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PERSOMEMSENTURY 


Le présent site document a été conçu de façon à ce que les connaissances requises ; fl 
pour le parcourir soient les plus élémentaires possibles . Il n'est donc pas nécessaire 
d'avoir obtenu un doctorat pour le consulter, il suffit de savoir raisonner, d'avoir 
l'esprit critique, d'observer et d'avoir du temps... 


"La simplicité est le sceau de la vérité et celle-ci resplendit de beauté" 


Omniprésente dans l'industrie (aérospatiale, imagerie, cryptographie, transports, chimie,..….), ou dans les 
services (banques, assurances, ressources humaines, projets, logistique, architecture, 
télécommunications,...), la mathématique appliqués apparait aussi dans de nombreux autres secteurs: 
sondages, modélisation des risques, protection des données.…..Elle intervient dans notre vie quotidienne 
(télécommunications, transports, médecine, météorologie, musique...) et contribue à la résolution de 
problématiques actuelles: énergie, santé, environnement, climatologie, optimisation, développement 
durable...Son grand succès est donc sa fantastique dispersion dans le monde réel et son intégration 
croissante à toutes les activités humaines. Nous allons donc vers une situation où la mathématique 
n'aura plus le monopole de la mathématique, mais où des économistes, gestionnaires et marchands 
feront tous de la mathématique. 


À ce titre, ancien étudiant dans le domaine de l'ingénierie, j'ai souvent regretté l'absence d'un ouvrage 
unique assez complet, détaillé (sans aller dans l'extrême des puristes…) et pédagogique si possible 
gratuit (!) et portatif (étant personnellement un adepte des liseuses électroniques...) contenant au moins 
une idée non exhaustive de l'ensemble du programme de mathématique appliquée des écoles 
d'ingénieurs et présentant une vue d'ensemble de ce qui est utilisé dans la réalité des entreprises avec 
des démonstrations plus intuitives que rigoureuses mais avec suffisamment de détails afin d'éviter au 
lecteur des efforts inutiles. Un ouvrage aussi qui ne nécessite pas non plus de devoir s'adapter chaque 
fois à une nouvelle notation ou au vocabulaire spécifique à l'auteur quand il ne s'agit pas de changer 
carrément de langue... et où tout un chacun peut proposer des améliorations ou des compléments. 


J'ai été de plus aussi frustré pendant mes études de devoir ingurgiter assez souvent des "formules" ou 
des "lois" soit disant (et à tort) indémontrables ou trop compliquées selon mes professeurs ou même 
déçu par des livres d'auteurs renommés (dont les développements sont laissés au soin du lecteur ou 
comme exercice..). Sur ce site Internet et le PDF associé, prédomine la volonté de ne jamais dérouter 
le lecteur par des formules creuses du style "il est évident que..", "on démontre facilement que...", 
"nous laissons le soin au lecteur de vérifier en tant qu'exercice que...", puisque tous les développements 
y sont présentés en détails. Mais je ne suis pas un puriste des maths! Je n'ai qu'une ambition: expliquer 


de la manière la plus simple possible. 


Bien que je doive admettre que la démonstration de certaines relations présentées dans le cadre des 
cursus des écoles d'ingénieurs ne puisse se faire faute de temps dans le planning scolaire ou de place 
dans un livre, je ne peux accepter qu'un professeur ou un auteur dise à son étudiant (respectivement, 
son lecteur) que certaines lois sont indémontrables (car la plupart du temps c'est faux) ou que telle ou 
telle démonstration est trop compliquée sans lui donner une référence bibliographique (où l'étudiant 
puisse trouver l'information nécessaire à satisfaire sa curiosité) ou au moins une démonstration 
infiniment simplifiée et satisfaisante. 
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Par ailleurs, j'estime totalement archaïque le fait que certains professeurs continuent de faire prendre 
des notes de cours de manière massive à leurs étudiants. Il serait beaucoup plus favorable et optimal de 
distribuer un support de cours contenant tous les détails et ce afin de pouvoir se concentrer sur 
l'essentiel avec les élèves c'est-à-dire les explications orales, l'interprétation, la compréhension, le 
raisonnement et la mise en pratique plutôt que la copie de tableau noir à outrance... Bien évidemment 
donner un support de cours complet fait que certains étudiants brillent par leur absence mais... c'est tant 
mieux! Ainsi, ceux qui sont passionnés peuvent approfondir les sujets à la maison ou à la bibliothèque 
universitaire, les médiocres feront ce qu'ils ont à faire et pour le reste (élèves en difficultés mais 
travailleurs) ils suivront le cours donné par le professeur pour profiter de poser des questions plutôt que 
de recopier bêtement un tableau noir. 


Pour me baser sur un modèle d'apprentissage d'un spécialiste américain, dont j'ai oublié le nom..., le 
présent site Internet (et son PDF associé) propose et impose les propriétés suivantes à son lecteur: 
découvrir, mémoriser, citer, intégrer, expliquer, reformuler, déduire, choisir, utiliser, décomposer, 
comparer, interpréter, juger, argumenter, modéliser, élaborer, créer, rechercher, raisonner, développer et 
ce dans une démarche claire, pédagogique et progressive permettant de développer l'esprit d'analyse et 
d'ouverture. 


Alors, dans mon esprit, ce site Internet (et son PDF associé) doit pouvoir se substituer, gratuitement, à 
de nombreuses références et lacunes du système, permettant ainsi à tout étudiant curieux de ne pas être 
frustré pendant de longues années durant son cursus de formation. Sans quoi, la science de l'ingénieur 
pourrait alors avoir l'aspect rébarbatif d'une science figée, à l'écart de l'évolution scientifique et 
technique, d'une accumulation hétéroclite de connaissances et surtout de formules qui la font 
considérer comme un sous-produit insipide des mathématiques et qui amène dans les entreprises à de 
nombreux faux résultats. 


Ceux qui ne voient la mathématique appliquée que comme un outil (ce qu'elle est aussi), ou comme 
l'ennemi des croyances religieuses, ou encore comme un domaine scolaire rébarbatif, sont légion. Il est 
cependant peut-être utile de rappeler que, comme le disait Galilée, "le livre de la Nature est écrit dans 
le langage des mathématiques" (sans vouloir faire de scientisme!). C'est dans cet esprit que ce site 
Internet (et son PDF associé) aborde la mathématique appliquée pour les étudiants en sciences de la 
Nature, de la Terre et de la Vie, ainsi que pour tous ceux qui exercent une profession liée à ces diverses 
matières y compris la philosophie ou pour toute personne curieuse de s'informer de l'implication des 
sciences dans la vie quotidienne. 


Le choix de traiter l'ingénierie ici comme une branche de la mathématique appliquée provient 
certainement du fait que l'ensemble des domaines de la physique (anciennement dénommée 
"philosophie naturelle") et la mathématique sont à ce jour tellement peu discernables que la médaille de 
Fields (la plus haute récompense de nos jours dans le domaine de la mathématique) a été décernée en 
1990 au physicien Edward Witten, qui a utilisé des idées physiques pour redémontrer un théorème 
mathématique. Cette tendance n'est certainement pas fortuite, car nous pouvons observer que toute 
science, dès qu'elle cherche à atteindre une compréhension plus détaillée du sujet qu'elle étudie, voit 
finalement toujours sa course aboutir dans la mathématiques pure (la voie absolue par excellence...). 
Ainsi, pouvons-nous présager dans un futur lointain, la convergence de toutes les sciences (pures, 
exactes ou sociales) vers la mathématique pour la modélisation (lire à titre d'exemple le document PDF 
"L'explosion des mathématiques" disponible dans la rubrique Téléchargement du site). 


Il peut parfois nous paraître difficile (à cause d'une crainte aussi obscure et irrationnelle que non 
justifiée des sciences pures chez une importante fraction de nos contemporains) de transmettre le 
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sentiment de beauté mathématique de la nature, de son harmonie la plus profonde et de la mécanique 
parfaitement huilée de l'Univers, à ceux qui ne connaissent que les rudiments du calcul formel. Le 
physicien R. Feynman a parlé un jour de "deux cultures": les gens qui ont, et ceux qui n'ont pas eu une 
compréhension suffisante des mathématiques pour apprécier la structure scientifique de la nature. Il est 
bien dommage qu'il y faille cependant des mathématiques et que celles-ci aient aussi mauvaise 
réputation. Pour l'anecdote, on prétend qu'un roi ayant demandé à Euclide de lui enseigner la géométrie 
se plaignit de sa difficulté. Euclide répondit: "il n'y a pas de voie royale". Les physiciens et 
mathématiciens ne peuvent se convertir à un autre langage. Si vous voulez apprendre à connaître la 
nature, à l'apprécier à sa juste valeur, vous devez comprendre son langage. Elle ne se révèle que sous 
cette forme et nous ne pouvons être prétentieux au point de lui demander de changer. 


Au même titre, aucune discussion intellectuelle ne vous permettra de communiquer à un sourd ce que 
vous ressentez vraiment en écoutant de la musique. De même, toutes les discussions du monde 
resteront impuissantes à transmettre une compréhension intime de la nature à ceux de "l'autre culture". 
Les philosophes et théologiens peuvent essayer de vous donner des idées qualitatives sur l'Univers. Le 
fait que la méthode scientifique (au sens plein du terme) ne puisse convaincre le monde entier de sa 
justesse et de sa pureté, trouve peut-être sa cause dans l'horizon limité de certaines gens qui sont 
amenés à s'imaginer que l'homme ou qu'un autre concept intuitif, sentimental ou arbitraire est le centre 
de l'Univers (principe anthropocentrique). 


Certes, dans le but de partager ce savoir mathématique, il est paradoxal de vouloir augmenter, avec 
notre travail, la liste déjà longue des ouvrages disponibles dans les bibliothèques, dans le commerce et 
sur l'Internet. Néanmoins, il faut être en mesure de présenter une argumentation solide qui justifie la 
création d'un tel site Internet (et son PDF associé) en comparaison à des ouvrages comme ceux de 
Feynman, Landau ou de Bourbaki. Voici donc les quelques arguments qui paraissent cependant 
susceptibles d'être présentés: 


. Le grand plaisir que je prends à cette entreprise ("garder la main" et progresser). 
. La passion du partage gratuit et sans frontières de la connaissance (et en français...). 
Le caractère évolutif et pratique d'un site Internet libre (outils de recherche efficaces). 
Le contenu évolutif en fonction de la demande!!! 
. La présentation rigoureuse avec des démonstrations simplifiées de beaucoup de concepts. 
. La présentation du plus grand nombre d'outils mathématiques utilisés dans les entreprises. 
. La possibilité pour les étudiants et professeurs de réutiliser le contenu par copier/coller. 
. Une notation constante et fixe, dans tout l'ouvrage, pour les opérateurs mathématiques, un 
langage clair et rigoureux sur tous les sujets abordés (critère des 3.C.: clair, complet et concis). 
9. Rassembler le maximum d'informations sur les sciences pures et exactes en un seul ouvrage 
électronique (portatif), homogène et rigoureux. 
10. Dégager, de toutes les pseudo-vérités, les seules vérités qui se démontrent. 
11. Tirer bénéfice de l'évolution des méthodes pédagogiques scolaires qui utilisent l'Internet pour 
chercher la solution à des problèmes de mathématiques. 
12. L'amélioration spectaculaire des logiciels automatiques de traduction et de la puissance des 
ordinateurs qui feront de ce site Internet (et son PDF associé), je le souhaite, une référence dans 
les domaines des sciences dures. 
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Et aussi. je considère que les résultats de la recherche individuelle sont la propriété de l'humanité et 
qu'ils doivent être mis à la disposition de tous ceux qui explorent où que ce soit les phénomènes de la 
nature. De cette façon le travail de chacun profite à tous, et c'est pour toute l'humanité que s'amassent 


nos connaissances ce qui est dans la tendance que permet l'Internet. 
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Je ne cache pas, que ma contribution se limite en grande partie à ce jour à celle d'un collectionneur qui 
glane ses informations dans les ouvrages des maîtres ou dans les publications ou pages Internet 
d'anonymes et qui complète et argumente les développements en les améliorant quand ceci est encore 
possible. Quant à ceux qui voudraient m'accuser de plagiat, ils devraient réfléchir au fait que les 
théorèmes présentés dans la plupart des ouvrages payants et disponibles dans le commerce ont été 
découverts et rédigés par leurs illustres prédécesseurs et que leur propre apport personnel a aussi 
constitué, comme le mien, à mettre toutes ces informations sous une forme claire et moderne quelques 
centaines d'années plus tard. De plus, il peut être vu comme douteux que l'on fasse payer l'accès à une 
culture qui est certainement la seule véritablement valable et juste dans ce bas monde et sur lequel il n'y 
a ni brevet, ni droit à la propriété intellectuelle. 


Ce site Internet (et son PDF associé) reflète aussi mes propres limites intellectuelles. Bien que je 
m'efforce d'étudier autant de domaines scientifiques et mathématiques que possible, il est impossible de 
tous les maîtriser. Le site Internet (et son PDF associé) indique clairement mes propres intérêts et 
expériences en tant que consultant, mais aussi mes points forts et mes points faibles. Je suis responsable 
du choix des entrées, ainsi que, bien sûr, des éventuelles erreurs et imperfections. 


Après avoir tenté un ordre de présentation rigoureux (linéaire) du sujet, j'ai décidé d'arranger ce site (et 
son PDF associé) dans un ordre plus pédagogique (thématique) et toujours avec des exemples 
d'applications concrets. Il est à mon avis très difficile de parler d'un si vaste sujet dans un ordre 
purement mathématique en une seule vie, c'est-à-dire lorsque les notions sont introduites une à une, à 
partir de celles déjà connues (où chaque théorie, opérateur, outil, etc. n'apparaîtrait pas avant sa 
définition). Un tel plan nécessiterait de couper le site (et son PDF associé), en morceaux qui ne sont 
plus thématiques. J'ai donc pris la décision de présenter les choses par ordre logique et non par ordre de 
nécessité. Le lecteur se heurtera donc, comme le rédacteur s'y est heurté, à l'extrême complexité du 
sujet. 


Les conséquences de ce choix sont les suivantes: 


1. Il faudra parfois admettre provisoirement certaines choses, quitte à les comprendre plus tard. 

2. Il sera probablement nécessaire pour le lecteur de parcourir au moins deux fois l'ensemble de 
l'ouvrage. Lors de la première lecture, on appréhende l'essentiel et lors de la deuxième lecture, on 
comprend les détails (je félicite celui qui comprendrait toutes les subtilités du premier coup). 

3. Il faut accepter le fait que certains sujets se répètent et qu'il y ait de nombreuses références 
croisées ainsi que remarques complémentaires. 


Certains savent que pour chaque théorème et modèle mathématique, il existe quasiment toujours 
plusieurs méthodes de démonstration. J'ai toujours tenté de choisir celle qui me semblait la plus simple 
(par exemple en relativité il y a la présentation algébrique et matricielle et idem en physique quantique). 
L'objectif étant d'arriver de toute façon au même résultat. 


Ce site (et son PDF associé) étant encore en cours de finalisation, il manque forcément des vérifications 
de convergences, de continuité et autres. (ce qui fera grimper au plafond les mathématiciens...) ! J'ai 
cependant évité (ou, dans le cas contraire, je le signale) les approximations habituelles de la physique et 
l'utilisation de l'analyse dimensionnelle, en y ayant recours le moins possible. J'essaie également d'éviter 
autant que possible des sujets dont les outils mathématiques n'ont pas au préalable été présentés et 
démontrés avec rigueur dans le corps de l'ouvrage. 


Enfin, cet exposé, perfectible, n'est pas une référence absolue et contient des erreurs. Toute remarque 
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est donc la bienvenue. Je m'appliquerai, dans la mesure du possible, à corriger les faiblesses signalées et 
à apporter les modifications nécessaires au plus vite. 


En revanche, alors que la mathématique est exacte et indiscutable, la physique théorique (ses modèles), 
reste interprétable dans le vocabulaire commun (mais pas dans le vocabulaire mathématique) et ses 
conclusions toutes relatives. Je ne peux que conseiller, lorsque vous parcourrez ce site (ou son PDF 
associé), de lire par vous-même et de ne pas subir d'influences extérieures. Il faut avoir l'esprit très 
(très) critique, ne rien prendre pour acquis et tout remettre en cause sans hésitation. Par ailleurs, le mot 
d'ordre du bon scientifique doit être: "Doute, doute, doute.., doute encore, et vérifie toujours.". Nous 
tenons aussi à rappeler que "rien de ce que l'on peut voir, entendre, sentir, toucher ou goûter, n'est ce 
qu'il a l'air d'être", ne vous fiez dès lors pas à votre expérience quotidienne pour tirer des conclusions 
trop hâtives, soyez critique, cartésien, rationnel et rigoureux dans vos développements, raisonnements 
et conclusions! 


Je tiens à préciser à ceux qui tenteraient de trouver par eux-mêmes les résultats de certains 
développements présents sur ce site (ou de son PDF associé), de ne pas s'inquiéter s'ils n'y arrivent pas 
ou s'ils doutent d'eux à cause du temps passé à la résolution d'une équation ou problème: certaines 
théories qui nous semblent évidentes ou simples aujourd'hui, ont mis parfois plusieurs semaines, 
plusieurs mois, voire plusieurs années, pour être élaborées par des mathématiciens ou physiciens de 
renom! 


J'ai également tenté de faire en sorte que ce site (et son PDF associé) soit agréable à l'oeil et à parcourir. 
Les concepteurs web professionnels voudront cependant bien excuser la mauvaise qualité du code 
HTML / PHP (qu'ils ne verront pas en partie.) / Javascript / CSS et l'abus de l'utilisation du biseautage 
et estampage de Photoshop ainsi que le choix d'une interface optimisée pour une résolution de 1024 x 
768 et supérieure, mais le temps me manque pour épurer le code et réaliser des finitions graphiques 
correctes (de plus, je privilégie plutôt la qualité du contenu que le contenant). 


Enfin, j'ai choisi d'écrire cet exposé à la première personne du pluriel ("nous"). Effectivement, la 
mathématique-physique n'est pas une science qui s'est faite ou évoluera grâce à un travail individuel 
mais à l'aide d'une collaboration intensive entre personnes reliées par la même passion et le même désir 
du Savoir. Ainsi, en faisant usage du "nous", il est rendu hommage aux hommes de science disparus, 
aux contemporains et aux futurs chercheurs pour le travail qu'ils effectueront dans le but de s'approcher 
de la vérité et de la sagesse. 


1. MÉTHODES 


La science est l'ensemble des efforts systématiques (observations scrupuleuses et hypothèses 
vraisemblables jusqu'à preuve du contraire) pour acquérir des connaissances sur notre environnement, 
pour les organiser et les synthétiser en lois et théories vérifiables et ayant pour principal objectif 
d'expliquer le "comment" des choses (et non pas le pourquoi!) souvent par une démarche à trois étapes: 


- De quoi est-ce que nous disposons? 
- Par où va-t-on passer? 
- Quel est notre objectif? 


Les scientifiques doivent soumettre leurs idées et résultats à la vérification et la reproduction 
indépendante de leurs pairs. Ils doivent abandonner ou modifier leurs conclusions lorsque confrontées à 
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des évidences plus complètes ou différentes. La crédibilité de la science s'appuie sur ce mécanisme 
d'autocorrection. L'histoire de la science montre que ce système fonctionne depuis très longtemps et ce 
même très bien par rapport à tous les autres. Dans chaque domaine, les progrès ont été spectaculaires. 
Toutefois, le système a parfois des ratés qu'il faut corriger avant que les petites dérives ne s'accumulent. 


Le bémol est que les scientifiques sont des hommes. Ils ont les défauts de tous les hommes et, en 
particulier, la vanité, l'orgueil et la fatuité. De nos jours, il arrive que plusieurs personnes travaillant sur 
un même sujet depuis un certain temps développent une foi commune et croient qu'ils détiennent la 
vérité. Le chef de file de cette foi devient le Pape et distille des grands-messes. Le Pape qui se prend au 
jeu, prend sa mitre et son bâton de pèlerin pour évangéliser ses collègues hérétiques. Jusque-là, cela 
prête à sourire. Mais, comme dans les vraies religions, ils ont parfois la fâcheuse tendance de vouloir 
s'étendre au détriment de ceux qui ne croient pas. Certaines de ces "Eglises" n'hésitent pas à se 
comporter comme l'Inquisition. Ceux qui osent émettre une opinion différente se font incendier à 
chaque occasion, lors des congrès, voire sur leur lieu de travail. Certains jeunes chercheurs, en mal 
d'inspiration, préfèrent se convertir à cette religion dominante, pour devenir plus rapidement des 
dignitaires religieux à peu de frais, plutôt que des chercheurs innovants, voire iconoclastes. Le grand 
Pape écrit sa Bible pour diffuser sa pensée, l'impose à lire aux étudiants et aux nouveaux venus. Il 
formate ainsi la pensée des jeunes générations et assure son trône. C'est une attitude moyenâgeuse qui 
peut bloquer le progrès. Certains Papes vont jusqu'à croire que le fait d'être pris pour le pape dans un 
domaine leur donne automatiquement le même trône dans tous les autres domaines... 


Cet avertissement, et les rappels qui vont suivre, doivent servir le scientifique à se remettre en question 
en faisant un bon usage de ce que nous pouvons considérer aujourd'hui comme les bonnes méthodes de 
travail (nous parlerons des principes de la méthode de Descartes plus loin) pour résoudre des problèmes 
ou développer des modèles théoriques. 


Dans ce but, voici un tableau récapitulatif qui propose les différentes étapes que le scientifique devrait 
suivre lors de ses travaux en mathématique ou physique théorique (pour les définitions, voir juste 
après): 
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| MATHÉMATIQUE 


PHYSIQUE 


1. Poser "l'hypothèse", la "conjecture" la 
"propriété" à démontrer de manière formelle ou en 
langage commun (les hypothèses étant notées H1., 
H2., … les conjectures CJ1., CJ2.... et les 


propriétés P1., P2., ...)) 


1. Poser correctement et de manière détaillée le ou 
les "problèmes" à résoudre de manière formelle ou 
en langage commun (les problèmes étant notés 
P1., P2., ….) 


2. Définir les "axiomes" (sous-entendu 
non-démontrables, indépendants et 
non-contradictoires) qui vont donner les points de 
départ et établir des restrictions aux 
développements (les axiomes étant notés Al., A2, 


a) 


Remarque: Parfois par abus, "propriétés", 
"conditions" et "axiomes" sont confondus 
alors que le concept d'axiome est beaucoup 
plus précis et profond. 


Dans la même idée, le mathématicien définit le 
vocabulaire spécialisé relié à des opérateurs 
mathématiques qui seront notés par D1., D2., D3,., 


3. Les axiomes posés, tirer directement des 
"lemmes" ou des "propriétés" dont la validité en 
découle directement et qui préparent au 
développement du théorème censé valider 
l'hypothèse ou la conjecture de départ (les lemmes 
étant notés L1., L2., … et les propriétés P1., 
P2....). 


2. Définir (ou énoncer) les "postulats" ou 
"principes" ou encore les "hypothèses" et 
"suppositions" (supposés non démontrables...) qui 
vont donner les points de départ et établir des 
restrictions aux développements (habituellement, 
les postulats et principes sont notés P1., P2., . et 
les hypothèses H1., H2., … en essayant d'éviter 
pour les postulats et principes, une confusion 
possible avec l'énoncé du ou des problèmes qui 
sont notés de la même manière). 


Remarque: Il ne faut pas cependant oublier 
que la validité d'un modèle ne dépend pas du 
réalisme de ses hypothèses mais bien de la 
conformité de ses implications avec la réalité. 


3. Une fois le "modèle théorique" développé 
vérifier les équations dimensionnelles pour déceler 
une éventuelle erreur dans les développements 
(ces vérifications étant notées VAI., VA2., ...). 


4. Une fois le ou les "théorèmes" (notés T1., T2. 
…) démontrés en tirer des "corollaires" (notés C1., 
C2., ….) et encore des propriétés (notées P1., P2., 
| ee À 


5. Tester la force ou l'utilité de sa ou ses 
conjectures ou hypothèses en démontrant la 
réciproque du théorème ou en la comparant avec 
des exemples à d'autres théories mathématiques 
pour voir si l'ensemble forme un tout cohérent (les 
exemples étant notés E1., E2., ..). 


5. Tester expérimentalement le modèle théorique 


4. Chercher les cas limites (dont les "singularités" 
font partie) du modèle pour en vérifier la validité 
intuitive (ces contrôles aux limites étant notés 
CL ER. 


obtenu et soumettre le travail à comparaison avec 
d'autres équipes de recherche indépendantes. Le 
nouveau modèle doit prévoir des résultats 
expérimentaux observés et jamais observés 
(prédictions permettant de la falsifier). Si le 
modèle est validé alors il prend officiellement le 
statut de "Théorie". 


6. D'éventuelles remarques peuvent être indiquées 
dans un ordre structuré et notées 
hiérarchiquement R1., R2., … 


6. D'éventuelles remarques peuvent être indiquées 
dans un ordre structuré et notées 
hiérarchiquement R1., R2., … 
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Procéder comme dans le tableau ci-dessus est une base de travail possible pour travailler en 
mathématique et physique. Évidemment, procéder de façon propre et traditionnelle comme ci-dessus 
prend un petit plus de temps qu'en faisant un peu n'importe quoi, n'importe comment (c'est pour cela 
que la plupart des professeurs ne suivent pas ces règles, le temps leur manque cruellement pour couvrir 
tout le programme scolaire). 


définitions hypothèses 


processus de 
déduction 


| 


résultats théoriques 


processus 
d'observations 
empiriques 


7 \ 


confirme ne confirme pas 


modification des 
hypothèses 


acceptation provisoire 


rejet 


Signalons aussi une forme amusante scientifique des 8 commandements: 


1. Les phénomènes tu observeras 
Et jamais mesure tu ne falsifieras 
(attention à l'erreur de confirmation: étudier que des phénomènes qui valident ses convictions) 
2. Des hypothèses tu formuleras 
Que par l'expérimentation tu testeras 
3. L'expérience précisément tu décriras 
Car ton collègue la reproduira 
(attention au piège de la discipline narrative: coller les faits aux résultats désirés) 
4. Fort de tes résultats 
Une théorie tu bâtiras 
5. De parcimonie tu useras 
Et l'hypothèse la plus simple tu retiendras 
6. Jamais vérité définitive ne sera (humilité épistémique) 
Et toujours tu chercheras 
7. D'une thèse non réfutable tu t'abstiendras 
Car hors de la science elle restera 
8. Tout échec sera pris comme une réussite 
Car la science doit confirmer mais aussi infirmer 
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Remarques: 


R1. Attention, il est très facile de faire des nouvelles théories physiques en alignant des mots. Cela 
s'appelle de la "philosophie" et les grecs ont pensé aux atomes en suivant cette méthode. Cela peut 
donc mener avec beaucoup de chance à une vraie théorie. Par contre il est bien plus difficile de 
faire une "théorie prédictive", c'est-à-dire avec des équations qui permettent de prédire le résultat 
d'une expérience. 


R2. Toutefois ce qui sépare la mathématique de la physique est que, en mathématique, l'hypothèse 
est toujours vraie. Le discours mathématique n'est pas une démonstration d'une vérité extérieure à 
chercher, mais vise uniquement la cohérence. Ce qui doit être juste est le raisonnement. 


Signalons que lorsque ces règles ne sont pas respectées, nous parlons de "fraude scientifique" (ce qui 
amène souvent à être licencié de son poste mais malheureusement on ne retire pas encore les diplômes 
quand cela arrive). En général, la fraude scientifique à proprement parler se présente sous trois grandes 
formes: le plagiat, la fabrication de données et l'altération de résultats défavorables à l'hypothèse 
avancée, l'omission d'exposition claire des hypothèses de travail et de données récoltées. À ces fraudes 
s'ajoutent des comportements qui posent problèmes concernant la qualité des travaux ou plus 
particulièrement l'éthique, comme ceux visant à augmenter en apparence la production (et par voie de 
fait la renommée du scientifique) en soumettant par exemple plusieurs fois la même publication en 
l'ayant un peu modifiée, les défauts de mentions de conflit d'intérêts, les expériences dangereuses, la 
non conservation des données primaires, etc. 


1.1. MÉTHODE DE DESCARTES 


Présentons maintenant les quatre principes de la méthode de Descartes qui, rappelons-le, est considéré 
comme le premier scientifique de l'histoire de par sa méthode d'analyse: 


P1. Ne recevoir jamais aucune chose pour vraie que je ne la connusse évidemment être telle. C'est- 
à-dire, d'éviter soigneusement la précipitation et de ne comprendre rien de plus en mes jugements que 
ce qui se présenterait si clairement et si distinctement à mon esprit, que je n'eusse aucune occasion de le 
mettre en doute. 


P2. De diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se pourrait 
(observations scrupuleuses et hypothèses vraisemblables jusqu'à preuve du contraire), et qu'il serait 
requis pour les mieux résoudre. 


P3. De conduire par ordre mes pensées, en commençant par les objets les plus simples et les plus aisés à 
connaître, pour monter peu à peu comme par degrés jusqu'à la connaissance des plus composés, et 
supposant même de l'ordre entre ceux qui ne se précèdent point naturellement les uns les autres. 


P4. Faire partout des dénombrements si entiers et des revues si générales, que je fusse assuré de ne rien 
omettre. 
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2. VOCABULAIRE 


La physique-mathématique, comme tout domaine de spécialisation, a son vocabulaire propre. Afin que 
le lecteur ne soit pas perdu dans la compréhension de certains textes qu'il pourra lire sur ce site (et son 
PDF associé), nous avons choisi d'exposer ici les quelques termes, abréviations et définitions 
fondamentaux à connaître. 


Ainsi, le mathématicien aime bien terminer ses démonstrations (quand il pense qu'elles sont justes) par 
l'abréviation "C.Q.F.D" qui signifie "Ce Qu'il Fallait Démontrer" ou encore dans les hautes écoles par 

souci d'esthétisme et de traditions certains professeurs (et mêmes élèves) notent cela en latin "Q.E.D" 

qui signifie "Quod Erat Demonstrandum" (cela en jette….). 


Et lors de définitions (elles sont nombreuses en mathématique et physique...) le scientifique fait souvent 
usage des terminologies suivantes: 


- … il suffit que … 

- … si et seulement si … 

- … nécessaire et suffisant … 
- … Signifie que … 


Les quatre ne sont pas équivalentes (identiques au sens strict). Car "il suffit que" correspond à une 
condition suffisante, mais pas à une condition nécessaire. 


2.1: SUR LES SCIENCES 


Il est important que nous définissions rigoureusement les différents types de sciences auxquelles l'être 
humain fait souvent référence. Effectivement, il semble qu'au 21ème siècle un abus de langage malsain 
s'instaure et qu'il ne devienne plus possible pour la population de distinguer la "qualité intrinsèque" 
d'une science d'une autre. 


Remarque: Etymologiquement le mot "science" vient du latin "scienta" (connaissance) dont la 
racine est le verbe "scire" qui veut dire "savoir". 


Cet abus de langage vient probablement du fait que les sciences pures et exactes perdent leurs illusions 
d'universalité et d'objectivité, dans le sens où elles s'auto-corrigent. Ceci ayant pour conséquence que 
certaines sciences sont reléguées au second plan et tentent d'en emprunter les méthodes, les principes et 
les origines pour créer une confusion quant à leurs distinctions. 


En soi, la science cependant ne produit pas de vérité absolue. Par principe, une théorie scientifique est 
valable tant qu'elle permet de prédire des résultats mesurables et reproductibles. Mais les problèmes 
d'interprétation de ces résultats font partie de la philosophie naturelle. 


Étant donné la diversité des phénomènes à étudier, au cours des siècles s'est constitué un nombre 
grandissant de disciplines comme la chimie, la biologie, la thermodynamique, etc. Toutes ces disciplines 
a priori hétéroclites ont pour socle commun la physique, pour langage la mathématique et comme 
principe élémentaire la méthode scientifique. 
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Ainsi, un petit rafraîchissement de mémoire semble nécessaire: 


Définitions: 


D1. Nous définissons par "science pure", tout ensemble de connaissances fondées sur un raisonnement 
rigoureux valable quel que soit le facteur (arbitraire) élémentaire choisi (nous disons alors "indépendant 
de la réalité sensible") et restreint au minimum nécessaire. Il n'y a que la mathématique (appelée 
souvent "reine des sciences") qui peut être classifiée dans cette catégorie. 


D2. Nous définissons par "science exacte" ou "science dure", tout ensemble de connaissances fondées 
sur l'étude d'une observation, observation qui aura été transcrite sous forme symbolique (physique 
théorique). Principalement, le but des sciences exactes est non d'expliquer le "pourquoi" mais le 
"comment". 


Remarque:Les deux définitions précédentes sont souvent incluses dans la définition de "sciences 
déductives" ou encore de "sciences phénoménologiques". 


D3. Nous définissons par "science de l'ingénieur", tout ensemble de connaissances théoriques ou 
pratiques appliquées aux besoins de la société humaine tels que: l'électronique, la chimie, 
l'informatique, les télécommunications, la robotique, l'aérospatiale, biotechnologies. 


D4. Nous définissons par "science" tout ensemble de connaissances fondées sur des études ou 
observations de faits dont l'interprétation n'a pas encore été retranscrite ni vérifiée avec la rigueur 
mathématique caractéristique des sciences qui précèdent, mais qui applique des raisonnements 
comparatifs statistiques. Nous incluons dans cette définition: la médecine (il faut cependant prendre 
garde au fait que certaines parties de la médecine étudient des phénomènes descriptifs sous forme 
mathématique tels que les réseaux de neurones ou autres phénomènes associés à des causes physiques 
connues), la sociologie, la psychologie, l'histoire, la biologie. 


Selon le philosophe Karl Popper, une théorie n'est scientifiquement acceptable que si, telle qu'elle est 
présentée, elle peut être falsifiable, c'est à dire soumise à des tests expérimentaux. La "connaissance 
scientifique" est ainsi par définition l'ensemble des théories qui ont jusqu'alors résisté à la falsification. 
La science est donc par nature soumise en permanence à la remise en question. 


D5. Nous définissons par "science molle" ou "para-sciences", tout ensemble de connaissances ou de 
pratiques qui sont actuellement fondées sur des faits invérifiables (non reproductibles scientifiquement) 
ni par l'expérience, ni par la mathématique. Nous incluons dans cette définition: l'astrologie, la 
théologie, le paranormal (qui est démoli par la science zététique), la graphologie… 


D6. Nous définissons par "sciences phénoménologiques" ou "sciences naturelles", toute science qui 
n'est pas inclue dans les définitions précédentes (histoire, sociologie, psychologie, zoologie, biologie.) 


D7. Le "scientisme" est la doctrine fondamentale suivant laquelle il n'y a de vérité que dans la science. 


Ce qui est intéressant dans cette doctrine, c'est que c'est certainement une des seules qui demande aux 
gens de devoir réfléchir par eux-mêmes et de comprendre l'environnement qui les entoure en remettant 
continuellement tout en question et sans ne jamais rien accepter comme acquis (...). De plus, les vraies 
sciences ont ceci d'extraordinaire qu'elles permettent de comprendre au-delà de ce que nous pouvons 


VOII. 
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Mais enfin, la science, c'est la science, et rien de plus: une certaine mise en ordre, pas trop mal réussie, 
des choses qui ne conduit plus à la méthaphysique comme du temps d'Aristote, mais qui n'a pas le 
prétention de nous livrer toute la réalité ni même le fond des choses visibles. 


2.2. TERMINOLOGIE 


Le tableau méthodique que nous avons présenté plus haut contient des termes qui peuvent peut-être 
vous sembler inconnus ou barbares. C'est la raison pour laquelle il nous semble fondamental de 
présenter les définitions de ces derniers, ainsi que de quelques autres tout aussi importants qui peuvent 
éviter des confusions malheureuses. 


Définitions: 


D1. Au-delà de son sens négatif, l'idée de "problème" renvoie à la première étape de la démarche 
scientifique. Formuler un problème est ainsi essentiel à sa résolution et permet de comprendre 
correctement ce qui fait problème et de voir ce qui doit être résolu. 


Le concept de problème est intimement relié au concept "d'hypothèse" dont nous allons voir la 
définition ci-dessous. 


D2. Une "hypothèse" est toujours, dans le cadre d'une théorie déjà constituée ou sous-jacente, une 
supposition en attente de confirmation ou d'infirmation qui tente d'expliquer un groupe de faits ou de 
prévoir l'apparition de faits nouveaux. 


Ainsi, une hypothèse peut être à l'origine d'un problème théorique qu'il faudra formellement résoudre. 


D3. Le "postulat" en physique correspond fréquemment à un principe (voir définition ci-dessous) dont 
l'admission est nécessaire pour établir une démonstration (nous sous-entendons que cela est une 
proposition non-démontrable). 


L'équivalent mathématique (mais en plus rigoureux) du postulat est "l'axiome" dont nous verrons la 
définition plus loin. 


D4. Un "principe" (parent proche du postulat") est donc une proposition admise comme base d'un 
raisonnement ou une règle générale théorique qui guide la conduite des raisonnements qu'il faudra 
effectuer. En physique, il s'agit également d'une loi générale régissant un ensemble de phénomènes et 
vérifiée par l'exactitude de ses conséquences. 


Remarque: le mot "principe" est utilisé avec abus dans les petites classes ou écoles d'ingénieurs par 
les professeurs ne sachant (ce qui est très rare), ou ne voulant (plutôt fréquent), ou ne pouvant faute 
de temps (quasi exclusivement), pas démontrer une relation. 


L'équivalent du postulat ou du principe en mathématiques est "l'axiome" que nous définissons ainsi: 


D5. Un "axiome" est une vérité ou proposition évidente par elle-même dont l'admission est nécessaire 
pour établir une démonstration. 
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Remarques: 


R1. Nous pourrions dire que c'est quelque chose que nous posons comme une vérité pour le 
discours que nous nous proposons de tenir, comme une règle du jeu, et qu'elle n'a pas forcément par 
ailleurs une valeur de vérité universelle dans le monde sensible qui nous entoure). 


R2. Les axiomes doivent toujours être indépendants entre eux (on ne doit pas pouvoir démontrer 
l'un à partir de l'autre), non contradictoires (nous disons également parfois qu'ils doivent être 
"consistants"). 


D6. Le "corollaire" est un terme malheureusement quasi inexistant en physique (à tort !) et qui est en 
fait une proposition résultant d'une vérité déjà démontrée. Nous pouvons également dire qu'un 
corollaire est une conséquence nécessaire et évidente d'un théorème (ou parfois d'un postulat en ce qui 
concerne la physique). 


D7. Un "lemme" constitue une proposition déduite d'un ou de plusieurs postulats ou axiomes et dont la 
démonstration prépare celle d'un théorème. 


Remarque: Le concept de "lemme" est lui aussi (et c'est malheureux) quasi réservé aux 
mathématiques. 


D8. Une "conjecture" constitue une supposition ou opinion fondée sur la vraisemblance d'un résultat 
mathématique. 


Remarque:Beaucoup de conjectures jouent un rôle un peu comparable à des lemmes, car elles sont 
des passages obligés pour obtenir d'importants résultats. 


D8. Par-delà son sens faible de conjecture, une "théorie" ou "théorème" est un ensemble articulé autour 
d'une hypothèse et étayé par un ensemble de faits ou développements qui lui confèrent un contenu 
positif et rendent l'hypothèse bien fondée (ou tout au moins plausible dans le cas de la physique 
théorique) 


D9. Une "singularité" est une indétermination d'un calcul qui intervient par l'apparition d'une division 
par le nombre zéro. Ce terme est aussi bien utilisé en mathématique qu'en physique. 


D10. Une "démonstration" constitue un ensemble de procédures mathématiques à suivre pour 
démontrer le résultat déjà connu ou non d'un théorème. 


D11. Si le mot "paradoxe" signifie étymologiquement: contraire à l'opinion commune, ce n'est 
cependant pas par pur goût de la provocation, mais bel et bien pour des raisons solides. Le "sophisme" 
quant à lui, est un énoncé volontairement provocateur, une proposition fausse reposant sur un 
raisonnement apparemment valide. Ainsi parle-t-on du fameux "paradoxe de Zénon", alors qu'il ne 
s'agit que d'un sophisme. Le paradoxe ne se réduit pas à de la fausseté, mais implique la coexistence de 
la vérité et de la fausseté, au point qu'on ne parvient plus à discriminer le vrai et le faux. Le paradoxe 
apparaît alors problème insoluble ou "aporie". 
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Remarque: Ajoutons que les grands paradoxes, par les interrogations qu'ils ont suscitées, ont fait 
progresser la science et amené des révolutions conceptuelles de grande ampleur, en mathématique 
comme en physique théorique (les paradoxes sur les ensembles et sur l'infini en mathématique, ceux 
à la base de la relativité et de la physique quantique). 


2.3. SCIENCE ET FOI 


Nous verrons qu'en science, une théorie est normalement incomplète, car elle ne peut décrire 
exhaustivement la complexité du monde réel. Il en est ainsi de toutes les théories, comme celle du Big 
Bang (cf.« ) ou de l'évolution des espèces (cf. 


). 
Il convient de distinguer différents courants scientifiques: 


- Le "réalisme" est une doctrine où les théories physiques ont pour objectif de décrire la réalité telle 
qu'elle est en soi, dans ses composantes inobservables. 


-"L'instrumentalisme" est une doctrine où les théories sont des outils servant à prédire des observations 
mais qui ne décrivent pas la réalité en soi. 


- Le "fictionnalisme" est le courant où le contenu référentiel (principes et postulats) des théories est un 
leurre, utile seulement pour assurer l'articulation linguistique des équations fondamentales. 


Même si aujourd'hui les théories scientifiques ont le soutien de beaucoup de spécialistes, les théories 
alternatives ont des arguments valables et nous ne pouvons totalement les écarter. Pour autant, la 
création du monde en 7 jours décrite par la Bible ne peut plus être perçue comme un possible, et bien 
des croyants reconnaissent qu'une lecture littérale est peu compatible avec l'état actuel de nos 
connaissances et qu'il est plus sage de l'interpréter comme une parabole. Si la science ne fournit jamais 
de réponse définitive, il n'est plus possible de ne pas en tenir compte. 


La foi (qu'elle soit religieuse, superstitieuse, pseudo-scientifique ou autre) a au contraire pour objectif 
de donner des vérités absolues d'une toute autre nature puisqu'elle relève d'une conviction personnelle 
invérifiable. En fait, l'une des fonctions des religions est de fournir du sens à des phénomènes qui ne 
sont pas explicables rationnellement. Les progrès de la connaissance entraînent donc parfois une remise 
en cause des dogmes religieux par la science. 


A contrario, sauf à prétendre imposer sa foi (qui n'est autre qu'une conviction intimement personnelle et 
subjective) aux autres, il faut se défier de la tentation naturelle de qualifier de fait scientifiquement 
prouvé les extrapolations des modèles scientifiques au-delà de leur champ d'application. 


Le mot "science" est comme nous l'avons déjà mentionné plus haut de plus en plus utilisé pour soutenir 
qu'il existe des preuves scientifiques là où il n'y a que croyance (certaines pages web de ce genre 
prolifèrent de plus en plus). Selon ses détracteurs c'est le cas du mouvement de scientologie. Selon ces 
derniers, nous devrions plutôt parler de "sciences occultes". 


Les sciences occultes et sciences traditionnelles existent depuis l'Antiquité; elles consistent en un 
ensemble de connaissances et de pratiques mystérieuses ayant pour but de pénétrer et dominer les 
secrets de la nature. Au cours des derniers siècles, elles ont été progressivement exclues du champ de la 
science. Le philosophe Karl Popper s'est longuement interrogé sur la nature de la démarcation entre 
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science et pseudoscience. Après avoir remarqué qu'il est possible de trouver des observations pour 
confirmer à peu près n'importe quelle théorie, il propose une méthodologie fondée sur la réfutabilité. 
Une théorie doit selon lui, pour mériter le qualificatif de "scientifique", pouvoir garantir l'impossibilité 
de certains événements. Elle devient dès lors réfutable, donc (et alors seulement) apte à intégrer la 
science. Il suffirait en effet d'observer un de ces événements pour invalider la théorie, et s'orienter par 
conséquent sur une amélioration de celle-ci. 


Enfin, citons Lavoisier: "Le physicien peut aussi, dans le silence de son laboratoire et de son cabinet, 
exercer des fonctions patriotiques; il peut espérer par ses travaux diminuer la masse des maux qui 
affligent bonheur et, n'eût-il contribué, par les routes nouvelles qu'il s'est ouvertes, qu'à prolonger de 
quelques années, de quelques jours, la vie moyenne des hommes, il pourrait aspirer aussi au titre 
glorieux de bienfaiteur de l'humanité." 
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La mathématique est la forme ultime d'art contraint. (inconnu) 


1. THÉORIE DE LA DÉMONSTRATION 


Na avons choisi de commencer l'étude de la mathématique appliquée par la théorie qui nous 


semble la plus fondamentale et la plus importante dans le domaine des sciences pures et exactes. 


La théorie de la démonstration et du calcul propositionnel (logique) a trois objectifs dans le cadre de ce 
site: 


1. Apprendre au lecteur comment raisonner et à démontrer et cela indépendamment de la spécialisation 
étudiée 


2. Montrer que le processus d'une démonstration est indépendant du langage utilisé 


3. Se préparer à la théorie de la logique et au théorème d'incomplétude de Güdel ainsi qu'aux automates 
(cf. chapitre d'Informatique Théorique). 


Le théorème de Güdel est le point le plus passionnant car si nous définissons une religion comme un 
système de pensée qui contient des affirmations indémontrables, alors elle contient des éléments de foi, 
et Güdel nous enseigne que les mathématiques sont non seulement une religion, mais que c'est alors la 
seule religion capable de prouver qu'elle en est une! 


Remarques: 


R1. Il est (très) fortement conseillé de lire en parallèle à ce chapitre, ceux sur la théorie des 
automates et de l'algèbre de Boole disponibles dans la section d'Informatique Théorique du site. 


R2. Il faut prendre cette théorie comme une curiosité sympathique mais qui n'amène 
fondamentalement pas grand-chose excepté des méthodes de travail/raisonnement. Par ailleurs, son 
objectif n'est pas de démontrer que tout est démontrable mais que toute démonstration peut se faire 
sur un langage commun à partir d'un certain nombre de règles. 


Souvent, quand un étudiant arrive dans une classe supérieure, il a surtout appris à calculer, à utiliser des 
algorithmes mais relativement peu voire pas du tout à raisonner. Pour tous les raisonnements, le support 
visuel est un outil puissant, et les personnes qui ne voient pas qu'en traçant telle ou telle courbe ou 
droite la solution apparaît ou qui ne voient pas dans l'espace sont très pénalisées. 


Lors des études secondaires, nous manipulons déjà des objets inconnus, mais c'est surtout pour faire des 
calculs, et quand nous raisonnons sur des objets représentés par des lettres, nous pouvons remplacer 
ceux-ci visuellement par un nombre réel, un vecteur, etc. À partir d'un certain niveau, nous demandons 
aux personnes de raisonner sur des structures plus abstraites, et donc de travailler sur des objets 
inconnus qui sont des éléments d'un ensemble lui-même inconnu, par exemple les éléments d'un groupe 
quelconque (cf. chapitre de Théorie Des Ensembles), Ce support visuel n'existe alors plus. 


Nous demandons ainsi souvent aux étudiants de raisonner, de démontrer des propriétés, mais personne 
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ne leur a jamais appris à raisonner convenablement, à écrire des preuves. Si nous demandons à un 
étudiant de licence ce qu'est une démonstration, il a très probablement quelque difficulté à répondre. Il 
peut dire que c'est un texte dans lequel on trouve des mots-clés comme: "donc", "parce que", "si", "si et 
seulement si", "prenons un x tel que”, "supposons que", "cherchons une contradiction", etc. Mais il est 
incapable de donner la grammaire de ces textes ni même leurs rudiments, et d'ailleurs, ses enseignants, 


s'ils n'ont pas suivi de cours, en seraient probablement incapables aussi. 


Pour comprendre cette situation, rappelons que pour parler un enfant n'a pas besoin de connaître la 
grammaire. Il imite son entourage et cela marche très bien: un enfant de six ans sait utiliser des phrases 
déjà compliquées quant à la structure grammaticale sans avoir jamais fait de grammaire. La plupart des 
enseignants ne connaissent pas non plus la grammaire du raisonnement mais, chez eux, le processus 
d'imitation a bien marché et ils raisonnent correctement. L'expérience de la majorité des enseignants 
d'université montre que ce processus d'imitation marche bien chez les très bons étudiants, et alors il est 
suffisant, mais il marche beaucoup moins bien, voire pas du tout, chez beaucoup d'autres. 


Tant que le degré de complexité est faible (notamment lors d'un raisonnement de type "équationnel"), la 
grammaire ne sert à rien, mais quand il augmente ou quand on ne comprend pas pourquoi quelque 
chose est faux, il devient nécessaire de faire un peu de grammaire pour pouvoir progresser. Les 
enseignants et les étudiants connaissent bien la situation suivante: dans un devoir, le correcteur a barré 
toute une page d'un grand trait rouge et mis "faux" dans la marge. Quand l'étudiant demande ce qui est 
faux, le correcteur ne peut que dire des choses du genre "ça n'a aucun rapport avec la démonstration 
demandée", "rien n'est juste", …, ce qui n'aide évidemment pas l'étudiant à comprendre. Cela vient en 
partie, du fait que le texte rédigé par l'étudiant utilise les mots voulus mais dans un ordre plus ou moins 
aléatoire et qu'on ne peut donner de sens à l'assemblage de ces mots. De plus, l'enseignant n'a pas les 
outils nécessaires pour pouvoir expliquer ce qui ne va pas. Il faut donc les lui donner! 


Ces outils existent mais sont assez récents. La théorie de la démonstration est une branche de la logique 
mathématique dont l'origine est la crise des fondements: il y a eu un doute sur ce que nous avions le 
"droit" de faire dans un raisonnement mathématique (voir la "crise des fondements" plus loin). Des 
paradoxes sont apparus, et il a alors été nécessaire de préciser les règles de démonstration et de vérifier 
que ces règles ne sont pas contradictoires. Cette théorie est apparue au début du 20ème siècle, ce qui 
est très peu puisque l'essentiel des mathématiques enseignées en première moitié de l'université est 
connu depuis le 16ème-17ème siècle. 


1. LA CRISE DES FONDEMENTS 


Pour les premiers Grecs, la géométrie était considérée comme la forme la plus haute du savoir, une 
puissante clé pour les mystères métaphysiques de l'Univers. Elle était plutôt une croyance mystique, et 
le lien entre le mysticisme et la religion était rendu explicite dans des cultes comme ceux des 
Pythagoriciens. Aucune culture n'a depuis déifié un homme pour avoir découvert un théorème 
géométrique! Plus tard, les mathématiques furent considérées comme le modèle d'une connaissance a 
priori dans la tradition aristotélicienne du rationalisme. 


L'étonnement des Grecs pour les mathématiques ne nous a pas quittés, on le retrouve sous la 
traditionnelle métaphore des mathématiques comme "Reine des Science". Il s'est renforcé avec les 
succès spectaculaires des modèles mathématiques dans la science, succès que les Grecs (ignorant même 
la simple algèbre) n'avaient pas prévus. Depuis la découverte par Isaac Newton du calcul intégral et de 
la loi du carré inverse de la gravité, à la fin des années 1600, les sciences phénoménales et les plus 
hautes mathématiques étaient restées en étroite symbiose - au point qu'un formalisme mathématique 
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prédictif était devenu le signe distinctif d'une "science dure". 


Après Newton, pendant les deux siècles qui suivirent, la science aspira à ce genre de rigueur et de 
pureté qui semblaient inhérentes aux mathématiques. La question métaphysique semblait simple: les 
mathématiques possédaient une connaissance a priori parfaite, et parmi les sciences, celles qui étaient 
capables de se mathématiser le plus parfaitement étaient les plus efficaces pour la prédiction des 
phénomènes. La connaissance parfaite consistait donc dans un formalisme mathématique qui, une fois 
atteint par la science et embrassant tous les aspects de la réalité, pouvait fonder une connaissance 
empirique a postériori sur une logique rationnelle a priori. Ce fut dans cet esprit que Marie 
Jean-Antoine Nicolas de Caritat, marquis de Condorcet (philosophe et mathématicien français), 
entreprit d'imaginer la description de l'Univers entier comme un ensemble d'équations différentielles 
partielles se résolvant les unes après les autres. 


La première faille dans cette image inspiratrice apparut dans la seconde moitié du 19ème siècle, quand 
Riemann et Lobatchevsky prouvèrent séparément que l'axiome des parallèles d'Euclide pouvait être 
remplacé par d'autres qui produisaient des géométries "consistantes" (nous reviendrons sur ce terme 
plus loin). La géométrie de Riemann prenait modèle sur une sphère, celle de Lobatchevsky, sur la 
rotation d'un hyperboloïde. 


L'impact de cette découverte a été obscurci plus tard par de grands chamboulements, mais sur le 
moment, elle fit un coup de tonnerre dans le monde intellectuel. L'existence de systèmes axiomatiques 
mutuellement inconsistants, et dont chacun pouvait servir de modèle à l'Univers phénoménal, remettait 
entièrement en question la relation entre les mathématiques et la théorie physique. 


Quand on ne connaissait qu'Euclide, il n'y avait qu'une géométrie possible. On pouvait croire que les 
axiomes d'Euclide constituaient un genre de connaissance parfaite a priori sur la géométrie dans le 
monde phénoménal. Mais soudain, nous avons eu trois géométries, embarrassantes pour les subtilités 
métaphysiques. 


Pourquoi aurions-nous à choisir entre les axiomes de la géométrie plane, sphérique et hyperbolique 
comme descriptions de la géométrie du réel? Parce que toutes les trois sont consistantes, nous ne 
pouvons en choisir aucune comme fondement a priori - le choix doit devenir empirique, basé sur leur 
pouvoir prédictif dans une situation donnée. 


Bien sûr, les théoriciens de la physique ont longtemps été habitués à choisir des formalismes pour poser 
un problème scientifique. Mais il était admis largement, si ce n'est inconsciemment, que la nécessité de 
procéder ainsi était fonction de l'ignorance humaine, et qu'avec de la logique ou des mathématiques 
assez bonnes, on pouvait déduire le bon choix à partir de principes premiers, et produire des 
descriptions a priori de la réalité, qui devaient être confirmées après coup par une vérification 
empirique. 


Cependant, la géométrie euclidienne, considérée pendant plusieurs centaines d'années comme le 
modèle de la perfection axiomatique des mathématiques, avait été détrônée. Si l'on ne pouvait connaître 
a priori quelque chose d'aussi fondamental que la géométrie dans l'espace, quel espoir restait-il pour une 
pure théorie rationnelle qui embrasseraïit la totalité de la nature ? Psychologiquement, Riemann et 
Lobatchevsky avaient frappé au coeur de l'entreprise mathématique telle qu'elle avait été conçue 
jusqu'alors. 


De plus, Riemann et Lobatchevsky remettaient la nature de l'intuition mathématique en question. Il 
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avait été facile de croire implicitement que l'intuition mathématique était une forme de perception - une 
façon d'entrevoir le monde platonicien derrière la réalité. Mais avec deux autres géométries qui 
bousculaient celle d'Euclide, personne ne pouvait plus être sûr de savoir à quoi le monde ressemblait. 


Les mathématiciens répondirent à ce double problème avec un excès de rigueur, en essayant 
d'appliquer la méthode axiomatique à toutes les mathématiques. Dans la période pré-axiomatique, les 
preuves reposaient souvent sur des intuitions communément admises de la "réalité" mathématique, qui 
ne pouvaient plus être considérées automatiquement comme valides. 


La nouvelle façon de penser les mathématiques conduisait à une série de succès spectaculaires. 
Pourtant cela avait aussi un prix. La méthode axiomatique rendait la connexion entre les 
mathématiques et la réalité phénoménale toujours plus étroite. En même temps, des découvertes 
suggéraient que les axiomes mathématiques qui semblaient être consistants avec l'expérience 
phénoménale pouvaient entraîner de vertigineuses contradictions avec cette expérience. 


La majorité des mathématiciens devinrent rapidement des "formalistes", soutenant que les 
mathématiques pures ne pouvaient qu'être considérées philosophiquement comme une sorte de jeu 
élaboré qui se jouait avec des signes sur le papier (c'est la théorie qui sous-tend la prophétique 
qualification des mathématiques de "système à contenu nul" par Robert Heinlein). La croyance 
"platonicienne" en la réalité des objets mathématiques, à l'ancienne manière, semblait bonne pour la 
poubelle, malgré le fait que les mathématiciens continuaient à se sentir comme les platoniciens durant le 
processus de découverte des mathématiques. 


Philosophiquement, donc, la méthode axiomatique conduisait la plupart des mathématiciens à 
abandonner les croyances antérieures en la spécificité métaphysique des mathématiques. Elle produisit 
aussi la rupture contemporaine entre les mathématiques pures et appliquées. La plupart des grands 
mathématiciens du début de la période moderne - Newton, Leibniz, Fourier, Gauss et les autres - 
s'occupaient aussi de science phénoménale. La méthode axiomatique avait couvé l'idée moderne du 
mathématicien pur comme un super esthèête, insoucieux de la physique. Ironiquement, le formalisme 
donnait aux purs mathématiciens un mauvais penchant à l'attitude platonicienne. Les chercheurs en 
mathématiques appliquées cessèrent de côtoyer les physiciens et apprirent à se mettre à leur traîne. 


Ceci nous emmène au début du 20ème siècle. Pour la minorité assiégée des platoniciens, le pire était 
encore à venir. Cantor, Frege, Russell et Whitehead montrèrent que toutes les mathématiques pures 
pouvaient être construites sur le simple fondement axiomatique de la théorie des ensembles. Cela 
convenait parfaitement aux formalistes: les mathématiques se réunifiaient, du moins en principe, à 
partir d'un faisceau de petits jeux détachés d'un grand. Les platoniciens aussi étaient satisfaits, s'il en 
survenait une grande structure, clé de voûte consistante pour toutes les mathématiques, la spécificité 
métaphysique des mathématiques pouvait encore être sauvée. 


D'une façon négative, pourtant, un platonicien eut le dernier mot. Kurt Güdel mit son grain de sable 
dans le programme formaliste d'axiomatisation quand il démontra que tout système d'axiomes assez 
puissant pour inclure les entiers devait être soit inconsistant (contenir des contradictions) soit incomplet 
(trop faible pour décider de la justesse ou de la fausseté de certaines affirmations du système). Et c'est 
plus ou moins où en sont les choses aujourd'hui. Les mathématiciens savent que de nombreuses 
tentatives pour faire avancer les mathématiques comme une connaissance a priori de l'Univers doivent 
se heurter à de nombreux paradoxes et à l'impossibilité de décider quel système axiomatique décrit les 
mathématiques réelles. Ils ont été réduits à espérer que les axiomatisations standards ne soient pas 
inconsistantes mais incomplètes, et à se demander anxieusement quelles contradictions ou quels 


Page: 20/4839 


[v3.0 - 2013] 


théorèmes indémontrables attendent d'être découverts ailleurs. 


Cependant, sur le front de l'empirisme, les mathématiques étaient toujours un succès spectaculaire en 
tant qu'outil de construction théorique. Les grands succès de la physique du 20ème siècle (la relativité 
générale et la physique quantique) poussaient si loin hors du royaume de l'intuition physique, qu'ils ne 
pouvaient être compris qu'en méditant profondément sur leurs formalismes mathématiques, et en 
prolongeant leurs conclusions logiques, même lorsque ces conclusions semblaient sauvagement 
bizarres. Quelle ironie! Au moment même où la perception mathématique en venait à paraître toujours 
moins fiable dans les mathématiques pures, elle devenait toujours plus indispensable dans les sciences 
phénoménales. 


À l'opposé de cet arrière-plan, l'applicabilité des mathématiques à la science phénoménale pose un 
problème plus épineux qu'il n'apparaît d'abord. Le rapport entre les modèles mathématiques et la 
prédiction des phénomènes est complexe, pas seulement dans la pratique mais dans le principe. 
D'autant plus complexe que, comme nous le savons maintenant, il y a des façons d'axiomatiser les 
mathématiques qui s'excluent! 


Mais pourquoi existe-t-il seulement de bons choix de modèle mathématique ? C'est à dire, pourquoi y 
a-t-il un formalisme mathématique, par exemple pour la physique quantique, si productif qu'il prédit 
réellement la découverte de nouvelles particules observables ? 


Pour répondre à cette question nous observerons qu'elle peut, aussi bien, fonctionner comme une sorte 
de définition. Pour beaucoup de systèmes phénoménaux, de tels formalismes prédictifs exacts n'ont pas 
été trouvés, et aucun ne semble plausible. Les poêtes aiment marmonner sur le coeur des hommes, mais 
on peut trouver des exemples plus ordinaires: le climat, où le comportement d'une économie supérieure 
à celle d'un village, par exemple - systèmes si chaotiquement interdépendants que la prédiction exacte 
est effectivement impossible (pas seulement dans les faits mais en principe). 


1.1. PARADOXES 


Dès l'antiquité, certains logiciens avaient constaté la présence de nombreux paradoxes au sein de la 
rationalité. En fait, nous pouvons dire que malgré leur nombre, ces paradoxes ne sont que les 
illustrations d'un petit nombre de structures paradoxales. Attardons-nous à exposer à titre de culture 
générale les plus connus qui constituent la classe des "propositions indécidables". 


Exemples: 
E1. Le paradoxe de la classe des classes (Russell) 


Il existe deux types de classes: celles qui se contiennent elles-mêmes (ou classes réflexives: la classe 
des ensembles non-vides, la classe des classes...) et celles qui ne se contiennent pas elles-mêmes (ou 
classes irréflexives: la classe des travaux à rendre, la classe des oranges sanguines, .). La question 
posée est la suivante: la classe des classes irréflexives est-elle elle-même réflexive ou irréflexive? Si elle 
est réflexive, elle se contient et se trouve rangée dans la classe des classes irréflexives qu'elle constitue, 
ce qui est contradictoire. Si elle est irréflexive, elle doit figurer dans la classe des classes irréflexives 
qu'elle constitue et devient ipso facto réflexive, nous sommes face à une nouvelle contradiction. 


E2. Le paradoxe du bibliothécaire (Gonseth) 


Dans une bibliothèque, il existe deux types de catalogues. Ceux qui se mentionnent eux-mêmes et ceux 
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qui ne se mentionnent pas. Un bibliothécaire doit dresser le catalogue de tous les catalogues qui ne se 
mentionnent pas eux-mêmes. Arrivé au terme de son travail, notre bibliothécaire se demande s'il 
convient ou non de mentionner le catalogue qu'il est précisément en train de rédiger. À ce moment, il 
est frappé de perplexité. S'il ne le mentionne pas, ce catalogue sera un catalogue qui ne se mentionne 
pas et qui devra dès lors figurer dans la liste des catalogues ne se mentionnant pas eux-mêmes. D'un 
autre côté, s'il le mentionne, ce catalogue deviendra un catalogue qui se mentionne et qui ne doit donc 
pas figurer dans ce catalogue, puisque celui-ci est le catalogue des catalogues qui ne se mentionnent 
pas. 


E3. Le paradoxe du menteur (variante) 


Définissons provisoirement le mensonge comme l'action de formuler une proposition fausse. Le poête 
crétois Epiménide affirme: "Tous les Crétois sont des menteurs", soit la proposition P. Comment 
décider de la valeur de vérité de P ? Si P est vraie, comme Epiménide est Crétois, P doit être fausse. Il 
faut donc que P soit fausse pour pouvoir être vraie, ce qui est contradictoire. P est donc fausse. 
Remarquons qu'on ne peut pas en déduire, comme dans le véritable paradoxe du menteur, que P doit 
aussi être vraie. 


2. RAISONNEMENT HYPOTHETICO-DEDUCTIF 


Le raisonnement hypothético-déductif est, nous le savons, la capacité qu'a l'apprenant de déduire des 
conclusions à partir de pures hypothèses et pas seulement d'une observation réelle. C'est un processus 
de réflexion qui tente de dégager une explication causale d'un phénomène quelconque (nous y 
reviendrons lors de nos premiers pas en physique). L'apprenant qui utilise ce type de raisonnement 
commence par formuler une hypothèse et essaie ensuite de confirmer ou d'infirmer son hypothèse selon 
le schéma synoptique ci-dessous: 


Définitions Hypothèses 


Processus de déduction 


Résultats théoriques 


Processus d'observations Modification des 
empiriques hypothèses 
Confirme... Ne confime pas... 
Acceptation 
provisoire 
Rejet 


Figure: 1.1 - Diagramme synoptique du raisonnement hypothético-déductif 
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La procédure déductive consiste à tenir pour vrai, à titre provisoire, cette proposition première que 
nous appelons, en logique "le prédicat" (voir plus bas) et à en tirer toutes les conséquences logiquement 
nécessaires, c'est-à-dire à en rechercher les implications. 


Exemple: 
Soit la proposition P : "X est un homme”, elle implique la proposition suivante Q : X est mortel. 


L'expression P = € (si c'est un homme il est nécessairement mortel) est un implication prédicative 


(d'où le terme "prédicat"). Il n'y a pas dans cet exemple de cas où nous puissions énoncer P sans Q. Cet 
exemple est celui d'une implication stricte, telle que nous la trouvons dans le "syllogisme" (figure 
logique du raisonnement). 


Remarque: Des spécialistes ont montré que le raisonnement hypothético-déductif s'élabore 
progressivement chez l'enfant, à partir de 6-7ans, et que ce type de raisonnement n'est utilisé 
systématiquement, en partant d'une fonction propositionnelle stricte qu'à partir de 11-12 ans. 


3. CALCUL PROPOSITIONNEL 


Le "calcul propositionnel" (ou "logique propositionnelle") est un préliminaire absolument indispensable 
pour aborder une formation en sciences, philosophie, droit, politique, économie, etc. Ce type de calcul 
autorise des procédures de décisions ou tests. Ceux-ci permettent de déterminer dans quel cas une 
expression (proposition) logique est vraie et en particulier si elle est toujours vraie. 


Définitions: 


D1. Une expression toujours vraie quel que soit le contenu linguistique des variables qui la composent 
est appelée une "expression valide", une "tautologie", ou encore une “loi de la logique 
propositionnelle". 


D2. Une expression toujours fausse est appelée une "contradiction" ou "antilogie". 
D3. Une expression qui est parfois vraie, parfois fausse est appelée une "expression contingente". 


D4. Nous appelons "assertion" une expression dont nous pouvons dire sans ambiguïté si elle est vraie 
ou fausse. 


D5. Le "langage objet" est le langage utilisé pour écrire les expressions logiques. 


D6. Le "métalangage" est le langage utilisé pour parler du langage objet dans la langue courante. 


Remarques: 


R1. Il existe des expressions qui ne sont effectivement pas des assertions. Par exemple, l'énoncé: 
"cet énoncé est faux", est un paradoxe qui ne peut être ni vrai, ni faux. 


R2. Soit une expression logique A. Si celle-ci est une tautologie, nous la notons fréquemment HE 4 
et si l'expression est une contradiction, nous la notons AK. 
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3.1. PROPOSITIONS 


Définition: En logique, une "proposition" est une affirmation qui a un sens. Cela veut dire que nous 
pouvons dire sans ambiguïté si cette affirmation est vraie (V) ou fausse (F). C'est ce que nous appelons 
le "principe du tiers exclu". 


2 Exemple: 


"Je mens" n'est pas une proposition. Si nous supposons que cette affirmation est vraie, elle est une 
affirmation de sa propre invalidité, donc nous devrions conclure qu'elle est fausse. Mais si nous 
supposons qu'elle est fausse, alors l'auteur de cette affirmation ne ment pas, donc il dit la vérité, aussi la 
proposition serait vraie. 


Définition: Une proposition en logique binaire (où les propositions sont soit vraies, soit fausses) n'est 
donc jamais vraie et fausse à la fois. C'est que nous appelons le "principe de non-contradiction". 


Ainsi, une propriété sur l'ensemble E des propositions est une application P de E dans l'ensemble des 
"valeurs de vérité": 


P:E—={,F)} (11 


Nous parlons de "sous-ensemble associé", lorsque la proposition engendre uniquement une partie E' de 
E et inversement. 


® Exemple: 


Dans £ =, si P(x) s'énonce "x est pair" , alors P = {0,2,4,...,2k,...} ce qui est bien seulement un 
sous-ensemble associé de E mais de même cardinal (cf. chapitre Théorie Des Ensembles). 


Définition: Soit P une propriété sur l'ensemble E. Une propriété Q sur E est une "négation" de Psiet 
seulement si, pour tout xe Æ: 


- Qx) est F si P(x) est V 
- Q(x) est Vsi P(x) est F 


Nous pouvons rassembler ces conditions dans une table dite "table de vérité": 


Tableau: 1.1 - Table de vérité des valeurs 


Table que nous pouvons aussi trouver ou donc aussi écrire sous la forme plus explicite suivante: 


Faux Vrai 


Tableau: 1.2 - Table de vérité des valeurs 
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ou encore sous forme binaire: 


1 | 0 


Do | 1 


Tableau: 1.3 - Table de vérité des valeurs 


En d'autres termes, P et Q ont toujours des valeurs de vérité contraires. Nous noterons ce genre 
d'énoncé "Q est une négation de P": 


Dé PP (12) 


où le symbole — est le "connecteur de négation". 


Remarque: Les expressions doivent être des expressions bien formées (souvent abrégé "ebf"). Par 
définition, toute variable est une expression bien formée, alors —-? est une expression bien formée. 
Si P,Q sont des expressions bien formées, alors P=— © est une expression bien formée (l'expression 


"je mens" n'est pas bien formée car elle se contredit elle-même). 


3.2. CONNECTEURS 


Il y a d'autres types de connecteurs en logique: 


Soient P et Q deux propriétés définies sur le même ensemble E. PY © (lire "P ou Q") est une propriété 


sur E définie par: 
- PY@ est vraie si au moins l'une des propriétés P, Q est vraie 
- PVYQ est fausse sinon 


Nous pouvons créer la table de vérité du "connecteur OU" ou "connecteur de disjonction" \/: 


RS OR V2 
V V V 
V F V 
F V v 
F F F 


Tableau: 1.4 - Table de vérité de OÙ 


Il est facile de se convaincre que, si les parties P, Q de E sont respectivement associées aux propriétés 
P, Q que PLU (cf. chapitre Théorie Des Ensembles) est associé à PV Q. 


PS P 


ps 0 (1.3) 
PVQS PUQ 


Le connecteur */ est associatif. Pour s'en convaincre, il suffit de faire une table de vérité où nous 
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vérifions que: 


[PV(QVRI]Sel(PVOIVRI (14) 


Il existe également le "connecteur ET" ou "connecteur de conjonction" À, pour quel que soient 
P, Q deux propriétés définies sur E, PA Q est une propriété sur E définie par: 


- PAG est vraie si toutes les deux propriétés P, Q sont vraies 
- PA Q est fausse sinon 


Nous pouvons créer la table de vérité du connecteur /\: 


| IE 
V V V 
V F F 
F V F 
F F F 


Tableau: 1.5 - Table de vérité de ET 


Il est également facile de se convaincre que, si les parties P, Q de E sont respectivement associées aux 
propriétés P, Q que PAn@ (cf. chapitre Théorie Des Ensembles) est associé à PA Q: 


FE 


(eRCTE. (1.5) 
PAQS PnQ 


Le connecteur , est associatif. Pour s'en convaincre, il suffit aussi de faire une table de vérité où nous 
vérifions que: 


[PA(QAR]JSI(PAQAR] (16) 


Les connecteurs /\,# sont distributifs l'un sur l'autre. A l'aide d'une simple table de vérité, nous 
prouvons que: 


[PV(@AR) SI(PVO)ACG VER) (7 
ainsi que: 
[PAG@VR)YSIPAQ)V(PAR)] (18) 


Une négation de PV @ est [{-#Pj A (-@)] une négation de PA Q est [{—P) V (-@)] tel que pour 
résumer: 
PVO) &[(GP) A(0)] 
PAQ) 8 [QP) V(-0)] 


(1.9) 


A nouveau, ces propriétés peuvent se démontrer par une simple table de vérité. 
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Remarque: Pour voir les détails de tous les opérateurs logiques, le lecteur devra se rendre dans le 
chapitre d'Algèbre De Boole (cf. section d'Informatique Théorique) où l'identité, la double négation, 
l'idempotence, l'associativité, la distributivité, les relations de De Morgan sont présentées plus 
formellement. 


Revenons maintenant sur le "connecteur d'implication logique" appelé aussi parfois le "conditionnel" 
noté "=" 


Remarque: Dans certains ouvrages sur le calcul propositionnel, ce connecteur est noté "2" et dans 
le cadre de la théorie de la démonstration nous lui préférons souvent le symbole "—". 


Soient P, Q deux propriétés sur E. P = © est une propriété sur E définie par: 
- P= Q est fausse si P est vraie et Q fausse 
- P= Q est vraie sinon 


En d'autres termes, P implique logiquement Q signifie que Q est vraie pour toute évaluation pour 
laquelle P est vraie. L'implication représente donc le "si... alors." 


Si nous écrivons la table de vérité de l'implication (attention à l'avant-dernière ligne !!!): 


SR —° 
V V V 
V F F 
F V V 
F F V 


Tableau: 1.6 - Table de vérité de l'implication 


Si P— ©, nous pouvons dire que pour que Q soit vraie, il suffit que P soit vraie (effectivement 
l'implication sera vraie si P est vraie ou fausse selon la table de vérité). Donc P est une condition 
suffisante de Q (mais non nécessaire!). D'un autre côté, P = © est équivalent à -£ = —P. Donc, si 
Q est fausse, il est impossible que P soit vraie (pour que l'implication reste vraie bien sûr!). Donc 
finalement Q est une condition nécessaire de P. 


® Exemples: 
E1. Soit la proposition: "Si tu obtiens ton diplôme, je t'achète un ordinateur" 


Parmi tous les cas, un seul correspond à une promesse non tenue: celui où l'enfant à son diplôme, et n'a 
toujours pas d'ordinateur (deuxième ligne dans le tableau). 


Et le cas où il n'a pas le diplôme, mais reçoit quand même un ordinateur? Il est possible qu'il ait été 
longtemps malade et a raté un semestre, et le père a le droit d'être bon. 


Que signifie cette promesse, que nous écrirons aussi: "Tu as ton diplôme — je t'achète un ordinateur" ? 


Exactement ceci: 
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- Si tu as ton diplôme, c'est sûr, je t'achète un ordinateur (je ne peux pas ne pas l'acheter) 
- Si tu n'as pas ton diplôme, je n'ai rien dit 
E2. De toute proposition fausse nous pouvons déduire toute proposition (deux dernières lignes) 


C'est un exemple plutôt anecdotique: dans un cours de Russell portant sur le fait que d'une proposition 
fausse, toute proposition peut être déduite, un étudiant lui posa la question suivante: 


- "Prétendez-vous que de 2 + 2 =5, il s'ensuit que vous êtes le pape ? " 

- "Oui", fit Russell 

- "Et pourriez-vous le prouver !", demanda l'étudiant sceptique 

- "Certainement", réplique Russell, qui proposa sur le champ la démonstration suivante. 
(1) Supposons que 2+2=5 

(2) Soustrayons 2 de chaque membre de l'égalité, nous obtenons 2 = 3 

(3) Par symétrie, 3 = 2 

(4) Soustrayant 1 de chaque côté, il vient 2 =1 


Maintenant le pape et moi sommes deux. Puisque 2 = 1, le pape et moi sommes un. Par suite, je suis le 
pape. 


Sur ce … 


Le connecteur d'implication est essentiel en mathématiques, philosophie, etc. C'est un des fondements 
de toute démonstration, preuve ou déduction. 


Le connecteur d'implication a comme propriétés (vérifiables à l'aide de la table de vérité ci-dessous): 


PQ 610) (2) 
P=Q eV] 


(1.10) 


conséquence de la dernière propriété (à nouveau vérifiable par une table de vérité): 
(P= 0) S[PA(-0)] («11 


Le "connecteur d'équivalence logique" ou "biconditionnel" noté "& "ou "<>" signifiant par définition 
que: 


(P&Q)e(P=Q)A(C—= PF?) «1 
en d'autres termes, la première expression a la même valeur pour toute évaluation de la deuxième. 


Ce que nous pouvons vérifier à l'aide d'une table de vérité: 
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om P=Q [g=rP|rsQ 
V V V V V 
V F F V F 
F V V F F 
EVE | v iv | v 


Tableau: 1.7 - Table de vérité de l'équivalence logique 


P & @ signifie bien (lorsqu'il est vrai!) que "P et Q ont toujours la même valeur de vérité" ou encore 
"Pet Q sont équivalents". C'est vrai si P et Q ont même valeur, faux dans tout cas contraire. 


Bien évidemment (c'est une tautologie): 
PS0) (PF (0) (113) 


La relation P & © équivaut donc à ce que P soit une condition nécessaire et suffisante de Q et à ce 
que Q soit une condition nécessaire et suffisante de P. 


La conclusion, est que les conditions de type "nécessaire, suffisant, nécessaire et suffisant" peuvent 


être reformulées avec les termes "seulement si", "si", "si et seulement si”. 
Ainsi: 


1. P= © traduit le fait que Q est une condition nécessaire pour P ou dit autrement, P est vraie 
seulement si Q est vraie (dans la table de vérité, lorsque P— © prend la valeur 1 on constate bien que 
P vaut 1 seulement si Q vaut 1 aussi). On dit aussi, si P est vraie alors Q est vraie. 


2. PQ ou ce qui revient au même © = À traduit le fait que Q est une condition suffisante pour P 
ou dit autrement, P est vraie si Q est vraie (dans la table de vérité, lorsque © = À prend la valeur 1 on 
constate bien que P vaut 1 si Q vaut 1 aussi). 


3. P & Q traduit le fait que Q est une condition nécessaire et suffisante pour P ou dit autrement, P est 
vraie si et seulement si Q est vraie (dans la table de vérité, lorsque P & © prend la valeur 1 on 
constate bien que P vaut 1 si Q vaut 1 et seulement si Q vaut 1). 


Remarque: L'expression "si et seulement si" correspond donc a une équivalence logique et ne peut 
être utilisée que pour décrire une bi-implication!! 


La première étape du calcul propositionnel est donc la formalisation des énoncés du langage naturel. 
Pour réaliser ce travail, le calcul propositionnel fournit finalement trois types d'outils : 


1. Les "variables propositionnelles" (P, Q, R,...) symbolisent des propositions simples quelconques. Si la 
même variable apparaît plusieurs fois, elle symbolise chaque fois la même proposition. 


2. Les cinq opérateurs logiques: -,A,V,=,# 


3. Les signes de ponctuation se réduisent aux seules parenthèses ouvrante et fermante qui organisent la 


lecture de manière à éviter toute ambiguïté. 
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Voici un tableau récapitulatif: 


La "négation" est un opérateur qui ne porte que sur E mA 
une proposition, il est unaire ou monadique. "Il ne 
pleut pas" s'écrit 2. Cet énoncé est vrai si et 
seulement si P est faux (dans ce cas s'il est faux qu'il 
pleut). L'usage classique de la négation est caractérisé 
par la loi de double négation: ——# est équivalent à P. 


La "conjonction" ou "produit logique" est un opérateur Â (PAQ) 
binaire; elle met en relation deux propositions. "Tout 
homme est mortel ET Ma voiture perd de l'huile" 

s'écrit (P Â Q) . Cette dernière expression est vraie si 


et seulement si P est vrai et Q est vrai. 


La "disjonction" ou "somme logique" est, elle aussi, un V (PVO) 
opérateur binaire. (P\/Q); est vraie si et seulement si 
P est vraie ou Q est vraie. Nous pouvons comprendre 
ce OÙ de deux façons : soit de manière inclusive, soit 
de manière exclusive. Dans le premier cas (PQ) est 


vrai si P est vraie, si Q est vraie ou si P et Q sont tous 
deux vrais. Dans le second cas, (PQ) est vraie si P 


est vraie ou si Q est vraie mais pas si les deux le sont. 
La disjonction du calcul propositionnel est le OU 
inclusif et on donne au OÙ exclusif le nom 
"d'alternative". 


"L'implication" est également un opérateur n (F0) 
binaire. Elle correspond, en gros, au schéma 
linguistique "Si..alors..". "Si j'ai le temps, j'irai au 
cinéma" s'écrit P= ©. P= © est fausse si P est vrai 
et Q est faux. Si le conséquent (ici Q) est vrai, 
l'implication (P = Q) est vraie. Lorsque l'antécédente 


(ici P) est fausse, l'implication est toujours vraie. Cette 
dernière remarque peut être comprise si l'on se réfère à 
des énoncés de type : "Si on pouvait mettre Paris en 
bouteille, on utiliserait la tour Eiffel comme 
bouchon." En résumé, une implication est fausse si et 
seulement si son antécédente est vraie et son 
conséquent est fausse. 


La "bi-implication" est, elle aussi, binaire : elle S (P = Q) 
symbolise les expressions "… si et seulement si..." et 
".… est équivalent à..." L'équivalence entre deux 
propositions est vraie si celles-ci ont la même valeur de 
vérité. La bi-implication exprime donc aussi une forme 
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d'identité et c'est pourquoi elle est souvent utilisée 
dans les définitions. 


Tableau: 1.8 - Récapitulatif des opérateurs 


Il est possible d'établir des équivalences entre ces opérateurs. Nous avons déjà vu comment le 
biconditionnel pouvait se définir comme un produit de conditionnels réciproques, voyons maintenant 
d'autres équivalences: 


(P=0 

( Q)e (PVO) 
(PVO) &(P= 0) 
(PAQ)& -(P = -0) 


(1.14) 


Remarque: Les opérateurs classiques À, Ÿ,# peuvent donc être définis à l'aide de -, = grâce 
aux lois d'équivalence entre opérateurs. 


Sont à noter également les deux relations de De Morgan (cf. chapitre d'Algeèbre de Boole) : 


(PVO) & (-PA-0) 
(PAQ) & (PV =0) 


Elles permettent de transformer la disjonction en conjonction et vice-versa: 


(PVO) & -(PAQ) 
(PAG) & (TP V-0) 


(1.16) 


3.3. PROCÉDURES DE DÉCISION 


Nous avons introduit précédemment les éléments de base nous permettant d'opérer sur des expressions 
à partir de propriétés (variables propositionnelles) sans toutefois dire grand-chose quant à la 
manipulation de ces expressions. Alors, il convient maintenant de savoir qu'en calcul propositionnel il 
existe deux manières d'établir qu'une proposition est une loi de la logique propositionnelle. Nous 
pouvons soit: 


1. Employer des procédures non axiomatisées 
2. Recourir à des procédures axiomatiques et démonstratives 
Remarque: Dans de nombreux ouvrages ces procédures sont présentées avant même la structure du 


langage propositionnel. Nous avons choisi de faire le contraire pensant que l'approche serait plus 
aisée. 
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3.3.1. PROCÉDURES DE DÉCISIONS NON AXIOMATISÉES 


Plusieurs de ces méthodes existent mais nous nous limiterons ici à la plus simple et à la plus parlante 
d'entre elles, celle du calcul matriciel, souvent appelée aussi "méthodes des tables de vérité". 


La procédure de construction est comme nous l'avons vu précédemment assez simple. Effectivement, la 
valeur de vérité d'une expression complexe est fonction de la valeur vérité des énoncés plus simples qui 
la composent, et finalement fonction de la valeur de vérité des variables propositionnelles qui la 
composent. En envisageant toutes les combinaisons possibles des valeurs de vérité des variables 
propositionnelles, nous pouvons déterminer les valeurs de vérité de l'expression complexe. 


Les tables de vérité, comme nous l'avons vu, permettent donc de décider, à propos de toute proposition, 
si celle-ci est une tautologie (toujours vraie), une contradiction (toujours fausse) ou une expression 
contingente (parfois vraie, parfois fausse). 


Nous pouvons ainsi distinguer quatre façons de combiner les variables propositionnelles, les 
parenthèses et les connecteurs: 


Nom Description Exemple 
1 Enoncé mal formé Non-sens. Ni vrai, ni faux (VP)Q 
2 Tautologie Enoncé toujours vrai PV -P 
È Contradiction Enoncé toujours faux (PAP) 
4, FEnoncé contingent | Enoncé parfois vrai, parfois faux (P Ve) 


La méthode des tables de vérité permet de déterminer le type d'expression bien formée face auquel 
nous nous trouvons. Elle n'exige en principe aucune invention, c'est une procédure mécanique. Les 
procédures axiomatisées, en revanche, ne sont pas entièrement mécaniques. Inventer une 
démonstration dans le cadre d'un système axiomatisé demande parfois de l'habilité, de l'habitude ou de 
la chance. Pour ce qui est des tables de vérité, voici la marche à suivre: 


Lorsqu'on se trouve face à une expression bien formée, ou fonction de vérité, nous commençons par 
déterminer à combien de variables propositionnelles distinctes nous avons affaire. Ensuite, nous 
examinons les différents arguments qui constituent cette expression. Nous construisons alors un tableau 
comprenant 2* rangées (n étant le nombre de variables) et un nombre de colonnes égal au nombre 
d'arguments plus des colonnes pour l'expression elle-même et ses autres composantes. Nous attribuons 
alors aux variables les différentes combinaisons de vérité et de fausseté qui peuvent leur être conférées 
(la vérité est exprimée dans la table par un 1 et la fausseté par un 0). Chacune des rangées correspond à 
un monde possible et la totalité des rangées constitue l'ensemble des mondes possibles. Il existe, par 
exemple, un monde possible dans lequel P est une proposition vraie tandis que Q est fausse. 


3.3.2. PROCÉDURES DE DÉCISIONS AXIOMATISÉES 


L'axiomatisation d'une théorie implique, outre la formalisation de celle-ci, que nous partions d'un 
nombre fini d'axiomes et que, grâce à la transformation réglée de ces derniers, nous puissions obtenir 
tous les théorèmes de cette théorie. Nous partons donc de quelques axiomes dont la vérité est posée (et 
non démontrée). Nous déterminons des règles de déduction permettant de manipuler les axiomes ou 
toute expression obtenue à partir de ceux-ci. L'enchaînement de ces déductions est une démonstration 
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qui conduit à un théorème, à une loi. 


Nous allons sommairement présenter deux systèmes axiomatiques, chacun étant constitué d'axiomes 
utilisant deux règles dites "règles d'inférence" (règles intuitives) particulières: 


Règle 1. Le "modus ponens": si nous avons prouvé Aet 4 = B, alors nous pouvons déduire B. A est 
appelé la "prémisse mineure" et 4 = 8 la prémisse majeure de la règle du modus ponens. 


® Exemple: De X ? y et (x > y) (y < x) nous pouvons déduire } < x 


Règle 2. La "substitution": nous pouvons dans un schéma d'axiomes remplacer une lettre par une 
formule quelconque, pourvu que toutes les lettres identiques soient remplacées par des formules 
identiques. 


Donnons à titre d'exemple, deux systèmes axiomatiques: le système axiomatique de Whitehead et 
Russell, le système axiomatique de Lukasiewicz. 


1. Le système axiomatique de Whitehead et Russel adopte comme symboles primitifs 1, et définit 
=, À,4 à partir de ces derniers de la manière suivante (relations facilement vérifiables à l'aide de 
tables de vérité): 


(4= 8) & -AVB 
(AAB) & ={(4V 8) (1.17) 
(AS B)S(4=— 8)A(B— 4) 


nous avions déjà présenté plus haut quelques-uns de ces éléments. 


Ce système comprend cinq axiomes, assez évidents en soi plus les deux règles d'inférence. Les axiomes 
sont donnés ici en utilisant des symboles non primitifs, comme le faisaient Whitehead et Russel: 


A1. (AV 4)= À 

A2. B=(AVB) 

A3. (AVB)=(8VA) 

A4. (AV(BVC))= (BV(AVC)) 


A5. (B=C)=((4VB)=(AVC)) 


Remarque: Ces cinq axiomes ne sont pas indépendants les uns des autres. Le quatrième peut être 
obtenu à partir des quatre autres. 


® Exemple: 


Pour prouver - 4 4, nous pouvons procéder ainsi: 
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(D) B= (AVE) Axiome A2 

(2) A= (AV À) (D et subst. 

(3) (B=C= ((AV B)= (AVC')) Axiome À5 (nécessaire) 

(4) (B= C)= ((-AV8)= (AVC) (3) et subst. 

(5) (8=c)=((4= 8)= (42= 0) (4) et définition de = 

(6) ((4VA)= 4)=((4= (4V4))= (42 4)) (5) et subst. 

(7) (A > (AV 4)) = (4 4) (6) (modus ponens) 

(8) (4= 4)= (4= 4) (2) et (Thetaxiome Al 

(9) A À (8) modus ponens 

(10) AV À (9) et déf. de = 
(1.18) 


2. Le système axiomatique de Lukasiewicz comprend les trois axiomes suivants, plus les deux règles 
d'inférences (modus ponens et substitution): 


A1. (4=B)=((8=Cc)=(4=c)) 
A2. A=(—4= B) 
A3. (-4= 4)= A 


Voici des preuves des deux premiers axiomes, dans le système de Whitehead et Russel. Ce sont les 
formules (6) et (16) de la dérivation suivante: 
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(1) (AV(BVC))= (8V(AVC)) Axiome A4 


(2) RE # on (D et subst. 
= (-( (AVB)V (-(8= c)V(AVC))) 


(3) -(AV23)V(- (= 0€) V(AVC')) A4 sur (2) et modus ponens 

(4) (AV8)= ((8= C)= (AVC)) (3) par déf. de = 

(5) (-A4VB)= ((8= C)= (AVC) (4) et subst. 

(6) (A= B)=((8= C)=(4= C)) (5) et déf. de = 
((AVB)=(8V 4) 

) (8=(4V8))= k (= (VA) | (6) et subst. 

(8)  ((AVB8)=(8VA4))=(8=(8V4) (7) modus ponens 

(9) B= (BV A) (8) modus ponens 

(10) —B= (-BV À) (9) et subst. 

(11) 8 \/(-8V 4) (10) et déf. de = 

(2) (--B8V(-B8V4))={(-B8V(--B8VA4)] Axiome A4 + subst. avec (11) 

(13) BV(-—-8V A) (12) modus ponens 

(14) B= (--8\ À) (13) et déf. de = 

(15) B= (-B= À) (14) et déf. de = 

(16) AS AE) (16) et subst. 


(1.19) 


Ces axiomatisations permettent de retrouver comme théorèmes toutes les tautologies ou lois de la 
logique propositionnelle. De par tout ce qui a été dit jusqu'à maintenant, nous pouvons tenter de définir 
ce qu'est une preuve. 


Définition: Une suite finie de formules 3,,28,,...,8, est appelée "preuve" à partir des hypothèses 
4,4,,...,4, si pour chaque i: 


- B, est l'une des hypothèses 4,4, ,...,4, 

- ou À; est une variante d'un axiome 

- ou 8, est inférée (par application de la règle du modus ponens) à partir de la prémisse majeure 2; et 
de la prémisse mineure 3, où j,& <i 

- ou 8; est inférée (par application de la règle de substitution) à partir d'une prémisse antérieure 8; , la 
variable remplacée n'apparaissant pas dans 4,4, ,..., 4, 


Une telle suite de formules, &,, étant la formule finale de la suite, est appelée plus explicitement 
"preuve de 8," à partir des hypothèses 4,4, ,...,4,, Ce que nous notons par: 


A... APES, (120) 
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Remarque: Il faut noter que lorsque nous essayons de prouver un résultat à partir d'un certain 
nombre d'hypothèses, nous n'essayons pas de prouver les hypothèses elles-mêmes. 


3.4. QUANTIFICATEURS 


Nous devons compléter l'utilisation des connecteurs du calcul propositionnel par ce que nous appelons 
des "quantificateurs" si nous souhaitons pouvoir résoudre certains problèmes. Effectivement, le calcul 
propositionnel ne nous permet pas d'affirmer des choses générales sur les éléments d'un ensemble par 
exemple. Dans ce sens, la logique propositionnelle ne reflète qu'une partie du raisonnement. Le "calcul 
des prédicats" au contraire permet de manipuler formellement des affirmations telles que "il existe un x 
tel que [x a une voiture américaine]" ou "pour tous les x [si x est un teckel, alors x est petit]"; en 
somme, nous étendons les formules composées afin de pouvoir affirmer des quantifications 
existentielles ("il existe.…") et des quantifications universelles ("pour tout...."). Les exemples que nous 
venons de donner font intervenir des propositions un peu particulières comme "x a une voiture 
américaine". Il s'agit ici de propositions comportant une variable. Ces propositions sont en fait 
l'application d'une fonction à x. Cette fonction, c'est celle qui associe "x a une voiture américaine" à x. 
Nous dénoterons cette fonction par "… a une voiture américaine" et nous dirons que c'est une fonction 
propositionnelle, car c'est une fonction dont la valeur est une proposition. Ou encore un "prédicat". 


Les quantificateurs existentiels et universels vont donc de pair avec l'emploi de fonctions 
propositionnelles. Le calcul des prédicats est cependant limité dans les formules existentielles et 
universelles. Ainsi, nous nous interdisons des formules comme "il existe une affirmation de x telle 
que..". En fait, nous ne nous autorisons à quantifier que des "individus". C'est pour cela que la logique 
des prédicats est dite une "logique du premier ordre”. 


Avant de passer à l'étude du calcul des prédicats nous devons définir: 
D1. Le "quantificateur universel": * (pour tout) 


D2. Le "quantificateur existentiel": 2 (il existe) 


Remarque: Nous utilisons parfois le symbole 31 pour dire brièvement: "il existe un et un seul": 
VreR,1lyeR.,x=in(y) 


Nous allons voir que la théorie de la démonstration et des ensembles est l'exacte transcription des 
principes et résultats de la Logique (celle avec un "L" majuscule). 


4, CALCUL DES PRÉDICATS 


Dans un cours de mathématiques (d'algèbre, d'analyse, de géométrie, .), nous démontrons les 
propriétés de différents types d'objets (entiers, réels, matrices, suites, fonctions continues, courbes, ….). 
Pour pouvoir prouver ces propriétés, il faut bien sûr que les objets sur lesquels nous travaillons soient 
clairement définis (qu'est-ce qu'un entier, un réel, ..?). 


En logique du premier ordre et, en particulier, en théorie de la démonstration, les objets que nous 
étudions sont les formules et leurs démonstrations. Il faut donc donner une définition précise de ce que 
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sont ces notions. Les termes et les formules forment la grammaire d'une langue, simplifiée à l'extrême et 
calculée exactement pour dire ce que nous voulons sans ambiguïté et sans détour inutile. 


4.1. GRAMMAIRE 


Définitions: 


D1. Les "termes", désignent les objets dont nous voulons prouver des propriétés (nous reviendrons un 
peu plus loin beaucoup plus en détail sur ces derniers): 


- En algèbre, les termes désignent les éléments d'un groupe (ou anneau, corps, espace vectoriel, etc.). 
Nous manipulons aussi des ensembles d'objets (sous-groupe, sous-espace vectoriel, etc). Les termes qui 
désignent ces objets, d'un autre type, seront appelés "termes du second ordre". 


- En analyse, les termes désignent les réels ou (par exemple, si nous nous plaçons dans des espaces 
fonctionnels) des fonctions. 


D2. Les "formules", représentent les propriétés des objets que nous étudions (nous reviendrons 
également beaucoup plus en détail sur ces dernières): 


- En algèbre, nous pourrons écrire des formules pour exprimer que deux éléments commutent, qu'un 
sous-espace vectoriel est de dimension 3, etc. 


- En analyse, nous écrirons des formules pour exprimer la continuité d'une fonction, la convergence 
d'une suite, etc. 


- En théorie des ensembles, les formules pourront exprimer l'inclusion de deux ensembles, 
l'appartenance d'un élément à un ensemble, .… 


D3. Les "démonstrations", elles permettent d'établir qu'une formule est vraie. Le sens précis de ce mot 
aura lui aussi besoin d'être défini. Plus exactement, elles sont des déductions sous hypothèses, elles 
permettent de "mener du vrai au vrai", la question de la vérité de la conclusion étant alors renvoyée à 
celle des hypothèses, laquelle ne regarde pas la logique mais repose sur la connaissance que nous avons 
des choses dont nous parlons. 


4.2. LANGAGES 


En mathématique, nous utilisons, suivant le domaine, différents langages qui se distinguent par les 
symboles utilisés. La définition ci-dessous exprime simplement qu'il suffit de donner la liste de ces 
symboles pour préciser le langage. 


Définition: Un "langage" est la donnée d'une famille (pas nécessairement finie) de symboles. Nous en 
distinguons de trois sortes: symboles, termes et formules. 
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Remarques: 


R1. Nous utilisons quelques fois le mot "vocabulaire" ou le mot "signature" à la place du mot 
"langage". 


R2. Le mot "prédicat" peut être utilisé à la place du mot "relation". Nous parlons alors de "calcul 
des prédicats" au lieu de "logique du premier ordre" (ce que nous avons étudié précédemment). 


4.2.1. SYMBOLES 

Il existe différents types de symboles que nous allons tâcher de définir: 

D1. Les "symboles de constante" (voir remarque plus bas) 

® Exemple: 

Le n pour l'élément neutre en théorie des ensembles (cf. chapitre de Théorie Des Ensembles) 


D2. Les "symboles de fonction" ou "foncteurs". À chaque symbole de fonction est associé un entier 


strictement positif que nous appelons son "arité": c'est le nombre d'arguments de la fonction. Si l'arité 
est 1 (resp. 2, ..,n), nous disons que la fonction est unaire (resp. binaire, …, n-aire) 


® Exemple: 
Le foncteur binaire de multiplication * dans les groupes (cf. chapitre de Théorie Des Ensembles). 


D3. Les "symboles de relation". De la même manière, à chaque symbole de relation est associé un 
entier positif ou nul (son arité) qui correspond à son nombre d'arguments et nous parlons de relation 
unaire, binaire, n-aire (comme par exemple le symbole de relation "="). 


D4. Les "variables individuelles". Dans toute la suite, nous nous donnerons un ensemble infini V de 
variables. Les variables seront notées comme il l'est de tradition: x, y, z (éventuellement indexées: x,,.… 


À 


D5. A cela il faut rajouter les connecteurs et quantificateurs que nous avons longuement présentés plus 
haut et sur lesquels il est pour l'instant inutile de revenir. 
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Remarques: 


R1. Un symbole de constante peut être vu comme un symbole de fonction à 0 argument (d'arité 
nulle). 


R2. Nous considérons (sauf mention contraire) que chaque langage contient le symbole de relation 


binaire = (lire "égal") et le symbole de relation à zéro argument dénoté 1 (lire "bottom" ou 


absurde") qui représente le faux. Dans la description d'un langage, nous omettrons donc souvent de 
les mentionner. Le symbole | est souvent redondant. Nous pouvons en effet, sans l'utiliser, écrire 
une formule qui est toujours fausse. Il permet cependant de représenter le faux d'une manière 
canonique et donc d'écrire des règles de démonstration générales. 


R3. Le rôle des fonctions et des relations est très différent. Comme nous le verrons plus loin, les 
symboles de fonction sont utilisés pour construire les termes (les objets du langage) et les symboles 
de relation pour construire les formules (les propriétés de ces objets). 


4.2.2, TERMES 

Les termes (nous disons aussi "termes du premier ordre") représentent les objets associés au langage. 
Définitions: 

Soit £ un langage: 


D1. L'ensemble 7 des termes sur £ est le plus petit ensemble contenant les variables, les constantes et 
stable (on ne sort pas de l'ensemble) par l'application des symboles de fonction de £ à des termes. 


D2. Un "terme clos" est un terme qui ne contient pas de variables (donc par extension, seulement des 
constantes). 


D3. Pour obtenir une définition plus formelle, nous pouvons écrire: 
LE {6 (122 
où t est une variable ou un symbole de constante et, pour tout £e N: 
Tin “HU... L)/L ET} (123) 


où f est une fonction d'arité n (rappelons que l'arité est le nombre d'arguments de la fonction). Ainsi, 
pour chaque arité, il y a un degré d'ensemble de termes. Nous avons finalement: 


Le U Te (1.24) 
KkeN 


D4. Nous appellerons "hauteur" d'un terme t le plus petit k tel que £ € Z,. 
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Remarques: 


R1. La définition DA signifie que les variables et les constantes sont des termes et que si f est un 
symbole de fonction n-aire et £,,...,£, sont des termes alors f(£,,..,£,) est un terme en soi aussi. 


L'ensemble TZ des termes est défini par la grammaire: 


T =V|S IST... T)| (125) 


Cette expression se lit de la manière suivante: un élément de l'ensemble 7 que nous sommes en 
train de définir est soit un élément de V (variables), soit un élément de #7, (l'ensemble des symboles 


de constantes), soit l'application d'un symbole de fonction f € $, à n éléments (constantes ou 
variables) de ZT. 


Attention: le fait que f soit de la bonne arité est seulement implicite dans cette notation. De plus, 
l'écriture $,(7.,...,T) ne signifie pas que tous les arguments d'une fonction sont identiques mais 


simplement que ces arguments sont des éléments de T. 


R2. Il est souvent commode de voir un terme (expression) comme un arbre dont chaque noeud est 
étiqueté par un symbole de fonction (opérateur ou fonction) et chaque feuille par une variable ou 
une constante. 


Dans la suite, nous allons sans cesse définir des notions (ou prouver des résultats) "par récurrence" sur 
la structure ou la taille d'un terme. 


Définitions: 


D1. Pour prouver une propriété P sur les termes, il suffit de prouver P pour les variables et les 
constantes et de prouver P(f(£,..,6,)) à partir de P(£),...,P(£, ). Nous faisons ainsi ici une "preuve 


par induction sur la hauteur d'un terme". C'est une technique que nous retrouverons dans les chapitres 
suivants. 


D2. Pour définir une fonction + sur les termes, il suffit de la définir sur les variables et les constantes 
et de dire comment nous obtenons D{f(£,...,4,)) à partir de P(4),..., D(£,) . Nous faisons ici encore 


une "définition par induction sur la hauteur d'un terme". 
® Exemple: 


La taille (nous disons aussi la "longueur") d'un terme t (notée T{£) ) est le nombre de symboles de 
fonction apparaissant dans t. Formellement: 


- T{x) = Te) = O si x est une variable et c est une constante 


AD 7) 


Ki£x 


où le 1 dans la dernière relation relation représente le terme f. 
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Remarque: La preuve par induction sur la hauteur d'un terme sera souvent insuffisante. Nous 
pourrons alors prouver une propriété P sur les termes en supposant la propriété vraie pour tous les 
termes de taille ? $ # et en la démontrant ensuite pour les termes de taille n. Il s'agira alors d'une 
"preuve par récurrence sur la taille du terme" (voir de tels exemples dans le chapitre de Théorie Des 
Nombres). 


4.2.3. FORMULES 


Les formules sont construites à partir de "formules atomiques" en utilisant des connecteurs et des 
quantificateurs. Nous utiliserons les connecteurs et les quantificateurs suivants (qui nous sont déjà 
connus): 


- connecteur unaire de négation: — 
- connecteurs binaires de conjonction et disjonction ainsi que d'implication: À, , # , — 
- quantificateurs: 2 qui se lit "il existe" et qui se lit "pour tout" 


Cette notation des connecteurs est standard (elle devrait du moins). Elle est utilisée pour éviter les 
confusions entre les formules et le langage courant (le métalangage). 


Définitions: 


D1. Soit £ un langage, les "formules atomiques" de £ sont les formules de la forme A(£,...,4,) où R 
est un symbole de relation n-aire de £ et #,,...,f, sont des termes de £. Nous notons "Atom" 
l'ensemble des formules atomiques. Si nous notons #, l'ensemble des symboles de relation, nous 


pouvons écrire l'ensemble des termes mis en relations par l'expression: 


Atom = S,(T,...,T)| (1.26) 


L'ensemble F des formules de la logique du premier ordre de £ est donc défini par la grammaire (où x 
est une variable): 


F= Atom|F VF|FAFIF=F|F-F|2F [var (27 


où il faut lire: l'ensemble des formules est le plus petit ensemble contenant les formules et tel que si Æ 
et F, sont des formules alors Æ VF, , etc. sont des formules et qu'elles peuvent être en relation entre 
elles. 


® Exemple: 

Les symboles de relation du langage propositionnel sont des relations d'arité 0 (même le symbole "=" 
est absent), les quantificateurs sont alors inutiles (puisqu'une formule propositionnelle ne peut pas 
contenir des variables). Nous obtenons alors le calcul propositionnel défini par: 


Cp = [C1 CG VO |C AC» |Cr Cl (128) 


Remarquons la présence du symbole "bottom!" signifiant le "faux" que nous n'avions pas mentionné lors 
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de notre étude de la logique propositionnelle. 


Nous ferons attention à ne pas confondre termes et formules. sin{x) est un terme (fonction), x = 3 est 
une formule. Mais sin(x) A (x = 3) n'est rien: nous ne pouvons, en effet, mettre un connecteur entre un 
terme et une formule (aucun sens). 


Remarques: 
R1. Pour définir une fonction sur les formules, il suffit de définir & sur les formules atomiques. 


R2. Pour prouver une propriété P sur les formules, il suffit de prouver P pour les formules 
atomiques. 


R3. Pour prouver une propriété P sur les formules, il suffit de supposer la propriété vraie pour 
toutes les formules de taille ? $ # et de la démontrer pour les formules de taille n. 


D2. Une "sous-formule" d'une formule (ou expression) F est l'un de ses composants, in extenso une 
formule à partir de laquelle F est construite. Formellement, nous définissons l'ensemble SF(F) des 
sous-formules de F par: 


- SiF est atomique: SF(F#) = {F} 
-Si F=A@EF, (soit une composition!) avec®e {A V.—}, SF(F) = {F} USF(R)USF(F,) 
- Si F = A ou QxA avec Le {7,3}, SF(F) = {F} USF(F) 


D3. Une formule F de £ n'utilise qu'un nombre fini de symboles de £. Ce sous-ensemble est appelé le 
"langage de la formule" et noté £(F). 


D4. La "taille (ou la longueur) d'une formule" F (notée T{F) ) est le nombre de connecteurs ou de 
quantificateurs apparaissant dans F. Formellement: 


- HF) = 0 si F est une formule atomique 
- HA SEÆA)=1+r7(4)+17%,) où Be{V, A.) 


- TA) = HQxA) = 1+7(Æ) avec 0e (V,3 

D5. "L'opérateur principal" (nous disons aussi le "connecteur principal") d'une formule est défini par: 
- Si A est atomique, alors elle n'a pas d'opérateur principal 

- Si 4= 8, alors — est l'opérateur principal de A 

- Si 4= BC où BE{A V,}, alors & est l'opérateur principal de A 


- Si 4 = QxB où LE {F,7, alors © est l'opérateur principal de A 
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D6. Soit F une formule. L'ensemble FZ(F) des variables libres de F et l'ensemble FAf(F) des 
variables muettes (ou liées) de F sont définis par récurrence sur Æ). 


Une occurrence d'une variable donnée est dite "variable liée" ou "variable muette" dans une formule F 
si dans cette même formule, un quantificateur y fait référence. Dans le cas contraire, nous disons avoir 
une “variable libre". 


Remarque: Une occurrence d'une variable x dans une formule F est une position de cette variable 
dans la formule F. Ne pas confondre avec l'objet qu'est la variable elle-même. 


Pour préciser les variables libres possibles d'une formule F, nous noterons Æ[x,,...,x,]. Cela signifie 
que les variables libres de F sont parmi x,,...,x, in extenso si y est libre dans F, alors y est l'un des x; 
mais les x; n'apparaissent pas nécessairement dans F. 


Nous pouvons définir les variables muettes ou libres de manière plus formelle: 


1. Si F = R(£,.4,) est atomique alors F£(F) est l'ensemble des variables libres apparaissant dans les 
4 et nous avons alors pour les variables muettes FF) = 


2.SiF-A@EA, où @e{A V,-}: PL(F) = PL(A) UPE(E) alors FM(F) = VM(A) UVM(E,) 
3.si F = alors VL(F) = VL(A) et VM(F) = VM(Æ) 

4. si F = QxA avec De (v,3:VL(F) = VL(Æ)-{x} et VM(F) =VM(A)U(x 

% Exemples: 

El. Soit F: x (x'y =y:x) alors VL(F)={y} et VM(F) ={x} 

E2. Soit G: {Vx2(x'z=2:y)}A(x=2:2} alors VL(G) ={x,z} et VM(G) ={x,y} 


D7. Nous disons que les formules F et G sont "& -équivalentes" si elles sont (syntaxiquement) 
identiques à un renommage près des occurrences liées des variables. 


D8. Une “formule close" est une formule sans variables libres. 


D9. Soit F une formule, x une variable et t un terme. F[x:= #] est la formule obtenue en remplaçant 


dans F toutes les occurrences libres de x par t, après renommage éventuel des occurrences liées de F 
qui apparaissent libres dans t. 
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Remarques: 


R1. Nous noterons dans les exemples vus qu'une variable peut avoir à la fois des occurrences libres 
et des occurrences liées. Nous n'avons donc pas toujours F£LCF) "PAM CEA) = 


R2. Nous ne pouvons pas renommer y en x dans la formule Yy{x: y = y: x) et obtenir la formule 
Yx(x'x=x'x): la variable x serait "capturée". Nous ne pouvons donc pas renommer des variables 
liées sans précautions: il faut éviter de capturer des occurrences libres. 


5. DÉMONSTRATIONS 


Les démonstrations que l'on trouve dans les ouvrages de mathématiques sont des assemblages de 


symboles mathématiques et de phrases contenant des mots-clés tels que: "donc", "parce que”, 
et seulement si", "il est nécessaire que", "il suffit de", "prenons un x tel que”, "supposons que", 
"cherchons une contradiction", etc. Ces mots sont supposés être compris par tous de la même manière, 


ce qui n'est en fait, pas toujours le cas. 


si", "si 


Dans tout ouvrage, le but d'une démonstration est de convaincre le lecteur de la vérité de l'énoncé. 
Suivant le niveau du lecteur, cette démonstration sera plus ou moins détaillée: quelque chose qui pourra 
être considéré comme évident dans un cours de licence pourrait ne pas l'être dans un cours de niveau 
inférieur. 


Dans un devoir, le correcteur sait que le résultat demandé à l'étudiant est vrai et il en connaît la 
démonstration. L'étudiant doit démontrer (correctement) le résultat demandé. Le niveau de détail qu'il 
doit donner dépend donc de la confiance qu'aura le correcteur: dans une bonne copie, une "preuve par 
une récurrence évidente" passera bien, alors que dans une copie où il y eu auparavant un "évident", qui 
était évidemment... faux, ça ne passera pas! 


Pour pouvoir gérer convenablement le niveau de détail, il faut savoir ce qu'est une démonstration 
complète. Ce travail de formalisation n'a été fait qu'au début de 20ème siècle!! 


Plusieurs choses peuvent paraître surprenantes: 


- il n'y a qu'un nombre fini de règles: deux pour chacun des connecteurs (et l'égalité) plus trois règles 
générales. Il n'était pas du tout évident a piori qu'un nombre fini de règles soit suffisant pour démontrer 
tout ce qui est vrai. Nous montrerons ce résultat (c'est essentiellement, le théorème de complétude). La 
preuve n'en est pas du tout triviale. 


- ce sont les mêmes règles pour toutes les mathématiques et la physique: algèbre, analyse, géométrie, 
etc. Cela veut dire que nous avons réussi à isoler tout ce qui est général dans un raisonnement. Nous 
verrons plus loin qu'une démonstration est un assemblage de couples, où F est un ensemble de 
formules (les hypothèses) et A une formule (la conclusion). Quand nous faisons de l'arithmétique, de la 
géométrie ou de l'analyse réelle, nous utilisons, en plus des règles, des hypothèses que l'on appelle des 
"axiomes". Ceux-ci expriment les propriétés particulières des objets que nous manipulons (pour plus de 
détails sur les axiomes voir la page d'introduction du site). 


Page: 44/4839 


[v3.0 - 2013] 


Nous démontrons donc, en général, des formules en utilisant un ensemble d'hypothèses, et cet ensemble 
peut varier au cours de la démonstration: quand nous disons "supposons F et montrons G", Fest alors 
une nouvelle hypothèse que nous pourrons utiliser pour montrer G. Pour formaliser cela, nous 
introduisons le concept de "séquent"”: 


Définitions: 
D1. Un "séquent" est un couple (noté T'+ÆF ) où: 


- Fest un ensemble fini de formules qui représente les hypothèses que nous pouvons utiliser. Cet 
ensemble s'appelle aussi le "contexte du séquent". 


- Fest une formule. C'est la formule que nous voulons montrer. Nous dirons que cette formule est la 
"conclusion du séquent”. 


Remarques: 


R1. Si T = {4,4} nous pourrons noter 4,..,4,H+ F au lieu de F HF. Le signe + se lit "thèse" 
ou démontre". 


R2. Nous noterons + Æ# un séquent dont l'ensemble d'hypothèses est vide et l”,,...,7, + Æ un 


séquent dont l'ensemble d'hypothèses est Ù li. 
1 


R3. Nous noterons que dans le séquent [,4k 8 la formule A peut être dans l (elle devient alors 
une hypothèse). 


R4. Nous écrirons F É F pour dire que "T HF est non prouvable”. 


D2. Un séquent T'HÆ est "prouvable" (ou démontrable, dérivable) s'il peut être obtenu par une 
application finie de règles. Une formule F est prouvable si le séquent + F est prouvable. 


5.1. RÈGLES DE DÉMONSTRATION 


Les règles de démonstration sont les briques qui permettent de construire les dérivations. Une 
dérivation formelle est un assemblage fini (et correct!) de règles. Cet assemblage n'est pas linéaire (ce 
n'est pas une suite) mais un "arbre". Nous sommes en effet souvent amenés à faire des branchements. 


Nous allons présenter un choix de règles. Nous aurions pu en présenter d'autres (à la place ou en plus) 
qui donneraient la même notion de prouvabilité. Celles que l'on a choisies sont "naturelles" et 
correspondent aux raisonnements que l'on fait habituellement en mathématique. Dans la pratique 
courante nous utilisons, en plus des règles ci-dessous, beaucoup d'autres règles mais celles-ci peuvent se 
déduire des précédentes. Nous les appellerons "règles dérivées". 


Il est de tradition d'écrire la racine de l'arbre (le séquent conclusion) en bas, les feuilles en haut: la 
nature est ainsi faite. Comme il est également de tradition d'écrire, sur une feuille de papier, de haut en 
bas, il ne serait pas déraisonnable d'écrire la racine en haut et les feuilles en bas. Il faut faire un choix ! 


Une règle se compose: 
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- d'un ensemble de "prémisses": chacune d'elles est un séquent. Il peut y en avoir zéro, un ou plusieurs 


- du séquent conclusion de la règle 


- d'une barre horizontale séparant les prémisses (en haut) de la conclusion (en bas). Sur la droit de la 
barre, nous indiquerons le nom de la règle. 


2 Exemple: 


FHA4=8 TrHA 
—+ 


CEE e (29) 


Cette règle a deux prémisses (T + 4 — 8 et TH 4) et une conclusion (T + 8) et se note de manière 
abrégée sous la forme: —,. Elle peut se lire de deux manières: 


- de bas en haut: si nous voulons prouver la conclusion, il suffit par utilisation de la règle de prouver les 
prémisses. C'est ce qu'on fait quand nous cherchons une démonstration. Cela correspond à "l'analyse". 


- de haut en bas: si nous avons prouvé les prémisses, alors nous avons aussi prouvé la conclusion. C'est 
ce que nous faisons quand nous rédigeons une démonstration. Cela correspond à la "synthèse". 


Pour les démonstrations il existe un nombre fini de règles au nombre de 17 que nous allons définir 
ci-après: 


1. Axiome: 


———— ax 
T,AFA 


De bas en haut: si la conclusion du séquent est une des hypothèses, alors le séquent est prouvable. 


2. Affaiblissement: 


Explications: 


- De haut en bas: si nous démontrons À sous les hypothèses l , en ajoutant d'autres hypothèses on peut 
encore démontrer À. 


- De bas en haut: il y a des hypothèses qui peuvent ne pas servir 


3. Introduction de l'implication: 


CT A+HB 
CHASSE 


- De bas en haut: pour montrer que 4 — Z nous supposons A (c'est-à-dire que nous l'ajoutons aux 
hypothèses) et nous démontrons B. 
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4. Elimination de l'implication: 


r+HA4=8 TrHA 
CES ° 


- De bas en haut: pour démontrer B, si nous connaissons un théorème de la forme 4— 8 et si nous 
pouvons démontrer le lemme 4— &, il suffit de démontrer A. 


5. Introduction à la conjonction: 


CES TÉS 


| (1.34 
CHAN A «3 


- De bas en haut: pour montrer 4 8, il suffit de montrer À et de montrer B. 


6. Elimination de la conjonction: 


TFAA8 hs (1.35) et TFAAB A4! (136) 


CHA THB 


- De haut en bas: de 4/\ 8, nous pouvons déduire À (élimination gauche) et B (élimination droite). 


7. Introduction de la disjonction: 


ne V£| (1.37) ou TPS x (1.38) 


T+HAVE T+HAVE 


- De bas en haut: pour démontrer 4/8, il suffit de démontrer A (disjonction gauche) ou de démontrer 
B (disjonction droite). 


8. Elimination de la disjonction: 


TEHAVS CAEC T28EFC 


V,| (139) 
rTÉC 


- De bas en haut: si nous voulons montrer C et que nous savons que nous avons 4/2, il suffit de le 
montrer d'une part en supposant À, d'autre part en supposant B. C'est un raisonnement par cas. 


9. Introduction de la négation: 


FAI 
TH-4 


(1.40) 


- De bas en haut: pour montrer —4, nous supposons A et nous démontrons l'absurde ( L ). 


10. Elimination de la négation: 


FA lrA_ 


RE ,| (1.41) 


- De haut en bas: si nous avons montré —4 et À, alors nous avons montré l'absurde ( L ) 
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11. Absurdité classique: 


F,4kL 
r+A 


- De bas en haut: pour démontrer À, il suffit de démontrer l'absurde en supposant —4. 


Cette règle, est équivalente à dire: À est vraie si et seulement si il est faux que A soit fausse. Cette règle 
ne va pas de soi: elle est nécessaire pour prouver certains résultats (il y a des résultats que nous ne 
pouvons pas prouver si nous n'avons pas cette règle). Contrairement, à beaucoup d'autres, cette règle 
peut par ailleurs être appliquée à tout moment. Nous pouvons, en effet, toujours dire: pour prouver À je 
suppose —.4 et je vais chercher une contradiction. 


12. Introduction du quantificateur universel: 


FHA xn'est pas libre dans les formules de Re 


Er ;| (1:43) 


- De bas en haut: pour démontrer ÿxA, il suffit de montrer À en ne faisant aucune hypothèse sur x. 


Remarque: pour des démonstrations cette vérification (aucune hypothèse sur x) est souvent source 
d'erreur. 


13. Elimination du quantificateur universel: 


FH\YxA 


——"%,| (1.44) 
F+HAx:=i] 


- De haut en bas: de xA4, nous pouvons déduire À x:=£] pour n'importe quel terme t. Ce que nous 


pouvons dire aussi sous la forme: si nous avons prouvé À pour tout x, alors nous pouvons utiliser À avec 
n'importe quel objet t (!!). 


14. Introduction du quantificateur existentiel: 


FAX]. 


ECS 


- De bas en haut: pour démontrer 3x4, il suffit de trouver un objet (in extenso un terme t) pour lequel 
nous savons montrer A[ x:=é]. 


15. Elimination du quantificateur existentiel: 


FHxA TARHC x n'est libre m1 dans les formule de |, m dans © . 


CEC L| (1.46) 


- De bas en haut: nous démontrons qu'il existe bien un ensemble d'hypothèses tel que 2x4 et partant de 
ce résultat comme nouvelle hypothèse, nous démontrons C. Cette formule C hérite alors de la formule 
3x4 et dès lors x n'est pas libre dans C car il ne l'était déjà pas dans 3x4. 
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16. Introduction de l'égalité: 


(1.47) 


Phi 


De bas en haut: nous pouvons toujours montrer t=t. Cette règle signifie que l'égalité est réflexive (cf. 
chapitre Opérateurs). 


17. Elimination de l'égalité: 


FHAx:=6] lti=u 


= 1.48 
TH A[x:= #] Dee 


- De haut en bas: si nous avons démontré LH A[x:= £] et t-u, alors nous avons démontré A x:= x]. 


Cette règle exprime que les objets égaux ont les mêmes propriétés. Nous noterons cependant que les 
formules (ou relations) t-u et u=t ne sont pas, formellement, identiques. Il nous faudra démontrer que 
l'égalité est symétrique (nous en profiterons aussi pour démontrer que l'égalité est transitive). 


® Exemples: 


E1. Cet exemple montre que l'égalité est symétrique (un petit peu non trivial mais bon pour 
commencer): 


————— 5",  ————————ûxx 
Ge Er = Hasard 

E . 

HA"HFH=xZ (1.49 

DR D Peu (1:49) 


Hn=H 2 =% 2 
kVr,2(n=2x=x) 
- De haut en bas: nous introduisons l'égalité =; et prouvons à partir de l'hypothèse x, = x, la formule 
x = %,. En même temps, nous définissons l'axiome comme quoi x, = x, . Ensuite à partir de ces 
prémisses, nous éliminons l'égalité =, en substituant les termes de façon à ce qu'à partir de la 
supposition x, = x; (venant de l'axiome) nous obtenions x, = x,. Ensuite, l'élimination de l'égalité 
implique automatiquement sans aucune hypothèse que x, = x, — x, = x,. Dès lors, il nous suffit 


d'introduire le quantificateur universel pour chacune des variables (donc deux fois) sans aucune 
hypothèse afin d'obtenir que l'égalité est symétrique. 


E2. Cet exemple montre que l'égalité est transitive (c'est-à-dire si x, = x, et x; = x, alors x =x;,).En 


notant F la formule x, = x, A x, = x;: 


——— 4x a û%. 
Ftru=xLAÂL=x ne Ftr=xLAL=x x 
FFn=2x F+Fx=2x OR 
F+r=x D ne 
_ 


t(ni=nAL=zL)1x1=-x v,x3 
Vam,8((n=%2/A2=x)2nS2x) 
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Que faisons, nous ici ? Nous introduisons d'abord la formule F deux fois en tant qu'axiome afin de la 
décortiquer plus tard à gauche et à droite (nous n'introduisons pas l'égalité supposée déjà introduite en 
tant que règle). Une fois ceci fait, nous éliminons à gauche et à droite la conjonction sur la formule pour 
travailler sur les termes gauches et droites seuls et introduisons l'égalité sur les deux termes ce qui fait 
qu'à partir de la formule nous avons l'égalité transitive. Il s'ensuit que sans aucune hypothèse cela 
implique automatiquement que l'égalité est transitive et finalement nous disons que ceci est valable 
pour toute valeur des différentes variables (si la formule est vraie, alors l'égalité est transitive). 


E3. L'objectif sera de démontrer que toute involution est une bijection (cf. chapitre de Théorie Des 
Ensembles). Soit f un symbole de fonction unaire (à une variable), nous notons (pour plus de détails 
voir le chapitre de Théorie Des Ensembles): 


- {nj[ f] la formule: 
Vz,y JA = f)—x=y (151) 

qui signifie que f est injective. 
- Surj[ f] la formule: 

Vyk f(x) =y (152) 
qui signifie que f est surjective 
- Bij[ f] la formule: 

ni f]ASur ST (153) 
qui signifie que f est bijective. 
- {av f] la formule: 

Vx f(f(R) =x (154) 


qui signifie que f est une involution (nous notons également cela f o f = 4 c'est-à-dire que la 
composition de f est l'identité). 


Nous aimerions savoir si: 
vf ]+ Bilf] (55) 


Nous allons présenter (en essayant que ce soit au plus clair) cette démonstration de quatre manières 
différentes: classique (informelle), classique (pseudo-formelle), formelle en arbre et formelle en ligne. 


Méthode classique: 


Nous devons montrer que si f est involutive alors elle est donc bijective. Nous avons donc deux choses 
à montrer (et les deux doivent être satisfaites en même temps): que la fonction est injective et 
surjective. 


1. Montrons que l'involution est injective. Nous supposons pour cela, puisque f est involutive elle est 
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donc injective, tel que: 


Vx,y f(x) = ff) (156) 
implique: 
X=Y (157) 
Or, cette supposition découle automatiquement de la définition de l'involution que: 
Vzxf(F(2)) = 2, y (FO) = y (1.58) 
et de l'application de f à la relation: 
Fa) = FO) (59) 
(soit trois égalités) tel que: 
FU) = SCO) (160) 
nous avons donc: 
= (160 
2. Montrons que l'involution est surjective: si elle est surjective, alors nous devons avoir: 
Vykf(x)=y (162) 
Or, définissons la variable x par définition de l'involution elle-même: 
x:= f(y) (163) 
(puisque y = f{x)..) un changement de variables après nous obtenons: 
FSOD=Y (164) 
et donc la surjectivité est assurée. 
Méthode pseudo-formelle: 
Nous reprenons la même chose et nous y injectons les règles de la théorie de la démonstration: 


Nous devons montrer que f involutive est donc bijective. Nous avons donc deux choses à montrer ( A) 


(et les deux doivent être satisfaites en même temps): que la fonction est injective et surjective: 


FIASU ST (1.65) 


1. Montrons d'abord que l'involution est injective. Nous supposons pour cela, puisque f est involutive et 
donc injective, que: 


(v,) Va f( = SO) (66 


Page: 51/4839 


[v3.0 - 2013] 


implique: 


(=) x2=7 (167 

Or, cette supposition découle automatiquement de la définition de l'involution que: 
(re,ax) Va f(S() = x, y FF ON = y (1.68) 

et de l'application de f à la relation: 

F@) = fo) (169) 
(soit trois égalités =, X2) tel que: 

FYG)=f GO) (4170) 
nous avons donc: 
X=}Y (171) 
2. Montrons que l'involution est surjective. Si elle est surjective, alors nous devons avoir: 
Vo f(x) =7(v,) «72 

Or, définissons la variable x par définition de l'involution elle-même: 

(Aixi= f0) (173 
(puisque y = f{x)..) un changement de variables après nous obtenons: 

FO») =y (174) 
et donc: 

(V,.ax) (175) 
la surjectivité est assurée. 
Méthode formelle en arbre: 
Faisons cela avec la méthode graphique que nous avons déjà présentée plus haut. 
1. Montrons que l'involution est injective: 
Pour cela, montrons d'abord que: 
FG)= FOI) = SO) (176) 


Donc: 
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PSE MU) =D y . 
MAY) = 20/0 * J@-J0F/® 10. 4) 
PORTONTIOENIE ECO) 


DA TTIOLE . G77) 
IMAGE DE ON * @-JOF/® 10 
10 = F0 FUO) =9b=/@) 


@) @) . 
Ja) =fH+IGG) = FCO) 


Remarque: Cette dernière relation est abrégée =, et appelée (comme d'autres existantes) "règle 


dérivée" car c'est un raisonnement qui est très souvent fait lors de démonstrations et un peu long à 
développer à chaque fois... 


Dès lors: 


mif=imfl , Imfl=mfl, 
ASIE) = x MA SFO)=r 
10 @-I DE UT 6) 4) (7 
= Ml = Exp ° 
PAIE EPA SE CPE 
ni F1 if 


2. Montrons que l'involution est surjective: 


ASIE VD) = 9 4 


ASIE = rx SON] ° (1.79) 
Doi ft x(f QD =») v, G) 
In STE Suri[ f] | 
Il s'ensuit: 
CC 
InvLSTE Jr TA Sur] 
Méthode formelle en ligne: 


Nous pouvons faire la même chose sous une forme un peu moins... large. et plus tabulée. (cela n'en 
est pas moins indigeste): 
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Iv[f]F Bjr] Vi 
L= Ze f]+ il] 
2:= In f]F Surj[ f] 


D STr ilr] Vi 
SI fG)= fo) x=7y Ne 
if] f( = fO)FxS y = X26)G)65) 
GISI FU) = x Ve 

Zi STE Env f] ax 

G) BfIE FCO) = y Ÿ, 
ZA STE nv f] ax 

Gi) {= JO) FU) = FO) =, 
MSG) = FO) EF G) = FO) ax 

(2v[ FTF Suril F] Ÿ, 
BvLFIE (f(x) = y} 4 
FI (7 Q) = »}lx = 0] Ÿ, 
IvSIE af) = x} ax 

(1.81) 
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Notes personnelles: 
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2. NOMBRES 


L. base des mathématiques, mis à part le raisonnement (cf. chapitre Théorie De La Démonstration), 


est sans nul doute pour le commun des personnes l'arithmétique. Il est donc obligatoire que nous y 
fassions étape pour étudier sa provenance, quelques-unes de ses propriétés et conséquences. 


Les nombres, comme les figures géométriques, constituent les bases de l'arithmétique. Ce sont aussi les 
bases historiques car les mathématiques ont certainement commencé par l'étude de ces objets, mais 
aussi les bases pédagogiques, car c'est en apprenant à compter que nous entrons dans le monde des 
mathématiques. 


L'histoire des nombres, appelés également parfois "scalaires", est beaucoup trop longue pour être 
relatée ici, mais nous ne pouvons que vous conseiller un des meilleurs ouvrages francophones sur le 
sujet: Histoire Universelle des chiffres (-2'000 pages), Georges Ifrah, ISBN: 2221057791. 


Cependant voici une petite bride de cette dernière qui nous semble fondamentale: 


Notre système décimal actuel, de base 10, utilise les chiffres de 0 à 9, dits "chiffres arabes", mais au fait 
d'origine indienne (hindous). Effectivement, les chiffres arabes (d'origine indienne.) dans le tableau 
ci-dessous sont la première ligne et nous voyons qu'ils sont nettement différents des "chiffres indiens" 
de la deuxième ligne: 


EE Re EE RES A NE 
COCO eCOCC 


Tableau: 2.1 - Chiffres arabes 


Il faut lire dans ce tableau: 0 "zéro", 1 "un", 2 "deux", 3 "trois", 4 "quatre", 5 "cinq", 6 "six", 7 "sept", 8 
"huit", 9 "neuf". Ce système est beaucoup plus efficace que les chiffres romains (essayez de faire un 
calcul avec le système de notation romain vous allez voir...). 


Ces chiffres ne furent introduits en Europe que vers l'an 1000. Utilisés en Inde, ils furent transmis par 
des Arabes au monde occidental par le pape Gerbert d'Aurillac lors de son séjour en Andalousie à la fin 
du 9ème siècle. 


Remarque: Le mot français "chiffre" est une déformation du mot arabe "sifr" désignant "zéro". En 
italien, "zéro" se dit "zero", et serait une contraction de "zefiro”, on voit là encore la racine arabe 
mais le zéro serait aussi d'origine indienne... Ainsi nos termes "chiffre" et "zéro" ont la même 
origine. 


Qi] 


L'usage précoce d'un symbole numérique désignant "rien", au sens de "aucune quantité" ou "absence 
de quantité", c'est à dire notre zéro, provient du fait que les indiens utilisèrent un système dit "système 
positionnel". Dans un tel système, la position d'un chiffre dans l'écriture d'un nombre exprime la 
puissance de 10 et le nombre de fois qu'elle intervient... et l'absence d'une position dans ce système 
posait d'énormes problèmes de relecture et pouvait engendrer de grosses erreurs de calculs. 
L'introduction révolutionnaire et pourtant simple du concept de rien permettait un relecture sans erreur 


des nombres. 
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L'absence d'une puissance est notée par un petit rond...: c'est le zéro. Notre système actuel est donc le 
"système décimal et positionnel". 


® Exemple: 


Description du système décimal et positionnel: 


10° 10! 10° 
l | | 
324 = 3x100 +2x10 + 4x1 


| | 
| unités 
Qizaines 
centaines 
Figure: 2.1 - Description système décimal et positionnel 


Le nombre 324 s'écrit de gauche à droite comme étant trois centaines: 3 fois 100, deux dizaines: 2 fois 
10 et quatre unités: 4 fois 1. 


Remarques: 


R1. Attention!! Nous différencions un chiffre d'un nombre. Le nombre est composé de chiffres et 
non inversement. Par ailleurs, nous différencions la partie entière de la partie décimale du nombre. 


R2. Un "nombre décimal" est un nombre qui a une écriture finie en base 10. 


Nous voyons parfois (et c'est conseillé) un séparateur de milliers représenté par une apostrophe ‘en 
Suisse (posé tous les trois chiffres à partir du premier en partant de la droite pour les nombres entiers). 
Ainsi, nous écrirons 1'034 au lieu de 1034 ou encore 1'344'567'569 au lieu de 1344567569. Les 
séparateurs de milliers permettent de rapidement quantifier l'ordre de grandeur des nombres lus. 


Ainsi: 


- Si nous voyons uniquement une apostrophe nous saurons que le nombre est de l'ordre du millier 
- Si nous voyons deux apostrophes nous saurons que le nombre est de l'ordre du million 
- Si nous voyons trois apostrophes nous saurons que le nombre est de l'ordre du milliard 


et ainsi de suite... 


Au fait, tout nombre entier, autre que l'unité, peut être pris pour base d'un système de numérotation. 
Nous avons ainsi les systèmes de numérotation binaire, ternaire, quaternaire,.…, décimal, duodécimal 
qui correspondent respectivement aux bases deux, trois, quatre,.., dix, douze. 


Une généralisation de ce qui a été vu précédemment, peut s'écrire sous la forme suivante: 


Tout nombre entier positif peut être représenté dans une base b sous forme de somme, où les 
coefficients a, sont multipliés chacun par leur poids respectif . Tel que: 


N=ab""+a, "+. +ab +ab (21) 
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Plus élégamment écrit: 


avec 4, €[0,b-1] et Nel0;8* -1]. 


Remarques: 


R1. Comme très fréquemment en mathématique, nous remplacerons l'écriture des chiffres ou des 
nombres par des lettres latines ou grecques afin de généraliser leur représentation. Aïnsi, lorsque 
nous parlons d'une base b la valeur b peut prendre n'importe quelle valeur entière 1, 2, 3, … 


R2. Lorsque nous prenons la valeur 2 pour b, N aura pour valeur maximale 2* _ j. Les nombres qui 
s'écrivent sous cette forme s'appellent les "nombres de Mersenne". Ces nombres ne peuvent être 
premiers (voir plus bas ce qu'est un nombre premier) que si n est premier. 


Effectivement, si nous prenons (par exemples) à = 10 et # = 3 la plus grande valeur que nous 
pourrons avoir sera alors: 


(b-1):107+(b-1):10! +(b-1:10° = 900 + 90 + 9 = 999 = 10° -1=BhŸ-1 (2.3) 


R3. Lorsque qu'un nombre est le même lu de gauche à droite ou de droite à gauche, nous parlons de 
"nombre palindrome". 


1. BASES NUMÉRIQUES 


Pour écrire un nombre dans un système de base b, nous devons commencer par adopter b caractères 
destinés à représenter les b premiers nombres {0, 1, 2, 3, 4,5, 6, 7, 9}. Ces caractères sont comme nous 
les avons déjà définis, les "chiffres" que nous énonçons comme à l'ordinaire. 


Pour la numérotation écrite, nous faisons cette convention, qu'un chiffre, placé à gauche d'un autre 
représente des unités de l'ordre immédiatement supérieur, ou b fois plus grandes. Pour tenir la place des 
unités qui peuvent manquer dans certains ordres, nous nous servons du zéro (0) et par suite, le nombre 
de chiffres employés peut varier. 


Définition: Pour la numérotation parlée, nous convenons d'appeler "unité simple", "dizaine", 
"centaine", "millier", etc., les unités du premier ordre, du second, du troisième, du quatrième, etc. Aïnsi 
les nombres 10, 11, ., 19 se liront de même dans tous les systèmes de numérotation. Les nombres 1a, 


1b, a0, bO, … se liront dix-a, dix-bé, a-dix, bé-dix, etc. Ainsi, le nombre 5b6a71c se lira: 
cinq millions bé-cent soixante-a mille sept cent dix-cé 


Cet exemple est pertinent car il nous montre l'expression générale de la langue parlée que nous utilisons 
quotidiennement et intuitivement en base dix (faute à notre éducation). 
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Remarques: 


R1. Les règles des opérations définies pour les nombres écrits dans le système décimal sont les 
mêmes pour les nombres écrits dans un système quelconque de numérotation. 


R2. Pour opérer rapidement dans un système quelconque de numérotation, il est indispensable de 
savoir par coeur toutes les sommes et tous les produits de deux nombres d'un seul chiffre. 


R3. Le choix de la base décimale semblerait dû au fait que l'humain a dix doigts. 


Voyons comment nous convertissons un système de numérotation dans un ordre: 
® Exemple: 
En base dix nous savons que 142'713 s'écrit: 
142°713,9 = 1:10° +4:10* +2:10° +7:10* +1:10 +3:10° (2.4) 
En base deux (base binaire) le nombre 0110 s'écrirait en base 10: 
0110,=0 2% +1:2+1:2+0:2=6, (25) 
et ainsi de suite... 


L'inverse (pour l'exemple de la base deux) est toujours un peu plus délicat. Par exemple la conversion 
du nombre décimal 1'492 en base deux se fait par divisions successives par 2 des restes et donne (le 
principe est à peu près identique pour toutes les autres bases): 


quotient | reste 
1492 
746 

373 

186 

93 

46 

23 

11 


ui OO ee ri © ei © mm © © 


© kb Qt 


Q 


Figure: 2.2 - Conversion décimal en binaire 


Ainsi, pour convertir le nombre 142'713 (base décimale) en base duodécimale (base douze) nous avons 
(notation: q est le "quotient", et r le "reste"): 


—g=11 892;r=9 (26) 


142713 
2 
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AR _ —=g=991r=0 (27) 
12 
Us = (2.8) 
12 
Ds =Ér=i0 (2.9) 
12 
6 
——g=0ûr=6 (2.10) 
12 


Ainsi nous avons les restes 6, 10, 7, 0, 9 ce qui nous amène à écrire: 
142713, = 6a709, (2.11) 


Nous avons choisi pour ce cas particulier la symbolique que nous avions définie précédemment (a-dix) 
pour éviter toute confusion. 


2. TYPES DE NOMBRES 


Il existe en mathématiques une très grande variété de nombres (naturels, rationnels, réels, irrationnels, 
complexes, p-adiques, quaternions, transcendants, algébriques, constructibles.) puisque le 
mathématicien peut à loisirs en créer en ayant uniquement à poser les axiomes (règles) de 
manipulations de ceux-ci (cf. chapitre de Théorie Des Ensembles). 


Cependant, il y en a quelques-uns que nous retrouvons plus souvent que d'autres et certains qui servent 
de base de construction à d'autres et qu'il conviendrait de définir suffisamment rigoureusement (sans 
aller dans les extrêmes) pour pouvoir savoir de quoi nous parlerons lorsque nous les utiliserons. 


2.1. NOMBRES ENTIERS NATURELS 


L'idée du "nombre entier" (nombre pour lequel il n'y a pas de chiffres après la virgule) est le concept 
fondamental de la mathématique et nous vient à la vue d'un groupement d'objets de même espèce (un 
mouton, un autre mouton, encore un autre, etc.). Lorsque la quantité d'objets d'un groupe est différente 
de celle d'un autre groupe nous parlons alors de groupe numériquement supérieur ou inférieur quel que 
soit l'espèce d'objets contenus dans ces groupes. Lorsque la quantité d'objets d'un ou de plusieurs 
groupes est équivalente, nous parlons alors "d'égalité". À chaque objet correspond le nombre "un" ou 
"unité" noté "1". 


Pour former des groupements d'objets, nous pouvons opérer ainsi: à un objet, ajouter un autre objet, 
puis encore un et ainsi de suite. chacun des groupements, au point de vue de sa collectivité, est 
caractérisé par un nombre. Il résulte de là qu'un nombre peut être considéré comme représentant un 
groupement d'unités tel que chacune de ces unités corresponde à un objet de la collection. 


Définition: Deux nombres sont dits "égaux" si à chacune des unités de l'un nous pouvons faire 
correspondre une unité de l'autre et inversement. Si ceci ne se vérifie pas alors nous parlons 
"d'négalité". 


Prenons un objet, puis un autre, puis au groupement formé, ajoutons encore un objet et ainsi de suite. 
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Les groupements ainsi constitués sont caractérisés par des nombres qui, considérés dans le même ordre 
que les groupements successivement obtenus, constituent la "suite naturelle" N et notée: 


N ={0;1,2, 3,4...) 


Remarque: La présence du 0 (zéro) dans notre définition de N est discutable étant donné qu'il n'est 
ni positif ni négatif. C'est la raison pour laquelle dans certains ouvrages vous pourrez trouver une 
définition de j sans le O. 


Les constituants de cet ensemble peuvent être définis par (nous devons cette définition au 
mathématicien Gottlob) les propriétés (avoir lu au préalable le chapitre de Théorie Des Ensembles est 
recommandé...) suivantes: 


P1. 0 (lire "zéro") est le nombre d'éléments (défini comme une relation d'équivalence) de tous les 
ensembles équivalents à (en bijection avec) l'ensemble vide. 


P2. 1 (lire "un") est le nombre d'éléments de tous les ensembles équivalents à l'ensemble dont le seul 
élément est 1. 


P3. 2 (lire "deux") est le nombre d'éléments de tous les ensembles équivalents à l'ensemble dont tous les 
éléments sont 0 et 1. 


P4. En général, un nombre entier est le nombre d'éléments de tous les ensembles équivalents à 
l'ensemble des nombres entiers le précédant! 


La construction de l'ensemble des entiers naturels s'est faite de la manière la plus naturelle et cohérente 
qui soit. Les naturels doivent leur nom à ce qu'ils avaient pour objet, aux prémices de leur existence, de 
dénombrer des quantités et des choses de la nature ou qui intervenaient dans la vie de l'homme. 
L'originalité de l'ensemble réside dans la manière empirique dont il s'est construit car il ne résulte pas 
réellement d'une définition mathématique, mais davantage d'une prise de conscience par l'homme du 
concept de quantité dénombrable, de nombre et de lois qui traduisent des relations entre eux. 


La question de l'origine de N est dès lors la question de l'origine des mathématiques. Et de tout temps 
des débats confrontant les pensées des plus grands esprits philosophiques ont tenté d'élucider ce 
profond mystère, à savoir si les mathématiques sont une pure création de l'esprit humain ou si au 
contraire l'homme n'a fait que redécouvrir une science qui existait déjà dans la nature. Outre les 
nombreuses questions philosophiques que cet ensemble peut susciter, il n'en est pas moins intéressant 
d'un point de vue exclusivement mathématique. Du fait de sa structure, il présente des propriétés 
remarquables qui peuvent se révéler d'une grande utilité lorsque l'on pratique certains raisonnements ou 
calculs. 


Remarquons immédiatement que la suite naturelle des nombres entiers est illimitée ( 

) mais dénombrable (nous verrons cela plus bas), car, à un groupement d'objets 
qui se trouve représenté par un certain nombre n, il suffira d'ajouter un objet pour obtenir un autre 
groupement qui sera défini par un nombre entier immédiatement supérieur n + 1. 


Définition: Deux nombres entiers qui différent d'une unité positive sont dits "consécutifs". 
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2.1.1. AXIOMES DE PEANO 


Lors de la crise des fondements des mathématiques, les mathématiciens ont bien évidemment cherché à 
axiomatiser l'ensemble N et nous devons l'axiomatisation actuelle à Peano et à Dedekind. 


Les axiomes de ce système comportent les symboles < et = pour représenter les relations "plus petit" et 


LA 


égal" (cf. chapitre sur les Opérateurs). Ils comprennent d'autre part les symboles 0 pour le nombre zéro 
et s pour représenter le nombre "successeur". Dans ce système, 1 est noté: 


s(0) (2.13) 
dit "successeur de zéro", 2 est noté: 
s(s(0)) (2.14) 


Les axiomes de Peano qui construisent sont les suivants (voir le chapitre de la Théorie de la 
Démonstration pour certains symboles): 


A1. 0 est un entier naturel (permet de poser que N n'est pas vide). 
A2. Tout entier naturel a un successeur, noté s(n). 
Donc s est une application injective, c'est- à-dire: 
Vz,y s(x)=s(y)=x=y (215) 
si deux successeurs sont égaux, ils sont les successeurs d'un même nombre. 


A3. Vx (s(x) = 0) , le successeur d'un entier naturel n'est jamais égal à zéro (ainsi N à un premier 


élément) 


A4. g{0) A Vx (g{x) = gis(x)) = Vx g{x), "axiome de récurrence" qui se doit se lire de la manière 


suivante: si l'on démontre qu'une propriété est vraie pour un x et son successeur, alors cette propriété 
est vraie pout tout x. 


Donc l'ensemble de tous les nombres vérifiant les 4 axiomes est: 


N={0,1,2,3,..,#,..)| (2.16) 


Remarque: Les axiomes de Peano permettent de construire très rigoureusement les deux opérations 
de base de l'arithmétique que sont l'addition et la multiplication (cf. chapitre sur les Opérateurs) et 
ainsi tous les autres ensembles que nous verrons par la suite. 
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2.2. NOMBRES PAIRS, IMPAIRS ET PARFAITS 


En arithmétique, étudier la parité d'un entier, c'est déterminer si cet entier est ou non un multiple de 
deux. Un entier multiple de deux est un entier pair, les autres sont les entiers impairs. 


Définitions: 


D1. Les nombres obtenus en comptant par deux à partir de zéro, (soit O, 2, 4, 6, 8, ….) dans cette suite 
naturelle sont appelés "nombres pairs". 


Le x* nombre pair est donné par la relation: 
(n+n)=2# (217) 


D2. Les nombres que nous obtenons en comptant par deux à partir de un (soit 1, 3, 5, 7,... ) dans cette 
suite naturelle s'appellent "nombres impairs". 


Le (#+1ÿ** nombre impair est donné par: 


(22x+D (2.18) 


Remarque: Nous appelons "nombres parfaits", les nombres égaux à la somme de leurs diviseurs 
entiers strictement plus petits qu'eux mêmes (concept que nous verrons en détail plus tard) comme 
par exemple: 6=1+2+3 et 28=1+2+4+7+14,. 


2.2.1. NOMBRES PREMIERS 


Définition: Un "nombre premier" est un entier possédant exactement 2 diviseurs (ces deux diviseurs 
sont donc "1" et le nombre lui-même). Dans le cas où il y a plus de 2 diviseurs on parle de "nombre 


La Li 


composé". 
Voici l'ensemble des nombres premiers inférieurs à 60: 


{2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59} 


Remarque: A noter que la définition de nombre premier exclut le chiffre "1" de l'ensemble des 
nombres premiers car il a un unique diviseur (lui-même) et pas deux comme le veut la définition. 


Nous pouvons nous demander s'il existe une infinité de nombres premiers ? La réponse est positive et 
en voici une démonstration (parmi tant d'autres) par l'absurde. 


Démonstration: 
Supposons qu'il n'existe qu'un nombre fini de nombres premiers qui seraient: 


Nous formons un nouveau nombre à partir du produit de tous les nombres premiers auquel nous 


ajoutons "1": 
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N = pipa..p, tl (220) 


Selon notre hypothèse initiale et le théorème fondamental de l'arithmétique (cf. chapitre de Théorie Des 
Nombres) ce nouveau nombre devrait être divisible par l'un des nombres premiers existants selon: 


N=g'p (221 
Nous pouvons effectuer la division: 


g = P1P2"Pn +1 _PiPauPn, 1 
?; A A 


Le premier terme se simplifie, car », est dans le produit. Nous notons E cet entier: 
g=ÆE+l/p, (223) 


Or, q et E sont deux entiers, donc 1} p, doit être un entier. Maïs p, est par définition supérieur à 1. 
Donc 1} p, n'est pas un entier. 


Il y a alors contradiction et nous en concluons que les nombres premiers ne sont pas en nombre fini, 
mais infini. 


OIC.Q.F.D. 


Remarques: 


R1. p, = MP:...?, (le produit des n premiers nombres premiers inférieurs ou égaux à n) est appelé 
"primorielle n". 


R2. Nous renvoyons le lecteur au chapitre de Cryptographie de la section d'Informatique Théorique 
pour étudier quelques propriétés remarquables des nombres premiers dont la non moins fameuse 
fonction phi d'Euler (ou appelé aussi "fonction indicatrice"). 


R3. L'étude des nombres premiers est un sujet immensément vaste et certains théorèmes y relatifs 
sortent largement du cadre d'étude de ce site. 


2.3. NOMBRES ENTIERS RELATIFS 


L'ensemble fj à quelques défauts que nous n'avons pas énoncés tout à l'heure. Par exemple, la 
soustraction de deux nombres dans J n'a pas toujours un résultat dans N (les nombres négatifs n'y 
existent pas). Autre défaut, la division de deux nombres dans N n'a également pas toujours un résultant 
dans } (les nombres fractionnaires n'y existent pas). 


Nous pouvons dans un premier temps résoudre le problème de la soustraction en ajoutant à l'ensemble 
des entiers naturels, les entiers négatifs (concept révolutionnaire pour ceux qui en sont à l'origine) nous 
obtenons "l'ensemble des entiers relatifs" noté Z (pour "Zahl" de l'allemand): 
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B = ue 2: LOT. 2,3... (2.24) 


L'ensemble des entiers naturels est donc inclus dans l'ensemble des entiers relatifs. C'est ce que nous 
notons sous la forme: 


NcoZ (225) 
et nous avons par définition (c'est une notation qu'il faut apprendre): 
&, =N (226) 


ZT 


Cet ensemble a été créé à l'origine pour faire de l'ensemble des entiers naturels un objet que nous 
appelons un "groupe" (cf. chapitre Théorie Des Ensembles) par rapport à l'addition. 


Définition: Nous disons qu'un ensemble E est un "ensemble dénombrable”, s'il est équipotent à W. 
C'est-à-dire s'il existe une bijection de (cf. chapitre Théorie Des Ensembles) N sur E. Aïnsi, grosso 
modo, deux ensembles équipotents ont "autant" d'éléments au sens de leurs cardinaux (cf. chapitre de 
Théorie Des Ensembles), ou tout au moins la même infinité. 


L'objectif de cette remarque est de faire comprendre que les ensembles N,Z sont dénombrables. 
Démonstration: 
Montrons que 7, est dénombrable en posant: 
An = et mia cl (227) 
pour tout entier # > 0. Ceci donne l'énumération suivante: 
0,-1,1,-2,2,-3,3, … (2.28) 
de tous les entiers relatifs à partir des entiers naturels seuls. 


OIC.Q.F.D. 


2.4. NOMBRES RATIONNELS 


L'ensemble 7% a aussi un défaut. Aïnsi, la division de deux nombres dans Z n'a également pas toujours 
un résultat dans Z, (les nombres fractionnaires n'y existent pas). Nous disons alors dans le langage de la 
théorie des ensembles que: la division n'est pas une opération interne dans Z. 


Nous pouvons ainsi définir un nouvel ensemble qui contient tous les nombres qui peuvent s'écrire sous 
forme de "fraction", c'est-à-dire du rapport d'un dividende (numérateur) et d'un diviseur 
(dénominateur). Quand un nombre peut se mettre sous cette forme, nous disons que c'est une "nombre 
fractionnaire": 


) /” numérateur 
fraction be barre de fraction 


K dénominateur 
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Figure: 2,3 - Construction nombre fractionnaire 


Une fraction peut être employée pour exprimer une partie, ou une part, de quelque chose 
(d'un objet, d'une distance, d'un terrain, d'une somme d'argent...). 


Par définition, "l'ensemble des nombres rationnels" est donné par: 


œ {ira za-0} (2.29) 
g 


et où p et q sont des entiers sans facteurs communs (autrement dit la fraction p/q est écrite sous forme 
irréductible). 


Nous supposerons par ailleurs comme évident que: 
N,Zc@ (230) 


La logique de la création de l'ensemble des nombres rationnels est similaire à celle des entiers relatifs. 
Effectivement, les mathématiciens ont souhaité faire de l'ensemble des nombres relatifs un "groupe" par 
rapport à la loi de multiplication et de division (cf. chapitre de Théorie Des Ensembles), 


De plus, contrairement à l'intuition, l'ensemble des nombres entiers et nombres rationnels sont 
équipotents. Nous pouvons nous persuader de cette équipotence en rangeant comme le fit Cantor, les 
rationnels dans un premier temps de la façon suivante: 


7 [1 L/ 4 


142 312 


(Pa | / ll nl 
1/4 . à / “ rs L. 
VA 2 ll a 7€. 
. 2 . fe ln! 
2 / 7 FU FIF | 
EVIL T 


Figure: 2.4 - Métode diagonale de Cantor 


a 


Ce tableau est construit de telle manière que chaque rationnel n'apparaît qu'une seule fois (au sens de sa 
valeur décimale) par diagonale d'où le nom de la méthode: "diagonale de Cantor”. 


Si nous éléminons de chaque diagonale les rationnels qui apparaissent plus d'une fois (les "fractions 
équivalentes") pour ne garder plus que ceux qui sont irréductibles (donc ceux dont le PGCD du 
numérateur et dénominateur est égal à 1), nous pouvons alors ainsi grâce à cette distinction définir une 
application f : N — @ qui est injective (deux rationnels distincts admettent des rangs distincts) et 
surjective (à toute place sera inscrit un rationnel). 
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L'application f est donc bijective: N et Q sont donc bien équipotents ! 


La définition un peu plus rigoureuse (et donc moins sympathique) de Q se fait à partir de Z en 
procédant comme suit (il est intéressant d'observer les notations utilisées) : 


Sur l'ensemble £ XÆ£\ {0}, qu'il faut lire comme étant l'ensemble construit à partir de deux éléments 


entiers relatifs dont on exclut le zéro pour le deuxième, on considère la relation R entre deux couples 
d'entiers relatifs définie par: 


(a, b)R(a’, Bb) & a b'=ab (31 


Nous vérifions facilement ensuite que R est une relation d'équivalence (cf. chapitre sur les Opérateurs) 
sur ZXÆ£\ {0}. 


L'ensemble des classes d'équivalences pour cette relation R noté alors (ZxXÆ \{0}1/ À est par définition 


Q. C'est-à-dire que nous posons alors plus rigoureusement: 
Q=(Z2XÆ\{0}i/R (2.32) 


La classe d'équivalence de {4,b) € ZXÆ\{0} est explicitement notée par: 


conformément à la notation que tout le monde a l'habitude d'employer. 


Nous vérifions facilement que l'addition et la multiplication qui étaient des opérations définies sur Æ 
passent sans problèmes à Q en posant: 


De plus ces opérations munissent d'une structure de corps (cf. chapitre de Théorie Des Ensembles) 
avec ï comme élément neutre additif et ï comme élément neutre multiplicatif. Ainsi, tout élément non 


nul de Q est inversible, en effet: 


ce qui s'écrit aussi plus techniquement: 


(abab)R(LT) (236) 
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Remarque: Même si nous aurions envie de définir Q comme étant l'ensemble ZX2Æ£ \ {0} où Æ 
représente les numérateurs et Z\ {0} les dénominateurs des rationnels, ceci n'est pas possible car 
autrement nous aurions par exemple {1,2} * (2,4) tandis que nous nous attendons à une égalité. 


D'où le besoin d'introduire une relation d'équivalence qui nous permet d'identifier, pour revenir à 
l'exemple précédent, (1,2) et (2,4). La relation R que nous avons définie ne tombe pas du ciel, en 
effet le lecteur qui a manipulé les rationnels jusqu'à présent sans jamais avoir vu leur définition 
formelle sait que: 

a a RS > 
Far: a'b=ab (237) 


Il est donc naturel de définir la relation R comme nous l'avons fait. En particulier, en ce qui 


concerne l'exemple ci-dessus, : -* car (1,2)R(2,4) et le problème est résolu. 


Outre les circonstances historiques de sa mise en place, ce nouvel ensemble se distingue des ensembles 
d'entiers relatifs car il induit la notion originale et paradoxale de quantité partielle. Cette notion qui a 
priori n'a pas de sens, trouvera sa place dans l'esprit de l'homme notamment grâce à la géométrie où 
l'idée de fraction de longueur, de proportion s'illustre plus intuitivement. 


2.5. NOMBRES IRRATIONNELS 


L'ensemble des rationnels Q est limité et non suffisant lui aussi. Effectivement, nous pourrions penser 


que tout calcul mathématique numérique avec les opérations communément connues se réduisent à cet 
ensemble mais ce n'est pas le cas. 


® Exemples: 


E1. Prenons le calcul de la racine carrée de deux que nous noterons 2/2 . Supposons que cette dernière 


racine soit un rationnel. Alors s'il s'agit bien d'un rationnel, nous devrions pouvoir l'exprimer comme 
a/b, où par de par la définition d'un rationnel a et b sont des entiers sans facteurs communs. Pour cette 
raison, a et b ne peuvent tous les deux être pairs. Il y a trois possibilités restantes: 


1. a est impair (b est alors pair) 
2. a est pair (b est alors impair) 
3. a est impair (b est alors impair) 


En mettant au carré, nous avons: 


qui peut s'écrire: 
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Puisque le carré d'un nombre impair est impair et le carré d'un nombre pair est pair, le cas (1) est 
impossible, car 4? serait impair et 23? serait pair. 


Le cas (2) est aussi impossible, car alors nous pourrions écrire 4 = 2e, où c est un entier quelconque, et 
donc si nous le portons au carré nous avons 4? = 4-? où nous avons un nombre pair des deux côtés de 
l'égalité. En remplaçant dans 23? = 4? nous obtenons après simplification que 3? = 2,2. 2? serait 
impair alors que 2-2? serait pair. 


Le cas (3) est aussi impossible, car 4? est donc alors impair et 24? est pair (que b soit pair ou impair!). 


Il n'y a pas de solution! C'est donc que l'hypothèse de départ est fausse et qu'il n'existe pas deux entiers 
a et b tels que 2/2 = ;jp. 


E2. Démontrons, aussi par l'absurde, que le fameux nombre d'Euler e est irrationnel. Pour cela, 
rappelons que e (cf. chapitre d'Analyse Fonctionnelle) peut aussi être défini par la série de Taylor (cf. 
chapitre sur les Suites Et Séries): 

L. à 1 Il 


= l+—+—+— +. +—+.. (2.40) 
11 21 31 A! 


Alors si e est rationnel, il doit pouvoir s'écrire sous la forme p/q (avec 4 > 1, car nous savons que e n'est 
pas entier). Multiplions les deux côtés de l'égalité par q!: 
gl, al, al gl, 4! q! 
++ + —— + 


gle=gh=+=+—+.. 
1 2 3% "ol @+D G+2) 


(2.41) 


Le premier membre qle serait alors un entier, car par définition de la factorielle: 
gl=g(g-T(g-2).2:1 (242) 
est un entier. 


Les premiers termes du second membre de la relation antéprécédente, jusqu'au terme q!/q!=1 sont aussi 
des entiers car q!/m! se simplifie si q>7m. Donc par soustraction nous trouvons : 


| al al | | | 
ge-[ar Reis 44) D 4 D _ 4}, 43 
11 21 3 al ) G@+ G+2 


où la série à droite devrait aussi être un entier! 
Après simplification, le second membre de l'égalité devient: 
1 1 
À —— +... 
(+1 (g+D(g +2) 


(2.44) 


le premier terme de cette somme est strictement inférieur à 1/2, le deuxième inférieur à 1/4, le troisième 
inférieur à 1/8, etc. 
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Donc, vu que chaque terme est strictement inférieur aux termes de la série harmonique suivante qui 
converge vers 1: 


1/2+1/4+1/8+...=1 (2.45) 


alors par conséquent, la série n'est pas un entier puisque étant strictement inférieure à 1. Ce qui 
constitue une contradiction! 


Ainsi, les nombres rationnels ne satisfont pas à l'expression numérique de 2/2 comme de e (pour citer 
seulement ces deux exemples particuliers). 


Il faut donc les compléter par l'ensemble de tous les nombres qui ne peuvent s'écrire sous forme de 
fraction (rapport d'un dividende et d'un diviseur entiers sans facteurs communs) et que nous appelons 
des "nombres irrationnels". 


2.6. NOMBRES RÉELS 


Définition: La réunion des nombres rationnels et irrationnels donne "l'ensemble des nombres réels". 
Ce que nous notons: 
QCR (246) 
Remarque: Les mathématiciens dans leur rigueur habituelle ont différentes techniques pour définir 


les nombres réels. Ils utilisent pour cela des propriétés de la topologie (entre autres) et en particulier 
les suites de Cauchy mais c'est une autre histoire qui dépasse le cadre formel du présent chapitre. 


Nous sommes évidemment amenés à nous poser la question si IR est dénombrable ou non. La 
démonstration est assez simple. 


Démonstration: 


Par définition, nous avons vu plus haut qu'il doit y avoir une bijection entre Q et IR pour dire que 
soit dénombrable. 


Pour simplifier, nous allons montrer que l'intervalle [0,1[ n'est alors pas dénombrable. Ceci impliquera 
bien sûr par extension que IR ne l'est pas! 


Les éléments de cet intervalle sont représentés par des suites infinies entre 0 et 9 (dans le système 
décimal): 


- Certaines de ces suites sont nulles à partir d'un certain rang, d'autres non 


- Nous pouvons donc identifier [0,1[ à l'ensemble de toutes les suites (finies ou infinies) d'entiers 
compris entre O et 9 
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n°1 [zu |A | M3 | Xu Xy 
N°2 | ZX |Xn |X2 | Xx | ay 
N°3 | ZX |Xp |Xx |Ax |… X3y 
n°4 |z%u |Xo |%s |Xu X4y 
N°5 |Za |Xo |[Xg | |. Xsy 
n°6 |xn |Xo |Ze | |. X6y 
ke la le |A L… Xjy 


Tableau: 2.2 - Identification et classement de nombres réels 


Si cet ensemble était dénombrable, nous pourrions classer ces suites (avec une première, une deuxième, 
etc.). Ainsi, la suite x, %5 24.3, Serait classée première et ainsi de suite. comme le propose le 


tableau ci-dessus. 


Nous pourrions alors modifier cette matrice infinie de la manière suivante: à chaque élément de la 
diagonale, rajouter 1, selon la règle: 0+1=1, 1+1=2, 8+1=9 et 9+1=0 


Le] 
N°1 |%n Xe | M3 | Xe |. A 
+1 
Le] 
N°2 |Xy |Xn |Xx | Xx | ay 
+1 
Le] 
n°3 | ZX |ZXp |Xx |A X3y 
+1 
o 
n°4 x |%o | 243 | Xu X4 y 
1 
o 
n°5 |Xa |ZXo [Xe | sy 
Le] 
n°6 | Zn |ZXo [Xe | X6y 
o 
DK | Æuy | ZX | Xe |Xn |. y 


Tableau: 2.3 - Identification et classement de nombres réels 


Page: 7414839 


[v3.0 - 2013] 


Alors considérons la suite infinie qui se trouve sur la diagonale: 


- Elle ne peut être égale à la première car elle s'en distingue au moins par le premier élément 

- Elle ne peut être égale à la deuxième car elle s'en distingue au moins par le deuxième élément 
- Elle ne peut être égale à la troisième car elle s'en distingue au moins par le troisième élément 
et ainsi de suite. Elle ne peut donc être égale à aucune des suites contenues dans ce tableau! 


Donc, quel que soit le classement choisi des suites infinies de 0...9, il y en a toujours une qui échappe à 
ce classement! C'est donc qu'il est impossible de les numéroter... tout simplement parce qu'elles ne 
forment pas un ensemble dénombrable. 


OIC.Q.F.D. 


La technique qui nous a permis d'arriver à ce résultat est connue sous le nom de "procédé diagonal de 
Cantor" (car similaire à celle utilisée pour l'équipotence entre ensemble naturel et rationnel) et 
l'ensemble des nombres réels est dit avoir "la puissance du continu" de par le fait qu'il est 
indénombrable. 


Remarque: Nous supposerons intuitif pour le lecteur que tout nombre réel peut être approché 
infiniment près par un nombre rationnel (pour les nombres irrationnels il suffit de s'arrêter à un 
nombre de décimales données et d'en trouver le rationnel correspondant). Les mathématiciens 
disent alors que Q est "dense" dans IR et notent cela: 


Le 
Il 
# 


2.6.1. NOMBRES TRANSFINIS 


Nous nous retrouvons donc avec un "infini" des nombres réels qui est différent de celui des nombres 
naturels. Cantor osa alors ce que personne n'avait osé depuis Aristote: la suite des entiers positifs est 
infinie, l'ensemble N , est donc un ensemble qui a une infinité dénombrable d'éléments, alors il affirma 
que le cardinal ( ) de cet ensemble était un nombre qui existait 
comme tel sans que l'on utilise le symbole fourre tout "«", il le nota: 


y = Card (N) 


Ce symbole est la première lettre de l'alphabet hébreu, qui se prononce "aleph zéro". Cantor allait 
appeler ce nombre étrange, un nombre "transfini". 


L'acte décisif est d'affirmer qu'il y a, après le fini, un transfini, c'est-à-dire une échelle illimitée de 
modes déterminés qui par nature sont infinis, et qui cependant peuvent être précisés, tout comme le 
fini, par des nombres déterminés, bien définis et distinguables les uns des autres !! 


Après ce premier coup d'audace allant à l'encontre de la plupart des idées reçues depuis plus de deux 
mille ans, Cantor allait poursuivre sur sa lancée et établir des règles de calcul, paradoxales à première 
vue, sur les nombres transfinis. Ces règles se basaient, comme nous l'avons précisé tout à l'heure, sur le 
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fait que deux ensembles infinis sont équivalents s'il existe une bijection entre les deux ensembles. 


Ainsi, nous pouvons facilement montrer que l'infini des nombres pairs est équivalent à l'infini des 
nombres entiers: pour cela, il suffit de montrer qu'à chaque nombre entier, nous pouvons associer un 
nombre pair, son double, et inversement. 


Ainsi, même si les nombres pairs sont inclus dans l'ensemble des nombres entiers, il y en a une infinité 
K, égaux, les deux ensembles sont donc équipotents. En affirmant qu'un ensemble peut être égal à une 


de ses parties, Cantor va à l'encontre ce qui semblait être une évidence pour Aristote et Euclide: 
l'ensemble de tous les ensembles est infini ! Cela va ébranler la totalité des mathématiques et va amener 
à l'axiomatisation de Zermelo-Fraenkel que nous verrons dans le chapitre de Théorie Des Ensembles. 


A partir de ce qui précède, Cantor établit les règles de calculs suivants sur les cardinaux: 
RtIi=R, Roth =, N=R (249) 


À première vue ces règles semblent non intuitives mais en fait elles le sont bien! En effet, Cantor définit 
l'addition de deux nombres transfinis comme le cardinal de l'union disjointe des ensembles 
correspondants. 


® Exemples: 


ET. En notant donc &, le cardinal de N nous avons K, + K, qui est équivalent à dire que nous 


sommons le cardinal de N union disjointe N .Or N union disjointe N est équipotent à N donc 
Ko + Ko = Ko (il suffit pour s'en convaincre de prendre l'ensemble des entiers pairs et impairs tout deux 


dénombrables dont l'union disjointe est dénombrable). 


E2. Autre exemple trivial: K, +1 correspond au cardinal de l'ensemble Rj union un point. Ce dernier 
ensemble est encore équipotent à N donc K, +1=k,. 


Nous verrons également lors de notre étude du chapitre de Théorie Des Ensembles que le concept de 
produit cartésien de deux ensembles dénombrables est tel que nous ayons: 


Card(N x N) = Card(N?) =[Card{N)P (2.50) 
et donc: 
Ki =R, (251 
De même (cf. chapitre de Théorie Des Ensembles), puisque Z = Z+4, Æ- nous avons: 
Ko + Ko = No (2-52) 


et en identifiant Q à Zx% (rapport d'un numérateur sur un dénominateur), nous avons 
immédiatement: 


Nous pouvons d'ailleurs démontrer un énoncé intéressant: si nous considérons le cardinal de l'ensemble 
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de tous les cardinaux, il est nécessairement plus grand que tous les cardinaux, y compris lui-même (il 
vaut mieux avoir lu le chapitre de Théorie Des Ensembles au préalable)! En d'autres termes: le cardinal 
de l'ensemble de tous les ensembles de A est plus grand que le cardinal de A lui-même. 


Ceci implique qu'il n'existe aucun ensemble qui contient tous les ensembles puisqu'il en existe toujours 
un qui est plus grand (c'est une forme équivalente du fameux ancien paradoxe de Cantor). 


Dans un langage technique cela revient à considérer un ensemble non vide A et alors d'énoncer que: 


Card(A) < CardiP(4)\ (2.54) 


où P(4) est l'ensemble des parties de A (voir le chapitre de Théorie des Ensembles pour le calcul 
général du cardinal de l'ensemble des parties d'un ensemble dénombrable). 


C'est-à-dire par définition de la relation d'ordre < (strictement inférieur), qu'il suffit de montrer qu'il 
n'existe pas d'application surjective f : À — P(A), en d'autres termes qu'à chaque élément de 
l'ensemble des parties de À il ne correspond pas au moins une pré-image dans A. 


Remarque: PIN) est par exemple constitué de l'ensemble des nombres impairs, pairs, premiers, et 
l'ensemble des naturels, ainsi que l'ensemble vide lui-même, etc. P{N) est donc l'ensemble de 
toutes les "patates" (pour emprunter le vocabulaire de la petite école.) possibles qui forment N . 


Démonstration (par l'absurde): 


L'idée maintenant est de supposer que nous pouvons numéroter chacune des patates de P(4) avec au 
moins un élément de À (imaginez cela avec N ou allez voir l'exemple dans le chapitre de Théorie Des 
Ensembles). En d'autres termes cela revient à supposer que f : À — P(A) est surjective et considérons 
un sous-ensemble E de À tel que: 


E={xeA|xg f(x} (2:55) 


c'est-à-dire l'ensemble d'éléments x de À qui n'appartiennent pas à l'ensemble numéro x (l'élément x 
n'appartient pas à la patate qu'il numérote. en d'autres termes). 


Or, si f est surjective il doit alors exister aussi un y€ À pour ce sous-ensemble E tel que: 
fO)=E={xeA|xg f(x} (2.56 
puisque E est aussi une partie de A. 


Si fy) = Æ alors y# f(y) mais de par la définition de E , yEe Æ et nous avons donc une absurdité de 
par l'hypothèse de la surjectivité! 


OIC.Q.F.D. 
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2.7. NOMBRES COMPLEXES 


Inventés au 16ème siècle entre autres par Jérôme Cardan et Rafaello Bombelli, ces nombres permettent 
de résoudre des problèmes n'ayant pas de solutions dans IR ainsi que de formaliser mathématiquement 
certaines transformations dans le plan telles que la rotation, la similitude, la translation, etc. Pour les 
physiciens, les nombres complexes constituent surtout un moyen très commode de simplifier les 
notations. Il est ainsi très difficile d'étudier les phénomènes ondulatoires, la relativité générale ou la 
mécanique quantique sans recourir aux nombres et expressions complexes. 


Il existe plusieurs manières de construire les nombres complexes. La première est typique de la 
construction telle que les mathématiciens en ont l'habitude dans le cadre de la théorie des ensembles. Ils 
définissent un couple de nombres réels et définissent des opérations entre ces couples pour arriver enfin 
à une signification du concept de nombre complexe. La deuxième est moins rigoureuse mais son 
approche est plus simple et consiste à définir le nombre imaginaire pur unitaire i et ensuite de construire 
les opérations arithmétiques à partir de sa définition. Nous allons opter pour cette deuxième méthode. 


Définitions: 
D1. Nous définissons le "nombre imaginaire unitaire pur" que nous notons i par la propriété suivante: 
P=-1ei= #1 


D2. Un "nombre complexe" est un couple d'un nombre réel a et d'un nombre imaginaire ib et s'écrit 
généralement sous la forme suivante: 


zZ = a+ib 
a et b étant des nombres appartenant à IR. 
Nous notons l'ensemble des nombres complexes € et avons donc par construction: 


RcC 


) 


Remarque: L'ensemble € est identifié au plan euclidien orienté E ( e Cala 
grâce au choix d'une base orthonormée directe (nous obtenons ainsi le "plan d'Argand-Cauchy" ou 
plus communément "plan de Gauss" que nous verrons un peu plus loin). 


L'ensemble des nombres complexes qui constitue un corps (cf. cha | e bles), et 
noté €, est défini (de manière simple pour commencer) dans la notation de la théorie des ensembles 
par: 


C-{z =(x+i y)xveR] 


En d'autres termes nous disons que le corps € est le corps IR auquel nous avons "adjoint" le nombre 
imaginaire i. Ce qui se note formellement: 


R{i] 


L'addition et la multiplication de nombres complexes sont des opérations internes à l'ensemble des 
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complexes (nous reviendrons beaucoup plus en détail sur certaines propriétés des nombres complexes 
dans le chapitre traitant de la Théorie Des Ensembles) et définies par: 


ZtZ (A tX)+in ty) 


(2.62) 
223 = (GX VV) ti( + X) 


La "partie réelle" de z est traditionnellement notée: 


La "partie imaginaire" de z est traditionnellement notée: 
G(z) = y (2.64) 
Le "conjugué" ou "conjugaison" de z est défini par: 
Z=X-—iy (2.65) 


et est aussi parfois noté Z * (en particulier en physique quantique dans certains ouvrages!). 


A partir d'un complexe et de son conjugué, il est possible de trouver ses parties réelles et imaginaires. 
Ce sont les relations évidentes suivantes: 


z+Z 


2 


ZE 
(2.66) 


R(z) = 


et G(z) = 


Le "module" de z (ou norme") représente la longueur par rapport au centre du plan de Gauss (voir un 
peu plus bas ce qu'est le plan de Gauss) et est simplement calculé avec l'aide du théorème de 
Pythagore: 


|z|= x? +y? = 7.7) (2:67) 


et est donc toujours un nombre positif ou nul. 


Remarque: La notation [z| pour le module n'est pas innocente puisque [z| coïncide avec la valeur 


absolue de z lorsque z est réel. 


La division entre deux complexes se calcule comme (le dénominateur étant évidemment non nul): 


Z1 _ x +iM . % + Z “ia _ (4% +YiYal 1%) Mi 


T2 71, 3 
Z3 Xp *1Va A2 Ta Xi Ya LCR 


(2.68) 
L'inverse d'un complexe se calculant de façon similaire: 


1 AI F fl : F1 x 
CD 6 te nr 


x+iy (xtix-i) =) x+y x +yt x+y 


Nous pouvons aussi énumérer 8 importantes propriétés du module et du conjugué complexe: 
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P1. Nous affirmons que: 


zl=0&z=0 (270) 
Démonstration: 


Par définition du module [z| =, x? + la , pour que la somme x? + y? soit nulle, la condition nécessaire 


est que: 
x=y=Û0 (271) 
OC.Q.FD. 
P2. Nous affirmons que: 
z1=|-2l=<17| 72) 
Démonstration: 
pie er OP ON ae + On 41 75 
OC.Q.FD. 
P3. Nous affirmons que: 
[R(z)| £ | avec égalité s1 et seulement si z est réel . 
[&(z)| £ |z [avec égalité si et seulement si z est imaginaire 
Démonstration: 
Les deux inégalités ci-dessus peuvent s'écrire: 
kel < Va? +b° _. 
<a +8 
donc équivalent respectivement à: 
a? £ a? +b° 
(2.76) 
b? £ a° +b° 
qui sont triviales. La suite est alors triviale… 
OC.Q.FD. 


P4. Nous avons: 


V(a.2)eCxC l2|=[All2| (77 
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et si: 


Z, 
z, #0, = (2.78) 


1 
Z3 Z2 


Démonstrations: 


ha = (222) = 22) = @2)@22) = af ef 


> l22|= fa|le2| 


(2.79) 


(nous démontrerons un peu plus bas en toute généralité que z,z, = z,z, ) et: 


APE COLE 
. 22; Lz: F | 
OC.Q.FD. 
P5. Nous affirmons (à nouveau...) que: 
Lf=2.7 (281) 
Démonstration: 
PT Ge -d) = ip pme = apres (02 
OC.Q.FD. 
P6. Nous affirmons que: 
Vz,z'ECZ=7,2+2 =7+27,2 2 =7:7 (285) 
Démonstrations: 
z= x+iy=x-iy= x+iy= 2 (284) 
et: 
PR = QD On 1) = GE FR) ON D em +2) iQ +0) 
= (a in) +(x 2) =2z+z 
et: 
= (x +), +) = CXAPN ER CHER TA) = (4% M) ia" + 2x) (2.86) 


= (ni) in) = 22) 
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OIC.Q.F.D. 


Remarques: 


R1. En des termes mathématiques, la première démonstration permet de montrer que la conjugaison 
complexe est ce que l'on appelle "involutive" (dans le sens qu'elle ne fait rien évoluer...). 


R2. En des termes tout aussi mathématiques (ce n'est que du vocabulaire!), la deuxième 
démonstration montre que la conjugaison de la somme de deux nombres complexes est ce que nous 
appelons un "automorphisme du groupe" (€, +1 (cf. chapitre de Théorie Des Ensembles). 


R3. Encore une fois, pour le vocabulaire…., la troisième démonstration montre que la conjugaison du 
produit de deux nombres complexes est ce que nous appelons un “"automorphisme du corps" 
(C,+,x) (cf. chapitre de Théorie Des Ensembles). 


P7. Nous affirmons que pour z différent de zéro: 


EH ie 


Nous nous restreindrons à la démonstration de la seconde relation qui est un cas général de la première 
(pour z=1). 


Démonstration: 


) ]- Ati LA +iñ 2% 7 _ (A4 + M2) FM YA) 


X2 TÉVa Xa TiVa X2 a 7 +» 

_ C2 +2) | ; Can 1%) - Ga + M9) *i02% x) (2.88) 
D +» + HN 

= (a =) +) _ A EM 22 Ta _ z 

x +» X2 7 Va Xa Ta z 

OIC.Q.F.D. 
P8. Nous avons: 
[a +22 f = FAI +2$# (22) + kzf (2.89) 


Démonstration: 


Page: 82/4839 


[v3.0 - 2013] 


la +2,f = |x +in + + f = Ï n+b)+in+» Il 


2 
2 | 
(fat) + +y 7) = (2 +2) +(n +3 F 


2 2 2 2 f 2 2 | \ f 2 2 
= 4 +2%% +24 + +292 +35 =Ù1X +" +202 +nri+lx +» | 


(2.90) 
= |z F +28 {2 +) zx iv) +le F = |z f +2R(z2; | + f 


OIC.Q.F.D. 
P9. Nous avons: 
[2 +2;| < k|+|2| (2.91) 


pour tous complexes z,,z, (rigoureusement non nuls car sinon le concept d'argument du nombre 
complexe que nous verrons plus loin est alors indéterminé). De plus l'égalité a lieu si et seulement si z, 
et z, sont colinéaires (les vecteurs sont "sur la même droite") et de même sens, autrement dit …. s'il 


existe Ae R, tel que z, = Az, . 
Démonstration: 
la +2, =laf +24 (22) +2 f <Bf + 2l223|+ k,f = (lz|+ 2 } (2.92) 


Cette inégalité peut ne pas paraître évidente à tout le monde alors développons un peu et supposons-la 
vraie: 


Bi +2f (all: 

Je +2) +0 D {fr +7 + x + | 

(x ka) +» +») (x + yE) + CR Le + y +(4 + y5) 

+ 2m +8 + pe + na + 2 CG + pe) + 2 + fe +28 + (8 + y) 


Après simplification: 


? 

: FT 2 [27.2 
% 2% + Ma SX + Je +y3 

2 ? 

2, 29/2, .2 2 q4 
(42 +) x +»)(# +») ue 
? 

2.2 222 22, 22, 22, 2.2 
4 23 + 2% 22)1)a MY SM + HN) M A MY 


et encore après simplification: 
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? 
» 2.2 2.2 
2% M3 SH 93 + MX 


0x? — 2% X2}1Ya +24 Ca 
0 x», 22) 
donc comme la parenthèse au carré est forcément positive ou nulle il s'ensuit: 
0<(xy, HE) (2.96) 
Cette dernière relation démontre donc que l'inégalité est vraie. 
OIC.Q.FD. 
Remarque: Il existe une forme plus générale de cette inégalité appelée "inégalité de Minkowski" 


présentée dans le chapitre de Calcul Vectoriel (les nombres complexes peuvent effectivement 
s'écrire sous la forme de vecteurs comme nous allons le voir de suite). 


2.7.1. INTERPRÉTATION GÉOMÉTRIQUE 


Nous pouvons aussi représenter un nombre complexe 4 +;k où 4 -ià dans un plan délimité par deux 
axes (deux dimensions) de longueur infinie et orthogonaux entres eux. L'axe vertical représentant la 
partie imaginaire d'un nombre complexe et l'axe horizontal la partie réelle (voir figure ci-après). 


Il y donc bijection entre l'ensemble des nombres complexes et l'ensemble des vecteurs du plan de Gauss 
(notion d'affixe). 


Nous nommons parfois ce type de représentation "plan de Gauss": 


Figure: 2.5 - Plan de Gauss 


et nous écrivons alors: 
Af(F)=a+ib (297) 


Nous voyons sur ce diagramme qu'un nombre complexe a donc une interprétation vectorielle (cf. 
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chapitre de Calcul Vectoriel) donnée par: 


1 (l 
z=4 + b=a+ih (2.98) 
(] l 


où la base canonique est définie telle que: 


b-Q-0 


Fr = [z| = Va? + (2.100) 


avec: 


ss — ; . 0 
Ainsi, ô est le vecteur de la base unitaire porté par l'axe horizontal IR et ù est le vecteur de la 
base unitaire porté par l'axe imaginaire IR; et r est le module (la norme) positif ou nul. 


Ceci est à comparer avec les vecteurs de 2? (cf. chapitre de Calcul Vectoriel): 
EE 1 ( x 
V = Xe + Ve; ZX EE à = (2.101) 
( 1 y 


| = JF +y? (2.102) 


ce qui fait que nous pouvons identifier le plan complexe avec le plan euclidien. 


avec: 


Par ailleurs, les définitions du cosinus et sinus (cf. chapitre de Trigonomeétrie) nous donnent: 
a =rcos@ b=rsn@ (2.103) 


Finalement: 


+(s | De (à) (2104) 
@= cos — |= sin — | =tan — 
Fr Fr d 


Ainsi: 
z=atib=rcos@t+irsin @= r(cos@+isin P)=r'cis@ (2.105) 


complexe qui est toujours égal à lui-même modulo 2 x de par les propriétés des fonctions 
trigonométriques: 
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z =r(cos@t+isin gi =r(cos(@+k27) +isin(@+kÆ27)|| (2.106) 


avec ke N et où ® est appelé "l'argument de z" et est noté traditionnellement: 
arg(z) (2.107) 


Les propriétés du cosinus et du sinus (cf. chapitre de Trigonométrie) nous amènent directement à écrire 
pour l'argument: 


arg(z) = —-argiz) et arg(-z) = arg(z) +37 (2.108) 


Nous démontrons entre autres avec les séries de Taylor (cf. chapitre des Suites Et Séries) que: 


4 & 
cosæ= re. OP E (D Er … (2.109) 
21 À (2k)l 


et: 


ARS AS 
| 


&-H 
: UE. (2.110) 


SOS TUE TA (2 +DI 


dont la somme est semblable à: 


g 


P = 1+gp+ + 
É . 2l 


Ca +. ee … (CA) 


31 & 


mais par contre parfaitement identique au développement de Taylor de 5# : 


rio E-. LA 


= +i si (2.112) 
TT 3 E. cos @+isin 


Donc finalement, nous pouvons écrire: 


z =r(cosg+isin g)=r'e#| (2.113) 


relation nommée "formule d'Euler". 
Grâce à la forme exponentielle d'un nombre complexe, très fréquemment utilisée dans de nombreux 
domaines de la physique et de l'ingénierie, nous pouvons très facilement tirer des relations telles que 
(cis est une vieille notation qui est l'abréviation du cos i sin se trouvant dans la parenthèse): 
z =r(cos@+isin @) = rcis@=re" 
Z, = n(cos@ tising)=ncisg = ne” (2.114) 


Z, = (cos @ +isin@) = Acisg = re" 


et en supposant connues les relations trigonométriques de bases (cf. chapitre de Trigonométrie) nous 
avons les relations suivantes pour la multiplication de deux nombres complexes: 
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Z1'Z1 = 'A[cos(g +B)+isin(g +2)]=n' rncis(g +@) 


= poil De = loto ] 
ne”re ne 


(2.115) 


dès lors: 
arg(Z ‘Z2) = arg(z;) +arg(z:) (2.116) 
et donc si nest un entier positif: 
arg (z") = #arg(z) (2.117) 
Pour le module de la multiplication (nous changeons de notation pour la lisibilité): 
[2122] = tre ?r Cia = LA ne) =rr'=lall| (C1) 
d'où: 
L| 0) 


Pour la division de deux nombres complexes: 


_ = Tfcos(g — @) +isin(g -2)]= dcis(g - @) 

: : : (2.120) 
= LEE = TL as) 

r, REZ ñ 


Le module de leur division vient alors immédiatement: 


il 


|: | 


rs 
mis (2.121) 


Z3 


dès lors nous avons pour l'argument: 


zZ rev ra 
are |= ag] —-|-ac) 77 |-p-p-ag(z)-arg(z) (12 
Z; r'é r 
ainsi il vient immédiatement: 
fe [_æ\1 lp 
argiz |=arglire" | |=argl -e æ=-@D=-arg(z) (2.123) 
Fr 


Pour la mise en puissance d'un nombre complexe (ou la racine): 
# M im — 


2" = rte" = r"[cos(mp) +isin(np)] = r"cis(m@) (2.124) 


ce qui nous donne immédiatement un résultat déjà mentionné plus haut: 
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et pour l'argument: 
ñ m , 
arg(z”) = arglire®) |= arg{r"e 7 |= @m= marg(z) (2.126) 


Dans le cas où nous avons un module unité tel que z = cos{@) +isin(g) nous avons alors la relation: 
« m ñ 
(cos p+isin)" = (9) = 6" =cos(mp)+isin(mæ) (2.127) 


appelée "formule de De Moivre”. 


Pour le logarithme népérien d'un nombre complexe, nous avons trivialement la relation suivante sur 
laquelle nous reviendrons dans le chapitre d'Analyse Complexe: 


In(z) = In (rev) =in(r)+i@ (2.128) 
où In( z ) est souvent dans le cas complexe écrit Log( z ) avec un "L" majuscule. 


Toutes les relations précédentes pourraient bien sûr être obtenues avec la forme trigonométrique des 
nombres complexes mais nécessiteraient alors quelques lignes supplémentaires de développements. 


Remarque: Une variation sinusoïdale f {£) = rsin(@f) peut être représentée comme la projection 
(cf. chapitre de Trigonométrie) sur l'axe vertical y (axe des imaginaires de l'ensemble €) d'un 
vecteur f tournant à vitesse angulaire & autour de l'origine dans le plan xOy: 


ÿ 


SF) =b= sin(@) | 


Figure: 2.6 - Représentation d'un vecteur de Fresnel 


Un tel vecteur tournant s'appelle "vecteur de Fresnel" et peut très bien être interprété comme la 
partie imaginaire d'un nombre complexe donné par: 


F = R(7) +190) = r(cos(@f) +isin(@f)) = re =rg# (2.129) 


Nous retrouverons les vecteurs tournants de façon explicite lors de notre étude de la mécanique 
ondulatoire et optique géométrique (dans le cadre de la diffraction). 
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2.7.2. TRANSFORMATIONS DANS LE PLAN 


Il est habituel de représenter les nombres réels comme points d'une droite graduée. Les opérations 
algébriques y ont leur interprétation géométrique: l'addition est une translation, la multiplication une 
homothétie centrée à l'origine. 


En particulier nous pouvons parler de la "racine carrée d'une transformation". Une translation 
d'amplitude a peut être obtenue comme l'itération d'une translation d'amplitude a/2. De même une 
homothétie de rapport a peut être obtenue comme l'itérée d'une homothétie de rapport ,f, . En 


particulier une homothétie de rapport 9 est la composée de deux homothéties de rapport 3 ( ou -3). 


La racine carrée prend alors un sens géométrique. Mais qu'en est-il de la racine carrée de nombres 
négatifs? En particulier de la racine carrée de -1? 


Une homothétie de rapport -1 peut être vue comme une symétrie par rapport à l'origine. Toutefois si 
nous voulons voir cette transformation d'une manière continue, force nous est de placer la droite dans 
un plan. Dès lors une homothétie de rapport -1 peut être vue comme une rotation de 7 radians autour 
de l'origine. 


Du coup, le problème de la racine carrée négative se simplifie. En effet, il n'est guère difficile de 
décomposer une rotation de 7 radians en deux transformations: nous pouvons répéter soit une rotation 
de zxx/ 2 soit une rotation de -z7/ 2. L'image de 1 sera la racine carrée de -1 et i est située sur une 
perpendiculaire à l'origine à une distance 1 soit vers le haut soit vers le bas. 


Ayant réussi à positionner le nombre i il n'est plus guère difficile de disposer les autres nombres 
complexes dans un plan de Gauss. Nous pouvons ainsi associer à 2i le produit de l'homothétie ( 

| mé e) de rapport 2 par la rotation de centre O et d'angle x} 2, soit une 
similitude centrée à l'origine. C'est ce que nous allons nous efforcer à montrer maintenant. 


Soient: 
A = x tin =a6",z, = x, +iy, = bel 
et£keN. 


Nous avons les propriétés de transformations géométriques suivantes pour les nombres complexes (voir 
le chapitre de Trigonométrie pour les propriétés du sinus et cosinus) que nous pouvons joyeusement 
combiner selon notre bon vouloir: 


P1. La multiplication de z, par un réel 4 dans le plan de Gauss correspond (trivial) à une homothétie 
(agrandissement) de centre O (l'intersection des axes imaginaires et réels), de rapport 4. 


Démonstration: 
A4 = (A'aie 
OIC.Q.F.D. 


P2. La multiplication de z, par un nombre complexe de module unitaire: 
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Z0 = on tip =cos@tisinw=e® (2132) 


correspond à une rotation de centre O et d'angle du complexe z,. 


Démonstration: 


OIC.Q.F.D. 


Remarque: Nous voyons alors immédiatement, par exemple, que multiplier un nombre complexe 
par i (c'est-à-dire sin(@) = 1,cos{@) = 0 ) correspond à une rotation de x /2. 


Il est intéressant d'observer que sous forme vectorielle la rotation de centre O de z, par z, peut s'écrire 
à l'aide de la matrice suivante: 


Démonstration: 


Nous savons que z,Z, est une rotation de centre O et d'angle « . Il suffit de l'écrire à l'ancienne: 


ZoZ _ (x +iyn)(A +im) = (x — Yo}) +i(xoM + YA) (2.135) 


ce qui donne sous forme vectorielle: 


ZoA 


A — ( 
20 À — Yo" +j (2.136) 
0 0} + Yo 


donc l'application linéaire est équivalente à: 
%0  Jof[ A} _ [0% Jo 2137 
Yo % [| A0 * Yox 


ou encore (nous retombons sur la matrice de rotation dans le plan que nous avons dans le chapitre de 
Géométrie Euclidienne ce qui est un résultat remarquable!) en utilisant: 


z =r(cos@t+isin@) =r(cos(@+k27) tisin(@+k27)) (2.138) 
dans le cas particulier et arbitraire où r serait unitaire (afin d'avoir une rotation pure!): 


z = cos(@+&27) +isain(g+£27)= zxn +0 (2.139) 


nous avons immédiatement (nous avons repris les notations de l'angle tel que nous l'avons dans le 


chapitre de Géométrie): 
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x —Y (A cosi@i —-sni@ilfx XoÀ — Yo cos(@)x, -sin(@)y" 140) 
Yo % in) [siniæ) cosiei [ln]) Lxm+>0m) (cos(æ)n +sin(@)x 


Remarquons que la matrice de rotation peut aussi s'écrire sous la forme : 


sin(@)  cos(@) 


cos(@) —sin(@) l 0 Là | 
| | = cos(@) Lo | +sin(@) | | = cos(@)'Î+sin(@)'J (2.141) 


de même : 


29 }o 10 x O1 Fa D ous 
= x = x: . 2.142 
%  % (] 0 1 Yo 1 0 0 Yo 


OIC.Q.F.D. 


Ainsi nous remarquons que ces matrices de rotation ne sont pas que des applications mais sont des 
nombres complexes aussi (bon c'était évident dès le début mais fallait le montrer de manière esthétique 
et simple). 


Ainsi, nous avons pour habitude de poser que : 


1 O1 10 -1 
1= = (2.143) 
0 1 1 0 


ou avec une autre notation fréquente en alègbre linéaire: 


1 01 fo -1 
1= i= (2.144) 
LS | 1 0 


Le corps des nombres complexes est donc isomorphe au corps des matrices réelles carrées de 
dimension 2 du type: 


C'est un résultat que nous réutiliserons de nombreuses fois dans divers chapitres de ce site pour des 
études particulières en algèbre, géométrie et en physique quantique relativiste. 


P3. La multiplication de deux complexes correspond à une homothétie ajoutée à une rotation. En 
d'autres termes, d'une "similitude directe". 
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Démonstration: 


22) = ae bel = (ab 24) (2.146) 
il s'agit donc bien d'une similitude de rapport b et d'angle $. 
OIC.Q.FD. 
Au contraire, l'opération suivante: 
2122 = 00% bo 78 = | ab Va Cr) (2.147) 
sera appelée une "similitude linéaire rétrograde". 
Par ailleurs, il en retourne trivialement la relation déjà connue suivante: 


arg(Z2) = arg(z) +arg(z>) (2.148) 


Remarques: 


R1. La somme de deux nombres z, +z, complexes ne pouvant avoir une écriture mathématique 


simplifiée sous quelque forme que ce soit, nous disons alors que la somme équivaut à une 
"translation d'amplitude". 


R2. La combinaison d'une similitude linéaire (multiplication de deux nombres complexes) directe et 
d'une translation d'amplitude (sommation par un troisième nombre complexe) correspond à ce que 
nous appelons une "similitude linéaire directe". 


P4. Le conjugué d'un nombre complexe est géométriquement son symétrique par rapport à l'axe IR tel 
que: 


A=n-in=rlcosa-isinal=r{cos-x)+isin(-a)l=re % (2.149) 
sans oublier que: 
cos(@) = cos(@+&27),sin(gi = sin(@+k£&27%) (2.150) 
Ce qui nous donne un résultat déjà connu: 
arg(z,)=-arg(z;) (2.151) 
D'où nous pouvons tirer la propriété suivante: 


(cos(g+x) +isain(®+})|l=r{-cos(@) —-isin(@)i = -r{cos(gÿ +isin(@)i=-Z, (2.152) 


d'où: 
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arg(z,)+}7 =arg(-z,) (2.153) 


P5. La négation du conjugué d'un nombre complexe est géométriquement son symétrique par rapport à 
l'axe des imaginaires IR; tel que: 


A = ton er codtianédl=ricoT Ed rIan()] (2154) 


Remarques: 
R1. La combinaison de P4, PS5 est appelée une "similitude rétrograde". 


R2. L'opération géométrique qui consiste à prendre l'inverse du conjugué d'un nombre complexe 
(soit 7-1) est appelée une "inversion de pôle". 


P6. La rotation de centre c et d'angle & est donnée par: 
c+eP(z-c) (2155) 
Explications: 


Le complexe c donne un point dans le plan de Gauss qui sera le centre de rotation. La différence z -c 
donne le rayon r choisi. La multiplication par ;## est la rotation du rayon par rapport à l'origine du plan 


de Gauss dans le sens inverse des aiguilles d'une montre. Finalement, l'addition par c la translation 
nécessaire pour ramener le rayon r tourné à l'origine du centre c. Ce qui donne schématiquement: 
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Figure: 2.7 - Représentation de la rotation complexe 


P7. Sur la même idée, nous obtenons une homothétie de centre c, de rapport À par l'opération: 
c+A(Z -c) (2156) 
Explications: 


La différence z, -c donne toujours le rayon r et c un point dans le centre de Gauss. A(z, -c) donne 


l'homothétie du rayon par rapport à l'origine du plan de Gauss et finalement l'addition par c la 
translation nécessaire pour que l'homothétie soit vue comme étant faite de centre c. 


2.8. NOMBRES QUATERNIONS 


Appelés aussi "hypercomplexes", les nombres quaternions ont été inventés en 1843 par William Rowan 
Hamilton pour généraliser les nombres complexes. 


Définition: Un quaternion est un élément (4,b,c,d)elR* et dont nous notons H l'ensemble qui le 


contient et que nous appelons "ensemble des quaternions". 


Un "quaternion" peut aussi bien être représenté en ligne ou en colonne tel que: 
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(a,b,c,d\= 


D NS GG 8 


Nous définissons la somme de deux quaternions (a,b,c,d) et (a',b',c',d") par: 
(déc dr bic d)=(ara bth crc d+A] (2158) 


Il est évident (du moins nous l'espérons pour le lecteur) que { H, +; est un groupe commutatif (cf. 


chapitre de Théorie Des Ensembles), d'élément neutre (0,0,0,0), l'opposé d'un élément (a,b,c,d) étant 
(-a,-b,-c,-d) 


Remarque: C'est l'addition naturelle dans p* vu comme IR -espace vectoriel (cf. chapitre de 
Théorie Des Ensembles). 


L'associativité se vérifie en appliquant les propriétés correspondantes des opérations sur IR. 
Nous définissons également la multiplication: 


(a,b,c,d)'(a'b'c'd") (2159) 


de deux quaternions (a,b,c,d) et (a ',b',c 'd") par l'expression: 
aa'- bb'-cc'-dd' 
(ab'+ ba +(cd'- dc 


(ac'+ca)=(d'=0b1 
(da'+ad" +(bc'-cb 


(2.160) 


C'est peut-être difficile à accepter mais nous verrons un peu plus loin qu'il y a un air de famille avec les 
nombres complexes. 


Nous pouvons remarquer que la loi de multiplication n'est pas commutative. Effectivement, en prenant 
la définition de la multiplication ci-dessus, nous avons: 
(0,1,0,0): (0,0,1,0ÿ = €0,0,0,1) 


(2.161) 
(0,0,1,0):(0,1,0,0) = (0,0,0,-1) 


Mais nous pouvons remarquer que: 
(0, 1 0,0): (0,0,1,0) = -(0,0,105:(0,1,0,0) (2.162) 
Remarque: La loi de multiplication est distributive avec la loi d'addition mais c'est un excellent 


exemple où il faut quand même prendre garde à démontrer la distributivité à gauche et à droite, 
puisque le produit n'est pas commutatif ! 
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La multiplication a pour élément neutre: 


(1,0,0,0) (2.163) 
Effectivement: 
(1,0,0,0)' (a,b,c,d) = (a,b,e,d)'(1,0,0,0) =(a,b,c,d) (2.164) 
Tout élément: 
(a,b,c,d)e H' =H-{(0,0,0,0)} (2.165) 
est inversible. 
En effet, si (a,b,c,d) est un quaternion non nul, nous avons alors nécessairement: 
+ +e+d? #0 (2166) 


sinon les quatre nombres a, b, c, d sont de carré nul, donc tous nuls. Soit alors le quaternion 
(&,h,c,d 1 défini par: 


a 
= —————_—_——_—_Û—_— 
1 a +b+c+d? 
h= —b 

Lens 2 2 2 

+ +e + 

s b & à (2.167) 
ee ns 
1 +rh+e+d 

—à 

de 


alors en appliquant machinalement la définition de la multiplication des quaternions, nous vérifions que: 
(a,b,c,d)'(a,,h,c,d,)=(a,,b,,c,4,)'(a,b,c,d)=1(10,0,0) (2.168) 
ce dernier quaternion est donc l'inverse pour la multiplication! 


Montrons maintenant (pour la culture générale) que le corps des complexes {Œ+,*1\ est un sous-corps 


de (H,+,X*i. 


Remarque: Nous aurions pu mettre cette démonstration dans le chapitre de Théorie Des Ensembles 
car nous faisons usage de beaucoup de concepts qui y sont vus mais il nous a semblé un peu plus 
pertinent de la mettre ici. 


Soit H' l'ensemble des quaternions de la forme (a,b,0,0). Si H' est non vide, et si (a,b,0,0), (a',b',0,0) 
sont des éléments de H' alors (H',+,*\ est un corps. Effectivement: 


P1. Pour la soustraction (et donc l'addition): 


Page: 96/4839 


[v3.0 - 2013] 


(a,b,0,0)-(a',b",0,0) = (a-a'b-b"0,0)EH' (2.169) 


P2. La multiplication: 
(a,b,0,0):(&',b",0,0) = (aa'-bb',ab'"+ba',0,0)e H' (2.170) 
P3. L'élément neutre: 
(1,0,00EeH" (2171) 
P4. Et finalement l'inverse: 


(ai(æ? +?) -b/(a +b?) 0,01 (2.172) 


de (a,b,0,0) est encore dans H'. 


Donc (Hl,+,*\ est un sous-corps de H. Soit alors l'application: 


(2.173) 


| € H' 
‘letibh (a,b,0,0) 


f est bijective, et nous vérifions aisément que pour tous complexes z,,z, , nous avons: 


JA +2) = f(&) + f(22) 
J(222) = f(a)F (2) 


(2.174) 


Donc f est un isomorphisme de {€+,X\ sur (H',+,xi. 


Cet isomorphisme a pour intérêt (provoqué) d'identifier € à H' et d'écrire € < H, les lois d'addition 
et de soustraction sur H prolongeant les opérations déjà connues sur €. 


Ainsi, par convention, nous écrirons tout élément de (a,b,0,0) de H' sous la forme complexe a+ib. En 
particulier 0 est l'élément (0,0,0,0), 1 l'élément (1,0,0,0) et i l'élément (0,1,0,0). 


Nous notons par analogie et par extension j l'élément (0,0,1,0) et k l'élément (0,0,0,1). La famille 
{1,i,j,k} forme une base de l'ensemble des quaternions vu comme un espace vectoriel sur IR, et nous 
écrirons ainsi & + bi +cj + dk le quaternion (a,b,c,d). 


La notation des quaternions sous forme définie ci-avant est parfaitement adaptée à l'opération de 
multiplication. Pour le produit de deux quaternions nous obtenons en développant l'expression: 


(a+bi+ct+dk)'(@'+è"itc'ji+d'#) (2175) 


16 termes que nous devons identifier à la définition d'origine de la multiplication des quaternions pour 
obtenir les relations suivantes: 
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in j=k=-ji 
j'k=i=-k) 
EN (2.176) 
k'i= j=-'x 
nt nn 
Ce qui peut se résumer dans un tableau: 
| 1 Ni x 


Mmuilililx 


ilil1lkl- 


HAPFIEIE 


Mk) j|-il)-1 


Tableau: 2.4 - Multiplication des composantes d'un quaternion 


Nous pouvons constater que l'expression de la multiplication de deux quaternions ressemble en partie 
beaucoup à un produit vectoriel (noté * sur ce site) et scalaire (noté + sur ce site): 


aa'- bbh'-cec'- ad" 
(ab'+ ba +(cd'- dc 
(ac'+ca-(bd'- db 
(rad iribc chi 


(2.177) 


Si ce n'est pas évident (ce qui serait tout à fait compréhensible), faisons un exemple concret. 
® Exemple: 
Soient deux quaternions sans partie réelle: 
p=xityitzX g=xity'j+z'& (2178) 
et ä,Y les vecteurs de p° de coordonnées respectives (x, y, z) et (x', y’, z'). Alors le produit: 
p'q=t(0,%) (0,9) (2.179) 
est: 
p'om=(-x' pr pr -2v 2x7 zx xx = {(-Lov EX) 
Nous pouvons aussi par curiosité nous intéresser au cas général... Soient pour cela deux quaternions: 
p=(au) g=t(b,v) (2180) 
Nous avons alors: 


p'q=(a+(0,2))"(b +(0,9)) = ab + (0,av) + (0,bà) + (-dov,axÿ) 


= (ab io ÿ,aÿ + bi +HXŸ) 
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Définition: Le centre du corps non-commutatif (H,+,*\ est l'ensemble des éléments de H commutant 


pour la loi de multiplication avec tous les éléments de H. 


Nous allons montrer que le centre de {H,+,*\ est l'ensemble des réels! 


Soit H, le centre de (H,+,X\, et (x, y, z, €) un quaternion. Nous devons avoir les conditions suivantes 


qui soient satisfaites: 
Soit (x,y,z,t) € Hi, alors pour tout (&,b,c,d) € H nous cherchons: 

(eve D ape diet he OxLMrE) (2182) 
ce qui donne en développant: 


xa — yb—z2c-id = ax-by-cz-dÎt 
xb + ya +zd —ic = ay +bx+ct — dz 
xc +za— yd +tb = az +cx -bt +dy 
fa + xd +ye—zb = dx +at+bz-cy 


après simplification (la première ligne du système précédent est nulle des deux côtés de l'égalité): 


ct-d&=0 
bt-dy =0 (2.184) 
bz-cy=0 


la résolution de ce système, nous donne: 
y=Zz=t=0 (2185) 
Donc pour que le quaternion (x, y, z, t) soit le centre de H] il doit être réel (sans parties imaginaires)! 
Au même titre que pour les nombres complexes, nous pouvons définir un conjugué des quaternions: 
Définition: Le conjugué d'un quaternion Z = (a,b,c,d) est le quaternion Z = (a,-b,-c,-d) 
Au même titre que pour les complexes, nous remarquons que: 
1. D'abord de manière évidente que si 7 = 7 alors cela signifie que Ze KR. 
2. Que 7Z+7eR 


3. Qu'en développant le produit 7.7 nous avons: 


Z'Z = Re AT SD De en ut” à 
= (a? +b? +0? +d?,-ab + ba -cd +dc,-ac +ca +bhd -db,da -ad-bc+ch) (2.186) 


= (a? +h?+c?+d?,00,0)=4a +b?+c?+4?elR 


que nous adopterons, par analogie avec les nombres complexes, comme une définition de la norme (ou 
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module) des quaternions tel que: 


IZ| 7.7 (2.187) 


Dès lors nous avons aussi immédiatement (relation qui nous sera utile plus tard): 


[ZZ | = \ ZZ'\ (ZZ') (2.188) 


Comme pour les nombres complexes (voir plus loin), il est aisé de montrer que la conjugaison est un 
automorphisme du groupe { HI, +\. 


Effectivement, soient Z = (a,b,e,d) et Z'=(a'b'c'd" alors: 


Z+2'=(ata, bb, c-c'-d-d')={(a, bc, d)t(a, bc, d) (2.189) 
= Z+7' 


Il est aussi aisé de montrer qu'elle est involutive. Effectivement: 
Z = (a-(-b)-(<0).-Cd)) = G@b,c,d)= Z (2190) 


La conjugaison n'est par contre pas un automorphisme multiplicatif du corps (H,+,*\. En effet, si nous 


considérons la multiplication de Z, Z' et en prenons le conjugué: 


aa'-bb'-cc'- dd" aa'-bb'-cc'- dd 
QE + | ue r DS — b'+b + d'- à ' 
771 = He See 2 Dani Lo ne 58 LA (a Miele 7 —. 


(ac'+ca -(bd'-d4b" (actes) + '= db) 
(da'+ad'}+(bc'-cb" —(da'+ ad" -(bc'-cb' 
nous voyons immédiatement (ne serait-ce que pour la deuxième ligne) que nous avons: 


ZZ'æ#ZZ' (2192) 


Revenons maintenant sur notre norme (ou module)... Pour cela, calculons le carré de la norme de [ZZ 1 


ZZ Ÿ -(2Z)-Gz) C199 
Nous savons (par définition) que: 
aa'- bh'-cc'- dd’ 
_[(ab"+ ba + (cd'- dc 


la 'rediT id de) 
(da'+ad" +(bc'-cb 


PA (2.194) 


notons ce produit de manière telle que: 
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Z'£'=(e,6,y,A)=2" (2195) 
Nous avons alors: 
Z"Z\=d+82+y +42 (2196) 
en substituant il vient: 


(2Z "(229 = (aa'-bb'-cc'- dd'Ÿ + (ab'+ ba'+cd'- de 'Ÿ 


(2.197) 
+lac'+ca'-bd'+ db'\? +{da'+ad'+bc'-cb' ÿ 


après un développement algébrique élémentaire (honnêtement ennuyeux), nous trouvons: 
TTTN 12 | 
(ZZ) (ZZ) = (a 2+b2+c2+42)|a2 +b?2 +2 +d? | =|Z | HS (2.198) 
Donc: 


(223-@25=[ZFIzÈ =1zzf cu) 


Remarque: La norme est donc un homomorphisme de (H,*\ dans (IR,*\. Par la suite, nous 
noterons G l'ensemble des quaternions de norme 1. 
2.8.1. INTERPRETATION MATRICIELLE 
Soient q et p deux quaternions donnés, soit l'application: 
P4q'P? 


La multiplication (à gauche) peut être faite avec une application linéaire (cf. chapitre d'Algèbre 
Linéaire) sur H. 


Si q s'écrit: 
atbhitci+tdk (2.200) 


cette application a pour matrice, dans la base 1, i, j, k: 


A DEC 
DATE ON C 

(2.201) 
ce à a -b 
dc bd d 


Ce que nous vérifions bien: 
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Z£'= (2.202) 


D ‘ ta rend db 
DUC E (da'+ad+(bc'-cb 


€ 


CS er + ie: & | 0 ca'=bh'=cc dd 
b a -d € ||b'l |(ab'+ba)+(cd'- de) 
—h E 
a 


En fait, nous pouvons alors définir les quaternions comme l'ensemble des matrices ayant la structure 
visible ci-dessus si nous le voulions. Cela les réduirait alors à un sous espace vectoriel de À, (R). 


En particulier, la matrice de 1 (la partie réelle du quaternion q) n'est alors rien d'autre que la matrice 
identité: 


3 D 1 Pi 0 
OM MO à 2 
M, = =1 (2203) 
NE 0 1 
SN LS à 
de même: 
à AR ES à ON 1 (] ni SE dE: DE | 
LOUE NE (] ot 1 (SF à 
M, = .M,= M, (2.204) 

0 0 0 -1 Al à DRE OS 
102. à OS: RON ÜL=1 D 0 1 O0 


2.8.2. ROTATIONS 


Nous allons maintenant voir que la conjugaison par un élément du groupe G des quaternions de norme 
unité peut s'interpréter comme une rotation pure dans l'espace! 


Définition: La "conjugaison" par un quaternion q non nul et de norme unité est l'application $, définie 
sur H par: 


SP q-.p.4 =4.p.4| (2.205) 


et nous affirmons que cette application est une rotation. 
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Remarques: 


R1. Comme q est de norme 1, nous avons bien évidemment kel =g'4&=1 donc ” E = 7.Ce 


quaternion peut être vu comme la valeur propre (unitaire) de l'application (matricielle) p sur le 
vecteur 4 (on se retrouve avec un concept en tout point similaire aux matrices orthogonales de 
rotation vues en algèbre linéaire). 


R2. #, est une application linéaire (donc si c'est bien une rotation, la rotation peut être décomposée 
en plusieurs rotations). Effectivement, prenons deux quaternions p,,p, et 4,4, des réels, alors 
nous avons: 


So (AP + bP2)l=q(An + LP: = Ag + gP2 = AS (P1lt HS, (Pa) (2.206) 


Vérifions maintenant que l'application est bien une rotation pure. Comme nous l'avons vu lors de notre 
étude de l'algèbre linéaire et en particulier des matrices orthogonales (cf. chapitre d'Algèbre Linéaire), 
une première condition est que l'application conserve la norme. 


Vérifions: 
IS, G@)|=l&3l =llell=1?l 207 


Par ailleurs, nous pouvons vérifier qu'une rotation d'un quaternion purement complexe (tel qu'alors 
nous nous restreignons à ]g°) et la même rotation inverse sommées est nulle (le vecteur sommé à son 


opposé s'annulent): 


S,(P)+8,(p) =apa +apa = ap +a(pa) (220) 


nous vérifions trivialement que si nous avons deux quaternions q,p alors »:4 =: dès lors: 


S(Pp)+S,(p)=apg +a(pa)=apg +(rG&G =g'p a +ta pa 
Apt To ERA IP EP) 


(2.209) 


pour que cette opération soit nulle, nous voyons immédiatement que nous devons restreindre p aux 
quaternions purement complexes. Dès lors: 


S,(p+P)=8,(0)=0 (2.210) 


/ 


Nous en déduisons alors que p doit être purement complexe pour que l'application £, soit une rotation 
et que #,(») est un quaternion pur. En d'autres termes, cette application est stable (en d'autres termes: 
un quaternion pur par cette application reste un quaternion pur). 


S, restreint à l'ensemble des quaternions purement complexes est donc une isométrie vectorielle, c'est- 


à-dire une symétrie ou une rotation. 


Nous avons vu également lors de notre étude des matrices de rotation dans le chapitre d'Algèbre 
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Linéaire que l'application A devait être de déterminant 1 pour que nous ayons une rotation. Voyons si 
c'est le cas de $, : 


Pour cela, nous calculons explicitement en fonction de: 
g=atbitcejtdk& (2211) 


la matrice (dans la base canonique {, j,&}) de $, et nous en calculons le déterminant. Ainsi, nous 
obtenons les coefficients des colonnes de A en se rappelant que: 


ij=k=-ji 
j'k=i=-k) 

ae 3 (2.212) 
&'i= j=-'k 


5? ==}? =] 


et ensuite en calculant: 
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SG) = (a+ bi +cj+dk}i(a— bi—cj - dk) 


= (ai +b(2)+c( ji) +d()) (a —bi-ci-dk)={(ai-b-ck+dji(a-bi-ci-dk) 
= (a2i+ ab —ack + adj) (ba — bi — bei —bdk) 

—(cak- chj+e/i +cd)+(daj +dbk+cd - d’i) 

= Cs +82 -62 -d?}i + Ch — ack + adj) (ba — bej — bdk) 

—(cak- chj + DL) + (da + dbk + xd) 

= (22487-07475 +2 (ad + bc) j +2(d-ac)k 


SC) = (a + bi + cj + dk) j(a — bi — cj - dk) 
= (ai+bG)+e0?)+d(&))(@ -bi-cj-dk)= (ai+bk-c-dil(a-bi-cj-dk) 

= (a? j+abk +ac — adi) +(bak— b? j +bci + bd) 

—(ca- chic? j -cdk) — (dai + db dek +d°? j) (2.213) 
= (2-27 402 9?) j+(abk + dé — adi) + (ak + bei + Bd) 

—(pé — chi -cdk)- (dai + 24 — dck) 

= 2(bc—ad)i+(a? -8? +74?) j+2(ab+cd)k 


S, (&) = (a+ bi + cj + dk)k(a — bi —cj - dk) 

= (ak +862) +e(k) + d(k?)) (a— bi-cj- dk) = (ak-b; + ci -d)(a — bi -cj-dk) 
= (a?k- abj+aci +ad)-(abj +b?k+ be — bai) 

+cai+cb-c?k+cdji)- (da — dbi - dej - d°?k) 

= Es hp? -ç2 + d?)£+(-abj + aci + D) — (abj + PÉ — bai) 

+(cai + DK + cdj) - (da — dbi — dej) 

= 2(ac+bd)i+2(cd -ab) j+{a?-b2- 0? +42 )k 


Il faut alors calculer le déterminant de la matrice (pfff...): 


Rd à 2{ad + bc) 2(bd — ac) 
2(bc - ad) dehfype dt 2(ab +cd) 
(ac +bd) 2(cd - ab) he $4* 

(2.214) 


en se souvenant que (ce qui permet aussi de simplifier l'expression des termes de la diagonale comme 
nous pouvons le voir dans certains ouvrages): 


æ +b+c+d?=1 (2215) 


nous trouvons que le déterminant vaut bien 1. Sinon, nous pouvons vérifier cela avec Maple: 
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>with(linalg): 

> A:=linalg[matrix](3,3,[a/2+b12-c/2-d12,2*(a*d+b*c),2*(b*d-a*c),2*(b*c-a*d),a12-b12+c12-d12,2* 
(a*b+c*d),2*(a*c+b*d),2*(c*d-a*b),a12-b12-c12+d21); 

> factor(det(A)); 


Montrons maintenant que cette rotation est un demi-tour d'axe (l'exemple qui peut sembler particulier 
est général!): 


D'abord, si: 
g=xi+yi+z£ (2216) 
nous avons: 
S9()=g'q'7=aq (2217) 
ce qui signifie que l'axe de rotation (x, y, z) est fixé par l'application $, elle-même ! 
D'autre part, nous avons vu que si q est un quaternion purement complexe de norme 1 alors: 
g'=getq{=-4 (2218) 
Ce qui nous donne la relation: 
g=g(D=q(-(@" h=-1 (C.219) 
Ce résultat nous amène à calculer la rotation d'une rotation: 
S,(S(æ)|=a(apz x = 4° pa = Sa =(-1l)p(-g i 
| 1) pg° =(-1)p(-l)=p 


Conclusion: Puisque la rotation d'une rotation est un tour complet, alors #, est nécessairement un 
g 


demi-tour : 
IDE cr 
par rapport (!) à l'axe (x, y, 2). 


A ce stade, nous pouvons affirmer que toute rotation de l'espace peut se représenter par #, (la 


conjugaison par un quaternion q de norme 1). En effet, les demi-tours engendrent le groupe des 
rotations, c'est-à-dire que toute rotation peut s'exprimer comme le produit d'un nombre fini de 
demi-tours, et donc comme la conjugaison par un produit de quaternions de norme 1 (produit qui est 
lui-même un quaternion de norme 1 .….). 


Nous allons tout de même donner une forme explicite reliant une rotation et le quaternion qui la 
représente, au même titre que nous l'avons fait pour les nombres complexes. 


Soit #(x,y,z) un vecteur unitaire et 8€ [0,2%] un angle. Alors nous affirmons que la rotation d'axe % 
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et d'angle & correspond à l'application $,, où q est le quaternion: 


COS — 
a 


8.8 8. 6 D dos) 

g =cos—+xsin—it+ysan—/jt+tzsan—£=|cos-—,san—u|= (2.221) 
2 2 2 2 2 e . 8 
dir 


zsin — 
2 


Pour que cette affirmation soit vérifiée, nous savons qu'il faut que: la norme de q soit unitaire, le 
déterminant de l'application #, soit égal à l'unité, que l'application $#, conserve la norme, que 


l'application £, renvoie tout vecteur colinéaire à l'axe de rotation sur l'axe de rotation. 
1. La norme du quaternion proposé précédemment vaut effectivement 1: 


2 2 2 


. 28 ie . 2 8 4, \ 
= cos? © + x sin Sen NZ nsc tan) (rte) 


F 


LE 
= cos ut de) CU 


et comme #{x,y,z) est unitaire alors nous avons: 


Donc: 
8 . 28, 8 .:8 —_ 
ke|= cos? Stan 2! x° by +7 | = cos? ru sin’ - =1 (2224) 


2. Le fait que q soit un quaternion de norme 1 amène immédiatement à ce que le déterminant de 
l'application #, soit unitaire. Nous l'avons déjà montré plus haut dans le cas général de n'importe quel 


quaternion de norme 1 (condition nécessaire et suffisante). 


3. Il en est de même pour la conservation de la norme. Nous avons déjà montré plus haut que c'était de 
toute façon le cas dès que le quaternion q était de norme 1 (condition nécessaire et suffisante). 


4. Voyons maintenant que tout vecteur colinéaire à l'axe de rotation est projeté sur l'axe de rotation. 
Notons q' le quaternion purement imaginaire et unitaire x + yj +z&. Nous avons alors: 


q PRE 2.225) 
NES 


Alors: 
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mais comme q' est la restriction de q à ces éléments purs qui le constituent, cela revient à écrire: 
S,(g'=S, (a) =4gz =a (2227) 


Montrons maintenant le choix de l'écriture 8/2.Siÿ =(x,»,2Z) désigne un vecteur unitaire 
orthogonal à ä (perpendiculaire à l'axe de rotation donc), et p le quaternion xi + y, j +z4 alors nous 
avons: 


S (pi= ro , ue É 
4?) bus 00 Li or Ron 


7 
N 
N 
N 
© 


= cos? g nee ‘p- pq')- sin? LEP, 
5? > 5 4 P-Pg) 57 P4 
Nous avons montré lors de la définition de la multiplication de deux quaternions que: 
pq'=-qQ p (2229) 
nous obtenons alors: 
8 à . 2 8 
S (pl= cos? — p+2cos—sin—g'p-sin? —=g'pq' 
g\2] 2 2 2 2 g P 2 g P4q 
2 8 LES: OR ot: 
= cos“ —p + 2cos—sin — +sin — = (2.230) 
SP so te 54 p(-a) 
= cos? LE +2cos LA ane + sin? ee ‘pq' 
2 HN 2 
Nous avons également montré plus haut que: 
Se (p) = —p = gpg (2.231) 
dés lors: 
g'pq'= Si(p)=-p (2232 


(le demi-tour d'axe (x, y, z)). Donc: 


Srpr= cos Sp+2cosS sin Sa p-sin Sp 

20 2 © + 6, (2.233) 
= = — pt 2 — 7 
[os ; sin +] cos ns P 


= cos 8 p + ain &g'p 


Remarque: Nous commençons à entrevoir ici déjà l'utilité d'avoir écrit dès le début 8/2 pour 
l'angle! 
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Nous savons que p est le quaternion pur assimilé à un vecteur unitaire ÿ orthogonal à l'axe de rotation 
& , lui-même assimilé à la partie purement imaginaire de q'. Nous remarquons alors de suite que la 
partie imaginaire du produit (défini!) des quaternions g æ est alors égal au produit vectoriel 5x5 = w. 


Ce produit vectoriel engendre donc un vecteur perpendiculaire à #,Y et donc (%,v,w]. 


Le couple {ÿ,w) forme donc un plan perpendiculaire à l'axe de rotation # (c'est comme pour les 
nombres complexes simples dans lequel nous avons le plan de Gauss et perpendiculairement à celui-ci 
un axe de rotation!). 


Alors finalement: 
So (p)= cos 8p +sin 8g'p = cos +an8dw (2.234) 


Nous nous retrouvons avec une rotation basée sur un plan (mais qui a donc lieu dans l'espace!) 
identique à celle présentée plus haut avec les nombres complexes standards dans le plan de Gauss. 


Nous savons donc maintenant comment faire n'importe quel type de rotation dans l'espace en une seule 
opération mathématique et ce en plus par rapport à un libre choix de l'axe ! 


Nous pouvons aussi maintenant mieux comprendre pourquoi l'algèbre des quaternions n'est pas 
commutative. Effectivement, les rotations vectorielles du plan sont commutatives mais celles de 
l'espace ne le sont pas comme nous le montre l'exemple ci-dessous : 


Soit la configuration initiale : 


X 


Figure: 2.8 - Situation initiale pour rotations quaternions 


Alors une rotation autour de l'axe X suivie d'une rotation autour de l'axe Y: 


Ÿ 


Y 


X 


3 X 


Z 


Figure: 2.9 - Exemple de rotation de quaternions 
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n'est pas égale à une rotation autour de l'axe Y suivie d'une rotation autour de l'axe X : 


bi 


ki) 


X X 


£ Z 


Figure: 2.10 - Exemple de non équivalence pour rotation quaternions 


Les résultats obtenus seront fondamentaux pour notre compréhension des spineurs (cf. chapitre de 
Calcul Spinoriel)! 


2.9. NOMBRES ALGÉBRIQUES ET TRANSCENDANTS 


Définitions: 


D1. Nous appelons "nombre entier algébrique de degré n", tout nombre qui est solution d'une équation 
algébrique de degré n, à savoir: un polynôme de degré n (concept que nous aborderons dans la section 
d'Algèbre) dont les coefficients sont des entiers relatifs et dont le coefficient dominant vaut 1. 


D2. Nous appelons "nombre algébrique de degré n", tout nombre qui est solution d'une équation 
algébrique de degré n, à savoir: un polynôme de degré n dont les coefficients sont des rationnels. 


Un premier résultat intéressant et particulier dans ce domaine d'étude (curiosité mathématique...) est 
qu'un nombre rationnel est un "nombre entier algébrique de degré n" si et seulement si c'est un entier 
relatif (lisez plusieurs fois au besoin...). En termes savants, nous disons alors que l'anneau 7% est 
"intégralement clos". 


Démonstration: 


Nous supposons que le nombre p/q, où p et q sont deux entiers premiers entre eux (c'est-à-dire dont le 
rapport ne donne pas un entier ou plus rigoureusement... que le plus grand commun diviseur est 1!), est 
une racine du polynôme (cf. chapitre de Calcul Algébrique) suivant à coefficients entiers relatifs et dont 
le coefficient dominant est unitaire: 
x #1 (9 99€) 

X +a,,x +..+axta (2.235) 
où l'égalité avec zéro du polynôme est implicite. 
Dans ce cas: 


p'=-(a,p"l+..+apg"? +ag"1l)jg (2.236) 


Puisque les coefficients sont par définition tous entiers et leurs multiples aussi dans la parenthèse, alors 
la parenthèse à nécessairement une valeur dans Z. 


Ainsi, q (à droite de la parenthèse) divise une puissance de p (à gauche de l'égalité), ce qui n'est 
possible, dans l'ensemble 7 (car notre parenthèse a une valeur dans cet ensemble pour rappel...), que 
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si q vaut +1 (puisqu'ils étaient premiers entre eux). 


Donc parmi tous les nombres rationnels, les seuls qui sont solutions d'équations polynômiales à 
coefficients entiers relatifs et dont le coefficient dominant est unitaire sont des entiers relatifs! 


OIC.Q.F.D. 


Pour prendre un autre cas intéressant et particulier, il est facile de montrer qu'absolument tout nombre 
rationnel est un "nombre algébrique". Effectivement, si nous prenons le plus simple polynôme suivant: 


gx—p=0 


où q et p sont premiers entre eux et où q est différent de 1. Alors comme il s'agit d'une polynôme à 
coefficients rationnels simple, après remaniement nous avons: 


x=— 
q 

Donc puisque q et p sont premiers entre eux et que q est différent de l'unité, nous avons bien que tout 
nombre rationnel est un "nombre algébrique de degré 1". 


Ainsi, la quantité de nombres rationnels "algébriques" est plus grande que le nombre de rationnels qui 
sont des "entiers algébriques". 


Nous avons aussi le nombre réel (et irrationnel) Je qui est un "nombre entier algébrique de degré 2", 
car il est racine de: 


et le nombre complexe i qui est aussi un "nombre entier algébrique de degré 2", car il est racine de 
l'équation: 


etc. 
Définition: Les nombres qui ne sont pas algébriques (entiers ou non!) sont transcendants. 


L'ensemble de tous les nombres transcendants est non dénombrable. La preuve est simple et ne 
nécessite aucun développement mathématique difficile. 


Effectivement, puisque les polynômes à coefficients entiers sont dénombrables, et puisque chacun de 
ces polynômes possède un nombre fini de zéros (voir le théorème de factorisation dans le chapitre de 
Calcul Algébrique), l'ensemble des nombres + RPHRQUES est dénombrable! Mais l'argument de la 
diagonale de Cantor ( ) établit que les nombres réels (et par 
conséquent les nombres complexes ie) sont non dénombrables, donc l'ensemble de tous les nombres 
transcendants doit être non dénombrable. 


En d'autres termes, il y a beaucoup plus de nombres transcendants que de nombres algébriques. 
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Les transcendants les plus connus sont Æ et #. Les démonstrations de leur transcendance est en cours 
de rédaction. Nous devrions pouvoir vous les fournir fin 2014. 


2.10. NOMBRES ABSTRAITS 


Le nombre peut être envisagé en faisant abstraction de la nature des objets qui constituent le 
groupement qu'il caractérise et ainsi qu'à la façon de codifier (chiffre arabe, romain, ou autre système 
universel). Nous disons alors que le nombre est "abstrait". 


Remarque: Arbitrairement, l'être humain a adopté un système numérique majoritairement utilisé de 
par le monde et représenté par les symboles 1, 2, 3, 4, 5, 7, 8, 9 du système décimal et qui seront 
supposés connus aussi bien en écriture qu'oralement par le lecteur (apprentissage du langage). 


Pour les mathématiciens, il n'est pas avantageux de travailler avec ces symboles car ils représentent 
uniquement des cas particuliers. Ce que cherchent les physiciens théoriciens ainsi que les 
mathématiciens, ce sont des "relations littérales" applicables dans un cas général et que les ingénieurs 
puissent en fonction de leurs besoins changer ces nombres abstraits par les valeurs numériques qui 
correspondent au problème qu'ils ont besoin de résoudre. 


Ces nombres abstraits appelés aujourd'hui communément "variables" ou "inconnues", utilisées dans le 
cadre du "calcul littéral", sont très souvent représentés par: 


1. L'alphabet latin: 
a, b, c, d, ex, y,z; À, B,C, D,E.…. (2241) 


où Les lettres minuscules du début l'alphabet latin (a, b, c, d, e...) sont souvent utilisées pour 
représenter de manière abstraite des constantes, alors que les lettres minuscules de la fin de l'alphabet 
latin (...x, y, z) sont utilisées pour représenter des entités (variables ou inconnues) dont nous 
recherchons la valeur. 


2. L'alphabet grec: 


JAœ Alpha A4 Lambda 

B6 Beta My Mu 

Ty Gamma Nv Nu 

LA ô Delta E Ixi 

EE Epsilon [Oo Omicron 

IZS  [Zeta Ir Pi 

IH7  Eta Po Rho 

(@88 [Thêta [a {Sigma 

Te Iota Tr au 

K£ Kappa |Yv [Upsilon 

(Pép Phi X7 Chi 

E #  Psi Qaœ (Omega 
Tableau: 2.5 - Alphabet Grec 
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qui est particulièrement utilisé pour représenter soit des opérateurs mathématiques plus ou moins 


complexes (comme la somme indexée Y, le variationnel à, l'élément infinitésimal €, le différentiel 
partiel 4, etc.) soit des variables dans le domaine de la physique (comme & pour la pulsation, la 


fréquence v, la densité &, etc.). 


3. L'alphabet hébraïque (à moindre mesure) 


Remarque: Comme nous l'avons vu, les nombres transfinis sont par exemples donnés par la lettre 
K, ‘aleph”. 


Bien que ces symboles puissent représenter n'importe quel nombre il en existe quelques-uns qui 
peuvent représenter en physique des valeurs dites "constantes Universelles" comme la vitesse de la 
lumière c, la constante gravitationnelle G, la constante de Planck h, etc. 


Nous utilisons très souvent encore d'autres symboles que nous introduirons et définirons au fur et à 
mesure. 


Remarque: Les lettres pour représenter les nombres auraient été employées pour la première fois 
par Viète au 16ème siècle. 


2.11. DOMAINES DE DÉFINITION 


Une variable est un nombre abstrait susceptible de prendre des valeurs numériques différentes. 
L'ensemble de ces valeurs peut varier suivant le caractère du problème considéré. 


Définitions: 


D1. Nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques qu'elle 
est susceptible de prendre entre deux valeurs finies ou infinies appelées "bornes". 


Soient a et b deux nombres tel que 4 < à. Alors: 


D2. Nous appelons "intervalle fermé d'extrémités a et b", l'ensemble de tous les nombres x compris 
entre ces deux valeurs incluses et nous le désignons de la façon suivante: 


[a,b]={xEeRl|a<x<b} (2242) 


D3. Nous appelons "intervalle ouvert d'extrémités a et b", l'ensemble de tous les nombres x compris 
entre ces deux valeurs non incluses et nous le désignons de la façon suivante: 


ja, P={xEeR|a<x<b} (2243) 
D4. Nous appelons "intervalle fermé à gauche, ouvert à droite" l'ensemble suivant: 
[a b={xeRl|a£<x<b} (224) 


D5. Nous appelons "intervalle ouvert à gauche, fermé à droite" l'ensemble suivant: 
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ja,b]={xEeRl|a<x<£<b} (2245) 


Soit sous forme résumée et imagée: 


d b 
[a,b] F j a£x<b Intervalle fermé borné 
a b Intervalle borné semi-fermé en a et 


a =<x<b  |semi-ouvert en b (ou semi-fermé à 
gauche et semi-ouvert à droite) 


Gb | #7 — 


Ja,b] + —————— a <x<b let semi-fermé en b (ou semi-ouvert 


à gauche et semi-fermé à droite) 


. b Intervalle borné semi-ouvert en a 


a b » 
Ja,b[ ; € a <x<b Intervalle ouvert borné. 
b Intervalle non borné fermé en b (ou 
]-,b] x <b . ; ( 
pe — fermé à droite) 
b Intervalle non borné ouvert en b 
ob | +7 | x<e  : 
(ou ouvert à droite) 
a Intervalle non borné fermé en a (ou 
[a ,+æ[ a £x se 
————— fermé à gauche) 
a Intervalle non borné ouvert en a 
Ja,+æ [ & <Xx { 
———— (ou ouvert à gauche) 


Tableau: 2.6 - Types d'intervalles et de bornes 


Remarques: 


R1. La notation {x tels que 4 « x <ä } désigne l'ensemble des réels x strictement plus grands que a 
et strictement inférieurs à b. 


R2. Le fait de dire qu'un intervalle est par exemple ouvert en b signifie que le réel b ne fait pas 
partie de celui-ci. Par contre, s'il avait été fermé alors b en aurait fait partie. 


R3. Si la variable peut prendre toutes les valeurs négatives et positives possibles nous écrivons dès 
lors: J-®, +a[ où le symbole "« "signifie une "infinité". Evidemment il peut y avoir des 


combinaisons d'intervalles ouverts et infinis à droite, fermé et limité gauche et réciproquement. 


RA4. Nous rappellerons ces concepts avec une autre approche lorsque nous étudierons l'algèbre 
(calcul littéral). 


Nous disons que la variable x est "ordonnée" si en représentant son domaine de définition par un axe 
horizontal où chaque point de l'axe représente une valeur de x, alors pour chaque couple de valeurs, 
nous pouvons indiquer celle qui est "antécédente" (qui précède) et celle qui est "conséquente" (qui 
suit). Ici la notion d'antécédente ou de conséquente n'est pas liée au temps, elle exprime juste la façon 
d'ordonner les valeurs de la variable. 
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Définitions: 


D1. Une variable est dite "croissante" si chaque valeur conséquente est plus grande que chaque valeur 
antécédente. 


D2. Une variable est dite "décroissante" si chaque valeur conséquente est plus petite que chaque valeur 
antécédente. 


D3. Les variables croissantes et les variables décroissantes sont appelées "variables à variations 
monotones" ou simplement "variables monotones". 
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Notes personnelles: 
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3. OPÉRATEURS ARITHMÉTIQUES 


Pa des nombres comme nous l'avons fait dans le chapitre précédent amène naturellement à 


considérer les opérations de calculs. Il est donc logique que nous fassions une description non 
exhaustive des opérations qui peuvent exister entre les nombres. Ce sera l'objectif de ce chapitre. 


Nous considérerons sur ce site qu'il existe deux types d'outils fondamentaux en arithmétique (nous ne 
parlons pas de l'algèbre mais de l'arithmétique!): 


1. Les opérateurs arithmétiques: 


Il existe deux opérateurs de base (addition et soustraction) à partir desquels nous pouvons construire 
d'autres opérateurs: la "multiplication" et la "division". 


Ces quatre opérateurs sont couramment appelés "opérateurs rationnels". Nous verrons ces derniers plus 
en détails après avoir défini les relations binaires. 


Remarque: Rigoureusement l'addition suffirait si nous considérons l'ensemble commun des réels car 
dès lors la soustraction n'est que l'addition d'un nombre négatif. 


2. Les opérateurs (relations) binaires: 


Il existe 6 relations binaires fondamentales (égal, différent de, plus grand que, plus petit que, plus grand 
ou égal, plus petit ou égal) qui permettent de comparer des grandeurs d'éléments se trouvant à gauche 
et à droite (donc au nombre de deux, d'où leur nom) afin d'en tirer certaines conclusions. 


Il est bien évidemment essentiel de connaître au mieux ces deux outils et leurs propriétés avant de se 
lancer dans des calculs plus ardus. 


1. RELATIONS BINAIRES 


Le concept de "relation" est la base de toute la mathématique dont le but est d'étudier - par observation 
et déduction (raisonnement), calcul et comparaison - des configurations ou relations abstraites ou 
concrètes de ses objets (nombres, formes, structures) en cherchant à établir les liens logiques, 
numériques ou conceptuels entre ces objets. 


Définitions: 


D1. Considérons deux ensembles non vides E et F ( )non 
nécessairement identiques. Si à certains éléments x de E nous pouvons associer par une règle 
mathématique précise R (non ambiguë) un élément y de F, nous définissons ainsi une "relation 
fonctionnelle" de E vers F et qui s'écrit: 


REF (31) 


Ainsi, de façon plus générale, une relation fonctionnelle R peut être définie comme une règle 
mathématique qui associe à certains éléments x de E, certains éléments y de F. 
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Alors, dans ce contexte plus général, si xRy, nous disons que y est une "image" de x par R et que x est 
un "antécédent" ou "pré-image" de y. 


L'ensemble des couples (x, y) tels que xRy soit une assertion vraie forme un "graphe" ou une 
"représentation" de la relation R. Nous pouvons représenter ces couples dans un repère adéquatement 
choisi pour faire une représentation graphique de la relation R. 


Il s'agit d'un type de relations sur lequel nous reviendrons dans le chapitre d'Analyse Fonctionnelle et 
qui ne nous intéresse pas directement dans ce chapitre. 


D2. Considérons un ensemble A non vide, si nous associons à cet ensemble (et à celui-ci uniquement!) 
des outils permettant de comparer les éléments le composant alors nous parlons de "relation binaire" ou 
"relation de comparaison" et qui s'écrit pour tout élément x et y composant A: 


XRy 


Ces relations peuvent aussi être représentées sous forme graphique. Dans le cas des opérateurs binaires 
classiques de comparaisons où À est l'ensemble des nombres naturels, relatifs, rationnels ou réels, cette 
forme graphique est ADS par une droite horizontale (le plus souvent...); dans le cas de la 
congruence (( | ) elle est représentée par des droites dans le plan dont 
les points sont donnés par la contrainte de la congruence. 


Comme nous l'avons déjà dit, il existe 6 relations binaires fondamentales (égal, différent de, plus grand 
que, plus petit que, plus grand ou égal, plus petit ou égal). Mais nous verrons un peu plus loin que la 
définition rigoureuse des relations binaires permet donc de construire des outils plus abstraits (comme 
par exemple la congruence bien connue par les élèves de petites classes et que nous étudierons dans le 
chapitre de Théorie des Nombres). 


1.1. ÉGALITÉS 


Il est fort difficile de définir la notion "d'égalité" dans un cas général applicable à toute situation. Pour 
notre part, nous nous permettrons pour cette définition de nous inspirer du théorème d'extensionalité de 
la théorie des ensembles (que nous verrons plus tard): 


Définitions: 


D1. Deux éléments sont égaux si, et seulement si, ils ont les mêmes valeurs. L'égalité est décrite par le 
symbole = qui signifie "égal à". 


Propriété (triviale): Si nous avons 4 = à, et c un nombre et * une opération quelconque (telle que 
l'addition, la soustraction, la multiplication ou la division) alors: 


axc=bxc 
Cette propriété est très utilisée pour résoudre ou simplifier des équations de type quelconque. 


D2. Si deux éléments ne sont pas égaux (donc sont inégaux...), nous les relions par le symbole # et 
nous disons qu'ils sont "non égaux". 


Il existe encore d'autres symboles d'égalités, qui sont une extension des deux que nous avons définis 
précédemment. Malheureusement, ils sont assez souvent mal utilisés (disons plutôt qu'ils sont utilisés 
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aux mauvais endroits) dans la plupart des ouvrages disponibles sur le marché: 


qui correspondent dans l'ordre à: presque égal (plutôt utilisé en ingénierie), asymptotiquement égal à 
(utilisé en analyse fonctionnelle), approximativement égal (utilisé en physique lors d'approximation de 
séries), identique à (utilisé aussi bien en analyse fonctionnelle qu'en physique), tend vers la limite 
(idem) et enfin proportionnel à (utilisé en physique ou en mathématiques financières). 


1.2. COMPARATEURS 


Les comparateurs sont des outils qui nous permettent de comparer et d'ordonner tout couple de 
nombres (et in extenso aussi des ensembles!). 


La possibilité d'ordonner des nombres est presque fondamentale en mathématique. Dans le cas 
contraire (s'il n'était pas possible ou non imposé d'ordonner), il y aurait des tas de choses qui 
choqueraient nos habitudes, par exemple (certains des concepts présentés dans la phrase qui suit n'ont 
pas encore été vus mais nous souhaitons quand même y faire référence): plus de fonctions monotones 
(en particulier de suites) et lié à cela la dérivation n'indiquerait donc rien sur un "sens de variation", 
plus d'approche de zéros d'un polynôme par dichotomie (algorithme classique de recherche dans un 
ensemble ordonné partagé en deux à chaque itération), en géométrie, plus de segments ni de 
demi-droites, plus de demi-espace, plus de convexité, nous ne pouvons plus orienter l'espace, etc. C'est 
donc important de pouvoir ordonner les choses comme vous l'aurez compris. 


Ainsi, pour tout &,b,c e IR nous écrivons lorsque a est plus grand ou égal à b: 


a >2b 
et lorsque a est plus petit ou égal à b: 


a <b 


Remarque: Il est utile de rappeler que l'ensemble des réels IR est un groupe totalement ordonné ( 

| ) ), sans quoi nous ne pourrions pas définir des relations d'ordre 
entre ses éétnents (ce qui n'est pas le cas des nombres complexes que nous ne pouvons pas 
ordonner!). 


Définition: Le symbole < est une "relation d'ordre" (voir la définition rigoureuse plus bas!) qui signifie 
"plus petit ou égal à "et inversement le symbole > est aussi une relation d'ordre qui signifie "plus grand 
ou égal à”. 


Nous avons également concernant la relation de comparaison stricte (qui n'appartient pas à la famille 
des relations d'ordre pour des raisons que nous préciserons plus loin) les propriétés suivantes qui sont 
relativement intuitives: 


a<betb<e 


implique (ultérieurement noté "—") que: 


Page: 122/4839 


[v3.0 - 2013] 


a <E (3.8) 
Si: 
a<betce?}0—a'c<b'e (G9) 
Si: 
a<b=æate< bte Ua<b=æa-c<b-c (610 
inversement: 


a)b=atec)b+etadb=a-cdb-e (311) 


Nous avons aussi: 


0O<a<b | (3.12) 
a 
et inversement: 
1,1 


b<a<0O—=-<— (3.13) 
a à 


Nous pouvons bien évidemment multiplier, diviser, additionner ou soustraire un terme de chaque côté 
de la relation telle que celle-ci soit toujours vraie. Petite remarque cependant, si vous multipliez les 
deux membres par un nombre négatif il faudra bien évidemment changer le comparateur tel que si: 

a <betc>0—a'c<b'e (3.14) 


et inversement: 
a <betc<0—a'c>b'e (3.15) 
Nous avons aussi: 
O<a<betpeR*—a*<b} (3.16) 
Soit: 
b<a<0etpelR* (317) 


Si p est un nombre entier pair alors: 


sinon si p est impair: 
ar »>b} (3.19) 


Ce résultat provient simplement de la multiplication des signes puisque la puissance lorsqu'elle est non 


fractionnaire n'est qu'une multiplication. 
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Finalement: 


O<a<betneN*=— a <%B (320) 


Les relations d'ordre : 


correspondent donc respectivement à: (strictement) plus grand que, (strictement) plus petit que, plus 
petit ou égal à, plus grand ou égal à, beaucoup plus grand que et enfin beaucoup plus petit que. 


Les relations d'ordre peuvent être définies de façon un peu plus subtile et rigoureuse et abstraite et ne 
s'appliquent pas seulement aux comparateurs (voir par exemple la relation de congruence dans le 
chapitre de Théorie Des Nombres)! 


Voyons cela de suite (le vocabulaire qui va suivre est aussi défini dans le chapitre de Théorie Des 
Ensembles): 


Définition: Soit une relation binaire R d'un ensemble À vers lui-même, une relation R dans À est un 
sous-ensemble du produit cartésien À c AxXA (c'est-à-dire que la relation binaire engendre un 
sous-ensemble de par les contraintes qu'elle impose aux éléments de À qui satisfont la relation) avec la 
propriété d'être: 


P1. Une "relation réflexive" si Yxe À: 


P2. Une "relation symétrique" si Ÿx, y € À: 
xRy = yRx (323) 

P3. Une "relation antisymétrique" si Ÿx, y € À: 

(xRy ety Rx) = x=}y (3.24) 
P4. Une "relation transitive" si YXx, y,z € À: 

(xRyeiyRz) = xRzZ (325) 
PS5. Une "relation connexe" si Ÿx,y € À: 

V(x re A (xkRyouyRx) (3.26) 


Les mathématiciens ont donné des noms particuliers aux familles de relations satisfaisant certaines de 
ces propriétés. 


Définitions: 


D1. Une relation est appelée "relation d'ordre stricte" si et seulement si elle est uniquement transitive 
(certains spécifient alors qu'elle est donc forcément antiréflexive mais on s'en doute..). 
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D2. Une relation est appelée un "pré-ordre" si et seulement si elle est réflexive et transitive. 


D3. Une relation est appelée "une relation d'équivalence" si et seulement si elle est réflexive, 
symétrique et transitive. 


D4. Une relation est appelée "relation d'ordre" si et seulement si elle est réflexive, transitive et 
antisymétrique. 


D5. Une relation est appelée "relation d'ordre total" si et seulement si elle est réflexive, transitive, 
connexe et antisymétrique. 


Pour les autres combinaisons il semblerait (?) qu'il n'y ait pas de désignations particulières chez les 
mathématiciens. 


Remarque: Les relations d'ordre binaire ont toutes des propriétés similaires dans les ensembles 
naturels, rationnels, relatifs et réels (il n'y a pas de relation d'ordre naturelle sur l'ensemble des 
nombres complexes). 


Si nous résumons: 


Relation binaire = “ > < £ 2 

réflexive oui non non non oui oui 

symétrique oui oui non non non non 

transitive oui non oui oui oui oui 

connexe non non non non oui oui 

antisymétrique oui non non non oui oui 
Tableau: 3.1 - Types de relations binaires 


Ainsi, nous voyons que les relations binaires £, 2 forment avec les ensembles précités, des relations 
d'ordre total et qu'il est très facile de voir quelles relations binaires sont des relations d'ordre partiel, 
total ou d'équivalence. 


Définition: Si R est une relation d'équivalence sur À. Pour Yxe À, la "classe d'équivalence" de x est 
par définition l'ensemble: 


[x] = {ve À:xky}| (3:27) 


[x] est donc un sous-ensemble de A ([ x] & À ) que nous noterons aussi. par la suite R (attention donc à 
ne pas confondre dans ce qui suit la relation d'équivalence et le sous-ensemble..). 


Nous disposons ainsi d'un nouvel ensemble qui est "l'ensemble des classes d'équivalences" ou 
"ensemble quotient" noté A/R. Ainsi: 


AIR={[x]|x€ 4} (328) 


Il faut savoir que dans A/R nous ne regardons plus [x] comme un sous-ensemble de À mais comme un 


élément! 
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Une relation d'équivalence, de manière vulgarisée sert donc à coller une seule étiquette à des éléments 
qui vérifient une même propriété, et à les confondre avec ladite étiquette (en sachant ce que nous 
faisons avec cette étiquette). 


Exemple: 


Dans l'ensemble des entiers relatifs Z , si nous étudions les restes de la division par 2, nous avons que 
ceux-ci valent toujours soit 0 soit 1. 


La classe d'équivalence de zéro est alors appelée l'ensemble des nombres entiers pairs, la classe 
d'équivalence de 1 est appelée l'ensemble des entiers impairs. Nous avons donc deux classes 
d'équivalences pour deux partitions de Z (gardez toujours cet exemple simple en tête pour les éléments 
théoriques qui suivront cela aide énormément). 


Si nous nommons la première 0 et la deuxième 1, nous retrouvons les règles d'opérations entre nombres 
pairs et impairs: 


0+0=0 0+1=1 1+1=0 


ce qui signifie respectivement que la somme de deux entiers pairs est paire, que la somme d'un pair et 
d'un impair est impaire et que la somme de deux impairs est paire. 


Et pour la multiplication : 
0-0=0 0-1=0 1.1=1 


ce qui signifie respectivement que le produit de deux pairs est pair, le produit d'un pair et d'un impair est 
pair et que le produit de deux impairs est impair. 


Et hop, nous avons déplacé les opérations de ZÆ sur cet ensemble quotient noté 7 / 27. 


Maintenant, pour vérifier que nous avons bien affaire à une relation d'équivalence, il faudrait encore 
vérifier qu'elle est réflexive (xRx), symétrique (si xRy alors yRx) et transitive (si xRy et yRz alors xRZz). 
Nous verrons comment vérifier cela quelques paragraphes plus loin car cet exemple constitue un cas 
très particulier de relation de congruence. 


Définition: L'application x : 4 — A/R définie par x+ [x] est appelée "projection canonique". Tout 
élément ze[ x] est alors appelé "représentant de la classe" [x]. 


Considérons maintenant un ensemble E. Alors nous proposons de démontrer qu'il y a bijection entre 
l'ensemble des relations d'équivalence sur E et l'ensemble des partitions de E. En d'autres termes cette 
proposition dit qu'une relation d'équivalence sur E n'est rien d'autre qu'une partition de E. 


Démonstration: 


Soit R une relation d'équivalence sur E. Nous choisissons 7:= Æ / R comme ensemble d'indexation des 
partitions et nous posons pour tout [x]e EfR, Æ,,:=[x]. 


Il suffit de vérifier les deux propriétés suivantes de la définition des partitions pour montrer que la 
famille (Æ,,, |, est une partition de E: 
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P1. Soient [x].[y]e £ŸRÀ tels que [x] “ [y] alors (trivial) Æ,n&;,, = G. 


p2 £= U Æ 


+ est évident car si xeÆ alors xe[x]= £,;. 
[x]er 2 


OIC.Q.F.D. 


Encore une fois, il est aisé de vérifier avec l'exemple pratique de la division par 2 donné plus haut que 
la partition des nombres pairs et impairs satisfait ces deux propriétés. 


Nous avons donc associé à la relation d'équivalence R une partition de E. Réciproquement si | Æ; 1, est 


une partition de E alors nous vérifions facilement que la relation R définie par xRy si et seulement s'il 
existe j e { tel que x,ye £, est une relation d'équivalence! Les deux applications ainsi définies sont 


bijectives et réciproques l'une de l'autre. 
Exemple: 


Nous allons à présent appliquer sur un exemple un peu moins trivial que le précédent ce que nous 
venons de voir à la construction des anneaux #/47, après quelques rappels (pour le concept d'anneau 
voir le chapitre de Théorie Des Ensembles). 


Rappels: 


R1. Soit deux nombres #,#€ Æ£. Nous disons que "n divise m" et nous écrivons #|## si et seulement si 
il existe un entier £ e& tel que # =k.n (cf. chapitre de Théorie Des Nombres), 


R2. Soit 4 > 1 un entier. Nous définissons la relation R par nRm si et seulement si 4 |(#-#2) ou dit 
autrement nRm si et seulement si il existe k £ 7 tel que »# = »# + k . à . Généralement nous écrivons ceci 
aussi # = *# (modulo d) au lieu de xRm et nous disons que "n est congru à m modulo d". Rappelons 
aussi que # = 0 (modulo d) si et seulement si d divise n (cf. chapitre de Théorie Des Nombres). 


Nous allons maintenant introduire une relation d'équivalence sur 7, . Démontrons que pour tout entier 
& > 1, la congruence modulo d est une relation d'équivalence sur 7%, (nous avons déjà démontré cela 
dans le chapitre de théorie des nombres lors de notre étude de la congruence maïs refaisons le travail 
pour le plaisir). 


Démonstration (contrôle des trois propriétés de l'équivalence): 
P1. Réflexivité: # = # car n=#+0.4. 
P2. Symétrie: Si # =» alors » = »# + kd et donc # =#+(-Kid c'est-à-dire »# = x. 


P3. Transitivité: Si # =» et »# = j alors » = »+ + ka et mm = j +k'4 donc x = j+(&+Æk')'d c'est-à-dire 


m= j. 
OIC.Q.FD. 


Dans la situation ci-dessus, nous notons ÆZ/4Æ l'ensemble des classes d'équivalence et noterons [x], la 
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[al ={..,n-2d,n-d,nn+td,n+2d,n+t3d,.}) (331 


(chaque différence de deux valeurs se trouvant dans les accolades est divisible par d et c'est bien ainsi 
une classe d'équivalence) et ainsi: 


ZidZ ={[01,,[1L12L....[é -1L} (32 
En particulier (trivial car nous obtenons ainsi tout Æ ): 
Z!2Æ={[01L [1L) (33 


Ainsi, nous voyons que le premier exemple que nous avions donné avec les nombres pairs et impairs est 
un cas particulièrement simple des classes d'équivalence de congruence modulo 2 car elles se réduisent 
toutes à seulement deux classes. 


Remarque: Les opérations d'addition et de multiplication définies sur #, définissent des opérations 
d'addition et de multiplication sur #{ 47. Nous disons alors que ces opérations sont compatibles 
avec la relation d'équivalence et forment alors un anneau (cf. chapitre de Théorie Ensembles). 


2. LOIS FONDAMENTALES DE L'ARITHMÉTIQUE 


Comme nous l'avons déjà dit précédemment, il existe un opérateur de base (addition) à partir duquel il 
possible de définir la multiplication, la soustraction (à condition que l'ensemble de nombres soit ad hoc) 
et la division (même remarque que pour la soustraction) et autour desquels nous pouvons construire 
toute la mathématique analytique. 


Bien évidemment il y a certaines subtilités à prendre en compte lorsque le niveau de rigueur augmente. 
Le lecteur peut alors se reporter au chapitre de Théorie Des Ensembles où ses lois fondamentales sont 
redéfinies avec plus de justesse. 
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2.1. ADDITION 


Définition: L'addition de nombres entiers est une opération notée "+" qui a pour seul but de réunir en 
un seul nombre toutes les unités contenues dans plusieurs autres. Le résultat de l'opération se nomme 
"somme" ou "total". Les nombres à additionner sont appelés "termes de l'addition". 


Remarque: Les signes d'addition "+" et de soustraction "-" sont dus à Widmann (1489). 


Ainsi, A+B+C... sont les termes de l'addition et le résultat est la somme des termes de l'addition. 


Voici une liste de quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération 
de l'addition: 


P1. La somme de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors que 
l'addition est une "opération commutative". Ce qui signifie que nous avons quand A est différent de B: 


A-B+B-A 


P2. La somme de plusieurs nombres ne change pas si nous remplaçons deux ou plusieurs d'entre eux 
par leur résultat intermédiaire. Nous disons alors que l'addition est "opération associative". 


P3. Le zéro est l'élément neutre de l'addition car tout nombre additionné à zéro donne ce même 
nombre. 


P4. Suivant l'ensemble dans lequel nous travaillons, l'addition peut comporter un terme de telle façon à 
ce que le total soit nul. Nous disons alors qu'il existe un "opposé" pour l'addition. 


Nous allons définir plus rigoureusement l'addition en utilisant l'axiomatique de Peano dans le cas 
particulier de l'ensemble des nombres entiers naturels comme nous en avons déjà fait mention dans le 
chapitre traitant des Nombres. Ainsi, avec ces axiomes il est possible de démontrer qu'il existe 
(existence) une et une seule application (unicité), notée "+", de NxXN dans N vérifiant: 


VreNAx2+0=-}x 
VaeN,s(x)=n+1 
VreN,VgeN,p +s(g) = s{p +a) 


où s signifie: "successeur". 


Remarque: Ce site n'ayant pas pour vocation de s'adresser à des mathématiciens, nous nous 
passerons de la démonstration (relativement longue) et admettrons intuitivement que l'application 
"+" existe et est unique. et qu'il en découle les propriétés susmentionnées. 


Soient x,%,,...,x, des nombres quelconques alors nous pouvons noter également la somme ainsi: 


* 
At tt. +Ax, = > (3.34) 


il 
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en définissant des bornes supérieure et inférieure à la somme indexée (au-dessus et en-dessous de la 
lettre grecque majuscule "sigma"). 


Voici quelques rappels des propriétés relatives à cette notation condensée: 


où k est une constante et: 


dE = x" (3.36) 


il 
x # # 

> (x +y;)= > x + y, (3.37) 

il il il 

Voyons maintenant quelques cas concrets d'additions de différents nombres simples afin de mettre en 
pratique les bases. 


Exemples: 


L'addition de deux nombres relativement petits est assez facile dès que nous avons appris par coeur à 
compter jusqu'au nombre résultant de cette opération. Ainsi (exemples pris sur la base décimale): 


5 10 1014 
2, + 3, + 3 (3.38) 
= 4% = 13 = 1017 


Pour les plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par coeur. Ainsi 
par exemple: 


9244 
+ 3475 (3.39) 
=? 


Démarche: nous additionnons les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la 
première colonne nous avons donc 4+5=9 ce qui nous donne: 


9244 
+ 3475 (3.40) 


et nous continuons ainsi pour la deuxième 4+7=11 mais à la différence que comme nous avons un 
nombre supérieur à la dizaine, nous reportons le premier chiffre (de gauche) sur la colonne suivante de 
l'addition. Ainsi: 


92!44 
+ 3475 (341) 
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La troisième colonne se calcule dès lors comme 4+2+1=7 ce qui nous donne: 


Pour la dernière colonne nous avons 9+5=14 et à nouveau nous reportons le premier chiffre (de 
gauche) sur la colonne suivante de l'addition. Aïnsi: 


192l44 
+ 5475 (3.43) 
4719 


et la dernière colonne donne: 


l92l44 
5475 (3.44) 
14719 


+ 


Voilà comment nous procédons donc pour l'addition de nombres quelconques: nous faisons une addition 
par colonne de droite à gauche et si le résultat d'une addition est supérieur à la dizaine, nous reportons 
une unité sur la colonne suivante. 


Cette méthodologie d'addition est simple à comprendre et à effectuer. Nous ne étendrons pas plus sur le 
sujet pour l'instant. 


2.2. SOUSTRACTION 


Définition: La soustraction du nombre entier À par le nombre entier B notée par le symbole 
trouver le nombre C qui, ajouté à B, redonne A. 


, c'est 


Remarque: L'opération n'est rigoureusement parlant pas possible dans les entiers naturels N que si 
A>B. 


Nous écrivons la soustraction sous la forme: 

A-B=C (345) 
qui doit vérifier: 

A=C+8B (3.46) 


Voici quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de 
soustraction (bon cela découle de l'addition.…): 


P1. La soustraction de plusieurs nombres dépend de l'ordre des termes. Nous disons alors que la 
soustraction est une "opération non-commutative". Effectivement: 
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5-2#2-5 (347) 


P2. La soustraction de plusieurs nombres change si nous remplaçons deux ou plusieurs d'entre eux par 
leur résultat intermédiaire. Nous disons alors que la soustraction est une "opération non-associative". 
Effectivement: 


5-(3-2)#(5-7D-2 (349) 


P3. Le zéro n'est pas l'élément neutre de la soustraction. Effectivement, tout nombre à qui nous 
soustrayons zéro donne ce même nombre, donc le zéro est neutre à droite. mais pas à gauche car tout 
nombre que nous soustrayons à zéro ne donne pas zéro! 


P4. Suivant l'ensemble dans lequel nous travaillons, la soustraction peut comporter un terme de telle 
façon à ce que le total soit nul. Nous disons alors qu'il existe un "opposé" pour la soustraction. 


Exemples: 


La soustraction de deux nombres relativement petits est assez facile dès que nous avons appris par 
coeur à compter jusqu'à au moins le nombre résultant de cette opération. Aïnsi: 


5 10 1014 
2, =, 5, — 3 (3.49) 


= 3 = 1011 


Pour les plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par coeur (au 
même titre que l'addition). Ainsi par exemple: 


4574 
- 3485 (3.50) 
=? 


nous soustrayons les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la première 
colonne nous avons 4 - 5 = -1 < Ü ce qui fait que nous reportons -1 sur la colonne suivante (deuxième) 
et écrivons 10 -1=9 en bas de la barre d'égalité de la première colonne: 


et nous continuons ainsi pour la deuxième 7 - 8 = -1 < 0 ce qui fait que nous reportons -1 sur la 
colonne suivante (troisième) et comme —]1-1=-2 nous reportons 10 - 2 =8 en bas de la barre 
d'égalité de la deuxième colonne: 


La troisième colonne se calcule dès lors comme 5 -7 = -2 < 0 et nous reportons -1 sur la colonne 
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suivante (quatrième) et comme -1-2=-3 nous reportons 10 -3 = 7 en bas de la barre d'égalité de 
la troisième colonne: 


Pour la dernière colonne nous avons 4 - 3 = 1 > Q nous reportons donc rien sur la colonne suivante et 
comme 1-1=0 nous reportons 0 en bas de la barre d'égalité de la quatrième colonne: 
1-11 
4574 
= 3185 (C9 
= 0789 


Voilà comment nous procédons donc pour la soustraction de nombres quelconques. Nous faisons une 
soustraction par colonne de droite à gauche et si le résultat d'une soustraction est inférieur à zéro nous 
faisons reporter -1 sur la colonne suivante et l'addition du dernier report sur la soustraction obtenue en 
bas de la barre d'égalité. 


La méthodologie utilisée pour la soustraction se basant sur exactement le même principe que l'addition 
nous ne nous étendrons pas plus sur le sujet. Cette méthode est très simple et nécessite bien sûr une 
certaine habitude à travailler avec les chiffres pour être totalement appréhendée. 


2.3. MULTIPLICATION 


Définition: La multiplication de nombres est une opération qui a pour but, étant donné deux nombres, 
l'un appelé "multiplicateur" m, et l'autre "multiplicande" M, d'en trouver un troisième appelé "produit" 
P qui soit la somme (donc la multiplication d'écoule de la somme!) d'autant de nombres égaux au 
multiplicande qu'il y a d'unités au multiplicateur: 


ttc] 
mxM=S M=2P (355) 
— 
=] 
Le multiplicande et le multiplicateur sont appelés les "facteurs du produit". 


La multiplication s'indique à l'aide du signe "*" (anciennement) ou du point de ponctuation 
surélevé (notation moderne) ou sans aucun symbole tel que: 


a*b=a'b=ab) (356) 


Remarque: Le signe de croix "*X" pour la multiplication se trouverait pour la première fois dans 
l'ouvrage d'Oughtred (1631) quant au point à mi-hauteur (notation moderne pour la multiplication), 
nous le devrions à Leibniz. Dès 1544, Stiefel, dans un de ses ouvrages n'employait aucun signe et 
désignaïit le produit de deux nombres en les plaçant l'un après l'autre. 


Nous pouvons définir la multiplication en utilisant l'axiomatique de Peano dans le cas particulier des 
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nombres entiers naturels comme nous en avons déjà fait mention dans le chapitre traitant des Nombres. 
Ainsi, avec ces axiomes il est possible de démontrer qu'il existe (existence) une et une seule application 
(unicité), notée "*X"' ou plus souvent ".", de NxXN dans N vérifiant: 


VreNA#.0=0 
VpeN,VgeN,p (g+D=pg+p 


Remarque: Ce site n'ayant pas pour vocation de s'adresser à des mathématiciens, nous nous 
passerons de la démonstration (relativement longue) et admettrons intuitivement que l'application " 
x "existe et est unique... 


La puissance est une notation particulière d'un cas précis de multiplications. Lorsque le(s) 
multiplicateur(s) et multiplicande(s) sont identique(s) en valeur numérique, nous notons la 
multiplication (par exemple): 


8 
R'R'R'RH'R'R HR TA 


c'est ce que nous nommons la "notation en puissance" ou "l'exponentiation". Le nombre en exposant 
est ce que nous nommons la "puissance" ou "l'exposant" du nombre (n en l'occurrence). La notation en 
exposants se trouve pour la première fois dans l'ouvrage de Chuquet intitulé "Triparty en la science des 
nombres" (1484). 


Vous pouvez vérifier par vous-même que ses propriétés sont les suivantes (par exemple): 


Voici quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de 
multiplication: 


P1. La multiplication de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors que 
la multiplication est une "opération commutative". 


P2. La multiplication de plusieurs nombres ne change pas si nous remplaçons deux ou plusieurs d'entre 
eux par leur résultat intermédiaire. Nous disons alors que la multiplication est "opération associative". 


P3. L'unité est l'élément neutre de la multiplication car tout multiplicande multiplié par le multiplicateur 
1 est égal au multiplicande. 


P4. La multiplication peut comporter un terme de telle façon à ce que le produit soit égal à l'unité 
(l'élément neutre). Nous disons alors qu'il existe un "inverse pour la multiplication" (mais cela dépend 
rigoureusement dans quel ensemble de nombres nous travaillons). 


PS5. La multiplication est "distributive", c'est-à-dire que: 
a'(b+e) =ab+ac 
l'opération inverse s'appelant la "factorisation". 


Introduisons encore quelques notations particulières relatives à la multiplication: 
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1. Soient x,,x,,...,x, des nombres quelconques (non nécessairement égaux) alors nous pouvons noter le 


produit ainsi: 


ñn 
4-0 = 11%, 660 
+ 


en définissant des bornes supérieure et inférieure au produit indexé (au-dessus et en-dessous de la lettre 
grecque majuscule "Pi"). 


Rappel des propriétés relatives à cette notation: 


pour tout nombre k tel que: 


Nous avons aussi par exemple: 


[ [tx +y)=(x +») (369 


2. Nous définissons également la "factorielle" simplement (car il existe aussi une manière complexe de 
la définir en passant par la fonction Gamma d'Euler comme cela est fait dans le chapitre de Calcul 
Différentiel Et Intégral) par: 


1.2:3.4....#=21l) (3.65) 


Exemples: 


Voyons quelques exemples simples de multiplications élémentaires. La multiplication de deux nombres 
relativement petits est assez facile dès que nous avons appris par coeur à compter jusqu'à au moins le 
nombre résultant de cette opération. Ainsi: 


à 10 1014 
X 2 Lo X 3 ,X 3 (3.66) 
= 10 = 30 = 3042 


Pour les beaucoup plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par 
coeur. Ainsi par exemple: 


4574 
x 8 (3.67) 


nous multiplions colonne par colonne et nous additionnons l'ensemble des résultats décalés d'un chiffre 


comme ci-dessous (8x4=32, 8x7=56, 8x5=40, 8x4=32) ainsi nous obtenons: 
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32 
36592 


Cette méthodologie est très logique si vous avez bien compris comment nous construisons un chiffre en 
base dix. Ainsi, nous avons (nous supposerons pour l'instant la distributivité comme connue): 


8:4574 = 8: (4000 + 500 +70 +4) = 8:(4:10° +5:10° +7:10+4:10°) 
= (8 4:10)+(8:510?)+8-(7:10)+(8-4:10°) (3-69) 
= 32'000 + 4'000 + 560 + 32 = 36592 


Pour ne pas surcharger l'écriture dans la multiplication par la méthode "verticale", nous ne représentons 
pas les zéros qui surchargeraient inutilement les calculs (et ce d'autant plus si le multiplicateur et/ou le 
multiplicande sont de très grands nombres). 


2.4. DIVISION 


Définition: La division de nombres entiers (pour commencer par le cas le plus simple...) est une 
opération, qui a pour but, étant donné deux nombres entiers, l'un appelé "dividende", l'autre appelé 
"diviseur", d'en trouver un troisième appelé "quotient" qui soit le plus grand nombre dont le produit par 
le diviseur puisse se retrancher (donc la division découle de la soustraction!) du dividende (la différence 


étant nommée le "reste" ou la "congruence"). 


Remarque: Dans les cas des nombre réels il n'y a jamais de reste à la fin de l'opération de division 
(car le quotient multiplié par le diviseur donne exactement le dividende)! 


D'une façon générale dans le cadre des nombres entiers, si nous notons D le dividende, d le diviseur, Q 
le quotient et R le reste nous avons la relation: 


D=Q0'4+%k| (370) 


en sachant que la division était initialement notée de la manière suivante: 


Nous désignons également souvent par "fraction" (au lieu de "quotient"), le rapport de deux nombres 
ou autrement dit, la division du premier par le deuxième. 


Remarque: Le signe de la division ":" est dû à Leïbniz. La barre de fraction se trouve elle pour la 
première fois dans les ouvrages de Fibonacci (1202) et elle est probablement due aux Hindous. 
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Si nous divisons deux nombres entiers et que nous souhaitons un entier comme quotient et comme reste 
(s'il y en a un...), alors nous parlons de "division euclidienne". 


Nous indiquons l'opération en plaçant entre les deux nombres, le dividende et le diviseur un ": " ou une 
barre de division " /". 


Si nous avons: 


nous appelons ë, l'inverse du dividende. A tout nombre est associé un inverse qui satisfait cette 
condition. 


De cette définition il vient la notation (avec x étant un nombre quelconque différent de zéro): 


Dans le cas de deux nombres fractionnaires, nous disons qu'ils sont "inverses" ou "réciproques", lorsque 
leur produit est égal à l'unité (comme la relation précédente) pour toute valeur de x, positive ou 
négative. 


Remarques: 


R1. Une division par zéro est ce que nous nommons une "singularité". C'est-à-dire que le résultat de 
la division est indéterminé. 


R2. Lorsque nous multiplions le dividende et le diviseur d'une division (fraction) par un même 
nombre, le quotient ne change pas (il s'agit d'une fraction équivalente), mais le reste est multiplié 
par ce nombre. 


R3. Diviser un nombre par un produit effectué de plusieurs facteurs revient à diviser ce nombre 
successivement par chacun des facteurs du produit et réciproquement. 


Les propriétés des divisions avec les notations condensées de puissances (exponentiation) sont les 
suivantes (nous laisserons le soin au lecteur de le vérifier avec des valeurs numériques): 


X'ZX'X _ 
——=x "y? (374 
Y'y 


ou: 


X ZX E Æ __—— 
mt xml lx=xex rt mp m = X (3.75) 
X ZX 


Rappelons qu'un nombre premier (entier relatif) est un nombre qui n'a d'autres diviseurs que lui-même 
et l'unité (rappelons que 1 n'est pas un nombre premier). Donc tout nombre qui n'est pas premier a au 
moins un nombre premier comme diviseur (excepté 1 par définition!). Le plus petit des diviseurs d'un 
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nombre entier est donc un nombre premier (nous détaillerons les propriétés des nombres premiers 
relativement au sujet de la division dans le chapitre de Théorie des Nombres). 


Voyons quelques propriétés de la division (certaines nous sont déjà connues car elles découlent d'un 
raisonnement logique des propriétés de la multiplication): 


+ 


| 


Cr 
R. 
Cr 
G 
Le 


où la deuxième ligne est ce que nous appelons une "amplification des termes" et la cinquième ligne une 
"mise au dénominateur commun". 


Nous avons aussi les propriétés suivantes: 


P1. La division de plusieurs nombres dépend de l'ordre des termes. Nous disons alors que la division est 
une "opération non-commutative". Ce qui signifie que nous avons quand À est différent de B: 


P2. Le résultat de la division de plusieurs nombres change si nous remplaçons deux ou plusieurs d'entre 
eux par leur résultat intermédiaire. Nous disons alors que la division est "opération non-associative": 


P3. L'unité est l'élément neutre à droite de la division car tout dividende divisé par le diviseur 1 est égal 
au dividende mais l'unité n'est par contre pas neutre à gauche. 


P4. La division peut comporter un terme de telle façon à ce que la division soit égale à l'unité (l'élément 
neutre). Nous disons alors qu'il existe un "symétrique pour la division". 


Si a et b sont deux nombres réels positifs et non nuls nous avons: 
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Fr 
a L 1 - 
a° af 


x } 
ab =(a by æT_=|2T (360) 
Bb? b 


Nous pouvons maintenant définir la racine q-ième principale d'un nombre quelconque a: 


1 


aî =} (3.81) 


la dernière relation n'étant définie que pour 4 € N *. Au niveau de la terminologie, nous avons: 


qui est une racine, le nombre a est le "radicande" et q est l'indice de la racine. Le symbole “3 est 


appelé le "radical". 


De ce qui a déjà été dit pour les puissances, nous pouvons conclure aisément que: 


et: 


il en ressort que: 


& 
|‘ 
Il 
1 
re] 
L'1 
Il 
ne 
ES 
LL, 
L'1 
[ae] 
+ 
L'1 
C1 
ES 
Il 
# 
Ÿ 
me 
© 
U 


Nous avons également si 4 < 0: 


sige N* est impair et: 


sige N* est pair. 


Sia<0etgeN* est impair, alors: 


est le nombre réel négatif b tel que: 
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b1 = (3.89) 


Si 4 € N *est pair alors bien sûr, comme nous l'avons déjà vu, la racine est complexe (cf. chapitre sur 
les Nombres). 


Si le dénominateur d'un quotient contient un facteur de la forme * La avec 4 # 0, en multipliant le 


numérateur et le dénominateur par * [+ , Nous supprimerons la racine au dénominateur, puisque: 


RE RE RE RE RE 


Zu 


Nous appelons communément ce procédé "rendre un dénominateur rationnel". Nous pouvons bien sûr 
faire de même avec le numérateur. 


Exemple: 


Voyons un exemple mondialement connu de l'application de la racine qui concerne l'origine des formats 
papier A6, A5, A4, A3, A2, AT, AO etc. 


Ce format a au fait la propriété (c'est un objectif à l'origine) de conserver ses proportions lorsque nous 
plions ou coupons la feuille en deux dans sa grande dimension. Ainsi, si nous appelons L la longueur et 1 
la largeur de la feuille, nous avons: 


2e ts fi=0) 
Î É (3.91) 
2 
Il en ressort que: 
L=dJai 65 


Comme le format A0 à par définition une superficie de 1 [| . Pour ce format nous avons alors: 


Nous en déduisons donc: 


pie 


—=1{r2 (3.94) 
Fri 
et donc: 

1= 2791 [me] 84.1 [om] (2.95) 


d'où nous tirons aussi: 


La 241 [w]=118.9 [om] (3.96) 
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Les autres formats de déduisant donc pour rappel en divisant par deux la feuille dans sa grande 
dimension. 


3. POLYNÔMES ARITHMÉTIQUES 


Définition: Un "polynôme arithmétique" (à ne pas confondre avec les polynômes algébriques qui 
seront étudiés dans la section d'Algèbre) est un ensemble de nombres séparés les uns des autres par les 
opérations d'addition ou de soustraction (+ ou -). 


Les composants enfermés dans le polynôme sont appelés "termes" du polynôme. Lorsque le polynôme 
contient un unique terme, nous parlons alors de "monôme", s'il y a deux termes nous parlons de 
"binôme", et ainsi de suite. 


La valeur d'un polynôme arithmétique est égale à l'excès de la somme des termes précédés du signe + 
sur la somme des termes précédés du signe -. 


Démonstration: 
#14 +3 — a hs — Mg + + = Hit + +... +8, HT Ho +6 +... +2) 
(3.97) 
quelles que soit les valeurs des termes. 


OIC.Q.F.D. 


Mettre en évidence l'unité négative -1 est ce que nous appelons une "factorisation" ou "mise en 
facteurs". L'opération inverse, s'appelant une "distribution" ou "développement". 


Le produit de plusieurs polynômes peut toujours être remplacé par un polynôme unique que nous 
appelons le "produit effectué". Nous opérons habituellement comme suit: nous multiplions 
successivement tous les termes du premier polynôme, en commençant par la gauche, par le premier, le 
second, …, le dernier terme du second polynôme. Nous obtenons ainsi un premier produit partiel. Nous 
faisons, s'il y a lieu, la réduction des termes semblables. Nous multiplions ensuite chacun des termes du 
produit partiel successivement par le premier, le second, …., le dernier terme du troisième polynôme en 
commençant par la gauche et ainsi de suite. 


Le produit des polynômes A,B,C, .L, … est la somme de tous les produits de n facteurs formés avec un 
terme de À, un terme de B, …, et un terme de L. S'il n'y a aucune réduction, le nombre de termes du 
produit est alors égal au produit des nombres de termes des facteurs. 


4. VALEUR ABSOLUE 

Un nombre réel est constitué de deux parties: un signe + ou - et une valeur absolue. 
® Exemples: 

E1. +7 est constitué du signe + et de la valeur absolue 7 


E2. -5 est constitué du signe - et de la valeur absolue 5 
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La valeur absolue de +7 est donc 7, la valeur absolue de -5 est donc 5. 


Définition: Pour tout nombre réel x, la "valeur absolue" de x, notée [x est donnée par: 


[= xsix>0 


[x] = x si x <0| (3.98) 


[x = 0 si x=0 


Nous remarquons que: 
[xl =max(—x,x) (3.99) 


Ainsi que les expressions équivalentes: 
et: 


et encore: 


xl£ye-y<x<y 


(3.102) 
H>yéx<-yVx2y 
ces dernières étant souvent utilisées dans le cadre de la résolution des inéquations. 


Indiquons qu'il est aussi utile d'interpréter l'expression x yl comme la distance entre les deux 


nombres x et y sur la droite réelle. Aïnsi, en munissant l'ensemble des nombres réels de la distance 
valeur absolue, il devient un espace métrique. 


La résolution d'une inéquation telle que [x 3 <3 se résout alors simplement à l'aide de la notion de 


distance. La solution est l'ensemble des réels dont la distance au réel 3 est inférieure ou égale à 9. C'est 
l'intervalle de centre 3 et de rayon 9 ou autrement écrit: 


[3—-9,3+9]=[-6,12] (3.103) 
La valeur absolue a quelques propriétés triviales que nous énoncerons sans démonstrations: 


P1. La valeur absolue de la somme algébrique de plusieurs nombres réels est inférieure ou égale à la 
somme des valeurs absolues des composantes de la somme: 


k+>1<lx+lyl 6109 
ce que les mathématiciens appellent parfois la "première inégalité triangulaire". 


P2. La valeur absolue de la différence est supérieure ou égale à la valeur absolue de la différence des 


valeurs absolues des composantes de la différence: 
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k-»|2|x-lv| (3.105) 
ce que les mathématiciens appellent parfois la "deuxième inégalité triangulaire". 
P3. La valeur absolue du produit (multiplication) est égale au produit des valeurs absolues: 
x-»l={xfl>l G.106) 


P4. La valeur absolue du rapport est égale au rapport des valeurs absolues: 


5. RÉGLES DE CALCUL 


Fréquemment en informatique (dans le développement en particulier), nous parlons de "priorité des 
opérateurs". En mathématiques nous parlons de "priorité des ensembles d'opérations et des règles des 
signes". De quoi s'agit-il exactement? 


Nous avons déjà vu quelles étaient les propriétés des opérations d'addition, soustraction, multiplication, 
mise en puissance et division. Nous tenons donc à ce que le lecteur différencie la notion de "propriété" 
de celle de "priorité" (que nous allons tout de suite voir) qui sont deux notions complètement 
différentes! 


En mathématiques, en particulier, nous définissons les priorités des symboles: {[( )]} 
Autrement dit: 
1. Les opérations qui sont entre parenthèses ( ) doivent être effectuées en premier dans le polynôme. 


2. Les opérations qui sont entre crochets [ ] doivent être effectuées en second à partir des résultats 
obtenus des opérations qui se trouvaient entre les parenthèses ( ). 


3. Finalement, à partir des résultats intermédiaires des opérations qui se trouvaient entre parenthèses ( ) 
et crochets [ ], nous calculons les opérations qui se situent entre les accolades { }. 


Faisons un exemple, ceci sera plus parlant. 
Exemple: 
Soit à calculer le polynôme: 
{[(5:@8+2)+3:[4+(8+6)'2]l (1+9)}:7+1 (3.108) 


Selon les règles que nous avons définies tout à l'heure, nous calculons d'abord tous les éléments qui sont 
entre parenthèses ( ), c'est-à-dire: 


(8+2)=10, (8+6)=14,(1+9)=10 (3.109) 


ce qui nous donne: 
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{[5°10+3-[4+14:2]] 10}: 7+1 (3.110) 


Toujours selon le règles que nous avons définies tout à l'heure, nous calculons maïntenant tous les 
éléments entre crochets en commençant toujours à calculer les termes qui sont dans les crochets [ ] au 
plus bas niveau des autres crochets [ |. Ainsi, nous commençons par calculer l'expression [4 +14 :2] qui 


se trouve dans le crochet de niveau supérieur: [5 : 10 + 3:.....]. 
Cela nous donne [4 +14:2]=32 et donc: 
{[(5:10+3°32] 10} 7+1 (3.111) 

Il nous reste à calculer maintenant [5:10 + 3:32] = 146 et donc: 

{146:10}'7+1 (3.112) 
Nous calculons maintenant l'unique terme entre accolades, ce qui nous donne: 

{146 10} =1460 (3.113) 
Finalement il nous reste: 

1460:7+1=10"221 (3.114) 

Evidemment il s'agit d'un cas particulier... Mais le principe est toujours le même. 
La priorité des opérateurs arithmétiques est une notion spécifique aux langages informatiques (comme 
nous en avons déjà fait mention) du fait qu'on ne peut dans ces derniers écrire des relations 
mathématiques que sur une ligne unique. 


Ainsi, en informatique l'expression: 


s'écrit (à peu de choses près): 
-a"(b+c) die" gg (3.116) 
Un non-initié pourrait y lire: 


avt 
ra @+c)] _g où Ca @+aT -g (3117 


| ä 
-a'(b+c) el 
ef ef g 


ou: 


bror -g (3.118) 


et encore quelques autres. ce qui vous en conviendrez, est fort dangereux car nous arriverons à des 


résultats différents à chaque fois (cas particuliers mis à part...) ! 
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Ainsi, il a logiquement été défini un ordre de priorité des opérandes tel que les opérations soient 
effectuées dans l'ordre suivant: 


1.- Négation 

2. | Puissance 

3. */ Multiplication et division 

4. \ division entière (spécifique à l'informatique) 

5. Mod Modulo (cf. chapitre de Théorie Des Nombres) 
6. + - Addition et soustraction 


Evidemment les règles des parenthèses ( ), crochets [ ], et accolades { } qui ont été définies en 
mathématiques s'appliquent à l'informatique. 


Ainsi, nous obtenons dans l'ordre (nous remplaçons chaque opération effectuée par un symbole): 
D'abord les termes entre parenthèses: 
-a*(b+c)" die" f-g=-a*a" die" f-g (3119) 
Ensuite les règles de priorité des opérateurs s'appliquent dans l'ordre défini précédemment: 
D'abord la négation (1): 
a” o'"die T-gep'añdie" 1-8 (6120) 
ensuite la puissance (2): 
taf dlefñf-g=6*7/6-g (3121 
nous appliquons la multiplication (3): 
BFrlô-g=Eelô-g (3.12) 

et finalement la division (3): 

ElÜ-g=#-g (3.123) 
Les règles (4) et (5) ne s'appliquent pas à cet exemple particulier. 
Finalement (6): 

ÿ-g=æ (3124) 


Ainsi, en suivant ces règles, ni l'ordinateur, ni l'être humain ne peuvent (ne devraient) se tromper lors de 
l'interprétation d'une équation écrite sur une ligne unique. 


En informatique, il existe cependant plusieurs opérateurs que nous ne retrouvons pas en mathématiques 
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et qui changent souvent de propriétés d'un langage informatique à un autre. Nous ne nous attarderons 
pas trop là-dessus cependant, nous avons mis ci-dessous un petit descriptif: 


L'opérateur de concaténation ” & " est évalué avant les opérateurs de comparaisons. 

Les opérateurs de comparaison (=, <, >, .…) possèdent tous une priorité identique. 

Cependant, les opérateurs les plus à gauche dans une expression, détiennent une priorité plus élevée. 
Les opérateurs logiques sont évalués dans l'ordre de priorité suivant: 

1. Not - 2. And - 3. Or - 4. Xor - 5. Eqv - 6. Imp 


Maintenant que nous avons vu les priorités des opérateurs, quelles sont les règles des signes en vigueur 
en mathématiques? 


D'abord, il faut savoir que ces dernières ne s'appliquent que dans le cas de la multiplication et de la 
division. Soient deux nombres positifs (+x},(+y). Nous avons: 


C+x): y) = (F2) (y) = +Cx' y) (125) 


Autrement dit, la multiplication de deux nombres positifs est un nombre positif et ceci est généralisable 
à la multiplication de n nombres positifs. 


Nous avons: 
D: = CN =-GY) G.129 


Autrement dit, la multiplication d'un nombre positif par un nombre négatif est négative. Ce qui est 
généralisable à un résultat positif de la multiplication s'il y a un nombre pair de nombres négatifs et à un 
résultat négatif pour un nombre impair de nombres négatifs sur la totalité n des nombres de la 
multiplication. 


Nous avons: 
CC = rie x rl. (6.127) 


Autrement dit, la multiplication de deux nombres négatifs est positive. Ce qui est généralisable à un 
résultat positif de la multiplication s'il y a un nombre pair de nombre négatifs et à un résultat négatif 
pour un nombre impair de nombres négatifs. 


Pour ce qui est des divisions, le raisonnement est identique: 
(+x)/(ty) = +(x/y) et (+y)/(+x) = +(y/ x) (3.128) 


Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division sera 
positif. 


Nous avons: 


Cz)/(y) = CaGy) = -G{y) et (y) 2) = (y) 2x) = -Ofx) (129) 
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Autrement dit, si soit le numérateur ou le dénominateur est négatif, alors le résultat de la division sera 
forcément négatif. 


Nous avons: 
C-x)/C-y) = +(x{y) et (-y){(-x) = +0y/x) (3.130) 


Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division, sera 
forcément positif. 


Evidemment, si nous avons une soustraction de termes, il est possible de la réécrire sous la forme: 


x=-py=xt+(-Dy=-l'(-x+y) (3131 
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Notes personnelles: 
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4. THÉORIE DES NOMBRES 


 … la théorie des nombres est une branche des mathématiques qui s'occupe des 


propriétés des nombres entiers, qu'ils soient entiers naturels ou entiers relatifs. Plus généralement, le 
champ d'étude de cette théorie concerne une large classe de problèmes qui proviennent naturellement 
de l'étude des entiers. La théorie des nombres peut être divisée en plusieurs branches d'étude (théorie 
algébrique des nombres, théorie calculatoire des nombres, etc.) en fonction des méthodes utilisées et 
des questions traitées. 


Remarque: Le terme "arithmétique" était aussi utilisé pour faire référence à la théorie des nombres 
mais c'est un terme assez ancien, qui n'est plus aussi populaire que par le passé. 


Nous avons choisi de ne présenter dans cet exposé que les sujets qui sont indispensables à l'étude de la 
mathématique et de la physique théorique ainsi que ceux devant faire absolument partie de la culture 
générale de l'ingénieur. 


1. PRINCIPE DU BON ORDRE 


Nous tiendrons pour acquit ce principe qui dit que tout ensemble non vide S CN contient un plus petit 
élément. 


Nous pouvons utiliser ce théorème pour démontrer une propriété importante des nombres appelée 
"propriété archimédienne" ou "axiome d'Archimède" qui s'énonce ainsi: 


Pour va,be N où a est non nul, il existe au moins un entier positif n tel que: 
n'a2b (41) 


En d'autres termes, pour deux grandeurs inégales, il existe toujours un multiple entier de la plus petite, 
supérieur à la plus grande. Nous appelons "archimédiennes" des structures dont les éléments vérifient 
une propriété comparable (cf. chapitre de Théorie Des Ensembles). 


Même si cela est trivial à comprendre faisons la démonstration car elle permet de voir le type de 
démarches utilisées par les mathématiciens quand ils doivent démontrer des éléments triviaux de ce 
genre. 


Démonstration: 
Supposons le contraire en disant que pour *}# € N nous avons: 
#'a< (42) 


Si nous démontrons que cela est absurde pour tout n alors nous aurons démontré la propriété 
archimédienne. 


Considérons alors l'ensemble: 
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S={b-x.alneN} (43) 


En utilisant le principe du bon ordre, nous en déduisons qu'il existe s, € S' tel que 5, £s pour tout 
se $. Posons donc que ce plus petit élément est: 


S “?-#04 (44) 
et nous avons donc aussi: 
b-(m+DaesS (45) 
Comme par hypothèse #:4 < à nous devons alors avoir: 
b-(Mm+Da2b-na (46) 
et si nous réarrangeons et simplifions: 
—(2n +D 2-20 (47) 
et que nous simplifions le signe négatif nous devions donc avoir...: 
#0 t1£<#% (48) 
d'où une contradiction évidente! 


Cette contradiction amène que l'hypothèse initiale comme quoi #:4 < & pour tout n alors est fausse et 
donc que la propriété archimédienne est démontrée par l'absurde. 


OIC.Q.FD. 
2. PRINCIPE D'INDUCTION 
Soit S un ensemble de nombres naturels qui possède les deux propriétés suivantes: 
Pl.ieS 
P2.SiteS,alors &+1eS 
Alors: 
S=N\{0}=N (49) 


Nous construisons ainsi l'ensemble des nombres naturels (se référer au chapitre de Théorie des 
Ensembles pour voir la construction rigoureuse de l'ensemble des nombres entiers avec les axiomes de 
Zermelo-Fraenkel). 


Soit maintenant: 


B=N'\S (410) 
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le symbole ”\" signifiant "excluant". Nous voulons démontrer que: 


B={@ (411) 


A nouveau, même si cela est trivial à comprendre faisons la démonstration car elle permet de voir le 
type de démarches utilisées par les mathématiciens quand ils doivent démontrer des éléments triviaux 
de ce genre. 


Démonstration: 
Supposons le contraire, c'est-à-dire: 
Bæ#% (412) 


Par le principe du bon ordre, puisque 8 & N, B doit posséder un plus petit élément que nous noterons 
b . 


Maïs puisque 1# $ de par (P1), nous avons que À > 1 et bien évidemment aussi que 14 2 , c'est- 
à-dire aussi à, -1e $'. En faisant appel à (P2), nous avons finalement que à, € #', c'est-à-dire que 
à, # 8, donc une contradiction. 


OIC.Q.F.D. 


Exemple: 


Nous souhaitons montrer à l'aide du principe d'induction, que la somme des n premiers carrés est égale 
à #2 +1){2x + D/6, c'est-à-dire que pour # > 1 nous aurions (cf. chapitre de Suites Et Séries): 


ie nn + D(2x# +1) 
6 


P+22+..+ 


D'abord la relation ci-dessus est facilement vérifiée pour x = 1 nous allons montrer que # = +1 
vérifie aussi cette relation. En vertu de l'hypothèse d'induction: 


P+2+..+8+(k+0 = ÉGTDCE TD , 
6 (4.14) 
_ + +2)(2& +3) 
6 


nous retrouvons bien l'hypothèse de la validité de la première relation mais avec # = # +1, d'où le 
résultat. 


OIC.Q.F.D. 


Ce procédé de démonstration est donc d'une très grande importance dans l'étude de l'arithmétique; 
souvent l'observation et l'induction ont permis de soupçonner des lois qu'il eût été plus difficile de 
trouver par a priori. Nous nous rendons compte de l'exactitude des formules par la méthode précédente 
qui a donné naissance à l'algèbre moderne par les études de Fermat et de Pascal sur le triangle de 


Pascal (voir la section d'Algèbre) 
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3. DIVISIBILITÉ 


Définition: Soit 4,8 e & avec 4 # (0. Nous disons que "A divise B (sans reste)" s'il existe un entier q 
(le quotient) tel que: 


B=A'g (415) 
auquel cas nous écrivons: 
AB (4.16) 


Dans le cas contraire, nous écrivons À { Z et nous lisons "A ne divise pas B". 


Remarques: 
1. Se rappeler que le symbole | est une relation alors que le symbole / est une opération! 


2. Il ne faut pas confondre l'expression "A divise B" qui signifie que le reste est obligatoirement nul 
et "A est le diviseur de la division de B" qui indique que le reste n'est pas forcément nul! 


Par ailleurs, si A|B, nous dirons aussi que "B est divisible par A" ou que "B est un multiple de A". 
Dans le cas où AJB et que 1£ 4 < 8, nous dirons que À est un "diviseur propre" de B. 
De plus, il est clair que A0 quel que soit 4e Æ\ {0} sinon quoi nous avons une singularité. 
Voici maintenant quelques théorèmes élémentaires se rattachant à la divisibilité: 
T1. Si AJB, alors A|BC quel que soit C'e Æ 
Démonstration: 
Si AJB, alors il existe un entier q tel que À = Ag. Alors, BC = AfgC) et ainsi AJBC. 
OIC.Q.FD. 
T2. Si AB et BIC, alors A|C. 
Démonstration: 
Si AB et BIC, alors il existe des entiers q et r tels que À = Ag et € = Br. Donc, C = Afgr)et ainsi A|C. 


OIC.Q.F.D. 


T3. Si AJB et A|C, alors: 


A|(Bx+Cy), Vx,ye (4.17) 
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Démonstration: 


Si ABB et A|C, alors il existe des entiers q et r tels que 8 = Ag et © = Ar. Il s'ensuit que: 
Bx+Cy=(Ag)x+(Ar)y= A(gxt+ry) (4.18) 
et ainsi que A|(8x+Cy) Vx,yeÆ. 
OIC.Q.FD. 
T4. Si AB et BJA, alors 4 = +8 
Démonstration: 


Si AB et BlA, alors il existe des entiers q et r tels que 8 = Ag et 4 = Br. Nous avons donc 8 = Bigr) 
et ainsi gr = 1; c'est pourquoi nous pouvons avoir 4 = +1 sir =+1 et qu'ainsi 4 = +8 


OIC.Q.F.D. 
T5. SiAJB et 84 0 alors [4] <|Z] 
Démonstration: 


Si AB et 8 # Q, alors il existe un entier g # Ô tel que 8 = Ag. Mais alors, [2] = |4|lg| > |A], puisque 
lg | à |: 


OC.Q.FD. 


3.1. DIVISION EUCLIDIENNE 


La division euclidienne est une opération qui, à deux entiers naturels appelés dividende et diviseur, 
associe deux entiers appelés quotient et reste. Initialement définie aux entiers naturels non nuls, elle se 
généralise aux entiers relatifs et aux polynômes, par exemple. 


Définition: Nous appelons "division euclidienne" ou "division entière" de deux nombres À et B 
l'opération consistant à diviser B par À en s'arrêtant quand le reste devient strictement inférieur à A. 


Rappelons (cf. chapitre Nombres) que tout nombre qui admet exactement les deux diviseurs euclidiens 
(dont la division donne un reste nul) que sont 1 et lui-même est dit "nombre premier" (ce qui exclut le 
nombre 1 de la liste des nombres premiers) et que tout couple de nombres qui n'ont que 1 comme 
diviseur euclidien commun sont dits "premiers entre eux". 


Soient À, BE & avec 4 > 0. Le "théorème de la division euclidienne" affirme qu'il existe des entiers 
uniques get r tels que: 


B=Agtr&r=B-Ag (419 


où 0 £r< A. De plus, si AfB, alors 0<r< 4. 
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Démonstration: 


Considérons l'ensemble: 
S=fr=B-ç4| 4 BET,AEZ",B-qA>0) (4.20) 


Il est relativement facile de voir que $ € N'L{0} et que $ # Zi, d'où, d'après le principe du bon ordre, 
nous concluons que S contient un plus petit élément » > 0. 
Soit q l'entier satisfaisant donc à: 


r=B-Ag (421) 


Nous voulons d'abord montrer que >» < 4 en supposant le contraire (démonstration par l'absurde), c'est- 
à-dire que >» > 4. Alors, dans ce cas, nous avons: 


B-gA=r2A (4.22) 
ce qui est équivalent à: 
B-(g+DA=r-A20 (423) 
mais B-(g+DA4eS et: 
B-(g+DA<B-gA (424) 
ce qui contredit le fait que: 
r=B-gA (4.25) 


est le plus petit élément de S. Donc, » < A. Enfin, il est clair que si » = 0, nous avons AJB, d'où la 
seconde affirmation du théorème. 


OIC.Q.F.D. 
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Remarque: Dans l'énoncé de la division euclidienne, nous avons supposé que 4 > 0. 
Qu'obtenons-nous lorsque 4 < 0? Dans cette situation, -A est positif, et alors nous pouvons 
appliquer la division euclidienne à B et -A. Par conséquent, il existe des entiers q et r tels que: 


B=g(-A)troù0<r<|A (426) 


Or, cette relation peut s'écrire: 


B=-g(A)+r (427) 


où bien sûr, -q est un entier. La conclusion est que la division euclidienne peut s'énoncer sous la 


forme plus générale: 
Soient À, 8 € &, alors il existe des entiers q et r tels que: 
B= Ag+r (4.28) 


où 0 £r < [AÏ. De plus, si A{ 2, alors 0 € r < [A]. 


Les entiers q et r sont uniques dans la division euclidienne. En effet, s'il existe deux autres entiers g, et 


ñ tels que: 
B=Ag +n (4.29) 
avec toujours 0 £r < À, alors: 
AG -g)=r-ñ (430) 


et ainsi A|(r -ñ). En vertu de (T5) nous avons, si r -n “ O, /r - | # À: 


Or, cette dernière inégalité est impossible puisque par construction - A4 < r -r < À. Donc, r = et, 


puisque À # 0, alors 4, = g d'où l'unicité. 


3.1.1. PLUS GRAND COMMUN DIVISEUR 


Soit a,b e £ tels que ab # 0. Le "plus grand commun diviseur" (noté "PGCD" par la suite) de a et b, 


noté: 
(a,b) (4.31) 
est l'entier naturel d non nul qui satisfait aux deux propriétés suivantes: 
P1. dja et d\b (donc sans reste r dans la division!) 
P2. si cla et cb alors & < 4 et c\d (par définition!) 


Notons que 1 est toujours un diviseur commun de deux entiers arbitraires. 
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Exemple: 


Considérons les entiers positifs 36 et 54. Un diviseur commun de 36 et 54 est un entier positif qui divise 
36, et aussi 54. Par exemple, 1 et 2 sont des diviseurs communs de 36 et 54. 


Div = (12,3,4,6,9,12,18,36) 


Diva = (1,2,3,6,9,18,27, 54} (4.32) 


Nous avons alors l'intersection représentée par le diagramme de Venn suivant: 


DIvS 4 
Figure: 4.1 - Diagramme de Venn des diviseurs communs 
avec l'ensemble des diviseurs communs suivant: 
Diva N Divsa = (123 6,9,18) (4.33) 
et donc le PGCD est: 


max{1,2,3,6,9,18})=18 (4.34) 


et nous constatons que l'ensemble des diviseurs communs de 36 et 54 est aussi l'ensemble des 
diviseurs de 18. 


Cependant, il n'est pas forcément évident que le PGCD autre qu'unitaire (c'est-à-dire différent 1) de 
deux entiers a et b qui ne sont pas premiers entre eux existe toujours. Ce fait est démontré dans le 
théorème suivant (cependant, si le PGCD existe, il est de par sa définition unique!) dit "théorème de 
Bézout" qui permet aussi de démontrer d'autres propriétés intéressantes de deux nombres comme nous 
le verrons plus tard. 


Démonstration: 


Soient 4,be & tels que ab # O0. Si d divise a et d divise b (pour les deux sans reste r!) il existe alors 
obligatoirement des entiers relatifs x et y tels que: 


d'=(a,b)=ax+by]| (4.35) 
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Cette relation est appelée "identité de Bézout" et il s'agit d'une équation diophantienne linéaire (cf. 
chapitre de Calcul Algébrique). 


Evidemment, si a et b sont premiers entre eux nous savons que d vaut alors 1. 


Pour démontrer l'identité de Bézout considérons d'abord l'ensemble: 


S = {d =axt+by|x,ye£,ax+by > 0} (4.36) 


Comme $ € N et S$ # Zi , nous pouvons utiliser le principe du bon ordre et conclure que S possède un 
plus petit élément d. Nous pouvons alors écrire: 


d = axy tbYo (4.37) 


pour un certain choix x,,», € &. Il suffit donc de montrer que 4 = (&,b) pour démontrer l'identité de 
Bézout! 


Procédons via une démonstration par l'absurde en posant supposant 4 Ÿ 4 . Alors si c'est le cas, d'après 
la division euclidienne, il existe g4,r € £ tels que a = gé +r, où Q € r < d. Mais alors: 


r=a-gd=a-g(ax +tby))=4a(l-gx) +b(-gy) (4.38) 


Ainsi, nous avons que re S et r < 4, ce qui contredit le fait que d est le plus petit élément possible de 
S. Donc nous avons démontré ainsi non seulement que d\a mais qu'en plus d existe toujours et, de la 
même façon, nous démontrons que d|b. 


Comme corollaire important montrons maintenant que si 4, e Æ tels que 4 # 0, alors: 
S'={axtby|zx,yeÆ} (4.39) 
constitue l'ensemble de tous les multiples de 4 = (&,b) : 


Comme d|a et db, alors nous avons forcément 4 | ax +by pour tout x,ye Æ. Soit M = {xd |neÆ}. 
Notre problème se réduit au fait à montrer que $ = M. 


Soit d'abord 5e S ce qui signifie que ds et qui implique 5€ MW. 
Soit un #€ M, cela voudrait donc dire que ;»# = #4 pour un certain xe Æ. 
Comme 4 = 4x, + by, pour un choix d'entiers quelconques x,,», € &, alors: 
m= nd = (ax + byo) = a(#x;) +b(xy,) € S' (4.40) 
OIC.Q.FD. 


Les hypothèses peuvent sembler compliquées mais portez plutôt votre attention un certain temps sur la 
dernière relation. Vous allez tout de suite comprendre! 
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Remarque: Si au lieu de définir le PGCD de deux entiers non nuls, nous permettons à l'un d'entre 
eux d'être égal à O, disons: 4 # b, à = 0. Dans ce cas, nous avons alb et , selon notre définition du 


PGOD), il est clair que (a, 0) = la|. 


Soit 4 = (&,b) et soit me Z , alors nous avons les propriétés suivantes du PGCD: 
P1. (a,b +ma) = (a,b) = (a, -b) 


P2. (am, bm) = al (a,b) Où m3 # 0 
le? 
d à 
1 


P4. Si geÆ \{0} tel que gla et glb alors 22 = —(a,b) 
gg) [gl 


Dans certains ouvrages, ces quatre propriétés sont démontrées en utilisant intrinsèquement la propriété 
elle-même. Personnellement nous nous en abstiendrons car faire cela est plus ridicule qu'autre chose à 
notre goût car la propriété est une démonstration en elle-même. 


Elaborons maintenant une méthode (algorithme) qui s'avérera très importante pour calculer 
(déterminer) le plus grand commun diviseur de deux entiers (utile en informatique parfois). 


3.1.2. ALGORITHME D'EUCLIDE 


L'algorithme d'Euclide est un algorithme permettant donc de déterminer le plus grand commun diviseur 
de deux entiers. 


Pour aborder cette méthode de manière intuitive, il faut savoir que vous devez comprendre un nombre 
entier comme une longueur, un couple d'entiers comme un rectangle (côtés) et leur PGCD est la taille 
du plus grand carré permettant de carreler (paver) ce rectangle par définition (oui si vous réfléchissez 
un petit moment c'est assez logique!). 


L'algorithme décompose le rectangle initial en carrés, de plus en plus petits, par divisions euclidiennes 
successives, de la longueur par la largeur, puis de la largeur par le reste, jusqu'à un reste nul. Il faut bien 
comprendre cette démarche géométrique pour comprendre ensuite l'algorithme. 


Exemple: 


Considérons que nous cherchons le PGCD (a,b) où b vaut 21 et a vaut 15 et gardons à l'esprit que le 
PGCD, outre le fait qu'il divise a et b, doit laisser un reste nul! En d'autres termes il doit pouvoir diviser 
le reste de la division de b par a aussi! 


Nous avons donc le rectangle de 21 par 15 suivant: 
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Figure: 4.2 - Première étape de l'algorithme PGCD 


D'abord nous regardons si 15 est le PGCD (on commence toujours par le plus petit). Nous divisons alors 
21 par 15 ce qui équivaut géométriquement à: 


ah: : 


15 n'est donc pas le PGCD (on s'en doutait..). Nous voyons immédiatement que nous n'arrivons pas à 
paver le rectangle avec un carré de 15 par 15. 


Nous avons donc un reste de 6 (rectangle de gauche). Le PGCD comme nous le savons doit, s'il existe, 
par définition pouvoir diviser ce reste et laisser un reste nul. 


Il nous reste donc un rectangle de 15 par 6. Nous cherchons donc maintenant à paver ce nouveau 
rectangle car nous savons que le PGCD est par construction inférieur ou égal à 6. Nous avons alors: 


Figure: 4.4 - Troisième étape de l'algorithme PGCD 


Et nous divisons donc 15 par le reste 6 (ce résultat sera inférieur à 6 et permet immédiatement de tester 


Page: 162/4839 


[v3.0 - 2013] 


si le reste sera le PGCD). Nous obtenons: 


A nouveau, nous n'arrivons pas à paver ce rectangle rien qu'avec des carrés. En d'autres termes, nous 
avons un reste non nul qui vaut 3. Soit un rectangle de 6 par 3. Nous cherchons donc maintenant à 
paver ce nouveau rectangle car nous savons que le PGCD est par construction inférieur ou égal à 3 et 
qu'il laissera un reste nul s'il existe. Nous avons alors géométriquement: 


Figure: 4.6 - Cinquième étape de l'algorithme PGCD 


Nous divisons 6 par 3 (ce qui sera inférieur à 3 et permet immédiatement de tester si le reste sera le 
PGCD): 


Figure: 4.7 - Sixième et dernière étape de l'algorithme PGCD 


et c'est tout bon! Nous avons 3 qui laisse donc un reste nul et divise le reste 6 il s'agit donc du PGCD. 
Nous avons donc au final: 


Figure: 4.8 - Résumé de l'algorithme PGCD 


Maintenant, voyons l'approche formelle équivalente: 


Soient 4, € &, où 4 > 0. En appliquant successivement la division euclidienne (avec b>a), nous 
obtenons la suite d'équations: 
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b= ag + 0<n <a 
a = gs +r 0<r <n 
ñ = 743 +73 ( <r <r 


(4.41) 


Fins = r;1d ; + Fr; Ô < Fr; < Fr; 


Fin = 7;4 ;4 
Si d = (a,b), alors d =r.;. 
Sinon de manière plus formelle: 
Démonstration: 
Nous voulons d'abord montrer que r; = (a,b). Or, d'après la propriété P1: 
(a,b+ma) =(a,b) =(a,-b) (4.42) 
nous avons: 
(aber) (5)... (rar) (4.43) 


Pour démontrer la deuxième propriété de l'algorithme d'Euclide, nous écrivons l'avant-dernière 
équation du système sous la forme: 


r; “F;a 7 Qjrja (444) 
Or, en utilisant l'équation qui précède cette avant-dernière équation du système, nous avons: 


Fr; =ria 7Q;(r;3 dira) 
Ne 
= (+ggiira t Cajrs 


En continuant ce processus, nous arrivons à exprimer 7; comme une combinaison linéaire de a et b. 
OC.Q.FD. 


Exemple: 


Calculons le plus grand commun diviseur de (429,966) et exprimons ce nombre comme une 
combinaison linéaire de 429 et de 966. 


Nous appliquons bien évidemment l'algorithme d'Euclide: 
966 = 429:2+108 
429 =108:3+105 


108 =105:1+3 
105=53:35 


(4.46) 
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Nous en déduisons donc que: 


r; = d = (966,429) =3 (4.47) 


et, de plus, que: 


3=108-105:1=108-(429 —-108:3) = 108: 4 -429 


4.48 
= (966-429: 2):4 429 = 966:4 -429:9 =966-4+429:(-9) 


Donc le PGCD est bien exprimé comme une combinaison linéaire de a et b et constitue à ce titre le 
PGCD. 


Définition: Nous disons que les entiers &,,4,,...,4, sont "relativement premiers" ou "premiers entre 


eux" si: 
(@,,a,,..,a,) =1 (449) 


3.1.3. PLUS PETIT COMMUN MULTIPLE 


Définitions: 
D1. Soient &,,4,,...,4, € & \{0}, nous disons que m est un "commun multiple" de &,,4,,...,4, si a, |» 
pour à =1,2,..,#. 
D2. Soient 4,,4,,...,4a, € & \ {0}, nous appelons "plus petit commun multiple" (PPCM) de &,,4,,...,4,, 
noté: 
[@,a,..,4,] (4.50) 
le plus petit entier commun multiple positif à tous les communs multiples de &,,4,,...,4,. 
Exemple: 


Considérons les entiers positifs 3 et 5. Un multiple commun de 3 et 5 est un entier positif qui est à la 
fois un multiple de 3, et un multiple de 5. Autrement dit, qui est divisible par 3 et aussi par 5. Nous 
avons donc: 


M; = (3,6,9,12,15,18, 21, 24,27, 30...) 


(4.51) 
M; = {5 10,15, 20,25, 30,35,40,45.... 


Nous avons alors l'intersection représentée par le diagramme de Venn suivant: 
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Figure: 4.9 - Diagramme de Venn des communs multiples 


avec l'ensemble des communs multiples suivants: 
Man Ms=(15,30,45,60,.) (4.52) 
et le PPCM est alors: 


min {15,30,45,60,.)=15 (4.55) 


Nous constatons que l'ensemble des multiples communs de 3 et 5 est aussi l'ensemble des multiples de 
15: 


Remarque: Soient 4,,4,,...,4, € Æ& \{0} . Alors, le plus petit commun multiple existe. En effet, 


considérons l'ensemble E des entiers naturels m qui pour tout i divisent 4, . Ce que nous noterons: 
E={mla|meN,i=12,.x} (454) 


Puisque nous avons forcément lna..a, | € Æ, alors l'ensemble est non vide et, d'après l'axiome du 


bon ordre, l'ensemble E contient un plus petit élément positif. 


Voyons maintenant quelques théorèmes relatifs au PPCM: 


T1. Si m est un commun multiple quelconque de &,,4,,...,4, alors [a,,4,,...,a,]|##, c'est-à-dire que m 


divise chacun des &, . 

Démonstration: 

Soit f =[a,,4,,...,a,]. Alors, d'après la division euclidienne, il existe des entiers q et r tels que: 
m=gM+r,0£<r<M (455) 


Il suffit de montrer que > = 0. Supposons > #( (démonstration par l'absurde). Puisque 4, | »# et a, | 
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, alors on a 4, |r et cela pour à =1,2,...,#. Donc, r est un commun multiple de 4,,4,,...,a, plus petit 


que le PPCM. On vient d'obtenir une contradiction, ce qui prouve le théorème. 

OIC.Q.FD. 
T2. Si & > O, alors [ka ,ka,,.…, ka, ] = kfa,,a,,...,a,] 
La démonstration sera supposée évidente (dans le cas contraire contactez-nous et cela sera détaillé!) 
T3. [a,b]' (ab) =| ab | 
Démonstration: 


Pour la démonstration, nous allons utiliser le "lemme d'Euclide" qui dit que si albc et (a,b) = 1 alors 
alc. 


Effectivement cela se vérifie aisément car nous avons vu qu'il existe x,y € & tels que 1=ax+èy et 
alors € = acx + hey. Mais alac et abc impliquent que & | (&cx + hey) , c'est-à-dire également que 4 |c. 


Revenons à notre théorème: 


Puisque (a,b) = (a,-b) et [a,b] =[a,-b], il suffit de prouver le résultat pour des entiers positifs a et b. 
En tout premier lieu, considérons le cas où {&,à) = 1. L'entier [a,b] étant un multiple de a, nous 
pouvons écrire [&,b] = #74. Ainsi, nous avons à | #4 et, puisque (4,b) = 1, il s'ensuit, d'après le lemme 
d'Euclide, que b | m. Donc, à < »# et alors 4b < arm. Mais ab est un commun multiple de a et b quine 
peut être plus petit que le PPCM. c'est pourquoi ab = #4 = [ab]. 


Pour le cas général, c'est-à-dire (&,h) = 4 > 1, nous avons, d'après la propriété: 


a à 
—,—|=1 (456) 


et avec le résultat obtenu précédemment que: 


a à a à a b 
"ll 45 
d à d d d à 


; : 2 : : : : 
Lorsque nous multiplions des deux côtés de l'équation par d”, le résultat suit et la démonstration est 
effectuée. 


OIC.Q.F.D. 


3.2. THÉORÈME FONDAMENTAL DE L'ARITHMÉTIQUE 


Le théorème fondamental de l'arithmétique dit que tout nombre naturel x > 1 peut s'écrire comme un 
produit de nombres premiers, et cette représentation est unique, à part l'ordre dans lequel les facteurs 
premiers sont disposés. 


Le théorème établit l'importance des nombres premiers. Essentiellement, ils sont les briques 
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élémentaires de construction des entiers positifs, chaque entier positif contenant des nombres premiers 
d'une manière unique. 


Remarque: Ce théorème est parfois appelé "théorème de factorisation" (un peu à tort. car d'autres 
théorèmes portent le même nom...). 


Démonstration: 


Si nest premier, et donc produit d'un unique entier premier, à savoir lui-même le résultat est vrai et la 
démonstration est terminée (dire qu'un nombre premier est produit de lui-même est bien évidemment un 
abus de langage!). Supposons que n n'est pas premier et donc strictement supérieur à 1 et considérons 
l'ensemble: 


D={d|d|reti<d<x} (458) 


Alors, D CN et, puisque n est composé, nous avons que D # Zi. D'après le principe du bon ordre, D 
possède un plus petit élément », qui est premier, sans quoi le choix minimal de p», serait contredit. 


Nous pouvons donc écrire # = p,*,. Si x, est premier, alors la preuve est terminée. Si x, est composé, 


alors nous répétons le même argument que précédemment et nous en déduisons l'existence d'un nombre 
premier », et d'un entier #, < », tels que # = »,p,#,. En poursuivant ainsi nous arrivons forcément à 


la conclusion que #, sera premier. 


Donc finalement nous avons bien démontré qu'un nombre quelconque est décomposable en facteurs de 
nombres premiers à l'aide du principe du bon ordre. 


OIC.Q.F.D. 


Nous ne connaissons pas à ce jour de loi simple qui permette de calculer le n-ième facteur premier 
(?,). Ainsi, pour savoir si un entier m est premier, il est pratiquement plus facile à ce jour de vérifier sa 


présence dans une table de nombres premiers. 
En fait, nous utilisons aujourd'hui la méthode suivante: 


Soit un nombre m, si nous voulons déterminer s'il est premier ou non, nous calculons s'il est divisible par 
les nombres premiers », qui appartiennent à l'ensemble: 


{Pa eNl|p, < fn (4.59) 


Exemple: 


L'entier 223 n'est ni divisible par 2, ni par 3, ni par 5, ni par 7, ni par 11, ni par 13. Il est inutile de 
continuer avec le prochain nombre premier, car 17? = 289 > 223. Nous en déduisons dès lors que le 
nombre 223 est premier. 


3.3. CONGRUENCES 


Définition: Soit #7 € £ \ {0} . Si a et b ont même reste dans la division euclidienne par m nous disons 
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que "a est congru à b modulo m", et nous écrivons: 


la = rm 0 dr) | (4.60) 


ou de manière équivalente il existe un nombre entier relatif k tel que: 


b=a+km| (4.61) 


Le lecteur pourra vérifier que cela impose que 
m|(a-—b) (4.62) 


soit en français... que m divise la différence entre a et b. Dans le cas contraire, nous disons que "a est 
non congru à b modulo m"!. 


Une autre manière de dire tout cela si ce n'est pas clair..…: 


L'étude de ces propriétés qui relient trois nombres entre eux est appelée communément "l'arithmétique 
modulaire”. 


Remarques: 
R1. Que nous soyons bien d'accord, la congruence implique un reste nul pour la division ! 


R2. Nous excluons en plus de 0 aussi 1 et -1 pour les valeurs que peut prendre m dans la définition 
de la congruence dans certains ouvrages. 


R3. Derrière le terme de congruence se cachent des notions semblables mais de niveaux 
d'abstraction différents: 


- En arithmétique modulaire, nous disons donc que "deux entiers relatifs a et b sont congrus modulo 
m s'ils ont même reste dans la division euclidienne par m". Nous pouvons aussi dire qu'ils sont 
congrus modulo m si leur différence est un multiple de m. 


- Dans la mesure des angles orientés, nous disons que "deux mesures sont congrues modulo 
277 [rad] si et seulement si leur différence est un multiple de 2x [ra ]". Cela caractérise deux 


mesures d'un même angle (cf. chapitre de Trigonométrie). 


- En algèbre, nous parlons de congruence modulo 1 dans un anneau commutatif (cf. chapitre de 
Théorie Des Ensembles) dont I est un idéal: "x est congru à y modulo I si et seulement si leur 
différence appartient 1". Cette congruence est une relation d'équivalence, compatible avec les 
opérations d'addition et multiplication et permet de définir un anneau quotient de l'ensemble parent 
avec son idéal I. 


- Nous trouvons parfois, dans l'étude de la géométrie (cf. chapitre de Géométrie Euclidienne) le 


terme de congru mis à la place de semblable. Il s'agit alors d'une simple relation d'équivalence sur 
l'ensemble des figures planes. 


La relation de congruence = est une relation d'équivalence (cf. chapitre sur les Opérateurs), en d'autres 
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termes , soient &,b,c,#€ &,# > 1 alors la relation de congruence est: 


P1. Réflexive: 
a =a mod{#) (463) 
P2. Symétrique: 
a =b mod{m)  b =a modfr#) (464) 
P3. Transitive: 
a =b mod{m),b = c mod) — a =c mod{r#) (4.65) 
Démonstration: 


Les propriétés P1 et P2 sont évidentes (si ce n'est pas le cas faites-le nous savoir nous développerons!). 
Nous démontrerons P3. Les hypothèses impliquent que à = à + lon,c = b + nm. Mais alors: 


c=b+tim=(a+knm)tim=at(k+lm (4.66) 
ce qui montre que a et c sont congrus modulo m. 
OIC.Q.FD. 


La relation de congruence = est compatible avec la somme et le produit (se rappeler que la puissance 
n'est finalement qu'une extension du produit!). 


Effectivement, soient &,b,a',b'm,e Æ&,m > 1 tel que 4 =b mod») et a'=h" mod{#»#) alors: 
Pl.a+ta'=b+b" modir) 
P2. aa'=bb" mod) 
Démonstrations: 
Nous avons: 
a =b+lona' =b'+lm (467) 

par hypothèse. Mais alors: 

ata'=b+b"+({+k£)m (468) 
ce qui démontre P1. Nous avons également: 

aa'= bb'+ bim + b'lon + kim = bb'+sm (4.69) 

ce qui démontre P2. 


OIC.Q.F.D. 
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Remarque: La relation de congruence se comporte sur de nombreux points comme la relation 
d'égalité. Néanmoins une propriété de la relation d'égalité n'est plus vraie pour celle de congruence, 
à savoir la simplification: si 4h = ac mod), nous n'avons pas nécessairement à = € mod). 


Exemple: 
2:1=2:3 mod(4) mais 17 3 mod(d) 


Jusqu'ici, nous avons vu des propriétés des congruences faisant intervenir un seul modulus. Nous allons 
maintenant étudier le comportement de la relation de congruence lors d'un changement de modulus. 


P1.Si a =b mod{##) et d|m, alors a = modid) 
P2. Si a =b modfr) et 4 =b mods) alors a et b sont congrus modulo [r,s] 


Ces deux propriétés sont évidentes. Inutile d'aller dans les détails pour P1. Pour P2, puisque b-a est un 
multiple de r et de s puisque par hypothèse: 
b-a bc 


= k, 
Fr S 


={—=b-a=rk=sl (470) 


b-a est donc un multiple du PPCM de r ets, ce qui démontre P2. 


De ces propriétés il vient que si nous désignons par f(x) un polynôme à coefficient entiers (positifs ou 
négatifs): 


fx) = Ax" + Bat + Cat + + Kx+L (471) 
La congruence & =& mod{##:) donnera aussi fa) = f(b) mod(y). 


Si nous remplaçons x successivement par tous les nombres entiers dans un polynôme f(x) à coefficients 
entiers, et si nous prenons les résidus pour le module m, ces résidus se reproduisent de m en m (dans le 
sens où la congruence se vérifie), puisque nous avons, quel que soit l'entier m et x: 


f(x) = f(x+m) mod(r) (4.72) 
Nous en déduisons alors l'impossibilité de résoudre la congruence suivante: 
fix) =r modé#) (473) 


en nombres entiers, si r désigne l'un quelconque des non-résidus (un résidu qui ne satisfait pas la 
congruence). 


3.9.1. CLASSES DE CONGRUENCE 


Définition: Nous appelons "classe de congruence modulo m", le sous-ensemble de l'ensemble 7% défini 
par la propriété que deux éléments a et b de #, sont dans la même classe si et seulement si 
a =b mod{#) ou qu'un ensemble d'éléments entre eux sont congrus par ce même modulo. 
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Remarque: Nous avons vu dans le chapitre traitant des opérateurs qu'il s'agit en fait d'une classe 
d'équivalence car la congruence modulo m est, comme nous l'avons démontré plus haut, une 
relation d'équivalence. 


Exemple: 


Soit # = 3. Nous divisons l'ensemble des entiers en classes de congruence modulo 3. Exemple de trois 
ensembles dont tous les éléments sont congrus entre eux sans reste (observez bien ce que donne 
l'ensemble des classes!): 


{..., 9,6, -3,0,3,6,9,12,...) 
{...,-8,-5,-2,14,7,10,13,...) (474) 
{..,-7,-4,-12,5,8,11..) 


Ainsi, nous voyons que pour chaque couple d'élément d'une classe de congruence, la congruence 
modulo 3 existe. Cependant, nous voyons que nous ne pouvons pas prendre -9 = -8 mod{3) où -9 se 
trouve dans la première classe et -8 dans la seconde. 


Le plus petit nombre non négatif de la première classe est O, celui de la deuxième est 1 et celui de la 
dernière est 2. Ainsi, nous noterons ces trois classes respectivement [0E ,[1];.[2}, le chiffre 3 en indice 


indiquant le modulus. 


Il est intéressant de noter que si nous prenons un nombre quelconque de la première classe et un 
nombre quelconque de la deuxième, alors leur somme est toujours dans la deuxième classe. Ceci se 
généralise et permet de définir une somme sur les classes modulo 3 en posant: 


[0H +[0E =[0L [OL +[1k =0E 
[0B +[2L =[2X [B+[0] =[2E (475) 
NB +[23% [0 [2k +[23 =[E 


Ainsi que: 


[OL'[OE =[0E [0] : IE -[0E 
[OL:[2L =[0L [LL =[1k (476 
CL'TE = (EE 0 


Ainsi, pour tout # > 1, la classe de congruence de: 
a mod{r#) (4.77) 


est l'ensemble des entiers congrus à a modulo m (et congrus entre eux modulo m). Cette classe est 
notée: 


[a], (4.78) 
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Remarque: Le fait d'avoir mis entre parenthèses l'expression "et congrus entre eux modulo m" est 
dû au fait que la congruence, étant une relation d'équivalence nous avons comme nous l'avons 
démontré plus haut que si à = 4 mod{rm},c = a mod), alors b = & mod). 


Définition: L'ensemble des classes de congruence [4],, (qui forment par le fait que la congruence est 


une relation d'équivalence des: "classes d'équivalence"), pour un m fixe donne ce que nous appelons un 
"ensemble quotient" (cf. chapitre Opérateurs). Plus rigoureusement, nous parlons de "l'ensemble 
quotient de 7 par la relation de congruence" dont les éléments sont les classes de congruence (ou: 
classes d'équivalence) et qui forment alors l'anneau Æ/ # . 


Nous déduisons de la définition les deux propriétés triviales suivantes: 


P1. Le nombre b est dans la classe [4], si et seulement si 4 =b mod(y#) 
P2. Les classes [4], et [»], sont égales si et seulement si & = 2 mod) 


Montrons maintenant qu'il y a exactement m différentes classes de congruence modulo m, à savoir 
LOL.[1L.....Lme 11. 


Démonstration: 


Soit # > 1, alors tout nombre entier a est congru modulo m à un et un seul entier r de l'ensemble 
(0,1, PAM 1} (remarquez bien, c'est important, que nous nous restreignons aux entiers positifs ou 


nuls sans prendre en compte les négatifs!). De plus, cet entier r est exactement le reste de la division de 
a par m. En d'autres termes, si 0 <> < m , alors: 


a =r mod{#) (4.79) 


si et seulement si & = g# + r où q est le quotient de a par met r le reste. La démonstration est donc 
une conséquence immédiate de la définition de la congruence et de la division euclidienne. 


OIC.Q.F.D. 


Définition: Un entier b dans une classe de congruence modulo m est appelé "représentant de cette 
classe" (il est clair que par la relation d'équivalence que deux représentants d'une même classe sont 
donc congrus entre eux modulo m). 


Nous allons pouvoir maintenant définir une addition et une multiplication sur les classes de 
congruences. Pour définir la somme de deux classes [4], ,[], , il suffit de prendre un représentant de 


chaque classe, de faire leur somme et de prendre la classe de congruence du résultat. Ainsi (voir les 
exemples plus haut): 


[al, +[b], =[e+è], (4.80) 
et de même pour la multiplication: 


Cal, ‘[], =[ab], (481) 
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Par définition de la somme et du produit, nous constatons que la classe de 0 est l'élément neutre pour 
l'addition: 


[a], +[0] =[al, VaeZVmenN (482) 
et la classe de l'entier 1 est l'élément neutre pour la multiplication: 

[al [1], =[aL VaeZvmenN «us 
Définition: Un élément [a], de Z/mZ est "une unité" s'il existe un élément [à] eZ/#£ tel que 
ONDES 
Le théorème suivant permet de caractériser les classes modulo m qui sont des unités dans FjmÆ : 
Théorème: Soit [a] un élément de Æ/ »#7Æ. Alors [a] est une unité si et seulement si (a,m) = 1. 
Démonstration: 
Supposons d'abord que {&,##) = 1. Alors par Bézout, nous avons son identité: 

as+mr=1 (4.84) 


Autrement dit, as est congru à 1 modulo m. Mais ceci est équivalent à écrire par définition que 
[æ][s] = [1] ce qui montre que [a] est une unité. Réciproquement, si [a] est une unité, ceci implique qu'il 
existe une classe [s] telle que [4][s] = [1]. 


Ainsi, nous venons de démontrer que Z{"®# constitue bien un anneau puisqu'il possède une addition, 
une multiplication, un élément neutre et un inverse. 


OIC.Q.F.D. 


3.4. FRACTIONS CONTINUES 


La notion de fraction continue remonte à l'époque de Fermat et atteint son apogée avec les travaux de 
Lagrange et Legendre vers la fin du 18ème siècle. Ces fractions sont importantes en physique car nous 
les retrouvons en acoustique ainsi que dans la démarche intellectuelle qui a amené Galois à créer sa 
théorie des groupes. 


Considérons dans un premier temps le nombre rationnel a/b avec {4a,b)= 1 avec & > 0 et 4 > &. Nous 
savons que tous les quotients g, et les restes 7; sont dans le cadre de la division euclidienne des entiers 
positifs. 


Rappelons l'algorithme d'Euclide vu plus haut (mais noté de manière un peu différente): 
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F3 (4.85) 


Pal 


Par substitutions successives, nous obtenons: 


1 (4.86) 


Ce qui est aussi parfois noté: 
l 
= +——=h+————#=.… (487) 


Ainsi, tout nombre rationnel positif peut s'exprimer comme une fraction continue finie où g,, € N. 


Exemples: 


ET. Cherchons l'expression de 17/49. Nous savons déjà que 0 <17/49 <1 donc que g, = 0. Nous 
avons alors: 


L- Ï = 04 — 0 + 04 
49 49/17 24 


“a 1 1 (4.88) 

17/15 1+ 1+ 
15/2 34 
2/1 


Nous voyons bien dans cet exemple que nous avons effectivement g,, € N . Nous pouvons également 
remarquer que par construction: 


Page: 175/4839 


[v3.0 - 2013] 


1 
En = (4.89) 
ÿ 


où les crochets représentent la partie entière et nous avons aussi: 


=g,+E (4.90) 
E 


n-l 


E2. Voyons comment extraire la racine carrée d'un nombre À par la méthode des fractions continues. 


Soit a le plus grand nombre entier dont le carré ,2 est plus petit que A. On le soustrait de A. Il y a donc 
un reste de: 


r = A- a? = (V4-a)(V4+a) (4.91) 


où nous avons utilisé une des identités remarquables vues dans le chapitre d'Algèbre. D'où en divisant 
les deux membres par la deuxième parenthèse, nous avons: 


VA-a= (492) 


Soit: 


Dans le dénominateur, nous remplaçons ./4 par: 


r 
A+——— (49,4) 
VA+a 


Cela donne: 


= 


Fr (4.95) 


JA+a 


etc... on voit ainsi que le système est simple pour déterminer l'expression d'une racine en termes de 
fraction continue. 


Le développement du nombre a/b s'appelle le "développement du nombre a/b en fraction continue 
finie" et est condensé sous la notation suivante: 


[42,934] (4.96) 


Nous considérerons comme intuitif que tout nombre rationnel peut s'exprimer comme fraction continue 
finie et inversement que toute fraction continue finie représente un nombre rationnel. Par extension, un 
nombre irrationnel est représenté par une fraction continue infinie! 
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Considérons maintenant [4 ,4,43....,q, | une fraction continue finie. La fraction continue: 


Cy=[m,92,..,qe] (497 


où & =1,2,..,# est appelée la "k-ième réduite" ou la "k-ième convergente" ou encore le "k-ième 
quotient partiel". 


Avec cette notation, nous avons: 


CG =lgl=4 

1  g>+1l 
Co =[dl= a +—= 12 

2 42 

1 H2+1l) 43 +g 
C; =[,4.4:]=4 + Gate ta (4.98) 
42 +— g243 
g3 


((ng2 +1)-43 +4} Ga +(g92 +1) 


C = LA » ’ _ 
a = [92,934] Cadaen 


Pour simplifier les expressions ci-dessus, nous introduisons les suites {x,} ,{4,} (n pour numérateur et d 
pour dénominateur) définies par: 


#0 = A=%, …, 2% = Gr + 


(4.99) 
do = 0, d\ — 1, ss d, — dd; +d,_ 


à l'aide de cette construction, nous avons une petite inégalité immédiate intéressante pour un peu plus 
loin: 


0 = do <d; <d; <d3.…. (4.100) 


Avec la définition ci-dessus, nous constatons que: 


À] # #3 #4 
CO=—,.C=—=,G=—,..,0a=— (4101) 
1 à 2 ä, 3 4 4 4, ( 


Soit en généralisant: 


Fi 
k 


Maintenant, montrons pour un usage ultérieur que pour ; > |, nous avons: 
_ FLE , 9 
7,4; _ CAE = ( Î (4.103) 


Le résultat est immédiat pour à = 1. En supposant que le résultat est vrai pour i montrons qu'il est aussi 
vrai pour j +1. Puisque: 
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CARTCA TH — (gn% +%) d; Es (gd +d;2 } en (di; — #1d;) ” (-1) (4104) 


alors en utilisant l'hypothèse d'induction, nous obtenons le résultat! 


Nous pouvons maintenant établir une relation indispensable pour la suite. Montrons que si €, est la 


k-ième réduite de la fraction continue simple finie [4 ,42....,4, | alors: 
CO < C3 <Cs <…. <Cs <Ca <C2 (4.105) 


Démonstration: 


Crta — Cr = (Cia Cru) H(Crn Ca) 
. ES _ #4 +2 ” 2) : as Lg De 42 | [ss : Et 


dix2 din din dk dixdin dadr 
k+2 kH 
- ee Z ditari x }+(24 = _— D 
dindin dinde dindin dinde (4.106) 
_ CD + CD du _ COTE De + CD du 
did ndr diadindr 
LCD de + CD du | CD (des = di) 
dixadi dr dixdinds 
puisque: 
0 = dy <d] <d3 <d3.…. (4.107) 
donc: 


di42 — dy > 0 (4.108) 
ce qui nous indique que le signe C4, -C, est le même que celui de (—1*#. 
Il en résulte que C,,, > €; pour k impair, et que €, <C, pour k pair. Il s'ensuit que: 


CO < C3 <Cs <… et On > Cu > OC >. (4.109) 


Ensuite, puisque: 
JO À 
Ce-Con= EE 2 RE EE LE (4110) 
Donc pour k pair, nous avons €, > C,_,, nous en déduisons donc: 


CO <C3 <Cs <.. <C6 < C4 <C2 (4.111) 


OIC.Q.FD. 
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Montrons maintenant que toute fraction continue infinie peut représenter un nombre irrationnel 


quelconque. 


En des termes formels, si {g,} est une suite d'entiers tous positifs et que nous considérons 


C, =[,42....,a, | alors celui-ci converge nécessairement vers un nombre réel si x — +. 


Effectivement il n'est pas difficile d'observer (c'est assez intuitif) avec un exemple pratique que nous 


avons: 
Cyr Cr 0 (4.112) 


lorsque & — +. 


Maintenant, notons x un nombre réel quelconque et 4, = [x] la partie entière de ce nombre réel. Alors 


nous avons vu tout au début de notre étude des fractions continues que: 
X=g +£ (4.113) 
Il vient donc que: 


A =x-4 (4.114) 


Attardons-nous pour les nécessités du chapitre d'Acoustique sur le calcul d'une fraction continue d'un 


logarithme en utilisant la relation précédente! 


D'abord rappelons que: 


Soit (relation démontrée dans le chapitre d'Analyse Fonctionnelle): 


x =log, (4) = ) (4.116) 


In(a} 
avec 1<a<u et (a,u)=1. 


Soit y, défini par: 


n 


Ya - 
ÿ_ = Yo = Ÿ'nH = q (4.117) 
LL 


Alors montrons que: 


E, = hOn2) _ 
In(y,,) 


n (4.118) 


En effet, pour # = 1 nous avons: 
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nu) . In(y) 


A =XI- — _ 4.119 
1—=2—4 Ina) Ei In( ) A ( ) 
pour # = 2 nous avons d'abord: 
si ] Ÿ_ 
a > Fa (4.120) 
= In) _In@&)-gin(e) In@&)-in(@) Ka} (ro / nf) 
E” jofg). In(a) In(a) In(a) Infa)  In(a) 
donc: 
Le 
& In(n) 
et puisque nous avions montré que: 
1 In(a) In (yo) 
ë, Ÿ 4 7? ho) *? ho) 


etc. par récurrence ce qui démontre notre droit d'utiliser ce changement d'écriture. 
Exemple: 
Cherchons l'expression de la fraction continue de: 
x=log,(u)=1log:(3) (4123) 
Nous savons en jouant avec la définition du logarithme que: 
1 c34<922 (4.124) 


donc: 


1og2 (2) <log2 (3) <log (27) = 1og(2) «log; (3) <2-10g2(2) 


l 3 (4.125) 
1 820) 21 ctog2 (3) <2 
log (2) 


donc g, = 1. Nous avons alors: 


ny In(y_ 
se, Li 
In(y,_) n(y5) 
et puisque: 


Y1=#=3 Yp=4a=2 (4127) 


il vient: 
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& = ne (4.128) 
In(2) 


Donc nous avons le premier quotient partiel: 


a 1 
one sd 
pesant En (4.129) 


Et in extenso nous avons déjà: 


Simplifions: 


(re -1)- In(2) _ In(2) 
In(2) n(s) “infn) (@139 
2 


Donc le premier quotient partiel peut s'écrire: 


1 
l 3) = 1+ ———— =... 
08219) In(2} (4.132) 


m(n) 


et passons au deuxième quotient partiel. Nous savons déjà pour cela que: 


<2 
3 (4.133) 
In| — 
2 


donc il est immédiat que 4; = 1 et alors comme: 


&, = hOn2) _ 
In(y,,) 


An (4.134) 


nous avons: 


In(2)—In (3) if 
= “0. - n(2) _,_ _ {2/_ (4.135) 
: In(n) . UE) 
2 


2 


Il vient finalement: 
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log, (3) = + 


etc. etc. 


À. 1 


In| — 
2} (4136) 
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Notes personnelles: 
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5. THÉORIE DES ENSEMBLES 


L.. de notre étude des nombres, des opérateurs, et de la théorie des nombres (dans les chapitres du 


même nom), nous avons assez souvent utilisé les termes "groupes", "anneaux", "corps", 
"homomorphisme", etc. et continuerons par la suite à le faire encore de nombreuses fois. Outre le fait 
que ces concepts soient d'une extrême importance, permettant de faire des démonstrations ou de 
construire des concepts mathématiques indispensables à l'étude de la physique théorique contemporaine 
(physique quantique des champs, théories des cordes, modèle standard..….), ils permettent de 
comprendre les composants et les propriétés de base de la mathématique et de ses opérateurs en 
rangeant ceux-ci par catégories distinctes. Ainsi, choisir de mettre la théorie des ensembles en tant que 
cinquième chapitre de ce site est un choix tout à fait discutable puisque rigoureusement c'est par là que 
tout commence... Cependant, nous avions besoin d'exposer quand même la théorie de la démonstration 
ne serait-ce que pour les notations et les méthodes dont il sera fait usage ici. 


Par ailleurs, lors de l'enseignement des mathématiques modernes dans le secondaire, voire primaire 
(années 1970), on introduisit le langage des ensembles et l'étude préalable des relations binaires pour 
une approche plus rigoureuse de la notion de fonctions et d'applications (voir la définition plus loin) et 
de la mathématique en général. 


Définition: Nous parlons de "diagramme sagittal" (ou de "schéma sagittal" du latin sagitta = flèche) 
pour tout schéma représentant une correspondance entre les composantes de deux ensembles reliés 
totalement ou partiellement par un ensemble de flèches. 


Exemple: 


La représentation graphique d'une fonction définie de l'ensemble E={-3,-2,-1,0,1,2,3} vers l'ensemble 
F={0,1,2,3,...9} conduirait au diagramme sagittal ci-dessous: 


Figure: 5.1 - Fonction d'un ensemble de définition à un autre ensemble d'arrivée 


Une relation de E dans E fournirait un diagramme sagittal du type: 
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Figure: 5.2 - Fonction renvoyant dans son propre ensemble de définition 


Le bouclage de chaque élément montrant une "relation réflexive" et la présence systématique d'une 
flèche retour indiquant une "relation symétrique”. 


Définition: Si l'ensemble d'arrivée est identique à l'ensemble de départ, nous disons que nous avons une 
"relation binaire". 


Cependant le choix d'introduire la théorie des ensembles dans les classes d'école a une raison aussi un 
peu autre. Au fait, dans un souci de rigueur interne (in extenso: non liée à la réalité), une très grande 
partie des mathématiques a été reconstruite à l'intérieur d'un seul cadre axiomatique, dénommé donc 
"théorie des ensembles", dans le sens où chaque concept mathématique (autrefois indépendant des 
autres) est ramené à une définition dont tous les constituants logiques proviennent de ce même cadre: 
elle est considérée comme fondamentale. Ainsi, la rigueur d'un raisonnement effectué au sein de la 
théorie des ensembles est garantie par le fait que le cadre est "non-contradictoire" ou "consistant". 
Voyons les définitions qui construisent ce cadre. 


Définitions: 


D1. Nous appelons "ensemble" toute liste, collection ou rassemblement d'objets bien définis, 
explicitement ou implicitement. 


D2. Un "Univers" U est un objet dont les constituants sont des ensembles. 


Il faut noter que ce que les mathématiciens appellent "univers" n'est pas un ensemble! En fait il s'agit 
d'un modèle qui satisfait aux axiomes des ensembles. 


Effectivement, nous verrons que nous ne pouvons pas parler de l'ensemble de tous les ensembles (ce 
n'est pas un ensemble), pour désigner l'objet qui est constitué de tous les ensembles ainsi, nous parlons 
d'univers. 


D3. Nous appelons "éléments" ou "membres de l'ensemble" les objets appartenant à l'ensemble et nous 
notons: 


pEA (61 
si p est un élément de l'ensemble A et dans le cas contraire: 
péA (52) 
Si B est une "partie" de À, ou sous-ensemble de À, nous notons cela: 
BCAOUA3B (53) 


dés lors, si pour tout: 
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Vx.xeB—xeA (54) 


Nous identifions également un ensemble soit en listant ses éléments (pas toujours forcément 
dénombrables par ailleurs!), soit en donnant la définition de ses éléments (nombres pairs, impairs, 
diviseurs entiers de.., etc.). 


Exemples: 
E1. A= {1,2,3} 
E2. À = {x]| x est un entier positif} 


D3. Nous pouvons munir les ensembles d'un certain nombre de relations qui permettent de comparer 
leurs éléments (c'est utile parfois...) ou de comparer certaines de leurs propriétés. Ces relations sont 
appelées "relations de comparaisons" ou "relations d'ordre" (cf. chapitre sur les Opérateurs). 


Remarques: 


R1. La structure d'ensemble ordonnée a été mise en place à la base dans le cadre de la théorie des 
Nombres par Cantor et Dedekind. 


R2. Comme nous l'avons démontré dans le chapitre sur les Opérateurs, N,£,Q.R sont totalement 
ordonnés par les relations usuelles £, 2. La relation <, souvent dite "d'ordre strict", n'est pas une 
relation d'ordre car non réflexive et non antisymétrique (cf. chapitre sur les Opérateurs), Par 
exemple, dans À}, la relation "a divise b", souvent notée par le symbole "|", est un ordre partiel. 


R3. Si R est un ordre sur E et F est une partie de E, la restriction à F de la relation R est un ordre 
sur F, dit "ordre induit par R dans F". 


R4. Si R est un ordre sur E, la relation R' définie par: 
xR'y © yRx (55) 


est un ordre sur E, dit "ordre réciproque" de R. L'ordre réciproque de l'ordre usuel < est l'ordre noté 
> ainsi que l'ordre réciproque de l'ordre "a divise b" dans est l'ordre "b est multiple de a". 


L'ensemble est l'être mathématique de base, dont l'existence est posée: il n'est pas défini en tant que tel, 
mais par ses propriétés, données par les axiomes. Il fait appel à une procédure humaine: une sorte de 
fonction de catégorisation, qui permet à la pensée de distinguer plusieurs éléments qualifiés 
d'indépendants. 


Nous pouvons démontrer à partir de ces concepts, que le nombre de sous-ensembles d'un ensemble de 
cardinal n est 2*. 


Démonstration: 


Il y a d'abord l'ensemble vide fi, soit 0 élément choisi parmi n, in extenso C$ (notation du coefficient 


binomial non conforme à la norme ISO 31-11!) conformément à ce que nous avons vu dans le chapitre 
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de Probabilités: 


ë 
CE È = 2 Kl (5.6) 
& &l  klém-k&l 


et ainsi de suite. 


Le nombre de sous-ensembles (cardinal) de E correspond donc à la sommation de tous les coefficients 
binomiaux: 


card (P(E)) = 5° C£| (6.7) 
k=0 


Or, nous avons (cf. chapitre de Calcul Algébrique): 
è k 
(x+y) =T BASE ll (5.8) 
k=0 


Donc: 


card (P(E)) = 5'CE 1 = (+1" =2*| (5.9) 
& 
&=0 


OC.Q.FD. 

Exemple: 
Considérons l'ensemble S'= {x,,x,,x,}, nous avons l'ensemble des parties P(S) constitué par: 
- "L'ensemble vide": {} = @ 
- Les "singletons": {x,},(x},(x} 
- Les "duets": {x,2},(%,2%},(2,23) 
- Lui-même: {x,,x,,x} 
Tel que: 

P(S)={S. (x). (x}).(6}).(n,2),(0,23),(%,2%),(%,22,23)} (5.10) 


Ce qui fait bien 8 éléments! 


Remarque: L'ordre dans lequel sont différenciés les éléments ne rentre pas en compte lors du 
comptage des parties de l'ensemble de départ. 


En mathématique appliquée, nous travaillerons presque exclusivement avec des ensembles de nombres. 
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Nous nous restreindrons donc à l'étude des définitions et propriétés de ces derniers. 


Maintenant, formalisons les concepts de base permettant de travailler avec les ensembles les plus 
courants que nous rencontrons dans les cursus scolaires de base. 


1. AXIOMATIQUE DE ZERMELO-FRAENKEL 


L'axiomatique de Zermelo-Fraenkel, abrégée "axiomatique ZF-C", présentée ci-dessous a été formulée 
par Ernst Zermelo puis précisée par Adolf Abraham Fraenkel au début du 20ème siècle et complétée 
par l'axiome du choix (d'où le C majuscule dans ZF-C). Elle est considérée comme la plus naturelle 
dans le cadre de la théorie des ensembles. 


Remarque: Il existe bien d'autres axiomatiques, basées sur le concept plus général de "classe", 
comme celle développée par von Neumann, Bernays et Güdel (pour les notations, voir le chapitre 
traitant de la Théorie De La Démonstration). 


Strictement et techniquement parlant, les axiomes de ZF sont des énoncés du calcul des prédicats du 
premier ordre (cf. chapitre de Théorie De La Démonstration) égalitaire dans un langage ayant un seul 
symbole primitif pour l'appartenance (relation binaire). Ce qui suit doit donc seulement être perçu 
comme une tentative d'exprimer en français la signification attendue de ces axiomes. 

A1. Axiome d'extensionnalité: 

Deux ensembles sont égaux si, et seulement si ils ont les mêmes éléments. C'est ce que nous notons: 


A=B&(VreAxeB)A(VreB,xe À) (5.11) 


Donc À et B sont égaux si tout élément x de À appartient aussi à B et tout élément x de B appartient 
aussi à À. 


A2. Axiome de l'ensemble vide: 
L'ensemble vide existe, nous le notons: 

@ (5.12) 
et il n'a aucun élément, son cardinal vaut donc 0. 


En réalité cet axiome peut être déduit à partir d'un autre axiome que nous verrons un peu plus loin mais 
il est pratique à introduire en tant que tel par commodité pédagogique dans les petites classes. 


A3. Axiome de la paire: 


Si À et B sont deux ensembles, alors, il existe un ensemble C contenant À et B et eux seuls comme 
éléments. Cet ensemble C se note alors {A, B}. 


Du point de vue des ensembles considérés comme des éléments cela donne: 


VAVBIC (AeCABEC) (513) 
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Cet axiome montre aussi l'existence du "singleton" (single-seul) d'un ensemble noté: 


{X} (5.14) 


qui est un ensemble dont le seul élément est X (donc de cardinal unitaire). Il suffit pour cela d'appliquer 
l'axiome en posant l'égalité entre A et B. 


A4. Axiome de la somme (dit aussi "axiome de l'union" ou encore "axiome de la réunion"): 


Cet axiome permet de construire la réunion d'un ensemble; dit de façon plus commune: la réunion d'une 
famille quelconque d'un ensemble, est un ensemble. 


Autrement dit, il existe pour tout ensemble quelconque, un ensemble qui contient exactement les 
éléments de tout élément de l'ensemble. La formalisation (peu intuitive) de cet axiome est la suivante: 


VAIBYC (CeB3D(DeAANCeD)) (15 


C'est-à-dire qu'étant donné un ensemble quelconque À, il existe un ensemble B tel que, pour tout 
ensemble C quelconque, C est élément de B si et seulement s'il existe un ensemble D tel que D soit un 
élément À et que C soit un élément de D. 


Un petit exemple particulier ne fera peut-être pas de mal...: 


A=(%:2%,%) 
FO | (516) 
B=| |A= (2},(2%},(x3} 


Nous voyons que conformément à l'axiome, chaque D est un élément de À et que chaque C est un 
élément de D et ce pour chaque C appartenant à B. De même si nous prenons: 


L'ensemble B est donc noté: 


[JA (6:18) 


ou: 


U À (5.19) 


xE À 
A5. Axiome des parties (dit aussi "axiome de l'ensemble des parties"): 


Il exprime que pour tout ensemble À, l'ensemble de ses parties P(A) existe. 
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Donc à tout ensemble À, nous pouvons associer un ensemble B qui contient exactement les parties (in 
extenso les sous-ensembles) C du premier: 


VABVC (CeB&CCA) (520) 


Nous avons vu un tel exemple déjà plus haut avec S'={x,x,,%}: 


P(S)={9,{n},(0},(4},(n,2),(4,23),(22,24}),(%,22,23)} (6.21) 
A6. Axiome de l'infini: 
Cet axiome exprime le fait qu'il existe un ensemble infini. 


Pour le formaliser, nous disons qu'il existe un ensemble, dit "ensemble autosuccesseur" K contenant fi 
(l'ensemble vide) tel que si x appartient à K, alors x L/{x} appartient également à K: 


K est autosuccesseur: & (De KjAfxe K = xuU{x}eK) (522) 


Cet axiome exprime donc que l'ensemble des entiers existe. Effectivement, N est ainsi le plus petit 
ensemble autosuccesseur, au sens de l'inclusion N = {{,{&,{,...}}} et par convention nous notons 
(où nous construisons l'ensemble des naturels): 


0=c 
… (e) 5.23) 
2-(2,(2)) 


A7. Axiome de régularité (dit aussi "axiome de fondation"): 
Le but principal de cet axiome est d'éliminer la possibilité d'avoir A comme élément de lui-même. 


Ainsi, pour tout ensemble non vide À, il existe un ensemble B qui est élément de À tel qu'aucun élément 
de À ne soit élément de B (il faut bien différencier le niveau du langage utilisé, un ensemble et ses 
éléments n'ont pas le même statut) ce que nous notons: 


AD BEA AnB=@ (524) 


En conséquence: 


Démonstration: 


En effet, soit À un ensemble tel que 4 e 4. Considérons le singleton{ A}, ensemble dont le seul élément 
est À. D'après l'axiome de fondation, nous devons avoir un élément de ce singleton qui n'a aucun 
élément en commun avec lui. Mais le seul élément possible est À lui-même, c'est-à-dire que nous 
devons avoir: 


AN{A}=S (5.26) 
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Or par hypothèse, 4 e À et par construction À € { A}. Donc À € AM {A}, ce qui contredit l'assertion 


précédente. Donc: 
AgA (5.27) 


OIC.Q.F.D. 


A8. Axiome de remplacement (dit aussi "schéma de remplacement"): 


Cet axiome exprime le fait que si une formule f est une fonctionnelle alors pour tout ensemble À, il 
existe un ensemble B constitué exactement des images des éléments À par cette fonction. 


Soient, de manière un peu plus formelle, l'ensemble A d'éléments a et la relation binaire f (qui est donc 
en toute généralité une fonctionnelle), il existe un ensemble B constitué des éléments b tel que f(a,b) 
soit vraie. Si f est une fonction où b est non libre cela signifie alors que: 


b = f(a) et B= f(A) (5.28) 
De manière technique nous écrivons cet axiome sous la forme: 


VAVae A 3lbf(a,b) = 1BVae À 3beBf(a,b) (529) 


Donc pour tout ensemble À et tout élément qu'il contient, il existe un et un seul b défini par la 
fonctionnelle f tel qu'il existe un ensemble B où pour tout élément a appartenant à l'ensemble À il existe 
un b appartenant à l'ensemble B défini par la fonctionnelle f. 


Voyons un exemple avec le prédicat binaire suivant qui pour la valeur de tout a de A détermine la 
valeur de tout b de B: 


P(a,b)=(a=11b=2)v(a=3nAb=4) (530) 


Donc de la connaissance que a vaut 1 nous en dérivons que b vaut 2 et de manière similaire (in extenso 
par remplacement) si a vaut 3, nous en dérivons que b vaut 4. 


Nous voyons bien au travers de ce petit exemple la relation forte qu'il y a à considérer le prédicat P 
comme une fonction naïve! Par ailleurs, comme il y une infinité possible de fonctions f, le schéma de 
remplacement est considéré comme une infinité d'axiomes. 


A9. Axiome de sélection (dit aussi "schéma de compréhension"): 


Cet axiome exprime simplement que pour tout ensemble À et toute propriété P exprimable dans le 
langage de la théorie des ensembles, l'ensemble des éléments de À qui satisfont la propriété P existe. 


Donc de manière plus formelle, à tout ensemble À et toute condition ou proposition P(x), il correspond 
un ensemble B dont les éléments sont exactement les éléments x de A pour lesquels P(x) est vraie. C'est 
ce que nous notons: 


B={xeA:P(x)} (531 


De manière plus complète et rigoureuse nous avons en réalité pour toute fonctionnelle f ne comportant 
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pas a comme variable libre: 


VAWVa (aeB&aeAnî) 
C'est typiquement l'axiome qui nous sert à construire l'ensemble des nombres pairs: 
{aeN|2eN,a= 2} 


ou à démontrer l'existence de l'ensemble vide (et qui rend caduc l'axiome de l'ensemble vide) car il 
suffit de poser qu'il existe un ensemble satisfaisant la propriété: 


At A 


et ce quel que soit l'ensemble A. Et seulement l'ensemble vide satisfait cette propriété de par l'axiome 
de sélection. 


Le respect des conditions très strictes de cet axiome permet d'éliminer les paradoxes de la "théorie 
naïve des ensembles", comme le paradoxe de Russel ou le paradoxe de Cantor qui ont invalidé la 
théorie naïve des ensembles. 


Considérons par exemple l'ensemble R de Russell de tous les ensembles qui ne s'auto-contiennent pas 
(notez bien que nous donnons une propriété de R sans expliciter quel est cet ensemble): 


R=-{E:E6E) 


Le problème est de savoir si R se contient ou non. Si Re R, alors, R s'auto-contient, et, par définition 
R& R et inversement. Chaque possibilité est donc contradictoire. 


Si maintenant nous désignons par C l'ensemble de tous les ensembles (l'Universel de Cantor), nous 
avons en particulier: 


FAQeEC 


ce qui est impossible (i.e. par exemple avec la puissance du continu de l'ensemble de réels), d'après le 
théorème de Cantor. 


Ces "paradoxes" (ou "antinomies syntaxiques") proviennent d'un non-respect des conditions 
d'application de l'axiome de sélection: pour définir E (dans l'exemple de Russel), il doit exister une 
proposition P qui porte sur l'ensemble R, qui doit être explicitée. La proposition définissant l'ensemble 
de Russell ou celui de Cantor n'indique pas quel est l'ensemble E. Elle est donc invalide! 


Un exemple fort sympathique et fort connu (c'est la raison pour laquelle nous le présentons) permet de 
mieux comprendre (il s'agit du paradoxe de Russel dont nous avons déjà parlé plus longuement dans le 
chapitre de Théorie De La Démonstration): 


Un jeune étudiant se rendit un jour chez son barbier. Il engagea la conversation et lui demanda s'il avait 
de nombreux concurrents dans sa jolie cité. De manière apparemment innocente, le barbier lui répondit: 
"Je n'ai aucune concurrence. En effet, de tous les hommes de la cité, je ne rase évidemment pas ceux 
qui se rasent eux-mêmes, mais j'ai le bonheur de raser tous ceux qui ne se rasent pas eux-mêmes." 
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En quoi donc, une telle affirmation si simple put-elle mettre en défaut la logique de notre jeune étudiant 
si malin ? 


La réponse est en effet innocente, jusqu'au moment où nous décidons de l'appliquer au cas du barbier: 
Se rase-t-il lui-même, oui ou non? 


Supposons qu'il se rase lui-même: il entre dans la catégorie de ceux qui se rasent eux-mêmes, dont le 
barbier a précisé qu'il ne les rasait évidemment pas. Donc il ne rase pas lui-même. 


Très bien! Supposons alors qu'il ne se rase pas lui-même: il entre alors dans la catégorie de ceux qui ne 
se rasent pas eux-mêmes, dont le barbier a précisé qu'il les rasait tous. Donc il se rase lui-même. 


Finalement, ce malheureux barbier est dans une position étrange: s'il se rase lui-même, il ne se rase pas, 
et s'il ne se rase pas lui-même, il se rase. Cette logique est autodestructrice, stupidement contradictoire, 
rationnellement irrationnelle. 


Vient alors l'axiome de sélection: Nous excluons le barbier de l'ensemble des personnes auxquelles 
s'applique la déclaration. Car en réalité, le problème vient du fait que le barbier est un élément de 
l'ensemble de tous les hommes de la cité. Ainsi, ce qui s'applique à tous les hommes ne s'applique pas 
au cas individuel du barbier. 


A10. Axiome du choix: 


Étant donné un ensemble A d'ensembles non vides mutuellement disjoints, il existe un ensemble B 
(l'ensemble de choix pour A) contenant exactement un élément pour chaque membre de A. 


Indiquons cependant que la question de l'axiomatisation et donc des fondements se trouva quand même 
ébranlée de deux questions à l'époque de leur construction: quels axiomes valides doivent être choisis et 
dans un système d'axiomes la mathématique est-elle cohérente (ne risque-t-on pas de voir apparaître 
une contradiction)? 


La première question fut soulevée d'abord par l'hypothèse du continu: si nous pouvons mettre deux 
ensembles de nombres en correspondance terme à terme, ils ont le même nombre d'éléments (cardinal). 
Nous pouvons mettre en correspondance les entiers avec les rationnels comme nous l'avons démontré 
dans le chapitre sur les Nombres, ils ont donc même cardinal, nous ne pouvons par contre mettre en 
correspondance les entiers avec les réels. La question est alors de savoir s'il y a un ensemble dont le 
nombre d'éléments serait situé entre les deux ou pas? Cette question est importante pour construire la 
théorie classique de l'analyse et les mathématiciens choisissent en général de dire qu'il n'y en a pas, mais 
nous pouvons aussi dire le contraire. 


En fait l'hypothèse du continu est liée de manière plus profonde à l'axiome du choix qui peut aussi être 
formulé de la manière suivante: si C est une collection d'ensembles non vides alors nous pouvons 
choisir un élément de chaque ensemble de la collection. Si C a un nombre fini d'éléments ou un nombre 
dénombrable d'éléments, l'axiome semble assez évident: nous pouvons ranger les ensembles de C en les 
numérotant, et le choix d'un élément dans chaque ensemble est simple. Là où ça se complique c'est 
lorsque l'ensemble C a la puissance du continu: comment choisir des éléments s'il n'y pas la possibilité 
de les numéroter? 


Finalement en 1938 Kurt Gôdel montre que la théorie des ensembles est cohérente sans l'axiome du 
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choix et sans l'hypothèse du continu aussi bien qu'avec! Et pour clore tout ça Paul Cohen montre en 
1963 que l'axiome du choix et l'hypothèse du continu ne sont pas liés. 


1.1. CARDINAUX 


Définition: Des ensembles sont dits "équipotents" s'il existe une bijection (correspondance biunivoque) 
entre ces ensembles. Nous disons qu'ils ont alors même "cardinal" que la norme ISO 3111 préconise 
d'écrire card mais sur le présent site internet nous utiliserons tantôt card que Card. 


Ainsi, plus rigoureusement, un cardinal (qui quantifie le nombre d'éléments contenus dans l'ensemble) 
est une classe d'équivalence (cf. 1 ) pour la relation d'équipotence. 


Remarque: Cantor est le principal créateur de la théorie des ensembles, sous une forme que nous 
qualifions aujourd'hui de "théorie naïve des ensembles". Mais, à côté de considérations 
élémentaires, sa théorie comportait des niveaux d'abstraction élevés. La vraie nouveauté de la 
théorie de Cantor, c'est qu'elle permet de parler de l'infini. Par exemple, une idée importante de 
Cantor a justement été de définir l'équipotence. 


Si nous écrivons €, = c, en tant qu'égalité de cardinaux, nous entendons alors par là qu'il existe deux 
1 C2 


ensembles équipotents À et B tels que: 
c, = Card(A) etc, = Card(B) 


Les cardinaux peuvent donc être comparés. L'ordre ainsi défini est une relation d'ordre total (( 

) entre les cardinaux (la preuve que la relation d'ordre est totale utilise 
l'axiome du Choïx et la preuve qu'elle soit antisymétrique est connue sous le nom de théorème de 
Cantor-Bernstein que nous démontrons d'ailleurs plus bas). 


Dire que &, < €, signifie dans un vocabulaire simple que A est équipotent à une partie propre de B, mais 


B n'est équipotent à aucune partie propre de A. Les mathématiciens diraient que le Card(A) est plus 
petit ou égal au Card(B) s'il existe une injection de A dans B. 


Nous avons vu lors de notre étude des nombres, en particulier des nombres transfinis, qu'un ensemble 
équipotent (ou en bijection) à N était dit "ensemble dénombrable". 


Voyons cette notion un petit peu plus dans les détails: 


Soit À un ensemble, s'il existe un entier n tel qu'il y ait au moins à chaque élément de À un 
correspondant dans l'ensemble {1,2,...n}(au fait rigoureusement il s'agit d'une bijection.. concept que 
nous définirons plus tard) nous disons alors que le cardinal de À, noté Card(A) ou card(A), est un 
"cardinal fini" et vaut n. 


Dans le cas contraire, nous disons que l'ensemble À est de "cardinal infini" et nous posons: 
Card(A) = + 


Un ensemble A est donc "dénombrable" s'il existe une bijection entre A et {. Un ensemble de nombre 
A est "au plus dénombrable" s'il existe une bijection entre A et une partie N . Un ensemble au plus 


dénombrable est donc soit de cardinal fini, soit dénombrable. 
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Nous vérifions dès lors les propositions suivantes: 


P1. Une partie d'un ensemble dénombrable est au plus dénombrable. 
P2. Un ensemble contenant un ensemble non-dénombrable n'est lui aussi pas dénombrable. 


P3. Le produit de deux ensembles dénombrables est dénombrable. 


Remarque: Nous pouvons restreindre un ensemble de nombres par rapport à l'élément nul et aux 
éléments négatifs ou positifs qu'il contient et dès lors nous notons (exemple pour l'ensemble des 
réels): 

= R\{0} 

={x|xeRetx20)} 


={x|xeRetx<0} (5.39) 


#3 # # # x 


Ces notions étant analogues pour N,£,Q (l'ensemble des nombres complexe n'étant pas ordonné, 
la deuxième et troisième ligne ne s'y applique pas). 


Donc tout sous-ensemble infini de N est équipotent à N lui-même, ce qui peut sembler contre-intuitif 
au premier abord...! 


En particulier, il y a autant d'entiers naturels pairs que d'entiers naturels quelconques (utiliser la 
bijection f (x) = 2*) de N vers P, où P désigne l'ensemble des entiers naturels pairs), autant d'entiers 
relatifs que d'entiers naturels, autant d'entiers relatifs que de nombres rationnels (voir le chapitre 
traitant des nombres pour les démonstrations). 


Nous pouvons donc écrire: 


Card(N) = Card(£) = Card(Q) =K;| (5.40) 


et plus généralement, toute partie infinie de @ est dénombrable. 
Un résultat important: tout ensemble infini possède donc une partie infinie dénombrable. 


Puisque nous avons démontré dans le chapitre traitant des nombres que l'ensemble des réels avait la 
"puissance du continu" et que l'ensemble des nombres naturels était de cardinal transfini K, , Cantor 


souleva la question s'il existait un cardinal transfini entre K, et le cardinal de IR ? Autrement dit, nous 


avons donc une quantité infinie de nombres entiers, et une quantité encore plus grande de nombres 
réels. Alors, existe-t-il un infini qui soit à la fois plus grand que celui des entiers et plus petit que celui 
des nombres réels? 


Le problème se posa en notant bien évidemment K, le cardinal de N et (nouveauté) K, le cardinal de 


Page: 198/4839 


EF et en proposant de démontrer ou de contredire que: 


[v3.0 - 2013] 


K, =2* (5.41) 


selon la loi combinatoire qui donne le nombre d'éléments de l'ensemble que l'on peut obtenir à partir de 
tous les sous-ensembles d'un ensemble (tel que nous l'avons démontré précédemment). 


Le reste de sa vie, Cantor essaya, en vain, de démontrer ce résultat que l'on nomma "l'hypothèse du 
continu". [l n'y réussit pas et sombra dans la folie. En 1900, au congrès international des 
mathématiciens, Hilbert estima qu'il s'agissait là d'un des 23 problèmes majeurs qui devraient être 
résolus au 20ème siècle. 


Ce problème se résout d'une façon assez étonnante. D'abord, en 1938, un des plus grands logiciens du 
20ème siècle, Kurt Güdel, démontra que l'hypothèse de Cantor n'était pas réfutable, c'est-à-dire qu'on 
ne pourrait jamais démontrer qu'elle était fausse. Puis en 1963, le mathématicien Paul Cohen boucla la 
boucle. Il démontra qu'on ne pourrait jamais non plus démontrer qu'elle était vraie!!! Nous pouvons 
conclure à juste raison que Cantor avait perdu la raison à chercher à démontrer un problème qui ne 
pouvait pas l'être. 


1.2. PRODUIT CARTÉSIEN 


Si E et F sont deux ensembles, nous appelons "produit cartésien de E par F"' l'ensemble noté Æ x Æ (à 
ne pas confondre avec le produit vectoriel) formé de tous les couples possibles (2, fi où e est un 


élément de E et f un élément de F. 


Autrement écrit: 


EXF={(e,f)leeEASERF}] (5.42) 


Nous remarquons facilement que ExF et MxÆ ne sont pas les mêmes ensembles (sauf bien sur si 
E=F). 


Nous notons le produit cartésien de E par lui-même: 


EXE=Æ?| (5.43) 


et nous disons alors z? est "l'ensemble des couples d'éléments de E". 


Nous pouvons effectuer le produit cartésien d'une suite d'ensembles Æ; x Æ, x...x Æ, et ainsi obtenir 
l'ensemble des n-uplets (a,2,,...,8,) où 4€ £,6,€ Æ&,,..,8,€eÆ,. 


Dans le cas où tous les ensembles Æ; sont identiques à E, le produit cartésien Æ; X Æ, x...x Æ, se note 
bien évidemment g*. Nous disons alors que %* est "l'ensemble des n-uplets d'éléments de E". 


Si E et F sont finis alors le produit cartésien £ x F est fini. De plus: 
Card(E x F) = Card(Æ)'Card(Æ) (5.44) 


De là, nous voyons que si les ensembles Æ,,Æ#,,...,Æ, sont finis alors le produit cartésien 


EX Æ, *x...x Æ, est aussi fini et nous avons: 


Page: 199/4839 


[v3.0 - 2013] 


# 
Card(E,XE,X..xE,) =] [Card(£Æ) (545) 
il 


En particulier, Card(Æ*) =[Card(Æ\f si E est un ensemble fini. 
Exemples: 


E1. Si R est l'ensemble des nombres réels, 1? est alors l'ensemble des couples de réels. Dans le plan 
rapporté à un repère, tout point M admet des coordonnées qui sont un élément de mp. 


E2. Lorsque nous lançons deux dés dont les faces sont numérotées de 1 à 6, chaque dé peut être 
symbolisé par l'ensemble Æ = {1,2,3,4,5,6}. Le résultat d'un lancer est alors un élément de ExÆ.Le 
cardinal de ÆxÆ est alors 36. Il y a donc 36 résultats possibles quand nous lançons 2 dés dont les 
faces sont numérotées de 1 à 6. 


Remarque:La théorie de base des ensembles ainsi que le concept de cardinal sont à la base 
théorique des logiciels de bases de données relationnelles. 


1.3. BORNES 


Soit M un ensemble de nombres quelconques de façon à ce que }f CR (exemple particulier mais 
fréquent) nous avons comme définitions: 


D1. xeR est appelé "borne supérieure" ou "majorant" de l'ensemble M, si x > #4 pour vme M. 
Inversement, nous parlons de "borne inférieure" ou de "minorant" (il ne faut donc pas confondre le 
concept de borne avec le concept d'intervalle!). 


D2. Soit À CR, # ©. xelIR est appelé "plus petite borne supérieure" noté: 
x =supAf (5.46) 


de M si x est une borne supérieure de M et si pour toute borne supérieure y € R nous avons x £ y 
Inversement, nous parlons de "plus petite borne inférieure" que nous notons: 


x=inf M (5.47) 


Les définitions sont équivalentes dans le cadre de l'analyse fonctionnelle (voir chapitre du même nom) 
puisque les fonctions sont définies sur des ensembles. 


Effectivement, soit f une fonction dont le domaine de définition 1 balaie tout IR . Ce que nous notons 
J:E —R etsoit x €R. 


D1. Nous disons que f présente un "maximum global" en x si: 
VreËE, f(x) < f(x) (5.48) 


D2. Nous disons que f présente un "minimum global" en x4 si: 
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VreË,f(x)2 f(x) (5.4) 


Dans chacun de ces deux cas, nous disons que f présente un "extremum global" en x, (c'est un concept 


que nous retrouverons souvent en mécanique analytique!). 


D3. f est "majorée" s'il existe un réel M tel que x € 7, f(x) £ M. Dans ce cas, la fonction possède une 
borne supérieure de f sur son domaine de définition I notée traditionnellement: 


sup f (5.50) 


et elle représente donc la plus petite borne supérieure (le plus petit majorant). 


D4. f est "minorée" s'il existe un réel M tel que Ÿx € À, f(x) 2 M. Dans ce cas, la fonction possède une 
borne inférieure de f sur son domaine de définition 1 notée traditionnellement: 


inf 5.5 
y Ÿ (551 


et elle représente la plus grande borne inférieure (le plus grand minorant). 


D5. Nous disons que f est "bornée" si elle est à la fois majorée et minorée (c'est le cas des fonctions 
trigonométriques). 


2. OPÉRATIONS ENSEMBLISTES 


Nous pouvons construire à partir d'au moins trois ensembles A,B,C, l'ensemble des opérations (dont 
nous devons les notations à Dedekind) existant dans la théorie des ensembles (très utiles dans l'étude 
des probabilités et statistiques). 


Remarque: Certaines des notations présentes ci-dessous se retrouveront fréquemment dans des 
théorèmes complexes, il est donc nécessaire de bien comprendre de quoi il en retourne. 


Ainsi, nous pouvons construire les opérations ensemblistes suivantes: 


2.1. INCLUSIONS 


Dans le cas le plus simple, nous définissons "l'inclusion" par: 


5.02) 


AcBeVrre A=xeBl 


En langage non spécialisé voici ce qu'il faut lire: À est "inclus" (ou "fait partie", ou encore est un "sous- 
ensemble") dans B alors pour tout x appartenant à A chacun de ces x appartient aussi à B: 
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AcB 


B U 


Figure: 5.3 - Exemple visuel de l'inclusion 
où le U dans le coin inférieur droit de la figure représente l'univers (de Cantor). 
De ceci il en découle les propriétés suivantes: 
P1.Si 4c 8 et Bc À alors cela implique 4 = Z et réciproquement. 
P2.Si 4c 8 et BcC' alors cela implique 4cC. 


2.2. INTÉERSECTION 


Dans le cas le plus simple, nous avons: 


AnB= {dre Aetxe B) ae 


En langage non spécialisé voici ce qu'il faut lire: "L'intersection" des ensembles À et B consiste en 
l'ensemble des éléments qui se trouvent à la fois dans A et dans B: 


ANB 


U 


Figure: 5.4 - Exemple visuel de l'intersection 


Plus généralement, si (4) est une famille d'ensembles indexés par ie 7, l'intersection des (4 } ie 


est notée: 


[4 (659 


ie 


Cette intersection est donc définie explicitement par: 
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[4 ={x/vielxeA} (555 


ie 


C'est-à-dire que l'intersection de la famille d'ensembles indexés comprend tous les x qui se trouvent 
dans chaque ensemble de tous les ensembles de la famille. 


Soient deux ensembles A et B, nous disons qu'ils sont "disjoints" si et seulement si: 
AnB=@ (556) 
Par ailleurs, si: 
ENF=@=Card(£ELF)=Card(E)+Card(F) (5.57) 
Les mathématiciens notent cela: 
EUF (5.58) 
et l'appellent "union disjointe". 


On plaisante parfois en disant que la connaissance se construit sur la disjonction.. (ceux qui 
comprendront apprécieront.….). 


Définition: Une collection $'= {$;} d'ensembles non vides forment une "partition" d'un ensemble À si 
les propriétés suivantes sont vérifiées: 


P1. VS,SeSetirjSns,=@ 


p2. 4= US, 
Ses 


Exemples: 
E1. L'ensemble des nombres pairs et l'ensemble des nombres impairs forment une partition de Æ. 


E2. La loi d'intersection " est une loi commutative (voir plus loin la définition du concept de "loi") 
telle que: 


ANnB=BMA (5.59) 


2.3. RÉUNION/UNION 


Dans le cas le plus simple, nous avons: 


AUB= (rre Aou x€ B) FE) 


En langage non spécialisé voici ce qu'il faut lire: La "réunion" ou "union" des ensembles A et B consiste 
en l'ensemble des éléments qui se trouvent dans À et en plus dans B: 
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AUB 


(8 


Figure: 5.5 - Exemple visuel de la réunion 


Plus généralement, si { 4) est une famille d'ensembles indexés par je 7, l'union des (A4 ),i € est 


notée Br: . Cette réunion est définie par: 
ie] 


LA ={x/4e]xeA) (561) 


ie 


C'est-à-dire que la réunion de la famille d'ensembles indexés comprend tous les x pour lesquels il existe 
un ensemble indexé par i tel que x soit inclus dans cet ensemble 4. 


Nous avons les propriétés de distributivité suivantes: 


[4 nB=[J(4n8) 6.6) 


ie iei 
M4 |L2=-1N(402) 663 
ie ie 
La loi de réunion 1 est une loi commutative (voir plus loin la définition du concept de "loi") telle que: 
AUB=BLUA (5.64) 


Nous appelons par ailleurs "lois d'idempotences" les relations (précisons cela pour la culture générale): 


et "lois d'absorptions" les lois: 


AN(AUE) = A 


(5.66) 
AU(ANZ) = A 


Les lois de réunion et d'intersection sont associatives telles que: 


Ann =((A4nBncC 


(5.67) 
AU(BUC) = (AUBUC 
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et distributives telles que: 


An(BUC)=(ANB)U(ANC) 
AU(BNC)=(AUB)N(AUC) 


2.4. DIFFÉRENCE 


Dans le cas le plus simple, nous avons: 
A\B={x|xeAAxeB} (5.69) 


En langage non spécialisé voici ce qu'il faut lire: La "différence" des ensembles À et B consiste en 
l'ensemble des éléments qui se trouvent uniquement dans A (et qui excluent donc les éléments de B): 


A/B 


cp 


Figure: 5.6 - Exemple visuel de la différence 


Si nous nous rappelons du concept de "cardinal" (voir plus haut), nous avons avec les opérations 
précédemment définies, la relation suivante: 


Card (AU B) = Card(A) +Card(B) -Card(AnB) (5.70) 
d'où si An 8 =@: 
Card(Ab PB) = Card(A) +Card(B) (5.71) 


2.5. DIFFÉRENCE SYMÉTRIQUE 


Soit U un ensemble. Pour tout 4,8 € nous définissons la différence symétrique 4AZ entre À et B 
par: 


AAB = (A\B)U(B\A) (5.72) 


En langage non spécialisé voici ce qu'il faut lire: La "différence symétrique" des ensembles À et B 
consiste en l'ensemble des éléments qui se trouvent uniquement dans A et de ceux se trouvant 
uniquement dans B (nous laissons donc de côté les éléments qui sont communs): 
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AAB 


U 


Figure: 5.7 - Exemple visuel de la différence symétrique 
Les propriétés triviales sont les suivantes: 
P1. AAB = BAA 
P2. 4Ap° = 48 (pour la notion de complémentarité voir plus loin) 
P3. AB = (AU BA NB) 


2.6. PRODUIT 


Dans le cas le plus simple, nous avons: 
AXB (5.73) 


En langage non spécialisé voici ce qu'il faut lire: "l'ensemble produit" (à ne pas confondre avec la 
multiplication ou le produit vectoriel) de deux ensembles À et B est l'ensemble des couples tels que: 


(x,»Y),xE À,yeB (5.74) 


L'ensemble produit des réels IR xIR par exemple forme le plan où chaque élément est défini par une 
abscisse et son ordonnée. Nous retrouvons souvent les ensembles produits en mathématiques et en 
physique lors que nous travaillons avec des fonctions. Par exemple, une fonction de deux variables 
réelles qui donne un réel en sortie sera noté: 


JAY) 2 6575) 
E>xE-—"® 


mais cette notation n'est à ma connaissance pas normalisée et il en existe de nombreuses variantes. 


2.7. COMPLÉMENTARITÉ 


Dans le cas le plus simple, nous avons: 


VACB A={x|rxe8,xe À) | 


En langage non spécialisé voici ce qu'il faut lire: Le "complémentaire" est défini comme en prenant B 
un ensemble et A un sous-ensemble de B alors le complémentaire de À dans B est l'ensemble des 
éléments qui sont dans B mais pas dans A. 
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Par exemple, dans la figure ci-dessous nous avons le complémentaire de À par rapport à U qui est 
indiqué en gris (s'il est seul il s'agit donc de l'univers seul qui l'entoure): 


A L' 


U 


Figure: 5.8 - Exemple visuel de la complémentarité 


Une autre notation très importante de la complémentarité qu'on retrouve parfois dans la littérature est la 
suivante: 


y Aou Æ# (5.77) 


où dans le cas particulier à droite ci-dessus, nous pourrions aussi écrire B/A (la notation ;, 4° serait 


rarement utilisée car elle peut prêter à confusion dans certaines situations). 
Nous avons comme propriétés pour tout À, inclus dans B: 


[Ua] -n4 (5.78) 


ie ie 


(4 Î =|J4# (5.79) 


ie iei 


Voici quelques lois triviales relatives aux compléments: 


À=A 
AnAÂ=g 680 
AUA=U 


Il existe d'autres lois très importantes en logique booléenne. Si nous considérons trois ensembles À, B, C 
comme représentés ci-dessous: 
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[\. 
aa 


Figure: 5.9 - Exemple de trois ensembles particuliers 
nous avons donc: 


A\(BNC)=(A\B)U(A\C) 


(5.81) 
A\B\C'={(4\B8)U(AnC) 


et les fameuses "lois de De Morgan" sous forme ensembliste (cf. chapitre de Systèmes Logiques 
Formels) et qui sont données par les relations: 


3. FONCTIONS ET APPLICATIONS 


Définition: En mathématiques, une "application" (ou "fonction") notée f ou À est la donnée de deux 
ensembles, l'ensemble de départ E et l'ensemble d'arrivée F (ou d'image de E), et d'une relation 
associant à chaque élément x de l'ensemble de départ un et un seul élément de l'ensemble d'arrivée, que 
nous appelons "image de x par f "et que nous notons f(x). 


Nous appelons "images" les éléments de f(E) et les éléments de E sont appelés les antécédents. 
Nous disons alors que f est une application de E dans F notée: 
J'E—F (583) 


(se rappeler du premier diagramme sagittal présenté au début de ce chapitre), ou encore une application 
à arguments dans E et valeurs dans F. 


Remarque: Le terme "fonction" est souvent utilisé pour les applications à valeurs numériques, 
réelles ou complexes, c'est-à-dire lorsque l'ensemble d'arrivée est IR ou €. Nous parlons alors de 
"fonction réelle", ou de "fonction complexe". 


Définitions: 


D1. Le "graphe" (ou encore "graphique" ou "représentative") d'une application f : Æ — Æ est le 
sous-ensemble du produit cartésien Æ xÆ constitué des couples (x,f(x)) pour x variant dans E. La 
donnée du graphe de f détermine son ensemble de départ (par projection sur la première composante 
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souvent notée x) et son image (par projection sur la seconde composante souvent notée y). 


D2. Siletriplet f =(Æ,F,1" est une fonction où E et F sont deux ensembles et TC ÆxÆ estun 


graphe, E et F sont respectivement la source et le but de f. Le "domaine de définition" ou "ensemble de 
départ" de f est: 


D,={xeE|%er,(y)el} (5.84 


D3. Etant donnés trois ensembles E, F et G (non vides), toute fonction de ÆExÆ vers G est appelée "loi 
de composition" de ÆxÆ à valeurs dans G. 


D4. Une "loi de composition interne" (ou simplement "loi interne") dans E est une loi de composition de 
£ExÆ à valeurs dans E (cas E-F=G). 


Remarque: La soustraction dans } n'est pas une loi de composition interne bien qu'elle fasse partie 
des quatre opérations élémentaires apprises à l'école. Par contre l'addition sur N en est bien une. 


D5. Une "loi composition externe" (ou simplement "loi externe") dans E est une loi de composition de 
F x Æ à valeurs dans E, où F est un ensemble distinct de E. En général, F est un corps, dit "corps de 
scalaires". 


Exemple: 


Dans le cas d'un espace vectoriel (voir définition beaucoup plus bas) la multiplication d'un vecteur 
(dont les composantes se basent sur un ensemble donné) par un réel est une loi de composition externe. 


Remarque: Une loi de composition externe à valeurs dans E est aussi appelée "action de F sur FE". 
L'ensemble F est alors le domaine d'opérateurs. On dit aussi que F opère sur E (ayez en tête 
l'exemple des vecteurs précédemment cité). 


D6. Nous appelons "image de f", et nous notons Im(f), le sous-ensemble défini par: 


Im(f)=f(E)=(yeF|xeE,y=f(R)| (5:85) 


Ainsi, "L'image" d'une application f : £ — À est la collection des f(x) pour x parcourant E , c'est un 
sous-ensemble de F. 


Et nous appelons "noyau de f", et nous notons Ker(f), le sous-ensemble très important en 
mathématiques défini par: 


Ker(f}= f7{0)\={xe £E|f(x) = 0} (5.66) 


Selon la figure (il faut bien comprendre ce concept de noyau car nous le réutiliserons de nombreuses 
fois pour démontrer des théorèmes ayant des applications pratiques importantes): 
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Im(f) image de f 


Figure: 5.10 - Représentation du concept de noyau d'une fonction 


Remarques: 


R1. Ker(f) provient de l'allemand "Kern", signifiant tout simplement "noyau". En anglais, le noyau 
se dit aussi "kernel", signifiant "amande" dans le civil. 


R2. Normalement les notations Im et Ker sont réservées aux homomorphismes de groupes, 
d'anneaux, de corps et aux applications linéaires entre espaces vectoriels ou modules etc... (voir 
plus loin). Nous n'avons normalement pas l'habitude de les utiliser pour des applications 
quelconques entre ensembles quelconques. Mais bon...ça ne fait rien. 


Les applications peuvent avoir une quantité phénoménale de propriétés dont voici celles qui font partie 
des connaissances générales du physicien (pour plus de renseignements sur ce qu'est une fonction, voir 
le chapitre traitant de l'Analyse Fonctionnelle). 


Soit f une application d'un ensemble E à un ensemble F alors nous avons les propriétés suivantes: 
P1. Une application est dite "surjective" si: 


Tout élément y de F est l'image par f d'au moins (nous insistons sur le "au moins") un élément de E. 
Nous disons encore que c'est une "surjection" de E dans F. Il découle de cette définition, qu'une 
application f : £ — F est surjective si et seulement si À = Im f . En d'autres termes, nous écrivons 
aussi cette définition ainsi: 


VyeF,3xez y= f(x) (587) 


ce qui s'illustre par: 
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Figure: 5.11 - Représentation d'une fonction surjective 
P2. Une application est dite "injective" si: 


Tout élément y de F est l'image par f d'au plus (nous insistons sur le "au plus") un seul élément de 
E. Nous disons encore que f est une injection de E dans F. Il résulte de cette définition, qu'une 
application f : £ — F est injective si et seulement si les relations x,,x,€ E et f(x )= f(x) 


impliquent x, = x, autrement dit: une application pour laquelle deux éléments distincts ont des images 


distinctes est dite injective. Ou encore, une application est injective si l'une aux moins des propriétés 
équivalentes suivantes est vérifiée: 


P2.1 V(x,y}e SG = fP—x=7y 
P22 V{xy)eE x#y= f(x) # f(y) 
P2.3 vye F l'équation en x, y = f(x) a au plus une solution dans E 


Tout cela s'illustrant par: 


Figure: 5.12 - Représentation d'une fonction injective 
P3. Une application est dite "bijective" si: 


Une application f de E dans F est à la fois surjective et injective. Dans ce cas, nous avons que pour tout 
élément y de F , l'équation y = f(x) admet dans E une unique (ni "au plus", ni "au moins") pré-image 
x. Ce que nous écrivons aussi: 


VyeF,ilxez y= f(x) (5.88) 
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ce qui s'illustre par: 


Figure: 5.13 - Représentation d'une fonction bijective 


Nous sommes ainsi tout naturellement amené à définir une nouvelle application de F dans E, appelée 
"fonction réciproque" de f et notée #”?, qui a tout élément y de F, fait correspondre l'élément x de E 


pré-image (ou solution) unique de l'équation y = f(x}. Autrement dit: 


x= ff" {y (6.89 


L'existence d'une application réciproque implique que le graphique d'une application bijective (dans 
l'ensemble des réels...) et celui de son application réciproque sont symétriques par rapport à la droite 
d'équation Y 7%. 


Effectivement, nous remarquons que si y = f(x) est équivalent à x = #”{y}, alors ces équations 
impliquent que le point (x, y) est sur le graphique de f si et seulement si le point (y, x) est sur le 
graphique de f”}. 


Exemple: 


Prenons le cas d'une station de vacances où un groupe de touristes doit être logé dans un hôtel. Chaque 
façon de répartir ces touristes dans les chambres de l'hôtel peut être représentée par une application de 
l'ensemble des touristes vers l'ensemble des chambres (à chaque touriste est associée une chambre). 


- Les touristes souhaitent que l'application soit injective, c'est-à-dire que chacun d'entre eux ait une 
chambre individuelle. Cela n'est possible que si le nombre de touristes ne dépasse pas le nombre de 
chambres. 


- L'hôtelier souhaite que l'application soit surjective, c'est-à-dire que chaque chambre soit occupée. 
Cela n'est possible que s'il y a au moins autant de touristes que de chambres. 


- S'il est possible de répartir les touristes de telle sorte qu'il y en ait un seul par chambre, et que toutes 
les chambres soient occupées: l'application sera alors à la fois injective et surjective nous dirons qu'elle 
est bijective. 
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Remarques: 


R1. Il vient des définitions ci-dessus qu'une application f est bijective (ou "biunivoque") dans 
l'ensemble des réels si et seulement si toute droite horizontale coupe la représentation graphique de 
la fonction en un seul point. Nous sommes donc amenés à faire la seconde remarque suivante: 


R2. Une application qui vérifie le test de la droite horizontale est continument croissante ou 
décroissante en tout point de son domaine de définition. 


P4. Une application est dite "fonction composée" si: 


Soit ® une application de E dans F et # une fonction de F dans G. L'application qui associe à chaque 
élément x de l'élément de E, #{g{x)) de G s'appelle "application composée" de & et de # et se note: 


Ww96@ (5.90) 


EN 


où symbole ” © "est appelé "rond". Aïnsi, la relation précédente s'écrit "psi rond phi" mais se lit "phi 
rond psi"… Ainsi: 


(yo px) = Wgx))| (5.91) 


Soit, de plus, Ÿ une application de G dans H. Nous vérifions aussitôt que l'opération de composition est 
associative: 


to(wopj=(row)o@p (5.92) 
Cela nous permet d'omettre les parenthèses et d'écrire plus simplement: ?°#°@ 


Dans le cas particulier où serait une application de E dans E, nous notons g* l'application composée 
P°spsS..9@ (k fois). 


Ce qui est important dans ce que nous venons de voir dans ce chapitre, c'est que toutes les propriétés 
définies et énoncées ci-dessus sont applicables aux ensembles de nombres. 


Voyons en un exemple très concret et très puissant: 


3.1. THÉORÈME DE CANTOR-BERNSTEIN 


Attention. Ce théorème, dont le résultat peut sembler évident, n'est pas forcément simple à aborder (son 
formalisme mathématique n'est pas très esthétique). Nous vous conseillons de lire très lentement et de 
vous imaginer les diagrammes sagittaux dans la tête lors de la démonstration. 


Voici l'hypothèse à démontrer: Soient X et Y deux ensembles. S'il existe une injection (voir la définition 
d'une fonction injective ci-dessus) de X vers YŸ et une autre de Y vers X, alors les deux ensembles sont 
en bijection (voir la définition d'une fonction bijective ci-dessus). Il s'agit donc aussi d'une relation 
antisymétrique. 
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Ce qui s'illustre par: 


x F 


> le 
Se 


Figure: 5.14 - Représentation d'une relation antisymétrique 


\ 


Pour la démonstration, nous avons besoin en toute rigueur de démontrer au préalable un lemme 
(évident intuitivement mais pas formellement...) dont l'énoncé est le suivant: 


Soient X, Y, Z trois ensembles tels que ZX &Z & F .SiX et Y sont en bijection, alors X et Z sont en 


bijection. 


Un exemple d'application de ce lemme est l'ensemble des nombres naturels et des nombres rationnels 
qui sont en bijection. Dès lors, l'ensemble des entiers relatifs est en bijection avec l'ensemble des 
nombres naturels puisque: 


Démonstration: 
D'abord, au niveau formel, créons une fonction f de Y à X telle quelle soit bijective: 
JF ZX (5.9) 


Nous avons besoin pour la suite d'un ensemble A qui sera défini par l'union des images des fonctions des 
fonctions f (du genre f{(f(f...))) ) des pré-images de l'ensemble Z dont nous excluons les éléments de 

X (ce que nous notons: Z-X ). En d'autres termes (si la première forme n'est pas claire.) nous 
définissons l'ensemble À comme étant l'union des images de (Z-X) par les applications f + f o f.. Ce 
que nous noterons : 


A= Ur" -X) (595) 


#=] 
Nous avons donc par construction 4 X . Rremarquons que nous avons aussi: 
Le] co Le) co 
A=[JS"(Z-X)= (4 -(Üre-x] =Uz(s"(z-X)=US(Z-X) 66 
n=l n=l a=l n=l 


et en réindexant: 
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FJA=Uf"(Z-X) 69 


n=2 
Nous avons alors (faire un schéma de tête des diagrammes sagittaux peut aider à ce niveau-là.…): 
J{Z-Z)UA)= À (5.98) 


Nous pouvons démontrer élégamment cette dernière relation: 


JCZ A) LA)= f(Z -Æ)U (A) = f(Z -HUUSG-HN-ÜS-2-A 
A2 nl 


(5.99) 


Comme Z peut être partitionné (rien nous en empêche!) en les deux sous-ensembles disjoints 


(Z - À) A et (Æ — À) sans oublier que XEZ € F et 4c X ,nous posons comme une 


définition l'application g telle que: 
g:Z À (5.100) 
tel que pour toute pré-image a nous ayons: 
Vae(Z-A) LAB fa) (5.101) 
(rappelez-vous de la définition des applications notées "f") et: 
Vae(Z-Aib a (5.102) 


L'application g est alors bijective car ses restrictions à (Z - #) U A et (Æ — 4), (qui forment une 
partition) sont f et l'identité qui sont par définition bijectives. 


Finalement il existe bien, par construction, une bijection entre X et Z. 


OIC.Q.F.D. 


Reprenons les hypothèses du théorème de Cantor-Bernstein: 
Soit # une injection de X vers Y et #’ une injection de Y vers X 
Nous avons alors: 
AA) CF et WF)CÆ (5.103) 
donc: 
WAY CF) CA (5.104) 


Comme est injective, X et g{Æ) sont par définition en bijection et de même, comme # est 
injective, ÿ{&{ 4) et 4) sont en bijection (là il est bon de relire...). 
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Donc: X et #{g{ 4) sont eux aussi en bijection. 


En utilisant le lemme sur gx ÆX)), &F) et X, il vient donc que gx ÆX)) est en bijection ÿ{F\) ce qui 
nous donne avec ceux que nous avons vu juste précédemment, que puisque aussi #{gXÆX)) et XX) 
sont en bijection, alors que #{F\ est en bijection avec g{X), alors X et Y sont en injection (ouf! c'est 
beau mais c'est aussi vicieux que simple). 


OIC.Q.F.D. 


Ce théorème s'interprèête de la manière suivante: Si nous pouvons compter une partie d'un ensemble 
avec la totalité des éléments d'un autre ensemble, et réciproquement, alors ils ont le même nombre 
d'éléments. Ce qui est évident pour des ensembles finis. Ce théorème généralise alors cette notion pour 
des ensembles infinis et c'est là sa force! 


À partir de là, ce théorème représente l'une des briques de base pour généraliser la notion de tailles 
d'ensembles à des ensembles infinis. 


4. STRUCTURES 


L'algèbre dite "algèbre moderne" commence avec la théorie des structures algébriques due en partie à 
Carl F. Gauss et surtout à Évariste Galois. Ces structures existent en un très grand nombre mais 
seulement les fondamentales nous intéresseront ici. Avant de les détailler, voici un diagramme 
synoptique de ces principales structures et de leur hiérarchie: 


Magma 
Monoïde 
Groupe 
Idéal « Anneau Module 
Anneau intègre Espace vectoriel 
Corps Algèbre Algèbre associative 


Figure: 5.15 - Diagramme synoptique des structures algébriques courantes 


Remarques: Tout en haut du diagramme, la structure au nombre minimal de contraintes, en bas, un 
maximum. Soit, plus nous descendons, plus la structure est en quelque sorte spécialisée. 


Soit pour simplifier les écritures, * une loi de composition (comme l'addition, la soustraction, la 
multiplication ou encore la division, .…).. 


Remarque: Cette notation généralisée est parfois appelée "notation stellaire". 
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Définitions: Soit + et : des symboles de lois internes à un ensemble E (cela pourrait être l'addition et 
la multiplication pour prendre le cas le plus connu) alors: 


D1. x est une "loi commutative" si: 
axb=bxa (5.105) 
D2. *x est une "loi associative" si: 
ax(bxc)=(axb)xe (5.106) 
D3. n est "élément neutre" pour * si: 
axn=n*%xa=a (5.107) 


Nous admettrons par ailleurs sans démonstration (c'est intuitif) que s'il existe un élément neutre, il est 
unique. 


D4,. a' est "l'élément symétrique" (dans le sens général de l'opposé par exemple pour l'addition et 
l'inverse pour la multiplication) de a pour x* si: 


a'*a=axa =}# (5.108) 
Nous admettrons également et sans démonstration que le symétrique de tout élément est unique. 
D5. © est une "loi distributive" par rapport à xsi: 


ao(bxc) =(aob)x(aoc) 
(5.109) 
(a xb)oc =(aoc)x(boc) 


D6. b est "l'élément absorbant" si pour tout a et une loi x nous avons: 


a*b=0 (5.110) 


Remarques: 


R1. Si a est son propre symétrique par rapport à la loi x, les mathématiciens disent que a est 
"involutif". 


R2. Si un élément b de E vérifie 4 xä = bxa = à, alors b est dit "élément absorbant" pour la loi x. 


R3. Il faut toujours vérifier que les neutres et les symétriques le soient "à gauche" et "à droite”. 
Ainsi, par exemple, dans (Z, -), l'élément 0 n'est un neutre qu'à droite car x-0 = x mais 


D-x=-x. 


4.1. MAGMA 


Définition: Nous désignons un ensemble par le terme "magma" M, si les composants le constituant 


sont opérables par rapport à une loi interne x: 
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* est une opération 


(4,*) est un magma si = 
* est une loi inteme 


Remarques: 
R1. Si de plus la loi interne * est commutative, nous parlons de "magma commutatif". 
R2. Si de plus la loi interne x est associative, nous parlons de "magma associatif". 


R3. Si de plus la loi interne * possède un élément neutre, nous parlons de "magma unitaire". 


Il est donc important de se rappeler que si nous désignons une structure algébrique par le terme 
"magma" tout court, cela ne signifie en aucun cas que la loi interne est commutative, associative ou 
même qu'elle possède un élément neutre ! 


Définition: Dans un magma {f,*) , un élément x est dit "élément régulier" (ou "élément simplifiable") 
à gauche si pour tout couple (&,ë)e Af nous avons: 


X*"a= x "b—=a=b (5111) 
Remarque: Nous définissons de même un élément régulier à droite. 


Ainsi, un élément est dit "régulier" s'il est régulier à droite et à gauche. Si * est commutative (ce qui est 
le cas pour un magma commutatif), les notions d'élément régulier à gauche ou à droite coïncident. 
Exemple: 


Dans (N,+\ tout élément est régulier et dans (N,*) tout élément non nul est régulier. 


Un magma {Àf,*) est donc une structure algébrique élémentaire. Il existe des structures plus subtiles 


(monoïdes, groupes, anneaux, corps, espace vectoriels, etc.) dans lesquelles un ensemble est muni de 
plusieurs lois et de différentes propriétés. Nous allons les voir de suite et les utiliser tout au long de ce 
site. 


4.2. MONOÏDE 


Définition: Si la loi x est associative et possède un élément neutre nous disons alors que le "magma 
associatif unitaire" est un "monoïde": 


.. _—— * est associative 
(4 : . est un monoïde si = | ._._ 
* I existe dans Af un élément neutre x pour * 
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Remarques: 


R1. Si de plus la loi interne *x est commutative alors nous disons alors que la structure forme un 
"monoïde abélien" (ou simplement "monoïde commutatif"). 


R2. Dans certains ouvrages nous trouvons aussi comme définition que le monoïde est un "demi- 
groupe" (avec une loi associative) muni d'un élément neutre. 


Montrons tout de suite que l'ensemble des entiers naturels F} est un monoïde abélien totalement 
ordonné (comme nous l'avons partiellement vu dans le chapitre des opérateurs) par rapport aux lois 
d'addition et de multiplication: 


La loi d'addition ( + ) est-elle une opération interne telle que Ya,èe N nous ayons: 
atbh=e (5.112) 
Nous pouvons démontrer que c'est bien le cas en sachant que 1 appartient à N tel que: 
2 à 2+ 
> 1+ 1 = 1 (5.113) 
I LI dl 


Donc £:e N et l'addition est bien une loi interne (nous disons également que l'ensemble N est "stable" 
par rapport à l'addition) et en même temps associative puisque 1 peut être additionné à lui-même par 
définition dans n'importe quel ordre sans que le résultat en soit altéré. Si vous vous rappelez que la 
multiplication est une loi qui se construit sur l'addition, alors la loi de multiplication ( x ) est aussi une 
loi interne et associative ! 


Nous admettrons à partir d'ici qu'il est trivial que la loi d'addition est également commutative et que le 
zéro "0" en est l'élément neutre (n). Ainsi, la loi de multiplication est elle aussi commutative et il est 
trivial que "1" en est l'élément neutre (n). 


Par ailleurs, pour parler déjà de quelque chose qui n'est pas directement en relation avec le monoïde… 


mais qui nous sera utile un peu plus loin, existe-t-il en restant dans la lignée de l'exemple précédent 
pour la loi d'addition ( + ) un symétrique 4 tel que va, € N nous ayons: 


avec re N? 


Il est assez trivial que pour que cette égalité soit satisfaite nous ayons: 


soit: 
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or les nombres négatifs n'existent pas dans N . Ce qui nous amène aussi à la conclusion que la loi 
d'addition ( + ) n'a pas de symétrique et que la loi de soustraction ( - ) n'existe pas dans } (la 
soustraction étant rigoureusement l'addition d'un nombre négatif). 


De même, car cela va aussi nous être utile un peu plus loin, existe-t-il pour la loi de multiplication ( x) 
un symétrique a' tel que 4e N nous ayons: 


a“a=n=]1l (517 
avec a'e N ? 
D'abord il est évident que: 
= 1 
a'=— (5.118) 
a 
Mais excepté pour 4 = 1, le quotient 1/a n'existe pas dans N . Donc nous devons conclure qu'il n'existe 


pas pour tout élément de N de symétriques pour la loi de multiplication et ainsi que la loi de division 
n'existe pas dans j et que la loi de multiplication ne forme pas un monoïde dans cet ensemble. 


Synthèse: 

__ Ni) ON EU 

oui oui 

oui oui 

oui oui 
(zéro "0") non (un "1") non 

_— oui 

(zéro 0") 

non non 


Tableau: 5.1 - Lois et leurs propriétés dans l'ensemble des entiers naturels 


Nous avons par exemple les propriétés suivantes relativement à l'ensemble des entiers naturels et au 
concept de monoïde: 


P1. (N,£,2) est totalement ordonné (attention cette notation est un peu abusive! il suffit qu'il y ait 
juste une des deux relations d'ordre R pour que l'ensemble soit totalement ordonné). 


P2. (N,+) et (N,*) sont des monoïdes abéliens. 
P3. L'élément zéro "O0" est l'élément absorbant pour le monoïde (N,X*). 
P4. Les lois de soustraction et division n'existent pas dans l'ensemble . 


P5. N est un monoïde abélien totalement ordonné par rapport aux lois d'addition et de multiplication 
(attention la notation suivante est abusive car le monoïde n'est composé que d'une seule loi interne et 
d'une relation d'ordre R ce qui donnerait au total 4 monoïdes): 
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(N,+,X,<,2) (5.119) 


Remarques: 


R1.Ilest rare d'utiliser les monoïdes; car souvent, lorsque nous nous trouvons face à une structure 
trop pauvre pour pouvoir vraiment discuter, nous la prolongeons vers quelque chose de plus riche, 
comme un groupe, ou un anneau (voir plus loin) tel que l'ensemble des entiers relatifs. 


R2. Dire qu'une structure algébrique est totalement ordonnée par rapport à certaines lois signifie 
que soit x une loi, et R une relation d'ordre et a, b, c, d quatre éléments de la structure intéressée, 
alors si aRb et cRd implique {4 *c)R(E *d). Nous notons alors cette structure (£$,* À) ou 
simplement (S,R) et en indiquant la (ou les) loi concernée. 


4.3. GROUPES 


Définition: Nous désignons un ensemble par le terme "groupe", si les composants le constituant 
satisfont aux trois conditions de ce que nous nommons la "loi interne de groupe", définie ci-dessous: 


* est associative 
(CG, *) est un groupe si & 4Il existe dans G un élément neutre pour * 


Tout élément de G possède un symétrique pour * 


Dans ce cas, la loi de compositions interne * sera souvent (mais pas exclusivement!) notée "+" et 
appelée "l'addition", le neutre e noté "0" et le symétrique de x noté "-x"!. 


Insistons sur le fait que la structure de groupe est probablement une des plus importantes dans la 
pratique de l'ingénieur et de la physique moderne en général. Raison pour laquelle il convient d'y porter 
une attention toute particulière (cf. chapitre d'Algèbre Ensembliste)! 


Si de plus, la loi interne x est également commutative, nous disons alors que le groupe est un "groupe 
abélien" ou simplement "groupe commutatif". 


S'il existe dans G au moins un élément a tel que tout élément de G est une puissance de a ou du 
symétrique a' de a, nous disons que {&;,*) est un "groupe cyclique de générateur a" s'il est fini, sinon 
nous disons qu'il est "monogène" (nous reviendrons sur les groupes cycliques dans le chapitre d'Algèbre 
Ensembliste). 


Plus généralement un groupe (G; x) d'élément neutre e, non réduit uniquement à {e} sera monogène, 
s'il existe un élément a de G distinct de e tel que G = {e,a!,a? a” ” . Un tel groupe sera 
cyclique, s'il existe un entier n non nul pour lequel 4* = #. Le plus petit entier non nul vérifiant cette 
égalité est alors "l'ordre du groupe". 

Exemple: 


Montrons tout de suite que l'ensemble des entiers relatifs Z est un groupe abélien totalement ordonné 
(comme nous l'avons vu dans le chapitre des Opérateurs) par rapport aux lois d'addition et de 


multiplication. 
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D'abord pour raccourcir les développements, il est utile de rappeler que l'ensemble 7%, est un 
"prolongement" de N par le fait que nous y avons ajouté tous les nombres symétriques de signe négatif 


(NcE£). 


Ainsi, en abusant toujours des notations (car normalement un groupe n'a qu'une seule loi et une seule 
relation d'ordre R suffit à l'ordonner): 


(Z;+,-,$<,2) (5.120) 
forme un groupe abélien totalement ordonné (4 groupes au fait!) et: 
(Æ,X,£,2) (5.121) 
un monoïde abélien (deux monoïdes au fait!) totalement ordonné. 


Remarquons aussi que la loi de division n'existe pas pour tout élément de l'ensemble Æ ! Donc en toute 
généralité nous disons qu'elle n'y existe pas. 


Synthèse: 
2 Go) VS ER RE 
Opération interne oui oui oui 
Associative oui non oui 
Commutative oui non oui 
oui non oui 
(zéro "0") (0 pas neutre à gauche) (un "1") non 
non non Qui 
(zéro 0") 
oui : 
; : oui non 
(signe opposé) 


Tableau: 5.2 - Lois et leurs propriétés dans l'ensemble des entiers relatifs 
Nous avons donc les propriétés suivantes: 


P1. (£, £,2) est totalement ordonné (attention à nouveau cette notation est un peu abusive! il suffit 
qu'il y ait juste une des deux relations d'ordre R pour que l'ensemble soit totalement ordonné). 


P2. (7, +) est un groupe commutatif dont zéro "O0" est l'élément neutre. 
P3. La loi de division n'existe pas dans l'ensemble Æ. 


P4. L'ensemble 7% est un groupe abélien totalement ordonné par rapport à la loi d'addition (attention la 
notation suivante est encore une fois abusive car le groupe est composé que d'une relation d'ordre R ce 
qui donnerait au total 2 groupes): 


(Z,+,£,2) (5.122) 


L'ensemble 7% n'est pas un groupe commutatif totalement ordonné par rapport à la loi de multiplication: 
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Nous voyons de suite alors que #, a des propriétés trop restreintes, c'est la raison pour laquelle il est 
intéressant de le prolonger par l'ensemble des rationnels Q défini de manière très simpliste. par (cf. 
chapitre sur les Nombres): 


(p,g)e Big =0}; (5.124) 


o-[? 
q 


Ce qui signifie pour rappel que l'ensemble des rationnels est défini par l'ensemble des quotients p et q 
appartenant chacun à Z dont nous excluons à q de prendre la valeur nulle (la notation /q signifiant 
l'exclusion). 


Et nous avons évidemment: 


Il est dès lors évident (sans démonstration et toujours en utilisant la notation abusive déjà commentée 
maintes fois plus haut...) que {Q, £, 2) est aussi totalement ordonné et aussi que Q@ est un groupe 
abélien totalement ordonné par rapport à la loi d'addition seulement: 


Ce qui devient intéressant avec @, c'est que la loi de multiplication devient une loi interne et forme un 
groupe abélien commutatif dit "groupe multiplicatif" par rapport à Q”. 


Démonstration: 


Démontrons donc que le symétrique existe pour la loi de multiplication (.) tel que: 


Puisque dans Q" tout nombre peut se mettre sous la forme: 
(5.128) 


avec p eBqer.. 


Alors puisque: 


Il existe donc un symétrique à tout rationnel dans Q” pour la loi de multiplication. 


OIC.Q.F.D. 
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Par définition, ou par construction, la division existe dans Q" et est une opération interne. Mais est-elle 


associative telle que pour Y»,g,r,e Q" nous ayons: 


(pla)tr = pl(gfr) (5.130) 
Démonstration: 


Au fait, la démonstration est assez triviale si nous nous rappelons que la division se définit à partir de la 
loi de multiplication par l'inverse et que cette dernière loi est (elle!) associative. Ainsi, il vient: 


1l Ii 1 1 1 1 
(pla)fr (2)! -»[ii -?(E)rrten pif) = pl (5131) 
gr gr gr F q 


Donc la loi de division n'est pas associative dans Q. 
OIC.Q.FD. 


Nous pouvons aussi nous demander si la loi de division ( / ) est cependant commutative tel que la 
relation: 


alb=bla (5.132) 
pour Va, b eQ'? 


Nous voyons très bien que cela n'est pas le cas puisque nous pouvons écrire cette dernière relation sous 
la forme: 


a b 
—=—=+1—4a=+b (5.133) 
b a 
Synthèse: 
oui oui oui oui 
oui non oui non 
oui non oui | non 
oui non oui oui 
(zéro 0") (0 pas neutre à gauche) (un "1") ("1" neutre à droite) 
_— _— oui oui 
(zéro 0") ("0" au numérateur) 
oui oui non __— 
(signe opposé) (signe opposé) (excepté dans Q}) 


Tableau: 5.3 - Lois et leurs propriétés dans l'ensemble des rationnels 
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Nous avons donc les propriétés suivantes: 


P1. (Q: £,2) est totalement ordonné 
P2. (Q:+,(Q',x) sont indépendamment des groupes abéliens totalement ordonnés 
P3. Zéro "0" est l'élément absorbant par rapport au groupe (Q':7 


P4. L'ensemble Q est un groupe abélien totalement ordonné par rapport aux lois d'addition et de 
multiplication que nous notons: 


(Q:+,2,<) et (Q';x2,<) (5.134) 


Les mêmes propriétés sont applicables à IR et à € mais à la différence que ce dernier n'est pas 
ordonnable. 


Cependant, il peut être compréhensible que pour € vous soyez sceptiques. Développons donc tout 
cela: 


Nous devons nous assurer que la somme, la différence, le produit et le quotient de deux nombres de la 
forme x +iy donne quelque chose d'encore de cette forme. 


Additionnons les nombres #4 +;ib et s +id où a, b, cet d sont des réels: 
(a+tib)+(c+id)=a+ib+c+tid =atc+ib+id =(ate)t+i(b +4) (5.135) 


Donc l'addition est bien une loi interne commutative et associative pour laquelle il existe un élément 
neutre et symétrique dans l'ensemble des complexes. 


Soustrayons les nombres 4 +;ë et c +id où a, b,cet d sont ici encore, des réels: 
(a+ib)-(c+id)=atib-c-id=a-c+ib-id =(a-c)+i(b-d) (5.136) 


Donc la soustraction est une opération interne; elle n'est ni commutative, ni associative elle n'a pas 
d'élément neutre à gauche et pas de symétrique. 


Multiplions maintenant les nombres 4 +:à et «+;4 où a, b,cet d là toujours, des réels. Pour 
parvenir à nos fins, nous emploierons la distributivité de la multiplication par rapport à l'addition. 

(a +ibile ti) =g'cta'i dti be ti bi d 

=a'cti a dti b'co+i bd (5.137) 

=a'cti a dti bh'c+(-D'h'd =(a c-b' d)+i(a d+b'c) 
Donc la loi de multiplication est bien une opération interne commutative, associative et distributive (!) 


pour laquelle il existe un élément neutre et symétrique dans ç* (voir ci-après) dans l'ensemble des 
complexes. 


Une division est avant tout une multiplication par l'inverse. Prouver qu'il existe un inverse c'est prouver 
qu'il existe un symétrique pour la multiplication. Inversons donc le nombre x +:y où x et y sont des 
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réels (différents de zéro): 


L {x —iy) . HT. _ KO _. ZX  : 
"1 : A died 1.1 ici J..4 
ati  (x+iy)(x ip) x Gp) x +y x +y x +y 
Donc l'inverse d'un nombre complexe est bien une opération interne non associative et non 
commutative pour laquelle il existe un élément neutre, et elle est symétrique. Il en est de même pour la 
division, qui correspond au produit par l'inverse d'un nombre complexe. 


Voyons un exemple de groupe cyclique: Dans €, considérons G={1,i,-1,-i} muni de la multiplication 
usuelle des nombres complexes. Alors {&,*) est évidemment un groupe abélien. Un tel groupe est aussi 


monogène car engendré par les puissances d'un de ses éléments: i (ou bien -i). Ce groupe monogène 
étant fini, il s'agit alors d'un groupe cyclique. 


4.4. ANNEAUX 


L'anneau est le coeur de l'algèbre commutative qui est la structure algébrique correspondant aux 
concepts collégiens d'addition, de soustraction, et de multiplication. 


Définition: Un groupe commutatif (ou "groupe abélien") A est un "anneau" s'il est muni d'une seconde 
loi de composition interne vérifiant les propriétés suivante: 


(A, +) est un groupe abélien 
(4, +*%) est un anneau si & 4Laloi * est associative 


Laloi *x est disibutive par rapport à la Loi + 


Comme nous le savons déjà, l'élément neutre de la première loi de composition interne + est noté "0" et 
appelé "zéro" de l'anneau. La deuxième loi interne est souvent notée par un point à mi-hauteur et 
appelée la "multiplication". 
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Remarques: 


R1. Si de plus, la deuxième loi interne de composition *x est également commutative, l'anneau est 
dit "anneau commutatif". Nous rencontrons aussi des anneaux non-commutatifs dans lesquels la 
relation de commutativité n'est pas imposée ou ne s'impose pas et alors nous devons parfois 
l'imposer, il faut alors renforcer la propriété de l'élément neutre de cette deuxième loi en imposant à 
"1" d'être un élément neutre à la fois à droite et à gauche tel que: 14 = &1 = 4 (un exemple d'anneau 
non-commutatif est fourni par l'ensemble des matrices # x # à coefficients dans un anneau À, par 
exemple Àf, IR \- voir chapitre d'Algèbre Linéaire). 


R2. Si de plus, il existe dans A un élément neutre pour la deuxième loi de composition interne *, et 
que cet élément neutre est l'unité "1" nous disons alors que l'anneau est un "anneau unitaire" et 1 


est appelé "unité" de l'anneau. Si l'anneau est commutatif et possède un élément neutre pour la 


deuxième loi de composition interne alors nous parlons "d'anneau commutatif unitaire" 


R3. Si 4 x*b = 0 = (a = 0 ou à = 0), quels que soient les éléments a,b de À, l'anneau est dit "anneau 
intègre" ou "anneau sans diviseurs de zéro" (dans le cas contraire il est bien évidemment "non 
intègre"). 


R4. Un "anneau factoriel" est un anneau commutatif unitaire et be dans lequel le théorème 
fondamental de l'arithmétique (c! pit Théorie No ) est vérifié. 


Définitions: 


D1. Un élément a d'un anneau À est un "élément unité" s'il existe à À tel que 4h = ba =1.Siuntel b 
existe il est unique (nous en avons vu un exemple lors de notre étude des classes de congruence en 
théorie des nombres). 


D2. Soit A un anneau. Nous disons que À possède des diviseurs de zéro s'il existe &,b € À avec 
a #0, #0 et 4.h= 0.Les éléments a et b sont appelés des "diviseurs de zéro”. 

Remarques: 

R1. Il est clair qu'un anneau est intègre si et seulement si il ne possède aucun diviseur de zéro. 


R2. Les notions d'unité et de diviseurs de zéro sont incompatibles mais un élément d'un anneau peut 
être ni l'un ni l'autre. C'est le cas, par exemple, de tous les entiers # {0,-1,1} dans Z. Ce ne sont ni 


des unités, ni des diviseurs de zéro. 


Nous verrons un os important d'anneau dans le cadre de notre étude des polynômes (« 
( Ç ) mais nous en avons déjà vu de très importants lors de notre étude des classes de 
congruence dans le chapitre de théorie des nombres. 


Voyons quelques exemples d'anneaux: Lors de notre étude des groupes nous avons trouvé que les 
structures: 
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(£,+),(Q. +).R,+),(C,+) (5.139) 
sont tous les quatre des groupes abéliens et les trois premiers sont en plus totalement ordonnés. 


La loi de division n'étant en aucun cas associative, nous pouvons nous restreindre à étudier pour chacun 
des groupes précités, le couple de lois: (+) et (x). 


Ainsi, il vient très vite que: 
(Z,+,X),(Q; +X),(R;+,x),(C;:+:X) (5.140) 


constituent des anneaux commutatifs unitaires et intègres. 


Remarque: Nous considérerons comme évident, à ce niveau du discours, que le lecteur aura 
remarqué que est 7, un "sous-anneau" de ( dans le sens où les opérations définies sont internes à 


chacun des ensembles et que les éléments neutres et identité sont identiques et qu'il existe pour 
chaque élément de ces ensembles un opposé qui est dans le même ensemble. Nous allons 
approfondir le concept de sous-anneau un peu plus loin. 


Soit À un anneau. Nous avons les propriétés suivantes: 


Platb=atc—{(b=0c) Va,b,ce A 


P2.0.4=0 vaeAÀ 
P3. (-D'a=-a Vae A 
Démonstrations: 


DM1. La propriété P1 découle de la définition D4 vu tout au début de la partie concernant les 
structures algébriques (tout élément possède un opposé/symétrique). En effet, nous pouvons 
additionner à l'égalité 4 + h = 4 + « l'élément -a. Nous obtenons alors {-a) +a +b =(-a) +a+e par 
l'existence de l'opposé cela donne 0+h=0+ d'où h=c. 


DM2. La propriété P2 découle des définitions D3 (existence de l'élément neutre), D4 (existence de 
l'opposé/symétrique), D5 (distributivité par rapport à l'autre loi) ainsi que de la propriété P1 ci-dessus. 
En effet, nous avons: 


0'ata=0'at+l'a=(0+D'a=l'a=a (5.141) 


Nous avons donc 0 .4+ «= «. La propriété P1 ci-dessus permet de conclure que Ü.4=0 (nous 
pourrions discuter de la pertinence de ce genre de démonstration...). 


DM3. La propriété P3. se montre à l'aide de P2. Nous avons: 
O=0-a=(1+(-1l))a=la+(-Da (5.142) 


en ajoutant -a à cette dernière égalité, nous avons: 
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-a=(-D'à& (5.143) 
OIC.Q.FD. 


4.4.1. SOUS-ANNEAU 


Définition: Soit À un anneau et 5 < À un sous-ensemble de À. Nous disons que S est un "sous-anneau" 
de A si: 


Pl.»eS$ (élément neutre de À est aussi celui deS) 

P2aes=-aes 

P3.abes—atbes 

P4. a,be S=a'èes 

Exemple: 

L'anneau % est un sous-anneau de Q,R 

4.5. CORPS 

Définition: Nous désignons un ensemble de nombres par le terme "corps" si: 


CAT) est un anneau unitaire 
(C,+,*) est un corps si = 
(C-{0} #} est un groupe 


Donc un corps est un anneau non nul dans lequel tout élément non nul est inversible ou en d'autres 
termes: un anneau dont tous les éléments non nuls sont des unités est un corps. 


Remarques: 
R1. Si la loi interne * est également commutative, le corps est dit "corps commutatif". 


R2. Les quaternions (cf. chapitre sur les Nombres) forment par exemple un corps non commutatif 
pour l'addition et la multiplication. 


Voyons des exemples de corps parmi les anneaux unitaires suivant: 
CZ, +,x),(Q: + x), (R; +,xX), (€; +:X) (5.144) 


Il nous faut d'abord déterminer lesquels ne constituent pas des groupes par rapport à la loi interne de 
multiplication ( * ). 


Comme nous l'avons déjà vu dans notre étude des groupes précédemment, il est évident qu'il nous faut 
éliminer {Æ; + *) à cause de l'existence des inverses qui n'est pas assurée dans cet ensemble. 
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Ainsi, les corps fondamentaux de l'arithmétique sont: 


(Q:+,%),(R;+,9,(C;+;X) (5.145) 


et puisque la loi de multiplication ( x ) est commutative dans ces ensembles, nous pouvons affirmer que 
ces corps sont également des corps commutatifs. 


Nous avons souvent dans les petites classes le schéma suivant pour le corps le plus important: 


L'addition est une opération interne 
L'addtion est associative 
(R;+) {L'addition est commutative 
cormmtatis | D existe un élément neutre pour l'addition: O 
Tout nombre réel possède un opposé 
La multiplication est une opération interne 


La multiplication est associative 


(R';x) La multiplication est commutative (R;+, x) 
groupe : An = 1: . cops 
ce Il existe un élément neutre pour la multiplication: 1| natif 
Tout nombre réel non nul possède un inverse (R. +x) 
nn Li. 2. coms. 
La multiplication est dstibutive par rapport à l'addition conmmtatif 
er mor 
Le) HE 


Larelation © est réflexive 


(R;,=) Larelation <= est antisymétrique 
y Larelation < est transitive 


ordonné 
Figure: 5.16 - Propriétés classique de l'ensemble des réels 


Ainsi, nous appellerons "corps" un système C de nombres réels ou complexes a tels que la somme, la 
différence, le produit et le quotient de deux quelconques de ces nombres a appartiennent au même 
système C. 


Nous énonçons également cette propriété de la manière suivante: les nombres d'un corps se 
reproduisent par les opérations rationnelles (addition, soustraction, multiplication, division). Ainsi, il est 
évident que le nombre zéro ne pourra jamais former le dénominateur d'un quotient et l'ensemble des 
entiers ne peut former un corps car la division dans l'ensemble des nombres entiers ne donne pas 
nécessairement un résultat dans ce même ensemble. 
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4.6. ESPACES VECTORIELS 


Lorsque nous définissons un "vecteur" (cf. chapitre de Calcul Vectoriel), nous faisons habituellement 
référence à un "espace euclidien" (cf. aussi chapitre de Calcul Vectoriel) de n dimensions de mR*. 
Cependant, la notion d'espace vectoriel est beaucoup beaucoup plus vaste que ce dernier qui ne 
représente qu'un cas particulier. 


Définition: Un "espace vectoriel (EV)" ou "K-espace vectoriel" (abrégé: K-ev) sur le corps K (nous 
prendrons fréquemment pour ce corps IR ou €) est un ensemble {Æ,+,*) possédant les propriétés: 


(Æ,+) est un groupe abélien 
EXK—E (5.146) 


(x,a) — a *x 


(E,+,*) 


* 
*est une loi externe définie pr | 


Nous avons donc deux lois de composition (en prenant les notations traditionnelles des vecteurs qui 
sera peut-être plus parlante et utile pour la suite….): 


1. Une loi de composition interne: l'addition notée + qui vérifie: 

1.1. Associativité: Vx,y,ZeÆ: (x+y)+z2=x+(y+2) 

1.2. Commutativité: Vx,YEeE: X+ÿ=ÿy+x 

1.3. Élément neutre: De E: V*eE *+0=7% 

1.4. Élément opposé: vx e &,At'e E: *+x'=0Ù 

2. Une loi de composition externe: la multiplication par un scalaire, notée -, qui vérifie: 
2.1. Associativité: VA,ueK,VxeÆ: A (u-x)=(4. 4).x 

2.2. Distributivité à droite par rapport au corps K: VA,ueK,VxeÆ: (A+u).x= A. x+ux 
2.3. Distributivité à gauche par rapport à E: VAeK,Vx,ÿeE: A (x+ÿ)=4 x+4 y 


2.4. Élément neutre (de KsurE): Ve Æ: 1.*=% 
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Remarques: 


R1. Nous disons alors que l'espace vectoriel a une "structure algébrique vectorielle" et que ces 
éléments sont des "vecteurs", les éléments de K des "scalaires". 


R2. Les opérations respectives s'utilisent fréquemment comme l'addition et la multiplication que 
nous connaissons déjà très bien sur If, ce qui est bien commode pour nos habitudes... 


R3. Dorénavant, pour distinguer les éléments du corps K et de l'ensemble E, nous noterons ceux de 
K par des lettres grecques et ceux de E par des lettres latines majuscules. 


R4. Outre les cinq propriétés énumérées ci-dessus, il ne faut pas oublier d'ajouter les cinq autres 


propriétés du groupe abélien (opération interne, commutativité, associativité, élément neutre, 
élément inverse). Ce qui nous fait donc au total dix propriétés à respecter. 


Il est inutile de démontrer que ces propriétés sont respectées pour p* et, par conséquent pour Er}. 
Nous pouvons cependant nous poser la question à propos de certains sous-ensembles de p*. 


Exemples: 


E1. Considérons la région rectangulaire illustrée dans la figure (a) et en perspective dans la figure (c) 
ci-dessous: 


x+y X2 


(a) (b) (c) 


Figure: 5.17 - Exemple du concept d'espace vectoriel 


Ce sous-ensemble de 2 n'est pas un espace vectoriel car, entre autres, la propriété d'opération interne 
du groupe abélien n'est pas satisfaite. En effet, si nous prenons deux vecteurs à l'intérieur du rectangle 
et que nous les additionnons, il se peut que le résultat sorte du rectangle. Par contre, il est facile de voir 
que la droite (infinie) illustrée dans la figure (b) respecte toutes les propriétés énumérées précédemment 
et, par conséquent, défini un espace vectoriel. Notons bien, cependant, que cette droite se doit de 
passer par l'origine, sinon la propriété d'élément neutre du groupe abélien ne serait pas respectée 
(l'élément neutre n'existant plus). 


E2. Un autre exemple d'un espace vectoriel est l'ensemble p2 des polynômes de degré deux ou moins 


(cf. chapitre de Calcul Algébrique). Par exemple, deux éléments de cet espace sont: 
x =17+21+3 
(5.147) 
y={+5 
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Cet ensemble respecte les 10 propriétés d'un espace vectoriel. En effet, si nous additionnons deux 
polynômes de degré deux ou moins, nous obtenons un autre polynôme de degré deux ou moins. Nous 
pouvons aussi multiplier un polynôme par un scalaire sans changer l'ordre (ou degré) de celui-ci, etc. 
Nous pouvons donc représenter un polynôme par des vecteurs dont les termes sont les coefficients du 
polynôme. 


Mentionnons que nous pouvons aussi former des espaces vectoriels avec des ensembles de fonctions 
plus générales que des polynômes. Il importe seulement de respecter les dix propriétés fondamentales 
d'un espace vectoriel ! 


Ainsi défini, un espace vectoriel E sur K est une action de Æ * sur (Æ,+}) qui est compatible avec la loi 
de groupe (par extension un "automorphisme" - voir la définition plus loin - sur (Æ, +) ). 


Définition: Soit E un espace vectoriel, nous appelons "sous-espace vectoriel" (SEV) F de E un 
sous-ensemble de E si et seulement si (notation des matheux): 

F#Q 

VIX,YieF,X+YeF (5.148) 

Vie K,VXeF,AXerF 


ou en utilisant une autre notation (celle utilisée plutôt par les physiciens): 


F=-@ 
Ver? r+ÿer ( 
VieK,VieF,AierF 


El 


.149) 


4.7. ALGÈBRES 


Une "C-algèbre A" où C est un corps commutatif (appelée aussi souvent "K-alègbre A" pour "Kürper" 
en allemand)), est un ensemble A muni de deux lois de composition internes + (addition) et x (produit) 
et d'une loi externe (multiplication) à domaine d'opérateurs C (produit par un scalaire) si et seulement 
si: 


(A,+,) est un C'-espace vectonel 
(A,C,+,,x) estune C'-algèbre s1 = <(4,+,x) est un anneau unitaire (5.150) 
Vie C,Va,be A,(Aa) b=a.(4b)= A(a-b) 


Exemples: 


EL. Pour reprendre un exemple dans la lignée de celui sur les exemples vectoriels, l'espace euclidien 
g* muni de l'addition (+), de la multiplication (-}) et du produit vectoriel (*X) est une IR -algèbre non 


associative et non commutative notée (R°,R,+,,x). 


E2. € est une [R-algèbre (un nombre complexe pouvant être vu comme un vecteur à deux composantes 


selon ce que nous avons vu dans le chapitre des Nombres). 
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5. HOMOMORPHISMES 


Le concept d'homomorphismes (du grec homoios = semblable et morphê = forme) a été défini par les 
mathématiciens car permettant de mettre en évidence des propriétés remarquables des fonctions en 
particulier avec leurs structures, leur noyau, et de ce que nous appelons les "idéaux" (voir plus loin). Ils 
nous permettront ainsi d'identifier une structure algébrique d'une autre. 


Définitions: 


D1. Si (A,*) et (8,2) sont deux magmas (peu importe la notation utilisée pour les lois internes), une 
application f de À dans B est un "homomorphisme de magma" ou "morphisme de magma" (par abus de 
langage nous écrivons parfois juste “"homomorphisme") si: 


f(a*b)= f(a)°f(b) Va,beA| (5.51 


en d'autres termes, si l'image d'un composé dans À est le composé des images dans B. 


D2. Si {4,*) et (B,°) sont deux monoïdes, une application f de A dans B est un "homomorphisme de 
monoïde" si: 


Ja*b)=f(a)°f@) VabeA 
f(u) = 3 


où 1,,1, sont les éléments neutres respectifs des monoïdes A,B. 


D3. Si À, B sont deux anneaux, un "homomorphisme d'anneaux" (très important pour le chapitre de 
Cryptographie!) de À dans B est une application f : 4 — À telle que nous ayons pour tout 4,4'€ À: 


Jdai=l 
f@+a)= f@)+f@) 6153) 
J{a'a)=f(a)f(a 


où 1,,1, sont les éléments neutres des anneaux À, B par rapport à la multiplication. 
Soit f : A— À un homomorphisme d'anneaux. Alors: 

P1. (0j = 0 

P2. f(-a)= -f (a) 

P3. Si a est une unité de À, alors f(a) est une unité de Bet f (a) = f (a) 


Démonstrations: 


DM1. Par f(a+a' = fa) + f(a, nous avons f{& +0) = f{a) + f (0). En ajoutant - f{&) des deux 
côtés de l'égalité, nous obtenons 0 = f(0 


DM2. La propriété P2 découle aussi de {a +a'= fa) + f{a' et de la propriété P1. En effet, nous 
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avons f (0) = fa +(-a)) = fa) + f(-a) = 0. En additionnant - f{&) aux deux côtés de la dernière 
égalité, nous obtenons f(-a) = - f (a). 


DM3. Soient &,b € À tels que ab = ba = 1. Alors par f(a'b) = f(a) f(b) et f(1,) = 1,, nous avons 
1= FD = fab} = f(a)f(b) et de même 1= f(b)f(a) ce qui montre que f(b) est l'inverse de f(a) si b 
est l'inverse de a. 


OC.Q.FD. 


Montrons maintenant qu'un homomorphisme d'anneaux f : A— À est injectif si et seulement si 
l'élément 0 est la seule pré-image de 0 (et donc réciproquement), ce qui se note techniquement: 


Ker(f)} = {0} (5.154) 
c'est-à-dire que le noyau est trivial. 
Démonstration: 
La condition est clairement nécessaire. Montrons qu'elle est suffisante: 


Nous supposons donc que £er(f} = 0. Soit 4,a'e À tel que f'{a) = f{a'. Alors comme nous avons 
un homomorphisme d'anneaux nous pouvons écrire: 


O= f(a)-f(a)=f(a-a) (5155) 
qui implique que 4-x'=0 donc que 4 = a". 


Ce qui montre que f est injectif si c'est un homomorphisme et que et que £er(f) = 0 en est 
effectivement une condition suffisante. 


OC.Q.FD. 


D4. Soient (4,+) et (8,*) , deux groupes et f une application f : A— À. Nous disons que f est un 
"homomorphisme de groupe" si (nous pourrions tout aussi bien mettre * au lieu de + dans le premier 
groupe et + au lieu de * dans le deuxième groupe, la définition resterait la même en remplaçant 
simplement les opérateurs respectifs!): 


fa+y)=f)*f0) Vzrye A 
Fu) = (5.156) 


fa )=(f@)" VreA 


où 1,,1, sont les éléments neutres respectifs des groupes A,B . Nous remarquons que la seule différence 


entre un homomorphisme d'anneau et un homomorphisme de groupe est que ce dernier à deux lois au 
lieu d'une et que nous y rajoutons le concept d'inverse. 


Ceci dit, la troisième proposition ci-dessus est en fait une conséquence de la définition composée 
uniquement des deux premières lignes. Effectivement, considérons un homomorphisme f entre les 
groupes (A,+) et (8,* avec 1, et 1, respectivement les éléments neutres de À et B. 
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Nous avons alors: 


VreA:lp=f(u)=/(xt+x = f()"f(rt) Gisn 
d'où: 
VreA:lg=f(r)*f(x7) (6.158) 


et donc: 


VreA:f(x)= £ (1) (5.159) 


D$5. Soit f une application f : À — 8 d'un corps vers un autre. Nous disons que f est un 
"homomorphisme de corps" si f est un homomorphisme d'anneaux.….. 


Effectivement, le fait que l'homomorphisme de corps soit le même que celui d'un anneau tient juste au 
fait que la différence entre les deux structures est que les éléments du corps sont tous inversibles 
(aucune loi ou propriété de loi ne diffère entre les deux selon leur définition). 


Montrons maintenant que tout homomorphisme de corps est injectif ("homomorphisme injectif") en se 
rappelant que plus haut nous avons démontré que tout homomorphisme d'anneaux l'était! 


Démonstration: 


Si a est différent de 0 et 3 = 471 (nous utilisons ici la propriété que les éléments d'un corps sont 
inversibles!) alors: 


1= FD = f(a-b)= f(a) f@) (5.160) 


Donc lorsque a est différent de zéro f(a) est différent de 0 ce qui prouve que #er(f} = {0} et donc que 
f est injective. 


OIC.Q.F.D. 


D6. Soient À et B deux K-ev et f : A— Æ une application de À dans B. Nous disons que f est une 


"application linéaire" ou "homomorphisme d'espaces vectoriels" (il est sous-entendu que c'est 
relativement aux lois indiquées et pour l'application choisie) si: 


Fx+y)= f{)+f0) V(x,y)e A 


5.161 
fAND=A/G) VreAviek © 


et nous notons L(A,B) l'ensemble des applications linéaires. 
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Remarques: 


R1. Nous avions déjà défini plus haut le concept d'application linéaire mais n'avions pas précisé que 
les deux ensembles À et B étaient des K-ev. 


R2. L'application linéaire est appelée "forme linéaire" si et seulement si 8 = & 


D7. Si l'homomorphisme est bijectif nous dirons alors que f est un "isomorphisme". S'il existe un 
isomorphisme entre À et B, nous disons que À et B sont "isomorphes" et nous noterons cela 4 8. 


Remarque: L'isomorphisme permet au fait d'identifier deux ensembles munis d'une structure 
algébrique identique (que ce soit groupe, anneau, etc.) mais dont les éléments sont nommés d'une 
façon différente. 


D8. Si l'homomorphisme f est une application uniquement interne, nous dirons alors que f est un 
"endomorphisme" (en d'autres termes, nous avons un endomorphisme si dans la définition de 
l'homomorphisme nous avons A=B). 


Remarque: Si nous avons un endomorphisme f de E, f est donc restreint à Im(f). Donc le terme 
"endomorphisme" veut juste dire que l'application f arrive dans E et pas qu'elle touche tous les 
éléments de E. Nous avons f(Æ) € Æ et pas forcément f(Æ) = Æ car dans ce dernier cas nous 
disons que f est surjective comme nous l'avons déjà vu. 


DS. Si l'endomorphisme f est en plus bijectif (donc en d'autres termes si l'homomorphisme est un 
endomorphisme et un isomorphisme), nous dirons alors que f est un "automorphisme". 


5.1. IDÉAL 

Définition: Soit À un anneau commutatif. Un sous-ensemble 5 < 4 est un "idéal" si: 
Pl.a+a'es$ pour tout 4,a'eS 

P2.r.ae$ pourtout ae S ettout re À 


En d'autres termes, un idéal est un sous-ensemble fermé pour l'addition et stable pour la multiplication 
par un élément quelconque de A. 


Exemple: 


L'ensemble des nombres pairs est par un exemple d'idéal de l'ensemble des nombres naturels. 
Remarque: Les idéaux # = {0}et S$ = 4 sont appelés les "idéaux triviaux". 


Pour savoir si un idéal est égal à tout l'anneau, il est utile d'utiliser la propriété suivante qui spécifie que 
si À est un anneau et J un idéal de À, alors si 1e ; nous avons ; = 4. 
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Démonstration: 


Ceci résulte de la propriété P2 de la définition d'un idéal: 


Pour tout » & À, nous avons r =r'1ej car 1e. 


OIC.Q.F.D. 


Un premier exemple d'idéal est donné par le noyau d'un homomorphisme d'anneaux. Effectivement, 
démontrons que le noyau d'un homomorphisme f : À — $ est un idéal de R. 


Démonstration: 
Soient 4,a'e Ker(f}. Alors: 
Jf(ata)=f(a)tf(a)=0+0=0 (5.162) 
ce qui montre que 4 +a'e Ker{f).Soit re R, alors: 
fra) = f(r)f(a)= f{r} 0=0 (5.163) 


ce qui montre que r'a € Ker(f). 
OIC.Q.FD. 


Proposition: Soit À un anneau et soit 4 e A. Le sous-ensemble: 
{ax|xe A} (5.164) 
noté (a) ou aA, est un idéal (nous allons voir un exemple concret après la prochaine définition). 
Définitions: 
D1. Un idéal ; # 4 d'un anneau A est dit "idéal principal" s'il existe 4 e À tel que Z = (a). 
D2. Un anneau dont tous les idéaux sont principaux est dit "anneau principal". 
Montrons maintenant que l'anneau Æ est principal (car tous ses idéaux sont principaux). 
Démonstration: 


Soit 1 un idéal de 7%, (il est facile d'en choisir un: par exemples tous les multiples de 2 ou de 3, etc.). Soit 
re le plus petit entier positif non nul de 1. Nous allons montrer que ; = r£: 


Soit a un élément quelconque de I. La division euclidienne nous permet d'écrire: 
a=grtr" (5.165) 


avec D £r'<r (nous l'avons déjà démontré). 
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Mais comme r'=a-gr et que &,r € À, par la définition d'un idéal, nous avons r'e 7 (la somme ou 
différence des éléments d'un idéal appartenant à l'idéal). Par choix de r (r' étant inférieur à r) ceci 
implique que r'= 0 et donc que 4 74. 


Ainsi tout élément de I est un multiple de r et donc: 
Î=r8 (5.166) 


OIC.Q.F.D. 


La démonstration ci-dessus n'utilise que la division euclidienne sur Æ. Nous pouvons alors généraliser 
ce résultat aux anneaux qui possèdent une division euclidienne. Ainsi, par exemple, l'anneau k[X] des 
polynômes (cf. chapitre de Calcul Algébrique) à coefficients dans un corps k est un anneau principal 
car il possède une division euclidienne. 


Démonstration: 


Soit I un idéal de k[X]. Notons d le plus petit degré que puisse avoir un polynôme non nul de I. Si 4 = 0 
alors 1e Z et donc / =1: ÂTÆ]= £TÆX]. Autrement, soit a(X) un polynôme de degré d. Si 4 (A) € 
alors on peut diviser u(X) par a(X). Il existe g{ÆX),r (A) € TX] tels que degir) < deg(a) = à et 

u(A) = g(Æ)-a(A) +r(A). Donc r (4) € 7 ce qui entraîne > = 0 (autrement contradiction avec la 
minimalité de d). Par suite, &{4) = g{ A. a(Æ\. Nous venons de montrer que ? = a{Æ). KT] 


OIC.Q.F.D. 


Ainsi, les seuls idéaux de 7, sont ceux de la forme ## . De plus si nous avons d et m qui sont des 
entiers > 1. Alors #Æ « dÆ si et seulement si d | m. 


Démonstration: 

Si d| m alors il existe n avec » = d.n. Soit # - « un élément de ##. Alors: 
ma=dnaedÆ (5.167) 

ce qui montre que #E € d&. 


Réciproquement, si » e 4 ceci implique que m est de la forme 4 .# et ceci prouve que d divise m. 
OIC.Q.FD. 


Démontrons aussi qu'un anneau R est un corps si et seulement s'il ne possède que les idéaux triviaux 
{0},R. 


Démonstration: 


Montrons que la condition est nécessaire: Soit 1 un idéal non nul de R et >» e } un élément non nul. Par 
hypothèse (qu'il s'agit d'un corps), il est inversible, c'est-à-dire qu'il existe + « À telque r.t=+t.r=1. 
Ceci implique que 1e Z et donc, par un résultat obtenu plus haut ; = R. 
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Réciproquement, supposons que tout idéal 7 # &Æ soit l'idéal nul. Alors si >» e À est un élément non nul 
de R, l'idéal principal (r) doit être égal à R. Mais ceci implique que 1€ (r) et donc qu'il existe x e À 


avec r.x=1 Ce qui montre que r est inversible. L'anneau R est donc un corps. 
OIC.Q.FD. 


Cette caractérisation va nous permettre de démontrer facilement que tout homomorphisme partant d'un 
corps est injectif. Soit que si f : À — $' est un homomorphisme où R est un corps, alors f est injectif. 


Démonstration: 


Nous mettons ensemble ce qui a été vu jusque-là. Nous avons démontré plus haut que le noyau Ker(f) 
d'un homomorphisme est un idéal. Mais nous avons également démontré plus haut que nous avons soit 
Ker(f) = {0} soit £er(f) = À (car l'anneau R est un corps si et seulement s'il ne possède que les 


idéaux triviaux). 


Mais vu que f {) =1# 0 (de par la définition d'un homomorphisme) il s'ensuit qu'il reste Ker(f) = {0} 
(puisque nous avons démontré que si À est un anneau et 1 un idéal de A alors si 1e 7 alors 7 = À). Ceci 
implique par un théorème précédent (où nous avons démontré que si Ker(f} = {0} l'homomorphisme 


est injectif) que. f est injective. 


OIC.Q.F.D. 


Etudions maintenant les homomorphismes dont l'anneau de départ est 7%. Soit À un anneau et 
f:Æ— A un homomorphisme. Par définition d'un homomorphisme et par ses propriétés, il faut que 
f{0) = 0 et fl) =1. Mail il faut encore que: 


Jim rilTit tb =latlat.+l,=x1l (5.168) 


# 


pour tout » e &. Ainsi f est complètement déterminé par la donnée de f(1) et est donc unique. 
Réciproquement, nous montrons que l'application f : £— A définie par: 


féR)=n14 (5.69) 


est un homomorphisme d'anneaux. En résumé, il existe un et un seul homomorphisme de # dans un 
anneau quelconque A. 


Définition: Soient À un anneau et f : £ — À l'unique homomorphisme défini précédemment. Si f est 
injectif, nous dirons que A est de "caractéristique nulle". Sinon, Ker(f) est un idéal non trivial de Æ et 
comme %Z est dès lors principal (comme nous l'avons démontré plus haut) il est de la forme #7#% avec 
m > 0. L'entier m est appelé la "caractéristique de A. 


Remarque: Moins formellement, la caractéristique d'un anneau est le plus petit entier positif m tel 
que #2: 1, = 0. S'il n'y en a pas, alors la caractéristique est nulle. 


Exemple: 
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L'anneau Z est de caractéristique nulle car l'unique homomorphisme f : £ — Æ£ est l'identité. Il est 
donc injectif. Les injections £ — Q,£ — IR montrent que Q.,R (et € également) sont des corps de 
caractéristique nulle. 


Nous nous proposons maintenant de démontrer que la caractéristique d'un anneau intègre (et en 
particulier d'un corps) est égale 0 ou à un premier p. 


Démonstration: 


Nous montrons la contraposée. Soit À un anneau de caractéristique # - (| avec m non premier. Il existe 
alors des entiers naturels #,7 < ## tels que # = #-r. Soit f : £ — À l'unique homomorphisme (défini 


précédemment). Par définition (de l'idéal) de m, nous avons f(?#) = O0 mais fr) # 0 # f(x). Mais 
alors ff (x) = f(r'#) = fn) = 0 ce qui montre que A n'est pas intègre. 


OC.Q.FD. 
Remarque:La réciproque du théorème n'est pas vraie comme le montre l'exemple de l'anneau 


EF *XIR où l'addition et la multiplication se font composante par composante. C'est un anneau de 
caractéristique nulle mais avec des diviseurs de zéro: 


(10):(0,1)=0 (5.170) 
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Notes personnelles: 
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6. PROBABILITÉS 


L. calcul des probabilités s'occupe des phénomènes aléatoires (dits plus esthétiquement: "processus 


stochastiques" lorsqu'ils sont dépendants du temps), c'est-à-dire de phénomènes qui ne mènent pas 
toujours à la même issue et qui peuvent être étudiés grâce aux nombres et à leurs conséquences et 
apparitions. Néanmoins, même si ces phénomènes ont des issues variées, dépendant du hasard, nous 
observons cependant une certaine régularité statistique. 


Définitions: Il existe plusieurs manières de définir une probabilité. Principalement, nous parlons de: 


D1. "Probabilité expérimentale ou inductive" qui est la probabilité déduite de toute la population 
concernée. 


D2. "Probabilité théorique ou déductive" qui est la probabilité connue grâce à l'étude du phénomène sous- 
jacent sans expérimentation. Il s'agit donc d'une connaissance "a priori" par opposition à la définition 
précédente qui faisait plutôt référence à une notion de probabilité "à posteriori". 


Comme il n'est pas toujours possible de déterminer des probabilités a priori, nous sommes souvent amenés 
à réaliser des expériences. Il faut donc pouvoir passer de la première à la deuxième solution. Ce passage 
est supposé possible en termes de limite (avec une population dont la taille tend vers la taille de la 
population réelle). 


La modélisation formelle par le calcul des probabilités a été inventée par A.N. Kolmogorov dans un livre 
paru en 1933. Cette modélisation est faite à partir de l'espace de probabilités (U, A, P) que nous définirons 
plus loin et que nous pouvons relier à la théorie de la mesure (voir chapitre du même nom). Cependant, les 
probabilités ont été étudiées sur le point de vue scientifique par Fermat et Pascal au milieu du 17ème 
siècle. 


Remarque: Si vous avez un professeur ou un formateur qui ose vous enseigner les statistiques et 
probabilités avec des exemples basés sur des jeux de hasard (cartes, dés, allumette, pile ou face, etc.) 
débarrassez-vous en ou dénoncez-le à qui de droit car cela signifierait qu'il n'a aucune expérience 
pratique du domaine et qu'il va vous enseigner n'importe quoi et n'importe comment (normalement les 
exemples devraient être basés sur l'industrie, l'économie ou la R&D, bref dans des domaines utilisés 
tous les jours par les entreprises mais surtout pas sur des jeux de hasard... !). 


1. UNIVERS DES ÉVÉNEMENTS 
Définitions: 


D1. "L'univers des événements", ou "univers des observables", U est l'ensemble de toutes les issues 
(résultats) possibles, appelées "événements élémentaires", qui se présentent au cours d'une épreuve 
aléatoire déterminée. L'univers peut être fini (dénombrable) si les événements élémentaires sont en 
nombre fini ou continu (non dénombrable) s'ils sont infinis. 


D2. Un "événement" quelconque À est un ensemble d'événements élémentaires et constitue une partie de 
l'univers des possibles U. Il est possible qu'un événement ne soit constitué que d'un seul événement 
élémentaire. 
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Exemple: 


Considérons l'univers de tous les groupes sanguins possible, alors l'événement A "l'individu est de rhésus 
positif" est représenté par: 


A={A4+,B+,AB+,0+)} CU (6.1) 
alors que l'événement B "l'individu est donneur universel" est représenté par: 
B={0-} CU (62) 
qui constitue donc un événement élémentaire. 


D3. Soit U un univers et À un événement, nous disons que l'événement À "à lieu" (ou "se réalise") si lors 
du déroulement de l'épreuve se présente l'issue i (ie U) etque (ie A). Dans le cas contraire, nous 
disons que À "n'a pas lieu". 


D4. Le sous-ensemble vide fi de U s'appelle "événement impossible". En effet, si lors de l'épreuve l'issue 
i se présente, nous avons toujours i & Zi et l'événement fi n'a donc jamais lieu. 


Si U est fini, ou infini dénombrable, tout sous-ensemble de U est un événement, ce n'est plus vrai si U est 
non dénombrable (nous verrons dans le chapitre de Statistiques pourquoi). 


DS. L'ensemble U s'appelle aussi "événement certain". En effet, si lors de l'épreuve l'issue i se présente, 
nous avons toujours ie L} (car U est l'univers des événements). L'événement U a donc toujours lieu. 


D6. Soit À et B deux sous-ensembles de U. Nous savons que les événements A8 et An& sont tous 
deux des sous-ensembles de U donc des événements qui sont respectivement des "événements conjoints" 
et des "événements disjoints". 


Si deux événements A et B sont tels que: 
ANnB=@ (63) 


les deux événements ne peuvent pas être réalisables pendant la même épreuve, nous disons alors qu'ils 
sont des "événements incompatibles". 


Sinon, si: 
ANnBr#@ (64) 


les deux événements peuvent être réalisables dans la même épreuve (possibilité de voir un chat noir au 
moment où on passe sous une échelle par exemple), nous disons inversement qu'ils sont des "événements 
indépendants". 
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1.1. AXIOMATIQUE DE KOLMOGOROV 


La probabilité d'un événement sera en quelque sorte le répondant de la notion de fréquence d'un 
phénomène aléatoire, en d'autres termes, à chaque événement nous allons attacher un nombre réel, 
appartenant à l'intervalle [0,1], qui mesurera sa probabilité (chance) de réalisation. Les propriétés des 
fréquences que nous pouvons mettre en évidence lors d'épreuves diverses nous permettent de fixer les 
propriétés des probabilités. 


Soit U un univers. Nous disons que nous définissons une probabilité sur les événements de U si à tout 
événement À de U nous associons un nombre ou une mesure P(A), appelé "probabilité a priori de 
l'événement A" ou "probabilité marginale de A". 


Al. Pour tout événement A: 


1> P(4)>0 


Ainsi, la probabilité de tout événement est un nombre réel compris entre 0 et 1 inclus (c'est du bon sens 
humain.….). 


A2. La probabilité de l'événement certain ou de l'ensemble (somme) des événements possibles est égale à 
L: 


A3. Si An B = Z sont deux événements incompatibles (disjoints), alors: 


P(AUB) = P(4) + P(B) 


la probabilité de la réunion ("ou") de deux événements incompatibles (ou mutuellement exclusifs) est 
donc égale à la somme de leurs probabilités (loi d'addition). Nous parlons alors de "probabilité disjointe". 


% Exemple: 


Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10%. Nous souhaiterions savoir 
qu'elle est la probabilité qu'une centrale nucléaire rencontre au plus un des deux événements pendant cette 
même période s'ils sont bien incompatibles. Nous avons alors la probabilité qui est la somme des deux 
probabilités ce qui fait 15%... 


Nous retrouverons un exemple de ce genre de probabilité disjointe dans le chapitre de Génie Industriel 
dans la méthode AMDEC (Analyse des Modes de Défaillance, de leurs Effets et de leurs Criticités) pour 
l'analyse de pannes des systèmes à structure complexe. 


Autrement dit sous forme plus générale si (4), est une suite d'événements disjoints deux à deux (4 et 


À; ne peuvent pas se produire en même temps si À # j) alors: 


La] #74 


ieN 
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Nous parlons alors de "o-additivité" car si nous regardons de plus près les trois axiomes ci-dessus la 
mesure P forme une o-algèbre ( ). 


A l'opposé, si les événements ne sont pas incompatibles (ils peuvent se superposer ou autrement dit: ils ont 
une probabilité jointe), nous avons alors comme probabilité qu'au plus un des deux ait lieu: 


P(AU B)= P(4)+P(B)-P(ANE) 


Ceci signifie que la probabilité pour que l'un au plus des événements À ou B se réalise est égale à la 
somme des probabilités pour que se réalise À ou pour que se réalise B, moins la probabilité pour que A et 
B se réalisent simultanément (nous démontrerons plus loin que cela est simplement équivalent à la 
probabilité que les deux n'aient pas lieu en même temps!). 


% Exemple: 


Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10% et que ces deux événements 
ne sont incompatibles. Nous souhaiterions savoir qu'elle est la probabilité qu'une centrale nucléaire 
rencontre tout au plus un des deux événements pendant cette même période. Nous avons alors la 
probabilité qui se calcule à partir de la relation précédente et qui donne alors 14.5%... 


Et donc s'ils étaient incompatibles nous aurions 4" 8 = Zi et nous retrouverions alors bien la probabilité 
disjointe: 


P(AUB) = P(4) + P(B) 


Une conséquence immédiate des axiomes (A2) et (A3) est la relation entre les probabilités d'un événement 
A et son complémentaire, noté À (ou plus rarement conformément à la notation utilisée dans le chapitre de 
Théorie De La Démonstration le complémentaire peut être noté —4 ): 


P(À) = 1- P(A) 
Soit U un univers comportant un nombre fini n d'issues possibles: 

ml Li... 2) 
où les événements: 

=}. =(@&}..24 ={(6) 

sont appelés "événements élémentaires". Lorsque ces événements ont même probabilité, nous disons 
qu'ils sont "équiprobables". Dans ce cas, il est très facile de calculer leur probabilité. En effet, ces 
événements étant par définition incompatibles entre eux à ce niveau de notre discours, nous avons en vertu 
de l'axiome 3 des probabilités: 


P(AUE U.UI,)= P()+ PL) +. + PU) + PQ) 


mais puisque: 
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P(AUL LU. UL = PU)=1 (615) 


et que les probabilités du membre de droite sont par hypothèse équiprobables, nous avons: 
l 
P(4)=P(L)=P(B)=.= P(L)== («çi6 
ñ# 
Définition: Si À et B ne sont pas incompatibles mais qu'ils sont indépendants, nous savons que par leur 
compatibilité À "1 8 # {, alors (très important en statistiques!): 
P(ANB) = P(A)'P(B) (6.17) 


la probabilité de l'intersection ("et") de deux événements indépendants est égale au produit de leurs 
probabilités (loi de multiplication). Nous parlons alors de "probabilité conjointe" (c'est le cas le plus 
fréquent) ou simplement de "probabilité jointe". 


Exemple: 


Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10%. De plus supposons que ces 
2 événements ne soient pas incompatibles (en d'autres termes ils sont compatibles). Nous allons nous 
intéresser à leur indépendance. Ainsi, nous souhaiterions savoir qu'elle est la probabilité qu'une centrale 
nucléaire rencontre les deux événements en même temps, à quel que moment que ce soit, pendant cette 


même période. Nous avons alors la probabilité qui se calcule à partir de la relation précédente et qui donne 
alors 0.05%... 


Autrement dit sous forme plus générale, les événements 4 ,...,4, sont indépendants si la probabilité de 
l'intersection est le produit des probabilités: 


P|f)4 =[ [P4) (6.18) 
ieN 1e N 


Remarque: Attention donc à ne pas confondre "indépendants" et "incompatibles"! 


Donc pour résumer jusqu'ici nous avons donc: 


2 événements incompatibles 
P(AUB)= P(A) + P(B 
(disjoints) CRE 


2 événements incompatibles _ ” 
2 événement non incompatibles P(ANB) = P(4): P(B) 
mais indépendants 


Tableau: 28.1 - Cas classiques de probabilités 


Grâce à la définition précédente, nous pouvons démontrer que la probabilité pour que soit À ou soit B ait 
lieu (donc au moins un des deux mais pas les deux en même temps), est simplement égale à... la 
probabilité que les deux n'aient pas lieu en même temps: 
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P(AU B\= P(4)+ P(B)- P(AN B)= 
P(4)+ P(B)- P(A)P(B) = 1- P(A)P(E) =1- (1- P(4)(- P(B)) 


6.19) 


Nous pouvons aussi à l'aide de cette dernière définition déterminer la probabilité qu'un seul des deux 
événements ait lieu: 


P(A®B)= P(A)P(F)+ P(B)P(A) = P(A)1- P(B))+ P(B)(1- P(4)) 
= P(4)+ P(B)- 2P(A)P(B) = P(A) + P(B)- 2P(AN B) 


(6.20) 


% Exemple: 


Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10%. Nous souhaiterions savoir 
qu'elle est la probabilité qu'une centrale nucléaire rencontre exactement un des deux événements pendant 
la même période en considérant qu'ils ne peuvent avoir lieu en même temps. Nous avons alors la 
probabilité qui se calcule à partir de la relation précédente et qui donne alors 14%... 


Il y a un domaine courant dans l'industrie dans lequel sont appliquées fréquemment les quatre relations 
suivantes (en anglais): 


AND: P(4). P(8) 
OR COMPATIBLE: P(4)+ P(B)- P(AN E) 
OR INCOMPATIBLE: P(4) + P(E) 

XOR : P(A)+ P(B)-2P(AN 8) 


(6.21) 


Il s'agit de "l'analyse par arbres d'erreurs" ou "analyse par arbres probabilistes" qui est utilisée pour 
analyser les raisons possibles de défaillance d'un système quel qu'il soit (industriel, administratif ou autre). 


Pour clore cette partie du chapitre considérons la figure suivante qui montre les diagrammes de Venn (cf. 
chapitre de Théorie Des Ensembles) pour les 16 événements (y compris l'événement impossible) qui 
peuvent être décrits en termes de deux événements donnés À et B. Dans chaque cas, l'événement est 
représenté par la zone rouge: 
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CO ] © (En 


Figure: 6.1 - Diagrammes de Venn possibles pour deux événements 


Considérons la situation où À représente un tremblement de terre et B représente une inondation majeure 
et U l'univers de tous les événements dramatiques pour une centrale nucléaire. Nous considérons que les 
deux événements sont indépendants. Ensuite, chacune des 16 combinaisons d'événements peuvent être 
décrites comme suit, soit mathématiquement ou verbalement. 


1. Un tremblement de terre peut se produire ou une inondation ou rien ou l'ensemble à la fois ou tout autre 
événement (bref n'importe quel événement peut se produire). 


PIUi)=1-100% (6.22) 


2. ALU B : Tout événement incluant un tremblement de terre, une inondation ou les deux en même temps 
peut se produire. 


PIAUBi=PIAI+PIB\-P(ANnB\= PIA\+P(B)i-PIAIP(IB) (6.23) 


3. AU E° : Tout événement incluant un tremblement de terre avec ou sans une inondation peut se 


produire à l'exception des événements incluant une inondation sans tremblement de terre. 
PIAL BE |= P(U)-P(B)+P(ANnB)i=1-P(B)+P(A)P(B) (624) 


4. 4 \L B: Tout événement incluant une inondation avec ou sans tremblement de terre peut se produire à 


l'exception des événements incluant un tremblement de terre sans inondation. 


Page: 252/4839 


[v3.0 - 2013] 


PIÆUB|=PIU)-P(A+P(ANB)=1-P(A)+P(A)P(B) (625) 


5. Æ L 8°: Tout événement peut se produire sauf ceux incluant un tremblement de terre accompagné 
d'une inondation. 


PIA VUE l=PIU\-P(AnBi=1-P(A\P(B) (6.26) 


6. A: Tout événement avec un tremblement de terre peut se produire (cela inclut donc les événements 
associant un tremblement de terre et une inondation). 


PiAi= P(A\ (6.27) 


7. B: Tout événement avec une inondation peut se produire (cela inclut donc les événements associant une 
inondation et un tremblement de terre). 


PIBi= PIB\ (628) 


8. (An BU 4 n £° |: Tout événement peut se produire sauf ceux incluant un tremblement de terre 


sans inondation ou ceux incluant une inondation sans tremblement de terre. 


PliAn Biu (A UE ||= PIU)-PIAi- PIB\+2P(AnB) 


(6.29) 


=1]-P(A;-PIB\+2P(A41P(8) 


9. | An 8° lu 4° LU B |: Tout événement incluant un tremblement de terre sans inondation ou une 


inondation sans tremblement de terre peut avoir lieu. 


PII[AN BE |UI4 UB||= P(A)+P(Bi-2P(ANB) (630) 
10. 2° : Tout événement excepté ceux associés à une inondation peuvent avoir lieu. 
PIB |=P(U)-P(B)=1-P(B) (631) 
11. 4 : Tout événement excepté ceux associés à un tremblement de terre peuvent avoir lieu. 
PiA = PIUi-P(Ai=1-PIA) (632) 


12. 4n 8: Tout événement associant un tremblement de terre et une inondation peut avoir lieu. 


PIANBi=PIAI PIB) (633) 
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13. 4n 8° : Tout événement avec un tremblement de terre sans inondation peut avoir lieu. 


PIAnB|= P(A)- P(A)\P(B) (634) 


14. 4 - B : Tout événement avec une inondation sans tremblement de terre peut avoir lieu. 


PIÆ NnBl=P(B)-P(A\P(B) (6.35) 


15. 4 n 8° : Tout événement peut avoir lieu excepté ceux incluant un tremblement de terre et/ou une 
inondation. 


PIÆ AB = P(U)\-P(AUB\=1-P(A\-P(B\+P(A\P(B\ (6.36) 


16. 4n Æ ou Bn 8° : Événement impossible. 


PIAn A = PIBNBE" |= P(SG\i=0 (637 


1.2. PROBABILITÉS CONDITIONNELLES 


Que pouvons-nous déduire sur la probabilité d'un évènement B sachant qu'un évènement À est réalisé 
sachant qu'il existe une lien entre À et B? En d'autres termes, s'il existe bien un lien entre A et B, la 
réalisation de À va modifier notre connaissance sur B et nous voulons savoir s'il est possible de définir la 
probabilité d'un événement conditionnellement (relativement) à un autre événement. 


Ce type de probabilité est appelée "probabilité conditionnelle" ou "probabilité à posteriori" de B sachant 
A, et se note dans le cadre de l'étude des probabilités conditionnelles: 


P(B/A) (638) 
et souvent dans la pratique pour éviter la confusion avec une possible division: 
P(B]|A) (6.39) 
et nous trouvons parfois chez les américains la notation: 
P(B A À) (6.40) 
Nous avons aussi le cas: 
P(A]|2B) (641) 


qui est appelé "fonction de vraisemblance de A" ou encore "probabilité a priori de A" sachant B. 
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Historiquement, le premier mathématicien à avoir utilisé correctement la notion de probabilité 
conditionnelle fut Thomas Bayes (1702-1761). Aussi parlons-nous souvent de Bayes ou de bayésien dès 
que des probabilités conditionnelles sont en jeu: formule de Bayes, statistique bayésienne… 


La notion de probabilité conditionnelle que nous allons introduire est beaucoup moins simple qu'elle ne 
paraît a priori et les problèmes de conditionnement sont une source inépuisable d'erreurs en tout genre (il 
existe de fameux paradoxes sur le sujet). 


Commençons d'abord par un exemple simpliste: Supposons que nous ayons deux dés. Imaginons 
maintenant que nous ayons lancé seulement le premier dé. Nous voulons savoir quelle est la probabilité 
qu'en lançant le second dé, la somme des deux chiffres vaille une certaine valeur minimale. Ainsi, la 
probabilité d'obtenir cette valeur minimale fixée sachant la valeur du premier dé est totalement différente 
de la probabilité d'obtenir cette même valeur minimale en lançant les deux dés en même temps. Comment 
calculer cette nouvelle probabilité? 


Formalisons la démarche: 


Après le lancer du premier dé, nous avons: 


A= \le résultat du premier lancé est. 


Soit l'hypothèse que £ © À, nous pressentons que P(B / A) doit être proportionnel à P(B), la constante de 
proportionnalité étant déterminée par la normalisation: 


P(A/A)=1 


Soit maintenant 8 < 4° (B est inclus dans le complémentaire de À donc les événements sont 
incompatibles). Il est relativement intuitif... que sous hypothèse précédente d'incompatibilité nous ayons 
la probabilité conditionnelle: 


P(B{ 4) =0 


Ceci nous mène aux définitions suivantes des probabilités à posteriori et respectivement à priori: 


Pi 4 = PA) - AE EC 

P(4) P(B) 
Ainsi, le fait de savoir que A est réalisé réduit l'ensemble des résultats possibles de U de B. A partir de là, 
seules les éventualités de Am8 ont une importance. La probabilité de A sachant B inversement (par 
symétrie) doit donc être proportionnelle à P(An 8)! 


Le coefficient de proportionnalité qui est le dénominateur permet d'assurer l'événement certain. 
Effectivement, si les deux événements À et B sont indépendants (pensez à l'histoire du chat noir et de 
l'échelle par exemple), nous avons donc: 


P(ANB) = P(A): P(B) 


et nous voyons alors P(B / A) qui vaut P(B) et donc A n'apporte rien sur B et réciproquement!! Donc en 
d'autres termes, si À et B sont indépendants nous avons: 


Page: 255/4839 


[v3.0 - 2013] 


P(B/A)=P(B) et P(AIB)=P(4) (647 


Une autre façon assez intuitive pour voir les choses est de se représenter la mesure de probabilité P 
comme une mesure d'aires de sous-ensembles de 2. 


En effet, si À et B sont deux sous-ensembles de [R* d'aires respectives P(A) et P(B) alors à la question de 

savoir qu'elle est la probabilité qu'un point du plan appartienne à B sachant qu'il appartient à À il est assez 

évident de répondre que cette probabilité est donnée par: 
Surface( À) NSurface(B\ 


(6.48) 
Surface (A) 


Indiquons aussi que la définition des probabilités conditionnelles s'utilise souvent sous la forme suivante: 
P(AN B) = P(A/ Bj' P(B) = P(B!/A)P(A) (6.49) 


appelée "formule des probabilités composées". Ainsi, la probabilité à posteriori de B sachant À peut donc 
aussi s'écrire sous la forme: 


P(B1 A) = — . 


% Exemple: 


Supposons une maladie comme la méningite. La probabilité de l'avoir sera notée PC) = 0.001 (chiffre 
arbitraire pour l'exemple) et un signe de cette maladie comme le mal de tête sera noté P(5) = 0.1. 
Supposons connue la probabilité à posteriori d'avoir mal à la tête si nous avons une méningite: 


P(SIM)=09 (651) 
Le théorème de Bayes donne alors la probabilité a priori d'avoir une méningite si nous avons mal à la 
tête!: 


P(SIM)P(M) 


PM IS)= . 


=0.009 (6.52) 


Pour en revenir à la théorie, notons que nous avons aussi: 
P(4)= P((B LB U.UB;)n 4)= P((BNA)U(B NA)U.U(8, N4)) 
= P(A NA)+P(8, N A)+..+P(2, NA) 
= P(AÏ B,)P(B,) + P(AI B,)P(B,) +...+ P(A! B,)P(B,) (6.53) 


= 


Nous pouvons donc connaître la probabilité de l'événement A connaissant les probabilités P(8;) 


élémentaires de ses causes et les probabilités conditionnelles de A pour chaque Ë;: 
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P(A) = À P(AIB,)P(B,) (6.54) 
= 


qui est appelée la "formule des probabilités totales" ou "théorème des probabilités totales". Mais aussi, 
pour tout j, nous avons le corollaire suivant en utilisant les résultats précédents qui nous donne suite à un 


événement À, la probabilité que ce soit la cause 8; qui l'ai produit: 


PE, NA) P(A/B)P(E,) 
P(4) _ D P(A!B,)P(B,) (6.55) 


P(B,/A) = 


qui est la forme générale de la "formule de Bayes" ou "théorème de Bayes" que nous utiliserons un tout 
petit peu en Mécanique Statistique et dans le cadre de l'étude de la théorie des files d'attentes (cf. chapitre 
de Techniques De Gestion). Il faut savoir que les implications de ce théorème sont cependant 
considérables dans le quotidien, dans la médecine, dans l'industrie et dans le domaine du Data Mining 
informatique. 


Nous retrouvons souvent dans la littérature de nombreux exemples d'applications de la relation précédente 
avec uniquement deux issues possibles B relativement à l'événement A. Dès lors nous avons la formule de 
Bayes écrite sous la forme suivante pour chacune des issues: 


P(B 1 A) = P(A! B)P(8) : P(AIB IPB 1 
7 PAIB)P(B)+PA/B)P(E) P(AIB)P(B)+P(AIE PIE | 

P(B, / 4) = P(A! B)P(B:) L P(A/B,\P(B, | Dee 
: P(A/B)P(B)+P(AÎB)P(B)  P|A1B,|P|B, |+P(A/B )P(B) 

et remarquons que dans ce cas particulier (des issues binaires): 
P(B, À A)+ P(B,  4)= PIB / A\+P|B ji À 

: PA! B)PIA . PA! B1P(B 

PIA#B)P(Bi+PIAIBIPIB| PIAIB |P|B |\+P(A/B)P(B 1 
PIA!B)PIA F PIA!B PIB (6.57) 


 P(AIB)P(B)+P(A/BlP(A| P(A/B)PIB)+P(A/A|P(A | 

P(AIB)P(A)+P(AIB)PB) PIAIB IPB )+P(AIB PIB | 

P(AB)P(B)+P(A/BIPIB| P(AIB)P(A)+P(AIA PA). 
ce qui est un résultat intuitif. 


Pour les événements binaires, nous avons aussi (en revenant au théorème des probabilités totales vu plus 
haut): 
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2 
P(4)= D PIAIB,) PIB, = P(A/ B)P(Bi+P(A/B )P(B) 


= P(AIB)PIB)+P(A/B|P(Z | 


% Exemples: 


E1.Une maladie affecte 10 personnes sur 10'000 (soit 0.1% — 0.001). Un test a été développé qui a 5% de 
faux positifs (personnes non atteint pour lequel le test dit qu'ils sont atteintes) mais qui détecte toujours 
cette maladie si une personne est atteinte. Quelle est la probabilité qu'une personne aléatoire pour laquelle 
le test donne un résultat positif a vraiment cette maladie? 


Il y a donc sur 10'000 personnes, 500 qui seront des faux positifs et nous savons a posteriori que 10 
personnes ont réellement la maladie. Alors la probabilité que quelqu'un qui a un résultat de test positif soit 
vraiment malade est: 

PiWM\=0.001 

PIM\= 0.999 

PITIMi=1 

PIT{ M \= 0.05 (6.59) 

PIT\i= PITIM\iPIMi+PITIM \PIM \=005095 
PITIMi\PiM\i  1.0.001 


= = 0.19627 
P(T) 0.05095 


PIMITi- 


Ce résultat est souvent contre-intuitif et même scandaleux. Il met aussi en évidence pourquoi les tests de 
diagnostiques doivent être extrêmement fiables! 


E2. Deux machines À et M, produisent respectivement 100 et 200 pièces. M, produit 5% de pièces 
défectueuses et À, en produit 6% (probabilités a posteriori). Quelle est la probabilité a priori pour qu'un 


objet défectueux ait été fabriqué par la machine À, ? 


L'événement constaté À est donc la présence d'une pièce défectueuse et la probabilité recherchée est la 
probabilité a priori que celle-ci provienne de la machine À# . 


Nous avons alors: 


PU, 14) P(AIM;)P(4,) | P(AIM)P(2) 
; D'P(AIM,)P(M,) P(AIM)P(M)+P(A/M)P(M2) 
_5 100 50, | (6.60) 
100 300 3 
= = ——— = 0.29 
510,6 20 41;ç062 
100 300 100 300 3 3 


E3. D'un lot de 10 pièces dont le 30% est défectueux, nous prélevons sans remise un échantillon de taille 
3. Quelle est la probabilité que la seconde pièce soit bonne (quelle que soit la première)? 
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Nous avons: 


P(4) = SP(AIB,)P(8) > P(AIB,)P(B,) 


=] = 


= P(AIB,)P(B)+P(A/B)P(B)= re = 70% 


où P(A/B) est la probabilité que la deuxième soit bonne sachant que la première est mauvaise et 
P(AÏ B,) est la probabilité que la deuxième soit bonne sachant que la première est bonne. P(B) est 


donc la probabilité que la première soit mauvaise, P(B;, ) la probabilité que la première soit bonne. 


E4. Terminons avec un exemple important dans les entreprises où les employés doivent plusieurs fois dans 
leur carrière passer des examens sous forme de questionnaire à choix multiples (Q.C.M.). Si un employé 
répond à une question de deux choses l'une: soit il connaît la réponse, soit il la devine. Soit p la probabilité 
que l'employé connaisse la réponse et donc 1-p celle qu'il la devine. Nous admettons que l'employé qui 
devine répondra correctement avec une probabilité 1/m où m est le nombre de réponses proposées. Quelle 
est alors la probabilité a priori qu'un employé connaisse (réellement) la réponse à une question à 5 choix 
s'il y a répondu correctement? 


Soient B et À respectivement les événements "l'employé connaît la réponse" et "l'employé répond 
correctement à la question". Alors la probabilité à priori qu'un employé connaisse (réellement) la réponse 
à une question qu'il a répondu correctement est: 


P(B1 = P(Ai B)P(E) : 1.p 


_ PAÏB)P(B)+POAÎD)PCE) 1 lp 
FR 


L'analyse bayésienne fournit donc un outil puissant de formalisation du raisonnement dans l'incertain et 
les exemples que nous avons montrés illustrent surtout à quel point cet outil est délicat à employer. 


1.2.1. ESPÉRANCE CONDITIONNELLE 


Maintenant, passons à la version continue de la probabilité conditionnelle en abordant le sujet directement 
avec un exemple particulier (la théorie avec le cas général étant indigeste) infiniment important dans le 
domaine de statistiques sociales et de la finance quantitative. Cependant, ce choix (de l'étude d'un cas 
particulier) implique que le lecteur ait lu au préalable le chapitre de Statistiques pour y étudier les 
fonctions de distributions continues et plus particulièrement celle de la loi de Pareto. 


Donc voilà le scénario: Souvent, en sciences sociales ou en économie, nous trouvons dans la littérature 
spécialisée traitant des lois de Pareto des affirmations du type suivant (mais quasiment jamais avec une 
démonstration détaillée): quel que soit votre revenu, le revenu moyen de ceux qui ont un revenu supérieur 
au vôtre est dans un rapport constant, supérieur à 1, à votre revenu si celui-ci suit une variable aléatoire de 
type Pareto. Nous disons alors que la loi est isomorphe à toute partie tronquée elle-même. 


Voyons de quoi il s'agit exactement: 


Soit X une variable aléatoire égale au revenu et suivant une loi de Pareto de densité ( 


> 
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x 
fi=k mr (6.63) 


avec & >1,x, >0,x2 x, et qui a pour fonction de répartition (voir aussi le chapitre de Statistique pour la 
démonstration détaillée): 


£ 
P(X £ x)= 1-(2) (6.64) 
x 


La phrase commence par "quel que soit votre revenu...", choisissons donc un revenu quelconque 
X0 À Xm :- 


A présent nous devons calculer "le revenu moyen de ceux qui ont un revenu supérieur à xp ". Il s'agit donc 
de calculer l'espérance (le revenu moyen) d'une nouvelle variable aléatoire Y qui est égale à X mais 
restreinte à la population des personnes ayant un revenu supérieur à xg : 


F= À lex2x } (6.65) 
La fonction de répartition de Y est donnée par: 
PIF<xi= PIX <x|Æ 2m) (6.66) 
Cette expression est naturellement nulle si x £ xp. 


Bon, jusqu'à maintenant nous n'avons fait que du vocabulaire. D'abord rappelons la relation de probabilité 
conditionnelle suivante vue plus haut: 


P(BI À) = TE . 


pour x? xy nous avons la loi conditionnelle à priori: 


Pix SX <xi 
FhÉSNÉEAIR Se (6.68) 
l = À | 


Avant d'aller plus loin, il faut être conscient que le numérateur et dénominateur sont indépendants mais 
que l'ensemble doit être toutefois considéré comme la réalisation d'une seule et unique variable aléatoire 
que nous noterons Y. Par ailleurs, seulement le numérateur est dépendant d'une variable. Le dénominateur 
peut lui être considéré comme une constante de normalisation. 


Nous voyons donc que la densité de Y est donnée par la fonction: 


( Y <%) 
Jro)= y) » > x (6.69) 
PIX 2x 


A présent nous pouvons calculer l'espérance de Y: 
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- LS fiyi + 
E(F) = dy = — y = ——— {yid 
Œ)= | #7 O)d> rx) Pas #0 dy 
L x 
Fazn) l*} 4 FXEn) | y Y Paen) | W (6.70) 
Es 1 1 ke 


CPiXemiG-D il PILE) GED 


Sachant que: 


+ À x* x ü 
PiXZ2%i= |# Ce dx= = | (6.71) 
x ZX 209 09 
Nous avons au final: 
& 
E(F) = — s 
= (6.72) 


E(Y) représente donc le revenu moyen de ceux qui ont un revenu supérieur à x et comme on peut le 


constater de l'égalité ci-dessus il est bien dans un rapport constant, supérieur à 1, à votre revenu zx. 


Nous pouvons vérifier ce résultat en faisant une simulation de Monte-Carlo dans un tableur (c'est 
intéressant de le mentionner pour généraliser à des cas non calculable à la main). Il suffit effectivement 
d'y simuler l'inverse de la fonction de répartition: 


1 
k 
Ya Am (6.73) 
1- PX <x) 


soit dans MS Excel 11.8346 (version anglaise): 
—($B$7"$B$6/(1-RANDBETWEEN(1;10000)10000)) (1/$B$6) 


et ensuite de prendre la moyenne des valeurs obtenues supérieurs ou égales à un X donné (ce qui 
correspondra à xn ) et vérifier que nous obtenons bien le résultat démontré précédemment! 


Evidemment, nous pourrions aussi calculer la variance conditionnelle (in extenso l'écart-type 
conditionnel). Cela viendra peut-être un jour. 


1.2.2. RÉSEAUX BAYÉSIENS 


Les réseaux bayésiens sont simplement une représentation graphique d'un problème de probabilités 
conditionnelles qui permet de mieux visualiser l'interaction entre les différentes variables lorsque que 
celles-ci commencent à être en grande nombre. 
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C'est une technique de plus en plus utilisée dans le décisionnel assisté par logiciel (Data Mining), 
l'intelligence artificielle (AT) et également dans l'analyse et la gestion du risque (norme ISO 31010). 


Les réseaux bayésiens sont par définition sont des graphes orientés acycliques ( 
), afin qu'un événement ne puisse pas (même indirectement) influencer sa propre probabilité, avec 
description quantitative des dépendances entre événements. 


Ces graphes servent à la fois de modèles de représentation des connaissances et de machines à calculer des 
probabilités conditionnelles. Ils sont surtout utilisés pour le diagnostic (médical et industriel), l'analyse de 
risques (diagnostics de pannes, anomalies ou accidents), la détection des spams, l'analyse de texte de voix 
et d'images, l'analyse d'opinions, la détection de fraudeurs ou de mauvais payeurs ainsi que dans le data 
mining (EGC: Extraction et Gestion de la Connaissance) en général. 


Remarque: De nombreux systèmes et logiciels permettent de construire et d'analyser des réseaux 
bayésiens sur la base de dessins ou de d'informations existantes dans des bases de données. Solutions 
payantes: SQL Server, Oracle, Hugin. Solutions gratuits (à ce jour): Tanagra, Microsoft Belief 
Network MSBNX 1.4.2, RapidMiner. Personnellement je préfère la simplicité du petit logiciel 
MSBNX de Microsoft. Pour information, en 10 ans d'expérience professionnelle en tant que consultant 
je n'ai rencontré à ce jour qu'une seule entreprise parmi plus de 800 multinationales dans mon 
portefeuille qui utilisait les réseaux de bayésiens. (dans le domaine des transports). 


Utiliser un réseau bayésien s'appelle faire de "l'inférence bayésienne". En fonction des informations 
observées, nous calculons la probabilité des données possibles connues mais non observées. 


Pour un domaine donné (par exemple médical), nous décrivons les relations causales entre variables 
d'intérêt par un graphe (plus besoin de préciser qu'il est acyclique). Dans ce graphe, les relations de cause 
à effet entre les variables ne sont pas déterministes, mais probabilisées. Ainsi, l'observation d'une cause ou 
de plusieurs causes n'entraîne pas systématiquement l'effet ou les effets qui en dépendent, mais modifie 
seulement la probabilité de les observer. 


L'intérêt particulier des réseaux bayésiens est de tenir compte simultanément de connaissances a priori 
d'experts (dans le graphe) et de l'expérience contenue dans les données. 


Exemple de 5 variables avec relations (graphe orienté acyclique) et numérotation des états/variables (en 
anglais: "states"): 


Page: 262/4839 


[v3.0 - 2013] 


Figure: 6.2 - Exemple de réseau bayésien (acyclique orienté) à 5 états 


Évidemment, la construction du graphe causal se fonde principalement sur le retour d'expériences (REX) 
et résulte parfois de normes ou de rapports de comités d'experts. Dans l'informatique, le graphe causal 
évolue automatiquement en fonction des bases de données (pensez à la librairie Amazon qui cible les 
publicités en fonction de vos achats passés en temps réel ou au service Genius de Apple). Cependant nous 
pourrons rarement penser à toutes les possibilités et 1l y aura aussi parfois des états cachés entre deux états 
qui auront été oubliés mais qui auraient permis de mieux modéliser la situation. 


Imaginons dans l'exemple ci-dessus qu'à l'aide d'une base de données d'une entreprise, nous sachions que 
sur 100'000 jours hommes, nous avons eu dans cette entreprise 1'000 accidents du travail (soit 1% du 
total) et 100 pannes machines (soit 0.01% du total). Nous représentons cela alors sous la forme 
traditionnelle suivante: 
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P(S1)-[1%,99%] P(S2)-[0.1%,99.9%] 


Accident du travail 
$1 


Figure: 6.3 - Réseau bayésien acyclique orienté avec probabilités de départ 


où nous avons le sous-ensemble S2, S4, SS qui constitue ce que les spécialistes appellent une "connexion 
série ou linéaire", le triplet S3, S2, S4 constitue une "relation divergente" (si les flèches pour ce triplet 
étaient inversées, nous aurions une "relation convergente"). 


Avant d'aller plus loin avec notre exemple faisons quelques constats par rapport à ces trois types de 
relations: 


" 


Pour toute clarté, distinguons d'abord "l'indépendance conditionnelle" de la "dépendance conditionnelle". 


Nous disons que des événements À et C sont "indépendants conditionnellement" si étant donné un 
événement B l'égalité suivante est vérifiée: 


PiAÏBi=PIAÎB C1 (6.74) 


Donc le qualificatif "conditionnellement" implique la présence de B et le fait que C n'influence pas la 
probabilité de l'événement A. 


Concernant la "dépendance conditionnelle", nous pouvons cette fois distinguer 3 types de relations. 


1. La dépendance conditionnelle du type suivant est appelée "connexion série ou linéaire" (déjà 
mentionnée plus haut): 
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Figure: 6.4 - Réseau bayésien en connexion série/linéaire 


où À, B et C sont dépendants (dans cet exemple particulier 1l y a 3 nœuds dépendants À, B et C mais d'une 
manière générale cette dépendance concernerait tous les noeuds s'il y en avait plus de 3). 


En outre À et C sont dépendants mais conditionnellement à B. Mais si la variable B est connue, A 
n'apporte plus aucune information utile sur C (le cheminement de l'incertitude est en quelque sorte rompu) 
et dès lors À et C deviennent indépendants conditionnellement. Nous avons la probabilité conditionnelle 
qui se simplifierait donc sous la forme suivante: 


P(C/B,A)=P(C18B) (6.75) 


2. La dépendance conditionnelle du type suivant est appelée "connexion divergente" (aussi déjà 
mentionnée plus haut): 


Figure: 6.5 - Réseau bayésien divergent 
où l'ensemble des nœuds sont dépendants. 


En outre B et C sont dépendants conditionnellement à À. Mais si À est connue, B n'apporte plus aucune 
information sur C (à nouveau le cheminement de l'incertitude est en quelque sorte rompu) et dès lors B et 
C deviennent indépendants. Nous avons donc par exemple si A est connue: 


PIC/#A,Bi= PIC I A1 (676) 


3. La dépendance conditionnelle du type suivant est appelée "connexion convergente" ou "V- 
Structure" (aussi déjà mentionnée plus haut): 
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Figure: 6.6 - Réseau bayésien convergent 
où cette fois les parents sont indépendants. 


Donc B et C sont indépendants mais deviennent dépendants conditionnellement à A. Si A est connue, nous 
avons alors: 


P(A/B,C)=P(AIB) (6.77) 


La dépendance entre les parents passe donc par l'observation de leur enfant commun. 


Maintenant, pour faire un exemple concret, imaginons que notre base de données nous donne (grâce aux 
responsables qualité qui ont toujours su saisir les anomalies qualité) que lorsqu'une panne machine a eu 
lieu, 99 fois sur 100 (99%) il y a eu un arrêt total de la production (donc in extenso 1 fois sur 100: 1% il 
n'y pas eu d'arrêt de la production) et que sur tous les arrêts de la production 1% n'était pas dû à une panne 
machine. Ce que nous représentons traditionnellement sous la forme suivante: 
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P(S1)-[1%,99%] P(S2}-[0.1%,99.9%)] 


Accident du travail 


S1 P(S4/S2) 


Panne machine 


Arrêt production 


Figure: 6.7 - Réseau bayésien de ler niveau 


Donc la "probabilité implicite" qu'il y ait un arrêt de la production est donnée par: 
PIS4\= PIS4i S2)P(S2)+ P|S4/ S2 Pa S21= 99%. 0.1% +1%.99.9% =1.098% (6.78) 


Ce chiffre représente donc la proportion implicite d'arrêts de production parmi les 100'000 jours hommes 
(nous pouvons donc donner une proportion de lignes de la base données représentant un arrêt production 
quelle que soit la cause et ce sans même avoir les détails de la base de données). 


Il en découle immédiatement alors la probabilité implicite qu'il n'y ait pas d'arrêt de la production: 


PIS4)=1-P(S41z98.902% (6.79) 


Ce qui est conforme à ce que nous donne le logiciel gratuit MSBNX 1.4.2: 
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(ArretProduction) 


= (0.01098) 


C'\Users\soz Vincent\Downioads\Model xbn 
Figure: 6.8 - Début du réseau bayésien dans MSBNX 1.4.2 


Maintenant supposons que nous avons observé un arrêt de la production. Quelle est la probabilité à 
posteriori qu'il soit dû à une panne machine? Nous avons alors: 
PIS4/ S21PIS21 99%.0.1% 


P(S4) does 


PIS2/54\1= 


Ce que nous pouvons aussi vérifier avec le logiciel MSBNX 1.4.2: 


G: File View Window Help 


Model 


L 3 ArretProduction = Yes 


© PanneMachine 
No 


1.0000 0.0000 
No 
0.0902 0.9098 


Figure: 6.9 - Probabilité a posteriori d'un arrêt dû à une panne machine dans MSBNX 1.4.2 
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Maintenant, imaginons que notre base de données nous donne (toujours grâce aux responsables qualité qui 
ont veillé à saisir les anomalies qualité) que 99 fois sur 100 (99%) lorsqu'il y a eu un arrêt de la 
production, il y a eu une évacuation. En revanche 5 % des évacuations ont été identifiées comme n'ayant 
rien à voir avec un arrêt de la production (donc 95% des évacuations sont dues à des exercices incendie 
OÙ à d'autres événements): 


P(S1)=[1%0,99%] P(S2}-[0.1%,99.9%] 


Accident du travail 


sl P(S4#/S2) 


Panne machine 


Arrêt production 


P{SS5/S4) 
BCE 


Evacuation 


DCIER 


Figure: 6.10 - Réseau bayésien de deuxième niveau 


Maintenant, pour calculer la probabilité implicite des évacuations a posteriori par rapport aux pannes 
machines, nous avons vu que lorsque nous avions une dépendance conditionnelle série, la probabilité 
conditionnelle ne dépendait que du parent direct. Aïnsi, il vient: 


P(S5)= P(S5/ S4) P(S4)+ P(S5/ S4)P(S4|= 99% .1.098% + 5%. 98.902% z 6.03% (6.81) 


Ce qui peut se vérifier avec le logiciel MSBNX 1.4.2: 
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ET: 


L File View Window Help 


Dl&| æ/:|11|=|%)| ?| 


Evacuation 


(Evacuation) 
Ds (0.0603212) 


Figure: 6.11 - Probabilité implicite d'une évacuation dans MSBNX 1.4.2 
Donc la probabilité implicite de l'évacuation ne dépend effectivement pas des pannes de machines. 
Maintenant supposons que nous avons observé une évacuation. Nous voulons savoir quelle est la 


probabilité a posteriori qu'elle soit due à une panne machine! Nous avons alors: 


P(SSIS4)P(S4) 99% .1.098% 


PIS41S51= = 
PIS5) 6.03% 


= 18.02% (6.82) 


Ce que nous pouvons aussi vérifier avec le logiciel MSBNX 1.4.2: 
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6: File View Window Help 


é|z|%|=lt%] €] 


Spreadsheet | Bar Chait | Recommendations | 


Node Name 


[es Unobserved ärretProduction Yes No 
 V RYes 01802 08198 
Euh" Evacuation Yes 
No 1.0000 O.0000 


Panne machine Yes 
0.0163 0.9837 


Figure: 6.12 - Probabilité a posteriori d'une évacuation due à une panne machine dans MSBNX 1.4.2 


Maintenant nous étudions le cas avec l'alarme et là aussi une base de données nous permet de construire 
un tableau avec les différentes probabilités: 


P{S1)={1%,99%] P(S2)-[0.1%,99.9%] 


Panne machine 
S2 


Accident du travail 
sl 


Arrèët arbre 


P(S3/S1,52) 
Accident du travail, Panne machine 


Évacuation 
ss 


Figure: 6.13 - Réseau bayésien de deuxième niveau avec seconde branche 


Maintenant, pour calculer la probabilité implicite qu'il y ait une alarme, il va falloir considérer les quatre 
situations possibles. Nous avons alors en utilisant le théorème des probabilités totales: 


P(S31= P(S3/ S1S2) PIS P(S2)+P(S3/S1S2|P(S1)P(S2) 
(6.83) 


+PIS34 SLS21PISTIPIS21+ PIS31 SLS2)PIS1|PIS2| 


Ce qui un peu plus rigoureusement devrait s'écrire: 
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PIS3)= P(S3/S1AS2)P(S1) PIS2)+P(S3/STAS2|P(ST)P(S2) 


__ _— 2 … ne (6.84) 
+PIS3/ S1AS2)P(S1PIS2)+PIS3/S1AS2) PS1) PIS2| 


L'application numérique donne donc pour la probabilité implicite d'une alarme: 


PIS31= 75%. 1%. 0.19% + 99%. 99%. 0.1%0 + 10%. 1% - 99,9% + 10% - 99%. 99,9% ; 
(6.85) 
= 10.089% 


Ce qui se construit et se vérifie de la manière suivante avec MSBNX 1.4.2: 


AccidentTravail CT Panneltachine > 


(AccidentTravail) (PanneMachine) 


Ves (0.01) ORN 


ArretProduction 


(ArretPraduction) 
Mes (0.01098) 


ss (Alarme: Alarme |” 


ES: (0.100888) 


#2 Assessment (Model Model, Node: Alarrne) Mk LE & | 


vacuation 


£Evacuation) 
BE: (0.0603212) 


Figure: 6.14 - Probabilité implicite d'une alarme dans MSBNX 1.4.2 


Concernant les notations, il peut être utile au lecteur de savoir qu'il peut parfois trouver dans la littérature: 


P(IS31/S1= Ou,52=Ou)=P(S3/S1,52)= P(S3/ S1AS2) (6.86) 


Remarque: Dans l'exemple particulier étudié ici les événements ont tous deux états. Mais dans la 


pratique cela peut aller à 3, 4 et plus. Dès lors les tableaux de croisement de probabilités deviennent 
vite énormes. 


Comme pour les cas précédents, supposons que nous savons qu'il y a eu un accident de travail. Nous 
souhaitons alors calculer la probabilité a priori d'une alarme. Nous avons alors (observez que la 
probabilité ne dépend effectivement alors plus que de l'état S2 puisque l'état S1 est entièrement connu!): 
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P(S3151)= P(S$3/ SLS2)P(S2)+ P(S31 S1,52) P(5S2| 
= 75% - 0.1% +10% : 99.9% = 10.065% 


(6.87) 


Ce que nous pouvons aussi vérifier avec le logiciel MSBNX 1.4.2: 


Spreadsheet | Bar Chart | Recommendations | 


Unobserved Node Name State 0 State 1 

F7 Yes &larme Yes No 

A ÿ 01007  0.8994 
No 


Figure: 6.15 - Probabilité implicite d'une alarme dans MSBNX 1.4.2 


Ainsi, savoir qu'il y a eu un accident de travail augmente la probabilité qu'il y ait bien une alarme (nous 
passons d'une probabilité de 10.089% à 10.65%). 

Pour terminer cet exemple, nous souhaiterions calculer les probabilités a posteriori PIS52 / S31 et 
PiS1/ S31. Pour cela, nous devons d'abord calculer les probabilités a priori PIS3/ #21 et PIS3{ Si 


(cette dernière venant d'être calculée). 


Nous avons pour la valeur manquante (ce qui se vérifie aussi facilement qu'avant avec le logiciel MSNBX 
1.4.2): 


P(S3152)= P(S31 52,81) P(S1)+P(S3/ S2, Si) P(S1) 
= 75% 1% + 99% - 99% = 98.76% 


(6.88) 


Nous avons donc: 


PIS31S1;= 10.06% 


(6.89) 
PIS3/S21=98.76% 


Nous avons maintenant tout ce qu'il faut pour calculer la probabilité a priori de PIS3/S21 et PIS3i Sli: 


PIS3/ S21P(S2) 98.76%. 0.1% 


PIS21S3)\= = = 0.9789% 
PIS3) 10.089% 
(6.90) 
PIS3} S11P(S1 04.10 
poires PLS3TST)PEST | 10.065%-1% _ | 997604 
PIS3) 10.089% 
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Donc la probabilité a priori qu'il y ait une panne machine lorsque nous savons qu'il y a une alarme est de 
0.979% (donc in extenso 99.021% que le déclenchement de l'alarme ne soit pas dû a priori à une panne 
machine). Respectivement il y a, a priori, 0.998 % de probabilité y ait un accident de travail lorsque nous 
savons qu'il y a une alarme (et donc 99.002 % que cela ne soit pas dû a priori à un accident de travail). 


Du point de vue critique, lorsqu'il y a donc une alarme finalement nous ne pouvons pas dire grand chose. 
Cela est dû dans le cas présent au fait que les événements d'intérêt notable ont tous deux de faibles 
probabilités d'avoir lieu (accident et panne machine) et que les gens réagissent plutôt bien au niveau du 
déclenchement de l'alarme (sinon si les probabilités a priori étaient grandes cela signifierait que le 
comportement n'est pas bon puisque nous pouvons deviner (avec exaspération) à l'avance quel problème a 
lieu avec une certaine confiance). 


Remarque: Nous n'avons pas trouvé comment vérifier ces derniers calculs avec MSNBX 1.4.2. Si 
quelqu'un trouve comment le faire ce serait super de nous communiquer le détail de la démarche. 


Pour clore, le lecteur aura remarqué que les calculs peuvent vite devenir ennuyeux dès que le graphe 
devient complexe d'où l'usage de logiciels informatiques. De plus, dans le domaine bancaire qui utilise par 
exemple les réseaux bayésiens pour les risques de crédit, la probabilité a priori peut être plus complexe. 
Par exemple nous pourrions vouloir connaître la probabilité a priori qu'il y ait une panne machine sachant 
que nous avons une alarme et un accident de travail: 


PIS2/53,811 = PIS2/ S3= Ou, $1= Oui 


1.3. MARTINGALES 


Une martingale en probabilités (il en existe une autre dans les processus stochastiques) est une technique 
permettant d'augmenter les chances de gain aux jeux de hasard tout en respectant les règles de jeu. Le 
principe dépend complètement du type de jeu qui en est la cible, mais le terme est accompagné d'une aura 
de mystère qui voudrait que certains joueurs connaissent des techniques secrètes mais efficaces pour 
tricher avec le hasard. Par exemple, de nombreux joueurs (ou candidats au jeu) cherchent LA martingale 
qui permettra de battre la banque dans les jeux les plus courants dans les casinos (des institutions dont la 
rentabilité repose presque entièrement sur la différence - même faible - qui existe entre les chances de 
gagner et celles de perdre). 


De nombreuses martingales ne sont que le rêve de leur auteur, certaines sont en fait inapplicables, 
quelques-unes permettent effectivement de tricher un peu. Les jeux d'argent sont en général inéquitables: 
quel que soit le coup joué, la probabilité de gain du casino (ou de l'État dans le cas d'une loterie) est plus 
importante que celle du joueur. Dans ce type de jeu, il n'est pas possible d'inverser les chances, seulement 
de minimiser la probabilité de ruine du joueur. 


L'exemple le plus courant est la martingale de la roulette. Elle consiste à jouer une chance simple à la 
roulette (noir ou rouge, paire ou impaire) de façon à gagner, par exemple, une unité dans une série de 
coups en doublant sa mise si l'on perd, et cela jusqu'à ce que l'on gagne. Exemple: le joueur mise 1 unité 
sur le rouge, si le rouge sort, 1l arrête de jouer et il a gagné 1 unité (2 unités de gain moins l'unité de mise), 
si le noir sort, il double sa mise en pariant 2 unités sur le rouge et ainsi de suite jusqu'à ce qu'il gagne. 
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Figure: 6.16 - Roulette de casino 


Ayant une chance sur deux de gagner, il peut penser qu'il va finir par gagner ; quand il gagne, il est 
forcément remboursé de tout ce qu'il a joué, plus une fois sa mise de départ. 


Cette martingale semble être sûre en pratique. À noter que sur le plan théorique, pour être sûr de gagner, 
il faudrait avoir la possibilité de jouer au cas où un nombre de fois illimité... Ce qui présente des 
inconvénients majeurs: 


Cette martingale est en fait limitée par les mises que le joueur peut faire car il faut doubler la mise à 
chaque coup tant que l'on perd: 2 fois la mise de départ, puis 4, 8, 16... s'il perd 10 fois de suite, 1l doit 
pouvoir avancer 1024 fois sa mise initiale pour la 11e partie ! Il faut donc beaucoup d'argent pour gagner 
peu.ù 


Les roulettes comportent de plus un "0" qui n'est ni rouge ni noir. Le risque de perdre lors de chaque coup 
est ainsi plus grand que 1/2... 


De plus, pour paralyser cette stratégie, les casinos proposent des tables de jeu par tranche de mise: de 1 à 
100.-, de 2 à 200.-, de 5 à 500.-, … Impossible donc d'utiliser cette méthode sur un grand nombre de coups, 
ce qui augmente le risque de tout perdre. 


Le black jack est un jeu qui possède des stratégies gagnantes: plusieurs techniques de jeu, qui nécessitent 
généralement de mémoriser les cartes, permettent de renverser les chances en faveur du joueur. Le 
mathématicien Edward Thorp a ainsi publié en 1962 un livre qui fut à l'époque un véritable best-seller. 
Mais toutes ces méthodes demandent de longues semaines d'entraînement et sont facilement décelables 
par le croupier (les brusques changements de montant des mises sont caractéristiques). Le casino a alors 
tout loisir d'écarter de son établissement les joueurs en question. 


Il faut noter qu'il existe des méthodes assez évoluées. L'une d'elles repose sur les combinaisons les moins 
jouées. Dans les jeux où le gain dépend du nombre de joueurs gagnants (Loto...), jouer les combinaisons 
les moins jouées optimisera les gains. C'est ainsi que certaines personnes vendent des combinaisons qui 
seraient statistiquement très rarement utilisées par les autres joueurs. 
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Partant de ce raisonnement, on peut encore conclure qu'un joueur qui aurait réussi à déterminer ainsi les 
combinaisons statistiquement les moins jouées, afin d'optimiser son espérance de gain, ne sera en fait 
certainement pas le seul joueur à avoir obtenu par l'analyse ces fameuses combinaisons! Cela revient à 
dire que les numéros en théorie les moins joués sont en fait surjoués par combinaisons, le mieux serait 
peut-être de réaliser un savant mélange de numéros sous-joués et de numéros surjoués pour obtenir les 
combinaisons idéales. Une autre conclusion à tout cela est peut-être que le mieux est encore de jouer des 
combinaisons aléatoires qui ont finalement moins de chance d'être également choisies par les joueurs qui 
incorporent un facteur humain et harmonieux dans le choix de leurs nombres. 


2. ANALYSE COMBINATOIRE 


"L'analyse combinatoire" (techniques de dénombrement) est le domaine de la mathématique qui s'occupe 
de l'étude de l'ensemble des issues, événements ou faits (distinguables ou non tous distinguables) avec 
leurs arrangements (combinaisons) ordonnés ou non selon certaines contraintes données. 


Définitions: 


D1. Une suite d'objets (événements, issues, objets...) est dite "ordonnée" si chaque suite composée d'un 
ordre particulier des objets est comptabilisée comme une configuration particulière. 


D2. Une suite est donc "non ordonnée" si et seulement si nous intéresse la fréquence d'apparition des 
objets indépendamment de leur ordre. 


D3. Des objets (d'une suite) sont dits "distincts" si leurs caractéristiques ne permettent pas de les 
confondre avec des autres objets. 


Remarque: Nous avons choisi de mettre l'analyse combinatoire dans ce chapitre car lorsque nous 
calculons des probabilités, nous avons également assez souvent besoin de savoir quelle est la 
probabilité de tomber sur une combinaison ou un arrangement d'événements donnés sous certaines 
contraintes. 


Souvent les étudiants ont de la peine à se rappeler de la différence entre une permutation, un arrangement 
et une combinaison. Voici donc un petit résumé de ce que nous allons voir: 


- Permutation: On prend tous les éléments. 


- Arrangement: On choisit des éléments parmi ceux de l'ensemble de départ et l'ordre intervient 
- Combinaison: Idem que pour l'arrangement mais l'ordre n'intervient pas 


Il existe plusieurs types d'arrangements selon les contraintes et les propriétés des éléments arrangés. Nous 
allons présenter et démontrer ci-dessous les 5 cas les plus répandus à partir desquels nous pouvons trouver 
(habituellement) tous les autres: 


2.1. ARRANGEMENTS SIMPLES AVEC RÉPÉTITION 


Définition: Un "arrangement simple avec répétition" est une suite ordonnée de longueur m de n objets 
distincts non nécessairement tous différents dans la suite (soit avec répétitions possibles!). 


Soient À et B deux ensembles finis de cardinaux respectifs m, n tels que trivialement il y ait m façons de 
choisir un objet dans À (de type a) et n façons de choisir un objet dans B (de type b). 
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Nous avons vu dans le chapitre de Théorie Des Ensembles que si À et B sont disjoints, que: 


Card(AL B) =Mm+Ax 


Nous en déduisons donc les propriétés suivantes: 


P1. Si un objet ne peut être à la fois de type a et de type b et s'il y a m façons de choisir un objet de type 
a et n façons de choisir un objet de type b, alors l'union des objets donne #7 + # sélections (c'est 
typiquement le résultat des requêtes d'UNION en SQL, sans filtres, dans les SGBDR des entreprises). 


P2. Si nous pouvons choisir un objet de type a de m façons puis un ne et de pe b de n façons, alors il y a 
selon le produit cartésien de deux ensembles ( bles): 


Card(Ax B = Card(A)'Card(B)= m'a 


de manières choisir un seul et unique objet de type a puis un objet de type b (this is typically the result of 
SELECT queries in SQL, without filters, with several unrelated tables in corporate RDBMS). 


Avec les mêmes notations pour m et n, nous pouvons donc choisir pour chaque élément de À, son unique 
image parmi les n éléments de B. Il y a donc n façons de choisir l'image du premier élément de À, puis 
aussi n façons de choisir l'image du deuxième élément de À, …, puis n façons de choisir l'image du m-ème 
élément de A. Le nombre d'applications totales consécutives possibles de A dans B est donc égal aux m 
produits de n (m fois le produit cartésien du cardinal de l'ensemble B avec lui-même donc!). Ce qu'il est 
d'usage d'écrire (nous avons mis les différentes écritures que l'on peut trouver dans les livres scolaires): 


CardlB4\=Card\ BxBx..xB|=Card(B\ 
a 4— 


m fois 


où 84 est l'ensemble des applications de A dans B. La progression du nombre de possibilités est donc 
géométrique (et non "exponentielle" comme il est souvent dit à tort!). 


Ce résultat mathématique est assimilable au résultat ordonné (un arrangement 4% dont l'ordre des 


éléments de la suite est pris en compte) de m tirages dans un sac contenant n boules différentes avec 
remise après chaque tirage. 


Exemples: 
E1. Combien de "mots" (ordonnés) de 7 lettres pouvons-nous former à partir d'un alphabet de 24 lettres 


distinctes (très utile pour connaître le nombre d'essais pour trouver un mot de passe par exemple)? La 
solution est: 


—7 

An = 247 = 4586471424 
E2. Combien de groupes d'individus aurons-nous lors d'une votation sur 5 sujets et où chacun peut être 
soit accepté, soit rejeté? La solution (très utilisée dans les entreprises en Suisse) est: 


A3 = 2° = 32 


Une généralisation simple de ce dernier résultat peut consister dans l'énoncé du problème suivant: 
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Si nous disposons de m objets &,....,4k,, tels que &, peut prendre x, états différents alors le nombre de 


combinaisons possibles est: 
An = Him (6.97) 


Et si nous avons #, = #, =. = x, alors nous retombons sur: 


ee 
An “An "5. A" (6.98) 
Exemple: 


Un graphiste a créé sous le logiciel Adobe Photoshop une maquette d'une site Internet avec trois en-têtes 
différentes, deux variantes pour le corps, quatre variantes pour le fond, six variantes de menus et trois 
variantes pour le pied de pages. Le nombre total de combinaisons (compositions dans le langage du 
graphiste) que l'on pourra présenter au client sera de: 


7. ee =3.2.4.6.3-432 (699) 


2.2. PERMUTATIONS SIMPLES SANS RÉPÉTITION 


Définition: Une "permutation simple sans répétition" (appelée anciennement "substitution") de n objets 
distincts est une suite ordonnée (différente) de ces n objets par définition tous différents dans la suite (sans 
répétition). 


Remarque: Attention à ne pas confondre le concept de permutation (de n éléments entre eux) et 
d'arrangement (de n éléments parmi m)! 


Le nombre de permutations de n éléments peut être calculé par récurrence: il y a n places pour un premier 
élément, n-1 pour un deuxième élément, …, et il ne restera qu'une place pour le dernier élément restant. 
Il est dès lors trivial que nous aurons un nombre de permutations donné par: 
n'(x—1)"(x—2)" (4-3). (4-0) (6.100) 
Rappelons que le produit: 
# 
n'(2-D'x-2)" (2 3...(s-(2-Di= [ [: (6.101) 
ii 
est appelé "factorielle de n" et nous la notons n! pour x € N. 


Il y a donc pour n éléments distinguables: 


610) 


permutations possibles. Ce type de calcul peut être par exemple utile en gestion de projets (calcul du 
nombre de manière différentes de recevoir dans une chaîne de production n pièces toutes différentes 
commandées chez des fournisseurs externes). 
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Exemple: 


Combien de "mots" (ordonnés) de 7 lettres distinctes sans répétition pouvons-nous former? 


A, =71=5040 (6.103) 


Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement À, dont l'ordre des éléments de 


la suite est pris en compte) du tirage de toutes les boules différentes d'un sac contenant n boules 
distinguables sans remise. 


2.3. PERMUTATIONS SIMPLES AVEC RÉPÉTITION 


Définition: Lorsque nous considérons le nombre de permutations ordonnées (différentes) d'une suite de n 
objets distincts tous nécessairement non différents dans une quantité donnée dans la suite nous parlons de 
"permutation simple avec répétition". 


Remarque: I ne faut pas confondre cette dernière définition avec "l'arrangement avec répétition" vu 
plus haut! 


Lorsque certains éléments ne sont pas tous distinguables dans une suite d'objets (ils sont répétitifs dans la 
suite), alors le nombre de permutations que nous pouvons constituer se réduit alors assez trivialement à un 
nombre plus petit que si tous les éléments étaient tous distinguables. 
Soit #; le nombre d'objets du type i, avec: 

A +A2 +. + = 2% (6.104) 
alors, nous notons: 


An...) (6.105) 


avec à = 1,2,..,# le nombre de permutations possibles (pour l'instant inconnu) avec répétition (un ou 
plusieurs éléments répétitifs dans une suite d'éléments sont non distinguables par permutation). 


Si chacune des #, places occupées par des éléments identiques était occupée par des éléments différents, 


le nombre de permutations serait alors à multiplier par chacun des #;! (cas précédent). 
Il vient alors que nous retombons sur la factorielle telle que: 
À, (m,2,23,...,) ‘almælral."xl=xl (6.106) 


dont nous déduisons immédiatement: 


Si les n objets sont tous différents dans la suite, nous avons alors: 
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1=21=...=241=11=1 (6.108) 
et nous nous retrouvons bien avec une permutation simple (sans répétition) telle que: 


- Al 
À = De = & 
ne EP 


Il conviendra donc de se rappeler que les permutations avec répétition sont en plus petit nombre que 
celles sans répétition (évident puisque nous ne prenons pas en compte les permutations des éléments 
identiques entre eux!). 


Exemple: 
Combien de "mots" (ordonnés) pouvons-nous former avec les lettres du mot "Mississippi": 


r 1il 
A4(,2,4, 4) = 34650 (6.110) 
M se om ssss  1l214l4l 


Ce résultat nous amène à l'assimiler au résultat ordonné (une permutation À, dont l'ordre des éléments de 


la suite n'est pas pris en compte) du tirage de n boules non toutes distinguables d'un sac contenant #& 2 x 
boules avec remise limitée pour chaque boule. 


2.4. ARRANGEMENTS SIMPLES SANS RÉPÉTITION 


Définition: Un "arrangement simple sans répétition" est une suite ordonnée de p objets tous distincts pris 
parmi n objets distincts avec # 2 p. 


Nous nous proposons donc maintenant de dénombrer les arrangements possibles sans répétition de p 
objets parmi n. Nous noterons AŸ le nombre de ces arrangements. 


Il est aisé de calculer 4} = » et de vérifier que À = #{x - 1). Effectivement, il existe n façons de choisir 
le premier objet et (n-1) façons de choisir le deuxième lorsque nous avons déjà le premier. 


: - ; / dl 
Pour déterminer A, nous raisonnons alors par récurrence. Nous supposons A4} connu et nous en 


déduisons: 
A = A [r-G@-D]= 47" G-p+D Gun 
Dès lors: 
A =n(a-l)'@-2)"(x-3"."(x-(p-D) (6112) 
alors: 
nl= A (n-p}l=[n (4-D'(x-2) "(x p+2) (a-p+Dl'(@-p) @-p-D.… (6113) 
d'où: 
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Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement A4Ÿ dont l'ordre des éléments de 


la suite est pris en compte) du tirage de p boules distinctes d'un sac contenant n boules différentes sans 
remise. 


Exemple: 


Soit les 24 lettres de l'alphabet, combien de "mots" (ordonnés) de 7 lettres distinctes pouvons-nous 
former? 


| 
F = 1 Li544368160 6115 
(24-71 


Le lecteur aura peut-être remarqué que si nous prenons ? 7 *# nous nous retrouvons avec: 


donc nous pouvons dire qu'une permutation simple de n éléments est comme un arrangement simple sans 
répétition avec # TP. 


2.5. COMBINAISONS SIMPLES 


Définition: Une "combinaison simple" ou "choix" est une suite non-ordonnée (dont l'ordre ne nous 
intéresse pas!) de p éléments tous différents (pas nécessairement dans le sens visuel du terme!) choisis 


parmi n objets distincts et est par définition notée sur ce site Internet C, et appelée la "binomiale" ou 


"coefficient binomial". 


Si nous permutons les éléments de chaque arrangement simple de p éléments parmi n, nous obtenons 
toutes les permutations simples et nous savons qu'il y en a p! d'où en utilisant la convention d'écriture du 
présent site internet (contraire à celle préconisée par la norme ISO 31-11!): 


C'est une relation très souvent utilisée dans les jeux de hasard mais également dans l'industrie via la loi 
hypergéométrique (cf. chapitre de Techniques De Gestion) ainsi que dans les statistiques d'assez haut 
niveau comme les statistiques d'ordre (cf chapitre de Statistiques). 


r x A . . r r + J 147 
Ce résultat nous amène à l'assimiler au résultat non ordonné (un arrangement €’, dont l'ordre des éléments 
Pl 


de la suite n'est pas pris en compte) du tirage de p boules d'un sac contenant n boules différentes sans 
remise. 
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Remarques: 


k . . x 
R1. Nous avons nécessairement par construction €, £ A?. 


R2. Selon les auteurs nous inversons l'indice ou le suffixe de C il faut donc être prudent! 


Exemple: 


Soit un alphabet de 24 lettres, combien avons-nous de choix de prendre 7 lettres parmi les 24 sans prendre 
en compte l'ordre dans lequel sont triées les lettres: 


| 
x - SU ue 
7124 =D) 


La même valeur peut être obtenue avec la fonction COMBIN( ) de Microsoft Excel 11.8346 (version 
française). 


Il existe, relativement à la binomiale, une autre relation très souvent utilisée dans de nombreux cas 
d'études ou également de manière plus globale en physique ou analyse fonctionnelle. Il s'agit de la 
"formule de Pascal": 


nl nl _ mn 
Cri tlr =Cy (6.119) 


Démonstration: 


Hier CR _@=D __ @=D  ,_ @=b! 


PUR fa (p-Dp-Dl (@-1-p)lpl (n-p}{p-Dl (n-1-plpl (6.120) 


Or pl= pp —-1)l donc: 
| 
(@-D=2Z («61 
P 


et de même (#x-pl(x-p-Dl=(x-p)l: 


PP er es 2) (6.122) 
ñ—p 
Ainsi: 
cu 40% 1 = (#—1)l " Gel _ &@-llp + @= DIT p) 

@-Dl@-D @-1-plpl G-plpl Gp 
(e—1)l (a Dir nl : D 

= ———|p+{x— = —— = ———-C 

A Era ne 


COIC.Q.F.D. 
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Pour résumer: 


Arrangement simple avec répétition 


Combinaison simple 
(cas de l'arrangement simple sans répétition où 
l'ordre n'est pas pris en compte) 


Tableau: 28.2 - Résumé des cas possibles 


TU ES MEILLEUR, 
EN THÉORIE QU'EN 
PRATIQUE! 


3. CHAÎNES DE MARKOV 


Les chaînes de Markov sont des outils statistiques et probabilistes simples et puissants mais dont la forme 
de présentation mathématique prête parfois à l'horreur... Nous allons tenter ici de simplifier un maximum 
les notations pour introduire cet outil formidable très utilisé au sein des entreprises pour gérer la 
logistique, les files d'attentes aux centrales d'appel ou aux caisses de magasins jusqu'à la théorie de la 
défaillance pour la maintenance préventive, en physique statistique ou en génie biologique (et la liste est 
encore longue et pour plus de détails le lecteur pourra se reporter aux chapitres concernés disponibles sur 
le site.…..). 


Définitions: 
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D1. Nous noterons { #{(£)},. un processus probabiliste fonction du temps dont la valeur à chaque instant 


dépend de l'issue d'une expérience aléatoire. Ainsi, à chaque instant t, X(t) est donc une variable aléatoire 
que nous désignons par "processus stochastique" (pour plus de détails dans le cadre de finance, voir le 
chapitre d'Economie). 


D2. Si nous considérons un temps discret, nous notons alors { # aie un "processus stochastique à temps 
discret". 


D3. Si nous supposons en outre que les variables aléatoires #, ne peuvent prendre qu'un ensemble 
discret de valeurs nous parlons alors de "processus à temps discret et à espace discret". 


Remarque: Il est tout à fait possible comme dans l'étude du télétrafic ( 
nn) d'avoir un processus à temps continu et à espace d'états discrets. 


Définition: { Z ‘a est une "chaîne de Markov" si et seulement si: 
P(ZX, — J | UE — hr A n-2 =i, 2... À0 — ÿ) — P(X, — J | À — i,) 


en d'autres termes (c'est très simple!) la probabilité pour que la chaîne soit dans un certain état à la n-ème 
étape du processus ne dépend que de l'état du processus à l'étape n-1 et pas des étapes précédentes! 


Remarque: Done en probabilités un processus stochastique vérifie la propriété markovienne ci-dessus 
si et seulement si la distribution conditionnelle de probabilité des états futurs, étant donné l'instant 
présent, ne dépend que de ce même état présent et pas des états passés. Un processus qui possède cette 
propriété est aussi appelé "processus de Markov". 


Définition: Une "chaîne de Markov homogène" est une chaîne telle que la probabilité qu'elle a pour 
passer dans un certain état à la n-ième étape soit indépendante du temps. En d'autres termes, la loi de 
probabilité caractérisant la prochaine étape ne dépend pas du temps (de l'étape précédente), et en tout 
temps la loi de probabilité de la chaîne est toujours la même pour caractériser la transition à l'étape en 
COUrS. 


Nous pouvons alors définir (réduire) la loi de "probabilité de transition" d'un état i vers un état j par: 
Pÿ : FL = j [Ai =i) 


Il est alors naturel de définir la "matrice de transition" ou "matrice stochastique": 


Pu 212 
P= P21 P2 P23 


Pa 


comme la matrice qui contient donc tous les probabilités possibles de transitions des états d'un graphe 
d'états orienté. 
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Les chaînes de Markov peuvent être représentées graphiquement sous la forme d'un graphe orienté G (cf. 

chapitre de Théorie Des Graphes) appelé parfois "automate" ayant pour sommet les points (états) i et pour 
arêtes les couples orientés (i, j). Nous associons alors à chaque composante un arc orienté et sa probabilité 
de transition. 


Exemple: 


P23 


Pi12 
Pa 
Pa 
P14 
Pal 


Figure: 6.17 - Exemple générique d'une chaîne de Markov 


Ainsi, dans l'exemple du graphe orienté ci-dessus, les seules transitions permises par les 4 états (matrice 
4 x4 ) ci-dessus sont celles indiquées par les flèches. Ce qui fait que la matrice de transition se simplifie 
alors en: 


Pu 12 A3 24 0 P2 0 Puy 
P P P P (sl (] 0 

PE 21 2 23 24 | _ P23 (6.127) 
Pa Pa Pa Ps Pa 0 P3 0 


Pai Pa Pas Pas] [Pa 0 0 0 


où le lecteur remarquera que nous avons la propriété triviale (par construction!) que la somme des termes 
(probabilités) d'une ligne de la matrice P est toujours unitaire (et donc que la somme des termes d'une 
colonne de la transposée de la matrice P est toujours unitaire aussi): 


2 Pÿ = (6.128) 
5 
et que la matrice est positive (ce qui signifie que tous ces termes sont positifs ou nuls). 


Remarque: Se rappeler que la somme des probabilités des colonnes obtenues est toujours égale à 1 
pour la transposée de la matrice stochastique!! 
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L'analyse du régime transitoire (ou: promenade aléatoire) d'une chaîne de Markov consiste à déterminer 
(ou à imposer à!) la matrice-colonne (vecteur) p(n) d'être dans un état donné à la n-ième étape de la 
promenade: 


Part #) C1) 


avec la somme des composantes qui vaut évidemment toujours 1 (car la somme des probabilités de se 
trouver dans un quelconque des sommets du graphe à un moment/étape donné(e) doit être égale à 100%). 


Nous appelons fréquemment cette matrice-colonne "vecteur stochastique" ou "mesure de probabilité sur 
le sommet i". 


Démonstration: 
Démontrons que la probabilité de ce vecteur stochastique est effectivement toujours unitaire. 


Si p(n) est un vecteur stochastique, alors son image: 


pin+D= PT. pa) (62) 


t PACESIEAU , 


l'est aussi. Effectivemen ar: 


Pitr+D = PP; (#) (6.2) 
J 
est une somme de termes positifs ou nuls. De plus, nous trouvons: 
PRADA AO} A AOL (Zn) P;(r) =5p;(0) =1 (64) 
? à ÿ J à 4 à E | 


CIC.Q.F.D. 


Ce vecteur de probabilités, dont les composantes sont positives ou nulles, dépend (c'est assez intuitif) de 
la matrice de transition P et du vecteur de probabilités initiales p(0). 


Bien que cela soit démontrable (théorème de Perron-Frobenius) le lecteur pourra vérifier par un cas 
pratique (informatisé ou non!) que si nous choisissons un vecteur d'état p(n) quelconque alors il existe 
pour toute matrice stochastique P un vecteur unique de probabilité noté traditionnellement Æ tel que: 


Pl ox=x (6.5) 
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Une telle mesure de probabilité 7 vérifiant la relation précédente est appelée une "mesure invariante" ou 
"mesure stationnaire" ou encore "mesure d'équilibre" qui représente l'état d'équilibre du système. En 
termes d'algèbre linéaire (voir chapitre du même nom), pour la valeur propre 1, Æ est un vecteur propre 
de P (cf. chapitre d'Algèbre Linéaire). 


Nous en verrons un exemple trivial dans le chapitre de Théorie des Graphes qui sera redéveloppé sous 
forme détaillée et complète ainsi que dans le chapitre de Théorie Des Jeux Et De La Décision dans le 
cadre de la pharmaco-économie. Mais signalons également que les chaînes de Markov sont également 
utilisées en météorologie par exemple ou encore dans le domaine de la casse de mots de passe 
informatiques: 


Figure: 6.1 - Exemple concret très simpliste d'une chaîne de Markov 


ou dans le domaine médical, financier, des transports, du marketing, etc. 


Dans le domaine du language, à partir de l'analyse fréquentielle de séquence de mots, les ordinateurs 
arrivent à construire aussi des chaînes de Markov et donc à proposer une sémantique plus correcte lors de 
corrections grammaticales informatisées ou de transcription de écrite de présentations orales. 


Enfin pour clore, donnons quelques définitions de vocabulaire complémentaires courantes que l'on 
retrouvera dans différentes chapitres comme celui de Techniques de Gestion ou de Génie Industriel. 


Définitions: 


D1. Une chaîne de Markov est dite "chaîne de Markov irréductible" si tous les états sont liés aux autres 
(c'est le cas de la chaîne dans la figure ci-dessus). 


D2. Une chaîne de Markov est dite "chaîne de Markov absorbante" si un quelconque des états de la 
chaîne absorbe les transitions (donc rien n'en sort pour dire simplement les choses!). 


Page: 287/4839 


[v3.0 - 2013] 


Notes personnelles: 
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7. STATISTIQUES 


L. statistique est une science qui a pour objet le groupement méthodique de faits ou événements 


répétitifs qui se prêtent à une évaluation numérique ou qualitative dans le temps suivant une loi donnée. 
Dans l'industrie et dans l'économie en général, la statistique est une science qui permet dans un 
environnement incertain de faire des inférences valides. 


Il faut savoir que parmi tous les domaines de la mathématique, celui qui est utilisé à la plus large échelle 
dans les entreprises et centres de recherches est bien la statistique et particulièrement depuis que des 
logiciels en facilitent grandement les calculs! Raison pour laquelle ce chapitre est un des plus gros du 
site internet alors que seuls les concepts élémentaires y sont présentés! 


Signalons aussi que les statistiques ont très mauvaise réputation à l'université car les notations y sont 
souvent confuses et varient grandement d'un professeur à l'autre, d'un livre à l'autre, d'un praticien à 
l'autre. En toute rigueur, il faudrait se conformer au vocabulaire et notations de la norme 

ISO 3534-1:2006 et comme malheureusement ce chapitre a été écrit avant la publication de cette 
norme... un certain temps d'adaptation sera nécessaire avec qu'il y ait conformité. 


Il est peut être inutile de préciser que la statistique est beaucoup utilisée en ingénierie, physique 
théorique, physique fondamentale, économétrie, gestion de projets ainsi que dans l'industrie des 
processus, dans les domaines des assurances vies et non vies, dans l'actuariat ou dans la simple analyse 
de banque de données (avec Microsoft Excel très souvent... malheureusement...) et la liste est encore 
longue. Par ailleurs, nous rencontrerons les outils présentés ici assez souvent dans les chapitres de 
Mécanique des Fluides, de Thermodynamique, des Techniques de Gestion, du Génie Industriel et 
d'Économétrie (en particulier dans ces deux dernières). Le lecteur pourra donc s'y reporter pour avoir 
des applications pratiques concrètes de quelques-uns des éléments théoriques les plus importants qui 
seront vus ici. 


Signalons également que outre les quelques exemples simples donnés sur ces pages, de nombreux autres 
exemples applicatifs sont donnés sur le serveur d'exercices du site dans les catégories Probabilités et 
Statistiques, Génie Industriel, Économétrie et Techniques de Gestion. 


Définition: Le but principal de la statistique est de déterminer les caractéristiques d'une population 
donnée à partir de l'étude d'une partie de cette population, appelée "échantillon" ou "échantillon 
représentatif". La détermination de ces caractéristiques doit permettre aux statistiques d'être un outil 
d'aide à la décision! 


Remarque: Le traitement des données concerne la "statistique descriptive". L'interprétation des 
données à partir des estimateurs s'appelle "l'inférence statistique" (ou "statistique inférentielle"), et 
l'analyse de données en masse la "statistique fréquentielle" (en opposition à l'nférence bayésienne). 


Lorsque nous observons un événement prenant en compte certains facteurs, il peut arriver qu'une 
deuxième observation ait lieu dans des conditions qui semblent identiques. En répétant ces mesures 
plusieurs fois sur différents objets supposés similaires, nous pouvons constater que les résultats 
observables sont distribués statistiquement autour d'une valeur moyenne qui est, finalement le résultat 
possible le plus probable. Dans la pratique, nous n'effectuons cependant parfois qu'une seule mesure et 
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il s'agit alors de déterminer la valeur de l'erreur que nous commettons en adoptant celle-ci comme 
moyenne mesurée. Cette détermination nécessite de connaître le type de distribution statistique auquel 
nous avons affaire et c'est ce que nous allons nous attarder (entre autres) à étudier ici (les bases du 
moins!). Il existe cependant plusieurs approches méthodologiques courantes (les moins courantes 
n'étant pas citées pour l'instant) face au hasard: 


1. Une toute première consiste à ignorer purement et simplement les éléments aléatoires, pour la bonne 
raison que l'on ne sait pas comment les intégrer. Nous utilisons alors la "méthode des scénarios" appelée 
aussi "simulation déterministe". C'est typiquement un outil utilisé par les financiers ou gestionnaires non 
diplômés travaillant avec des outils comme Microsoft Excel (qui inclut un outil de gestion de scénarios) 
ou MS Project (qui inclut un outil du type scénarios déterministes du type optimiste, pessimiste, 
attendu). 


2. Une seconde approche envisageable, quand nous ne savons pas associer des probabilités précises aux 
futurs événements aléatoires, est la théorie des jeux ( 

) où l'on utilise des critères de sélection semi-empiriques comme le critère du maximax, du 
minimax, de Laplace, de Savage, etc. 


3. Enfin, quand nous pouvons lier des probabilités aux événements aléatoires, soit que ces probabilités 
découlent de calculs ou de mesures, soit qu'elles reposent sur une expérience acquise auprès de 
situations antérieures de même nature que la situation actuelle, nous pouvons faire appel aux 
statistiques descriptives et inférentielles (contenu du présent chapitre) pour tirer des informations 
exploitables et pertinentes de cette masse de données acquises. 


4. Une dernière approche quand nous avons connaissance de probabilités relatives aux issues 
intervenantes faisant suite à des choix stratégiques est l'utilisation de la théorie de la décision (( 


). 


Remarques: 


R1. Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est 
qu'un "indicateur ponctuel". C'est la statistique mathématique qui lui donne le statut d'estimateur 
dont on maîtrise le biais, l'incertitude et autres caractéristiques statistiques. Nous cherchons en 
général à ce que l'estimateur soit sans biais, convergeant et efficace (nous verrons lors de notre 
étude des estimateurs plus loin de quoi il s'agit exactement). 


R2. Lorsque nous communiquons une statistique il devrait être obligatoire de préciser l'intervalle de 
confiance ainsi que la taille de l'échantillon étudié et ses caractéristiques détaillées sinon quoi elle 
n'a quasiment aucune valeur scientifique. 


R3. Si vous avez un professeur ou un formateur qui ose vous enseigner les statistiques et 
probabilités avec des exemples basés sur des jeux de hasard (cartes, dés, allumette, pile ou face, 
etc.) débarrassez-vous en ou dénoncez-le à qui de droit car cela signifierait qu'il n'a aucune 
expérience pratique du domaine et qu'il va vous enseigner n'importe quoi et n'importe comment 
(normalement les exemples devraitent être basés sur l'industrie, l'économie ou la R&D), bref dans 
des domaines utilités tous les jours par les entreprises mais surtout pas sur des jeux de hasard...!). 
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Introduisons avant de continuer quelques définitions qui vont nous être utiles pour la suite sur le 
concept d'échantillons et de moyennes: 


1. ÉCHANTILLONS 


Lors de l'étude statistique d'ensembles d'informations, la façon de sélectionner l'échantillon est aussi 
importante que la manière de l'analyser. Il faut que l'échantillon soit représentatif de la population (nous 
ne faisons pas nécessairement référence à des populations humaines!). Pour cela, l'échantillonnage 
aléatoire est le meilleur moyen d'y parvenir. 


Le statisticien part toujours de l'observation d'un ensemble fini d'éléments, que nous qualifions de 
"population". Les éléments observés, en nombre n, sont tous de même nature, mais cette nature peut 
être fort différente d'une population à l'autre. 


Définitions: 


D1. Nous sommes en présence d'un "caractère quantitatif” lorsque chaque élément observé fait 
explicitement l'objet d'une même mesure. À un caractère quantitatif donné, nous associons une 
"variable quantitative" continue ou discrète qui synthétise toutes les valeurs possibles que la mesure 
considérée est susceptible de prendre (ce type d'information étant représenté par des courbes de loi de 
Gauss-Laplace, de la loi bêta, de la loi de Poisson, etc.). 


Remarque: Nous reviendrons sur le concept de "variable" en statistiques plus loin. 


D2. Nous sommes en présence d'un "caractère qualitatif" lorsque chaque élément observé fait 
explicitement l'objet d'un rattachement unique à une "modalité" choisie dans un ensemble de modalités 
exclusives (de type: homme | femme) permettant de classer tous les éléments de l'ensemble étudié selon 
un certain point de vue (ce type d'information étant représenté par des diagrammes à barre, fromages, 
diagrammes à bulles, etc.). L'ensemble des modalités d'un caractère peut être établi a priori avant 
l'enquête (une liste, une nomenclature, un code) ou après enquête. Une population étudiée peut être 
représentée par un caractère mixte, ou ensemble de modalités tel que genre, tranche salariale, tranche 
d'âge, nombre d'enfants, situation matrimoniale par exemple pour un individu. 


D3. Un "échantillon aléatoire" est un échantillon tiré au hasard dans lequel tous les individus d'une 
population ont la même chance, ou “"équiprobabilité" (et nous insistons sur le fait que cette probabilité 
doit être égale), de se retrouver dans l'échantillon. 


D4. Dans le cas contraire d'un échantillon dont les éléments n'ont pas été pris au hasard, nous disons 
alors que l'échantillon est "biaisé" (dans le cas inverse nous disons qu'il est "non-biaisé") 


Remarque: Un petit échantillon représentatif est, de loin, préférable à un grand échantillon biaisé. 
Mais lorsque la taille des échantillons utilisés est petite, le hasard peut donner un résultat moins bon 
que celui qui est biaisé.… 


2. MOYENNES 


La notion de "moyenne" ou "tendance centrale" (les financiers appellent cela aussi une "mesure de 
localisation".…) est avec la notion de "variable" à la base des statistiques. 
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Cette notion nous semble très familière et nous en parlons beaucoup sans nous poser trop de questions. 
Pourtant il existe divers qualificatifs (nous insistons sur le fait que ce ne sont que des qualificatifs!) 
pour distinguer la forme de la résolution d'un problème consistant à calculer la moyenne. 


Il faut donc être très très prudent quant aux calculs de moyennes car il y a une fâcheuse tendance dans 
les entreprises à se précipiter et à utiliser systématiquement la moyenne arithmétique sans réfléchir, ce 
qui peut amener à de graves erreurs! Un exemple sympathique (pour faire un analogie) est qu'un 
nombre considérable de législations exigent seulement des seuils moyens de pollution par année alors 
que par exemple, fumer 1 cigarette par jour n'a pas le même impact que fumer 365 cigarette sur une 
année alors que les deux ont la même moyenne pris sur un an... C'est une preuve flagrante 
d'incompétence statistique du législateur. 


Voici un petit échantillon d'erreurs courantes: 
- Considérer que la moyenne arithmétique est la valeur qui coupe la population en deux parties égales. 


- Considérer que la moyenne de ratios du type objectifs/réalisés est pas égale au ratio des moyennes des 
objectifs et des moyennées des réalisations (alors que ce n'est pas la même chose!) 


- Considérer que la moyenne des salaires de différentes filliales est égale à la moyenne générale des 
salaires (alors que ceci n'est vrai que si et seulement si il y a le même nombre d'employés dans chaque 
filiale). 


- Considérer que la moyenne de la moyenne des lignes d'un tableau est toujours égal à la moyenne des 
moyennes des colonnes (alors que ceci n'est vrai que si et seulement si le contenu des cellules est non 
vide). 


Nous verrons ci-dessous différentes moyennes avec des exemples relatifs à l'arithmétique, au 
dénombrement, à la physique, à l'économétrie, à la géométrie et à la sociologie. Le lecteur trouvera 
d'autres exemples pratiques en parcourant l'ensemble du site. 


Définitions: Soient des nombres x, réels, nous avons alors: 


D1. La "moyenne arithmétique" ou "moyenne empirique" (la plus communément connue) définie par le 
quotient de la somme des n valeurs observées x, par l'effectif total n: 


et très souvent notée x ou encore À est pour toute loi statistique discrète ou continue un estimateur 
sans biais de l'espérance. 


La moyenne arithmétique représente donc une mesure statistique exprimant la grandeur qu'aurait 
chacun des membres d'un ensemble de mesures si la somme doit être identique au produit de la 
moyenne par le nombre de termes. 


Si plusieurs valeurs occurrent plus d'une fois dans les mesures, la moyenne arithmétique sera alors 
souvent notée formellement: 
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et appelée "moyenne pondérée par les effectifs". Enfin, indiquons que dans le cadre de cette démarche, 
la moyenne pondérée par les effectifs prendra le nom "d'espérance mathématique" dans le domaine 
d'étude des probabilités. 


Nous pouvons tout aussi bien utiliser les fréquences d'apparition des valeurs observées (dites 
"fréquence des classes"): 


Nous avons alors la "moyenne pondérée par les fréquences de classe": 


1 L > À, Lé 
H=-Dns=2x=D fix 04 
} il 


il il 7 


Avant de continuer, indiquons que dans le domaine de la statistique il est souvent utile et nécessaire de 
regrouper les mesures/données dans des intervalles de classe de largeur donnée (voir les exemples plus 
loin). Il faut souvent faire plusieurs essais pour cela même s'il existe des formules semi-empiriques pour 
choisir le nombre de classes lorsque nous avons n valeurs à disposition. Une de ces règles 
semi-empiriques utilisée par de nombreux praticiens consiste à retenir le plus petit nombre entier de 
classes k tel que: 


2Ë >» (7.5) 


la largeur de l'intervalle de classe étant alors obtenue en divisant l'étendue (différence entre la valeur 
maximale mesurée et la minimale) par k. Par convention et en toute rigueur... (donc rarement respecté 
dans les notations), un intervalle de classe est fermé à gauche et ouvert à droite: [....…[. Cettre règle 
empirique se nomme la "règle de Sturges" et est basées sur le raisonnement suivant: 


Nous admettons que les valeurs du coefficient binomial C donnent un histogramme idéal (nous 


laissons le lecteur vérifier cela simplement avec un tableau comme Microsoft Excel 11.8346 et la 
fonction COMBIN( ) qui y est disponible dans la version française). Au fur et à mesure que k devient 
grand l'histogramme ressemble de plus en plus à une courbe continue appelée "courbe Normale" que 
nous verrons plus loin. 


Dès lors, en nous basant sur le théorème binomial (cf. chapitre de Calcul Algébrique), nous avons: 
Le] Le! h : . 
= S'CarPpP ES CAPTPIP ES CA = - = 6 
ñn= >», Cha b = 2, Cpl 1 = 2, Cn =(a+b) ={(1+1i =2 (7.6) 
p=0 p=0 p=0 


Ensuite, pour chaque intervalle i le praticien prendra par tradition la moyenne entre les deux bornes 
pour le calcul et la multipliera par la fréquence f. de classe correspondante. Dès lors, le regroupement 


en fréquence de classes fait que: 


1. La moyenne pondérée par les effectifs diffère de la moyenne arithmétique. 


Page: 296/4839 


[v3.0 - 2013] 


2. Vue l'approximation effectuée elle sera un moins bon indicateur que la moyenne arithmétique. 


3. Elle est très sensible au choix du nombre de classes donc médiocre à ce niveau-là. 


Plus loin, nous verrons deux propriétés extrêmement importantes de la moyenne arithmétique et de 
l'espérance mathématique qu'il vous faudra absolument comprendre (moyenne pondérée des écarts à la 
moyenne et la moyenne des écarts à la moyenne). 


Remarque: Le "mode", noté Mod ou simplement M, est par définition la valeur qui apparaît le plus 
grand nombre de fois dans une série de valeurs. Dans Microsoft Excel 11.8346 (version française), 
soulignons que la fonction MODE ) renvoie la première valeur dans l'ordre des valeurs ayant le 
plus grand nombre d'occurrences en supposant donc une distribution unimodale. 


D2. La "médiane" ou "moyenne milieu", notée 4f, (ou plus simplement M), est la valeur qui coupe une 


population en deux parties égales. Dans le cas d'une distribution statistique continue f(x) d'une variable 
aléatoire X, il s'agit de la valeur qui représente 50% de probabilités cumulées d'avoir lieu tel que (nous 
détaillerons le concept de distribution statistique plus loin très en détails): 


Me +0 
P(X<M,)=P(X>M,)= [ f(x)dx = [ f(Hdx = 0.5 
00 Me 


Dans le cas d'une série de valeurs ordonnées x,,x,,...,x 


,,.., 2, , là médiane est donc de par sa définition 
la valeur de la variable telle que l'on ait autant d'éléments qui ont une valeur qui lui est supérieure ou 
égale, que d'éléments qui ont une valeur qui lui est inférieure ou égale. Elle est principalement utilisée 


pour les distributions asymétriques, car elle les représente mieux que la moyenne arithmétique. 
Plus rigoureusement: 


- Si le nombre de termes est impair, de la forme 2n+1, la médiane de la série est le terme de rang n+1 
(que les termes soient tous distincts ou non!). 


- Sile nombre de termes est pair, de la forme 2n, la médiane de la série est la demi-somme (moyenne 
arithmétique) des valeurs des termes de rang n et n + 1 (que les termes soient tous distincts ou non!). 


Dans tous les cas, de par cette définition, il découle qu'il y a au moins 50 % des termes de la série 
inférieurs ou égaux à la médiane, et au moins 50% des termes de la série supérieurs ou égaux à la 
médiane. 
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Considérons par exemple la table de salaires ci-dessous: 


1 1200 1 6% 
2 1220 2 12% 
3 1250 3 18% 
4 1300 4 24% 
5) 1350 5) 29% 
6 1450 6 35% 
7 1450 7 41% 
8 1560 8 47% 
[9 1600 9 53% 
10 1800 10 59% 
11 1900 11 65% 
12 2150 12 71% 
13 2310 13 76% 
14 2600 14 82% 
15 3000 15 88% 
16 3400 16 94% 
17 4800 17 100% 


Tableau: 7.1 - Identification de la médiane 


Il y a un nombre impair 2n+1 de valeurs. Donc la médiane de la série est le terme de rang n+1. Soit 
1'600.- (résultat que vous donnera n'importe quel tableur informatique). La moyenne arithmétique 


quant à elle vaut 2'020. 


En relation directe avec la médiane il est important de définir le concept suivant afin de comprendre le 


mécanisme sous-jacent: 


Définition: Soit donnée une série statistique x,,x3,..., He 


absolus" autour de x le nombre £'{x} défini par: 


E'(x) = > [x; — x] (7.8) 


Z, , NOUS appelons "dispersion des écarts 


£ (x) est minimum pour une valeur de x la plus proche d'une valeur donnée x, au sens de l'écart 


absolu. La médiane est la valeur qui réalise ce minimum (extrémum)! L'idée va alors consister à étudier 
les variations de la fonction pour trouver le rang de cet extrémum. 


En effet, nous pouvons écrire: 


Vrelz,,xul,r €{12,3,..,2-—1) eH=-Xk-d+ À x (7.9) 


Donc par définition de la valeur x : 


i=1 


2H 
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c=Y>lx-xl+ Y x -xl 
i=l i= H 


= Lrx- (x +x +..+2)]+[(xu +...+x,) -(a-r)x] 


=(2r-n)x+(rut.+x,)-(x+xm+.+x) 


Ce qui nous permet donc de faire sauter les valeurs absolues est simplement le choix de l'indice r qui 
est pris de telle manière que la série de valeurs peut en pratique toujours être coupée en deux parties: 
tout ce qui est inférieur à un élément de la série indexé par r et tout ce qui lui est supérieur (la médiane 
donc par anticipation). 


£'(x) est donc une fonction affine (assimilable à l'équation d'une droite pour r et n fixés) par morceaux 
(discrète) où l'on peut assimiler le facteur: 


2r-n (7.11) 
à la pente et: 
(rRut.+2)-(n+x+..+x) (07.12) 
à l'ordonnée à l'origine. 


La fonction est donc décroissante (pente négative) tant que r est inférieur à n/2 et croissante quand r 
est supérieur à n/2. Plus précisément, nous distinguons deux cas qui nous intéressent particulièrement 
puisque n est un entier (elle pas donc par un extremum!): 


- Si n est pair, nous pouvons poser # = 2x", alors la pente peut s'écrire 2{r —-x» 1 et elle est nulle si 
r =Ax" et dès lors puisque ce résultat n'est valable par construction que pour Yxe[x,,x,,,] alors &'{x) 
est constante sur [x,,x,4] et nous avons un extrémum obligatoirement au milieu de cet intervalle 


(moyenne arithmétique des deux termes). 


- Sin est impair, nous pouvons poser # = 2#'+1 (nous coupons la série en deux parties égales), alors la 
pente peut s'écrire (2r-2#—1) et elle est donc nulle si » = #»'+1/2 et dès lors puisque ce résultat n'est 
valable que pour Yxe[x,,x,,,] alors il est immédiat que la valeur du milieu sera la médiane %,:41. 


Nous retrouvons donc bien la médiane dans les deux cas. Nous verrons aussi plus loin comment la 
médiane est définie pour une variable aléatoire continue. 


Il existe un autre cas pratique où le statisticien n'a à sa disposition que des valeurs regroupées sous 
forme d'intervalles de classes statistiques. La procédure pour déterminer la médiane est alors différente: 


Lorsque nous avons à notre disposition uniquement une variable classée, l'abscisse du point de la 
médiane se situe en général à l'intérieur d'une classe. Pour obtenir alors une valeur plus précise de la 
médiane, nous procédons à une interpolation linéaire. C'est ce que nous appelons la "méthode 
d'interpolation linéaire de la médiane". 


La valeur de la médiane peut être lue sur le graphique ou calculée analytiquement. Effectivement, 
considérons le graphique représentant la probabilité cumulée F(x) en intervalles de classe comme 


ci-dessous où les bornes des intervalles ont été reliées par des droites: 
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Figure: 7.1 - Représentation graphique de l'estimation par interpolation linéaire de la médiane 


La valeur de la médiane M se trouve évidemment au croisement entre la probabilité de 50% (0.5) et 
l'abscisse. Si nous prenons dans le cadre particulier de l'exemple ci-dessus la borne supérieure de 
l'intervalle de classe précédant celle contenant la médiane nous avons 2 et 4 pour la borne inférieure de 
l'intervalle suivant. Nous avons alors en calculant la pente la relation suivante: 


Dr M2 4-2 


= =z—————— (7.13) 
Ây 05-02 07-02 
Ce que nous écrivons fréquemment: 
M,-a b—a 
— = (714 
05-F(a) F(b)-F(a) 
d'où la valeur de la médiane: 
M, =a+(b-a) __ (7.15) 
F(b)-F(a) 


Prenons le tableau suivant que nous retrouverons bien plus tard dans le présent chapitre: 


[0,501 0.068 
[50,100[ 919 1587 | 0.1587 
[100,150[ 1498 3'085 0.3085 
[150,200[ 1915 5'000 | 0.5000 
[200,250[ 1915 6915 | 0.6915 
[250,300[ 1498 8'413 | 0.8413 
[300,350[ sat) 9332 | 0.9332 
[350,400[ 440 9772 0.9772 
[400 et + 228 10'000 | 1 


Tableau: 7.2 - Identification de la classe médiane et du mode 
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Nous voyons que la "classe médiane" est dans l'intervalle [150,200] car la valeur cumulée de 0.5 s'y 
trouve (colonne toute à droite) mais la médiane a elle, en utilisant la relation établie précédemment, 
précisément une valeur de (c'est trivial dans l'exemple particulier du tableau ci-dessus mais faisons 
quand même le calcul...): 


MW, 2150200150. 0 200 (7.16) 
0.5 — 0.3085 


et nous pouvons faire de même avec n'importe quel autre centile bien évidemment! 


Nous pouvons également donner une définition pour déterminer la valeur modale si nous sommes 
seulement en possession des fréquences des classes d'intervalles. Pour cela partons du diagramme en 
barre des fréquences simplifié ci-dessous: 


X; 


Xi+i 


Figure: 7.2 - Représentation graphique de l'estimation par classess d'intervalles de la valeur modale 


En utilisant les relations de Thalès (cf. chapitre de Géométrie Euclidienne), nous avons immédiatement, 
en notant M la valeur modale: 
M-x zxu -M 
â À; 


(7.17) 


Comme dans une proportion, on ne change pas la valeur du rapport en additionnant les numérateurs et 
en additionnant les dénominateurs, il vient: 


= = + (7.18) 
Nous avons alors: 
À] 
= X, + ———— | Xx,,, — 7.19) 
t] A, +A, ( il x) (7 


Avec l'exemple précédent cela donne alors: 
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M =150+ 


(1'915—1"498) 
('915-1'498) + (1 915-1498) 


= 150+—(250- 150) = 150-100 = 200 


(250-150) 


La question qui se pose ensuite est celle de la pertinence du choix de la moyenne, du mode ou de la 
médiane en termes de communication. 


Un bon exemple reste celui du marché du travail où de façon générale, alors que le salaire moyen et le 
salaire médian sont relativement différents, les institutions de statistiques étatiques calculent la médiane 
que beaucoup de médias traditionnels assimilent alors explicitement au concept de "moyenne 
arithmétique" dans leurs communiqués. 


Remarque: Pour éviter d'obtenir une moyenne arithmétique ayant peu de sens, nous calculons 
souvent une "moyenne élaguée", c'est à dire une moyenne arithmétique calculée après avoir enlevé 
des valeurs aberrantes à la série. 


Les "quantiles" généralisent la notion de médiane en coupant la distribution en des ensembles donnés 
de parties égales (de même cardinal pourrions-nous dire.) ou autrement dit en intervalles réguliers. 
Nous définissons ainsi les "quartiles", les "déciles" et les "centiles" (ou "percentiles") sur la population, 
ordonnée dans l'ordre croissant, que nous divisons en 4, 10 ou 100 parties de même effectif. 


Nous parlerons ainsi du centile 90 pour indiquer la valeur séparant les premiers 90% de la population 
des 10% restants. 


Précisons que dans la version francophone de Microsoft Excel 11.8346 les fonctions QUARTILE( }, 
CENTILE( ), MEDIANE( ), RANG.POURCENTAGE ( ) sont disponibles et spécifions qu'il existe 
plusieurs variantes de calcul de ces centiles d'où une variation possible entre les résultats sur différents 
logiciels. 


Ce concept est très important dans le cadre des intervalles de confiance que nous verrons beaucoup 
plus loin dans ce chapitre et très utile dans le domaine de la qualité avec l'utilisation des boîtes à 
moustaches (traduction de Box & Whiskers Plot ou BoxPlot) permettant de comparer ("discriminer" 
comme disent les spécialistes) rapidement deux populations de données ou plus et surtout d'éliminer les 
valeurs aberrantes (prendre comme référence la médiane sera justement plus judicieux!): 


Page: 302/4839 


[v3.0 - 2013] 


100 


90 


60 


70 


60 


50 


40 
Figure: 7.3 - Box & Whiskers Plot 


Une autre représentation mentale très importante des boîtes à moustache est la suivante (elle permet 
donc de se donner une idée de l'asymétrie de la distribution): 


Mode 
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Figure: 7.4 - Représentation graphique du mode, de la médiane et des quartiles par rapport à une distribution 


Les notions de médiane, valeurs abérrantes et intervalles de confiance que nous venons de démontrer 
et/ou de citer sont à ce point importantes qu'il existe des normes internationales pour les utiliser 
correctement. Citons d'abord la norme ISO 16269-7:2001 Médiane - Estimation et intervalles de 
confiance et aussi la norme ISO 16269-4:2010 Détection et traitement des valeurs aberrantes. 


D3. Par analogie avec la médiane, nous définissons la "médiale" comme étant la valeur (dans l'ordre 
croissant des valeurs) qui partage la somme (cumuls) des valeurs en deux masses égales (donc la 
somme totale divisée par deux). 


Dans le cas de salaires, alors que le médiane donne le 50% des salaires se trouvant en-dessous et 
en-dessus, la médiale donne combien de salariés se partagent (et donc le salaire partageant) la première 
moitié et combien de salariés se partagent la seconde moitié de l'ensemble des coûts salariaux. 
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Par exemple pour revenir à notre tableau sur les salaires: 


1 1200 1200 3.5% 

2 1220 2420 7% 

3 1250 3670 10.7% 

4 1300 4970 145% 

5) 1350 6320 18.4% 

6 1450 7770 22.6% 

7 1450 9220 26.8% 

8 1560 10780 31.4% 

9 1600 12380 36.1% 

10 1800 14180 41.3% 

11 1900 16080 468% 
12 p150 8230 531% 
13 2310 20540 59.8% 

14 2600 23140 67.4% 

15 3000 26140 76.1% 

16 3400 29540 86% 

17 4800 34340 100% 


Tableau: 7.3 - Identification de la médiale 


La somme de tous les salaires fait donc 34'340 et la médiale est alors 17'170 (entre l'employé n°11 et 
12) alors que la médiane était de 1'600. Nous voyons alors que la médiale correspond au 50% du 
cumul. Ce qui est un indicateur très utile dans le cadre des analyses de Pareto ou de Lorenz par 
exemple (cf. chapitre de Technique de Gestion). 


D4. La "moyenne quadratique" parfois simplement notée Q qui est définie par: 


avec m—2. 


Remarque: C'est une des moyennes les plus connues en statistiques car l'écart-type est une 
moyenne quadratique (voir plus loin). 


Exemple: 


Soit un carré de côté a, et un autre carré de côté b. La moyenne des aires des deux carrés est égale à un 
carré de côté: 
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D5. La "moyenne harmonique" parfois simplement notée H est définie par: 


ñn 


EE 


Elle est peu connue mais découle souvent de raisonnements simples et pertinents (typiquement la 
résistance équivalente d'un circuit électrique ayant plusieurs résistances en parallèles). Il existe une 
fonction MOYENNE .HARMONIQUE( ) dans Microsoft Excel 11.8346 (version française) pour la 
calculer. 


Exemple: 


Soit une distance d parcourue dans un sens à la vitesse w, et dans l'autre (ou pas) à la vitesse v,. La 
vitesse moyenne s'obtiendra en divisant la distance totale 2d par le temps mis à la parcourir: 


V=— (7.24) 


Si nous calculons le temps mis lorsqu'on parcourt d avec une vitesse v, c'est tout simplement le 


quotient: 


Le temps total vaut donc: 


D6. La "moyenne géométrique" parfois notée simplement G est définie par: 


li, =3 [I (7.28) 
1 


Cette moyenne est souvent oubliée mais néanmoins très connue dans le domaine de l'économétrie 
(surtout quand nous étudierons le rendement géométrique moyen) et de la finance d'entreprise (cf. 
chapitre Techniques De Gestion) raison pour laquelle il existe une fonction 
MOYENNE.GEOMETRIQUE( ) dans Microsoft Excel 11.8346 (version française) pour la calculer. 


Exemple: 


Supposons qu'une banque offre une possibilité de placement et prévoit pour la première année un 
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intérêt (c'est absurde mais c'est un exemple) avec un taux (# —F)% , mais pour la deuxième année un 


intérêt avec un taux {4 +F)% Au même moment une autre banque offre un intérêt à taux constant 


pour deux ans: X%. C'est pareil, dirons-nous un peu rapidement. En fait les deux placements n'ont pas 
la même rentabilité. 


Dans la première banque, un capital €; donnera au bout de la première année un intérêt: 

(A -F)%'C (7.29) 
et la seconde année: 

(ZX +F)[CX -F% "C0 ] (7.30) 
Dans l'autre banque nous aurons au bout d'un an: 
A'Cy (731 

et après la seconde année: 

XXE) (732) 
etc. 


Comme vous pouvez le voir le placement ne sera pas identique si Y # Q ! X% n'est donc pas la 
moyenne de (4 -F)% et (Æ +F)%. 


Posons maintenant: 
n=(Z+F)M etr, =(4-F)% (7.33) 
Quelle est en fait la valeur moyenne r ? 


Au bout de deux ans le capital est multiplié par r, : r,. Si la moyenne vaut r il sera alors multiplié par ;? 
. Nous avons donc la relation: 


dd. - LL: 73 
En ACr ñn'# (7.34) 


C'est un exemple d'application où nous retrouvons donc la moyenne géométrique. L'oubli de la 
moyenne harmonique une erreur fréquente dans les entreprises lorsque certains employés calculent le 
taux moyen d'augmentation d'une valeur de référence. 


D7. La "moyenne mobile", appelée aussi "moyenne glissante" est définie par: 


_MtM;+.+M, 


# 


MM 


5 


La moyenne mobile est particulièrement utilisée en économie, où elle permet de représenter une courbe 
de tendance d'une série de valeurs, dont le nombre de points est égal au nombre total de points de la 


série de valeurs moins le nombre que vous spécifiez pour la période. 
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Une Moyenne Mobile (MM) en finance est calculée à partir des moyennes des cours d'une valeur, sur 
une période donnée: chaque point d'une moyenne mobile sur 100 séances est la moyenne des 100 
derniers cours de la valeur considérée. Cette courbe, affichée simultanément avec la courbe d'évolution 
des cours de la valeur, permet de lisser les variations journalières de la valeur, et de dégager des 
tendances. 


Les moyennes mobiles peuvent être calculées sur différentes périodes, ce qui permet de dégager des 
tendances à court terme MMC (20 séances selon les habitudes de la branche), moyen terme (50-100 
séances) ou long terme MML (plus de 100 séances). 


Moyenne Mobile 
courte (MMC=5 


N Moyenne Mobile 


longue (MML=100} 


Copyright®|Clétel À 


“28/2/1997 24/3/1993 


e: 7.5 - Représentation gr biles pour 100 séances de négoce 


Les croisements des moyennes mobiles par la courbe des cours (découpée avec une certaine 
granularité) de la valeur génèrent des signaux d'achat ou de vente (selon les professionnels) suivant le 
cas: 


- Signal d'achat: lorsque la courbe des cours franchit la MM. 
- Signal de vente: lorsque la courbe des cours franchit la MM vers le bas. 


Outre la moyenne mobile, précisons qu'il existe une quantité d'autres indicateurs artificiels souvent 
utilisés en finance comme par exemple le "upside/downside ratio". 


L'idée est la suivante: Si vous avez un produit financier (cf. chapitre d'Économie) actuellement de prix 
&, (prix courant) pour lequel vous avez un objectif de gain haut à un prix haut correspondant que nous 


noterons À, (high price) et inversement le potentiel de perte que vous estimez à un prix Æ (low price). 


Alors, le rapport: 


donne le Upside/Downside Ratio. 


Par exemple, un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 15.- a donc un ratio 
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UD; =1 et donc un facteur spéculatif identique pour permettre le gain ou une perte de 5.-. 


Un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 20.- a donc un ED; = 2 donc 
deux fois le potentiel spéculatif de gain par rapport à celui de perte. 


Certaines associations boursières recommandent de refuser les 2; inférieurs à 3. Les investisseurs 


ont tendance à rejeter les 1); trop élevés pouvant être un signe de gonflage artificiel. 


D8. La "moyenne pondérée" (dont nous avons déjà fait mention plus haut d'un cas particulier) est 
définie par: 


et est utilisée par exemple en géométrie pour localiser le barycentre d'un polygone, en physique pour 
déterminer le centre de gravité ou en statistiques pour calculer une espérance (le dénominateur étant 
toujours égal à l'unité en probabilités) et en gestion de projets pour estimer les durées des tâches. 


Dans le cas général le poids », représente l'influence pondérée ou arbitraire/empirique de l'élément x, 
par rapport aux autres. 


DS. La "moyenne fonctionnelle" ou "moyenne intégrale" est définie par: 


1 
b-a 


E 
li = (l J(x)dx| (7.38) 
2 


où ä, dépend d'une fonction f d'une variable réelle intégrable (cf. chapitre de Calcul Différentiel Et 
Intégral) sur un intervalle [a,b]. Elle est très souvent utilisée en théorie du signal (électronique, 
électrotechnique). 


2.1. LISSAGE DE LAPLACE 


Pour en revenir à nos fréquences de classes vues bien plus haut et avant de continuer avec l'étude de 
quelques propriétés mathématiques des moyennes. il faut savoir que lorsque nous travaillons avec des 
lois discrètes de probabilités il arrive très (très) fréquemment que nous rencontrions un problème 
typique dont la source est la taille de la population. Considérons comme exemple le cas où nous avons 
12 documents et que souhaiterions estimer la probabilité d'occurrence du mot "Viagra". Nous avons sur 
un échantillon les valeurs suivantes: 
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| 
| 


RU DIR 
OINOIR 


| 
| 


| 6 | 6 
| | 3 
| 8 | 0 
| 9 | 6 
| 10 | 2 
| 11 | 0 
| 12 | 1 


Tableau: 7.4 - Fréquences de classe du mot 


Tableau que nous pouvons représenter d'une autre manière: 


Occurrences du mot Documents, Probabilité 

0 4 0.33 
1 2 0.17 
2 2 0.17 
3 [ 0.083 
4 1 0.083 
5) 0 0 

6 2 0.17 


Tableau: 7.5 - Fréquences de classe respective des documents 


Et ici nous avons un phénomène courant. Il n'y a aucun document avec 5 occurrences du mot qui nous 
intéresse. L'idée (très courante dans le domaine du Data Mining) est alors d'ajouter artificiellement et 
empiriquement un comptage en utilisant une technique appelée "lissage de Laplace" qui consiste à 
additionner k unités à chaque occurrence et qui est courant dans le domaine du Data Mining. Dès lors le 
tableau devient: 


Occurrences du motDocuments, Probabilité 
0 5) 0.26 
1 3 0.16 
2 3 0.16 
3 2 0.11 
4 P 0.11 
5) ! 0.05 
6 3 0.16 


Tableau: 7.6 - Fréqunce de classe des documents avec lissage 


Évidemment ce type de technique est sujet à débat et sort du cadre scientifique. Nous avons même 
hésité à présenter cette technique dans le chapitre de Méthodes Numériques (avec le reste de toutes les 


techniques numériques empiriques)... 
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2.2. PROPRIÉTÉS DES MOYENNES 


Voyons maintenant quelques propriétés pertinentes qui relient quelques-unes de ces moyennes ou qui 
sont propres à une moyenne donnée. 


Les premières propriétés sont importantes donc prenez garde à bien les comprendre: 


P1. Le calcul des moyennes arithmétique, quadratique et harmonique peut être généralisé à l'aide de la 


relation suivante: 
1 4) 
=» —S x (7.39) 
F3] 


où nous retrouvons: 

1. Pour # = 1, la moyenne arithmétique 
2. Pour # = 2, la moyenne quadratique 
3. Pour # = —-1,la moyenne harmonique 


P2. La moyenne arithmétique a une propriété de linéarité, c'est-à-dire que (sans démonstration car 
simple à vérifier): 


Ax + {4 = ÀX + Li bi 


C'est la version statistique de la propriété de l'espérance en probabilité que nous verrons plus loin. 
P3. La somme pondérée des écarts à la moyenne arithmétique est nulle. 
Démonstration: 


D'abord, par définition, nous savons que: 


ñ > et u= Tux (7.41) 
A 


il il 


il s'ensuit que: 


té La té té Î té té Lé 
dx (x - 4) PS ke LD »; - 2% i DE #7 2% D = 0] (742) 


il il il 


Ainsi, cet outil ne peut être utilisé comme mesure de dispersion! 


Par extension la moyenne des écarts à la moyenne pondérée par les effectifs est nulle aussi: 


27 (x - 4) 0 (7.43) 


# 
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OIC.Q.F.D. 


Ce résultat est relativement important car il permettra plus loin de mieux saisir le concept d'écart-type 


et de variance. 


P4,. Soit à démontrer: 


Démonstration: 


Li  Hy SE < Hg (744) 


Tout d'abord, nous prenons deux nombres réels non nuls x, et x, tels que x; > x, > Ü et nous écrivons: 


1. La moyenne arithmétique: 


2. La moyenne géométrique: 


3. La moyenne harmonique: 


Le 


=, 


Lee 
Hg 2 


4. La moyenne quadratique: 


A À 


= "2 (745) 


= NET (7.46) 


ZX ZX 
LE. #1 
An A At D, 2 23% (7:47) 
2 2% a tx 
di 
2 17 (748 
Fr (7.48) 


Remarque: Les comparaisons entre les moyennes précitées et la médiane ou encore les moyennes 
glissantes et pondérées n'ont pas de sens c'est pour cela que nous nous abstenons à les faire. 


Prouvons déjà que {, > {4 par l'absurde en posant {, — 4, < Ü: 
E Li E & 
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Be En = A2 — 


2%% NET A +2 2% — 22% —. 
x + X2 x + X2 


— À 2 À + 42 5 — 2%% <0 


— 4/%2X24 +4/%2%2X <2%% 


= VA%2 , VA <2 
ZX x 


2 1 
ZX ZX 

— EE F. «2 
4 4 


sé : 
Par commodité posons y= {2 nous savons que y > 1. Or: 


ES | 
es X3 1 
+ f=—+y (750) 
X2 A 


= Ë Ê : Le 
et nous cherchons à montrer que }“L+ |“2 <2 n'est pas possible. Mais ceci découle des 
42 ] 


(7.49) 


équivalences suivantes: 


2 
fr -h-2 Hé +1-2y<0(y-1ÿ <0 (751) 
X2 4 Y 


Il y a donc contradiction ce qui vérifie notre hypothèse initiale: 


Hg y 20 He ? Hy (752) 
Regardons maintenant si {, > Hg: 


Sous l'hypothèse x, > x > 0. Nous cherchons donc maintenant à montrer que: 


À +x L 
> alX ZX (7.53) 
D \ 1 '°#2 


Or nous avons les équivalences suivantes: 


A +x 2 
22 > fn: S(x+x) >4r.méex+x-2n m>0e(n-x) >0 (7.54) 


et la dernière expression est évidement correcte. 
Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale: 
Ho 7 Uy 0 Ha ? Hg (7:55) 


Nous prouvons maintenant 4, > { et démontrons-le par l'absurde en posant {4 — £, < 0: 
P 4 ” Fa P P 4 Pa 
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4 4 + x A +2 
4 ê \ 2 2 


2 2 2 2 2 2 2 2 
X +x % +x A +x X +x X +x X +22% x +x 7 
= 1 2 __À 2 0 = 1 2 - 1 2 — 1 2 - À 1 42 2 (7.56) 
| 2 2 2 2 2 4 


2 2 
A +2%X +x 2 
222, 527 tr <0— (5-2) <0 


> +x < 


Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale: 
HT 70e 424 (757) 
Nous avons donc bien: 
 < Hg CH < y (7.58) 


OIC.Q.F.D. 


Ces inégalités démontrées, nous pouvons alors passer à une figure que nous attribuons à Archimède 
pour placer trois de ces moyennes. L'intérêt de cet exemple est de montrer qu'il existe des relations 
remarquables parfois entre la statistique et la géométrie (fruit du hasard ???). 


Figure: 7.6 - Point de départ pour la représentation géométrique des moyennes 


Nous allons d'abord poser 4 = 48.ë = BC et O est le milieu de 4€ . Ainsi, le cercle dessiné & est de 
centre O et de rayon ©4. D est l'intersection de la perpendiculaire à 4€ passant par B et du cercle £ 
(nous choisissons l'intersection que nous voulons). H est quant à lui le projeté orthogonal de B sur 95. 


Archimède affirme que ©4 est la moyenne arithmétique de a et b et que 375 est la moyenne 
géométrique de a et b, et 54 la moyenne harmonique de a et b. 
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Nous démontrons donc que (trivial): 


OA 


_atb 


2 


(7.59) 


v [à 


Donc @4 est bien la moyenne arithmétique ;4, de a et b. 
Ensuite nous avons dans le triangle rectangle ADB: 
AD? = DB2+ B4 (7.60) 
Puis dans le triangle rectangle 89€ nous avons: 
DC? =BC2+DB2 (7.61) 
Nous additionnons alors ces deux égalités, et nous trouvons: 
2DB?+ BA +BC?= AD?+DC? (762) 
Nous savons que D est sur un cercle de diamètre 4€, donc ADC est rectangle en D, donc: 
AD?2+DC2= AC2 (7.63) 
Puis nous remplaçons 84 et BC par a et b: 
2DB? + a? +b2 = AC? = (a+bÿ & 2DB? = 2ab & DB = fab (7.64) 
Et donc, 9 est bien la moyenne géométrique 4, de a et b. 
Nous reste à prouver alors que £47 est la moyenne harmonique de a et b: 


Nous avons dans un premier temps (projection orthogonale): 


atb 


DGeDB - DO (DBcosa)- DO-DE -| ]Fr _—. 


Puis nous avons aussi (projection orthogonale aussi): 


— — —. — —  — — 
DO o DB = (DOcosæ)-DB= DB-DB= DB (766) 


Nous avons donc: 
—— + — 
DB? = (= DA (7.67) 


et comme Dg = ab , nous avons donc: 
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Da est donc bien la moyenne harmonique de a et b, Archimède ne s'était pas trompé. 


3. TYPES DE VARIABLES 


Lorsque nous avons parlé des échantillons au début de ce chapitre, nous avons fait mention de deux 
types d'informations: les variables quantitatives et qualitatives. Nous n'avons cependant pas précisé qu'il 
existait trois types de variables quantitatives très importantes qu'il convient absolument de différencier: 


1. Les variables discrètes (par comptage): Sont analysées avec des lois statistiques basées sur un 
domaine de définition dénombrable toujours strictement positif (loi de Poisson typiquement dans 
l'industrie). Sont quasiment toujours représentées sous forme graphique par des histogrammes. 


2. Les variables continues (par mesure): Sont analysées avec des lois statistiques basées sur un domaine 
de définition non dénombrable strictement positif ou pouvant prendre toute valeur positive ou négative 
(loi Normale typiquement dans l'industrie). Sont également quasiment toujours représentées sous forme 
graphique par des histogrammes avec des intervalles de classe. 


3. Les variables par attribut (de classification): Il ne s'agit pas de données numériques mais de données 
qualitatives de type {Oui, Non}, {Réussi, Échec}, {A temps, En retard}, etc. Les données de type 
attribut suivent une loi Binomiale. 


Comprendre les différents types de données est une discipline importante de l'ingénieur parce que cela 
a des conséquences importantes sur le type d'analyse, les outils et techniques qui seront employés. 


Une question fréquente concernant la collecte de données est de savoir quelle est la quantité qui devrait 
être collectée. Au fait cela dépend du niveau de précision souhaité. Nous verrons beaucoup plus loin 
dans ce chapitre (avec démonstration) comment déterminer mathématiquement la quantité de données 
à collecter en parlant de la précision souhaitée pour un process Normal. 


Voyons de près de quoi il s'agit car maintenant que le concept de moyenne nous est relativement bien 
connu, nous allons pouvoir aborder des calculs plus formels et qui prendront tout leur sens. 


3.1. VARIABLES DISCRÈTES 


Soit X une variable indépendante (un individu d'un échantillon dont la propriété est indépendante des 
autres individus) qui peut prendre les valeurs aléatoires discrètes x,,x,,x,,... dans IR (réalisations du 


vecteur { X1,X3,...,X, 1) avec les probabilités respectives p,,p,,p2,,. où, de par l'axiomatique des 
probabilités: 


P: El01] > =i 
1 


Définitions: 


D1. Soit X une variable aléatoire (v.a.) numérique (quantitative). Elle est complètement décrite par la 
valeur de la probabilité (pour les variables discrètes) ou par la probabilité cumulée (pour les variables 
continues) pour qu'une réalisation de cette variable soit inférieure à x pour tout x. Cette probabilité 
(cumulée) est notée: 


F(x)=P(X£<x) VreR 
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avec: 


12P(X)20 (771) 


où F(x) s'appelle la "fonction de répartition" de la variable X. C'est la proportion théorique de la 
population considérée dont la valeur est inférieure ou égale à x. Il s'ensuit: 


PIX >xi=1-F(D Se PIX <x)+P(X >xl=1 (772) 
Plus généralement, pour toute paire de nombres a et b avec 4 <b , nous avons: 
Pla<SÆX<b)=F(b)-F(a) (7.73) 


D2. La "fonction de répartition empirique" est quant à elle définie naturellement par (nous avons 
indiqué les différentes notations courantes dans la littérature): 


ñ 1 il Le) 
BCD = lrex = D Ogex = ——— [0,1] (7.74) 
À . # 


associé à l'échantillon de variables aléatoires indépendantes et identiquement distribuées (ce que l'on 
nomme aussi un "vecteur aléatoire" noté (X1,X3,..,X, |). 


Il s'agit simplement du cumul normalisé à l'unité des fréquences d'apparition en-dessous d'un certaine 
valeur fixée (démarche que la majorité des êtres humains font naturellement en cherchant la fonction 
de répartition). 


Donc si nous reprenons l'exemples de salaires, vus plus haut, nous avons alors par exemple pour x fixé 
à 1'800: 


Page: 317/4839 


[v3.0 - 2013] 


Salaires ordonnés [Fréquence 


(x £x) lex 


1200 
1220 
1250 
1300 
1350 
1450 
1450 
1560 
1600 
1800 
1900 
2150 
2310 
2600 
3000 
3400 
4800 (0) 


Figure: 7.7 - Exemple de la fonction de répartition empirique 


SiSs ss ss rl le PlPlelelPlelE 


et donc: 


17 
à 1 
Ày (x <1800)=—Zlxex = 102 59% (7.75) 


4 
La fonction de répartition est clairement une fonction monotone croissante (ou plus précisément "non 
décroissante") dont les valeurs vont de 0 à 1. 
3.1.1. ESPÉRANCE ET VARIANCE DE VA. DISCRÈTES 


Définition: Nous définissons "l'espérance mathématique", appelée aussi "moment d'ordre 1", de la 
variable X par la relation: 


Ux EX =S n%| (776 
i 


appelée aussi "règle des parties". 


En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est associé une 
probabilité à laquelle nous associons également une valeur (donnée par la variable aléatoire). La 
question étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir. La valeur espérée, 
(l'espérance mathématique donc...) est alors la moyenne pondérée, par la probabilité, de toutes les 
valeurs des événements de l'espace des échantillons. 


Si la probabilité est donnée par une fonction de distribution (voir les définitions des fonctions de 


Page: 318/4839 


[v3.0 - 2013] 


distribution plus bas) de la variable aléatoire, nous avons: 


Pi = SX) Hx = E(X) =D xf(x) (7.77) 


Remarques: 


R1. ji, peut être notée # s'il n'y pas de confusion possible. 


R2. Si nous considérons chaque valeur x,,x;,,x,,... Comme les composantes d'un vecteur x et 
chaque probabilité (ou pondération) p,,2,,2,,... comme les composantes d'un vecteur À alors 


nous pouvons écrire l'espérance de manière technique sous la forme d'un produit scalaire souvent 
noté: 


Dor=(p.x)= 5 px = E(X) (7.78) 


2=l 


Voici les propriétés mathématiques les plus importantes de l'espérance pour toute variable aléatoire 
(quelle que soit sa loi!) ou pour toute série de variables aléatoires et que nous utiliserons souvent tout 
au long de ce chapitre: 


P1. Multiplication par une constante: 


E(aX)= D axP(X =x)=a) xPCX =x)=@E(X) (7) 


P2. Somme de deux variables aléatoires: 


E(X+F)= 2x +3,)P((X=x)0( =y;))] 
. 


=>[aP(E=moeer)) HELP 250€ =3))] 


Æ _ 
= 5x, Z P((X=x)N4= ») +Z y, DAC =x)N(F= 2) (7.80) 
| - - = 
=>, AC = 3,)N [JE = | A0 =y;) NX | 
- . e : 
=DxP(X=x)+2 y, P(Y=y,)=E(X)+E0) 
: - 
où nous avons utilisé dans la 4ème ligne, la propriété vue dans le chapitre de Probabilités: 


e(La) 37 


ieN 
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Nous en déduisons que pour n variables aléatoires X,, définies sur une même loi de distribution: 


sy x | =S E(X) (81) 
à i 
P3. Espérance d'une constante: 
EG*)=S pe ni 8) 
i i 


Définition: Après avoir traduit la tendance par l'espérance il est intéressant de traduire la dispersion ou 
"déviation standard" autour de l'espérance par une valeur appelée "variance de X" ou encore "moment 
centré du deuxième ordre", notée V(X) ou as (lire "sigma-deux"') et donnée sous sa forme discrète par: 


oÿ = P(A)= E[(X -4y) |] E Z (x - ny) Pi (7.83) 


La variance n'est cependant pas comparable directement à la moyenne, car l'unité de la variance est le 
carré de l'unité de la variable, ce qui découle directement de sa définition. Pour que l'indicateur de 
dispersion puisse être comparé aux paramètres de tendance centrale (moyenne, médiane et... mode), il 
suffit d'en prendre la racine carrée. 


Par commodité, nous définissons ainsi "l'écart-type" de X, noté at ÆX), par: 


OX) = Oz = NAS (7.84) 


L'écart-type est donc la moyenne quadratique des écarts (ou "écart moyen quadratique") entre les 
observations et leur moyenne. 


Remarques: 


R1. L'écart-type «, de la variable aléatoire X peut être noté & s'il n'y pas de confusion possible. 


R2. L'écart-type et la variance sont, dans la littérature, souvent appelés "paramètres de dispersion" 
à l'opposé de la moyenne, mode et médiane qui sont appelés des "paramètres de position". 


Définition: Le rapport «{ {{ (exprimé en %) parfois utilisé dans les entreprises comme comparaison de 
la moyenne et de l'écart-type est appelée le "coefficient de variation" (C.V.). 


Pourquoi trouvons-nous un carré (réciproquement une racine) dans cette définition de la variance? La 
raison intuitive est simple (la rigoureuse l'est nettement moins...). Nous avons démontré plus haut que la 
somme des écarts à la moyenne pondérés par les effectifs, est toujours nulle: 


> (x -#)=0 (7.85) 


il 


Or, si nous assimilons les effectifs par la probabilité en normalisant ceux-ci par rapport à n, nous 
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tombons sur une relation qui est la même que la variance à la différence que le terme entre parenthèse 
n'est pas au carré. Et nous voyons alors immédiatement le problème... la mesure de dispersion serait 
toujours nulle d'où la nécessité de porter cela au carré. 


Nous pourrions imaginer cependant d'utiliser la valeur absolue des écarts à la moyenne, mais pour un 
certain nombre de raisons que nous verrons plus loin lors de notre étude des estimateurs le choix de 
porter au carré s'impose assez naturellement. 


Signalons cependant quand même l'utilisation courante dans l'industrie deux autres indicateurs 
fréquents de la dispersion: 


- "L'écart absolu moyen" (moyenne des valeurs absolues des écarts à la moyenne): 


N 
RL (7.86) 
NN 


qui est un indicateur élémentaire très utilisé lorsque nous ne souhaitons pas faire de l'inférence 
statistique sur une série de mesures. Cet écart peut être facilement calculé dans la version française 
Microsoft Excel 11.8346 à l'aide de la fonction ECART.MOYEN( ). 


- "La déviation absolue de la médiane" noté MAD (médiane des valeurs absolues des écarts à la 
médiane): 


MAD = M,||X-M4, (Xi (7.87) 


qui est considéré comme un indicateur plus robuste de la dispersion que ceux donnés par l'écart absolu 
moyen ou l'écart-type (malheureusement cet indicateur n'est pas intégré nativement dans les tableurs). 


Exemple: 


Considérons les mesures d'une variable aléatoire X: 
(1,1,2,2,4,6,9) (7.88) 
dont la médiane vaut: 
M,(X) = M, (11,2,2,4,6,9)=2 (7-89) 
Les déviations absolues par rapport à la médiane sont alors: 
X-M,(Æ)=(110,0,2,4,7) (7.90) 


Mis dans l'ordre croissant, nous avons alors: 


(0,0,11,2,4,71 (7.91) 
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où nous identifions la déviation absolue de la médiane vaut: 


MAD = M4,(0,0,1,1,2,4,71=1 (7-92) 


Dans le cas où nous avons à disposition une série de mesures, nous pouvons estimer la valeur 
expérimentale de la moyenne (l'espérance) et de la variance des mesures par les estimateurs suivants (il 
s'agit simplement au fait de l'espérance et l'écart-type d'un échantillon dont les événements sont tous 
équiprobables) dont la notation est particulière: 


# 1 È A l A12 - 
=—S xletlé = (x -4) | (793 
# 


il #5] 


Démonstration: 
# # 1 1 * 
= EHX)=D rx >-x- 0 x=À 


il i-1 7 #52] 


D = BCE - EC = AE - A) 1e D = Be) pa DC MT (99 
il 2] 
= LG - 2-6 
Fil 


OIC.Q.F.D. 


Et démontrons un petite propriété bien sympathique comme quoi la moyenne arithmétique est un 
optimum de la somme des carrés des écarts. Effectivement, nous avons: 


Le] Le] n 
2 
Zix-af =D -2a x +n@ (795) 
i=1 i=1 i=1 


et si nous cherchons 4 tel que la dérivée de l'expression ci-dessus est nulle: 


à n Le] 
— Sr -2aS" x + = 0 (7.96) 
date var 
i=1 i=1 
alors æ est un optimum. Nous avons alors: 
ä Le. 3 h h 
—| 5x -24S "x + |[=-25 x; +2næ=0 (7.97) 
dal PE — 
i=1 i=1 i=1 


soit après réarrangement et simplification élémentaire: 


1 n 
&œ=—5 x (7.98) 
7 521 


Il s'agit donc bien de la moyenne arithmétique. Maintenant pour savoir s'il s'agit d'un extrema de type 
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maximum ou minimum il suffit de faire la dérivée seconde et de voir que cela donne une constante 
positive (donc la dérivée première augement quand æ augmente). Il s'agit alors d'un bien extrema de 


type minimum!!! 


Le terme de la somme se trouvant dans l'expression de la variance (écart-type) est appelée "somme des 
carrés des écarts à la moyenne". Nous l'appelons aussi la "somme des carrés totale", ou encore la 
"variation totale" dans le cadre de l'étude de l'ANOVA (voir la fin de ce chapitre). 


Remarque:ll est important que le lecteur comprenne que dans ce cas l'espérance se calcule 
simplement en utilisant la moyenne arithmétique! 


La variance peut également s'écrire sous la forme de la "relation de Huyghens" que nous réutiliserons 
plusieurs fois par la suite. Voyons de quoi il s'agit: 


PCA) = ACX - 43) 1e DC -) JG) = D -2uyx + 4h) SG) 
i à 
dr f(x) 2 nf) D JR) DR JR) 2H + He (709 
i i i i 
=D f(x) 4E = EC?) - pa = EC?) - EX) 
i 
Faisons maintenant un petit crochet relativement à un scénario fréquent générateur d'erreurs dans les 


entreprises lorsque plusieurs séries statistiques sont manipulées (cas très fréquent dans l'industrie ainsi 
que dans les assurances ou la finance). 


Considérons deux séries statistiques portant sur le même caractère: 
- (%.,#)...,(x,,#,), effectif total n, moyenne x , écart-type &, 
- (#4)... 07,,,), effectif total m, moyenne Yÿ, écart-type &, 


Nous noterons (z,,r,) la série statistique obtenue en regroupant les deux séries. Nous avons alors: 


+) y, A—D) X+m— D y, 
= 2% Z re me nx+mÿ (100) 
LE = ——————————_—_—_— = —————— = — 

A+ A + A+ 


Donc la moyenne des moyennes n'est pas égale à la moyenne globale (première erreur fréquente dans 
les entreprises) exceptée si les deux séries statistiques ont le même nombre d'effectifs!!! 


Concernant l'écart-type, rappelons d'abord que nous avons: 
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(7.101) 


Pour la suite, rappelons que nous avons démontré précédemment la relation de Huygens: 


& 
V(z)= À = E(z?)- E(z)ÿ = DE 7? (7.102) 
=] 


Il vient alors: 


En “mot }- (a) 


A + 


1 5 1 £ NX + Ÿ 
m=lsy2-7 1 a-[ee) - _ 
: 23 - R 2 H% A+m A + 


"> LS, a 
7 24% m2" Ê je) 
A + 


1.7 _2 LÉ 2 2 
(En -s Jen 2m ni .. 
: À; FR 5 + x + -[£ LX| 
A+ A+ A+ 


no +mao, Le + m5? (= me 


A+ A+ A+m 


n D +mo Ca COS (ir + mÿ)° 
— © + —  ——— ——— 


= À 7 
A+ (a+ m)° 
no +moi Ces + mnÿ? + mx? +m5°)-(#27 + 2Hxmy + my) 
= —————_—_—— + —————————————…———.…— …——————…—"—… _.——…———… —.…— —."— 
a+ (x+m)° 
no +moi AA + mor? | (22) no +mo? ÿ?+x32-0% 
L À À 
ñ + (#+) a+ (a+m) 
= noi +mo, + HR GPA 
A+ (x+7) 


(7.103) 


Donc nous voyons que l'écart-type global n'est pas égal à la somme des écarts-types (deuxième erreur 
courante dans les entreprises) excepté si les effectifs et les moyennes sont les mêmes dans les deux 
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séries!!! 


Considérons maintenant X une variable aléatoire d'espérance Æ (valeur constante et déterminée) et de 
variance 4? (valeur constante et déterminée), nous définissons la "variable centrée réduite" par la 


relation: 


et l'on démontre de façon très simple en utilisant la propriété de linéarité de l'espérance et la propriété 
de multiplication par un scalaire de la variance (voir de suite après) que: 


E&@)=0P(F)=1 (7105) 


Démonstration: 


(7.106) 


et en utilisant la relation de Huyghens: 


V(Y)= EC?) 18 = EX?) = ar - 2xut)| = (EX) 2E(Xu+ 2) 
= (EX 2E(X)u +4) = (EU) 28 +4)= (EX #) (7.107) 
= (+) re Se =1 


OIC.Q.F.D. 


Ainsi, toute répartition statistique définie par une moyenne et un écart-type peut être transformée en 
une autre distribution statistique souvent plus simple à analyser. 


Voici quelques propriétés mathématiques importantes de la variance: 


P1. Multiplication par une constante: 


VuX) = D fax nf RDS GX ui f 2 V2) (108) 


P2. Somme de deux variables aléatoires: 
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PR +N= Ex +9,)- (ar +47) JG) 


=ZZ((x 47) #(»;- 4) CR? 
- px (C - ay) +2(x% -4y)(v,-4)+(»,- de) }ftx.5) 


(7.109) 


2 - x) fx +22 (x ay)», -4)fG +2: ur) SG») 


= 7 +7()+22 (x -4y (4) G,»)) 


1,3 


= FL)+F()+ 28[(x- y )(Y - ky)] = PCA) +V(F)+2cov(X,F) 


3.1.2. COVARIANCE DISCRÈTE 


Nous venons de voir dans la dernière relation le concept de "covariance" dont nous verrons une 
expression plus commode un peu plus bas mais donc définie par: 


Cyr = EX - 4x7 -)] G.10) 


Introduisons une forme plus générale et extrêmement importante de la covariance dans de nombreux 
domaines: 


V(X+FY+Z)= ZZZUG +ÿ; +2) (y + Hy +43)) F(x,9;2) 
-ZZZ(G = dy) + O5 4) + Gr 47) S(x92) 

-ZZZ(A+8 +CŸ f(x,7,2) 

= 22214 +87+C7+24B+2BC+2AC)f(x.9;.2) (111) 


= PA+FO+PU+ILZ 2 (A8 +20 + AC) (x. js Z,) 


= VCD + PP) +P(2) + 2covX. n +2cov(Y, Z)+2cov(X,Z) 
= 7) + FA) +Y(X3)+2cov(X1, X2)+2cov(X, Xa)+2cov(X1, Xa) 


=D 7x) 129 cov(X, X, 7 


icj 


Donc dans le cas général: 


Èx, = 27 (X) + 25 cov(X,,X,) | (7.112) 
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En utilisant la propriété de linéarité de l'espérance et le fait que: 


nous avons pour la covariance: 


cov(X,?) = E[(X- EX) - E(P))]= E[AY - E(X) - XE(Y)+ ECO) E(T)] 
= E(XY)- E(E(X)Y)- E(XE(Y))+E(E(ANE(T)) 

= E(XY)- E(X)E(Y)- E(Y)E(X)+E(NE(P)E(1) 

= E(XY)-2E(N)E(Y)+E(N)E(T)E(1)= ECXY)- E(X)E(F) 


(7.114) 


et donc nous obtenons la relation très utilisée en statistiques et finance dans la pratique appelée 
"formule de la covariance"…..: 


Cyy = cov(X#,F) = E(XT) - E(AE(F)| (7.115) 


qui est cependant plus connue sous la forme: 
1 — 
Cyy=covi#,F)i= , 22 7 —X-Y (7.116) 
: 


Indiquons également que si X = F, ce qui équivaut donc à une covariance univariée, nous retrouvons 
la relation de Huyghens: 


cy.x = ElX? 4% =E[(X-ur\X-ur ]= EX -4r Ferre (7.117) 


Remarque: Les statistiques peuvent être découpées selon le nombre de variables aléatoires que 
nous étudions. Ainsi, lorsqu'une seule variable aléatoire est étudiée, nous parlons de "statistique 
univariée", pour deux variables aléatoires de "statistique bivariée" et en général, de "statistique 
multivariée". 


Si et seulement si les variables sont équiprobables, nous retrouvons la covariance dans la littérature 
sous la forme suivante, appelée parfois "covariance de Pearson", qui découle de calculs que nous avons 
déjà fait antérieurement avec l'espérance: 


1 # 
ÊEr Di . Hy)Cx jte) (7.118) 


#3] 


La covariance est un indicateur de la variation simultanée de X et Y. En effet si, en général X et Y 
croissent simultanément, les produits (y, - {,)(x; -4,) seront positifs (corrélés positivement), tandis 


que si Y décroît lorsque X croît, ces même produits seront négatifs (corrélés négativement). 


Signalons que si nous distribuons les termes de la dernière relation, nous avons: 
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l 1 : : 
CRT =cov(,7)=- 2 X%— Axl\Y kr)==2Z(x —x)(» -}) 
el ï 
(7.119) 


Lo L 1 | _ 
2a(n-5)-7(x-5)=- > xx -ÿ)-x> (Y 7) 
ï î î 


et nous avons déjà démontré que la somme des écarts à la moyenne est nulle. Dès lors nous obtenons 
une autre forme courante de la covariance: 


l - =n 1 _ 
Cyy=Ccov(X,F)= Six -xiym-ÿi=- x (y -ÿ) (7.120) 
d AT AT 
1 l 
et par symétrie: 
= X F)= l— _ ls  . 
Cyy = COV( 3 = 24-27) 7), 2% (% 2) (7.121) 


ï i 


Donc au final, dans le cas équiprobable, nous avons finalement les trois relations équivalentes 
importantes utilisées dans différents chapitres du présent site: 


Cry =cov(Æ#,r) es ZX» -ÿ] 
n 7 
crr=cov(XN=lS x x.y (7.122) 
] RAT 


crr=cov(E = x (n-p)=1S y (x 7) 
? # # 


ï ï 


Dans le chapitre de Méthodes Numériques pour notre étude de la régression linéaire et de l'analyse 
factorielle nous aurons besoin de l'expression explicite de la propriété de bilinéarité de la variance. Pour 
voir en quoi cela consiste exactement, considérons trois variables aléatoires X, Y et Z et a et b deux 
constantes. Alors en utilisant la troisième relation donnée précédemment, nous avons: 


cov(},aX +7 \= ls (» —ÿ\(ax, +bz,) 
ñ# 


; 
1 

= — ) [ip —ÿ)iax +(% -ÿibz, | . De” — ÿ\ax; +» — ÿ)bz, (7.123) 

ï ï ï 


=e 7 (x - Fix +825 (x — ÿiz;, =acov(X,F)+bcov(r,Z) 
HS Cie 


Cette dernière relation est elle aussi importante et sera utilisée dans plusieurs chapitres du site 


(Économie, Méthodes Numériques). Elle nous permet aussi d'obtenir directement des covariances entre 
des sommes de variables. 


Page: 328/4839 


[v3.0 - 2013] 


Exemple: 


Si X, Ÿ, Z,T sont quatre variables aléatoires définies sur la même population, nous voulons calculer la 
covariance suivante: 


cov(34+57,4Z7 —-2T) (7.124) 


Nous allons donc développer en deux fois (raison pour laquelle nous appelons cela la "bilinéarité"). 
D'abord par rapport au second argument (arbitrairement!): 


covi3ÆX +5F 47 —-2Ti=dcovi3X +5F Zi-2covi3Æ#+5F T1 (7.125) 


et ensuite par rapport au premier: 


cow(3X +57 47 -2T) = 4[3cov(X,Z)+5Scovi7,Z 1]J-2[3cov(X,Ti+ScoviF,T)] (7.126) 


Donc au final: 
covi3Æ +5F 47 -2Ti=12covit À Z i+20coviF, Zi-6covi Æ Ti—-10coviF, Ti (7.127) 


Maintenance, considérons # un vecteur de composantes (x,,x,,...,2,) et Ÿ un autre vecteur de 
composantes (y,,32,...,%,), tous deux étant des variables aléatoires, le calcul de la covariance des 


composantes deux à deux donne ce que l'on appelle la "matrice des covariances" (outil très utilisé en 
finance, dans la gestion en général et les méthodes numériques statistiques!). 


Effectivement, si nous notons: 
LE AS À = E| | Xm — Hr, IlXn AT ||= Cmn (7.128) 


Nous pouvons dès lors écrire une matrice symétrique (le plus souvent dans la pratique elle est carrée) 
sous la forme: 


Emn=| | (7.129) 


Cette matrice a comme propriété remarquable que si nous prenons deux vecteurs identiques (dont les 
composantes sont les mêmes variables aléatoires) et que nous calculons la matrice, alors la diagonale de 
cette dernière donnera les variances des composantes de vecteurs (voir les exemples dans le chapitre 
d'économétrie)! Raison pour laquelle cette matrice est souvent appelée "matrices des variances- 
covariances" et se retrouve donc parfois notée également sous la forme suivante: 
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D + … a 
VX) . -.  cov( XX, ) à Frs 
| F1 3) : ° ok. | 
Cmn — : VX | = : a, (7.130) 
COV I Æ mA | nee 7e FX) - 
CR CE, 


Cette matrice a pour avantage de montrer rapidement quelles sont les couples de variables qui ont une 
covariance négative et donc. dont la variance de la somme est plus petite que la somme des variances. 


Remarque: Cette matrice est très importante et nous la retrouverons fréquemment dans le chapitre 
d'Économie lors de notre étude da la théorie du portefeuille et dans les techniques de fouille de 
données (data mining, clustering) dans le chapitre de Méthodes numériques (l'analyse par 
composantes principales). 


Rappelons maintenant que nous avions un axiome en probabilités (cf. chapitre de Probabilités) qui 
énonçait que deux événements A,B sont indépendants si: 


P(ANB) = P(A)' PB) (7.131) 
De la même façon, par extension, nous définissons l'indépendance des variables aléatoires discrètes. 
Définition: Soit X,Y deux variables aléatoires discrètes. Nous disons que X, Y sont indépendantes si: 
Vx,yE R,P(X = x} = y) = P(X = x) P(F =}) (7.132) 


Plus généralement, les variables discrètes 4,..,4, sont indépendantes (en bloc) si: 
te] 

Va. ER P(X=2n,.,X4,52,)=[ [P(X: =x). 135) 
=] 


L'indépendance de deux variables aléatoires implique que leur covariance est nulle (la réciproque est 
fausse!). Prouvons ceci dans le cas où les variables aléatoires ne prennent qu'un nombre fini de valeurs 


{x}, et { Yi}, respectivement, avec I, J des ensembles finis: 


E(X Y)= D P(X=x,Y=»,)xy, =D P(X=x) P(F = y, )xy, 


ë,3 2,3 


= DA = ss] Di vi)» =E(X)'E(F) 


(7.134) 


et donc: 


cyr = E(X'Y)-E(X)E(FY)=0 (7135) 
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Remarque: Donc plus la covariance est faible, plus les séries sont indépendantes. A l'inverse, plus la 
covariance est élevée, plus les séries sont liées. 


Etant donné que: 
V(X+F)=V(X)+V(F)+2c7, (7.136) 
si X, Y sont indépendantes alors €yy = 0: 
V(X+F)=V(X)+ (Fr) (7.137) 


De manière plus générale si 4,,.,%4, sont indépendantes (en bloc) alors pour toute loi statistique (!) 


nous avons: 


F >: D (x) (7.138) 


3.1.3. ESPÉRANCE ET VARIANCE DE LA MOYENNE (ERREUR STANDARD ET FCP) 


Souvent en statistique, il est utile de déterminer l'écart-type de la moyenne empirique (ou en d'autres 
termes...: l'erreur quadratique moyenne). Voyons de quoi il s'agit: 


Soit la moyenne d'une série de termes déterminés chacun par la mesure de plusieurs valeurs (il s'agit au 
fait de son estimateur dans un cas particulier comme nous le verrons beaucoup plus loin): 


X = Lx FA TAHZÆ) (C1) 
alors en utilisant les propriétés de l'espérance: 
E(X) = 2 (EG) +E(X,)+.+Æ(X,)) (7.140) 
et si toutes les variables aléatoires sont identiquement distribuées et indépendantes nous avons alors: 


E(X) = LT 4 (7.141) 
# 


Remarque: Nous démontrerons bien plus loin que si toutes les variables aléatoires sont 
identiquement distribuées et indépendantes et de variance finie, alors l'espérance suite une 
asymptotiquement une loi Normale. 


Pour la variance, le même raisonnement s'applique: 


— 1 
V4) = cd = a Fa) +W(X,)) 


1 
= r (a+ gË+..+a) (7.142) 
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et si les variables aléatoires sont toutes identiquement distribuées et indépendantes (nous étudierons 
plus loin le cas très important et courant dans la pratique où cette dernière condition n'est pas 
satisfaite): 


(A) = CE - (7.143) 


ñ# 


d'où l'écart-type de la moyenne appelé aussi "erreur-type", "erreur-standard" ou encore "variation non 
systématique": 


(7.144) 


et il s'agit rigoureusement de l'écart-type de l'estimateur de la moyenne (c'est peut-être plus clair ainsi)! 


Cette relation se trouve dans de nombreux logiciels dont les graphiques Microsoft Excel (mais il n'y a 
pas de fonction intégrée), écrite soit avec l'écart-type (comme ci-dessus), soit avec la notation de la 
variance (suffit de mettre au carré.….). 


Signalons que la dernière relation peut être utilisée même si la moyenne des n variables aléatoires n'est 
pas identique! La condition suffisante étant juste que les écarts-types soient tous égaux et c'est le cas de 
l'industrie (production). 


Nous avons donc: 


= (S)=n0" V(M,)= 0" (M,)- 


| (7145) 
rl 


où #, désigne la somme des n variables aléatoires et Af, leur moyenne. 
La variable centrée réduite que nous avions introduite plus haut: 


F = LL (7.146) 
T 


peut alors s'écrire de plusieurs manières: 


_ Sun MH 


= ——— = ———| (7.147 


Par ailleurs, en supposant que le lecteur sache déjà ce qu'est une loi Normale V4, ), nous 


démontrerons plus loin en détails car c'est extrêmement important (!) que la loi de probabilité de la 
variable aléatoire Z , moyenne de n variables aléatoires identiquement distribuées et linéairement 
indépendantes, est alors la loi: 
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3.1.4, COEFFICIENT DE CORRÉLATION 


Maintenant, considérons X et Y deux variables aléatoires ayant pour covariance: 
cyy = EX - 427 -4)] (149 
Nous avons: 
(ur) SCO FE) C150) 


nous allons démontrer cette relation immédiatement car l'utilisation de la covariance seule pour 
l'analyse des données n'est pas géniale car elle n'est pas à proprement parler bornée et simple d'usage 
(au niveau de l'interprétation). Nous allons donc construire un indicateur plus facile d'usage en 
entreprise. 


Démonstration: 
Choisissons une constante a quelconque et calculons la variance de: 
aX+Y (7.151) 
Nous pouvons alors immédiatement écrire à l'aide des propriétés de la variance et de l'espérance: 
V(aX+Y)= a V(X)+ 2acyy +V(F) (7.152) 


La quantité de droite est positive et nulle en tout a par construction de la variance (de gauche). Donc le 
discriminant de l'expression, vue comme un trinôme en a du type: 


2 2 
P(5) = a +br+c= (2) ee 
24 4a 


= 


2 (4) 4Y(XY? 


P(a) = V(X)a° + 2e y ya +W(F)= (4) + 
Donc pour que P(a) soit positif pour tout a nous avons comme seule possibilité que: 
(2cyr) (PS0 159 
Soit après simplification: 
(cry) SPC) 155 
OC.Q.FD. 


Ce qui nous donne: 
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2 
c Exr| 
Cr) AT 1 (7156) 


PAPE) PAPE). 


Finalement nous obtenons une forme de l'inégalité statistique dite "inégalité de Cauchy-Schwarz": 


€ 
-1< Les <1 7 157 


ÉTTONRES 


Si les variances de X et Y sont non nulles, la corrélation entre X et Y est définie par le "coefficient de 
corrélation linéaire" (il s'agit donc de la covariance standardisée afin que son amplitude ne soit pas 
dépendante de l'unité de mesure choisie): 


SEE 7 1CQ 


Far 


ce qui peut aussi s'écrire sous forme développée (en utilisant la relation de Huyghens): 


Ryy = 


Re, = UM = EUDECD _ BUM-BDEM 
; PCA (F) (ex?) - E(X))(#@?)- Er) ) (7.159) 


ou encore plus condensée: 


Cxy 


| A)atr) 


Ryy (7.160) 


Signalons que normalement, la lettre R est réservée pour dire qu'il s'agit d'un estimateur du coefficient 
de corrélation alors que la définition ci-dessus n'est pas un estimateur et qu'en toute rigueur, nous 
devrions alors noter ©x7 7 selon les traditions d'usage. 


Quels que soient l'unité et les ordres de grandeur, le coefficient de corrélation est un nombre sans unités 
(donc sa valeur ne dépend pas de l'unité de mesure choisie, ce qui n'est de loin pas le cas de tous les 
indicateurs statistiques!), compris entre -1 et 1. Il traduit la plus ou moins grande dépendance linéaire 
de X et Y et ou, géométriquement, le plus ou moins grand aplatissement. Nous pouvons donc dire qu'un 
coefficient de corrélation nul ou proche de 0 signifie qu'il n'y a pas de relation linéaire entre les 
caractères. Mais il n'entraîne aucune notion d'indépendance plus générale. 


Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits fortement corrélés. Il 
faut prendre garde à la confusion fréquente entre corrélation et causalité. Cependant, que deux 
phénomènes soient corrélés n'implique en aucune façon que l'un soit cause de l'autre. 


Ainsi: 


- Si À; = -1 nous avons affaire à une corrélation négative dite "corrélation négative parfaite" (dans la 


cas d'une relation linéaire tous les points de mesures sont situés sur une droite de pente négative). 


-Si-1<R;,7 < 1 nous avons affaire à une corrélation négative ou positive dite "corrélation imparfaite" 


(dans la cas d'une relation linéaire tous les points de mesures sont situés sur une droite de pente 


Page: 334/4839 


[v3.0 - 2013] 


négative ou respectivement positive). 


- Si Ryy = 0 la corrélation est nulle... (dans la cas d'une relation linéaire tous les points de mesures sont 


situés sur une droite de pente nulle). 


- Si Ryy = 1 nous avons affaire à une corrélation positive dite "corrélation positive parfaite" (dans la 


cas d'une relation linéaire tous les points de mesures sont situés sur une droite de pente positive). 


L'analyse du coefficient de corrélation poursuit donc l'objectif de déterminer le degré d'association 
entre les différentes variables: celui-ci est souvent exprimé par le coefficient de détermination, qui est 
le carré du coefficient de corrélation. Le coefficient de détermination mesure donc la contribution d'une 
des variables à l'explication de la seconde. 


En utilisant les expressions de la moyenne et de l'écart-type de variables équiprobables telles que 
démontrées plus haut, nous passons de: 


E(XY)-E(X)E(®) 
(eG)-EGy (Er )-Ex)) 


» 


(7.161) 


à l'estimateur du coefficient de corrélation: 


12 SP 
ne, 2%, 2 


7.162) 


où nous voyons que la covariance devient alors la moyenne des produits moins le produit des 
moyennes. 


Soit après simplification: 


21| (7.163) 


ñn 
2% 


&=1 


1 
1 
À 


| | 2 PT 


Le coefficient de corrélation peut être calculé dans version française de Microsoft Excel 11.8346 avec 
entre autres la fonction intégrée COEFFICIENT. CORRELATION( ). 
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Remarques: 


R1. Dans la littérature le coefficient de corrélation est souvent appelé "coefficient d'échantillonnage 
de Pearson" (dans le cas équiprobable) ou "test de Bravais-Pearson" (dans le cas non équiprobable) 
et lorsque nous le portons au carré, nous parlons alors de "coefficient de détermination". 


R2. Souvent le carré de ce coefficient est un peu abusivement interprété comme le % de variation 
expliqué de la variable étudiée Y par la variable explicative X. 


Enfin, à noter que nous avons donc la relation suivante qui est énormément utilisée dans la pratique 
(voir le chapitre d'Economie pour des exemples fameux!): 


VA +7)= FOX) + PCF) +2Ry pd CAT) (7.164) 


ou sa version avec l'écart-type: 


Tyyy = 0% +07 + 2RrrO7Oy (7.165) 


Il s'agit d'une relation que l'on retrouve souvent en finance dans le cadre du calcul de la VaR selon la 
méthodologie RiskMetrics proposée par J.P. Morgan (cf. chapitre d'Économie). 


Exemple: 


Une compagnie aérienne a à sa disposition 120 sièges qu'elle réserve pour des passagers en 
correspondance venant de deux autres vols arrivés un peu plus tôt dans la journée et en partance pour 
Francfort. Le premier vol arrive de Manille et le nombre de passagers à son bord suit une loi Normale 
de moyenne 50 et de variance 169. Le second vol arrive de Taipei et le nombre de passagers à son bord 
suit une loi Normale de moyenne 45 et de variance 196. 


Le coefficient de corrélation linéaire entre le nombre de passagers des deux vols est mesuré comme 
étant: 


Ryy =0.5 (7.166) 


La loi que suit le nombre de passagers pour Francfort si nous supposons que la loi du couple suit elle 
aussi une loi Normale (selon énoncé!) est: 


X+Y = N(uiy + Hp, VX +F)) (7167) 
avec: 
Lx +{w =50+45=95 (7.168) 


et: 
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VX +F7)= FOX) +V(F)+2Ry y PCA WT) (7.169) 


ce qui donne: 


W(X +7)=169+196+2.0.5./169.196 =169+196+182=547 (7.170) 


3.2. VARIABLES CONTINUES 


Définitions: 


D1. Nous disons que X est une variable continue si sa "fonction de répartition" est continue (déjà 
définie plus haut). La fonction de répartition de X étant définie par: 


F(d=P(X<x) VxrxeR (7171) 


soit la probabilité cumulée que la variable aléatoire X soit plus petite ou égale à la valeur x fixée. Nous 
avons aussi bien évidemment: 


12P(X)20 (7172) 
D3. Nous appelons: 
G{x)=1-F(x)= P(X >x) (7173) 


la "fonction de survie" (survival function) ou "fonction de queue" (tail distribution function). 


D2. Si de plus la fonction de répartition F de X est continûment dérivable de dérivée © appelée 
"fonction de densité" ou "fonction de masse" ou encore "fonction de distribution" alors nous disons que 
X est absolument continue et dans ce cas nous avons: 


2 
P(x £SX £x)= [ O(x)dx = Fix )-Æ#(x}) (7.174) 
X 
avec la condition de normalisation: 
+0 
P(X < +00) = [ £x)dx=1 (7175) 
—<0 


Toute fonction de distribution de probabilité doit satisfaire l'intégrale de normalisation dans son 
domaine de définition! 


Remarque: Il est intéressant de remarquer que la définition amène à ce que la probabilité qu'une 
variable aléatoire totalement continue prenne une valeur donnée est nulle! Donc ce n'est pas parce 
qu'un événement a une probabilité nulle qu'il ne peut arriver!!! 


La moyenne ayant été définie par la somme pour une variable discrète, elle devient une intégrale pour 
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une variable continue: 


+0 
E(X) = [ xO(x)dx| (7.176) 


et la variance s'écrit donc: 


Ko 
VCX)= [[x- ET ecoar) Gi 


—o 


Nous avons alors aussi la médiane qui est logiquement redéfinie dans le cas d'une variable aléatoire 
continue par: 


Me Me l 
M, = | dF(x)= dx = —| (7.178) 
[ar = ['ecpar= > 


—( —© 


et elle coïncide rarement avec la moyenne! 


Souvent les statisticiens utilisent les mêmes notations pour l'espérance mathématique d'une variable 
continue: 


E(A), M(A),4,,4 (7.179) 
et pour la variance: 
V(X),0,,0? (7.180) 
que pour une variable discrète. 


Par la suite, nous calculerons ces différents termes avec développements uniquement dans les cas les 
plus usités. 


3.3. POSTULAT FONDAMENTAL DE LA STATISTIQUE 


Le but ultime de la statistique est de remonter de l'échantillon à la fonction de répartition analytique qui 
lui aurait donné naissance. Ce but sera présenté dans le cadre de ce site internet comme un postulat 
(bien que cela postulat soit très difficile à appliquer dans la pratique). 


Postulat: À toute fonction de répartition empirique F (x) nous pouvons associer une fonction de 


répartition théorique F(x) vers laquelle elle converge quand la taille de l'échantillon est suffisamment 
grande. 


Si: 


X, =suplé (D -F(x) (7181 


est la variable aléatoire définie comme la plus grande différence (en valeur absolue) entre Ë, (x) et 
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F(x) (observée pour toutes les valeurs de x pour un échantillon donné), alors X, converge vers 0 


presque sûrement. 


Remarque: Les mathématiciens de la statistique arrivent à démontrer ce postulat sous forme d'un 
théorème appelé le "théorème fondamental de la statistique" ou "théorème de Glivenko-Cantelli" en 
ce qui concerne les fonctions continues. Personnellement, quitte à choquer les connaisseurs, je 
considère que cette démonstration n'en est pas une car elle est très éloignée ce que montre 
l'expérience (oui c'est mon côté physicien qui ressort...) et ce résultat théorique amène un grand 
nombre de praticiens à faire souvent tout leur possible (exclusion de données, transformations et 
autres abominations) pour trouver une loi connue à laquelle ils peuvent ajuster leurs données 
mesurées. 


4. INDICE DE DIVERSITÉ 


Il arrive dans le domaine de la biologie ou de l'entreprise que l'on demande à un statisticien ou analyste 
de mesurer la diversité d'un certain nombre d'éléments prédéfinis. Par exemple, imaginons une 
multinationale ayant une gamme de produits bien définie et dont certains magasins (clients) dans le 
monde peuvent choisir un sous-ensemble de cette gamme pour leur commerce. La question étant alors 
de faire un ranking des magasins qui vendent la plus grande diversité de produits de la marque et ce en 
prenant en compte aussi les quantités. 


Par exemple, nous avons une liste de 4 produits au total dans notre catalogue. Le hasard faisant, trois 
de nos clients vendent nos 4 produits mais nous souhaiterions savoir lequel en vend la plus grande 
diversité et ce en prenant en compte les quantités. 


Nous avons les données de ventes par produit suivantes pour le client 1: 


| Clenti 
Produit 1 |5 
Produit 2 |5 
Produit 3 |5 
Produit 4 |5 


pour le client 2: 


Produit 1 | 1 


Produit 2 | 1 
Produit 3 | 1 
Produit 4 |17 


et pour le client 3: 
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Produit 1 | 2 
Produit 2 | 2 
Produit 3 | 2 


Produit 4 |34 


Une mesure de l'information (diversité des états) qui peut être bien adaptée à cette mesure est la 
formule de Shannon introduite dans le chapitre de Mécanique Statistique dont l'espérance est: 


S(X) = E{h(x)} = Ÿp, log(p,) (7.182) 
il 


Arbitrairement, nous prendrons 4 = 1 et la base 10 pour le logarithme (ainsi, si nous avons 10 variables 


équiprobables, l'entropie sera unitaire par exemple..). 


Dès lors il vient: 


ñ 
S=-> p;log(p;) (7.183) 


=] 


Nous allons récrire cela de manière plus adéquate pour l'application en entreprise. Ainsi, si n est le 
nombre de produits et », est la proportion (ou "fréquence relative") de ventes du produit i parmi la 


totalité des ventes N nous avons alors: 


é 


= | 


P; 


Il vient alors: 


n 


_ il 


NW 
Mog(N)-2 flo () 
N 


Nous avons alors pour le client 1: 


À (7.184) 


DA [8 (4) +108 (N)] ee(MX 4-2 fles(f) 


(7.185) 
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Mog(N)- 2 À loa(f) 


S = + 
_ 2010g(20) — (Slog(5) + Slog(5) + Slog(S) + Slog(5)) (7.186) 
i 20 

RICE: 0) PR log(20) — log(5) = log(4) = 0.602 


20 


qui est la valeur maximale possible (chaque état est équiprobable). Et pour le client 2 nous avons: 


Nlog(N)-2,.flog(f) 

=! 

N (7.187) 
: 2010og(20) — (Hog() + Tlog(l +1log(l) + 171og{17)) 
| 20 


5 = 
= 0.255 


et pour le client 3: 


Nog(N)-> flog(f) 


. = 
La N (7.188) 


: 401og(40) — (21og(2} + 21og(2) + 21og(2) + 3410g(34)) = 0.255 
| 


Ainsi, le client ayant la plus grande diversité est le premier. Nous voyons aussi une propriété 
intéressante de la formule de Shannon à l'aide des clients 2 et 3 c'est que la quantité n'influe pas sur la 
diversité (puisque la seule différence entre les deux clients est la quantité qui est multipliée d'un facteur 
2 et non la diversité)! 


5. FONCTIONS DE DISTRIBUTIONS 


Lorsque nous observons des phénomènes probabilistes, et que nous prenons note des valeurs prises par 
ces derniers et que nous les reportons graphiquement, nous observons toujours que les différentes 
mesures obtenues suivent une caractéristique courbe ou droite typique fréquemment reproductible. 


Dans le domaine des probabilités et statistiques, nous appelons ces caractéristiques des "fonctions de 
distribution" car elles indiquent la fréquence avec laquelle la variable aléatoire apparaît avec certaines 
valeurs. 


Remarque: Nous utilisons aussi simplement le terme "fonction" ou encore “loi” pour désigner ces 
caractéristiques. 


Ces fonctions sont en pratique bornées par ce que nous appelons "l'étendue de la distribution", ou 
"dispersion de la distribution", qui correspond à la différence entre la donnée maximale (à droite) et la 
donnée minimale (à gauche) des valeurs observées: 


E=Max- Min (7.189) 
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notée souvent aussi R dans l'ingénierie de la qualité (cf. le Géni ustriel). 


Si les valeurs observées se distribuent d'une certaine manière c'est qu'elles ont alors une probabilité 
d'avoir une certaine valeur de la fonction de distribution. 


Dans la pratique industrielle (cf. chap ), la dispersion des valeurs statistiques est 
importante parce qu'elle donne une indication sur la variation d'un processus (variabilité). 


Définitions: 


D1. La relation mathématique qui donne la probabilité qu'a une variable aléatoire d'avoir une valeur 
donnée de la fonction de distribution est appelée "fonction de densité", "fonction de masse" ou encore 
"fonction marginale”. 


D2. La relation mathématique qui donne la probabilité cumulée qu'a une variable aléatoire d'être 
inférieure ou égale à une certaine valeur est nommée la "fonction de répartition" ou "fonction 
cumulée". 


D3. Des variables aléatoires sont dites "indépendantes et identiquement distribuées" (i.i.d.) si elles 


suivent toutes la même fonction de distribution et qu'elles sont indépendantes... 


Remarque: Le lecteur pourra trouver la fonction de distribution de Weibull (ou "loi de Weibull") 
dans le chapitre traitant du Génie Industriel (section sur l'Ingénierie), et la fonction logistique dans 
le chapitre de Méthodes Numériques. 


De telles fonctions étant très nombreuses dans la nature, nous proposons au lecteur une étude détaillée 
des plus connues seulement. 


5.1. FONCTION DISCRÈTE UNIFORME 


Si nous admettons qu'il est possible d'associer une probabilité à un événement, nous pouvons concevoir 
des situations où nous pouvons supposer a priori que tous les événements élémentaires sont 
équiprobables (c'est-à-dire qu'ils ont même probabilité). Nous utilisons alors le rapport entre le nombre 
de cas favorables et le nombre de cas possibles pour calculer la probabilité de tous les événements de 
l'Univers des événements U. Plus généralement si U est un ensemble fini d'événements équiprobables et 
A une partie de U nous avons sous forme ensembliste: 


P(A) = Card(A)/ Cara(U) 
Plus communément, soit e un événement pouvant avoir N issues équiprobables possibles. Alors la 
probabilité d'observer l'issue donnée de l'événement suit une "fonction discrète uniforme" (ou "loi 
discrète uniforme") donnée par la relation: 


P=1N 


Ayant pour espérance (ou moyenne): 


H= E(X)= mx 2x 
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Si nous nous mettons dans le cas particulier où x, =i avec j = 1... Nous avons alors (cf. chapitre de 


Suites et Séries): 


pi 
E(A) = 6 = 2 NOW+T) | = (7.193) 


Et pour variance: 


1 À 


ro= Lu) = 156 - RE bise) 


1 W mi =l il 
N 
5 Est |: 2 LE Eds 
_ s(areGen) 2 ag (M 
ui 


6 N25£% 2 
(N+DON+D N#iM (N+1) 
= — Ti 
6 N & 4 
(N+D@CN+D M+l{ AQU), (+) (7.194) 
: 6 N 2 4 
L(W+DON+D_(N+D, (+1) _(W+n@m+n (N+1) 
6 2 4 6 4 
_2AN+D@N+D 3(N+1)  2AN+DON+D-3(N+1) 
12 12 12 
_ 2ONŸ+N+2N+1)-3N7-6N-3 AN? +6N+2-3N7-6N 3 
12 12 
MN? -1 


Voici un exemple de tracé de la fonction de distribution et respectivement de répartition pour la loi 
discrète uniforme de paramètres {1,5,8,11,12} (nous voyons que chaque valeur est bien équiprobable): 
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Figure: 7.8 - Loi discrète uniforme (fonction de distribution et de répartition) 


5.2. FONCTION DE BERNOULLI 


Si nous avons affaire à une observation binaire alors la probabilité d'un événement reste constante d'une 
observation à l'autre s'il n'y a pas d'effet mémoire (autrement dit: une somme de variables de Bernoulli, 
deux à deux indépendantes). 


Nous appelons ce genre d'observations où la variable aléatoire a valeurs 0 (faux) ou 1 (vrai), avec 


probabilité (1-p), p respectivement, des "essais de Bernoulli" avec "événements contraires à 
probabilités contraires". 


Ainsi, une variable aléatoire X suit une "fonction de Bernoulli" (ou "loi de Bernoulli") si elle ne peut 
prendre que les valeurs 0 ou 1, associées aux probabilités q et p de sorte que 43 +p= let: 


PA =0)=g P(Æ=l=p=(Î-g) (7.195) 


L'exemple classique d'un tel processus est le jeu de pile de face ou de tirage avec remise. Il est inutile 
de vérifier formellement que la probabilité cumulée est unitaire. 


Remarquons que par extension, si nous considérons N événements où nous obtenons dans un ordre 
particulier k fois une des issues possible (réussite) et N-k l'autre (échec), alors la probabilité d'obtenir 
une telle série (de k réussites et N-k échecs ordonnés dans un ordre particulier) sera donnée par: 


P=p* (-p}=p"1g"" (7196) 
conformément à ce que nous avions obtenu en combinatoire dans le chapitre de Probabilités! 


Voici un exemple de tracé de la fonction de répartition pour g = 0.3: 
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0.8 


06 


0.2 


0 02 04 06 08 1 12 14 18 18 
Figure: 7.9 - Loi de Bernoulli (fonction de distribution et de répartition) 
La fonction de Bernoulli a donc pour espérance (moyenne): 
u=EX)=S mx =1lpt0 (-p2)=p (7.197 


et pour variance (nous utilisons la relation de Huyghens démontrée plus haut): 


V(X)= à = E[X- ECM] =E(X?)- EX) = E(X?)-p=p-p=pf-p=pq (1) 


Remarque: L'exemple ci-dessus n'est certes par pertinent mais nous verrons dans le chapitre de 
Techniques De Gestion que la fonction de Bernoulli apparaît naturellement au début de notre étude 
des files d'attentes. 


5.3. FONCTION GÉOMÉTRIQUE 


La loi géométrique ou "loi de Pascal" consiste dans une épreuve de type Bernoulli, dont la probabilité 
de succès est p et celle d'échec 4 =1- » sont constantes, que nous renouvelons de manière 
indépendante jusqu'au premier succès. 


Si nous appelons X la variable aléatoire donnant le rang du premier succès la probabilité que X = # est 
alors (cas particulier de la fonction de Bernoulli): 


PX) = gŸ1lp| (7.199) 


avec ke N’'- 


Cette loi a pour espérance: 
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u= E(X)= Xpix =" p=DKQ-p) "p=pLk-p}" (7200 
& & & 


Or, cette dernière relation s'écrit aussi (car c'est une simple série géométrique): 


1 
(1-4) 


Effectivement, nous avons démontré dans le chapitre sur les Suites et Séries que: 


(7.201) 


D 1 À 
2,44 


car Ü=<g<l. 
Ensuite, il suffit de dériver les deux membres de l'égalité par rapport à q et nous obtenons: 
l 
E 
1-g) 


(7.204) 


D 1 A 
2 


Re | 


Nous avons donc le nombre moyen d'essais X qu'il faut faire pour arriver au premier succès: 


L'-) 


E(X)= De P(X=k)= 5 kpg"t = 2 = 


Calculons maintenant la variance en rappelant comme à chaque fois que (relation de Huyghens): 
V(X)=E(X*)-E(X) (206) 


Commençons donc par calculer Æ (x é : 


E(X =D P(X=k)=pD ka" = pDk(k-141)g = pDk (k-1)g + pq 
k=0 0 k 0 1 0 
(7.207) 


Le dernier terme de cette expression est l'équivalent de l'espérance calculée précédemment. Soit: 


RS 
p> kg" =— (7208) 
K=0 P 


Il reste à calculer: 
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p>k-(&-1)g" (7.209) 
fl 
Nous avons: 
PDk(k-1g" = pa> k.(k&-1) g"? (7.210) 
1 k=2 


Or en dérivant l'égalité: 


Nous obtenons: 


Par conséquent: 


PIE E-Da = pad ke (ta? = 22 2 
ps ka (1-gÿ ? 


Donc: 


Pour finir: 


V(X)=E(X*?)-E(X) = CAE RE 


® Exemple: 


El. Vous essayez, tard dans la nuit et dans l'obscurité, d'ouvrir une serrure au moyen d'un trousseau de 
5 clés, sans porter attention, car vous êtes un peu fatigué (ou un peu éméché...) vous essayez chaque 
clé. Sachant qu'une seule convient, quelle est la probabilité d'utiliser la bonne clé au k-ème essai? 


A. 
ra (À) (3) (7.216) 


E2. Tracé de la fonction de distribution et répartition pour la fonction Géométrique de paramètre 
p=03: 
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(el 


Figure: 7.10 - Loi géométrique (fonction de distribution et de répartition) 
Déterminons maintenant la fonction de répartition de la loi Géométrique. Nous partons donc de: 
&-l 7 
P(X) = pp (2%) 


nous avons alors par définition la probabilité cumulée que l'expérience réussisse dans les n premiers 
essais: 


+0 . +0 . 
P(XS<n)=1- 5 pg/t=1-p 3 gŸ1 (7219) 
J=rH J=2#H 


avec n entier valant 0...1..2, etc. 
Posons: 
j-1=n+k—=k&=n-—;j+1 (7219) 
Nous avons alors: 
+o +o ko 
P(X < x) = 1-p> gt L 1-p 5 gg" _ 1- pq" q* =1- pq" — 
k=0 &k=0 k=0 


ñ 1 x 
=1-(-gg —=1-g 
l-g 


5.4. FONCTION BINOMIALE 


Si nous revenons maintenant à notre épreuve de Bernoulli. Plus généralement, tout N-uplet particulier 
formé de k succès et de N-k échecs aura pour probabilité (dans le cadre d'un tirage avec remise ou sans 
remise si la population est grande en première approximation.): 


P(N,k) = p*:q""# (7.221) 
d'être tiré (ou d'apparaître) quel que soit l'ordre d'apparition des échecs et réussites. 


Mais, nous savons que la combinatoire permet de déterminer le nombre de N-uplets de ce type (le 
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nombre de manières d'ordonner les apparitions d'échecs et de réussites). Le nombre d'arrangements 
possibles étant, nous l'avons démontré (cf. chapitre Probabilités), donné par le coefficient binomial 
(notation non conforme sur ce site à la norme ISO 31-11): 


Donc comme la probabilité d'obtenir une série de k succès et N-k échecs particuliers est toujours 
identique (quel que soit l'ordre) alors il suffit de multiplier la probabilité d'une série particulière par la 
combinatoire (ceci étant équivalent à faire une somme): 


W 
PAK, k) = CE Pa —————— "pt + as 
{ ) k £t (N- k)l 2 ‘4 ( 3) 
pour avoir la probabilité totale d'obtenir une quelconque de ces séries possibles (puisque chacune est 
possible). 


Remarque: Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) simple avec 
contrainte sur l'ordre ou à l'étude d'une série de succès ou d'échecs. Nous utiliserons cette relation 
dans le cadre de la théorie des files d'attentes ou en fiabilité. Il faut noter que dans le cas de grandes 
populations, même si le tirage n'est pas avec remise il peut être considéré comme tel... 


Écrite autrement ceci donne la "fonction Binomiale" (ou "loi Binomiale") connue aussi sous la forme de 
la fonction de distribution suivante: 


PV. b)= Chpt p} V4 = CNpÉgNE) (7.224) 


et parfois notée: 
ZX — S(n,p) (7.225) 


avec un petit n ou grand N (cela importe peu...) et peut être calculée dans la version française de 
Microsoft Excel 11.8346 à l'aide de la fonction LOI.BINOMIALE ). 


Nous disons parfois que la loi Binomiale est non exhaustive car la taille de la population initiale n'est 
pas apparente dans l'expression de la loi. 


Exemple: 


Nous souhaitons tester l'alternateur d'un groupe électrogène. La probabilité de défaillance à la 
sollicitation de ce matériel est estimée à 1 défaillance pour 1'000 démarrages. 


Nous décidons d'effectuer un test de 100 démarrages. La probabilité d'observer 1 panne au cours de ce 
test est de: 
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P(N = 100, =1)= Ch pig NE = TRES) 


l 99 
| 
___ 100! | 1 ] (- 1 | — 
1100-11 (1000 1000 


Nous avons bien évidemment pour la fonction de répartition (très utile dans la pratique comme le 
contrôle de lots de fournisseurs ou la fiabilité! ): 


n'a à 
phqN-# 


(7.226) 


Effectivement, nous avons démontré dans le chapitre de Calcul Algébrique le "théorème binomial": 
; ñn 
(x+y) =Y7 ES te 
k=0 


Donc: 


pi 
D CPP QA-p} 4 =(p+0-p)) = =1 (7229 


&=0 


Il vaut mieux utiliser Microsoft Excel 11.8346 (ou tout autre logiciel largement répandu) pour ne pas 
s'embêter à calculer ce genre de relations en utilisant la fonction CRITERE.LOI.BINOMIALE( ) dans 
la version française. 


L'espérance mathématique (moyenne) de P(N,k) est: 


ñn Le] n 
ED =D P(X=bk= DCE p (pk = Cp (-p}N TE (7.230) 
40 k=0 k=l 


Or: 


cù = ci A AC = NCÈT (7.231 


d'où: 
. l_k N—k e NI] _ k-l 1) 
EC) = ND CE PQ PT = bp Cr p te (- pYVED 
&=] &=l 


Hi N-D-k N-1 éd 
= A5 CE p'A-pO TEE Ap(p#(-p)) = M 
k= 


donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée de probabilité p après N essais. 


Avant de calculer la variance, introduisons la relation suivante: 
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©. (W=0l pas 


Ds 


SUN=1- ji = (W- 1)? (7.233) 


En effet, en utilisant les développements précédents: 


— (N-1)! 5 NI-5 a (W-1)l 5 N-I-5 

LS ant si? 4 PTSNES EP LÉ 

+ nn) sis _rar ne EV-2)l pi es 

=(N DZ? =(N PTE EEE (7.234) 


(NPD Sp" (ND (84e) =(W-1)? 


f=b = 


Commençons maintenant le (long) calcul de la variance dans lequel nous allons utiliser les résultats 
précédents: 
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———+— 
=hp=x 
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N N-1 
2 (N—T| k _N 2 CN—DT 4 640 
= + NS 7 SENS (en 
F "2 Œ-DIN-DI * it ZE 1-5) 
N2 
2 (N—1)l 5 N-5-1 
= ji + D — 
4 12, ( PTE EPL q 
1 =] 
(WN-Dl , gs CNT); cvs 
= —{{ + E — +  _ 
# B2 PTE DER TT PL PS TS 
(à Cr 


_— ie + HE CM? 5 gts DA 123 CM 5 als 


= {2 +p(N- De + CM p'a SQN AS 22 + M2 (N-1)+ Np(p+(- 2) 


= HP + PT (N 1) + Mb = 4 + NÉ pt — Np° + Np = +4 — Ap° + NP 
= p(l- p)= Npq 


(7.235) 


L'écart-type étant a? =F(k), nous avons: 


= ÎN p(l-p) (7236) 


Voici un exemple de tracé de la fonction de distribution et respectivement de répartition de la loi 
binomiale #{10,0.5) : 
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Figure: 7.11 - Loi binomiale (fonction de distribution et de répartition) 


Indiquons que certaines personnes dans les entreprises ramènent le calcul de l'espérance et de 
l'écart-type à l'unité de N. Nous avons alors: 


N N 
x , l , ( ) (7.237) 
P\ll-pP 
pl |= p(xX)=—pa=—pfi-r)S o- 
He Lines ot-re ce PC 


Exemple: 


Sur un échantillon de 100 travailleurs, 25% sont en retard au moins une fois par semaine. L'espérance 
du nombre de retard est alors: 


E(X) = Np = 1000.25 = 25 


(7.238) 
g(X)= JN(1-p)=4.33 
Rapporté à l'unité, cela nous donne: 
LE = 0.25 
NV 
(7.239) 
1- 
ex] = POP) _ 0433 
NV N 


Pour clore concernant notre étude de loi binomiale, nous allons développer un résultat qui nous sera 
indispensable pour construire le test de données appariées de McNemar d'un tableau (carré) de 
contingence (et comme il est carré il est in extenso dichotomique) que nous étudierons dans le chapitre 
de Méthodes Numériques. 


Nous avons besoin pour ce test de calculer la covariance de deux variables aléatoires binomiales 
appariées (raison pour laquelle la covariance est non nulle): 
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covi#%,#;1= Era; il Eix; VEix; | (7.240) 


Comme elles sont appariées, cela signifie que: 


Pi=1l-p; (7241) 


et donc: 


covi#,2; 1= Elx;n; |— XP; HP; = Ex; l-#2p; (—p;) (7.242) 


Maintenant, vient la difficulté qui est de calculer Æ\ x,# ; !- Pour calculer ce terme il n'existe pas à 


notre connaissance d'autres méthodes que de chercher la loi du couple (parfois on peut contourner 
cela). Dans le cas présent il s'agit d'une loi multinomiale (plus précisément: trinomiale) qu'il est d'usage 
d'écrire sous la forme: 


A! 


# Le; 10 — —A; il 


A-h-n; 


.. À; 
M2,2,,P;1-2-P;1= PS Pÿ (1-P;-P;| : (7.243) 


Mais que nous noterons temorairement pour la suite afin de condenser l'écriture: 


#| ki n-k-i _(”# ki n-k-i 
EE RES La = Fr 7.244 
EfGe-En * El 7 on 


Nous avons donc une loi trinomiale car nous avons cherchons le nombre de fois d'avoir l'événement k, 
l'événement let ni l'un ni l'autre (donc le reste du temps). 


Nous avons alors: 


| 
st= Véro 
ra (&) EE Ellen 7 
| (7.245) 
= 0 +0 +, 0 + > WE — ri AL LS 
k=0,j#0 i=0,k#0 Kk=0j=0 Kk21i21 HUE TE I 
Sit>1et}>1,nous avons: 
&lilim—-k&-7il k(&-DUG-Dlin-k-2il (&-DlG-Dlix-k-7il 
(x 2e 2}! (7.246) 


A _— 
(Œ=DIG-Dlin-k-ril 


Maintenant utilisons cette relation dans l'espérance conjointe: 
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Eikii= 7 ee "cs 
ete ÆU (ak) 


Ge 2)! ki ,n-k-i 
=Aaa-1 © r 7.247 
FD ae E-DIO- DIRE FPnp 


CE M ne 
iskénisien & = DIG-Dlix-k-7il 


Considérons le cas où n vaut 2. Nous avons: 


SU 0-2 pes 
iekoieren & DIE -Dlin-k-ril 
0! _ 
ee ù A Ge 
isxeiere2 &—DIG-DII2-k-F)l 
| 
0 11, 11,211 


DETENTE ET 


et pour n valant 3, le résultat sera aussi 1, et ainsi de suite (nous supposerons afin de simplifier... que 
quelques exemples numériques suffirons au lecteur pour le convaincre de la généralité de cette 
propriété). Nous avons alors: 


s @e 2) k-1_ 1-1 n-k-l 
Etki= nr —l)pg æ ——_————_————— 0 4 Fr = A(x— Dpg 
tekenisien &- DIG-Dlix-k&-7il _… 


=l 


Donc au final: 


2 2 
cov | # 1; = Æ1 HA; on: P; (gl — P;) AR — Dr?; Ts PP; (7.250) 


APP ; 


5.5. FONCTION BINOMIALE NÉGATIVE 


La loi binomiale négative s'applique dans la même situation que la loi binomiale mais elle donne la 
probabilité d'avoir E échecs avant la R-ème réussite quand la probabilité de succès est p (ou 
inversement la probabilité d'avoir R réussites avant le E-ème échec quand la probabilité d'échec est p). 


Introduisons cette fonction par l'exemple. Considérons pour cela les probabilités suivantes: 
P(succès) =0.2=p P(échec)=08=1-p=g (7.251) 


Imaginons que nous ayons fait 10 essais et que nous voulions nous arrêter à la troisième réussite et que 
le 10-ème essai est la troisième réussite! Nous allons noter cela: 


[1 23 4 5 6 7 8 9] 10 (7252) 


Mettons en évidence les réussites (R) et échecs (E): 
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[1 23456 7 8 9] 10 
[EEREEEREE|R 


(7.253) 


Nous avons donc 7 échecs et 3 réussites. Dans le cadre d'une expérience où les tirages sont 
indépendants, la probabilité que nous avions d'obtenir ce résultat particulier est alors: 


(0.8) (0.2) (7254) 


Mais l'ordre des succès et échecs dans la partie entre crochets n'a aucune importance. Donc comme 
nous avons 2 succès parmi 9 dans les crochets il vient que la probabilité d'obtenir le même résultat 
indépendamment de l'ordre est alors en utilisant la combinatoire: 


9 
Ces (0.2) 0.0603 (7.255) 


ce qui correspond donc à la probabilité d'avoir 7 échecs avant la 3ème réussite. Ce qui s'écrit avec 
Microsot Excel 14.0.6123 ou ultérieur en français (7+3=10 essais, 7 échecs dont 3 réussites): 


=LOI.BINOMIALE.NEG.N(7;3;0.2;0)-0.0604 


Généralisons l'écriture antéprécédente notant k le nombre d'échecs, N le nombre total d'essais et p la 
probabilité d'une réussite: 


k _N-k 


P(&,N,p)= | 4 P (7.256) 


E) 


Il y a plusieurs écritures possibles cependant car la relation précédente n'est pas très intuitive à mettre 
en pratique comme l'aura peut-être remarqué le lecteur. Ainsi, si nous notons k comme étant le nombre 
de succès et non le nombre d'échecs, nous avons alors (écriture la plus courante selon moi parmi 
d'autres équivalentes) la probabilité suivante d'avoir un certain nombre de réussites avant d'avoir un 
nombre k d'échecs: 


donc la comparaison avec la formulation de la loi binomiale démontrée plus haut est alors probablement 
évidente! 


Il est cependant plus courant de noter la relation précédente en faisant disparaître N car pour l'instant 
l'écriture n'est toujours pas très claire. Pour cela, nous notons R le nombre de réussites, E le nombre 
d'échecs, p la probabilité d'une réussite et il vient alors la probabilité d'avoir R réussites après E échecs 
(c'est beaucoup plus clair...): 


E+R-1 . E+R-1 
r&.Ep=| … jar 8 | _ er (7.258) 


Nous la trouvons aussi parfois sous la forme suivante en utilisant explicitement la combinatoire: 
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: E+R-1 R E (E+R-D| F g _(E+R-Tl À EF 
REN.p | 8-1 }e PT E-D(E+R-1-(E-D) _ (Œ-DIRI 
(7.259) 
L(E+R-D Re (E+R-1) 2 8 
T'RIGE-D 7 ? -| À Jr É 


La probabilité cumulée que nous ayons au moins R réussites avant le E-ème échec vient 
immédiatement: 


>| }e p° (7.260) 
Æor E-1 


Remarque: Le nom de cette loi provient du fait que certains statisticiens utilisent une définition d'un 
coefficient combinatoire avec valeur négative pour l'expression de la fonction. Comme c'est une 
forme plutôt rare, nous ne souhaitons pas la démontrer. Il faut savoir aussi que cette loi est aussi 
connue sous le nom de "loi de Pascal" (au même titre que la loi géométrique.) en l'honneur de 
Blaise Pascal et de "loi de Pélya", en l'honneur de George P6lya. 


Exemple: 


E1. Un contrôle de qualité long terme nous a permis de calculer l'estimateur p des pièces 
non-conformes comme valant 2% à la sortie d'une ligne de production. Nous souhaiterions savoir la 
probabilité cumulée d'avoir 200 pièces bonnes avant que la 3ème pièce défectueuse apparaisse. Avec 
Microsoft Excel 14.0.6123 ou ultérieur en français il vient en utilisant la loi binomiale négative: 


=LOI.BINOMIALE.NEG.N(200;3;0.02;1)=77.35% 


E2. Pour comparer avec la loi binomiale, demandons-nous quelle est la probabilité cumulée de tirer 198 
pièces non-défectueuses parmi 201 avec Microsoft Excel 14.0.6123 ou ultérieur en français: 


=LOI.BINOMIALE.N(198;201;0.98;1)-76.77% 


nous voyons donc que la différence est faible. Au fait la différence entre les deux lois est dans la 
pratique quasiment toujours tellement faible que nous n'utilisons alors que la loi binomiale (mais il faut 
quand même être prudent!). 


Comme à l'habitude, déterminons maintenant la variance et l'espérance de cette loi. Commençons par 
l'espérance d'avoir R réussites avant le E-ème échec sachant que la probabilité d'avoir un échec est p. 
Pour cela nous allons utiliser une astuce très simple et géniale (tout l'art était d'y penser...). Si nous 
reprenons notre exemple de départ: 
[1 2345678 9] 10 
(7.261) 
[RRERRRERRIE 


et que nous le réécrivons sous la forme suivante: 
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2345678910 


RRERRRERRE 
ä 4; #; 


(7.262) 


Nous remarquons alors que la troisième réussite R de la première écriture peut être décomposée en la 
somme de trois variables aléatoires géométriques telle que: 


R= A t+tAs+.+4, (7263) 


Avec dans le cas du présent exemple particulier # = 3 correspondant au fait à Æ = 3. Donc en toute 
généralité la somme de n variables aléatoires géométriques donne toujours une loi binomiale négative si 
la probabilité p est égale pour chaque variable géométrique! Bref... comme nous avons démontré 
l'expression de l'espérance et la variance de la loi Géométrique comme étant: 


l 1- 
EA)=— V)= 22 664 
P P P 
Puisque les variables aléatoires sont de même paramètres et indépendantes il vient alors pour 
l'espérance de la loi binomiale négative: 


E(R)= E(X +X)+.+X,)=EÆE(X)+E(X)+.+E(X,) 
il y (7.265) 
= nE(X)=n.—=E. — 
2 P 


Et donc pour la variance de la loi binomiale négative: 


FR) = FX, +Æ, +..+X,)= FA )+ (A )+. +W(Z,) 
1-p q (7.266) 


Exemple: 


Quelle est l'espérance du nombre de pièces bonnes que nous aurons avant la troisième pièce 
non-conforme, sachant que la probabilité d'une pièce non-conforme est de 2%? 


E(R)=—=——=150 (7267) 
P Ce 
et pour la variance: 
= JÙ0 
o= 1822 6 q _ =85.732 (7.268) 
P (2%) 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction binomiale 
négative de paramètres P(R,Æ, p) = P(3,Æ,0.6) basé sur l'exemple du début mais avec comme seule 
différence d'avoir pris probabilité de réussite de 60% au lieu de 20%: 
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Figure: 7.12 - Loi binomiale négative (fonction de distribution et de répartition) 


La distribution ci-dessus est tronquée à 9 mais continue théoriquement à l'infini. Ce qui différencie 
particulièrement la loi binomiale, géométrique de la loi binomiale négative sont les queues de la 
distribution. 


5.6. FONCTION HYPERGÉOMÉTRIQUE 


Nous considérons pour approcher cette fonction un exemple simple (mais guère intéressant dans la 
pratique) qui est celui d'une urne contenant n boules dont m sont noires et les autres m' blanches (pour 
plusieurs exemples concrets utilisés dans l'industrie se reporter au chapitre de Génie Industriel ou de 
Méthodes Numériques). Nous tirons successivement, et sans les remettre dans l'urne, p boules. Quelle 
est la probabilité que parmi ces p boules, il y en ait k qui soient noires (dans cet énoncé l'ordre du tirage 
ne nous intéresse donc pas!). 


Nous parlons souvent de "tirage exhaustif" avec la loi hypergéométrique car contrairement à la loi 
binomiale, la taille du lot qui sert de base au tirage va apparaître dans la loi. Raison pour laquelle la loi 
hypergéométrique tend vers les valeurs de la loi Normale lorsque la taille du lot est petite. 


Remarque: Cela équivaut à l'étude non ordonnée d'un tirage sans remise (cf. chapitre de 
Probabilités) avec contrainte sur les occurrences appelé parfois "tirage simultané". Nous utiliserons 
souvent cette fonction dans le domaine de la qualité ou de la fiabilité où les boules noires sont 


associées à des éléments avec défauts et les blanches à des éléments sans défauts. 


Les p boules peuvent être choisies parmi les n boules de c, façons (représentant donc le nombre de 


tirages différents possibles) avec pour rappel (cf. chapitre de Probabilités): 


Les k boules noires peuvent être choisies parmi les m noires de C façons. Les p-k boules blanches 


peuvent être elles choisies de GE façons. Il y a donc C'* sas tirages qui donnent k boules noires et 


p-k boules blanches. 
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La probabilité recherchée vaut donc (nous en verrons une autre formulation possible dans le chapitre 
de Génie Industriel): 


 — 

P(n,p,m,k) = H(k) = Le = ie UE RC) 
P PE 
plin-p)l 


et est dite suivre une "fonction Hypergéométrique" (ou "loi Hypergéométrique") et peut être obtenue 
heureusement de manière directe dans Microsoft Excel 11.8346 avec la fonction 
LOIL.HYPERGEOMETRIQUE ). 


Exemples: 


E1. Nous souhaitons mettre en production un petit développement informatique de 10'000 lignes de 
code (n). Le retour d'expérience montre que la probabilité de défaillance est de 1 bug pour 1000 lignes 
de code (soit 0.1% de 10'000 lignes) ce qui correspond à valeur de m. 


Nous testons environ 50% des fonctions du logiciel au hasard avant l'envoi au client (soit l'équivalent 
de 5'000 lignes de code correspondant à p). La probabilité d'observer 5 bugs (k) est avec 
Microsoft Excel 11.8346: 


= LOLHYPERGEOMETRIQUE(Kk;p;m;n) 
= LOIHYPERGEOMETRIQUE(5;5000;0.1%*10000;10000)=-24.62% 


E2. Dans une petite production unique d'un lot de 1'000 pièces dont nous savons que 30% en moyenne 
sont mauvaises à cause de la complexité des pièces par retour d'expérience d'une fabrication 
précédente similaire. Nous savons qu'un client va en tirer 20 au hasard pour décider d'accepter ou de 
rejeter le lot. Il ne rejettera pas le lot s'il trouve zéro pièce défectueuse parmi ces 20. Quelle est la 
probabilité d'en avoir exactement 0 de défectueuse? 


=LOLHYPERGEOMETRIQUE(0;20;300;1000)-0.073% 


et comme on exige un tirage nul, le calcul de la loi hypergéométrique se simplifie en: 


CURE ALT 


Il n'est pas interdit de faire le calcul direct de l'espérance et de la variance la fonction hypergéométrique 
mais le lecteur pourra sans trop de peine imaginer que ce calcul va être. relativement indigeste. Alors 
nous pouvons utiliser une méthode indirecte qui de plus est intéressante. 


D'abord le lecteur aura peut-être, même certainement, remarqué qu'au fait l'expérience de la loi 
hypergéométrique est une série d'essais de Bernoulli (sans remise bien entendu!). 


Alors, nous allons tricher en utilisant dans un premier temps la propriété de linéarité de l'espérance. 
Définissons pour cela une nouvelle variable correspondant implicitement au fait à l'expérience da la 
fonction hypergéométrique (k essais de Bernoulli de suite!): 
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où À, représente la réussite d'obtenir au i-ème tirage une boule noire (soit 0 ou 1). Or, nous savons que 
pour tout i la variable aléatoire X; suit une fonction de Bernoulli pour laquelle nous avons démontré 
lors de notre étude de la loi de Bernoulli que Æ(X,) = p . Dès lors, de par la propriété de linéarité de 


l'espérance nous avons: 


k 
2-24) #7 (7.273) 


= 


Or, dans l'essai de Bernoulli, p est la probabilité d'obtenir l'élément recherché (pour rappel...). Dans la 
loi hypergéométrique ce qui nous intéresse est la probabilité d'avoir une boule noire (qui sont en 
quantité m, avec donc m' boules blanches) par rapport à la quantité totale de boules n. Et le rapport 
nous donne évidemment cette probabilité. Ainsi, nous avons: 


où k est le nombre de tirages (attention à ne pas confondre avec la notation de l'énoncé initial où il était 
noté par la variable p). Cette moyenne donne donc le nombre moyen de boules noires lors d'un tirage 
de k boules parmi n, dont m sont connues comme étant noires. 


Pour déterminer la variance, nous allons utiliser la variance de la fonction de Bernoulli et la relation 
suivante démontrée lors de l'introduction de l'espérance et de la covariance au début de ce chapitre: 


VOX +F)=V(X)+P(F)+2cov(X,F) = VOX) +V(F)+2(ECX-F)- ECA)E(F)) (7275) 
k 


Dons en rappelant que nous avons X = ÿ°X; il vient: 
i=l 


k k k 
> x | =DV(X)+2 D (AC, X)-E(X)E(X,)) (0.276 
i=1 2=]l Lie j£n 


Or, pour la loi de Bernoulli, nous avons: 


m mm mm 
)=p:4 m'+mm+m  (m'+m) x? 
Alors nous avons déjà: 
- mm mm 
2 PCA) =k—— =k—— (7.278) 
2 (2 +) ñ# 


Ensuite, nous avons facilement: 
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2 
BCE)» M 2 ( dis | (7.279) 
+ A+ 


Le calcul de E(Æ;X;) nécessite une bonne compréhension des probabilités (c'est un bon rappel!). 


L'espérance E(X;X,) est donnée (implicitement) par la somme pondérée des probabilités que deux 


événements aient lieu en même temps comme nous le savons. Or, nos événements sont binaires: soit 
c'est une boule noire (1) soit c'est une boule blanche (0). Donc tous les termes de la somme n'ayant pas 
deux boules noires consécutivement seront nuls! 


Le problème est alors de calculer la probabilité d'avoir deux boules noires consécutives et celle-ci 
s'écrit donc: 

m—1 
m'+m (n'+ im) — 1 


P(XX,=D=P((X =DN(X, =1))=P(X; =1)Pra(X, =D= (7.280) 


Donc nous avons finalement: 


m— 
m'+m (m'+ mi) —1 


E(X,X,) = (7.281) 


Soit: 


1 2 
cou(X,,X,)=E(X,.X,)- BE) = (ne 


8 


(r'+mY Cora" + on — 1) 


Finalement: 


k k 
V(X)= DP(X)+2 D (ECX-X,)-ECX)EX,)) 
=1 l£iéj£n 
.m' am oi k 
= + 2 1 
(+) (m'+m) Core + re — 1) lie jen 
mn mm k&—-D& 
— : +2 —"— “ ere (7.283) 
(+) (tm) Gm'tm-1 2 
_kmmnt+m-Tl-mm'k(k-T)  Lom-mn'tm-1-k+1 
(2 +) (om +» — 1) (4m) Core + > — 1) 
__k£.mmm'+m—xk) m mo m+m-k. m'+m-x 


=À 
(m4) (a+ m1) + min m+m—l : m'+m—1 


où nous avons utilisé le fait que: 
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D'cov P 4.4) (7.284) 


est composé de: 


&\ &(k-1 
en 


(7.285) 


termes puisqu'il correspond au nombre de façons qu'il y a de choisir le couple (i, j) avec à < j. 


Donc finalement: 


ou: 


—k 
«= fra f° 


#—1 


(7.286) 


(7.287) 


Nous voyons qu'il s'agit du même écart-type que la loi binomiale, à la différence d'un facteur qui est 


noté: 


Jpc = (7.288) 


que l'on retrouve assez souvent en statistiques et qui est appelé "facteur de correction de population" ou 


en anglais "finite population correction factor". 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction 


Hypergéométrique de paramètre (x,p,#,#) = (10,6,5,&): 


a 1 
Le) 

0. a 
0 

Q a 
Q 

Q a 
at 

a Q 
Q 

0@ L À à 90 


_ 


Figure: 7.13 - Loi hypergéométrique (fonction de distribution et de répartition) 
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Démontrons que la loi Hypergéométrique tend vers une loi binomiale puisqu'il en est fait usage de 


nombreuses fois dans différents chapitres du site (et particulièrement le chapitre de Génie Industriel). 


Pour cela, décomposons: 


PA ANA 
Phpmkh= Er (728) 
Cy 


Il vient alors: 


_ E | nl | 
pl@-—p)l 


: m| (x — m)l plix-p)l 
| kln-b)l(@-DI((-m)-(p-#))l #| 


| ml l (nm) | 
CRC LEklén-k)l/L(p-Hl((e-m)-(p-k))l 


klép-klm-bl((e-m)-(@p-0) 1 
» Ml (x—#)l (x — p)l 
FGn-k)l((a-m)-(p-k))l xl 


Pour le deuxième terme: 


ml 1.2.3.....m 
(m-k)l 1.2.3... (m-à) 


=m m—l).…..(#-&+D (7291) 
Pour ## —+0 tous les termes sont alors de l'ordre de m. Nous avons alors: 


m(n-1).….(m-k+l)=m#f (7292) 


Pour le troisième terme un développement identique en tous points au précédent permet d'obtenir: 


na—m)| _ 
=(n- nm) (7293) 


(@e-m)-(p-#)1 


Idem pour le quatrième terme: 


n—p)l 
AR 2. P (7.294) 
A| 
En conclusions nous avons: 
ma nn k p=k 
Ni Der 2 - gr (am) (7.295) 
C" moto À x? 


Changeons d'écriture en posant p (le nombre d'individus tirés) comme étant N. Il vient alors: 
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m2 nm & ik 
Cr CN? (x —#) 
Fe & 
CY 740 n" 


(7.296) 


Faisons un autre changement d'écriture en notant b les boules noires (black) et w les boules blanches 
(white). Il vient alors: 


b nb k NE & a 
CECRe | ON GET nb wi = 
n er N TU N rer 
Cy + A A 


Enfin, notons p la proportion de boules noires et q celle de boules blanches dans le lot n. Il vient alors: 


& N-k 
CCS # # ee 
SE PET CO Ne) 
CY #70 # (7.298) 
NOR N—k &k N-k -N N_k N-k 
=Cpag nn n° =C; pq 


Nous retrouvons donc bien la loi binomiale!! En pratique, il est courant d'approximer la loi 
hypergéométrique de paramètres par une loi binomiale de paramètres dès que le rapport nombre 
d'individus tirés sur le nombre total d'individus est inférieur à 10% (c'est-à-dire lorsque l'échantillon est 
10 fois plus petit que la population). Il s'ensuit que la loi hypergéométrique tend aussi (comme nous le 
démontrerons plus loin) vers une loi Normale lorsque la population tend vers l'infini et que l'échantillon 
est petit. 


5.7. FONCTION MULTINOMIALE 


La loi multinomiale (appelée ainsi car elle fait intervenir plusieurs fois le coefficient binomial) est une 
loi applicable à n événements distinguables, chacun ayant une probabilité donnée, qui surviennent une 
ou plusieurs fois et ce de façon non nécessairement ordonné. Il s'agit d'un cas fréquent dans les études 
marketing et qui nous serta utile pour construire le test statistique de McNemar beaucoup plus loion. 
Nous retrouvons également cette loi en finance quantitative. 


Plus techniquement, considérons l'espace des événements £2= {1,2,...,#} muni d'une probabilité 
P{{i}) = p,,i =1,2,..,#. Nous tirons n fois de suite avec remise un élément de {3 avec la probabilité 
P,,i=1,2,..,#. Quelle est donc la probabilité d'obtenir de manière non nécessairement ordonnée 


l'événement 1, #, fois, l'événement 2, #, fois et ce sur une suite d'un tirage de n éléments. 


Remarque: Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) et 
contraintes sur les occurrences. Donc sans contraintes nous verrons par l'exemple que nous 
retombons sur un tirage avec remise simple. 


Nous avons vu dans le chapitre de Probabilités, que si nous prenons un ensemble d'événements ayant 
plusieurs issues, alors les différentes combinaisons de suites que nous pouvons obtenir en prenant p 
éléments choisis parmi n est: 


ja nl 7 909 
(s pin =pll (7.299) 
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Il y a donc: 


Al 


Ce = 
À Hl@r-&) 
façons différentes d'obtenir &, fois un certain événement. Soit une probabilité associée de: 
Ph) = CE pla "À = CE ph (1- 


Maintenant, intervient la particularité de la loi multinomiale!: il n'y a pas d'échecs contrairement à la loi 
binomiale. Chaque "pseudo-échec" peut être considéré comme un sous tirage de &, parmi les # — & 


éléments restants. 


Ainsi le terme: 


SATA (7301 


s'écrira sur l'ensemble de l'expérience si nous considérons un cas particulier limité à deux types 
d'événements: 


— ; - 
SATA l= CE pi (CE k | (7.302) 


avec donc: 


ch ___(#=k)l 
L | kl((x- &)-&)l 


qui donne le nombre de façons différentes d'obtenir #&, fois un second événement puisque dans 
l'ensemble de la suite, de n éléments déjà &, ont été tirés ce qui fait qu'il n'en reste plus que »— & sur 


lesquels nous pouvons obtenir les &, voulus. 


Ces relations nous montrent donc qu'il s'agit d'une situation où chaque probabilité d'événement est 
considérée comme une sous loi binomiale (d'où son nom aussi...). 


Alors nous avons dans le cas particulier de deux séries d'uplets: 


CA ph = C£ Ck, ki P3° 


_. ___@=k)l ke | 
_&lé-k)l&l(@-k)-k Ti P2 (7.304) 
| 
#1 + ph pi 


"Hlbltr-h-&) 


et comme: 
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il vient: 


et nous voyons que la construction de cette loi impose donc que: 


<'. — DE 
Zn=1 2,k=2 307 
i i 


Ainsi, par récurrence nous avons la probabilité P recherchée appelée "fonction Multinomiale" (ou "loi 
Multinomiale") et donnée par: 
ma 
24 |! 
À | i=]1 sis 


P = = [1z* = TI" (7.308) 
II k =1 II k, i=l 


= =1 


dans le logiciel Microsoft Excel 11.8346, le terme: 


La _ 7 (7309) 


appelé "coefficient multinomial" est disponible sous le nom de la fonction MULTINOMIALE( ) dans la 
version française. Dans la littérature nous trouvons également ce terme parfois sous les formes 


respectives suivantes: 
&+k +...+£ 
F* É ") | di | (7.310) 
6, ,...k, k,k,..,k,, 


Démontrons que la loi multinomiale est bien une loi de probabilité (car nous pourrions en douter...). Si 
c'est bien le cas, la somme des probabilités doit être comme nous le savons, égale à l'unité. 


Démonstration: 
Rappelons que dans le chapitre de Calcul Algébrique nous avons démontré que (théorème binomial): 
é k 
Le] n— m9 
(x+ y) = Lx» (7.311) 


Faisons maintenant un petit peu de notation: 
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#7 ñ 
- #| : 
(x +2) = 5" Cr x" = 5" ——— ax" k (7.312) 
k =0 =0 à (2 —& L 


et cette fois-ci un changement de variables: 


n n 
ME A! k, 
+) = ZCŒaR th = y . Am (313) 
= ko à le | 


Cette dernière relation (qui est un cas à deux termes du "théorème multinomial") va nous être utile pour 
démontrer que la loi multinomiale est bien une loi de probabilité. Nous prenons donc le cas particulier 
avec deux groupes de tirage: 


al TT k CDR: 
P _ AGE — 2 
m [ F7: PE 2 (7.314) 
1 C2Ès 
i= 
ce qui s'écrit aussi de par la construction de la loi multinomiale: 
#1 k (rh) 
P = —————— 7.315 
Aln-& li? ” 
et donc la somme doit être égale à l'unité telle que: 
S A (Ki) (7.316) 
ko à l(#-k il EE | 


pour vérifier cela nous utilisons le théorème multinomial montré précédemment: 


ñ de Al k (n-) 
+p ie D 3 
(A TP2! Al k 1 P2 (7.317) 


Or, comme par construction de la loi multinomiale la somme des probabilités est unitaire, nous avons 
bien: 


nl k, (rx) 


n 
(n tr) = == —————»r "tp 7.318 
Ai : foûlx-ki)l ' : 


OIC.Q.F.D. 


Exemples: 


E1. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité que les six faces apparaissent le 
même nombre de fois (mais pas nécessairement consécutivement!) soit deux fois pour chaque: 
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2 

nl x ll 1(:) 121 

P= Il =-—1]1| -| = = 0.34% 
HR 6 ° (7.319) 


[I#! [12° 


où nous voyons bien que m correspond au nombre de groupes de réussites. 


E2. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité qu'une seule et unique face 
apparaisse 12 fois (donc que le "1" apparaisse 12 fois de suite, ou le "2", ou le "3", etc.): 


12 
al me ji Pi 1 
ee UC #2 (7.320) 
i=l | 


2=l 


Nous retrouvons donc avec ce dernier exemple un résultat connu de la binomiale. 


5.8. FONCTION DE POISSON 


Pour certains événements forts rares, la probabilité p est très faible et tend vers zéro. Toutefois la valeur 
moyenne #'? tend vers une valeur fixe lorsque n tend vers l'infini. 


Nous partirons donc d'une distribution binomiale de moyenne # = #'? que nous supposerons finie 
lorsque n tend vers l'infini. 


La probabilité de k réussites lors de n épreuves vaut (loi Binomiale): 
# 
P(k) = ps (7.321) 


En posant p = #{x# (où m est temporairement la nouvelle notation pour la moyenne selon # = x#'? ), 


al jé & jé n—k 
nee Es É _ ” (7.322) 
le —&)ll x n 


En regroupant les termes, nous pouvons mettre la valeur de P{&) sous la forme: 


PM p-2] Al 
EL à KR (7,323 
: : ein [r-#) | 


cette expression peut s'écrire: 


Nous reconnaissons que, lorsque n tend vers l'infini, le deuxième facteur du produit a pour limite 2. 


Quant au troisième facteur, puisque nous nous intéressons aux petites valeurs de k (la probabilité de 
réussite est très faible), sa limite pour n tendant vers l'infini vaut 1. 


Cette technique de passage à la limite est parfois appelée dans ce contexte: "théorème limite de 


Poisson". 
Page: 369/4839 


[v3.0 - 2013] 


Nous obtenons ainsi la "fonction de Poisson" (ou "loi de Poisson"), appelée également parfois "loi des 
événements rares", donnée donc par: 


qui peut être obtenue dans Micrsooft Excel 11.8346 avec la fonction LOI. POISSON( } et qui dans la 
pratique et la littérature spécialisée est souvent notrée par la lettre u. 


Il s'agit bien d'une loi de probabilité puisqu'en utilisant les séries de Taylor (cf. chapitre de Suites Et 
Séries), nous montrons que la somme des probabilités cumulées est bien: 


+<0 +0 
ee, = D =] (7.325) 
= €! = *| 


Remarque: Nous retrouverons fréquemment cette loi dans différents chapitres du site comme par 
exemple lors de l'étude du Génie Industriel en maintenance préventive ou encore dans le même 
chapitre lors de l'étude des théories des files d'attentes (le lecteur peut s'y reporter pour un exemple 
intéressant et pragmatique) et enfin dans le domaine de l'assurance. 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction de Poisson de 
paramètre {{ = 3: 


Q 


01 


01 


000 


— — F- — — + r- 


Figure: 7.14 - Loi de Poisson (fonction de distribution et de répartition) 


Cette distribution est importante car elle décrit beaucoup de processus dont la probabilité est petite et 
constante. Elle est souvent utilisée dans la "queing theory" (temps d'attente), test d'acceptabilité et 
fiabilité, et contrôles statistiques de qualité. Entre autres, elle s'applique aux processus tels que 
l'émission des quanta de lumière par des atomes excités, le nombre de globules rouges observés au 
microscope, le nombre d'appels arrivant à une centrale téléphonique. La distribution de Poisson est 
valable pour de nombreuses observations faites en physique nucléaire ou corpusculaire. 


L'espérance (moyenne) de la fonction de Poisson est (nous utilisons la série de Taylor de 
l'exponentielle): 
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u= EH = Ÿ ER - -ÿr gaz. US Enr pren = (7.326) 
Ko ! 


et donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée. 


Ce résultat peut paraître déroutant.... la moyenne s'exprime par la moyenne??? Oui il ne faut 
simplement pas oublier que celle-ci est donnée au début par: 


Remarque: Pour plus de détails le lecteur peut aussi se reporter à la partie concernant les 
"estimateurs" dans le présent chapitre. 


La variance de la fonction de distribution de Poisson est quant à elle donnée par (en utilisant à nouveau 
les séries de Taylor): 


= 2 - 2 À 
cs FO ZI B = ZE] = 


+0 & & +0 k 
RÉ Sn Soul eh 4 Sp EG TA 
LE 2 Ce ET 
k +0 &-1 k 
= ku s 2 4 - 
SEE Sri # # 
Dr Mere té Da 
Hi ra sÊ 
DNS ET D g A + = SUR A 2e + 
0 Àl 1 1) k=0 
pas 2 À 
= je _ P = +D4- 
A EE AE C+1 la 
&=l 
= pie" Ë CR KL 22, a Cu Le 
ii De se io ÈS duc 


= pe A (uote) LP 2 jeu ef + pe Fe GP 2j + pi je = pi 
(7.328) 


toujours avec: 
H=A'P (7.329) 


Le fait important que pour la loi de Poisson nous ayons la variance qui soit égale à l'espérance est 
appelé "propriété d'équidispersion de la de Poisson". Il s'agit d'une propriété souvent utilisée dans la 
pratique comme indicateur pour identifier si des données (à support discret) sont distribuées selon une 


loi de Poisson. 


Les lois théoriques de distributions statistiques sont établies en supposant la réalisation d'un nombre 
infini de mesures. Il est évident que nous ne pouvons en effectuer qu'un nombre fini N. D'où la 
nécessité d'établir des correspondances entre les valeurs utiles théoriques et expérimentales. Pour ces 
dernières nous n'obtenons évidemment qu'une approximation dont la validité est toutefois souvent 
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admise comme suffisante. 


Maintenant démontrons une propriété importante de la loi Poisson dans le domaine de l'ingénierie que 
nous appelons la "stabilité par l'addition". L'idée est la suivante: 


Soit deux variables aléatoires indépendantes X et Y de loi de Poisson de paramètre respectif 4 et £4. 
Nous voulons vérifier que leur somme est aussi une loi de Poisson: 


A+ = Pyyn (7330) 


Voyons cela: 


k k 
PX+Y ==> P[(X=iln(r=k-1]=>P(X=i)P(Y=k-1) (7331) 
i=Ù i=Ù 


car les événements sont indépendants. Nous avons alors: 


k k ji 4 ki -u 
PAY= DES PE AP( EL Te 87 
=D il Œ&-i) 
(7.332) 
_e (+4) = k| i, ki 
kl Sil&-àl 


Or, en appliquant le théorème binomial (cf. chapitre Calcul Algébrique): 


ST ii LS oh ai Hi k 
D— Au =) CA =(A+H4) (7333) 
0 l(&—i)l rare 
Donc au final: 
ke (A+4) . 
PÉX+F=k)={ A+ — (7.334) 


et donc la loi de Poisson est bien stable par l'addition. 


5.9. FONCTION DE GAUSS-LAPLACE/LOI NORMALE 


Cette caractéristique est la plus importante fonction de distribution en statistiques suite au résultat d'un 
théorème connu appelé "théorème central limite" qui comme nous le verrons, permet de démontrer 
(entre autres) que toute suite de variables aléatoires indépendantes de même loi ayant une espérance et 
un écart-type fini et non nécessairement égales converge vers une fonction de Gauss-Laplace (loi 
Normale). 


Il est donc très important de focaliser particulièrement son attention sur les développements qui vont 
être faits ici! 


Partons d'une fonction Binomiale et faisons tendre le nombre n d'épreuves vers l'infini. Si p est fixé au 
départ, la moyenne # = *'P tend également vers l'infini, de plus l'écart-type #'P?'4 tend également 
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vers l'infini. 


Remarque: Le cas où p varie et tend vers 0 tout en laissant fixe la moyenne # = *'P ayant déjà été 
étudié lors de la présentation de la fonction de Poisson. 


Si nous voulons calculer la limite de la fonction Binomiale, il s'agira donc de faire un changement 
d'origine qui stabilise la moyenne, en 0 par exemple, et un changement d'unité qui stabilise l'écart-type, 
à 1 par exemple. 


Voyons tout d'abord comment varie 2 (&) en fonction de k (nombre de réussites) et calculons la 


différence: 
» , fn 2 à xs [@-0p 
P(&+D-2(b = ip ge ml lphgtt IE 1 
24 +1)- 2) fe 4 L]r'e £f 7 l&+ne . 
, .. 999 
- > (E) 14 4 
(& +l)g 


Nous en concluons que À (&) est une fonction croissante de k, tant que #'p -&-g est positif (pour n, 


p et q fixés). Pour le voir il suffit de prendre quelques valeurs (du membre de droite de l'égalité) ou 
d'observer la distribution graphique de la fonction Binomiale en se souvenant bien que: 


H=A'D (7.336) 


Comme g < 1 ilest par conséquent évident que la valeur de k voisine de l'espérance de la loi Binomiale 
#=x'p constitue le maxima de A (&). 


D'autre part la différence Æ(&+1)- PB (&) est le taux d'accroissement de la fonction Æ,(&). Nous 
pouvons alors écrire: 


APE _ B&+D-2( 
LE &+D-& 


(7.337) 


comme étant la pente de la fonction. 


Définissons maintenant une nouvelle variable aléatoire telle que sa moyenne soit nulle (variations 
négligeables) et son écart-type unitaire (une variable centrée-réduite en d'autres termes). Nous avons 
alors: 


k— xp 
Vrpa 


Nous avons alors aussi avec cette nouvelle variable: 


- += _ km _[ŒE+D =] ET) 


Vrpa (ra ra 


Appelons F(x) l'expression de Æ,(£) calculée en fonction de la nouvelle variable de moyenne nulle et 


Page: 373/4839 


Ax 


(7.338) 


[v3.0 - 2013] 


d'écart-type unitaire dont nous recherchons l'expression quand n tend vers l'infini. 


Reprenons: 


AP, (k) _#p-k-g 


_ _ == xp). 
AX (&+Dg 


E,(&) = Œ+Da 


P,(&) (7.339) 


Afin de simplifier l'étude de cette relation quand n tend vers l'infini et k vers l'espérance X=x'p?, 
multiplions des deux côtés par xpg ! 4 Papa ; 


LF,(&) xpg _—(k-xp)-q4 npq 2. 


Â& , |xpq (& +l)g pa 


Réécrivons le terme de droite de l'égalité. Il vient alors: 


(7.340) 


E-#)-a by _[-&-#p)- 4] 


&+D fa ” (&+1)./pg 


Et maintenant réécrivons le terme de gauche de la relation antéprécédente. Il vient: 


E,(&) (7.341) 


LFP, (@&) A à pe LF,(k)  xpq e ÀF, (&) #pq 
RE 7 [Œ&+D-K] /2Pg {LG +D-»#]-&- #p))} Vnpa 
LF, (&) #pq LP, (&) _ AZ, (&) 


T&+0-#]-@&-)] pe a (@+D-#]-G&-#)} 4x 
V2P4 J2p4 


Après un passage à la limite pour n tendant vers l'infini nous avons dans un premier temps pour le 
dénominateur du deuxième terme de la relation antéprécédente: 


[-(&-xp)-4]#p 


———— EP (k) (7342) 
(& +1)./xpg 


la simplification suivante: 
(& + 1)./xpg _. rpg (7.343) 


Donc: 


| fx — + = 
LA 2) +a ep £— xp »pE, (#) - Ch P(E) (7.344) 


k/npa k/xpg kfrpa 


et dans un second temps, tenant compte du fait que les valeurs de k considérées se trouvent alors au 
voisinage de l'espérance np, nous obtenons: 


P.(&)=- 


= X (7.345) 
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et: 
gp. _4P__ 4  _) . 
kfnpa ne xp fnpg  Anpa ne 
Donc: 
—[@&- xp) +4]1p 
À — = —x (7347) 
& #pq = +0 
et comme: 


EX) = F(x) (7348) 
#0 


où F(X) représentera pour les quelques lignes qui vont suivre, la fonction de densité lorsque n tend vers 
l'infini. 


Nous avons finalement: 


dF(x) 


=-x"(x) (7.349) 
re (x) 


Cette relation peut encore s'écrire en réarrangeant les termes: 
1 
———dF(x) =-xdx (7.350) 
F(x) 


et en intégrant les deux membres de cette égalité nous obtenons (cf. chapitre de Calcul Différentiel Et 
Intégral): 


x? 
iRCF(x)) = .. +c* (7351) 


La fonction suivante est une des solutions de la relation précédente: 


Effectivement: 
x x 2 2 
7 + X X | 
Inl 4e 2 |=in(l)+inle 2 |=c*+|-— Er UE (7.353) 


La constante est déterminée par la condition que: 


[ FGax (7.354) 


Page: 375/4839 


[v3.0 - 2013] 


qui représente la somme de toutes les probabilités, vaille 1. Nous pouvons montrer pour cela que: 


A=—— (7355) 
27 
Démonstration: 
Nous avons: 
2 2 

ko _27 + 13) #, 

Je 2 dx = [- V2 dx = 2 ed (7356) 

—<© —<© —<© 


Donc concentrons-nous sur le dernier terme de l'égalité. Ainsi: 
+o 2 +o 2 
1 = [a dx = sd dx (7.357) 
—& 


puisque ,-** est une fonction paire (cf. chapitre d'Analyse Fonctionnelle). Écrivons maintenant le carré 
de l'intégrale de la manière suivante: 


; | a R _ RR ap 
1724 lim || fe ax|| fe? dy ||=4 tim | [fe dxdy | (7.358) 
s 00 


et faisons un changement de variable en passant en coordonnées polaires, dès lors nous faisons aussi 
usage du Jacobien dans ces mêmes coordonnées (cf. chapitre de Calcul Différentiel Et Intégral): 


| 2 (TR à rx. (8 
1 =4 lim Îf: rdrd $ |= 4 lim [ [< rdrd$ |=4— lim Je rdr 
R=+0 R=+0 A 2 R=+40 À 


(7.359) 
2 
=0r --e" =2n(0+)-rsi- 
[a] 
Par extension pour 7 nous avons: 
1=A1=4/27 (7.360) 
OIC.Q.FE D. 


Nous obtenons donc la "loi normale centrée réduite" notée sous forme de fonction de densité de 
probabilité (la notation avec le F majuscule peut malheureusement porter à confusion dans le cadre du 
présennt développement avec le fonction de répartition…): 


e 2| (7.361) 


F5 = 


1 
27 
qui peut être calculée dans la version française Microsoft Excel 11.8346 avec la fonction 
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LOI.NORMALE.STANDARD ) ou pour la réciproque par LOI NORMALE.STANDARD.INVERSE( 
). 


Pour information, une variable suivant une loi Normale centrée réduite est très souvent par tradition 
notée Z (pour "Zentriert" en allemand). 


En revenant aux variables non normées: 


À = = — (7,362) 
NE ul 


nous obtenons donc la "fonction Gauss-Laplace" (ou "loi de Gauss-Laplace") ou également appelée 
"loi Normale" donnée sous forme de densité de probabilité par: 


, (ka) 
P(&, 4, 0) = —— 0e 2a2 | (7.363) 
gY 27 


et souvent notée N(Æ,æ ). Elle peut être calculée dans la version française de Microsoft Excel 11.8346 
avec la fonction LOI. NORMALE ) ou pour la réciproque par LOI NORMALE.INVERSE( ). 


La probabilité cumulée (fonction de répartition) de valoir une certaine valeur k étant bien évidemment 
donnée par: 


y à LE 
P(XSx)=—— [eo 29 dk (7364) 
TN2T Lo 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction Normale de 
paramètres ({4, &) = (0,1): 


(el 


(el 


(el 


(el 


(el 


û 


— _ nm m — o _ 


Figure: 7.15 - Loi Normale Centrée Réduite (fonction de distribution et de répartition) 


Cette loi régit sous des conditions très générales, et souvent rencontrées, beaucoup de phénomènes 
aléatoires. Elle est par ailleurs symétrique par rapport à la moyenne Æ (c'est important de s'en 


souvenir). 
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Montrons maintenant que ## représente bien l'espérance mathématique (ou la moyenne) de x (c'est un 


peu bête mais on peut quand même vérifier...): 


+o 1 +0 (2 
E(X) = [a Goax L fe Ale) x (7.365) 

. T2 À 

Posons: 
ü = [A (7.366) 
T 
Nous avons dès lors: 
+o +0 1 à 


: _ 
E(X) = [ x (Ar = — = 


= ie ef à 
J= [fu m5) -e 7] -0-0-0 (7.368) 


Donc il vient au final: 


l 


+ Ll; 
E(X) = —— fer du = ni il 4 (7.369) 


vx” 


(7.367) 
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Remarques: 


R1. Le lecteur pourrait trouver cela déroutant dans un premier temps que le paramètre d'une 
fonction soit un des résultats que nous cherchons de la fonction. Ce qui dérange est la mise en 
pratique d'une telle chose. Au fait, tout s'éclairera lorsque nous étudierons plus loin dans ce chapitre 
les concepts "d'estimateurs de vraisemblance". 


R2. Indiquons que dans la pratique (finance, qualité, assurance, etc.) il est fréquent de devoir 
calculer l'espérance uniquement pour des valeurs positives de la variable aléatoire qui est définie 
alors naturellement comme étant "l'espérance positive" et donnée par: 


Et 1 T (+) 270) 
(A) = —— [ xe dx (7.370) 
TY2X à 


Nous en verrons un exemple pratique dans le chapitre d'Économie lors de notre étude du modèle 
théorique de la spéculation de Louis Bachelier. 


Montrons aussi (..…) que & représente bien l'écart-type de X (il convient, en d'autres termes de montrer 
que FX) = a) et pour cela rappelons que nous avions démontré que (relation de Huyghens): 


FX) = E(X?) -E(XŸ (7.371) 


Nous avons déjà calculé tout à l'heure E(X\) = 4 = E(X ÿ =; commençons alors par calculer 


E(X ): 


l 


E(X°)- [És f{x)dx = 


Posons y ={x-x\){4/2æ qui conduit dès lors à: 


(x) - [ (20 + 4) ed - Ro fee + ur fe fe à L 
2 + (7.373) 
+ fe 
"Al" 


Or, nous savons: 
bios è is ? 
pre” dy =0 fe” dy = V7 (7.372) 
—2 —à 


Il reste donc à calculer la première intégrale. Pour cela, procédons par une intégration par parties (cf. 
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chapitre de Calcul Différentiel et Intégral): 


è è 
[Os a = j @eEX, - [F'Oe@d 


, : S (7.375) 
: 2 rt -# = — a Fe a 
Ed dy [2e )æy | ts 
D'où: 
(= 2 ON sono es (7.376) 
T2 x Jr 


Il vient finalement: 
V(X) = E(X?)-E(X) = (7377 


Une signification supplémentaire de l'écart-type dans la loi de Gauss-Laplace est une mesure de la 
largeur de la distribution telle que (cela ne peut se vérifier qu'à l'aide d'intégration à l'aide de méthodes 
numériques) que toute moyenne et pour tout écart-type non nul nous avons: 


| — 997% = Ha | 
| - 95,4% = 2e | 
| — 68.3% = +1 | 


37 20 1T A =} #1 +27 #3 


Figure: 7.16 - Intervalles sigma de la loi Normale 


La largeur de l'intervalle a une très grande importance dans l'interprétation des incertitudes d'une 
mesure. La présentation d'un résultat comme j} + # signifie que la valeur moyenne a environ 68.3% de 
chance (probabilité) de se trouver entre les limites de }j -4 et f} + sr, ou qu'elle a environ 95.4% de 
se trouver entre j} — 2er et À + 2er etc. 
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Remarque:Ce concept est beaucoup utilisé en gestion de la qualité en entreprise particulièrement 
avec le concept industriel anglo-saxon Six Sigma (cf. chapitre de Génie Industriel) qui impose une 
maîtrise de 6&T autour de chaque côté (!) de la moyenne des côtés des pièces fabriquées (ou tout 
autre sujet dont on mesure la déviation). 


1 68.26894 317311 

27 95.4499 45'500 

3T 99.73002 2'700 

4 99.99366 63.4 

5 99.999943 0.57 

6T 99.9999998 0.002 
Tableau: 7.7 - Niveau de qualité Sigma avec taux de défection/non-défection 


La deuxième colonne du tableau peut facilement être obtenue avec Maple 4.00b. Par exemple pour 
la première ligne: 


>S:=evalf(int(1/sqrt(2*Pi)*exp(-x/2/2),x=-1..1)); 

et la première ligne de la troisième colonne par: 

>(1-S)*1E6: 

Si la loi Normale était décentrée, il suffirait alors d'écrire pour la deuxième colonne: 
>S:=evalf(int(1/sqrt(2*Pi)*exp(-(x-mu)12/2),x=-1..1)); 


et ainsi de suite pour tout écart-type et toute moyenne on retombera sur les mêmes intervalles!!! 


La loi de Gauss-Laplace n'est par ailleurs pas qu'un outil d'analyse de données mais également de 
génération de données. Effectivement, cette loi est une des plus importantes dans le monde des 
multinationales qui recourent aux outils statistiques pour la gestion du risque, la gestion de projets et la 
simulation lorsqu'un grand nombre de variables aléatoires sont en jeu. Le meilleur exemple 
d'application en étant le logiciel CrystalBall ou @Risk de Palisade (mon préféré...). 
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Dans ce cadre d'application (gestion de projets), il est par ailleurs très souvent fait usage de la somme 
(durée des tâches) ou le produit de variables aléatoires (facteur d'incertitude du client) suivant des lois 
de Gauss-Laplace. Voyons comment cela se calcule: 


5.9.1. SOMME DE DEUX VARIABLES ALÉATOIRES NORMALES 


Soient X, Y deux variables aléatoires indépendantes. Supposons que X suit la loi 7 ( 4.) et que Y suit 
la loi À ( lb ©) . Alors, la variable aléatoire Z = X+Y aura une densité égale au produit de 


convolution de j, et f, . C'est-à-dire: 


(-4f (sx) 


T 1 T2 _ 24 7.378 
A2 [AGAG- Das [e Los 4 de 7 


ce qui équivaut à faire le produit conjoint (cf. chapitre de Probabilités) des probabilités d'apparition des 
deux variables continues (se rappeler le même genre de calcul sous forme discrète!) 


Pour simplifier l'expression, faisons le changement de variable £ = x — {4 et posons 4 = { +4 —s, 
= Vo + : 


Comme: 


(t+aŸÿ (7.379) 


PSS 
Lo] 
[ 
# 
[ 
Rs 
tt 
t> 
Il 
| 
I 
mn 
+ 
+ 
+ 
F 
en 
Le) 
Lo 
Il 
[ 
mn 
+ 
5 
+ 
Fo 
tt 
Il 


nous obtenons: 


test afa?o2 
1 + — ” éH) 1 + — 2 sd 
3 Zoe 
fa(o)= —— [+ À. ” dt= —— |: 2 di 
270 L 270 L 
(7.380) 
es] 
Es 
= — el [e #3 @ 
27, 
Nous posons: 
ac 
Di + — 
o du T (7.381) 


du 
ue = m2 5 = y — > dt = 20,0, — 
265, dt V2a5, ee 


Alors: 
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2 
(ori) 
: À yo Re a (7.382) 
" 502 
Ja (s) = ——e 26° [e DT 0 gg = 629 [e* du 
2779, LA 277 
Sachant que: 

vi 2 

[ ce du= JT (7383 

A 


et: 


a =(-5+4 +4) =[-(s- 4 -4)| = (5 j4 =) (7.384) 


notre expression devient: 


, Ex) 
à = g 21 | (7.385) 


Nous reconnaissons l'expression de la loi de Gauss-Laplace de moyenne 4 +44, et d'écart type 
o= 1e +. 


Par conséquent, X+Y suit la loi: 


N(# +44, Jo +) (7.386) 


Le fait que la somme de deux lois Normales donne toujours une loi Normale est ce que nous nommons 
en statistiques la "stabilité par la somme" de la loi de Gauss-Laplace. Nous retrouverons ce type de 
propriétés pour d'autres lois que nous étudierons plus loin. 


Remarque: Les familles de lois stables par addition constituent un domaine important d'étude en 
physique, finance et statistiques appelé "distribution de Lévy alpha-stables", Si le temps me le 
permet, je présenterai les détails de ce domaine d'étude extrêmement important dans le présent 
chapitre. 


5.9.2, PRODUIT DE DEUX VARIABLES ALÉATOIRES NORMALES 


Soient X, Y deux variables aléatoires indépendantes réelles. Nous désignerons par jf, et j, les densités 
correspondantes et nous cherchons à déterminer la densité de la variable Z = X.F. 


Notons f la fonction de densité du couple (X,Y). Vu que X, Y sont indépendantes (cf. chapitre de 
Probabilités): 


SAN) = fr): fr) (7.387) 


La fonction de répartition de Z est: 
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F(z)=P(Z<z)= PIX <2)= [fard = [] Go HO) (300) 
D D 


où D={(x>)|x.y<z}. 


D peut se réécrire comme union disjointe (nous faisons cette opération pour anticiper lors du futur 
changement de variables une division par zéro): 


D=D UD, UZB, (7.389) 


avec: 
a ={(x,>)eR° |x-y<zetx > 0} 
D, ={(x,y) eR° |x-y<zetx < 0} (7.390) 
D, ={(xr)eR |x-y<z etx=0) 

Nous avons: 


F(2)= [rt fr Odrdy + [] Ge Card + [] fra) fr) dxdy 
A 2 D, (7.391) 


—,— 
— 


La dernière intégrale vaut zéro car 2} est de mesure (épaisseur) nulle pour l'intégrale selon x. 


Nous effectuons ensuite le changement de variable suivant: 


X=X 
(7.392) 
É= x.y 


1 (il 
tx? {x 


z +0 £z OÙ 
F(z)= [ [AD RE pra | [RO RO 


Le jacobien de la transformation est: 


=— (7.393) 


xl 


Donc: 


LL 7! pl bn ji (7.394) 
_ [ PRE a 


Notons jf, la densité de la variable Z. Par définition: 


F()=[ZO& (35) 
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D'un autre côté: 


z Ko 
F(2)= | ee dxdt (7.396) 


comme nous venons de le voir. Par conséquent: 


Ko 
f20= [ Jr) Jr (El x) 4 


pl 


(7.397) 


—© 


Ce qui est un peu triste c'est que dans le cas d'une loi de Gauss-Laplace (loi Normale), cette intégrale 
ne peut être calculée simplement que numériquement. il faut alors faire appel à des méthodes 
d'intégration du type Monte-Carlo (cf. chapitre de Méthodes Numériques). 


D'après quelques recherches faites sur Internet cependant, mais sans certitude, cette intégrale pourrait 
être calculée et donnerait une nouvelle loi appelée "loi de Bessel". 


5.9.3. LOI NORMALE CENTRÉE RÉDUITE 


La fonction de Gauss-Laplace n'est pas tabulée puisqu'il faudrait autant de tables numériques que de 
valeurs possibles pour la moyenne # et l'écart-type æ (qui sont donc des paramètres de la fonction 
comme nous l'avons vu). 


C'est pourquoi, en opérant un changement de variable, la loi Normale devient la "loi Normale centrée 
réduite" où: 


1. "Centrée" signifie soustraire la moyenne (la fonction à alors pour axe de symétrie l'axe des 
ordonnées). 


2. "Réduite" signifie, diviser par l'écart-type &. 


Par ce changement de variable, la variable k est remplacée par la variable aléatoire centrée réduite: 


Ke IR (7.398) 

[ag 

Si la variable k a pour moyenne # et pour écart- type «7 alors la variable &* = sit a pour moyenne 
[ag 

0 et pour écart-type 1. 
Donc la relation: 

, Es) 

P(k,4,0)= ——e 29? (7.399) 
27 


s'écrit alors (trivialement) plus simplement: 
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(7.400) 


qui n'est d'autre que l'expression de la loi Normale centrée réduite souvent notée N(0,1) que nous 
retrouverons très fréquemment dans les chapitres relatifs à la physique, la finance, la gestion et 
l'ingénierie! 


Remarque: Calculer l'intégrale de la relation précédente entre n'importe quelles bornes n'est pas 
possible formellement parlant de manière exacte. Une idée possible et simple consiste alors à 
exprimer l'exponentielle en série de Taylor et de faire ensuite l'intégration terme par terme de la 
série (en s'assurant de prendre suffisamment de termes pour la convergence!). 


5.9.4. DROITE DE HENRY 


Souvent, dans les entreprises c'est la loi de Gauss-Laplace (Normale) qui est analysée mais des logiciels 
courants et facilement accessibles comme Microsoft Excel sont incapables de vérifier que les données 
mesurées suivent une loi Normale lorsque nous faisons de l'analyse fréquentielle (aucun outil intégré 
par défaut ne permet de le faire) et que nous n'avons pas les données d'origines non groupées. 


L'astuce consiste alors à utiliser la variable centrée réduite qui se construit comme nous l'avons 
démontré plus haut avec la relation suivante: 


L'idée de la droite d'Henry est alors d'utiliser la relation linéaire entre k et k* donnée par l'équation de la 
droite: 


k=rm=£-# (Ga 
T 


et qui peut être tracée pour déterminer la moyenne et l'écart-type de la loi Normale. 
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Exemple: 


Supposons que nous ayons l'analyse fréquentielle suivante de 10'000 tickets de caisse dans un 


supermarché: 


[0,50[ 668 668 | 0.068 
[50,100[ 919 1587 | 0.1587 
[100,150[ 1'498 31085 | 0.3085 
[150,200[ 1915 5000 | 0.5000 
[200,250[ 1915 6915 0.6915 
[250,300[ 1'498 8413 | 0.8413 
[300,350[ 919 9'332 | 0.9332 
[350,400[ 440 9'772 | 0.9772 
[400 et + 228 10000 | 1 


Tableau: 7.8 - Intervalles de classe pour la détermination de la droite de Henry 


Si nous traçons maintenant cela sous Microsoft Excel 11.8346 nous obtenons: 


2500 


2000 


1500 


100û 


Nombre de tickets 


500 


(l 


l 


100 


200 300 40û 
Borne droite de l'intervalle des tickets 


500 


Figure: 7.17 - Distribution des ventes de tickets 


Ce qui ressemble terriblement à une loi Normale d'où l'autorisation, sans trop de risques, d'utiliser dans 
cet exemple la technique de la droite d'Henry. 


Mais que faire maintenant? Eh bien connaissant les fréquences cumulées, il ne nous reste plus qu'à 
calculer pour chacune d'entre elles k* à l'aide de tables numériques ou avec la fonction NORMSINV( ) 
de la version anglaise de Microsoft Excel 11.8346 (car rappelons que l'intégration formelle de la 
fonction gaussienne n'est pas des plus faciles.….). 


Ceci nous donnera les valeurs de la loi Normale centrée réduite N(0,1) de ces mêmes fréquences 
respectives cumulées (fonction de répartition). Ainsi nous obtenons (nous laissons le soin au lecteur de 
chercher sa table numérique ou d'ouvrir son logiciel préféré..): 
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50 0.068 | 1.5 
100 0.1587 | -1 
150 0.3085 | 0.5 
200 0.5000 | 0 
250 0.6915 | 0.5 
300 0.8413 | 1 
350 0.9332 | 1.5 
400 0.9772 | 2 
: 1 | : 


Tableau: 7.9 - Fréquences relatives cumulées pour la droite de Henry 


Signalons que dans le type de tableau ci-dessus, dans Microsoft Excel, les valeurs de fréquences 
cumulées nulles et unitaires (extrêmes) posent problèmes. Il faut alors jouer un petit peu... 


Comme nous l'avons spécifié plus haut, nous avons sous forme discrète: 


k; = f() = _ - (7.403) 


Donc graphiquement sous Microsoft Excel 11.8346 nous obtenons grâce à notre tableau le graphique 
suivant (évidemment en toute rigueur on fera une régression dans les règles de l'art comme vu dans le 
chapitr de Méthodes Numériques avec intervalles de confiance, de prédiction et tout le toutim...): 


2.50 
2.00 
1.50 
1.00 
0.50 
-050 & 200 300 400 
-1.00 
-1.50 
-2.00 
-2.50 
-3.00 


k*= 0.01k - 2.00 
R?= 1.00 


k* 


L'a 


Figure: 7.18 - Forme linéarisée de la distribution 


Donc à l'aide de la régression donnée par Microsoft Excel 11.8346 (ou calculée par vos soins selon les 
techniques de régressions linéaires vues dans le chapitre de Méthodes Numériques). Il vient: 


£=Ë 4 00&-2 v40 
TT 


dont nous déduisons immédiatement: 


g=100 g=200 (7.405) 
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Il s'agit donc d'une technique particulière pour une distribution particulière! Des techniques similaires 
plus ou moins simples (ou compliquées suivant les cas) existent pour nombre de distributions. 


Voyons une autre manière approximative d'aborder le problème. Reprenons pour cet exemple notre 


tableau: 
[ [0,507 50[ 

| [50,100 100[ D 100 | 75 | 1587 
[100,150[ 150 125 30.85 
[150,200[ 200 175 50.00 
[200,250[ 250 225 69.15 
[250,300[ 300 275 84.13 
[300,350 350 325 93,32 
[350,400[ 400 375 97.72 
[400 et + - - 100 


La moyenne sera maintenant calculée à l'aide de la valeur centrale des intervalles et des effectifs selon 
la relation vue au début de ce chapitre: 


N 
“ HS; 
== (7.406) 
2 # 
[O,500 (668 16700 
[50,100[ 75 919 68'925 
[100,150[ 125 1498 187250 
[150,200[ 175 1915 335125 
[200,250[ 225 1915 430'875 
[250,300[ 275 1498 411950 
[300,350[ 325 919 298'675 
[350,400[ 375 440 165'000 
[400 et + - - - 
Somme: 9772 1914500 
Moyenne: 1'914'500/9'772 
=195.92 


La moyenne expérimentale est donc assez proche de la moyenne théorique obtenue précédemment 
avec la droite de Henry. 


L'écart-type sera maintenant calculé à l'aide de la valeur centrale des intervalles et des effectifs selon la 


relation vue aussi au début de ce chapitre: 
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(7.407) 


[0,50 1997.00 
[50,100[ 75 919 1375.08 
[100,150[ 125 1498 771.02 
[150,200 175 1915 85.76 
[200,250[ 225 1915 165.71 
[250,300 275 1498 958.65 
[300,350[ 325 919 1566.93 
[350,400 375 440 1443.98 
[400 et + - 228 - 
Variance: 8364.16 
Ecart-Type: 91.45 


L'écart-type expérimental est donc assez proche de l'écart-type théorique obtenu avec la méthode de la 


droite de Henry. 


5.9.5. DIAGRAMME QUANTILE-QUANTILE 


Une autre manière de juger qualitativement de l'ajustement de données expérimentales avec une loi 
théorique (quelle qu'elle soit!!!) est l'utilisation d'un "diagramme quantile-quantile". 


L'idée est assez simple, il s'agit de comparer les données expérimentales, aux données théoriques 
supposées suivre une loi donnée. Ainsi, dans le cas de notre exemple nous avons en prenant les valeurs 
de la moyenne théorique (200) et l'écart-type théorique (100) obtenus avec la droite de Henry: 


[0,501 6.80% 50.91 
[50,100[ 100 15.87% 100.02 
[100,150[ 150 30.85% 149.99 
[150,200[ 200 50.00% 200 
[200,250[ 250 69.15% 250.01 
[250,300[ 300 84.13% 299.98 
[300,350[ 350 93.32% 350.00 
[350,400[ 400 97.72% 399.90 
[400 et + - 100% - 


Représenté graphiquement, cela nous donne donc le fameux diagramme quantile-quantile: 
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DIAGRAMME QUANTILE-QUANTILE 


Quantiles observés 
Le] 
Le 
Les] 


0 50 100 150 200 250 300 350 400 450 


Quantiles théoriques 


Figure: 7.19 - Diagramme quantile-quantile de la distribution 


Et bien évidemment on peut comparer les quantiles observés à toute loi théorique supposée. Plus les 
points seront alignés sur la droite, meilleur sera l'ajustement! C'est très visuel, très simple et beaucoup 
utilisé par les non spécialistes en statistiques dans les entreprises. 


5.10. FONCTION LOG-NORMALE 


Nous disons qu'une variable aléatoire positive X suit une "fonction log-normale" (ou "loi log-normale") 
de paramètres {{,€ > 0 (moments de la loi log-Normale), si et seulement si en posant: 


y=in(Æ) (7.408) 


nous voyons que y suit une fonction de probabilité de type loi Normale de moyenne /{ et de variance 
a? (moments de la loi Normale). 


In exteno, de par les propriétés des logarithmes, une variable peut être modélisée par une loi 
log-normale si elle est le résultat de la multiplication d'un grand nombre de petits facteurs indépendants. 


La fonction de densité de X pour xx 0 est alors (cf. chapitre de Calcul Intégral): 


1 _ (into) -4) 
PE Er | 5 


(7.409) 


qui peut être calculée dans la version française de Micrsoft Excel 11.8346 avec la fonction 
LOI.LOGNORMALE( ) ou pour la réciproque par LOL LOGNORNALE.INVERSE( ). 


Ce type de scénario se retrouve fréquemment en physique, dans les techniques de maintenance ou 
encore en finance des marchés dans le modèle de pricing des options (voir ces chapitres respectifs du 
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site pour des exemples concrets). Il y a par ailleurs une remarque importante relativement à la loi 
log-normale dans le traitement plus loin du théorème central limite! 


Montrons que la fonction de probabilité cumulée correspond bien à une loi Normale si nous faisons le 
changement de variable mentionné précédemment: 


+o +o A2 +0 32 
[ Fax = [ 1 [00 ù [i(-(e 0 (7.410) 
(n] (e] 


0 CXN27T 2° o2x D 
en posant: 
y =in(x) = Der = dx =xdy (7411) 
dx x 
et: 


nous avons bien: 


1 +0 l (in(x)- gt) 1 +co 1 (7-4) 
x)dx = —E dx = —e 20 xd 
Ï @) a): 2 20° ae 
4e (r-x) ue 
1 7 
de NS 


nous tombons donc bien sur une loi Normale! 


L'espérance (moyenne) de X est donnée alors par (le logarithme népérien n'étant pas défini pour x « 0 
nous bornons l'intégrale à partir de zéro): 


E(X) = ECES El" Re a] 


(7.414) 
(u-uŸ 

= © | exp] — ———— +u | du 

li | 20° 


où nous avons effectué le changement de variable: 
u =in(x) & x =e",xdu = dx (7415) 


L'expression: 


2 
OUR à, (ais 


20° 


étant par ailleurs égale à: 


Page: 392/4839 


1 


2 2 
-——liu-lgu+e ii -(u+e) +?) (7417) 
> À pal pal 


la dernière intégrale devient donc: 


et où nous avons utilisé la propriété qui a émergée lors de notre étude de la loi Normale, c'est-à-dire que 
toute intégrale de la forme: 


(x—c'e î 
#0 _ 
le 27 Jx=oÿf2x (741) 
—© 


a donc toujours la même valeur! 


Pour le caclul de la variance, rappelons que pour une variable aléatoire X celle-ci est définie par: 
2 2 
V(X)=E(X)-E(XY (420 


Calculons Æ\X? | en procédant de manière similaire aux développements précédents: 
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0 . .: 
E(X°)= [ x? f(x)dx = : ch 


0 
vi (u-u)  : (u-uY 
= e* exp| —- — k“du = exp|- + 2u |du 
el | 2° TV2T 2 
= | 


ef L(lu-(ut2o )F | u+20 Ê +) 


TV27 29° 
/ 12 k 2 
1 (u -| +20 || (u+2a°) - y? 
me misn, va 
2 2 
(u+20 |) -yu 
Exp 2 
20 æ | (u-{(u+20?)) 
= —————————_—_—_—_— EX TT té 
oÿ27 Î P 20°? 


= EXP 


/ \2 
(a+20 | - 4° — Au +40 
2o° 


| = EXP | 2u+2o°)= gXH+T) 
où nous avons encore une fois le changement de variable: 

u =in(x) & x =e",xdu = dx (7.422) 
et où nous avons transformé l'expression: 


2 
_(u- Hi 


+9u (7.423) 
29 


sous la forme: 


1 j | 4. , 3 
——l\u-lgu+2e il -iu+2 1 +u?l (7424) 
>! pal pal À 


Donc: 


2 
CD = EC) EC = exp(2u+202)-| exp] 14 
2 (7.425) 


= exp(2u +2 )- EXp (24+0?) = 2H+O Ca - 1) 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction Log-Normale de 
paramètres (44, = (0,1): 
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07 


0 


Figure: 7.20 - Loi Log-Normale (fonction de distribution et de répartition) 


5.11. FONCTION UNIFORME CONTINUE 


Soient 4 < à. Nous définissons la fonction de distribution de la "fonction uniforme" (ou "loi uniforme") 
par la relation: 


Fr) = _—. Lao] (7.426) 


Nous avons donc pour fonction de répartition: 
PIX < x) = rendre enfer ie 


Il s'agit bien d'une fonction de distribution car elle vérifie (intégrale simple): 


RS (7.427) 


Î MOUSE lag] LP x = le | à] 42 eh FO 


—© 


b-a 
La fonction uniforme a par ailleurs pour espérance (moyenne): 


5 

1 Î 1 x 1 F-4 
XAx = —| =— 

—a° b-4a 2 : b-4 2 


u= E(X)= [Ga =- 
(7.428) 

1 (+a)(b-a)_a+b 

ba 2 2 


et pour variance en utilisant la relation de Huyghens: 
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b 2 b 2 
ra = 2) -RUP = [2 çex-(S) frrax-[#5t) 


F b-a® 
nu: (#) - 1 bé {sts) 
b-a 3 2 b-a 3 2 
_1 G=0 +ab te fete (7.429) 
ba 3 2 
2 2, _ 2/22 2 
host Lys se AE" +ab+a")-3(b" +2ab +a°) 
3 4 12 
_ 4h? +4ab +447 38° — 6ab- 3x7 b-2ab-a?  (b-a) 
: 12 EE 


Le] signifie qu'en dehors du domaine de définition [a,b] la fonction de distribution est nulle. Nous 


retrouverons ce type de notation dans certaines autres fonctions de distribution. 


Voici un exemple de tracé de la fonction de distribution et respectivement de répartition pour la loi 
Uniforme continue de paramètres {&,b)= (0, 1): 


1 


00! 


« 
e o o o o o Le “ o cs o o cs o - 


Figure: 7.21 - Loi uniforme continue (fonction de distribution et de répartition) 


Remarque: Cette fonction est souvent utilisée en simulation dans les entreprises pour signaler que la 
variable aléatoire a des probabilités égales d'avoir une valeur comprise dans un certain intervalle 
(typiquement dans les rendements de portefeuilles ou encore dans l'estimation des durées des 
projets). Le meilleur exemple d'application étant à nouveau le logiciel CrystalBall ou @Risk qui 
s'intègrent dans MS Project. 


Voyons un résultat intéressant de la loi Uniforme continue (et qui s'applique à la discrète aussi en fait.…..). 


Souvent j'entends des gestionnaires (qui se jugent de haut niveau) dire que comme une mesure a une 
probabilité égale d'avoir lieu dans un intervalle fermé donné, alors la somme de deux variables 
aléatoires indépendantes du même type aussi! 


Or nous allons démontrer ici que ce n'est pas le cas (si quelqu'un a une démonstration plus élégante je 


Page: 396/4839 


[v3.0 - 2013] 


suis preneur)! 


Démonstration: 


Considérons deux variables aléatoires indépendantes X et Y qui suivent une loi uniforme dans un 
intervalle fermé [0,a]. Nous cherchons donc la densité de leur somme qui sera notée: 


Z=X+F (7.430) 
Nous avons alors: 


a 0<x,y£<a 


1 
Jr = fr») = { (7.431) 


sinon 
avec la variable: 
O<z<2a (7.432) 


Pour calculer la loi de la somme, rappelons que nous savons qu'en termes discrets cela équivaut à faire 
le produit conjoint des probabilités (cf. chapitre de Probabilités) d'apparition des deux variables 
continues (se rappeler le même genre de calcul sous forme discrète!) 


C'est-à-dire: 


+0 
= | fe-nDfOob (45 


— 


Comme jfy(y)=1 si 0 £y£<a et 0 sinon alors le produit de convolution précédent se réduit à: 


fi)=[fre-pd (4 
(n] 


L'intégrant vaut par définition 0 sauf lorsque par construction 0 £z— y £4 où il vaut alors 1. 


Intéressons-nous alors aux bornes de l'intégrale dans ce dernier cas qui est bien évidemment le seul qui 
est intéressant. 


Faisons d'abord un changement de variables en posant: 


d'où: 
du =-dy (7.436) 


L'intégrale s'écrit alors dans cet intervalle après ce changement de variable: 


fz(z)= el iu - Î du (7.437) 
(s] £ 


£ 
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En se rappelant comme vu au début que 0 £ z < 24, alors nous avons immédiatement si z <0 et 
z > 2a que l'intégrale est nulle. 


Nous allons considérer deux cas pour cet intervalle car la convolution de ces deux fonctions 
rectangulaires peut se distinguer selon la situation où dans un premier temps elles se croisent 
(s'emboîtent), c'est-à-dire où 0 < z 4, et ensuite s'éloignent l'une de l'autre, c'est-à-dire 4 <z < 24. 


- Dans le premier cas (emboîtement) où 0 < z £a: 


Jztu) = APE: =Z (7.438) 


£—a 0 


où nous avons changé la borne inférieure à 0 car de toute façon f (#4) est nulle pour toute valeur 
négative (et lorsque 0 £z <a,z—& est justement négatif ou nul!). 


- Dans le deuxième cas (déboîtement) où 4 <z < 2a : 
£Z [e] 
Jz(u)= [ du = [ du =uf., =a-(z-a)=2a-z (7.439) 
£—a £Z—a 


où nous avons changé la borne supérieure à a car de toute façon f;{#) est nulle pour toute valeur 


supérieure (et lorsque 4 «z < 2a , z est justement plus grand que a). 
Donc au final, nous avons: 


Z si 0<z<a 
fz(z)=12a-z sia<z<2a (7.440) 


(e] sinon 


OIC.Q.F.D. 


Il s'agit d'un cas particulier, volontairement simplifié, de la loi triangulaire que nous allons voir de suite. 


Ce résultat (qui peut sembler contre intuitif) se vérifie en quelques secondes avec un tableur comme 
Microsoft Excel 11.8346 en utilisant la fonction ALEA.ENTRE.BORNES } et la fonction 
FREQUENCE( ) dans la version française. 


5.12. FONCTION TRIANGULAIRE 


Soient 4 «ec « b. Nous définissons la "fonction triangulaire" (ou "loi triangulaire") par construction 
basée sur les deux fonctions de distribution suivantes: 


2(x — a) 
P EE 
ae (x) @ — aÿ(c- a) [a,c] . 
__2@-27 | 
E 8 (x) = G-a6-0 À 
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où a est souvent assimilée à la valeur optimiste, c la valeur attendue (le mode) et b la valeur pessimiste. 


C'est effectivement la seule manière de l'écrire si le lecteur garde à l'esprit que le triangle de base c-a 
doit avoir une hauteur h valant 2/(c-a) telle que sa surface totale soit égale à l'unité (nous allons de suite 
le montrer). 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction triangulaire de 
paramètres (a,c,b)=(0,3,5): 


00 


+ — _— à 
Figure: 7.22 - Loi triangulaire (fonction de distribution et de répartition) 


La pente de la première droite (croissante de gauche) est donc bien évidemment: 


2 
(a) -a) (7.442) 
et la pente de la deuxième droite (décroissante à droite): 
_9 | 
——— (a 
G-aXe-o) 


Cette fonction est une fonction de distribution si elle vérifie: 
+o 
p= [(2.G+2:@)dr=1 (449 
—© 


Il s'agit dans ce cas de l'aire du triangle qui rappelons-le est simplement la base multipliée par la hauteur 
le tout divisé par 2 (cf. chapitre sur les Formes Géométriques): 


1 2 |. 
{6-0 1 (7.445) 
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Remarque: Cette fonction est beaucoup utilisée en gestion de projet dans le cadre de l'estimation 
des durées des tâches ou encore en simulations industrielles. La valeur a correspondant à la valeur 
optimiste, la valeur c à la valeur attendue (mode) et la valeur b à la valeur pessimiste. Le meilleur 
exemple d'application étant à nouveau le logiciel CrystalBall ou @Risk qui s'intègrent dans MS 
Project. 


La fonction triangulaire a par ailleurs une espérance (moyenne): 


2(x- a) atfx 2(b- x) 


+0 Ê 
RS 7-7 a ere 


a 
tJ 


: pas ( Ê jet) ei (br 1e) 
(b— a)(c — a) 2 , @-aïb-ce) (2 3 F 
Gé -gat)-(58 ai) 

 G-a)Cc-a) a) 3 F. 3 2 
(Ge -26) (lé) 
Demers PTE c) G 2 3 
” 
2 


3 
—€)| | - qu )+e +(c—-a) ae-[anr 5) 
cu 6 6 2 3 


(b 1e 
(—a)(c—a)(è-—c) 


A ZE has LE 


(b— PTE a)(b—c) 


je éd 


@—a)(c- Te 


3 
Ce ac Po. D à à . 23 
3 3 3 3 


= 2 


(7.446) 


3 5: 


(—a)(-a)(®-c) 


(-38 — 1341 — 1,35 +1,33 Hja) 


3 3 3 3 
(@—a)(—aXb—e) 


(- be — e+be - ab +cb + ac°) 


1 
3 (bac - abc) 
1 (a+b+ch(b-a)(c—-a)(b—c) 
3 

= 


(b—a)(c -a)(b—c) 
+b+c 
3 


et pour variance: 
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T 2x4 2x 
= [4 troc pr Je- pr 
1 c(-x° +86? u+4c°? a — 6e — 126 ia +124 fa) 14 (a — 4 ua +6) 
7 (b—a)(c-a) 6 (b—a)(c— a) (7.447) 
1 (3° +8 u+407b 60 12e ub+12/b) 1 #/(52-4ub+610) 
6 (b—-a)(c-a) 6 (b—a)(c — a) 
= +2ba- Lub+ sde +? a+ +aca- cute 


on remplace # par l'expression obtenue précédemment et on simplifie (c'est de l'algèbre élémentaire 
pénible): 


_. a? +b°+e? ab ac —be 
18 


(7.448) 


Nous pouvons montrer que la somme de deux variables aléatoires indépendantes chacune de loi 
uniforme sur [a,b] (donc indépendantes et identiquement distribuées) suit une loi triangulaire sur 
[2a,2b] mais si elles n'ont pas les mêmes bornes, alors leur somme donne un truc qui n'a pas de nom à 
ma connaissance. 


5.13. FONCTION DE PARETO 


La "fonction de Pareto" (ou "loi de Pareto"), appelée aussi "loi de puissance" ou encore "loi scalante" 
est la formalisation du principe des 80-20. Cet outil d'aide à la décision détermine les facteurs (environ 
20%) cruciaux qui influencent la plus grande partie (80%) de l'objectif. 


Remarque: Cette loi est un outil fondamental et basique en gestion de la qualité (cf. chapitre de 
Génie Industriel et Techniques de Gestion), Elle est aussi utilisée en réassurance. La théorie des 
files d'attente s'est intéressée à cette distribution, lorsque des recherches des années 1990 ont 
montré que cette loi régissait aussi nombre de grandeurs observées dans le trafic Internet (et plus 
généralement sur tous les réseaux de données à grande vitesse). 


Une variable aléatoire est dite par définition suivre une loi de Pareto si sa fonction de répartition est 
donnée par: 


& 
P(X< x)= 1-(2) (7.449) 
x 


avec x qui doit être supérieur ou égal à X 


La fonction de densité (fonction de distribution) de Pareto est alors: 
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k k 
d Z dx kr 4 1 À +4 k -k4 
JG) d | =) (=) 7 dx xÀ dx ) an 
k 
Lak kil pr Âm 
kx,,X x 


avec keR,et x2x,20 (donc x >0). 


La distribution de Pareto est donc définie par deux paramètres, x, et k (nommé "index de Pareto"). 


Cette une loi dite aussi à "invariance d'échelle" ou "loi fractale", terme définissant la propriété suivante: 


| Rd Ki or 
fleft.xl= hé (ce. x| =(c*] EE ET PA f{x)æ f(x) (451) 


La loi de Pareto est par ailleurs bien une fonction de distribution puisque étant connue sa fonction de 


répartition: 
+0 x ji : Ÿ . Ÿ | 
Froa-fi-(=) | -|-(&) }t-(2) ]-0-0-(+ J=1 (7.452) 


L'espérance (moyenne) est donnée par: 


+o +0 À +: l 
u=E(X)= [af(x)ar= [at ax = | dx 
Xp Xy 4 nm 
(7.453) 
en 1 | _&: 
Eh rh 4-1 


si & > 1. Si & <1, l'espérance n'existe pas. 


Pour calculer la variance, en utilisant la relation: 
2 2 
V(X) = E(X = E(XŸ (459 


Nous avons: 


+0 ko k 4 
a(x)= [7 (mare Ha Li D (455 
x L RL” 


sik>2.Sit<2, EX?) n'existe pas. 


Donc si # > 2: 
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En (is) k2 
= V(X)= = { ce) = ——"——— (7456) 


&—2 


Si & < 2, la variance n'existe pas. 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction de Pareto de 
paramètre (x,2x,,,4) = (x, 1,2): 


RS. 


— 


Figure: 7.23 - Loi de Pareto (fonction de distribution et de répartition) 


Remarque: Il faut noter que lorsque ; —- la distribution s'approche de £(x- x,,) où 4 est la 
fonction Delta de Dirac. 


Il existe une autre manière importante de déduire la famille des lois de Pareto qui permet de 
comprendre bien des choses concernant d'autres lois et qui est souvent présentée de la façon suivante: 


Notons x le seuil au-delà duquel nous calculons l'espérance de la quantité examinée, et E(Y) 
l'espérance au-delà de ce seuil x tel qu'il soit proportionnel (linéairement dépendant) au seuil choisi: 


EF) = ax +b (7457) 


Cette relation fonctionnelle exprime l'idée que la moyenne conditionnelle au-delà du seuil x est un 


multiple de ce seuil à une constante près, c'est-à-dire une fonction linéaire de ce seuil. 


Ainsi, en gestion de projets par exemple, nous pourrions dire qu'une fois une certain seuil de durée 
dépassé, la durée espérée est un multiple de ce même seuil à une constant près. 


Si une relation linéaire de ce type existe et est bien vérifiée, nous parlons alors de distribution de 
probabilité sous la forme d'une loi de Pareto généralisée. 


Considérons l'espérance mathématique de la fonction conditionnelle bayésienne donnée par (cf. 
chapitre de Probabilités): 
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1 + 


FO x2%) | {af ividy (7.458) 


Si nous notons F{y}, la fonction de répartition de f {y}, nous avons alors par définition: 


dF(y)= f{y)dy (7459) 
Dès lors: 


+ 
EE) = ———— [x4FO@) (7460 
De à ©) (7.460) 
et si nous définissons: 
Fy(x)= P(X 2 xp) =1-ÆFyx) (7461) 
que nous pouvons assimiler à la "queue de la distribution". 


Il vient: 


E(F) = = Pro (7.462) 


LE x) ; 


et donc nous cherchons le cas très particulier où: 


+0 


L { xaF(y) = ax+b (7.463) 


F( : 


c'est-à-dire: 


+ 
[ yaF (y) =iax+biÆF(x) (7.464) 


x 


En dérivant par rapport à x, nous trouvons: 
ae d 2 : 
—| lydF(y)|=—liax+biF(x)l (7.465) 
dx : dx 


La dérivée de l'intégrale définie ci-dessus sera la dérivée d'une constante (valorisation de l'intégrale en 
+00 ) moins la dérivée de l'intégrale de l'expression analytique en x. Nous avons donc: 


+ + 
+ î | mo) - an | mo) oo e PO Laçp+iax+p ÉD ac) 


Soit: 
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dF(x) 


BAC aF(x)+(ax+bi=—"" (7.467) 
dx dx 


et comme: 
dF=d{i-Fj=-@4F (7.468) 
Il vient: 


PUR) a+ iax+b EE (7.469) 
x 


Après simplification et réarrangement nous obtenons: 


aF(x)dx=-{x(@-1)+bidF(x) (7.470) 


qui est donc une équation différentielle en F{x). Sa résolution fournit toutes les formes de lois de 


Pareto recherchées, selon les valeurs que prennent les paramètres a et b. 


Pour résoudre cette équation différentielle, considérons le cas particulier où & > 1, = 0. Nous avons 


alors: 
aF(x)dx=-x(a-1)dF(x) (7.471) 
En posant: 
x = . (7.472) 
a] 
Nous avons alors: 
nr 1h (7.473) 
* & F(x) 
et donc: 
—In(x) = Ein F(x)i+ c® (7.474) 
Il vient: 
if li HOT Li FX) ge (7.475) 
e M =8k = eh e 
et donc: 
1 
(2) _ F(x)* .ce (7.476) 
x 
Nous avons: 
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k 
fe k 
Fe] = (=) (7.477) 
X Æ 
Il vient alors pour la fonction de répartition: 


k 
FD =1-F(x)=1- (=) (7.478) 


X 


Si nous cherchons la fonction de distribution, nous dérivons par x pour obtenir: 


=& 


(7.479) 
dx xt 


k 
*@= dF(x) a 


Il s'agit de la loi de Pareto que nous avons utilisée depuis le début et nommée "distribution de Pareto de 
type l" (nous ne montrerons pas sur ce site celles de type IT). 


Une chose intéressante à observer au passage est le cas de la résolution de l'équation différentielle: 
aF(x)dx=-{x(@-1+bidF(x) (7.480) 
lorsque & = 1, > 0. L'équation différentielle se réduit alors à: 
F(x)dx =-bdF(x) (7.481) 


Soit: 


re LL FC (7.482) 
b F(x) 


Après intégration: 
1 L 
——-x=iIn|#(x)) (7483) 
b 
et donc: 


1 
FG=er 


Si nous faisons un petit changement de notation: 
F=e # (7485) 
et que nous écrivons la fonction de répartition: 
F(D =1- F(D =1-e" #7 (7.486) 


Et en dérivant nous obtenons la fonction de distribution de la loi exponentielle: 
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F(x) = de ** (7487) 


Donc la loi exponentielle a une espérance conditionnelle seuil qui est égale à: 


Bob nb ut Sn ui 
a=l b=L À 4 


(7.488) 


Donc l'espérance conditionnelle seuil est égale à elle-même augmenté de l'écart-type de la distribution. 


5.14. FONCTION EXPONENTIELLE 


Nous définissons la "fonction exponentielle" (ou "loi exponentielle") par la relation de fonction de 
distribution suivante: 


P(D = 4 8" lnse| (7489) 


avec À > 0 qui comme nous allons de suite le montrer n'est au fait que l'inverse de la moyenne et où x 
est une variable aléatoire sans mémoire. 


Au fait la loi exponentielle découle naturellement de développements très simples (voir celui dans le 
chapitre de Physique Nucléaire par exemple) sous des hypothèses qui imposent une constance dans le 
vieillissement d'un phénomène. Dans le chapitre des Techniques de Gestion, nous avons aussi démontré 
en détails dans la partie concernant la théorie des files d'attentes, que cette loi était sans mémoire. 
C'est-à-dire que que la probabilité cumulée qu'un phénomène se produise entre les temps t et t+s s'il ne 
s'est pas produit avant est la même que la probabilité qu'il se produise entre les temps 0 et s. 


Remarques: 


R1. Cette fonction se retrouve fréquemment en physique nucléaire (voir chapitre du même nom) ou 
encore en physique quantique (voir chapitre du même nom) ainsi qu'en fiabilité (cf. chapitre de 
Génie Industriel) ou dans la théorie des files d'attentes (cf. chapitre de Techniques de Gestion). 


R2. Nous pouvons obtenir cette loi dans la version française de Micrsosoft Excel 11.8346 avec la 
fonction LOILEXPONENTIELLE ). 


Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie: 


+0 +0 +0 +0 
I F3 (xdx = [ A6 ax = À [ e Vax= À (- 3) el = (eo et ) =-(0—-1)=1 (7.490) 
—<© Û ( 


( 


La fonction exponentielle a pour espérance (moyenne) en utilisant l'intégration par parties: 
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+o 


+o +o 
= fr E,(x)dx = lÉg A'e "dx=-e x[” = [ 8 "dx 
ie (7.491) 


+0 +0 


- Fu = 1 
À 


: 
D À 


et pour variance (nous utilisons à nouveau ÿ(X) = E(X*)-E(X ÿ ) et il ne nous reste plus qu'à 


calculer: 
+o 
E(X*?) = De (7.492) 
Un changement de variable y = Àx = dy = Adx conduit à: 
1 +o 
E(X?) = 7 [+ (7.493) 
Une double intégration par parties donne: 


è è 
[FO Odt = f @ gt) - [F'OeOd 


L n : (7.494) 
pren = -ye 7 k + s La d =2 [7] + Li = 2 


D'où E(X?) = 2/ À? il vient dès lors: 
FIN À 
V(X)= ECX?)-E(X) = EN () =— (7495) 


Donc l'écart-type (racine carrée de la variance pour rappel) et la moyenne ont exactement la même 
expression! 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction exponentielle de 
paramètre 4 = 1: 
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1. 


9 SO + NN 6 # # © S © Sd = + À NO À + + 
Figure: 7.24 - Loi exponentielle (fonction de distribution et de répartition) 


Déterminons maintenant la fonction de répartition de la loi exponentielle: 


P(x<X)= [ae # à = Afe *a = À. Fe) 


= -(e* - 1) =1-6* 


] (7.496) 


Remarque: Nous verrons plus loin que la fonction de distribution exponentielle n'est qu'un cas 
particulier d'une fonction plus générale qui est la fonction du Khi-deux, cette dernière aussi n'étant 
qu'un cas particulier d'une fonction encore plus générale qui est la fonction Gamma. Il s'agit d'une 
propriété très importante utilisée dans le "test de Poisson" pour les événements rares (voir plus loin 
aussi). 


5.15. FONCTION DE CAUCHY 


Soient X,Y deux variables aléatoires indépendantes suivant des lois Normales centrées réduites 
(variance unité et espérance nulle). La fonction de densité est donc donnée par: 


_# 
1 e 2 (7.497) 


Fr) = Jr = F 


La variable aléatoire: 
4 


(la valeur absolue intervient dans l'intégrale lors du changement variable) suit une allure caractéristique 
appelée "fonction de Cauchy" (ou "loi de Cauchy") ou encore "loi de Lorentz". 


de (7.498) 


Déterminons sa fonction de densité f. Pour cela, rappelons que f est déterminée par la relation 
(générale): 


Page: 409/4839 


[v3.0 - 2013] 


VteR,?P(T<i) )= Jr (7.499) 


Donc (application du calcul intégral élémentaire): 
d | 
HO Fil al <£) (7.500) 


dans le cas où f est continue. 


Etant donné que X et Y sont indépendants, la fonction de densité du vecteur aléatoire est donnée par un 
des axiomes des probabilités (cf. chapitre de Probabilités): 


HE fr) fo) (7.501) 


Donc: 


P(T<#) NC 


= P(X «4|r|) g Fr) Fr O)dxdy (7.502) 


où donc D ={(2,y}|x <£: y}. 


Cette dernière intégrale devient: 


+e tp 
[70 = (l (l Jr) fe)dxdy (7.503) 


Faisons le changement de variable x =4‘|y| dans l'intégrale intérieure. Nous obtenons: 


PIT<E)= [ [Ath #0) did - fie DD: O)' pdd (7.504) 
Donc: 
#ko "y ss #) 
JE) = FPT ê) = [ae bb: #0: ll D [e 'd (7.505) 


C'est maintenant que la valeur absolue va nous être utile pour écrire: 


+ a +) 0 -y247#) to -y2(1241) 
JE) = — dy=-— fe 2 dy+— fe 72 dy (7.506) 
HO 0 bv|dy 7x | pd + l pay 


Pour la première intégrale nous avons: 
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2 (+2 #) 


(El 
Î 241 +1 # 


-y2 (2 #1) 
2 


=0 (7.507) 


Il ne reste donc plus que la seconde intégrale et en faisant le changement de variable » = y° , nous 
obtenons: 


+0 -v(12+l) 24 |" 


Er à 2 0 2 UE (7.508) 


Ce que nous noterons par la suite (afin de respecter les notations adoptées jusqu'à présent): 


P(x) -— (7.509) 
mm 1F= 


et qui n'est d'autre que la fonction de Cauchy. 
Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie (cf. chapitre de Calcul Différentiel 


et Intégral): 


Lux 
1+x FT 


[ro = If (arctan(+æ) — arctan(-æ)) =1. (7.510) 


Voici un exemple de tracé de la fonction de distribution de Cauchy: 


Figure: 7.25 - Loi de Cauchy (fonction de distribution) 


La fonction de Cauchy a pour espérance (moyenne): 
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Li = fr PO - = 


— 
27 


1% x 
re si Le a] 
(a+ x . +In(l +x D | }= = (In(D -In(s) +In(c) —In(1)) (7.511) 


= (ins) +In(s)) = 


Attention!!! Les calculs précédents ne donnent pas zéro au fait car la soustraction d'infinis est non pas 
nulle mais indéterminée! La loi de Cauchy n'admet donc pas d'espérance rigoureusement parlant! 


Ainsi, même si nous pouvons bricoler une variance: 


Lo. 1 1 
dx = [ x2: P(x)dx = — dx == f(- dx = 
[@-2 Ga [* dre [rare [One 
, (7.512) 
—" lim [a je lim (£ — arctan(£)) = + 
JT + 


celle-ci est absurde et n'existe rigoureusement parlant pas puisque l'espérance n'existe pas...! 


5.16. LOI BÊTA 


Rappelons d'abord que la fonction Gamma d'Euler est définie par la relation (cf. chapitre de Calcul 
Différentiel Et Intégral): 


+ 


l'z) = [° "x" dx (7.513) 


Nous avons démontré (cf. chapitre de Calcul Différentiel Et Intégral) qu'une propriété non triviale de 
cette fonction est que: 


l(z+D=Zz'T(Z) (7.514 


Posons maintenant: 


D'(a) TE) = lim (fe x y dry os 
25 +0 È ) 


où: 


: {x y) 20,y20,x+y< R) (7.516) 


DE 


En faisant le changement de variables: 


nous obtenons: 
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A 4 
Fa): T() = lim [ex éd = lim [ee [œ — viva (7.518) 


Pour l'intégrale interne nous utilisons maintenant la substitution v = &°£ (0 £ £ £ 1) et nous trouvons 
alors: 


2 4 z 1 
F(a):T() = lim [” { [ce - v)EP v)du = din pe [OR 
A 2,8) (7.519) 


= B(a,b) ferustsau = B(a,b)' Ta +b) 


La fonction B qui apparaît dans l'expression ci-dessus est appelée "fonction bêta" et nous avons donc: 


Fab (a): (8) 
’ (a +b) 


(7.520) 


Maintenant que nous avons défini ce qu'était la fonction bêta, considérons deux paramètres 

a > 0,à > 0 et considérons la relation particulière ci-dessous comme étant la "fonction de distribution 
bêta" ou "loi bêta" (il existe plusieurs formulations de la loi bêta dont une très importante qui est 
étudiée en détails dans le chapitre de Techniques de Gestion): 


xl ( = F0 


75 


“ox! (7-52) 


où: 


1 
B(a,b} = FE Q- x} lax| (7.522) 


Nous vérifions d'abord que que # ,(x} est bien une fonction de distribution (sans trop aller dans les 
détails): 


+0 + xt ( _ F4 + xei ( _ D 
2 ,Ca)dx = [2 17, dx = [ — 1, , dx 
Î 22 (x) Î Bab MA ll LE Jo 
(7.523) 
1e Ë l l 
= ri La 1{- x)°-lax = a BG.) = ae =] 
Maintenant, calculons son espérance (moyenne): 
_ »1,._ P(@a+1b) 
= PF dx = re NT em 
A le 2.» (x)dx Fab [ (x) dx FD . 
/.524 


_T(@+1):T@) Ta+b) _ a 


T(a+b+l) Ta) T() (a+b) 


en utilisant la relation: 
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F(z+D=2Zz"T(Z) (7.525) 


et sa variance: 


+o 1 
oi = fG - 7: f(x)dx = Th - 4} x - x) ax 


B(a,b) 
1 1 1 l 
= fat x) ox - Ouf xt x) tax + 8 (xt - x) ax (7.526) 
Ba,b) 
1 2 2 1 2 
= "| B(a +2,b) - 24 B(a,b) + ° B(a,b)) = ————: {Ba +2,b) - °B(a,b 
FES (B(a + 2,5) - 24° B(a,b) + 4 B(a,b)) NS (Ba +2,b)- 4 B(a,b)) 
En sachant que l'fz +1)=z:l(z) et que B(a,b} = DS nous trouvons: 
a 
_#A'(a+l), 
B(a + 2,b) atbtl B(a,b) (7.527) 
et donc: 
Pare). 3. _ (7.528) 
at+b+1 (a +b)*(a+b+1) 


Exemples de tracés de la fonction pour {&,b) = (0.1,0.5) en rouge, (4,b) = (0.3,0.5) en vert, 
{a,b) = (0.5,0.5) en noir, (a,à) = (0.8,0.8) en bleu, (&,b) = (1, D en magenta, {a,b) = (11.5) en cyan, 
{a,b) = (1,2) en gris, (&,b) = (1.5,2) en turquoise, (a,b) = (2,2) en jaune, (4,b) = (3,3) en couleur or: 


(a 02 0.4 06 08 1 
x 


Figure: 7.26 - Loi bêta (fonctions de distribution) 


et tracé de la fonction de distribution et répartition de la loi bêta de paramètres (4,) = (2,3): 
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Le | ) Le «a + 
[= [=] So [=] o s La _ =] [=] o o [=] [=] — La 


Figure: 7.27 - Loi bêta (fonction de distribution et de répartition) 


5.17. FONCTION GAMMA 


La fonction Gamma d'Euler étant connue, considérons deux paramètres 4 > 0, 4 > 0 et définissons la 
"fonction Gamma” (ou "loi Gamma") comme étant donnée par la relation: 


x e —AX 


2 (x) = RE Lot 


7 (7.529) 
[kg Le 4% x 


En faisant le changement de variables ; = 4x nous obtenons: 


[ete = — (7.530) 


et pouvons alors écrire la relation sous une forme plus classique que nous trouvons fréquemment dans 
les ouvrages: 


BC = ©" À" lsofl (7531) 


et c'est sous cette forme que nous retrouvons cette fonction de distribution dans la version française de 
Microsoft Excel 11.8346 sous le nom LOIGAMMA( } et pour sa réciproque par 
LOI.GAMMA.INVERSE( ). 


Si 4 e N, la loi Gamma au dénominateur devient (cf. chapitre de Calcul Différentiel Et Intégral) la 
factorielle (4 —1il. La fonction Gamma peut alors s'écrire: 


x271 22 gx (x ai 


= gg À (7.532) 
(a—1il (a-1il 


Pat = 


Cette forme partiuclière de la fonction de distribution de la fonction Gamma s'appelle alors la "fonction 
d'Erlang" que nous retrouvons naturellement dans la théorie des files d'attentes et qui est donc très 
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importante dans la pratique! 


Remarque: Si 4 =1 alors L'{&) =1 et ,2-1 _ j et nous retombons sur la loi exponentielle. 


Ensuite, nous vérifions avec un raisonnement similaire en tout point à celui de la fonction bêta que 
Æ ,(x) est une fonction de distribution: 


Æ,(x)dx =1 (7533) 


d—, 


Exemples tracés de la fonction de distribution pour (&, 4) = {(0.5,1) en rouge, (a, 4) = (1,1) en vert, 
(a, À) = (2,1) en noir, (a, À) = (4,2) en bleu, (a, À) = (16,8) en magenta: 


0.8 


0.6 


0.2 


Figure: 7.28 - Loi Gamma (fonction de distribution) 


et tracé de la fonction de distribution et répartition pour la fonction Gamma de paramètres 
(a, À) = (4,1): 
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à 


01 


01 


Figure: 7.29 - Loi Gamma (fonction de distribution et de répartition) 


La fonction Gamma a par ailleurs pour espérance (moyenne): 


A° 
T'{a) 


# Tati) _ # .aF(a) _a 
Die 2 Lier 2% 4 


= fr fc - pee — 


et pour variance: 
2 + 


id _ 2, _ À … 2 ,.a—1 -4x 
T pi I" ° FÜR)dx @ [s HV dr 


. : | ds + 4° le = are] 
(a: 


: (7.535) 
_Æ flta+2), 2T@) . T@+D}_ 1 _- 

T'(a) 22 ui pa ae Ta) À ; Fe (Fa +2)+a°T(a)-2aT(a +1) 
= 1 ‘a: 2 524 = 

AT (Ca +1): a: (a) +a?T(a) - 2a°T(a)) F 


Démontrons une propriété de la fonction Gamma qui nous servira à établir plus tard dans ce chapitre, 
lors de notre étude de l'analyse de la variance et des intervalles de confiance sur des petits échantillons, 
une autre propriété extrêmement importante de la loi du Khi-deux. 


Comme nous le savons, la fonction de densité d'une variable aléatoire suivant une fonction Gamma de 
paramètres &,A > 0 est: 


—Ax al 
Pa) = f()= EU 


(a) 


avec (cf. chapitre de Calcul Différentiel Et Intégral) la fonction Gamma d'Euler: 


À, gt (7536) 


Ko 
T'(a)= [ex x (7.537) 
(a) 
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Par ailleurs, quand une variable aléatoire suit une fonction Gamma nous la notons: 


— y(a,4) (7.538) 
Soient X, Y deux variables indépendantes. Montrons que si X = y{p,A) et F = y{q,A) alors: 
X+Y=7y{p+g.4) (753) 


Notons f la fonction de densité du couple (X,Y), f; la fonction de densité de X et f; la fonction de 
densité de Y. Vu que X, Y sont indépendantes, nous avons: 


JG Y)= fr) fr) (7.540) 
pour tout x,y 0. 


Soit Z = X +F. La fonction de répartition de Z est alors: 


F(z)=P(Z<z)=P(X +7 <2)= [frame Gun 
D 
où D={(xy)|x+y<2}. 


Remarque: Nous appelons un tel calcul une "convolution" et les statisticiens ont souvent à 
manipuler de telles entités ayant à travailler sur de nombreuses variables aléatoires qu'il faut 
sommer ou même multiplier. 


En simplifiant: 
HKoOz—x 
F(2)= [ [ fr) HO) 050) 


—© —(0 


Nous effectuons le changement de variable suivant: 


Le jacobien est alors (cf. chapitre de Calcul Différentiel Et Intégral): 


x x 
a % l 
= 6x © - 1 (7.544) 
œ | F1 
Ex © 


Donc avec la nouvelle borne d'intégration s= x+y = x+(z-x)=Zz nous avons: 
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He z z ko 
F(z)= [ [ fr Gr). fyts- Dasdx = [ [Ar forte - rats (7.545) 


Si nous notons g la fonction de densité de Z nous avons: 


£z +o £ 
F(z)= [ [ fr) fe- maxds= | gsjds (7.540 


Par suite: 
+0 
g(s)= [ Jr) futs—x)dx (7.547) 


fx et jy étant nulles lorsque leur argument est négatif, nous pouvons changer les bornes d'intégration: 


5 
g(s)= [rt - fyls— x)dx pour s>0 (7.548) 
0 
Calculons g: 


[ x771 (s- xÿ” dx (7.549) 
Û 


Après le changement de variable x = st nous obtenons: 


Far P Rs 


TAN TAN p+921 
T(?) T(4) s B(p,g) (7.550) 


1 
g(s}= PT (NT ae = 
0 


(»} T4) 


où B est la fonction bêta que nous avons vue plus haut dans notre étude de la fonction de distribution 
bêta. Or nous avons aussi démontré la relation: 


l'(p)l (4) 
B(p,a) = (7.551) 
P{p+g) 
Donc: 
4745 ÂÀs 


SPA (7552) 
Ce qui finalement nous donne: 
Z 2 4 PR 1 
P(Z£Sz)=P(X+Y <z}= | gfods= | SP GS (7553) 
esa-rerrren-frou [PES 


Ce qui montre que bien que si deux variables aléatoires suivent une fonction Gamma alors leur somme 


est aussi telle que: 
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X+Y=y{p+g.4) (7554 


Donc la fonction Gamma est stable par addition de même que le sont toutes les lois qui découlent de la 
loi Gamma et que nous allons aborder ci-après. 


2.18. FONCTION DE KHI-DEUX (OU DE PEARSON) 


La "fonction de Khi-deux" (appelée aussi "loi du Khi-deux" ou encore "loi de Pearson") n'est par 
définition qu'un cas particulier de la fonction de distribution Gamma dans le cas où 4 = &/2 et 
A = 1/2, avec k entier positif: 


1 k/2-1 -x/2 
XX eg à | 
1 ( ) PLE T(&/ 2) [0,+0[ 


(7.555) 


Cette relation qui relie la loi du Khi-deux à la loi Gamma est importante dans la version française de 
Microsoft Excel 11.8346 car la fonction LOI.KHIDEUX( ) donne le seuil de confiance et non la loi de 
distribution. Il faut alors utiliser la fonction LOI.GAMMA ) avec les paramètres donnés ci-dessus (à 
part qu'il faut prendre l'inverse de 1/2, soit 2 comme paramètre) pour avoir la fonction de distribution et 
de répartition. 


Le lecteur qui voudra vérifier que la loi du Khi-2 est un cas particulier de la loi Gamma, pourra écrire 
dans la version française de Micrsoft Excel 14.0.6123: 


=LOI.KHIDEUX.N(2*x;2*k; VRAI) 
=LOIGAMMA.N(x;k;1; VRAD) 


Tous les calculs faits auparavant s'appliquent et nous avons alors immédiatement: 
g=k,o=2k (7.556) 


Exemples de tracés de la fonction de distribution pour # =1 en rouge, # = 2 en vert, k = 3 en noir, 
& = 4 en bleu: 
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y1 


x 


Figure: 7.30 - Loi du Khi-deux (fonctions de distribution) 


et tracé de la fonction de distribution et respectivement de répartition pour la loi du Khi-deux pour 
&=2: 


[Ni Ô «+ d D - 


ee ee _ _ ' _ — _ — 


Figure: 7.31 - Loi du Khi-deux (fonction de distribution et de répartition) 
Dans la littérature, il est de tradition de noter: 
2 = 2 
X = Yx ou X = 7° (&) (7557) 


pour indiquer que la distribution de la variable aléatoire X est la loi du Khi-deux. Par ailleurs il est 
courant de nommer le paramètre k "degré de liberté" et de l'abréger "ddl". 


La fonction Khi-deux découle donc de la loi Gamma et par ailleurs en prenant # = 2 nous retrouvons 
aussi la loi exponentielle (voir plus haut) pour 4 = 1/2: 


Page: 421/4839 


[v3.0 - 2013] 


B(x x)= rx 12 = ge *!à 


l 
— 1, (7.558) 
Par ailleurs, puisque (cf. chapitre de Calcul Différentiel Et Intégral): 
T{1/2)= 47 (7.559) 


la loi du Khi-deux avec k égal à l'unité peut s'écrire sous la forme: 


1 1/2-1 -x/2 il "2 
2 (X)= —— 8e = 


= x = 1 560) 
227 (1/2) 2 is DS 


à || 


Enfin, terminons avec une propriété assez importante dans les tests statistiques que nous étudierons un 
peu plus loin et particulièrement dans les invtervalles de confiance des événementes rares. 
Effectivement, le lecteur pourra vérifier dans un tableur comme Microsoft Excel 14.0.6123 (version 
française), que nous avons: 


= LOLPOISSON.N(x € N: 4 VRAI) 
=1-LOLKHIDEUX.N(2*4,2*(x+D: VRAD (7.561) 
=]-LOLGAMMA.N(ye x+ 1 VRAD 


Il nous faut donc démontrer cette relation entre loi du khi-2 et loi de Poisson. Voyons cela en partant de 
la loi Gamma: 


Este A lgset (7562) 


Si nous posons 4 = 1/2 et & = & / 2 nous avons alors la loi du khi-2 à k degré de libertés: 


1 M2-1 -x/2 
C2) = ———————— x" el (7.563) 
212 : T(&{ 2) [0,+0[ 
Maintenant, rappelons que nous avons vu dans le chapitre de Suites Et Séries, la série de Taylor 
(Maclaurin) avec reste intégral à l'ordre n-1 autour de 0 jusqu'à 4 suivante: 


” n-1 jù À (al n-1 3x À (as 
et = NS 8" (0)+ ete 2 = + | 0" (6) — 2 à 
rl - {x—1l en pl (xD 
k=0 0 k=0 û 
(7.564) 
ms DL 0 n-1 nl 3x À à a 
— D —-fe au UT => — +fe . — 
u=-t;" &l 2 {x—1l &=0 À 0 {x— ll 
Nous multiplions par ,-4: 
ss " ml 3% À : 7 n-1 3x : À a 
ü 2e "| > +127 g|=H1= > —e + “au (7.565) 
nl {xD sn - {ll 
k=0 """ 0 ‘ k=0 0 | 


Page: 422/4839 


[v3.0 - 2013] 


Et donc: 
n-| a 
Se g À = fe Le M à (7.566) 
0 À ny &-Dl 


Or, concentrons-nous sur le terme: 


À a 
le du (7567) 
(nx—Dl 
et faisons un premier changement de variable: 
I ee 7 . 
Le du ——— 77 0 0e = | ——— re x (7.568) 
5 éd x?) 2 (al Le 1)! 


et un second changement de variable (attention! le k dans le changement de variable n'est pas le même 


que celui de la somme de la loi de Poisson..): 


; 2 2 
? til É - ) | 
2 


Or, nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que si x est un entier 
strictement positif: 


Î le x = 


EYE mr (7.569) 


© mr, js 
OS, ns 


Il vient alors: 


Nous avons finalement: 
À 


f 1 k/2-1 -x12 2 
rer À 
0 


où nous retrouvons donc bien la fonction de distribution du khi-2 sous l'intégrale! Donc au final: 


nl ar n À 1 
2 Le _ 1— | ——— 27 te ax (7.573) 
K=0 € JU 


D'où la relation donnée plus haut pour les tableurs! 
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5.19. FONCTION DE STUDENT 


La "fonction de Student" (ou "loi de Student") de paramètre k est définie par la relation: 


avec k étant le degré de liberté de la loi du Khi-deux sous-jacente à la construction de la fonction de 
Student comme nous allons le voir. 


Indiquons qu'elle peut aussi être obtenue dans la version français de Microsoft Excel 11.8346 à l'aide 
des fonctions LOI.STUDENT } et sa réciproque par LOI.STUDENT.INVERSE ). 


Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement 
mais bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc 
indirectement.….): 


+o 

[A Gax =1 (7.575) 

LA 
Voyons la démonstration la plus simple pour justifier la provenance de la loi de Student et qui nous sera 
en même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin. 


Pour cette démonstration, rappelons que: 


R1. Si X, Y sont deux variables aléatoires indépendantes de densités respectives f,,.f,, la loi du couple 
(X, Y) possède une densité f vérifiant (axiome des probabilités!): 


S(er)= f(x) 0) (07576) 


R2. La loi N(0,1) est donnée par (voir plus haut): 


1 
1(0= ee" (577 
R3. La loi r est donnée par (voir précédemment): 


_ 1 742 7! nt 
F0); Ÿ (7.578) 


pour y20 et h#2>1. 


R4. La fonction I” est définie pour tout æ > 0 par (cf. chapitre de Calcul Différentiel et Intégral): 
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et vérifie (cf. chapitre de Calcul Différentiel et Intégral): 


pour æ> 2. 


Ces rappels étant faits, considérons maintenant X une variable aléatoire suivant la loi N(0,1) et Y une 
variable aléatoire suivant la loi 72. 


Nous supposons X et Y indépendantes et nous considérons la variable aléatoire (c'est à l'origine l'étude 
historique de la loi de Student dans le cadre de l'inférence statistique qui a amené à poser cette variable 
dont nous justifierons l'origine plus loin): 


DEP EE à (7.581) 


VF Fin 


Nous allons montrer que T' suit une loi de Student de paramètre n. 


Démonstration: 


Notons F et f les fonctions de répartition et de densité de Tet f,,7,.f les fonctions de densité de X, 
Y et (X,Y) respectivement. Nous avons alors pour tout £ IR : 


#=P(r<s)= (Ts) [fr () dxdy = IEAG )-fÜy)dr (7582) 


D=4(xy7)eRxR" De (7.583) 
A 


la valeur imposée positive et non nulle de y étant due au fait qu'elle est sous une racine et en plus au 
dénominateur. 


Ainsi: 
ST" 
)=[f40 y) dxdy = J40) J Jx (x) dxdy = [40) CENTRES (7.584) 


où comme À suit une loi N(0,1): 


x 


est la fonction de répartition de la loi Normale centrée réduite. 


Nous obtenons alors la fonction de densité de T'en dérivant F: 
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f()=F'()= Tls ORACUTEONT QE 


car (la dérivée d'une fonction est égale à sa dérivée multipliée par sa dérivée intérieure): 
aœ(sfy tn 
ee, (: ATOE (7.587) 


Donc: 


f(e)= TÎ40) OPACIIRORT" 


# 
2 
- CR 
l l _»2.31 | - 
[rca »12,3 & 2 dy 
0 
apr (7.588) 


e "y 7. e TZ {y 


AT ni 2 rl 


1 +0 fix 7) 2] 


= 2 24 
PT (ai 2) arr [< er 


En faisant le changement de variable: 


dy = — du 
| 1+— 
2 £) A 

u=—|1+—|—= (7.589) 
2 ñ f 
1+— 
# 
= ü 
di 


nous obtenons: 


a Ps Ce) je 
J(e) UE een er = je u * du UE Ra A Er — 
(+) (7.590) 


Le 


ce qui est bien la loi de Student de paramètre n. 
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OIC.Q.FD. 


Voyons maintenant quelle est l'espérance de la loi de Student: 


T= Re (7.591) 


Nous avons: 
1 
E(T)= (ex) a+ (7.592) 
Mais 7) existe si et seulement si x > 2. En effet pour # = 1: 
N;2 
E LE 2 (y)dy = a  . (7.593) 
FF) 1" FT GE #12) 


et: 


[e"yTdy=27 [eu 7 du= 2Frfet) <40 (7.595) 
0 


Ainsi pour # = 1, l'espérance n'existe pas. 


Donc pour # >2: 
l 
E(T)=\n E(X a) 7.596 
(T) C ) F (7.596) 
Voyons maintenant la valeur de la variance. Nous avons donc: 
W(T)= E(T) _ E(T) (7.597) 


Discutons de l'existence de Æ (2° }: Nous avons trivialement: 


2 


E(T‘)= fe =rE(X°) af?) (7.598) 


X suit une loi normale centrée réduite donc: 
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1 
Pour ce qui est de a?) nous avons: 


(+) [,# (y) 34 IT (#4 2) Je Ÿ 34 


2T'(#/ 2) 


où nous avons fait le changement de variable 4 = y/2. 


(7.600) 


Mais l'intégrale définissant r{s- ) converge seulement si # > 3. 


Donc Æ (T°) existe si et seulement si x > 3 et vaut alors selon les propriétés de la loi Gamma d'Euler 


démontrées dans le chapitre de Calcul Différentiel et Intégral: 


Ainsi pour # >3: 


(7.601) 


Il est par ailleurs important de remarquer que cette loi est symétrique par rapport à 0! 


Exemple de tracé de la fonction de distribution et répartition pour la fonction de Student de paramètre 


k =3: 
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Figure: 7.32 - Loi de Student (fonction de distribution et de répartition) 


5.20. FONCTION DE FISHER 


La "fonction de Fisher" (ou "loi de Fisher-Snedecor") de paramètres k et 1 est définie par la relation: 


& 

HE ar 
PO = ( #x) 2 | (7.60) 
16016 
À 2 


si x > 0 . Les paramètres k et 1 sont des entiers positifs et correspondent aux degrés de liberté des deux 
lois du Khi-deux sous-jacentes. Cette distribution est souvent notée F;; ou F(k,l) et peut être obtenue 


dans la version française de Microsoft Excel 11.8346 par la fonction LOL.F( ). 


Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement 
mais bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc 
indirectement..): 


+o 
[ F:(x)dx=1 (7.604) 
0 


Voyons la démonstration la plus simple pour justifier la provenance de la loi de Fisher et qui nous sera 
en même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin. 


Pour cette démonstration, rappelons que: 


R1. La loi É est donnée par (voir plus haut): 


x 
--1l 
7 (7.605) 


1 
FO) re) 


pour y20 et #21. 
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R2. La fonction T° est définie pour tout æ > 0 par (cf. chapitre de Calcul Différentiel et Intégral): 


r(a)= [ex ax (7.606) 
0 


Soient X, Y deux variables aléatoires indépendantes suivant respectivement les lois 7 et 7À . 


Nous considérons la variable aléatoire: 


_ Ain 


Îm 


(7.607) 


Nous allons donc montrer que la loi de T est la loi de Fisher-Snedecor de paramètres n, m. 


Notons pour cela F'et f les fonctions de répartition et de densité de Tet ÿ,,/7,,f les fonctions de 
densité de X, Y et (X,Ÿ) respectivement. Nous avons pour tout £ e IR : 


F()=P(TSO= (TT < c)- EX x, y) dxdy = EG) (y)dxdy (7.608) 


où: 
+ + RÈ 
D= f(x.) 8R x ae») (7.609) 
FR 


où les valeurs positives imposées proviennent à l'origine d'une loi du Khi-deux pour x et y. 
Ainsi: 
xt 
7 
)=[[ 409 »)dxdy = [6 DE Jardy (510 


Nous obtenons la fonction de densité de T'en dérivant F. D'abord la dérivée intérieure: 


f(4)= _ [FA és pr (7.611) 
9 


nous avons alors: 
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PO + l y, 771 Il -E ( F à 
=— | — 0 — 0 "| — 
mi TM) ? 2T(n2) Um’) °? 
1 nn 2 Éa 21 
|» ee | d 
PT (ni 2) FFT Gr nl ? M 
LS ” 214 n, *, *, (7.613) 
- mi -pl2,,77 , 2m .,2 
= TT | e e 7e) 
2" T(x/ 2) rs) J ? nu 


LC: 
L: 


2 


En faisant le changement de variable: 
3 fe EE  — 
2 mi # # (7.614) 
(is) fit 


nous obtenons: 


À " a+ 
f(é)= —#—[#) ne [ 17 "4 
tm) 22 | [74 | Le . TR 
2 2 1+—6 (=) 
2 
2r(re ». Lam 2r(re 1, La 
ma 2 Aé \2 # 2 ma 2 A = # 2 
= — 1+—4 = = #2 |1+—4 (7.615) 
2 2 ë r 
rene) H+M 
= 2 Am) (je, 7 
2 À 


OIC.Q.F.D. 


5.21. FONCTION DE BENFORD 


Cette distribution aurait été découverte une première fois en 1881 par Simon Newcomb, un astronome 
américain, après qu'il se fut aperçu de l'usure (et donc de l'utilisation) préférentielle des premières pages 
des tables de logarithmes (alors compilées dans des ouvrages). Frank Benford, aux alentours de 1938, 
remarqua à son tour cette usure inégale, crut être le premier à formuler cette loi qui porte indûment son 
nom aujourd'hui et arriva aux mêmes résultats après avoir répertorié des dizaines de milliers de données 


(longueurs de fleuves, cours de la bourse, etc.). 
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Seule explication possible: nous avons plus souvent besoin d'extraire le logarithme de chiffres 
commençant par 1 que de chiffres commençant par 9, ce qui implique que les premiers sont "plus 


nombreux" que les seconds. 


Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son 
hypothèse. Rien de plus simple: il se procure des tables de valeurs numériques, et calcule le 
pourcentage d'apparition du chiffre le plus à gauche (première décimale). Les résultats qu'il obtient 


confirment son intuition: 


30.1 % 
17.6 % 


125% 


9.7 % 


7.9 % 


6.7 % 


5.8 % 


DIV U R WII 


0.1 % 


9 


46% 


Tableau: 7.10 - Probabilité d'apparition d'un chiffre selon la loi de Benford 


A partir de ces données, Benford trouve expérimentalement que la probabilité cumulée qu'un nombre 
commence par le chiffre n (excepté 0) est (nous allons le démontrer plus loin) donnée par la relation: 


appelée "fonction de Benford" (ou "loi de Benford"). 


Voici un tracé de la fonction précédente: 


l 
P(x) =logs ‘ +) (7.616) 
ñ# 
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0.9 
0.8 
0.7 
0.6 


0.5 


0.3 


(a) 2 4 ô 8 
x 


Figure: 7.33 - Tracé de la fonction de Benford (fonction de répartition) 


Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-à-dire à 
des chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur une liste de 
chiffres tirés au hasard. 


La loi de Benford a été testée sur toutes sortes de tables: longueur des fleuves du globe, superficie des 
pays, résultat des élections, liste des prix de l'épicerie du coin. Elle se vérifie presque à tous les coups. 


Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix d'un 
supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les mêmes prix 
convertis en Euros. 


Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente. Puis une 
démonstration générale en a été donnée en 1996, qui fait appel au théorème de la limite centrale. 


Aussi surprenant que cela puisse paraître, cette loi a trouvé une application: le fisc l'utilise aux 
Etats-Unis pour détecter les fausses déclarations. Le principe est basé sur la restriction vue plus haut: la 
loi de Benford ne s'applique que sur des valeurs ayant une signification physique. 


S'il existe une distribution de probabilité universelle P(n) sur de tels nombres, ils doivent être invariants 
sous un changement d'échelle tel que: 


Pen) = f(k&)P(n) (7.617) 
Si: 
[PCe)dn =] (7.618) 


alors: 
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[PGor)dn =1]/£ (7.619) 
et la normalisation de la distribution donne: 
f&)=1/X (7.620) 


si nous dérivons P{kx) = f(k)P(x) par rapport à Z nous obtenons: 


à di 
EN 
a 0 Er 0) 


à 1 
nP'{n) = Pin) . (7.621) 
nP'{m) = POS 
en posant # = 1 nous avons: 
nP\{(n)=-P(#) (7.622) 
Cette équation différentielle a pour solution: 


P(n) = 1/2 (7.623) 


Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de probabilité 
(elle diverge) et deuxièmement, les lois de la physique et humaines imposent des limites. 


Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si le nombre 


décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la 


probabilité que le 


premier chiffre non nul (décimal) soit D est donnée par la distribution logarithmique: 


D+l 
[ P(n)dn 
= TD —— 


PB (7.624) 


F (a )dn 


Les bornes de l'intégrale sont de 1 à 10 puisque la valeur nulle est interdite. 


L'intégrale du dénominateur donne: 
1 0! 
15772 = 57 =]n(10)-In(l) =in(10) (7.625) 
# 


L'intégrale du numérateur donne: 


241 Da 
[ P(a)dn = [ An =Iin(D +1)-In(D) = in ai à (7.626) 
# D 


Ce qui nous donne finalement: 
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nl 2*11 pl1+21 
P = : D] (7.627) 
7 In(l0) In{10) 


De par les propriétés des logarithmes (voir le chapitre d'Analyse fonctionnelle) nous avons: 


jl 
2, = 1+— 
D | 5) 


Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par changement 
d'échelle mais également à des nombres provenant de sources quelconques. Expliquer ce cas implique 
une investigation plus rigoureuse en utilisant le théorème de la limite centrale. Cette démonstration a 
été effectuée seulement en 1996 par T. Hill par une approche utilisant la distribution des distributions. 


(7.628) 


Pour résumer un partie importante de tout ce que nous avons vu jusqu'ici, l'illustration ci-dessous est 
très utile car elle résume les relations 76 distributions univariées (57 continues et 19 discrètes): 
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a=0,e=1 diè a=b=1 n=M,8= "2 
Zplo,n) l°"®/[Discrote unifrm(s,t)] bmn | Roctanguier(n) |—{Bots-binomial(s, bn) [peus ER 
Pr R,V pie, v re 
AG)=-log(1— €) pnbetah  p=n/ns/" 


\ nn 
- Su mai Power series(e, A(e)) ———— —»| Poison(y) |#71P É où 2 21 [ivrmpemeiq, rase) 
| Hemms . Cr Ris 
sé" 2 


Afc)=(1-c)"* 6 P=m/nsn= nains — 0 


Bota-Pascal(n, a,b)| © 1=2 


pr beta”. un Le : , \ 
Geometric(p) m2 ‘ A 5 pæn/p 1e =npli-p) ass 
F,M,V = ,P) = —p),n — nr (u, a, A) 
LE 2 M eo Ur 0) 2 LS 


AT, B — 00 au é—0 


Sn a)", 


nn N 
\ 


(Noncentral chi-square(n, 6) 
c 


X1/ 
' Standard Wald(a) En 


! 


7-0 x 
Le poncentral t{r, 8,7) ; 
18 0 


' 


Noncentral F(n1,n3,6) | | 
5=2/a 


7-0, =0 
) 


| Doubly noncentral F{mn, 12, 6, y 
1 
Properties: 


(+) 
8=02\ xvs LE 


Wetbull(a, 8) Log logistic(A, «)W ÿ L10*] 
Ms, 8, V LA | Benford 
] v 


| 7=0 =1 =1 
ÿesx x +4| ls 2 


re 


Generalised Pareto(s,n,7)) [Logistic(x,#)) |Trianguiar(e,ë,m)) {| Kolmogorov-Smirnov(n) 
8, V ) v L Vis 


Figure: 7.34 - Relations entre distributions (Source: AMS Lawrence M. Leemis and Jacquelyn T. McQueston) 
6. ESTIMATEURS DE VRAISEMBLANCE 


Ce qui va suivre est d'une extrême importance en statistiques et est utilisé énormément en pratique. Il 
convient donc d'y accorder une attention toute particulière! Outre le fait que nous utiliserons cette 
technique dans la présent chapitre, nous la retrouverons dans le chapitre de Méthodes Numériques pour 
les techniques avancées de régressions linéaires généralisées ainsi que dans le chapitre de Génie 
Industriel dans le cadre de l'estimation des paramètres de fiabilité. 


Nous supposons que nous disposons d'observations x,,x,,x;,...x, qui sont des réalisations de variables 
aléatoires non biaisées (dans le sens qu'elles sont choisies aléatoirement parmi un lot) indépendantes 


Page: 436/4839 


[v3.0 - 2013] 


À,,X,,X4,,...X, de loi de probabilité inconnue mais identique. 


Nous allons chercher à estimer cette loi de probabilité P inconnue à partir des observations 
js XX. Xe 


Supposons que nous procédons par tâtonnements pour estimer la loi de probabilité P inconnue. Une 
manière de procéder est de se demander si les observations x,,x,,x;,,...x, avaient une probabilité 


élevée ou non de sortir avec cette loi de probabilité arbitraire P. 


Nous devons pour cela calculer la probabilité conjointe qu'avaient les observations x,,x,,x;,...x, de 


sortir avec 2,,P2,P3,..p,. Cette probabilité vaut (cf. chapitre de Probabilités): 


# 
[IPC = x) (7.629) 
il 
en notant P la loi de probabilité supposée associée à p,,p,,p:,...p,.1Il faut avouer qu'il serait alors 


particulièrement maladroit de choisir une loi de probabilité (avec ses paramètres!) qui minimise cette 
quantité. 


* 

Au contraire, nous allons chercher la probabilité »,,p,,p;,..p, qui maximise [| P(ZX, = x), c'est- 
il 

à-dire qui rende les observations x,,zx;,,x;,...x, le plus vraisemblable possible. 


Nous sommes donc amenés à chercher le (ou les) paramètre(s) 8 qui maximise(nt) la quantité: 
# 
L, (8) = [12 =x;) (7.630) 
i-l 


Cette quantité L porte le nom de "vraisemblance". C'est une fonction du ou des paramètres 8 et des 
observations x,,X%,,2%3,...2,. 


La ou les valeurs du paramètre g qui maximisent la vraisemblance Z, (8) sont appelées "estimateurs 


du maximum de vraisemblance" (estimateur MV). 


Faisons quand même trois petits exemples (très classiques, utiles et importants dans l'industrie) avec 
dans l'ordre d'importance (donc pas forcément dans l'ordre de facilité.) la fonction de distribution de 
Gauss-Laplace (Normale), la fonction de distribution de Poisson et finalement Binomiale (et in extenso 
Géométrique). 


Remarque: Ces trois exemples sont importants car utilisés dans les SPC (maïtrise statistiques de 
processus) dans différentes multinationales à travers le monde (cf. chapitre de Génie Industriel), 


6.1. ESTIMATEURS DE LA LOI NORMALE 


Soit %,X,X3,...2%, Un n-échantillon de variables aléatoires identiquement distribuées supposées suivre 


une loi de Gauss-Laplace (loi Normale) de paramètres X et a. 
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Nous recherchons quelles sont les valeurs des estimateurs du maximum de vraisemblance 8 qui 


maximisent la vraisemblance Z, (8) de la loi Normale? 


Remarque: Il va de soi que les estimateurs du maximum de vraisemblance 8 sont ici: 


8= (4,7) (7.631) 


Nous avons démontré plus haut que la densité d'une variable aléatoire gaussienne était donnée par: 


1 (xs? 
P(XHO)=——>e 207 (7.632) 
T2 
La vraisemblance est alors donnée par: 
1 & 
| 2 1 oz # A) 
La, |=[[P(x,4,01= 8 20% (7.633 


| g” 2x : 


Maximiser une fonction ou maximiser son logarithme est équivalent donc la "log-vraisemblance" sera: 
In [2 4, | = in(22 - #in(o) - > zu) (7.63) 
7 2 20 5" 


Pour déterminer les deux estimateurs de la loi Normale, fixons d'abord l'écart-type. Pour cela, dérivons 
in [2 44, oo | par rapport à ## et regardons pour quelle valeur de la moyenne la fonction s'annule. 


Il nous reste après simplification le terme suivant qui est égal à zéro: 


D'(x-4) (7.635) 


il 


Ainsi, l'estimateur du maximum de vraisemblance de la moyenne (espérance) de la loi Normale est 
donc après réarrangement: 


À = (7.636) 


x | 
2 


et nous voyons qu'il s'agit simplement de la moyenne arithmétique (ou appelée aussi "moyenne 
empirique"). 


Fixons maintenant la moyenne. L'annulation de la dérivée de In [2 44, o? | en 4° conduit à: 
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Ce qui nous permet d'écrire l'estimateur du maximum de vraisemblance pour l'écart-type (la variance 
lorsque la moyenne est connue selon la loi de distribution supposée elle aussi connue!): 


= 
7 


£ 2 
DE — A] (7.638) 


i=] 


LEA 


que certains appellent aussi "écart-type de Pearson". 


Cependant, nous n'avons pas encore défini ce qu'était un bon estimateur ! Ce que nous entendons par 
là: 


- Si l'espérance d'un estimateur est égale à elle-même, nous disons que cet estimateur est "sans biais" et 
c'est bien évidemment ce que nous cherchons! 


- Si l'espérance d'un estimateur n'est pas égale à elle-même, nous disons alors que cet estimateur est 
"biaisé" et c'est forcément moins bien. 


Dans l'exemple précédent, la moyenne est donc non biaisée (trivial car la moyenne de la moyenne 
arithmétique est égale à elle-même). Mais qu'en est-il de la variance (in extenso de l'écart-type) ? 


Un petit calcul simple par linéarité de l'espérance (puisque les variables aléatoires sont identiquement 
distribuées) va nous donner la réponse dans le cas où la moyenne théorique est approchée comme dans 
la pratique (industrie) par l'estimateur de la moyenne (cas le plus fréquent). 


Nous avons donc le calcul de l'espérance de la "variance empirique": 
Æ & I=EIFIX\]= CE a? )-#ii — 2x, 
# i=l # 


X 
= Se _ 2A1S x, +) = CEE ei 2 a) =£ ls: Fa à) (7.639) 
: n° : # 


=] = 
=_> EL |-ElÀ| 


# = 


Or, comme les variables sont équidistribuées: 

a(&\- 1 > E( 2)-#(2)=E(#)-E(2) Ga 

= — X = X £ } (7.640) 
# ;2 
Et nous avons (relation de Huyghens): 
2 2 
W(X)=ÆIX" |-Æ(X) (0.641) 
ainsi que: 
r(M=El#)-#(a) =#lR)-# (x 64) 


où la deuxième relation ne peut s'écrire que parce que nous utilisons l'estimateur du maximum de 
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vraisemblance de la moyenne (moyenne empirique). D'où: 


E(&\-=E(x2)-#(m2)-[7(X)+8(XŸ \-(F(A)\+E(XŸ |\=F(X)-V(A) C.643 
et comme: 


FIX \= 0 ety(n= (7.644) 
À 


Nous avons finalement: 


E|& -#-T-fi-1jé == le Go 


A À À 


nous avons donc un biais de moins une fois l'erreur-standard: 


= Ca (7.646) 
7 


nous disons alors que cet estimateur à un biais négatif (il sous-estime la vraie valeur!). 


Nous noterons également que l'estimateur tend vers un estimateur sans biais (E.S.B.) lorsque le nombre 
d'individus tend vers l'infini # — « . Nous disons alors que nous avons un "estimateur 
asymptotiquement non biaisé" ou "estimateur asymptotiquement débiaisé". 


Il est important de prendre note que nous avons démontré que la variance empirique tend vers la 
variance théorique quand n tend vers l'infini et ce. que les données suivent une loi Normale ou non! 


Remarque: Un estimateur est aussi dit "estimateur consistant" s'il converge en probabilité, lorsque 
# — ©, vers la vraie valeur du paramètre. 


De par les propriétés de l'espérance, nous avons alors: 


il vient alors: 


Z 


écart-type standard". (à ne pas confondre avec "l'erreur-standard" que 


que certains appellent aussi 
nous verrons plus loin). 


Nous avons donc finalementet pour résumer les deux résultats importants suivants: 


4 1] 


1. "L'estimateur du maximum de vraisemblance biaisé" ou appelé également "écart-type empirique" ou 


encore "écart-type échantillonnal" ou encore "écart-type de Pearson" … et donc donné par: 
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: 1 à er 
ê = =D - à) (7.649) 


lorsque # — æ. Nous retrouvons cet écart-type suivant les contextes (par tradition) noté de quatre 
différentes façons qui sont: 


OS Sy (7650) 
et même parfois (mais c'est très malheureux car cela génère alors souvent de la confusion) & ous. 


2. "L'estimateur du maximum de vraisemblance non biaisé" ou appelé également "écart-type standard": 


1 & al cc 
T= |— .— (7.651) 
LS (x; — À) 


Nous retrouvons cet écart-type suivant les contextes (par tradition) noté de quatre différentes façons 
qui sont: 


GS Sn (7-652) 


Nous retrouverons ces deux dernières souvent dans les tables et dans de nombreux logiciels et que nous 
utiliserons plus bas dans les développements des intervalles de confiance et des tests d'hypothèses! 


Par exemple, dans la version françaisde de Microsoft Excel 11.8346 l'estimateur biaisé est donné par la 
fonction ECARTYPEP( } et le non biaisé par ECARTTYPE( ). 


Au total, cela nous fait donc trois estimateurs pour la même quantité!! Comme dans l'écrasante majorité 
des cas de l'industrie la moyenne théorique n'est pas connue, nous utilisons le plus souvent les deux 
dernières relations encadrées ci-dessus. Maintenant, c'est là que c'est le plus vicieux: lorsque nous 
calculons le biais des deux estimateurs, le premier est biaisé, le second ne l'est pas. Donc nous aurions 
tendance à n'utiliser que le second. Que nenni! Car nous pourrions aussi parler de la variance et de la 
précision d'un estimateur, qui sont aussi des critères importants pour juger de la qualité d'un estimateur 
par rapport à un autre. Si nous faisions le calcul de la variance des deux estimateurs, alors le premier, 
qui est biaisé, a une variance plus petite que le second qui est sans biais! Tout ça pour dire que le critère 
du biais n'est pas (et de loin) le seul à étudier pour juger de la qualité d'un estimateur. 


Enfin, il est important de se rappeler que le facteur -1 du dénominateur de l'estimateur du maximum de 
vraisemblance non biaisé provient du fait qu'il fallait corriger l'espérance de l'estimateur biaisé à la base 
minoré de une fois l'erreur-standard'! 


6.2. ESTIMATEURS DE LA LOI DE POISSON 


En utilisant la même méthode que pour la loi Normale (Gauss-Laplace), nous allons donc rechercher les 
estimateurs du maximum de vraisemblance de la loi de Poisson qui rappelons-le, est définie par: 


Dès lors, la vraisemblance est donnée par: 
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Xe 


ñ 4 : 
LGD= [IP = —e 7 (652 


ü I: ! 
= 


Maximiser une fonction ou maximiser son logarithme est équivalent donc: 
ñn 
n[Z(a)]=In(4 D» x >In(x x (7655) 
=1 
Nous cherchons maintenant à la maximiser: 


2ln[LG] _ 


1 
—Y x -2=0 (7.656) 
Er” 


ñn 
B=—%x;| (7.657) 


Il est tout à fait normal de retrouver dans cet exemple didactique la moyenne empirique, car c'est le 
meilleur estimateur possible pour le paramètre de la loi de Poisson (qui représente aussi l'espérance 
d'une loi de Poisson). 


Sachant que l'écart-type de la distribution particulière (voir plus haut) n'est que la racine carrée de la 
moyenne, nous avons alors pour l'écart-type du maximum de vraisemblance biaisé: 


(7.658) 


Remarque: Nous montrons de la même manière des résultats identiques pour la loi exponentielle 
très utilisée en maintenance préventive et fiabilité! 


6.3. ESTIMATEUR DE LA LOI BINOMIALE (ET GÉOMÉTRIQUE) 


En utilisant la même méthode que pour la loi Normale (Gauss-Laplace) et la loi de Poisson, nous allons 
donc rechercher l'estimateur du maximum de vraisemblance de la loi Binomiale qui rappelons-le, est 
définie par: 

NI k _N-k NI 


AN. De CP = —————. ; _ : : k f1- N-k a. 
FRA &lCN — &)| 4 Ki(N-K)|l p'-(1-p) (7.659) 


Dès lors, la vraisemblance est donnée par: 


i 
L(p)=[[P(G,P)= Cp" Gp} * (7.660) 
i=l 
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Il convient de se rappeler que le facteur qui suit le terme combinatoire exprime déjà les variables 
successives selon ce que nous avons vu lors de notre étude de la fonction de distribution de Bernoulli et 
de la fonction binomiale. D'où la disparition du produit dans la dernière égalité précédente. 


Maximiser une fonction ou maximiser son logarithme est équivalent donc: 
In[L(p)]= {cé )+kin(p)+(N-#)n(i-2) 0660 
Nous cherchons maintenant à la maximiser: 


"© = =û (7.662) 
Le lecteur au remarque que le coefficient biniomial a disparu. Dès lors, nous en déduisons 
immédiatement que l'estimateur de la loi binomiale sera le même que celui de la loi géométrique. 
Ce qui donne: 
&k(-p)-piW-k)=k-lp-pN+pk=k-pN=0 (7.663) 


d'où nous tirons l'estimateur du maximum de vraisemblance biaisé qui sera: 


PEL (7.664) 
Fr NS 


Ce résultat est assez intuitif si l'on considère l'exemple classique d'une pièce de monnaie qui a une 
chance sur deux de tomber sur une de ces faces. La probabilité p étant le nombre de fois k où une face 
donnée a été observée sur le nombre d'essais total (toutes faces confondues). 


Remarque: Dans la pratique, il n'est pas aussi simple d'appliquer ces estimateurs! Il faut bien 
réfléchir lesquels sont les plus adaptés à une expérience donnée et idéalement calculer également 
l'erreur quadratique moyenne (erreur-standard) de chacun des estimateurs de la moyenne (comme 
nous l'avons déjà fait pour la moyenne empirique plus tôt). Bref c'est un long travail de réflexion. 


6.4. ESTIMATEURS DE LA LOI DE WEIBULL 


Nous avons vu dans le chapitre de Génie Industriel une étude très détaillée de la loi de Weïbull à trois 
paramètres avec son écart-type et son espérance car nous avions précisé qu'elle était assez utilisée dans 
le domaine de l'ingénierie de la fiabilité. 


Malheureusement les trois paramètres de cette loi nous sont en pratique inconnus. A l'aide des 
estimateurs nous pouvons cependant déterminer l'expression de deux des trois en supposant Y comme 
étant nul. Cela nous donne donc la loi de Weïbull dite "loi de Weïbull à deux paramètres" suivante: 


8x dé X # 
P(x, 8,7) = 2 EXP { (7.665) 
7 \7 7 


avec pour rappel &8 > 0 et #7 >0. 
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Dès lors la vraisemblance est donnée par: 


LB) =[IPG. 80 =[l 22) a. ( | 
il 5 7 \7 7 
à n 8\ à 8 
(EE) 
Maximiser une fonction ou maximiser son logarithme est équivalent donc: 
In[£(8,7)]= In (£ ë] | > (= Ds }"| 
7 ») Fr 


-nn(£ Ex 3n|(s J |-(2 }= F2 +(8- DRE : G.667) 


nn(£)- TRS 38 +(8- DRE : 


=1 


(7.666) 


Cherchons maintenant à maximiser cela en se rappelant que (cf. chapitre de Calcul Différentiel et 
Intégral): 


À 


LR = a” In(a) et LR =-a"iIn(a) (7.668) 
dx dx 


d'où: 


n[L(8,7)] i- x 
Rent net Dal i(s) + 


PL " “in cé 3) 


i=1 


: D xA(in(x)- n)] +3 (à 


i=l re 


LE +En(s )0 


Et nous avons pour le deuxième paramètre: 


(7.669) 


Oin|Z(5, 
RUE ere En =0 (670 
07 7 7° 7 =1 


d'où: 


4 —n=0 (7.671) 
FL i=l 
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Finalement avec les écritures correctes (et dans l'ordre de résolution dans la pratique): 


pv (3) En) 
n=-— 5x" in| +|+5 in) + De —#=Û0 (7672) 
rl ñ# i=1 7 i=l 7 


ñ# i=l 


La résolution de ces équations implique de lourds calculs et on ne peut rien en tirer dans les tableaux 
classiques comme Microsoft Excel ou Calc de Open Office. 


On prend alors une approche différente en écrivant notre loi de Weïbull à deux paramètres ainsi: 
È xË 
P(x, 8,89)=—x" exp ur (7.673) 


avec pour rappel $8 > 0 et 8-0. 


Dès lors la vraisemblance est donnée par: 


n & # n  #\n 
L(8,7)= [ [P(G,.8,8) = 15 2 le es(-# = (5) Exp - Si xfT (7.674) 
ë=l i=l 


Maximiser une fonction ou maximiser son logarithme est équivalent donc: 


la[LC8.8)]= 10 (Ë] [À # fl + 


| “ 
: . (7.675) 


LÉ )-S2 +Dia(x #)= na(£ F)-32x +(8- DE (x , 


=1 


Cherchons maintenant à maximiser cela en se rappelant que (cf. chapitre de Calcul Différentiel et 
Intégral): 


LD = 4” ina) et Le, 
dx 


=-a" in(a) (7.676) 
cu (a) 


d'où: 


Sln[L(89] n° 


32% (x)+2in(x) =0 (7.677 
98 = 


Et nous avons pour le deuxième paramètre: 


8in[L(E 8] 1,188 20 67 
86 8 ê£ 


Il est alors immédiat que: 


Le] 
ô= _ xf (7.679) 
# 
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injecté dans la relation: 


L x In(x)+5In(x)=0 (7.680) 
# 9 i= =] 
Il vient: 
va In(x;) : 
- œ = +3 In(x)=0 (7.681) 
Foix À 


en simplifiant: 


mn x = 
pi 6 tn (7.683) 


peut très facilement être calculée avec l'outil Valeur Cible de Microsoft Excel ou Calc de Open Office. 


6.5. ESTIMATEURS DE LA LOI GAMMA 


Nous allons utiliser ici une technique appelée "méthode des moments" pour déterminer les estimateurs 
des paramètres de la loi Gamma. 


Supposons que X,, …, À, sont des variables aléatoires indépendantes et identiquement distribuées selon 


la loi Gamma avec pour densité: 


E (x) = 


À ‘lost (7-84 


Nous cherchons à estimer 4,4. Pour cela, nous déterminons d'abord quelques moments théoriques. 
Le premier moment est l'espérance qui comme nous l'avons démontré vaut: 


E(A) = == (7.685) 
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et le second moment, l'espérance du carré de la variable, est comme nous l'avons démontré 
implicitement lors de la démonstration de la variance de la loi Gamma: 


_a(@ +1) 


2\_ 
EX" =" : 


(7.686) 


Nous exprimons ensuite la relation entre les paramètres et les moments théoriques: 


= 
dé nEr 
(7.687) 
aa +1) 
A2 
La résolution donne: 
2 
__ FA 
PRE 1 
72 é (7.688) 
1= Le … 
#7 


Une fois ce système établie, la méthode des moments consiste à utiliser les moments empiriques, en 
l'occurrence pour notre exemple les deux premiers, #4, : 


Pia 
À 
ei +... ne 


# 


"a 
(7.689) 


F3 — 


que l'on pose égaux aux moments théoriques vrais. Dès lors, il vient: 


(7.690) 


7. FACTEUR DE CORRECTION SUR POPULATION FINIE 


Maintenant démontrons un autre résultat qui nous sera indispensables dans certains tests statistiques 
que nous verrons plus loin. 


Supposons que nous avons une population de N individus que nous représentons par l'ensemble 
11,2,.,W) et une variable aléatoire X qui est donc une application de 1,2,..,N} dans IR . Nous posons 


x; = À(i). La moyenne de X est alors donnée par: 


1 
=—S'x (7.691) 
H=- 2x 
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La variance de X est par définition: 


l 
= F2(x y] (7.692) 
Considérons à présent l'ensemble E des échantillons (à... 5, : de taille n pris dans ;1,2,.., N avec 


0 <x < MN. Chaque individu a une probabilité d'être tiré égale à: 


l 1 1 iN-xil 


N N=-1  N-ia-l WI 


Nous nous intéressons à la variable aléatoire Z définie sur E et étant égale à la moyenne de 
l'échantillon. Plus précisément: 


1 
Xih. ini=—% "x; (7.694) 
1 ñ x = 


Afin de calculer la variance F\ Z\, nous allons exprimer # comme somme de variables aléatoires. En 
effet si nous définissons les variables 4, avec & =1..N par: 
Xÿc aike (1... a) 


Art... h)= (7.695) 
0 sinon 


Nous avons naturellement (donc de la par la définition précédente): 
- 1Y 
X=—S"X, (7.696) 
k=1 


et donc il vient: 


= 1 
FiIXI=—] SVIXLI+S'coviX,,X; il (7.697) 
#2 re, — J 
1#] 


Les variables aléatoires Æ#, ne sont pas indépendantes deux à deux, en effet comme nous allons le voir, 


leurs covariances ne sont pas nulles si N est fini. Dans le cas contraire, (covariance nulle), nous 
retrouvons un résultat déjà démontré plus haut: 


W(X\= Ce = (7.698) 


e 


Il nous faut donc calculer les variances F1 4% 1 et les covariances covi Æ;,Æ; 1. 


Pour ce faire nous allons utiliser la relation de Huyghens et pour cela nous allons commencer par 
calculer l'espérance Æ\ X, 1: 
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E(Xs)=P(X3, = 2x) xx (7.699) 


Or PIX = xÿ 1 est la probabilité qu'un échantillon contienne k. Cette probabilité vaut bien 


évidemment }#/{ À} et par suite: 
EiXgi= LR xx (7.700) 
N 
De la même façon nous obtenons 
E\ XË = ré (7.701) 
Nous pouvons donc calculer la variance Fi Æ, 1: 


2 
#niN-ni 
ViXL\=ElXÉ|-EiX, 2 (in) se —# (7.702) 


Pour calculer les covariances avons à présent besoin de calculer les espérances Æ\ 4; .Æ FU 


Or PIX, =x%,4 ; =2x;lest la probabilité qu'un échantillon contienne i et j. Cette probabilité vaut bien 


évidemment: 
x nl | 
—: (7.704) 
N N-1 
et par suite: 
#in— li 
E\X; -Æ;i= NIN=I XX (7.705) 
Nous pouvons à présent calculer les covariances: 
#in—li x? 
cov\ #;, À; = EX; À; i- EX; EX; Dr ‘2; Sr 
(7.706) 
niN-h\ 
= — ————  X.Xx. 
N?iN-1) 


Nous sommes maintenant en mesure de calculer F\ Z |: 


l #niN-n)i 2 #iN-xi 


= 1 
PL I= IS PIX IE S Covi A LE —© 5 gg — ———— 5S'x;x; | (7.707) 
x? — 3j 1 J x? N? a NN L 
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Sachant que (réarrangement de la définition de la variance): 


SA = N.(o2+y?) (7.708) 
Et que (réarrangement de la définition de la moyenne): 


2x = Nu (7.709) 


Nous avons: 
_ iN i N i 
ViZ)= + To +) Mu x) 
À NV M: —_ 3 
RAIN—x: RAIN—x: RAIN-—-xh) 
=— (at) ; 2,2 : + 
x N'iN-T: N°(N-1 ; (7.710) 
LAN 3, AÏN-ni 3; niN-xi 3 
à + 
&| N A en € tan 4) 
: : iN—x: 
CU miN-1 
Et donc: 
Fixi=- © N=n (7.711) 
ÿn VN-1 
Le terme: 
N— x 
= <1 (7.712) 
JEP N=1 


que nous avons déjà rencontré lors de notre étude la loi hypergéométrique, et appelé "facteur de 
correction sur population finie" et il a pour effet de réduire l'erreur-standard d'autant plus que n est 
grand. 


8. INTERVALLES DE CONFIANCE 


Jusqu'à maintenant nous avons toujours déterminé les différents estimateurs de vraisemblance ou 
estimateurs simples (variance, écart-type) à partir de lois (fonctions) statistiques théoriques ou 
mesurées sur toute une population de données. 


Définition: Un "intervalle de confiance" est un couple de nombres qui définit une plage de valeurs 
possibles avec une certaine probabilité pour un estimateur statistique donné (plage calculée à l'aide de 
paramètres vrais mesurés). Il s'agit du cas le plus fréquent en statistiques. 


Nous allons maintenant aborder une approche un peu différente et importante dans l'industrie en se 
demandant maintenant quelles doivent être les tailles d'échantillons pour avoir une certaine validité 
(intervalle de confiance I.C.) pour les données mesurées ou encore quel écart-type ou fractile dans une 
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loi Normale centrée réduite (grand nombre d'individus), du Khi-deux, de Student ou de Fisher 
correspond à un certain intervalle de confiance (nous verrons ces deux derniers cas de faibles 
échantillons dans la partie traitant de l'analyse de la variance ou ANOVA) lorsque la variance ou la 
moyenne est connue ou respectivement inconnue sur l'ensemble ou une partie de la population donnée. 


Indiquons que ces intervalles de confiance utilisent le théorème central limite démontré plus loin (afin 
d'éviter toute frustration) et que les développements que nous allons faire maintenant nous seront 
également utiles dans le domaine des Tests d'Hypothèses qui ont une place majeure en statistique! 


Enfin, indiquons que de très nombreuses organisations (privées ou étatiques) font des statistiques 
fausses car les hypothèses et conditions d'utilisation ne sont pas rigoureusement vérifiées ou simplement 
omises ou pire encore, toute la base (les mesures) ne sont pas collectées dans les règles de l'art 
(fiabilisation de la collecte de données). 


Remarque: Le praticien doit être très prudent quant à au calcul des intervalles de confiance et à 
l'utilisation des tests d'hypothèses dans la pratique. Raison pour laquelle, afin d'éviter toute erreur 
triviale d'utilisation ou d'interprétation, il est important de se référer aux normes suivantes par 
exemple: ISO 2602:1980 (Interprétation statistique de résultats d'essais - Estimation de la moyenne 
- Intervalle de confiance), ISO 2854:1976 (Interprétation statistique des données - Techniques 
d'estimation et tests portant sur des moyennes et des variances), ISO 3301:1975 (Interprétation 
statistique des données - Comparaison de deux moyennes dans le cas d'observations appariées), ISO 
3494:1976 (Interprétation statistique des données -- Efficacité des tests portant sur des moyennes et 
des variances), ISO 5479:1997 (Interprétation statistique des données - Tests pour les écarts à la 
distribution normale), ISO 10725:2000 + ISO 11648-1:2003 + ISO 11648-2:2001 (Plans et 
procédures d'échantillonnage pour acceptation pour le contrôle de matériaux en vrac), ISO 
11453:1996 (Interprétation statistique des données - Tests et intervalles de confiance portant sur les 
proportions), ISO 16269-4:2010 (Interprétation statistique des données Détection et traitement des 
valeurs aberrantes), ISO 16269-6:2005 (Interprétation statistique des données - Détermination des 
intervalles statistiques de tolérance), ISO 16269-8:2004 (Interprétation statistique des données - 
Détermination des intervalles de prédiction), ISO/TR 18532:2009 (Lignes directrices pour 
l'application des méthodes statistiques à la qualité et à la normalisation industrielle). 


8.1. I.C. SUR LA MOYENNE AVEC VARIANCE THÉORIQUE CONNUE 


Commençons par le cas le plus simple et le plus courant qui est la détermination du nombre d'individus 
pour avoir une certaine confiance dans la moyenne des mesures effectuées d'une variable aléatoire 
supposée suivre une loi Normale. 


D'abord rappelons que nous avons démontré au début de ce chapitre que l'erreur-type (écart-type à la 
moyenne) était sous l'hypothèses de variables indépendantes et indentiquement distribuées: 


T 
Ts = — 


. 


Maintenant, avant d'aller plus loin, considérons X comme une variable aléatoire suivant une loi 
Normale de moyenne # et d'écart-type «. Nous souhaiterions que la variable aléatoire ait par exemple 
95% de probabilité cumulée de se trouver dans un intervalle symétrique borné donné. Ce qui s'exprime 
donc sous la forme suivante: 
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P(u-ô<X<pn+6)=0.95 (7714) 


Remarque: Donc avec un intervalle de confiance de 95% vous aurez raison 19 fois sur 20, ou 
n'importe quel autre niveau de confiance ou niveau de risque &æ (1-niveau de confiance, soit 5%) 


que vous vous serez fixé à l'avance. En moyenne, vos conclusions seront donc bonnes, mais nous ne 
pourrons jamais savoir si une décision particulière est bonne! Si le niveau de risque est très faible 
mais que l'événement a quand même lieu, les spécialistes parlent alors de "grande déviation" ou de 
"black swan" (cygne noir). La gestion des valeurs aberrantes est traitée dans la norme 

ISO 16269-4:2010 Détection et traitement des valeurs aberrantes que tout ingénieur faisant des 
statistiques en entreprise se doit de respecter. 


En centrant et réduisant la variable aléatoire: 


rf-Ê sie 
T T 


<?) =095 (7.715) 
T 


Notons maintenant Y la variable centrée réduite: 


r(-Éer)(r-e(re 2))- 0.95 (7.716) 
T T 


Puisque la loi Normale centrée réduite est symétrique: 
dl , 
1- 2e[r =?) =0.95 (7.717) 
T 
D'où: 
de] 
rfr =?) = 0.025 (7.718) 
T 


A partir de là en lisant dans les tables numériques de la loi Normale centrée réduite, nous avons pour 
satisfaire cette égalité que: 


Ce qui s'obtient facilement avec la version anglaise de Microsoft Excel 11.8346 en utilisant la fonction: 
-NORMSINV((1-0.95)/2). 


Donc: 
3z=196€ (7.720) 


Ce qui est noté de façon traditionnelle dans le cas général autre que 95% par (Z étant la variable 
aléatoire correspond donc à la loi Normale centrée réduite): 


ô=Zg (7.721 
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Or, considérons que la variable X sur laquelle nous souhaitons faire de l'inférence statistique est 
justement la moyenne (et nous démontrerons plus loin que celle-ci suit une loi Normale centrée 
réduite). Dès lors: 


nous en tirons: 


dont nous prenons évidemment (normalement...) la valeur entière supérieure. 


Cette dernière notation est plus souvent écrite sous la forme suivante mettant mieux en évidence la 
largeur de l'intervalle de confiance à un niveau & sous-jacent: 


2 
n = Zan© (7.724) 
dl 


Relation appelée "effectif de l'échantillon pour estimation par loi Normale”. 


Ainsi, nous pouvons maintenant savoir le nombre d'individus à avoir pour s'assurer un intervalle de 
précision 5 (marge d'erreur) autour de la moyenne et pour qu'un pourcentage donné des mesures se 
trouvent dans cet intervalle et en supposant l'écart-type théorique & connu (ou imposé) d'avance 
(typiquement utilisé dans l'ingénierie de la qualité ou les instituts de sondages). 


Autrement dit, nous pouvons calculer le nombre n d'individus à mesurer pour s'assurer un intervalle de 
confiance donné (associé à Z) de la moyenne mesurée en supposant l'écart-type théorique connu (ou 
imposé) et en souhaitant un précision de % en valeur absolue sur la moyenne. 


Cependant. en réalité, la variable Z provient du théorème central limite (voir plus bas) qui donne pour 
un échantillon de grande taille (approximativement): 


M, - X- 
Z=Z,= EEE 


Du cin ot" 


En réarrangeant nous obtenons: 


et comme Z peut être négatif ou positif alors il est plus censé d'écrire cela sous la forme: 


u=X+Z 


(7.727) 


r 


Soit: 
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que les ingénieurs notent parfois: 
LCL < y SUCZL (7.729) 


avec LCL étant la lower confidence limit et UCL la upper confidence limit. C'est de la terminologie Six 
Sigma (cf. chapitre de Génie Industriel). 


Et nous venons de voir plus avant que pour avoir un intervalle de confiance à 95% nous devrions avoir 
Z=1.96. Et puisque la loi Normale est symétrique: 


95%=1-5%=1-œ=1-2.25%=1-2.0.025 (7.730) 


Cela se note finalement: 


X-Z 


(7.731) 


Comme nous l'avons déjà mentionné, et nous le démontrerons un peu plus loin, la moyenne 
arithmétique centrée réduite d'une séries de variables aléatoires indépendantes et identiquement 
distribuées de variance fini suit asymptotiquement une loi Normale centrée réduite, alors l'intervalle de 
confiance ci-dessus a une portée très générale! Raison pour laquelle nous parlons parfois de 
"d'intervalle de confiance asymptotique de la moyenne". 


Ces intervalles ont évidemment pour origine que nous travaillons très souvent en statistiques sur des 
échantillons et non sur toute la population disponible. L'échantillonage choisi influe donc sur 
l'estimateur ponctuel. Nous parlons alors de "fluctuation d'échantillonage". 


Dans le cas particulier d'un I.C. (intervalle de confiance) à 95%, la dernière relation s'écrit: 


Parfois nous retrouvons l'inégalité antéprécédente sous la forme équivalente suivante: 
L-ZorOg < Up SX +ZoOÿ (7.73) 
ou encore plus rarement sous la forme générale suivante (que l'on retrouve pour toutes les intervalles): 
X-ME<SuUE<X+4ME (7734) 


où ME signifie "marge d'erreur". 


Nous sommes ainsi capables maintenant d'estimer des tailles de population nécessaires à obtenir un 
certain niveau de confiance æ dans un résultat, soit d'estimer dans quel intervalle de confiance se 


trouve la moyenne théorique en connaissant la moyenne expérimentale (empirique) et l'estimateur du 
maximum de vraisemblance de l'écart-type. Nous pouvons bien évidemment dès lors aussi déterminer la 
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probabilité avec laquelle la moyenne est en dehors d'un certain intervalle. (l'un comme l'autre étant 
beaucoup utilisés dans l'industrie). 


Enfin, signalons que du résultat précédent, nous déduisons immédiatement par la propriété de stabilité 
de la loi Normale (démontrée plus haut) le test suivant que nous retrouvons dans de très nombreux 
logiciels de statistiques: 


(ZX -X)- (4 — {à) 
= e (7.735) 
++ 4 


#1] #2 


7 oale. = 


appelé "test Z bilatéral sur la différence de deux moyennes" avec l'intervalle de confiance 
correspondant: 


Remarque: La taille de la population mère pour les relations développées plus haut n'entre pas en 
ligne de compte dans le calcul des intervalles de confiance ni dans celui de la taille de l'échantillon, 
et pour cause, elle est considérée infinie. Il faut donc faire attention à ne pas avoir parfois des tailles 
d'échantillons qui sont plus grandes que la population mère réelle possible. 


8.2. I.C. SUR LA VARIANCE AVEC MOYENNE THÉORIQUE CONNUE 


Commençons par démontrer une propriété fondamentale de la loi du Khi-deux: 


Si une variable aléatoire X suit une loi Normale centrée réduite À = (0,1) alors son carré suit une loi 
du Khi-deux de degré de liberté 1: 


X?= (1) (7.737) 
Démonstration: 


Pour démontrer cette propriété, il suffit de calculer la densité de la variable aléatoire y2 avec 
À = N(0,1). Or, si Æ = W(0,1) et si nous posons y = y?, alors pour tout y 0 nous obtenons: 


PG<y)=P(X s<y)=P(-<x<+h) o7 


Puisque la loi Normale centrée réduite est symétrique par rapport à 0 pour la variable aléatoire X, nous 
pouvons écrire: 


P<y}=2.P(0sX<4{y) c73 


En notant la fonction de répartition de la loi Normale centrée réduite (sa probabilité cumulée en 


d'autres termes pour rappel...), nous avons: 
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P(FY <y)= 2. [@(p)- œ(0)] (7.740) 


et comme: 


1 À - 
P(0) = P(0,0,1) = — [ e 2-05 (7.741) 


V2r À 
alors: 
P<y}=2.0(4>)-2.05=2.@{f)-1 70 
La fonction de répartition de la variable aléatoire (probabilité cumulée) y = 72 est donc donnée par: 
PE <y)=2@(fy)-1 (7743) 


si y est supérieur ou égal à zéro, nulle si y inférieur à zéro. Nous noterons cette répartition f# (y) pour 
la suite des calculs. 


Puisque la fonction de distribution est la dérivée de la fonction de répartition et que X suit une loi 
Normale centrée réduite alors nous avons pour la variable aléatoire X: 


PCX = x) = ®{(x) = SE) Sn 
X 


V2r 


et il s'ensuite pour la loi de distribution de Y (qui est donc le carré de X pour rappell!): 
à à à à 
Lo (e()-)-2 ef b)-20 (D) dr 
( 
le Ne 1 -,;2 
= — = gp} = 9 + 
P (P) xp" > 


NI 
DR 
EN 
Ü1 


cette dernière expression correspond exactement à la relation que nous avions obtenue lors de notre 
étude de la loi du Khi-deux en imposant un degré de liberté unité. 


Le théorème est donc bien démontré, à savoir que si X suit une loi Normale centrée réduite alors son 
carré suit une loi du Khi-deux à 1 degré de liberté tel que: 


(Zvon 1] = 7 (1), (746) 


OIC.Q.F.D. 


Ce type de relation est utilisé dans les processus industriels et leur contrôle (cf. chapitre de Génie 
Industriel). 


Nous allons maintenant utiliser un résultat démontré lors de notre étude de la loi Gamma. Nous avons 
effectivement vu plus haut que la somme de deux variables aléatoires suivant une loi Gamma suit aussi 
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une loi Gamma dont les paramètres s'additionnent: 


X+Y=7y(p+g.4) (7747 
Comme la loi du Khi-deux n'est qu'un cas particulier de la loi Gamma, le même résultat s'applique. 
Pour être plus précis, cela revient à écrire: 


Si #,...,#, sont des variables aléatoires indépendantes (!) et identiquement distribuées N(0,1) alors 
par extension de la démonstration précédente où nous avons montré que: 


2 m 7AQ 
(Zvo) = 7 (1) (74) 


et de la propriété d'addition de la loi Gamma, la somme de leurs carrés suit alors une loi du Khi-deux de 
degré k telle que: 


L&)= XÈ+X2+..+XE| (7.749) 


Ainsi, la loi du y à k degrés de liberté est la loi de probabilité de la somme des carrés de k variables 


normales centrées réduites linéairement indépendantes entre elles. Il s'agit de la propriété de linéarité de 
la loi du Khi-deux (implicitement de la linéarité de la loi Gamma)! 


Maintenant voyons une autre propriété importante de la loi du Khi-deux: Si 4,,..,4, sont des 
variables aléatoires indépendantes et identiquement distribuées {4,7 (donc de même moyenne et 


même écart-type et suivant une loi Normale) et si nous notons l'estimateur du maximum de 
vraisemblance de la variance: 


F. 1 : 2 ee. 
Sy = — > (X, - 4} (7.750) 
À ;=] 


alors, le rapport de la variable aléatoire $? sur l'écart-type supposé connu de l'ensemble de la 


LEA 


population (dit "écart-type vrai" ou "écart-type théorique" pour bien différencier!) multiplié par le 
nombre d'individus n de la population suit une loi du Khi-deux de degré n telle que: 


2 
9 2 A: 5% = 
Y (2) = Fe au à (7.751) 


Ce résultat est appelé "théorème de Cochran" ou encore "théorème de Fisher-Cochran” (dans le cas 
particulier d'échantillons gaussiens) et nous donne donc une distribution pour les écarts-types 
empiriques (dont la loi parente est une loi Normale). 


En utilisant la valeur de l'écart-type démontrée lors de note étude da la loi du khi-deux nous avons 
donc: 


nS2 


=] PAOIE 2# (7.752) 
nul 


F 
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Mais net & sont imposés et sont donc considérés comme des constantes. Il vient alors: 


(7.753) 


2 
Ey(s2\=r( 6-02» 782 )- 02, = o4 
of S 


Et dès lors nous avons une expression de l'écart-type de l'écart-type empirique si nous connaissons 


l'écart-type de la population: 
2 br d e« 
Toi L a É (7.754) 


Mais nous avons démontré lors de notre étude des estimateurs que: 


Dès lors il vient que: 


sy 
[ 


# 


Rappelons que la population parente est dite "infinie" si le tirage de l'échantillon avec remise ou encore 
si la taille N de la population est très supérieure à celle de n de l'échantillon 


Remarques: 


R1. En laboratoire, les X,...,X, peuvent être vues comme une classe d'individus d'un même 


produit étudié identiquement par différentes équipes de recherche avec des instruments de même 
précision (écart-type de mesure nul). 


R2. $2 est la "variance interclasse" également appelée "variance expliquée". Donc elle donne la 


variance d'une mesure ayant eu lieu dans les différents laboratoires. 


Ce qui est intéressant c'est qu'à partir du calcul de la loi du Khi-deux en connaissant n et l'écart-type 
a? ilest possible d'estimer cette variance (écart-type) interclasse. 


Pour voir que cette dernière propriété est une généralisation élémentaire de la relation: 


Ge)= XÊ+XS +. +X2 (7750) 
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il suffit de constater que la variable aléatoire (#». $2/ a? est une somme de n carrés de N(0,1) 


indépendants les uns des autres. Effectivement, rappelons qu'une variable aléatoire centrée réduite 
(voir notre étude de la loi Normale) est donnée par: 


F = À TH (7.759) 
T 
Dès lors: 
nSé _ nm 1 : (real => (54) (7.760) 
cu cu À ;=] | =] T 


Or, puisque les variables aléatoires 4,,..,#, sont indépendantes et identiquement distribuées selon 
une loi Normale, alors les variables aléatoires: 


n À (7.761) 


sont aussi indépendantes et identiquement distribuées mais selon une loi Normale centrée réduite. 


Puisque: 
2 
7% 2  . 
>= y“(#) (7762) 
: 
en réarrangeant nous obtenons: 
nS® . 
= (7.763) 
4" (x) 


Donc sur la population de mesures, l'écart-type vrai suit la relation donnée ci-dessus. Il est donc 
possible de faire de l'inférence statistique sur l'écart-type lorsque la moyenne théorique est connue (...). 


Puisque la fonction du Khi-deux n'est pas symétrique, la seule possibilité pour faire l'inférence c'est de 
faire appel au calcul numérique et nous noterons alors l'intervalle de confiance à 95% (par exemple.) 
de la manière suivante: 


nS2 ñ = nS2 


= 20 Ses  - 070 
225% (2) 497.54 (2) 
Soit en notant 95% = 1— &æ: 
2 7" 
# AS. 
ER ED "| (7.765) 
Lar2() Ban) 


le dénominateur étant alors bien évidemment la probabilité cumulée. Cette relation est rarement utilisée 
dans la pratique car la moyenne théorique n'est pas connue. Voyons donc le cas le plus courant: 
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8.3. I.C. SUR LA VARIANCE AVEC MOYENNE EMPIRIQUE 


Cherchons maintenant à faire de l'inférence statistique lorsque la moyenne théorique de la population 
Æ n'est pas connue. Pour cela, considérons maintenant la somme: 


2 : . 
r(@)= >(ÊE J =D = 2 -D+%-0) (7.766) 
| i=l 


où pour rappel # est la moyenne empirique (arithmétique) de l'échantillon: 


En continuant le développement nous avons: 


CE = RP +0, - LUE -10+(E- 0°) 


i=]l 


POD= (A - D+(Z-) - 


PE - Xÿ+2(7- DE - P+È- a | 


=] 


PE - Zÿ +2(X7- HE (X,- X#)+açX - fi) À 
i=1 i=l 
(7.768) 


Or, nous avons démontré au début de ce chapitre que la somme des écarts à la moyenne était nulle. 
Donc: 


= "> dhbasiatieé : PE Marie ny | 
i=l 


= 


(7.769) 


et reprenons l'estimateur sans biais de la loi Normale (nous changeons de notation pour respecter les 
traditions et bien différencier la moyenne empirique de la moyenne théorique): 


Dès lors: 


ñ 5,2 - 2 - 2 
Po XD | +. ie (7.771) 


fn 


ou autrement écrit: 
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dr) = 


GDS? (2 | (7.772) 
a? din 


Puisque le deuxième terme (au carré) suit une loi Normale centrée réduite aussi, alors si nous le 
supprimons nous obtenons de par la propriété démontrée plus haut de la loi du Khi-deux: 


_ (n-1$? 
er: 


(7.773) 


FG-D 


Ces développements nous permettent cette fois-ci de faire aussi de l'inférence sur la variance 2 d'une 
loi V(44, &) lorsque les paramètres Æ et & sont tous les deux inconnus pour l'ensemble de la 
population. C'est ce résultat qui nous donne, par exemple, l'intervalle de confiance: 


(n - DS? nr CES 


sg = (7.774) 
téntr-D Hartr-D 


lorsque la moyenne théorique Æ est donc inconnue. 


8.4. I.C. SUR LA MOYENNE AVEC VARIANCE EMPIRIQUE CONNUE 


Nous avons démontré beaucoup plus haut que la loi de Student provenait de la relation suivante: 


T{k) = _— (7.775) 


NE 


si Z et U sont des variables aléatoires indépendantes et si Z suit une loi Normale centrée réduite N(0,1) 
et U une loi du Khi-deux 72(#) tel que: 


ÎrE)= 


fe _kH 
2 | £ 2 (7.776) 


"| | LE — 
Lx 2) ter # 
et rappelons que la fonction de densité (distribution) est symétrique! 


Voici une application très importante du résultat ci-dessus: 


Supposons que Æ,,..,#, constituent un échantillon aléatoire de taille n issu de la loi W{44, &). Alors 
nous pouvons déjà écrire que selon les développements faits plus haut: 


Et pour U qui suit une loi a (&), si nous posons # = #— 1 alors selon les résultats obtenus plus haut: 


_(4-D$ 


2 es 
= 4 (x—Ù (7.778) 
a 


Ü 
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Nous avons alors après quelques simplifications triviales: 


XZ-yu XZ-u X- y 
Z oi fn __ ln  _ 1x _Z-4 


in 1) 


UIk  f(x-D$° 
Cv #—] 


Donc puisque: 


Z 
T(K)=—— (7780) 
VU IE 


suit une loi de Student de paramètre k alors nous obtenons le "independant one-sample t-test" (en 
anglais) ou "test-T à 1 échantillon": 


=T(2-1] (7.781) 


quisuit aussi une loi de Student de paramètre n-1 et qui est très utilisé dans les laboratoires pour les tests 
d'étalonnages. 


Ce qui nous donne aussi après réarrangement: 
S 
"A 


Ce qui nous permet de faire de l'inférence sur la moyenne Æ d'une loi Normale d'écart-type théorique 
inconnu (sous-entendu qu'il n'y a pas assez de valeurs expérimentales) mais dont l'estimateur sans biais 
de l'écart-type est connu. C'est ce résultat qui nous donne l'intervalle de confiance: 


u=*X-T(#-1) (7.782) 


=  S =. À 
K-— ant -DSHS TEE (7.783) 
À 


En 


où nous retrouvons les mêmes indices que pour l'inférence statistique sur la moyenne (espérance) d'une 
variable aléatoire d'écart-type (théorique) connu puisque la loi de Student tend asymptotiquement pour 
de grandes valeurs de n vers une loi Normale. Ainsi, l'intervalle précédent et l'intervalle suivant: 


donneront des valeurs très proches (à la troisième décimale) pour des grandeurs de n aux alentours des 
10'000 (dans la pratique on considère qu'à partir de 100 c'est identique..). 


Nus déduisons immédiatement par la propriété de stabilité de la loi du Khi-deux (démontrée plus haut 
par le fait qu'elle découle de la loi Gamma) le test suivant que nous retrouvons dans de très nombreux 
logiciels de statistiques: 
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_ = sè ç2 : . s2 si 
(D -Xi-Totu- DT se 4 SR -X +Rotm-DL4+Z (785) 
Au A A 


appelé "test-T bilatéral sur la différence de deux moyennes". 


Nous pouvons bien évidemment dès lors aussi déterminer la probabilité avec laquelle la moyenne est 
dedans ou en dehors d'un certain intervalle. (l'une comme l'autre étant beaucoup utilisées dans 
l'industrie). 


Le lecteur pourra s'amuser à contrôler avec la version française de Microsoft Excel 11.8346 que pour 
un grand nombre de mesures n, la loi de Student tend vers la loi Normale centrée réduite en comparant 
les valeurs des deux fonctions ci-dessous: 


=LOIL.STUDENT.INVERSE.N(5%/2;n-1) 
=LOI.NORMALE.STANDARD.INVERSE.N(5%/2) 
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Remarque: Le résultat précédent fut obtenu par William S. Gosset aux alentours de 1910. Gosset 
qui avait étudié la mathématique et la chimie, travaillait comme statisticien pour la brasserie 
Guinness en Angleterre. À l'époque, on savait que si X,,.., X, sont des variables aléatoires 


indépendantes et identiquement distribuées alors: 


XZ-y 


in 


Toutefois, dans les applications statistiques on s'intéressait bien évidemment plutôt à la quantité: 


= N(0O,D (7.786) 


À -y 


Sin 


on se contentait alors de supposer que cette quantité suivait à peu près une loi Normale centrée 
réduite ce qui n'était pas une mauvaise approximation comme le montre l'image ci-dessous ( 
df=n-1): 


(7.787) 


_ lot normale 
— dfs100 
— (fes 

dfn2 
— df=i 


0.4 


0.3 


00 


Figure: 7.35 - Comparaison entre la fonction de distribution Normale et celle de Student 


Suite à de nombreuses simulations, Gosset arriva à la conclusion que cette approximation était 
valide seulement lorsque n est suffisamment grand (donc cela lui donnait l'indication comme quoi il 
devait y avoir quelque part derrière le théorème central limite). Il décida de déterminer l'origine de 
la distribution et après avoir suivi un cours de statistique avec Karl Pearson il obtint son fameux 
résultat qu'il publia sous le pseudonyme de Student. Ainsi, on appelle loi de Student la loi de 
probabilité qui aurait dû être appelée la loi ou fonction de Gosset. 


Signalons enfin que le test de Student est très utilisé pour identifier si des variations (progressions ou 
l'inverse) de la moyenne des chiffres de deux populations identiques sont significatives. C'est-à-dire que 
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si la taille de deux échantillons dépendants est identique alors nous pouvons créer le test suivant (nous 
avons indiqué tous les différents types d'écritures que l'on peut retrouver dans la littérature et dans les 
nombreux logiciels implémentant ce test): 


UE _ _ d  —  — 
Sin Soin Soin  So!Vn Sp! n 


Avec: 


La relation antéprécédente est donc très utile pour comparer deux fois le même échantillon dans des 
situations différentes de mesure (ventes avant ou après rabais d'un article par exemple). Cette dernière 
relation est appelée "test-T de deux moyennes d'échantillons appariés (ou échantillons dépendants)". 


Définition: Nous parlons "d'échantillons appariés" (par paires) si les échantillons de valeurs sont prises 
2 fois sur les mêmes individus (donc les valeurs des paires ne sont pas indépendantes, contrairement à 
deux échantillons pris indépendamment). 


8.5. TEST BINOMIAL EXACT 


Il arrive fréquemment lors de mesures que l'on souhaite comparer si deux échantillons de petite taille 
pris au hasard (sans remise!) d'une population elle aussi petite. sont significativement différents ou non 
alors que l'on attendait une égalité parfaite (50%/50%)! 


Il s'agit donc d'un test adapté aux cas suivants: 


- Savoir si un échantillon d'une population préfère utiliser une technique de travail plutôt qu'une autre 
alors que l'on s'attend à ce que la population utilise autant l'une que l'autre 


- Savoir si un échantillon d'une population a une caractéristique prédominante parmi deux possibilités 
alors que l'on s'attend à ce que la population soit parfaitement équilibrée. 


Avant d'aller plus en détails, rappelons qu'il faut être extrêmement prudent quant à la manière d'obtenir 
les deux échantillons. Il faut que l'expérience soit non biaisée, cela signifie pour rappel, que le protocole 
de tirage ne doit en aucun cas avantager l'une au l'autre des caractéristiques de la population (si vous 
étudiez l'équilibre homme/femme dans une population en attirant dans le sondage des personnes grâce à 
un cadeau sous la forme de bijoux vous aurez alors un échantillon biaisé.…. car vous aurez probablement 
naturellement plus de femmes que d'hommes.….). 


Ceci étant dit, cette situation correspond donc à une loi binomiale pour laquelle nous avons démontré 
plus haut dans ce chapitre que la probabilité de k réussites pour une population de taille N dont la 
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probabilité de réussite est p (et la probabilité d'échec q donc de 1-p) était donnée par la relation: 


PIN k&i\i= #4 ail = érM (1- my (7.790) 
Dans le cas qui nous intéresse, nous avons donc p = 4 = 0.5: 


FIN E]= Cf Re a ed = DSL (7.791) 


tout en se rappelant que la distribution ne sera pas pour autant symétrique et ce surtout si la taille N de 
la population est petite. 


Si nous notons maintenant x le nombre de réussites (considéré comme la taille du premier échantillon) 
et y le nombre d'échecs (considéré comme la taille du deuxième échantillon), nous avons alors: 


P(N,&)= 05" CE = P(x+y,k)=0.5"VCEŸ (7.792) 


Ceci étant fait, pour construire le test et de par l'asymétrie de la distribution, nous allons calculer la 
probabilité cumulée que k soit plus petit que le x obtenu par l'expérience et la sommer à la probabilité 
cumulée pour que k soit plus grand que le y obtenu par l'expérience (ce qui correspond à la probabilité 
cumulée des queues respectivement gauche et droite de la distribution). Cette somme correspond donc 
à la probabilité: 


x N 
P= 0.55 Ce +055 CE (7793) 
k=0 k=y 


et cette dernière relation est appelée "test binomial exact (bilatéral)". 


Si la probabilité P obtenue pour la somme est au-dessus d'une certaine probabilité cumulée fixée à 
l'avance, nous dirons alors que la différence avec un échantillon tiré au hasard dans une population 
parfaitement équilibrée n'est pas significative (en bilatéral...) et respectivement si elle est en-dessous, la 
différence sera donc significative et nous rejetterons l'équilibre supposé. 


Ainsi,si: 
RE D É _ 
SNS CN +05" SC =05"| SC +S Cd |>a (7.794) 
__ — _— — 
k=0 k=y" k=0 k=p' 


la différence par rapport à une population équilibrée sera considérée comme non significative. Souvent 
on prendra au maximum & comme valant 5% (mais rarement en-dessous) ce qui correspond donc à un 
intervalle de confiance de 95%. 


Malheureusement d'un logiciel de statistiques à l'autre les paramètres demandés ou les résultats obtenus 
ne seront pas nécessairement les mêmes (les tableurs n'intègrent pas de fonction spécifique pour le test 
binomial, il faudra souvent construire un tableau ou programmer soi-même la fonction). Par exemple, 
certains logiciels calculent systématiquement et imposent (ce qui est assez logique dans un sens...): 
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Exemple: 


xl 
0515 
&=0 


NW 


CN + > cr) =P (7.795) 


k=y# 


D'une petite population ayant deux caractéristiques x et y particulières qui nous intéressaient et pour 
laquelle nous nous attendions à avoir un parfait équilibre tel que x = y nous avons en réalité obtenu 


x=5 et y = 7. Nous souhaiterions faire le calcul avec Microsoft Excel 11.8346 pour savoir si cette 


différence est significative ou non à un niveau de 5%? 


Pour répondre à cette question, nous allons donc calculer la probabilité cumulée 


ce qui nous donne: 


os" 


k=0 


&=y 


k=0 


x nl 5 12 
Éd Ècr)-o# (5e P 
ZE AT ‘ kr Th 


k=7 


Coeff. binormial 


O0 00 -J La & LU) Ne © 


0.774 


| (7.796) 


Figure: 7.36 - Valeurs du calcul des coefficients binomiaux dans Microsoft Excel 11.8346 


soit explicitement: 


© C9 -J Lh & LU ND es © 


11 
12 


sa 


Coeff. binomial 


=COMBIN(12:E12) 
=COMBIN(12:E13) 
=COMBIN(12:E14) 
=COMBIN(12:E15) 
=COMBIN(12:E16) 
=COMBIN(12:E17) 
=COMBIN(12:E18) 
=COMBIN(12:E19) 
=COMBIN(12:E20) 
=COMBIN(12:E21) 
=COMBIN(12:E22) 
=COMBIN(12:E23) 


=0.5%12*SOMME(F 12:F23) 


Figure: 7.37 - Formules du calcul des coefficients binomiaux dans Microsoft Excel 11.8346 


donc la probabilité cumulée étant de 0.774 (soit 77.4%) la différence par rapport à une population 
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équilibrée sera considérée donc comme non significative. 


Remarque: Ce test est également utilisé par la majorité des logiciels de statistiques (comme Minitab) 
pour donner un intervalle de confiance de la conformité d'opinions par rapport à celle d'un expert. 
C'est ce que nous appelons une étude R&R (reproductabilité & répétabilité) par attributs (voir mon 
livre sur Minitab pour un exemple). 


8.6. I.C. POUR UNE PROPORTION 


Indiquons que certains statisticiens utilisent le fait que la loi Normale découle de la loi de Poisson qui 
elle-même découle de la loi Binomiale (nous l'avons démontré lorsque n tend vers l'infini et que p et q 
sont du même ordre) pour faire un intervalle de confiance dans le cadre de l'analyse de proportions 
(très utilisé dans l'analyse de la qualité dans les industries). 


Pour voir cela, notons Æ#, la variable aléatoire définie par: 


{ si le i-ème élément de l'échantillon possède l'attribut À | 
1— (7.797) 


0 sinon 


où l'attribut A peut être la propriété "défectueux" ou "non défectueux" par exemple pour une analyse 
de pièces. Nous noterons k le nombre de réussites de l'attribut A. 


La variable aléatoire # = 4, + Æ, +...+X4, nous l'avons démontré au début de ce chapitre, suit une loi 
Binomiale de paramètres n et p avec les moments: 


n=E(X)=n.p 


o= PCA) = fn pa = np (1-p) | 


Ceci étant, nous ne connaissons pas la valeur vraie de p. Nous allons donc utiliser l'estimateur de la loi 
Binomiale démontré plus haut: 


7.798) 


RE 
Pam (00) 
Ed EC: 
D'après les propriétés de l'espérance nous avons alors: 
E(X 
EG)= 43 = a) - E(X) = 2, (7800) 
À À Lc] 


Et nous avons d'après les propriétés de la variance, la relation suivante pour la variance de la moyenne 
empirique de la proportion: 


A A 7 


V(B)= -(2- _#-p-(-p) _P:A-p) (7.801) 


Ce qui nous amène alors à: 
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Ilè 


D ete z VE  À2 (7.802) 
P Tÿ = ( ) 


Aÿ 
Maintenant rappelons enfin que nous avons démontré que la loi Normale découlait de la loi Binomiale 
sous certaines conditions (les praticiens admettent que c'est applicable tant que n>50 et x-p 25). 
Autrement dit, que la variable aléatoire X suivant une loi Binomiale suit une loi Normale sous certaines 
conditions. Évidemment, si X suit une loi Normale alors X/n aussi (et donc 5 …). Dès lors nous pouvons 
centrer et réduire afin qu'il se comporte comme la variable aléatoire centrée réduite notée Z: 


Exemple: 


Si 5% de la production annuelle d'une entreprise est défectueuse, quelle est la probabilité qu'en prenant 
un échantillon de 75 pièces de la ligne de production que seulement 2% ou moins soit défectueux? 


Nous avons dès lors avec: 


7-.002-005 | 10 


[0.05 095 (7.804) 
75 


La probabilité cumulée correspondante à cette valeur de la variable aléatoire est avec la version 
anglaise de Microsoft Excel 11.8346: 


=NORMSDIST(-1.19)-11.66% 


Nous pouvons maintenant approximer l'intervalle de confiance pour la proportion en se basant sur la loi 
Binomiale et son comportement asymptotiquement normal dans les conditions démontrées lors de notre 
introduction de la loi Normale tel que: 


Le 7 QNS 
Ban (7.805) 


Avant de passer à un exemple, il est peut-être utile de préciser au lecteur que cette approximation par 
une loi Normale est très courante et que nous allons la rencontrer encore de nombreuse fois dans les 
démonstrations qui vons suivre. C'est tellement courant qu'on a même donné un nom à cette méthode...: 
la "méthode de Wald”"' (bon en réalité il y en en a plusieurs de méhtodes de Wald mais c'est la plus 
connue que nous utiliserons à chaque fois). 


Exemple: 


Prenons &æ = 5%, nous avons alors: 


Page: 469/4839 


ÿ-Zous Je CP R sp < 5 +75 EP 
f-1.9 FEB sycpois PE) 
À À 


Sur une production de 300 éléments nous en avons trouvé 8 qui étaient défectueux. Quel est donc 
l'intervalle de confiance? 


Nous vérifions d'abord avec: 


Ê= — = 2.66% (7.807) 
300 
que: 
Cal 8 
n-B=300 —=82>5 (7.808) 
300 


ERA 

ON Ve 55 

300 300 
0.84% < p < 4.49% 


8 


(2) 
300 L 300) 
300 


Pour clore ce sujet, nous pouvons évidemment nous intéresser aussi au nombre d'individus (taille 
d'échantillon) qu'il faut avoir pour satisfaire une certaine précision d'intervalle de confiance (imposé) en 
ayant un écart-type imposé. 


Nous avons donc selon les hypothèses susmentionnées et dans l'acceptation de l'approximation par une 


loi Normale que: 
[pa [PQ =») C0) 
A A 


Et en procédant de manière identique aux développements effectués plus haut avec la loi Normale, 
nous obtenons: 


2 2 
Zan PAP) _ Zar2P4 (7.811) 
6? 6? 


AR = 


dont nous prenons évidemment normalement la valeur entière supérieure dans la pratique. 


Une question qui revient souvent dans la pratique concerne le fait de savoir s'il faut prendre en 
unilatéral ou bilatéral. Au fait cela il n'y a pas de réponse précise, tout dépend de ce que nous 
cherchons à mettre en évidence. 
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Remarque: La taille de la population mère pour les relations développées plus haut n'entre pas en 
ligne de compte dans le calcul des intervalles de confiance ni dans celui de la taille de l'échantillon, 
et pour cause, elle est considérée infinie. Il faut donc faire attention à ne pas avoir parfois des tailles 
d'échantillons qui sont plus grandes que la population mère réelle possible. 


Exemple: 


Nous souhaiterions savoir le nombre d'individus (taille d'échantillon) à prendre d'un lot de production 
sachant que la proportion de défectueux est imposée à 30% avec une erreur tolérée d'environ 5% entre 
la proportion réelle et empirique et ce afin d'obtenir un intervalle de confiance à un niveau de 95% du 
résultat: 


Z y 30%(1— 30%) _ 1.96. 30% - 70% 
5%? 5%? 


It 


A 


Remarque: La dernière relation est très très souvent utilisée en théorie des sondages (analyses pour 
des votations avec réponses de type: Oui/Non) où parfois la taille de l'échantillon n est imposée 
pour des raisons de coûts du sondage et dont nous cherchons à calculer l'incertitude % et parfois 
l'inverse (l'incertitude est imposée et donc nous cherchons à connaître la taille de l'échantillon). 


8.6.1. TEST DE L'ÉGALITÉ DE DEUX PROPORTIONS 


Toujours dans le même contexte que l'approximation précédente de la loi Binomiale par une loi 
Normale, l'industrie (en particulier la biostatistique) est friande de comparer deux proportions de deux 
populations différentes afin de savoir si elles sont statistiquement égales ou non (autrement dit: 
significativement différentes ou pas). 


Dès lors rappelons que nous avons démontré la stabilité de la loi Normale si deux variables aléatoires 
étaient indépendantes et identiquement distribuées (selon une loi Normale donc!): 


X-Y- N[u= Hy-W,0= foitei) (7.813) 


Dans le cadre des hypothèses susmentionnées il en est alors de même approximativement pour la 
différence de deux proportions: 


X # # 
FE N(4p, Hy: Px 3, Je Mêx-êr 7,+.) 
: 1-5 (1-2 (7.814) 
a FEU FX), FEV FF] 
= M Êg Br + 


7 #2 


Dès lors nous savons que cette nouvelle variable centrée réduite suit une loi Normale selon: 
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Te (x By) 4 
Pr (x), Pr: AÈy) (81) 
LG “0 


et comme nous cherchons à savoir la probabilité cumulée que l'espérance théorique de la différence est 
nulle, cette dernière relation se réduit alors dans ce cas à: 


F= (Br Êy) 
Pxr'(r Br) | Br: (7 Pr) (7.816) 
7 #2 


Évidemment nous pouvons aussi construitre (comme toujours...) un intervalle de confiance à partir de 
cette relation. 


Il semblerait cependant que cette dernière relation approximative serait d'après l'expérience plus 
correcte en prenant pour dénominateur: 


où À sera pris comme le mélange de deux populations. C'est-à-dire: 


somme du nombre d'évenements dans chacun des deux prélèvements 


Ê= (7.818) 
somme du nombre d'échantillons 


soit (en changeant la notations des indices des proportions expérimentales): 


h À +2 
ÿ=-717772P2 (7.819) 


A+ 
Ce test est aussi appelé "test Z de l'égalité de deux proportions" 
Exemple: 


Dans le cadre d'un plan d'échantillonnage (cf. chapitre de Génie Industriel) nous avons prélevé sur un 
premier lot de 50 individus, 48 en parfait états. Dans un second lot de 30 individus, 26 étaient en bon 
état. 


Nous avons donc: 
: 48 x 26 
= — = 96% : = — = 6 66% (7.820) 
Px 50 0,Py 30 L 


Nous souhaiterions donc savoir si la différence est significative avec une certitude de 95% ou 
simplement due au hasard. Nous utilisons alors: 
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p= 


MÈ + Pa _ 48426 _ 92.50% (7.821) 
A + 50 +30 
et: 


: 0.96 — 0.8666 = 1535 


Ce qui correspond à une probabilité cumulée en utilisant la version anglaise de 
Microsoft Excel 11.8346 de: 


=NORMSDIST(1.535)-93.77% 


Donc la différence est due au hasard (ceci dit c'est presque in extremis..). Autrement dit, elle n'est pas 
significative sous les contraintes énoncées. 


8.6.2. TEST DES SIGNES 


Nous mesurons quelque chose sur un échantillon puis, plus tard, nous mesurons la même chose sur ce 
même échantillon mais avec une autre méthode (donc il s'agit donc d'échantillons appariés!). Les deux 
classements ordonnées des mesures sont comparés et chaque observation est affectée d'un signe ("+" 


en cas d'élévation dans le classement, "—" en cas de descente). Celles qui restent au même niveau sont 
éliminées. 
Selon l'hypothèse à tester, il y a autant de "+" que de "—", c'est-à-dire que la médiane de la distribution 


n'a pas bougé (cette affirmation peut ne pas paraître évidente à la première lecture il faut donc bien 
prendure du temps parfois pour réfléchir là-dessus). 


L'idée étant que pour chaque couple de valeurs, il n'y a que deux signes possibles de variations, nous 
avons une chance sur deux (50% de probabilité) que la différence soit positive ou négative. Ce test est 
donc basé uniquement sur l'étude des signes des différences observées entre les paires d'individus, 
quelles que soient les valeurs de ces différences. 


Nous pouvons souhaiter contrôler deux hypothèses: 


- L'inégalité des proportions de signes doit être significative. Donc l'un deux signes doit être en petit 
nombre par rapport à l'autre, ce qui correspond à un test unilatéral gauche (la probabilité cumulée 
d'avoir ce petit nombre de signes doit être inférieur à un niveau & donné). 


- La proportion des deux signes doit être faiblement déséquilibrée (P{+) = P(—) = 0.5). Il s'agit donc 
dans ce cas d'un test en bilatéral (c'est le cas le plus courant) avec un certain niveau & donné. 


Pour pouvoir créer un tel test, nous allons considérons l'apparition des "+" et des "—" comme un 
système de tirage aléatoire binaire dont l'ordre des succès n'est pas pris en compte (il s'agit donc d'une 
loi binomiale ou hypergéométrique) et avec remise (ce qui élimine d'emblée la loi hypergéométrique qui 
n'est pas symétrique et pose des problèmes d'utilisation dans la pratique..). Pour considérer un tirage 
aléatoire avec remise (alors qu'on ne fait pas réellement de remise), il faut que la population N soit 
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grande. Raison pour laquelle le test des signes considère que les valeurs appariées doivent être 
continues (ce qui permet in extenso d'approcher la loi hypergéométrique par la loi binomiale). 
Cependant certains logiciels de statistiques utilisent la loi hypergéométrique pour des soucis de 
précision. 


Remarque: Il faut savoir que la majorité des logiciels de statistiques, font implicitement l'hypothèses 
lors de ce test que les données sont continues et utilisent la loi binomiale. 
Exemple: 


Considérons deux séries de mesures avec deux méthodes différentes. Nous souhaiterions tester 
l'hypothèse avec un niveau & de 5% si la différence entre les deux méthodes est significative (nous 
nous attendons donc à une équilibre des signes). Il s'agit donc d'un test des signes à deux échantillons 
(sachant qu'il est possible de faire la même chose en comparant les valeurs d'un seul et unique 
échantillon à sa médiane). 


20.4, 25.4, 25.6, 25.6, 26.6, 28.6, 28.7, 29, 29.8, 30.5, 30.9, 31.1 
20.7, 26.3, 26.8, 28.,1,.26.2, 27.3, 29,5, 32,309, 323, 32.3, 31.7 


Nous avons donc les différences: 
-0.3, -0.9, -1.2, -2.5, 0.4, 1.3, -0.8, -3.0, -1.1, -1.8, -1.4, -0.6 


Soit: 


Bon il déjà clair que le résultat va être le rejet de l'hypothèse comme quoi il n'y pas de différence. Mais 
faisons quand même le calcul. Comme le test est en bilatéral à un niveau de 5%, la probabilité cumulée 
d'avoir obtenu au moins deux signes "+" ne doit pas être inférieure à 2.5% et pas supérieure à 97.5% si 
l'on veut accepter (ne pas rejeter) l'hypothèse comme quoi la différence n'est pas significative. 


Nous avons alors: 

= 12 . <k 12-k - 12: -<k,. A2-k 12 ; 12 
P(X<2)= > CE 05 (1-05) = > CH 0505" =05" > 0x =193% 
k=0 k=0 k=0 
Soit avec la version française de Microsoft Excel 14.0.6123: 
=LOI.BINOMIALE(2;12;0.5;1)=-1.928% 

ou si nous faisons pas d'approximation en étant plus précis avec la loi hypergéométrique: 

=LOLHYPERGEOMETRIQUE.N(2;24/2;12;24; VRAI)=0.17% 


ce qui n'est guère plus brillant. 


Donc la probabilité cumulée est inférieure à 2.5% et n'est de loin pas supérieure à 97.5%, nous rejetons 
l'hypothèse comme quoi la différence n'est pas significative. 
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Nous pourrions accepter l'hypothèse si nous prenions pour & la valeur: 


p—valuez=193%.2=386% (7.824) 
mais bon ce n'est pas le cas! 


Enfin, pour terminer concernant ce test des signes (test de la médiane), indiquons que certains logiciels 
de statistiques proposent un intervalle de confiance de la médiane basé sur la méthode de calcul 
exposée précédemment (intervalle de confiance d'une loi binomiale). Cependant, nous pensons qu'il 
vaudrait mieux favoriser le bootstrapping comme nous l'avons vu dans le chapitre de Méthodes 
Numériques, nous nous abstiendrons donc de présenter cette technique ici. De plus il est peut utile de 
préciser que certains font un approximation en loi Normale (comme avec la majorité des tests mais 
nous nous en abstiendrons dans le cas présent). 


8.6.3. TEST DE LA MÉDIANE DE MOOD 


Nous considérons deux échantillons indépendants 1 41,...,4,4 1 et 1 ,...,F,2 1. Nous supposons que 
iX,..,X#, 1 est un échantillon indépendant et identique distribué d'une loi continue F et iK,...,F,3 1 


est un échantillon indépendant et identiquement distribué d'une loi continue G. 


Après regroupement des x, + x; valeurs des deux échantillons, & = # : M, est le nombre 
d'observations Æ; qui sont supérieures à la médiane des N = x +x#, observations (la notation n'est pas 
géniale car elle peut faire croire à une multiplication mais bon...). 


Sous l'hypothèse nulle que les variables X et Y suivent la même loi continue (c'est-à-dire G=F), la 
variable & = x - f, peut prendre les valeurs 0,1,...,#, selon la loi hypergéométrique: 


# | # | 
À les AIN I9- EM =(N/9-ENI 
P(NNT 2. +)» EME EAP QE Dee II (7.825) 
Cyn —————— 
Ni2liN-Nif2il 


Dès lors, nous pouvons calculer la probabilité cumulée en unilatéral d'avoir k. Le test de Mood est donc 
un test purement unilatéral. 


Exemple: 
Considérons les deux échantillons: 
23.4, 24.4, 24.6, 24.9, 25.0, 26.2, 26.3, 26.8, 26.8, 26.9, 27.0, 27.6, 27.7 
22.5, 22.9, 23.7, 24, 24.4, 24.5, 25.3, 26, 26.2, 26.4, 26.7, 26.9, 27.4 
La médiane globale calculée avec Microsoft Excel 14.0.6123 est de 26.10. Nous avons au total: 
k=m.M,=38 (7.826) 


Il vient alors avec la version française de Microsoft Excel 14.0.6123: 
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=LOILHY PERGEOMETRIQUE.N(8;26/2;13;26; VRAI)=94.24% 


Donc à un seuil de 5%, nous ne rejettons pas l'hypothèse nulle (mais bon étant proche de la limite c'est 
un peu périlleux de conclure cela...). Si nous faisons le même calcul avec la loi Binomiale nous 
obtenons: 


LOI.BINOMIALE.N(8;26/2;0.5;1)=86.65% 


Mais bien évidemment ici l'approximation ne s'applique pas puisque l'approximation par une loi 
binomiale est acceptable dans la pratique que lorsque l'échantillon est environ 10 fois plus petit que la 
population. 


Remarque: Il existe malheureusement plusieurs versions du test de Mood. Par exemple un logiciel 
comme Minitab compare à l'aide d'une table de contingence... le contingent de valeurs au-dessus ou 
en-dessous de la médiane et fait un simple test d'indépendance du Khi-deux (test de Pearson) vu 
dans le chapitre de Méthodes Numériques. 


8.6.4. TEST DE POISSON (1 ÉCHANTILLON) 


Nous savons qu'un certain nombre d'événements rares suivent une loi de Poisson. Nous pouvons alors 
nous permettre comme pour toute autre loi, de calculer la probabilité cumulée dans un intervalle donné 
(bilatéral ou unilatéral). 


Donc, si nous avons une variable aléatoire discrète suivant une loi de Poisson: 


gen (7.827) 


Nous avons alors en unilatéral droite à un certain niveau de confiance &, la valeur de n de k la plus 
proche satisfaisant la condition: 

n ,,k 

Eu 


k=0 


g #—1-æ (7.828) 


Donc pour trouver la valeur de n (entier strictement positif ou nul) il faudrait inverser la somme, ce qui 
est peu. pratique (raison pour laquelle aucun tableur à ce jour ne propose de fonction pour la loi de 
Poisson inverse). 


Maintenant, rappelons que nous avons vu dans le chapitre de Suites Et Séries, la série de Taylor 
(Maclaurin) avec reste intégral à l'ordre n-1 autour de 0 jusqu'à 4 suivante: 


n-| aX 2 À 1 
V2 —g ” =]- | TT. Mo Da: (7.829) 
k=0 k| ; 2 Tik/2) 


Résultat que nous avions également donné sous la forme de fonctions pour la version française de 
Microsoft Excel 14.0.6123 pour que le lecteur puisse vérifier cette équivalence: 
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= LOLPOISSON.N(x € N: 4 VRAI) 
=1-LOLKHIDEUX.N(2*4 2 *(x+ 1), VRAD 


(7.830) 


Il vient alors que dans les tableurs, nous pouvons utiliser la loi du Khi-deux inverse pour calculer 
l'inverse de la loi de Poisson avec cette fois cependant une petite nuance: le résultat ne donnera pas 
nécessairement un nombre entier. 


Si par exemple nous prenons (toujours avec la version française de Microsoft Excel 14.0.6123): 
=1-LOIL.KHIDEUX.N(2*20:2*(15+1); VRAD=0.156513135 (7.821) 
La question est alors de trouver l'écriture pour l'inverse. Celle-ci est alors donnée par: 
=KHIDEUX.INVERSE(1-0.156513135;2*20)/2=-15.53194258 (7.822) 


Finalement, l'écriture de l'inverse est assez naturelle. Ainsi, le "test de Poisson à 1 échantillon" à un 
niveau & donné en unilatéral droite peut s'écrire: 


& < KHIDEUX.INVERSE(1-alpha;2*(nombre de mesures+1)}/2 (7.832) 


Soit formellement: 


2 
calt2 (% ; +] 
PP (imposé )! 
2 


Attention cependant à une chose! Il semblerait que certains logiciels de statistiques approximent parfois 
un peu abusivement la loi de Poisson par une loi Normale. Dès lors, l'intervalle unilatéral se calcule à 
partir de: 


(7.836) 


Â <= AïZ;., fhnmesé (7.837) 
A 


Une société fabrique des télévisions en quantité constante et a mesuré le nombre d'appareil défectueux 
produits chaque trimestre pendant les dix dernières années (donc 4 fois 10 mesures). La direction 
décide que le nombre maximum acceptable d'unités défectueuses est de 20 par trimestre et souhaite 
déterminer si l'usine satisfait à ces exigences (sous l'hypothèse que la distribution des défectueux suive 
une loi de Poisson) à un niveau de confiance de 5%. 


Il vient alors: 


Exemple: 
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Les 40 mesures nous donnent une moyenne de: 


X=ÀÂ=17.825 (7.838) 


Nous avons alors avec l'approximation grossière: 


120 
À £17.825 +2Z_5% 20 (7.839) 


Soit dans un tableur comme la version française de Microsoft Excel 14.0.6123: 


= LOLNORMALE.STANDARD.INVERSE.N(1-5%)*R ACINE(20/40)+17.825 _—. 
= 18.988 | 


ou: 


< 5% (2 (20 +1)) (7.841) 
2 


À 


Soit dans un tableur comme la version française de Microsoft Excel 11.8346: 
= KHIDEUX.INVERSE(1-5%,2#20+1)#2 = 14.072 (7.842) 


Dans les deux cas, nous sommes en-dessous de la moyenne imposée de 20 (donc on rejette l'hypothèse 
nulle comme quoi le nombre de défauts est supérieur ou égal à 20). Bien évidemment, il est possible 
pour chacune des méthodes de déterminer quelle devrait être la probabilité cumulée (niveau de 
confiance) qui nous amène à la limite des 20 (donc la p-value en d'autres termes). Avec la première 
méthode (approximation normale), la p-value est de 0.104%. 


Évidemment, dans le cas bilatéral, nous avons: 


: F 
Lan (2 @+D) ge Han @HD| Gus 
à 2 


LA 


Exemple: 


Une compagnie d'aviation a eu 2 deux crashs en 1'000'000 de vols (événement très rare). Quelle est 
l'intervalle de confiance en bilatéral à 95% sachant qu'au niveau mondial le nombre d'accident par 
millions est de 0.4. 


Nous avons alors: 


2 2 


2 2 
Soit pour la borne supérieure avec un tableur comme la version française de Microsoft Excel 11.8346: 
=LOI.KHIDEUX.INVERSE(1-5%/2;2*(2+1))/2=7.224 (7.845) 


et pour la borne inférieure: 
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=LOILKHIDEUX.INVERSE(1-5%/2;2*(2+1))/2=0.618 (7.846) 
Donc statistiquement, cette compagnie d'avion est moins sûre que l'ensemble des compagnies. 
8.6.5. TEST DE POISSON (2 ÉCHANTILLONS) 


Nous venons de voir que: 


2 2 
Gen (2 GT ee Herte GOT Ga 
2 2 


IA 


Or, en suivant le même raisonnement que celui qui nous a amené à construire les tests de comparaison 
des moyennes suivant: 


(Z -X)-Zar PH SA SX, -X)+ Zi + 2 (7.848) 
# #2 #] #2 


ou son équivalent avec la loi de Student quand l'écart-type vrai n'est pas connu et en utilisant le fait que 
nous avons démontré que la loi de Poisson est stable par l'addition (et donc aussi par la soustraction), 
que la loi de Gamma était aussi stable par l'addition (et donc aussi par la soustraction) et la loi du 
Khi-deux aussi puisque ce n'est qu'un cas particulier de la loi Gamma. Nous aurions tendance à écrire 
un peu vite: 


2 2 
tan (2 +2 +0) 4 y een (22 Da D) Gao) 
: 2 


Et au fait cela constitue un piège! ! Car la loi du Khi-deux a un support qui est défini comme étant 
strictement positif et l'intervalle de confiance peut naturellement avoir la borne de gauche qui est 
négative. Une solution consiste alors à utiliser le test de la différence de deux proportions que nous 
avons déjà étudié plus haut: 


Fz (Pr Êy)-4 
Br (Pr), Pr: Or) 9 
# #3 


À condition bien évidemment que les conditions permettant d'approcher le test par une loi Normale 
soient satisfaites (les proportions doivent être inférieures typiquement à 0.1 et les n supérieurs à 50). 


Exemple: 


Une compagnie d'aviation a eu 2 deux crashs en 1'000'000 de vols (événement très rare). Une autre 
compagnie a eu 3 crashs en 1'200'000 vols. Quel est l'intervalle de confiance en bilatéral à 95% en 
supposant que la différence est nulle. 


Les proportions sont respectivement: 


Page: 479/4839 


[v3.0 - 2013] 


Êg = 2 =? 0.000002 et fr = >= À 20.000002 (7851) 
# 


Notons: 


À = ÿy — By = — 0.0000005 


x =l-Py (7.852) 
êr =1- Py 


Nous avons alors: 


À — Zn PAIX Q PTIT € y <A + Zn PxAXx , PYAY (7.853) 
74 #3 #4 #3 


ce qui donne un intervalle de confiance pour la différence de proportion théorique attendue: 


—0.000004461< y: < 0.000003461 (7.854) 


et donc comme -0.0000005 est dans cet intervalle, nous acceptons l'hypothèse comme quoi la 
différence des proportions n'est pas significative au seuil de 5%. 


Donc pour résumer un peu les convergences de lois dans tous ces différents tests et intervalles que nous 
avons vu jusqu'à maintenant, nous proposons au lecteur le schéma suivant qui clarifiera peut-être plus 


ou moins bien les choses: 
Loi Hypergéométrique Æ(N,x,p) nt ue PE ie 


Figure: 7.38 


LES PA Ces 24 PP 

| EME 0 

Loi Binomiale B(x, p) 

co: Cr 7] 4, - 
Lot sil Usa = 


M = np, = #p(1- p) 
- Â>18 
Loi de Poisson P(4)  k---- + = À, Æ À] Loi Normale N(4, 0?) où 


“= 0, =] HE &,0 = 2k 
k>100 7 \ & > 30 


+ ‘ 
+ L 
Loi de Student T(k) Loi du Khi-deux 72(#) 
- Convergence des différentes lois usuelles en inférence statistique élémentaire 


Et aussi ce tableau où toutes les relations ont été démontrées en détail plus haut et certains déjà 
utilisées (d'autres le seront plus loin): 
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Moyenne _ 
(population infinie) 


F 


Moyenne mn 
(population finie) Tr 


Proportion p pil-pi 
(population finie) Tu 
FOR P pil-pi [N-n 
(population infinie) | . N=I 


ES ñ—] fie 
é #71 2 2m 1} 2 


(population infinie*) # x? 


Tableau: 7.11 - Tableau des statistiques d'échantillonnage démontrées et utilisées en partie jusqu'à maintenant 
*: Pour autant que la population parente soit distribuée normalement. 
9. INTERVALLE DE CONFIANCE/TOLÉRANCE/PRÉDICTION 


Nous allons ici, afin d'éviter une confusion fréquente et avant de passer à d'autres sujets plus 
complexes, comparer l'intervalle de confiance, l'intervalle de tolérance (souvent appelé "intervalle de 
fluctuation" dans certains programmes scolaires) et enfin l'intervalle de prédiction. 


Définitions: 


D1. "L'intervalle de tolérance" (ou "intervalle de fluctuation") est un intervalle contenant un certain 
pourcentage (souvent 68.26, 95.44 ou 99.73%) des individus d'une population de mesures. 


D2. "L'intervalle de confiance" pour un échantillon de moyenne # contient l'intervalle de valeur à un 
niveau de confiance donné (souvent 90, 95 ou 99%) de l'espérance Æ (moyenne vraie) de la 
population. 


D3. "L'intervalle de prédiction" permet de déterminer un intervalle d'un valeur individuelle basée sur la 
connaissance de la moyenne échantillonnale et de l'écart-type de la population. 


Un exemple valant mieux assez souvent mieux que mille mots, prenons le cas où la moyenne et 
l'écart-type de prix de 49 DVD sont: 


X=315531 S=8-07992 (7855) 
Nous avons alors: 


[Z+S]=1[30.8,32.4] 
[Z+25]=[30.0,332] (7.856) 
[ZX +35 ]=[29.2,34.2] 


correspondant respectivement à des intervalles de tolérance selon une loi Normale de 68.26, 95.44 et 
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99.73%. 
Par contre, un intervalle de confiance à 95% basé sur la relation démontrée plus haut: 


v 5, 
LEE RTE SUS A += T2 D (7.857) 
» \n 


Donne: 


3132<4<3178 (7.858) 


Donc 95% de probabilité cumulée que la moyenne vraie (espérance) se trouve comprise entre 31.32 et 
31.78. 


29.5 30.0 30.5 31.0 31.5 32.0 32.5 33.0 33.5 


Pnx Intervalle de tolérance 
+ ———————sstimée pour le prix à 

30.8 324 68.26% de tous les DVD 
E J Intervalle de tolérance 
30.0 33.2 estimée pour le prix à 


95.44% de tous les DVD 


g—_—__ 7 Intervalle de tolérance 
29.2 340 estimée pour le prix à 


99.73% de tous les DVD 
A —————————" ‘Jhtervalle de confiance de 
31.32 31.78 l'espérance (à 95%) de la 
population des DVD 


Histogramme de l'échantillon des prix de 49 DVD 


Maintenant passe à une notion qui curieusement est rarement traitée dans les ouvrages de statistiques. 
L'idée de l'intervalle de prédiction est de plutôt que de s'intéresser à l'intervalle de confiance de 
l'espérance basé sur une moyenne expérimentale, d'utiliser cette moyenne expérimentale 
(échantillonnale) comme base pour prévoir l'intervalle d'une unique valeur (et non d'une moyenne!). 


Nous allons donc nous intéresser à la différence entre la moyenne et une valeur ponctuelle: 
X—Xx (7.859) 


que nous supposerons proche de zéro (il vaut mieux pour avoir un produit fiable et passer les tests 
d'autorisation des ventes). Concernant la variance, ce qui nous intéresse ce n'est plus simplement 
l'écart-type de la moyenne maïs l'écart-type de la différence. et comme l'échantillon est indépendant 
de la valeur unique nous avons: 
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oè_, = o2+0o? La, = (+) (7.860) 


ñ 


Donc nous pouvons écrire qu'en première approximation: 


X 


x 


+ X—x .: — 
ne. Le fi) . fi (7.861) 
À À 


Et bien évidemment suite à ce que nous avons vu: 


Z 


Ilè 


X—X 


7.862 
$ fi) ns. 
À 


Et donc in extenso nous pouvons construire l'intervalle de prédiction: 


Tin-11= 


x 1.#(n- 1} (it)sxeremain-ns fur) (7.863) 
# # 


10. LOI FAIBLE DES GRANDS NOMBRES 


Nous allons maintenant nous attarder sur une relation très intéressante en statistiques qui permet de dire 
pas mal de choses tout en ayant peu de données et ce quelle que soit la loi considérée (ce qui est pas 
mal quand même!). C'est une propriété très utilisée en simulation statistique par exemple dans le cadre 
de l'utilisation de Monte-Carlo. 


Soit une variable aléatoire à valeurs dans +. Alors nous allons démontrer la relation suivante appelée 
"inégalité de Markov": 


VA>O0: PAZ AÀ)< —- (7.864) 


avec Æ(Æ)< À dans le contexte particulier des probabilités. 


En d'autres termes, nous proposons de démontrer que la probabilité qu'une variable aléatoire soit plus 
grande ou égale qu'une valeur 4 est inférieure ou égale à son espérance divisée par la valeur 
considérée 4 et ce quelle que soit la loi de distribution de la variable aléatoire X! 


Démonstration: 


Notons les valeurs de X par {x,...,x,}, Où 0 £x <zx, <.. < x, (c'est-à-dire triées par ordre croissant) 
et posons x = 0. Nous remarquons d'abord que l'inégalité est triviale au cas où À Z x, = 0. 
Effectivement, comme X ne peut être compris qu'entre 0 et x, par définition alors la probabilité qu'il 


soit supérieur à x,, est nulle. En d'autres termes: 


P(X > À)=0 (7.865) 
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et X étant positif, E(X) l'est aussi, d'où l'inégalité pour ce cas particulier dans un premier temps. 


Sinon, nous avons 0 < 4£ x, et il existe alors un & € {1,..,#} tel que x,_, < À £ x,. Donc: 
n n x 
E(R)=Yxn >2Yxr > AY p;,= A P(X2> A) (7866) 
i=l i=k ik 


OIC.Q.F.D. 


Exemple: 


Nous supposons que le nombre de pièces sortant d'une usine donnée en l'espace d'une semaine est une 
variable aléatoire d'espérance 50. Si nous souhaitons estimer la probabilité cumulée que la production 
dépasse 75 pièces nous appliquerons simplement: 


P(X 275)< —- = - = 0.6666 = 66.66% (7.867) 


Considérons maintenant une sorte de généralisation de cette inégalité appelée "inégalité de Bienaymé- 
Tchebychev" (abrégée "inégalité BT") qui va nous permettre d'obtenir un résultat très très très 
intéressant et important un peu plus bas. 


Considérons une variable aléatoire X. Alors nous allons démontrer l'inégalité de Bienaymé- 
Tchebychev suivante: 


ae, = Cas (7.868) 
g? 2 


Ve>0:P([X-E(N|ze)< 
E 


qui exprime le fait que plus l'écart-type est petit, plus la probabilité que la variable aléatoire X s'éloigne 
de son espérance est faible. 


Démonstration: 


Nous obtenons cette inégalité en écrivant d'abord: 
Ve>0:P(IX-E(X)2 €)= PIX -E(X)Ÿ > a) (7.869) 


où le choix du carré va nous servir pour une simplification future. 


Puis en appliquant l'inégalité de Markov (comme quoi c'est quand même utile...) à la variable aléatoire 
pe [ X-E x) avec 3 — &* il vient automatiquement: 


EÏLX-EHT) 
PF >E#) = P(x- ET 2 #)< “+ : ( ] (7.870) 
(2 


eu 


Ensuite, en utilisant la définition de la variance: 
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Efx-#f)-E{x-f)=7@eo en 


Nous obtenons bien: 


EfX-20)T) y © our 
” - (7.872) 
PF>E#) S——7— a 
OC.QFD. 


Si nous posons: 


l'inégalité s'écrit aussi: 


P(X-E(HIz10)<+ (7.874) 


La 


et exprime que la probabilité qu'afin que X s'éloigne de son espérance de plus que t fois son écart-type, 
est inférieure à 1/42. Il y a, en particulier, moins de 1 chance sur 9 pour que X s'éloigne de son 


espérance de plus de trois fois l'écart-type. 
Exemple: 


Nous reprenons l'exemple où le nombre de pièces sortant d'une usine donnée en l'espace d'une semaine 
est une variable aléatoire d'espérance 50. Nous supposons en plus que la variance de la production 
hebdomadaire est de 25. Nous cherchons à calculer la probabilité que la production de la semaine 
prochaine soit comprise entre 40 et 60 pièces. 


Pour calculer ceci il faut d'abord se souvenir que l'inégalité de BT est basée en parties sur le terme 
[ZX E(X)| donc nous avons: 


40-50[=160-50[=10 (7.875) 


donc l'inégalité de BT nous permet bien de travailler sur des intervalles égaux en valeur absolue ce qui 
s'écrit aussi: 


—10<Æ-Æ(X)S<10 (7.876) 
Ensuite, ne reste plus qu'à appliquer simplement l'inégalité numériquement: 


P{X-E(2|>e)-P(lX-E(X)210)- AE ER cr =025-25% (7877 


Ces deux dernières inégalités vont nous permettre d'obtenir une relation très importante et puissante 
que nous appelons la "loi faible des grands nombres" (L.F.G.N.) ou encore "théorème de Khintchine”. 


Considérons une variable aléatoire X admettant une variance et (X,) . une suite de variables 


re 
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aléatoires indépendantes (donc non corrélées deux-deux) de même loi que X et ayant toutes les mêmes 
espérances /{ et les mêmes écarts-types «. 


Ce que nous allons montrer est que si nous mesurons une même quantité aléatoire Æ, de même loi au 
cours d'une suite d'expériences indépendantes (alors dans ce cas, nous disons techniquement que la 
suite (Æ, La de variables aléatoires est définie sur le même espace probabilisé), alors la moyenne 
arithmétique des valeurs observées va se stabiliser sur l'espérance de X quand le nombre de mesures est 
infiniment élevé. 


De manière formelle ceci s'exprime sous la forme: 


Ve>0,P Ex )-4 2€ «T0 (7.878) 
À ;= RE 


lorsque # — + c'est cela le résultat très important dont nous faisions mention plus haut! L'estimateur 
empirique de la moyenne tend donc pour toute loi vers l'espérance vraie si n est grand! Donc de par la 
même nous assurons que la moyenne empirique est un estimateur convergent de l'espérance! Ce 
résultat (assez intuitif) est parfois appelé "théorème fondamental de Monte Carlo” car il est au centre 
du principe des simulations du même nom (cf. chapitre de Méthodes Numériques) qui ont une 
importance cruciale dans l'étude des statistiques avancées. 


Donc en d'autres termes la probabilité cumulée que la différence entre la moyenne arithmétique et 
l'espérance des variables aléatoires observées soit comprise dans un intervalle autour de la moyenne 
tend vers zéro quand le nombre de variables aléatoires mesurées tend vers l'infini (ce qui est finalement 
intuitif). 


Ce résultat nous permet d'estimer l'espérance mathématique en utilisant la moyenne empirique 
(arithmétique) calculée sur un très grand nombre d'expériences. 


Démonstration: 


Nous utilisons l'inégalité de Bienaymé-Tchebychev pour la variable aléatoire (cette relation s'interprète 
difficilement mais permet d'avoir le résultat escompté): 


wi) 


ñ 
> À, (7.879) 
i=l 


Ne 


Et nous calculons d'abord en utilisant les propriétés mathématiques de l'espérance que nous avions 
démontrées plus haut: 


sn=rx) ex) Érte FDA nas Cu 
# ;=] 7 i=l # ;=] # 52 


et dans un deuxième temps en utilisant les propriétés mathématiques de la variance aussi déjà 
démontrées plus haut: 
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a 
À ;2 7 


i=1 


(7.881) 
1 n 
2= 


l£ié j£n 


et puisque nous avons supposé les variables non corrélées entre elles alors la covariance est nulle dès 
lors: 


ra) = H(Èruo)] - +(È | lool (8 
# \i=1 # \i=l # 


A 


Donc en injectant cela dans l'inégalité BT: 


P{x- EN) > &°) TT (7.883) 


nous avons alors: 
F 
P(r EG) > c°) < — (7.884) 


qui devient: 
2 
L: m 
F (Ex) 4 DE ne: (7.885) 


et l'inégalité tend bien vers zéro quand n au dénominateur tend vers l'infini. 


OIC.Q.F.D. 


Signalons que cette dernière relation est souvent notée dans certains ouvrages et conformément à ce 
que nous avons vu au début de ce chapitre: 


P(lM, - my | > €) «A (7.886) 
RE 


ou encore: 
__ 
P(lM, - my | < e) > 1— — (7.887) 
Donc, pour Y# > Ü: 


dim P(14, -my|<e)=1 (7888) 
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11. FONCTION CARACTÉRISTIQUE 


Avant de donner une démonstration à la manière de l'ingénieur du théorème central limite, introduisons 
d'abord le concept de "fonction caractéristique" qui tient une place centrale en statistiques. 


D'abord, rappelons que la transformée de Fourier est donnée dans sa version physicienne par (cf. 
chapitre de Suites et Séries) la relation: 


F(b=—L [7 (x)e ax (7.889) 
27 


Rappelons que la transformation de Fourier est un analogue de la théorie des séries de Fourier pour les 
fonctions non périodiques, et permet de leur associer un spectre en fréquences. Au facteur près, il s'agit 
d'une "transformée de Laplace bilatérale" donnée par: 


al 
L,[f@]= F(p) = | fe Fax (7.890) 


—2 


avec p qui est la variable complexe donnée dans le cas présent par (la partie réelle est nulle puisque la 
transformée de Fourier n'est que le cas particulier d'une transformée de Laplace dont la partie réelle de 
la variable est nulle: dont faire une transformée de Fourier c'est faire une transformée de Laplace sur 
l'axe des complexes uniquement): 


p=ik (7.891) 
Nous souhaitons maintenant démontrer que si: 
g(x)= f'(») alors G(&) =ikF(k) (7.892) 


En d'autres termes, nous cherchons une expression simplifiée de la transformée de Fourier de la dérivée 


de f(x). 
Démonstration: 


Nous partons donc de: 


Une intégration par parties donne: 
Fo “ik se fe ( tk sd 
[# (xe “ax = f(x) .e | +i [ (x dx (7.894) 


En imposant que, f tend vers zéro à l'infini, nous avons alors: 


Km +0 


JG}e 


Km 
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et: 


ex = : 


LT. 
El’ (x) Pr 


C'est le premier résultat dont nous avions besoin. 


[fre *dx= ik. FE) (7696) 


OIC.Q.FD. 
Maintenant, démontrons que si: 
gx) = xf{(x) alors G(&) =iF'(k) (7.897) 
Démonstration: 
Nous partons donc de: 
G{k)= | xf (x}e *dx= El f(x) ea =iF(k) 
ne dk | 2x À 
= i : rc) Letar =: : Texier (7.898) 
2x2 "dk 27 à 
= | xf(x)e ax 
LR 
C'est le deuxième résultat dont nous avions besoin. 
OIC.Q.FD. 


Maintenant effectuons le calcul de la transformée de Fourier de la loi Normale centrée-réduite (ce 
choix n'est pas innocent...): 


2 


1,7 (7.899) 


= fr@)= FE 


Nous savons que cette dernière relation est trivialement solution de l'équation différentielle (ou bien 
elle vérifie): 


Y'=-xy (7.900) 


en prenant la transformée de Fourier des deux côté de l'égalité, nous avons en utilisant les deux 
résultats précédents: 


g(x)= f(x) alors GC) =ikF(k) (7.901) 
g(x)= xf(x) alors G(X) =iF(k) 


Nous avons: 


ikP(k) =—F() (7.90) 
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Ou encore: 
pk = Gp (x) (7.903) 
F(&) 
Donc après intégration: 
É É 1 1 ki 
Î-kak = [ar (&) =-lel =in(F(@)f 2}? =in(F(b))-In(F(0)) 
| à F) 2 2 
La +. (7.904) 
À st 
sn ls, T7 0 ps 702 
2 F(0) F(0) 
Puisque: 
1 © hi 
F(&)=—— | f(x)e "dx (7905) 
@= [70 
nous avons donc: 
1 de: 1 y wo jt 
F(0)= —= | f(de dx = —>© | f(x)dx= — e 2 dx= e 2dx (7.906) 
7 L nl nl A 


Nous avons démontré lors de notre étude de la loi Normale que: 
+o _l,a 
Je 2 dx= {2x (7.907) 
LE 


Donc: 


F(0)=— [e 2ax Lpr- 1 609 
27 2 
Nous avons alors (résultat important!) 
-- 
F(k)= e ? (7.909) 
27 


Introduisons maintenant la fonction caractéristique telle que définie par les statisticiens: 


ÉyrCk) = E[ |] - TA prod (7.910) 


—© 


qui est un outil analytique important et puissant permettant d'analyser une somme de variables 
aléatoires indépendantes. De plus, cette fonction contient toutes les informations caractéristiques de la 


variable aléatoire X. 
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Il s'agit 


Remarque: La notation n'est pas innocente puisque le ET...] représente une espérance de la fonction 
de densité par rapport à l'exponentielle complexe. 


Donc la fonction caractéristique de la variable aléatoire normale centrée réduite de distribution: 


x2 


1 s 4 CS) 


2x 


y (x) = 


devient simple à déterminer car: 


+0 
Pr (X) = [ fr (x)dx = N27F(-)| (7.912) 


—0 


raison pour laquelle la fonction caractéristique de la loi Normale centrée réduite est souvent assimilée à 
une simple transformée de Fourier. 


Et grâce au résultat précédent: 


g 1 = ge 2 (7.913) 


Donc: 


Êr &) = —= e 


27 


qui est le résultat dont nous avons besoin pour le théorème central limite. 


T2 =L2 Cod 
7 


Mais avant cela, regardons d'un peu plus près cette fonction caractéristique: 


by (@) = E[e*] = Tr (dx (7.915) 


—© 


En développement de Maclaurin nous avons (cf. chapitre Suites et Séries) et en changeant un peu les 
notations: 


Fl& Go) 


MOINE 


li #! 


x fr (Dax | (7.916) 


et en intervertissant la somme et l'intégrale, nous avons: 


4 f: & ko des k 
fy(e)= T ce [a frcoar = Eat (7.917) 
&=0 7 k=0 *° 
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Cette fonction caractéristique contient donc tous les moments (terme général utilisé pour l'écart-type et 
l'espérance) de X. 


12. THÉORÈME CENTRAL LIMITE 


Le théorème central limite est un ensemble de résultats du début du 20ème siècle sur la convergence 
faible d'une suite de variables aléatoires en probabilité. Intuitivement, d'après ces résultats, toute 
somme (implicitement: la moyenne de ses variables) de variables aléatoires indépendantes et 
identiquement distribuées tend vers une certaine variable aléatoire. Le résultat le plus connu et le plus 
important est simplement appelé "théorème central limite" qui concerne une somme de variables 
aléatoires indépendantes avec variance existante dont le nombre tend vers l'infini et c'est celui-ci que 
nous allons démontrer de manière heuristique ici. 


Dans le cas le plus simple, considéré ci-dessous pour la démonstration du théorème, ces variables sont 
continues, indépendantes et possèdent la même moyenne et la même variance. Pour tenter d'obtenir un 
résultat fini, il faut centrer cette somme en lui soustrayant sa moyenne et la réduire en la divisant par 
son écart-type. Sous des conditions assez larges, la loi de probabilité (de la moyenne) converge alors 
vers une loi Normale centrée réduite. L'omniprésence de la loi Normale s'explique par le fait que de 
nombreux phénomènes considérés comme aléatoires sont dus à la superposition de causes nombreuses. 


Ce théorème de probabilités possède donc une interprétation en statistique mathématique. Cette 
dernière associe une loi de probabilité à une population. Chaque élément extrait de la population est 
donc considéré comme une variable aléatoire et, en réunissant un nombre n de ces variables supposées 
indépendantes, nous obtenons un échantillon. La somme de ces variables aléatoires divisée par n donne 
une nouvelle variable nommée la moyenne empirique. Celle-ci, une fois réduite, tend vers une variable 
Normale réduite lorsque n tend vers l'infini comme nous le savons. 


Le théorème central limite nous dit à quoi il faut s'attendre en matière de sommes de variables 
aléatoires indépendantes. Mais qu'en est-il des produits? Eh bien, le logarithme d'un produit (à facteurs 
strictement positifs) est la somme des logarithmes des facteurs, de sorte que le logarithme d'un produit 
de variables aléatoires (à valeurs strictement positives) tend vers une loi Normale, ce qui entraîne une 
loi log-Normale pour le produit lui-même. 


En elle-même, la convergence vers la loi Normale ("normalité asymptotique") de nombreuses sommes 
de variables aléatoires lorsque leur nombre tend vers l'infini n'intéresse que le mathématicien. Pour le 
praticien, il est intéressant de s'arrêter un peu avant la limite: la somme d'un grand nombre de ces 
variables est presque gaussienne, ce qui fournit une approximation souvent plus facilement utilisable 
que la loi exacte. 


En s'éloignant encore plus de la théorie, on peut dire que bon nombre de phénomènes naturels sont dus 
à la superposition de causes nombreuses, plus ou moins indépendantes. Il en résulte que la loi Normale 
les représente de manière raisonnablement efficace. 


A l'inverse, on peut dire qu'aucun phénomène concret n'est vraiment Gaussien car il ne peut dépasser 
certaines limites, en particulier s'il est à valeurs positives. 


Démonstration: 


Soit {Æ;}. ,. une suite (échantillon) de variables aléatoires continues (dans notre démonstration 


simplifiée…), indépendantes (mesures de phénomènes physiques ou mécaniques indépendants par 
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exemple) et identiquement distribuées, dont la moyenne {et l'écart-type &- existent (ce qui signifie 
P q y )'à Ype Ty qui sign 


que le théorème central limite fonctionne que pour les phénomènes à variance finie!!!). 


Nous avons vu au début de ce chapitre que: 


Sn M,-H 


on _ cidn 


sont les mêmes expressions d'une variable centrée réduite générée à l'aide d'une suite de n variables 
aléatoires identiquement distribuées qui par construction a donc une moyenne nulle et une variance 
unitaire: 


(7.918) 


Zn = 


E(Z,)=0 et ÿ(Z,)=1 (7.919) 


Développons la première forme de l'égalité antéprécédente (les 2 sont de toute façon égales!): 


Zn = ” Eux ap |- Te (Ex )-ne (7.920) 


Maintenant utilisons la fonction caractéristique de la loi Normale centrée-réduite (nous allégeons par la 
même occasion l'écriture des estimateurs de la moyenne et de l'écart-type): 


n 


2,(Æ;- 4) 
bz, (a) = E| 4% | = Elexplie“ 


ho 


(7.921) 


Comme les variables aléatoires Æ, sont indépendantes et identiquement distribuées, il vient: 


n 


: y — LE - a — À - = h - 
ÿz (@)=E afro | -……. £ ani | SE arfe pe (7.922) 
20 ho aa 


Un développement de Taylor (cf. chapitre de Suites Et Séries) du terme entre accolades donne au 
troisième ordre (développement en série de Maclaurin de l'exponentielle): 


À — {4 
El expliæ 
| Fe) 


Ilè 


Elt+iT (x 19 CE X-ÿ| 023 
i = iY = .923 
ho aa 


Finalement: 
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» . : : a 1 Là k 
CL (A — Hi) pes D 4) 


ko æ : 
= ne (X - à - Lo? —{\#-/A) ro 


(rip (D | 
2nOZ Hs: 


X 


+o 
-| Para fur e Ts rar Ta Far | 
x 


— —© 


+co 
nl 


+o a +0 Fe 
[ Xrtodr- € een ro | 


-| ue L 
Er réal 1) ax 


te] à 2 
: 484 
| -p-run| 
Let 
2 


(7.924) 
Posons: 


Nous avons alors: 


1 


@ x 


Fa 2 | 2 
êz (@)= [+1] = (- D | (7.926) 
x x . 


Et donc quand x tend vers l'infini (cf. chapitre d'Analyse fonctionnelle): 


è 


a? a? 
1 Fo 1Ÿ A _ 
7 (@)= lim (+) =| lim fist) =ge 2] (7927) 
L = KO x n—+#0 x 


Nous retrouvons donc la fonction caractéristique de la loi Normale centrée réduite! 


En deux mots, le Théorème Central Limite (TCL) dit que pour de grands échantillons, la somme 
centrée et réduite de n variables aléatoires identiquement distribuées suit une loi Normale centrée et 
réduite. Et donc nous avons in extenso pour la moyenne empirique: 


M,,-H4 


oi n 


= N(0,D M4, = N(u, ain) (7.28) 
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Malgré l'immensité de son champ d'applications, le TCL n'est pas universel. Dans sa forme la plus 
simple, il impose en particulier à la variable considérée d'avoir des moments du premier et du deuxième 
ordre (moyenne et variance). Si tel n'est pas le cas, il ne s'applique plus. 


L'exemple le plus simple d'échec du TLC est donné par la distribution de Cauchy, qui n'a ni moyenne, 
ni variance, et dont la moyenne empirique a toujours la même distribution (Cauchy) quelle que soit la 
taille de l'échantillon. 


Maintenant, nous allons illustrer le théorème central limite dans le cas d'une suite (_X, ) de variables 


aléatoires indépendantes discrètes suivant une loi de Bernoulli de paramètre 1/2. 


Nous pouvons imaginer que #, représente le résultat obtenu au n-ème lancé d'une pièce de monnaie 
(en attribuant le nombre 1 pour pile et O0 pour face). Notons: 


— “| 
X,=-2X, (7929) 
7 kel 
la moyenne. Nous avons pour tout n bien évidemment: 
E(X,)=1/2 V(X,)=1/4 (7930) 


et donc: 


E(X, js 2 (x, F)=5214 pa (7.931) 
k=1 


# Ke] 


Après avoir centré et réduit ZX, nous obtenons: 
Z, -E(X,) 

(x) 
Notons ® la fonction de répartition de la loi Normale centrée réduite. 


Le théorème central limite nous dit que pour tout £ e IE : 
lim P(2H(X,-1/2)<t)=@() 55) 

A l'aide de Maple 4.00b nous avons tracé en bleu quelques graphiques de la fonction: 
tb AO=P(AM(X,-12)<t) 6059 


pour différentes valeurs de n. Nous avons représenté en rouge la fonction . 


x =]: 
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4 Es 0 2 + 


Figure: 7.39 - Première approche de la loi de Bernoulli par le loi Normale selon le TCL 


Figure: 7.40 - Deuxième approche de la loi de Bernoulli par le loi Normale selon le TCL 


Page: 496/4839 


[v3.0 - 2013] 


Figure: 7.42 - Quatrième approche de la loi de Bernoulli par le loi Normale selon le TCL 


Ces graphiques obtenus avec Maple 4.00b à l'aide des commandes suivantes: 


> with(stats): 
> with(plots): 
> e1:=plot(Heaviside(t+1)*statevalf[dcdf,binomiald[1,0.5]](trunc((t+1)/2)),t=-2..2,y-0..1,color-blue): 
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> e2:=plot(Heaviside(t+sqrt(2))*statevalf[dcdf,binomiald|2,0.5]] 
(trunc((t*sqrt(2}+2}/2)),t=-sqrt(2)-1..sqrt(2)+1,y-0..1,color=blue): 
> e3:=plot(Heaviside(t+sqrt(5))*statevalf[dcdf,binomiald[5,0.5]] 
(trunc((t*sqrt(5)+5}/2)),t=-sqrt(5)-1..sqrt(5)+1,y=0..1,color=blue): 
> e4:=plot(statevalf[cdf normald](t),t--5..5): 

> es:=plot(Heaviside(t+sqrt(30))*statevalf[dcdf,binomiald[30,0.5]] 
(trunc((t*sqrt(30)+30)/2)),t=-sqrt(30)-1..sqrt(30)+1,y-0..1,color=blue): 
> display({e1,e4}); 

> display({e2,e4}); 

> display({e4,e3}); 

> display({e5,e4}); 


montrent bien la convergence de F, vers æ. 


En fait nous remarquons que la convergence est carrément uniforme ce qui est confirmé par le 
"théorème central limite de Moivre-Laplace": 


Soit #, une suite de variables aléatoires indépendantes de même loi de Bernoulli de paramètre p, 
0 < p «1. Alors: 


A()=P(2n(X,-1/2) st) (7.935) 
tend uniformément vers P(:) sur IR lorsque # — co. 


13. TESTS D'HYPOTHÈSE ET D'ADÉQUATION 


Lors de notre étude des intervalles de confiance, rappelons que nous sommes arrivés aux quelques 
relations suivantes (ce n'est que l'échantillon des plus importantes démontrées plus haut!): 


XZ-Z, 9 =. HSÀ+Z = (536 
NA NA 
et: 
2 2 
_ Es ce se (7.937) 
Lar2() Fan) 
et: 
_ns2 _ne2 
a < PE (7.938) 
tant Far D 
et enfin: 
 : =. à 
ZT nn -DSus A+ Tr 1) (7.939) 
» NA 


qui permettaient donc de faire de l'inférence statistique en fonction de la connaissance ou non de la 
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moyenne ou de la variance vraie sur la totalité ou sur un échantillon de la population. En d'autres 
termes de savoir dans quelles bornes se situait un moment (moyenne ou variance) en fonction d'un 
certain niveau de confiance æ imposé. Nous avions vu que le deuxième intervalle ci-dessus ne peut 


être que difficilement utilisé dans la pratique (suppose la moyenne théorique connue) et nous lui 
préférons donc le troisième. 


Nous allons également démontrer en détails plus loin les deux intervalles suivants: 


Sos à à 
Fi22,) EN 0 F_ui2tr,m) se 


et: 
2 2 
D PS EL (7.941) 
Frot Lim 1) Se ee Fair 1lm-1) GE 


Le premier intervalle ci-dessus ne peut être lui aussi que difficilement utilisé dans la pratique (suppose 
la moyenne théorique connue) et nous lui préférons donc le deuxième. 


Définition: Lorsque nous cherchons à savoir si nous pouvons faire confiance à la valeur d'une 
statistique (moyenne, médiane, variance, coefficient de corrélation, etc.) avec une certaine certitude, 
nous parlons de "test d'hypothèse" et plus particulièrement de "test de conformité" (nous parlons de 
"test d'adéquation" quand il s'agit de vérifier que des mesures suivent bien une loi donnée et non juste 
une statistique). 


Les tests d'hypothèses sont destinés à vérifier si un échantillon peut être considéré comme extrait d'une 
population donnée ou représentatif de cette population, vis-à-vis d'un paramètre comme la moyenne, la 
variance ou la fréquence observée. Ceci implique que la loi théorique du paramètre soit connue au 
niveau de la population. Les tests d'hypothèses ne sont pas faits pour démontrer l'hypothèse nulle 
(exprimant généralement une égalité ou une homogénéité entre différentes populations), mais pour 
éventuellement la rejeter (dispons pour être exact que le rejet est plus robuste). 


Par exemple, si nous souhaitons savoir avec une certaine confiance si une moyenne donnée d'un 
échantillon de population est réaliste par rapport à la vraie moyenne théorique inconnue, nous 
utiliserons le "test-Z" qui est simplement: 


= T _ T 
tin SHS + Ton 


942) 


Fe (7.942 


Maintenant rappelons que nous avons démontré que si nous avions deux variables aléatoires de loi: 
N(4,c) N(4, 0) (7.943) 


alors la soustraction (différencier) des moyennes donne: 


Donc pour la différence de deux moyennes de variables aléatoires provenant de deux échantillons de 
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population nous obtenons directement: 


N|X,-X,, (7.945) 


goals. _ Z-u Z-4_ (Z-A)-(4 -4) 


= Eu : RE a, (7.946) 


La relation qui est très utile lorsque pour deux échantillons de deux populations de données, nous 
voulons vérifier s'il existe une différence significative des différences des moyennes théoriques à un 
niveau de confiance & fixé et la probabilité associée pour avoir cette différence: 


(7.947) 


Donc: 


izeale.| 


<[Zaa| (7.948) 


Nous parlons du "test-Z de la moyenne à deux échantillons" et il est beaucoup utilisé dans l'industrie 
pour vérifier l'égalité de la moyenne de deux populations de mesures. 


Et si l'écart-type théorique n'est pas connu, nous utiliserons le "test-7" de Student (pas mal utilisé en 
pharmaco-économie) démontré plus haut: 


2-+ Tm-DsHs R+T T2 — D (7.949) 


Dans la même idée pour l'écart-type, nous utiliserons le "test du Khi-deux" aussi déjà démontré plus 
haut: 


ICS _ (n—1)5? 


——————— (7950) 

Zar2r 1) Ha 1) 

Et lorsque nous voulons tester l'égalité de la variance de deux populations nous utilisons le "'test-F" de 
Fisher (démontré plus bas lors de notre étude de l'analyse de la variance): 


1 SE _or. 1 S% 


__—_—_— —] ——— 2 EE —————————————— (7.951) 
Fiat — L FR — LE Sy mn. Ann (x — L FR — 1} Se 


Dans la pratique il faut avoir conscience que le but d'un test est très très souvent de montrer que l'effet 
est significatif. Il est alors d'usage de dire que le test réussit si l'hypothèse nulle est rejetée au profit de 
l'hypothèse alternative. Lorsque le praticien sait que l'effet est significatif et pourtant que son test 
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échoue à rejeter l'hypothèse nulle on parle parfois du "dilemne du non rejet de l'hypothèse nulle". 
Comme nous le verrons un peu plus loin, l'idée est alors de calculer à posteriori la puissance du test 
(celle-ci étant alors appelée par certains logiciels comme SPSS: "puissance observée") et d'adapter la 
taille de l'échantillon en conséquence pour avoir une puissance acceptable selon la tradition d'usage. 


13.1. ORIENTATION DU TEST D'HYPOTHÈSE 


Le fait que nous obtenions l'ensemble des valeurs satisfaisant à un testborné à droite et (!) à gauche est 
ce que nous appelons dans le cas général un "test bilatéral" car il comprend le test unilatéral à gauche et 
unilatéral à droite. Ainsi, tous les tests susmentionnés sont dans une forme bilatérale mais nous 
pourrions en faire une utilisation unilatérale aussi! Nous utilisons un test unilatéral lorsque la différence 
attendue (ou à mettre en évidence) ne peut aller que dans un sens (typiquement dans le cas des essais 
cliniques ou lors d'un action corrective de contrôle qualité en industrie pour laquelle nous nous 
attendons à une amélioration allant dans une unique direction). Les test unilatéraux sont parfois 
nommés "test de non-infériorité" (unilatéral gauche) ou "test de non-supériorité" (unilatéral droite). 


Ci-dessous, nous avons représenté par exemple un test unilatéral à droite (car la région de rejet est à 
droite et donc la probabilité cumulée est unilatérale gauche) et un test bilatéral: 


5% 


Test unilatéral Test bilatéral 


Figure: 7.43 - Illustration d'un test (ou intervalle de confiance) unilatéral à droite et bilatéral 


Nous pouvons également résumer la manière de déterminer la p-value par le logigramme suivant: 
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type de test 
À bilatéral 
umilatéral < umilatéral 
gauche droite 
est-ce que La valeur ; 
du test est idroiteouàgauche 
du centre? 
Pins 
p-value= probabilité |  p-vahe=ledoublede | p-vale= le double de À  p-vale= probabilité | 
cumulée à gauche de la probabilité cumulée la probabilité cumulée cumulée à droite de la 
la distribution du correspondant à la comespondantäla distribution du test 
test statistique valeur du test àgauche valeur du test à droite statistique ou (1- 
ou le double de (1- probabilité cumulée) 
probabilité cammlée) 
valeur de seuil re seuil valeur de n valeur de seuil 
gauche oc gauche o12 
valeur du test valeur du test valeur du test valeur du test 


Figure: 7.44 - Figure de résumé pour déterminer la p-value lors de tests paramétriques à distribution symétrique 


Signalons aussi que les tests d'hypothèses sur l'écart-type (variance), la moyenne ou la corrélation sont 
appelés des "tests paramétriques" à l'inverse des tests non paramétriques que nous verrons beaucoup 
plus loin. 


Remarques: 


R1. Il existe également une autre définition du concept de test paramétrique et non-paramétrique 
(un peu différente car plus précise) à voir plus loin... 


R2. Attention! Certains auteurs ou professeurs parlent parfois de test "unilatéral à gauche" pour un 
"test unilatéral à droite". Au fait il s'agit simplement d'un choix de vocabulaire. Si la référence 
pédagogique n'est pas la zone de rejet mais la zone d'acception, alors il est clair que les concepts de 
droite et gauche s'inversent…. 


Enfin, de nombreux logiciels calculent ce que nous appelons la "p-value" qui est le risque calculé 
(probabilité) & qu'aurait pu fixer le statisticien pour être à la limite entre l'acceptation de l'hypothèse 


nulle et son rejet (rappelons qu'un test qui réussit ne prouve rien). La p-value est donc une valeur 
fondamentale dans le domaine car elle permet de chiffrer la vraisemblance de l'hypothèse nulle A, 
(acception ou rejet). 


Pour un test d'hypothèse, par exemple, le 5% de risque & est celui de rejeter l'hypothèse nulle 4; 


alors même qu'elle est vraie. Si le risque imposé/choisi est 5% et que la p-value calculée est inférieure 
(dans la majorité des tests mais il faut être prudent car ce n'est pas une généralité! !!), le test échoue 
(rejet de l'hypothèse) en faveur d'une hypothèse alternative notée #, ou parfois À 1. 
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L'hypothèse alternative a bien évidemment elle-même son propre risque que nous notons & et sa 


propre p-value. 


Peut-être, pour mieux comprendre, voici une illustration d'un cas particulier d'un test d'hypothèse 
bilatéral de la moyenne pour une variable aléatoire suivant typiquement une loi Normale (en gros c'est 
le même principe pour tous les tests….): 


#0 = 0 
& = Erreur de Type I 


A :4=25 
8 = Erreur de Type I 


Dh} 


Figure: 7.45 - Hypothèse nulle et alternative d'un test bilatéral particulier 


Ainsi, dans le cas présenté ci-dessus, nous voyons mieux pourquoi l'hypothèse nulle peut donc être 
acceptée ou rejetée en faveur de l'hypothèse alternative (qui est de même loi que l'hypothèse nulle mais 
juste décalée) dépendant de la valeur de référence mesurée qui sera utilisée pour le test (en l'occurence 
dans le cas particulier il s'agit de la moyenne arithmétique des mesures). 


Nous remarquons aussi que la zone rouge de l'hypothèse alternative, correspondant à la probabilité 
cumulée £ , est confondue en partie avec la partie jaune de l'hypothèse nulle. Raison pour laquelle nous 


pouvons parfois accepter l'hypothèse nulle à tort. Nous voyons cependant que plus & serait petit, plus 


l'hypothèse alternative serait donc éloignée de la zone limite rouge de l'hypothèse nulle (cela 
correspondrait à une translation vers la droite dans le cas présent) et moins la probabilité de faire une 
fausse conclusion est grande. Raison pour laquelle nous parlons de "risque 8" car plus celui-ci est 


petit, mieux c'est. In extenso, plus 1- & est grand, moins il y a de risque de confondre l'hypothèse 
nulle et alternative. Raison pour laquelle 1- & est appelé puissance du test" (voir plus bas la section 
qui est consacrée à cette notion). 


Nous acceptons l'hypothèse nulle si la p-value est plus grande que 5% (0.05). Au fait, plus la p-value 
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est grande, mieux c'est car l'intervalle de confiance est de plus en plus petit. Si l'intervalle de confiance 
vient à être énorme (très proche de 100%) car la p-value est très petite alors l'analyse n'a plus vraiment 
de sens physiquement parlant! 


Ainsi, si la p-value est faible, c'est qu'il faudrait prendre un risque faible de se tromper, donc accepter 
dans presque tous les cas l'hypothèse testée. 


Remarque: 


Nous ne devrions jamais dire que nous "acceptons" une hypothèse ou encore qu'elle est "vraie" ou 
J 

"fausse" car ces termes sont trop forts et pourraient faire penser à une preuve scientifique. Nous 

devrions dire si nous "rejetons" ou "ne rejetons pas" l'hypothèse nulle et qu'elle est éventuellement 

"correcte" ou "non correcte”. 


Pour les test d'hypothèses bilatéraux, nous pouvons par exemple dire que nous avons (ou n'avons 
pas) une différence significative entre la valeur de référence mesurée et la valeur attendue. Pour les 
tests unilatéraux, nous pouvons dire que la valeur de référence mesurée est significativement plus 
grande ou plus petite que la valeur attendue. 


Par ailleurs si le lecteur a bien compris la construction des tests d'hypothèses, le fait de rejeter une 
hypothèse à tort ("Erreur de Type l" ou "Erreur de première espèce") est donc plus robuste que de 
l'accepter à tort ("Erreur de type Il" ou "Erreur de deuxième espèce"). 


Le lecteur remarquera aussi en s'aidant de la figure précédent qu'un test unilatéral a une plus forte 
puissance qu'un test unilatéral (a même niveau de risque bien entendu!). Ainsi, une différence non 
significative en test bilatéral, peut s'avérer significative en unilatéral. 


Définitions: 


D1. La probabilité & de l'erreur de Type I (de première espèce/faux négatif) est la probabilité de rejet 
de l'hypothèse nulle alors qu'elle est vraie. 


D2. La probabilité & de l'erreur de Type IT (de deuxième espèce/faux positif) est la probabilité de 
maintien de l'hypothèse nulle alors qu'elle est fausse. 


Pour clore, voici les trois situations types de tests d'hypothèses sur la statistique qu'est la moyenne dans 
le cadre d'une distribution sous-jacente normale et dont l'espérance est dans ce cas particulier supposée 
nulle et de variance unitaire (car on peut très souvent ce ramener à ce cas particulier en centrant et 
réduisant la variable aléatoire sous-jacente): 
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F0) F(x) = 50% 


0.3 #0 : À; : > 0 
Zone de rejet 
+ 
0.1 
ne 
(Zoritique | 
J (x) F(x) = 50% 
0.4 : 
0. 
A: 4 <0 De 0 
0.2 d'acceptation 
0.1 
Z 
2 rique | 
F@) F(x) = 50% 
0.4 2 
lH:ue0 H, H:4%#0 


0.2 Zone de rejet n Zone de rejet 


Zeritique 


Z crifique | 


Figure: 7.46 - Les trois scénarios possibles d'un test d'hypothèse sur la moyenne 


Indiquons que cela n'a aucun sens (contrairement à ce que nous pouvons parfois lire sur certains 
supports papier ou électronique) d'avoir les hypothèses nulles suivantes dans le cas paticulier représenté 


ci-dessus: 


Hj:u>0 (7.952) 
#0 NE 0 


avec l'hypothèse alternative qui en découle automatiquement (je ne l'ai pas écrite car c'est inutile). La 
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raison en est simple: comment pourriez-vous positioner votre distribution Normale centrée réduite si 
l'espérance n'est pas fixée..??? Raison pour laquelle l'hypothèse nulle dans le cadre des tests sur la 
moyenne (et d'un certain autre nombre de tests) est toujours une égalité! 


Pour résumer, nous pouvons dire que si nous prenons une décision, nous pouvons nous tromper et il 
vaut mieux éviter de se tromper souvent. En clair, la probabilité de dire une bêtise doit être connue et 
de préférence petite. 


13.2, PUISSANCE D'UN TEST 


Lorsque l'effet est concrètement important, on imagine bien qu'il faut moins d'observations pour le 
démontrer que lorsqu'il est petit. mais combien au juste? A-t-on les moyens, en termes de nombre de 
mesures, de démontrer ce que l'on cherche? Faut-il s'y prendre autrement et changer le dispositif de son 
observation/expérimentation? 


Pour étudier plus en détails la notion de "puissance de test" que nous avons jusque là uniquement 
mentionnée, rappelons la figure suivante déjà rencontrée juste un peu plus haut: 


#0 : = 0 
& = Erreur de Type I 


AH :4=25 
£ = Erreur de Type I 


en D = ee 0e ne ee 0 ee 0 ee ee ee © © © © © ee ee me en ee en 0 © ne = = he 


Dans l'exemple particulier ci-dessus, nous allons donc rejeter l'hypothèse nulle si Z + 1 96 ou si 
X <-—1 96. Imaginons que dans le cadre de l'hypothèse alternative, si nous avons mesuré 2.5, nous 
aurons comme puissance du test: 


| < Zn) = 1-0.2946 = 0.705 (7.953) 
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Donc le test est relativement puissant (dans la pratique, nous considérons un test comme étant puissant 
si sa valeur est au-delà de 80%). Ainsi, nous remarquons que la puissance 1— & (a posteriori!) est 


d'autant plus grande que la p-value sera petite (et respectivement la puissance sera à posteriori d'autant 
plus petite que la p-value sera grande). Donc la puissance a posteriori est en correspondance 
décroissante avec la p-value (dans la pratique il est cependant un peu absurde de faire ces calculs a 
posteriori). 


13.2.1. PUISSANCE DU TEST Z À 1 ÉCHANTILLON 
En toute généralité, dans le cas d'un test bilatéral, la relation précédente s'écrira donc: 
1 8=1- 2 Pyigss 44 Ztan |= 1 Pi yo) SH XZ+Z nl (7954) 
Si l'écart-type de la moyenne n'est pas été unitaire, nous avons: 
1- 8=1-PIF; 


10,œ-1 SH +21 4nT | (7.955) 


Il vient donc: 


ps 


1- 6=1-P F1) 


- X 
+ Zi-x92 =1- Pa ÉF+ a | (7.956) 


autrement écrit: 


u-X 
1— B=1-? (01) < pu Vr+Zian | 1 Pot) ÉCANCES ART .. 
.957 


= PF) Ze" ddr = PFtory € Zac do Nr 


C'est sous cette forme que nous retrouvons la puissance d'un test bilatéral de la moyenne (puissance Z à 
1 échantillon): 


1 8= P|Frto1) S 2x2 -d Nr | (7958) 
où d est parfois appelé la "taille d'effet" et est donc donné par: 


HZ _S 3959 
œ 


ä = —= 
L œ 
et 5 est nommé la "différence"! 


Il va de soit que si la variance vraie n'est pas connue, il faut alors remplacer la loi Normale par la loi de 
Student tel que: 


1 8= Pi Fiton) < Tan = sd) (7.960) 
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avec: 


Remarque: Attention à un petit piège courant! Le développement ci-dessus correspond à un % qui 
est donc négatif relativement à l'exemple de départ! La relation est un peu différente dans le cas où 
ä est positif mais cela n'a aucune importance car la puissance du test est identique valeur absolue! 


Pour avoir la taille de l'échantillon c'est assez simple. Nous avons: 
Z-g = Zan —d on (7.962) 


et donc en bilatéral: 


à 


[e} 


2 
Lin —Z 
(2e) (7.963) 


où nous voyons que si la puissance du test est imposée comme étant égale à 50%, ayant Z qui vaut alors 
0 nous retombons (! )sur la relation de l'effectif de l'échantillon pour loi Normale démontrée bien plus 
haut: 


2 
n = Zan® (7.964) 
ô 


Signalons aussi que nous retrouvons parfois dans la littérature la relation antéprécédente sous la forme 
suivante: 


2 
 (Zian +A-p) 


EE (7.965) 
| Ag — A | 


Évidemement nous pouvons fixer d'autres paramètres pour déterminer la valeur de la variable restante. 
Nous pourrions par exemple chercher la valeur de la puissance du test en imposant l'écart-type, la taille 
de l'échantillon et le niveau de confiance, etc. 


Un lecteur nous a proposé une maniêtre très élégante de retrouver le même résultat avec beaucoup 
moins de développements... Effectivement, il suffit de voir sur la figure précédente que nous avons: 


T  — T 
La——+Â = Zi pm —+Hh (7.966) 
ê æ en 


Donc nous tirons immédiatement une relation équivalement aux deux précédentes (qui donne bien 
évidemment le même résultat numérique): 
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2 
TZ g — Z-x/2 | 
u-X 


A = 


Remarque: Le lecteur attentif aura peut-être remarqué que nous avons supposé dans les 
développements qui précédent que l'écart-type de la moyenne vraie et aternative (estimée) est 
implicitement supposée être la même... Dans la pratique cela est presque tout le temps le cas, raison 
pour laquelle les quasi totalité des logiciels de statistiques ne demandent qu'un seul écart-type pour 
le calcul de la puissance du test Z à 1 échantillon. Cependant, dans certains rares logiciels 
universitaires, on demande l'écart-type des deux moyennes. Mais dès lors les développements 
ci-dessus sont différents. 


Une analyse de puissance peut avoir plusieurs facettes: 


1. Nous connaissons le niveau du test, la taille d'échantillon et la taille d'effet (implicitement la 
différence) et nous cherchons à calculer la puissance. Ceci permet de voir si notre dispositif 
expérimental est bien calibré. 


2. Nous connaissons la puissance voulue, le niveau du test et la taille d'effet à détecter. Nous cherchons 
alors à calculer la taille d'échantillon nécessaire pour monter un dispositif expérimental efficace. 


3. Nous connaissons la puissance voulue, le niveau du test et la taille d'échantillon et nous cherchons à 
vérifier qu'elle taille d'effet nous pouvons espérer mettre en évidence. 


Sauf exception, nous considèrerons qu'il est inutile de montrer un test si la puissance escomptée est 
inférieure à 80%. Cette puissance correspond à une probabilité de 80% de ne pas rejeter l'hypothèse 
nulle à tort, ou, ce qui revient au même de 20% d'erreur de type II. 


Évidemment, il est possible de faire le même raisonnement (analytiquement quand c'est possible, sinon 
numériquement) avec absolument TOUS les tests d'hypothèses que nous avons vus jusqu'à maintenant. 
Donc au même titre qu'il y a un peu plus d'une centaine de tests d'hypothèses dans le domaine des 
statistiques comme nous l'avons déjà mentionné. il est évident que nous n'allons pas nous... amuser... à 
faire les mêmes développements pour tous ces tests mais seulement pour les grands classiques. Tant que 
nous avons des ordinateurs à notre disposition avec les algorithmes intégrés par des 
informaticiens/scientifiques, nous pouvons nous passer de refaire tous les développements qui 
n'apporteraient pas grand chose. Par ailleurs, la majorité des logiciels comportement des outils pour 
calculer la puissance de 5 à 10 tests le plus souvent. 


Remarque: Nous ne traiterons pas des tests statistiques paramétriques de détection des valeurs 
abérrantes sur ce site comme le test Q de Dixon ou de Grubb pour la simple raison qu'ils ont une 
origine trop empirique et qu'ils n'ont aucun intérêt analytiquement parlant. Par contre, si des 
lecteurs insistent, nous pourrons mettre les détails sur ces tests avec les algorithmes détaillés de 
calcul des valeurs critiques en utilisant un simple tableur et la technique de Monte-Carlo pour 
n'importe la distribution de leur votre choix (mais pas uniquement selon la loi Normale 
contrairement à ce qui est écrit dans la majorité des livres). 


Page: 509/4839 


[v3.0 - 2013] 


13.3. PUISSANCE DU TEST P À 1 ET 2 ÉCHANTILLONS 


De même que l'intervalle de confiance de la loi Normale avec écart-type théorique connu (c'est-à-dire 
sur toute la population), nous pouvons déterminer le nombre d'individus (taille d'échantillon) si nous 
souhaitons imposer une puissance au test de la proportion à 1 échantillon étudié plus haut. Pour cela, 
nous utilisons la même technique que pour la puissance du test Z. Nous écrivons alors dans un premier 


temps: 
Zg IP +B= Zn [pa +p (7.968) 
# # 


2 
L Z 8 NP8 -Zi-r VPa 


D'où nous déduisons: 


L (7.969) 
PP 
Donc si la puissance est de 50%, nous retrouvons bien: 
Zénp(-p) _ ZinPa 
ne SAR ENT F7 LT (7970) 


6? 6? 


Pour la puissance du test de la différence de deux proportions (test de la proportion à deux 
échantillons) dans l'objectif de déterminer la taille de l'échantillon nous sommes obligés de poser 
# = #3 = x. Dés lors, les développements obtenus lors de l'étude du test de la différence de deux 


proportions s'écrivent: 


7 = à - À 7 
. ST 1 2pi1-p: 2P4 (7.971) 
pil-fl—+— —_—— 
#4 # de 


avec: 


Mè +2p2 _A\À thai À +2 
# +#3 2# 2 


Ê= (7.972) 


De la même manière que nous l'avons fait pour le test Z et le test p à 1 échantillon, nous avons: 


# # # # 2p4 p + "7 072 
ZA Pa - À +82 = Zen fE + À 5 2 (7.973) 


Soit: 


L 
"> 
_. 
NI 
to 
NI 
E 


PA F | _ +: _ i=£ . 
8\ P27F P277 Lai, 
Ce qui revient donc à supposer que la différence vraie des deux proportions est la moyenne (ce qui est 
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discutable….). 


Mais nous avons aussi (comme les échantillons sont indépendants de par la propriété de la variance): 


A An An An 254 “: EN 
Ze PB + VB +85 — À = Zran +5 (7975) 


Soit: 


ES 


À di POTE 2pq 


À 7 


[A à + Pad à 24,2 ès 
Zg MAR + Ba — Pi = Zi-ar9 pa +? (7.977) 


Nous avons alors après réarrangement: 


2 
7 Aà + Pad - Zi nee 
SVP TP292 — -x/2 NP (7.978) 


BP 


+ FA (7.976) 


+82 — À11= Zi 


ce qui nous donne: 


13.4, ANALYSE DE LA VARIANCE (À UN FACTEUR) 


L'objectif de l'analyse de la variance (contrairement à ce que son nom pourrait laisser penser) est une 
technique statistique permettant de comparer les moyennes de deux populations ou plus (très utilisé 
dans le pharma ou dans les labos de R&D ou de bancs d'essais). Cette méthode, néanmoins, doit son 
nom au fait qu'elle utilise des mesures de variance afin de déterminer le caractère significatif, ou non, 
des différences de moyennes mesurées sur les populations. 


Plus précisément, la vraie signification est de savoir si le fait que des moyennes d'échantillons sont 
(légèrement) différentes peut être attribué au hasard de l'échantillonnage ou provient du fait qu'un 
facteur de variabilité engendre réellement des échantillons significativement différents (si nous avons 
les valeurs de toute la population, nous n'avons rien à faire!). Pour plus d'informations au niveau du 
vocabulaire et la mise en application, l'ingénieur et le chercheur se reporteront à la norme 

ISO 3534-3:1999. 


Pour l'analyse de la variance appelée "ANOVA à un facteur" (ANalysis Of VAriance) ou "ANAVAR à 
un facteur" (ANAlyse de la VARiance), ou encore "ANOVA à une voie" ou plus rigoureusement 
"ANOVA à un facteur fixe avec répétitions" ou encore "ANOVA à une variable catégorielle fixe avec 
répétition", nous allons d'abord rappeler, comme nous l'avons démontré, que la loi de Fisher-Snedecor 
est donnée par le rapport de deux variables aléatoires indépendantes qui suivent une loi du Khi-deux et 
divisée par leur degré de liberté tel que: 
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ECS + 
UE _ p (pe 2 JU x2 _—. 
— = Fi tH 1. J7/ 
7 OA) 

2 2 MURS 


et nous allons voir maintenant son importance. 


Considérons un échantillon aléatoire de taille n, disons X1..., #, issu de la loi N{xy,ay) et un 


échantillon aléatoire de taille m, disons  .….,F,, issu de la loi {y ,@y ). 


Considérons les estimateurs du maximum de vraisemblance de l'écart-type de la loi Normale 
traditionnellement notés dans le domaine de l'analyse de la variance par: 


ñ 1 
Le 2 SCE He) et Sy 20 4 (7.980) 
3=l 


À ;2 


Les statistiques ci-dessus sont celles que nous utiliserions pour estimer les variances si les moyennes 
théoriques #7,{# étaient connues. Donc nous pouvons utiliser un résultat démontré plus haut lors de 


notre étude des intervalles de confiance: 


mSË 


a * = 


= Y{(m) (7.981) 


Comme les F; sont indépendantes des X; (hypothèse qui implique que la covariance est nulle, la 
réciproque n'étant pour rappel pas toujours vraie!), les variables: 
ns? F4 mSË 
a‘ 


(7.982) 


sont indépendantes l'une de l'autre. 


Remarque: Il existe un type d'ANOVA prévu pour le cas où les variables ne sont pas indépendantes 

(on parle alors de "covariable"). I s'agit de l'ANCOVA qui signifie "Analyse de la COvariance et de 
la VAriance" qui utilise un mix entre la régression linéaire (cf. chapitre de Méthodes Numériques) et 
l'ANOVA. Le but de l'ANCOVA est de supprimer statistiquement l'effet indirect de la covariable. 


Nous pouvons donc appliquer la loi de Fisher-Snedecor avec: 


y 


X 


U = 


et£&=}» (7.983) 


ainsi que: 
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et J=m (7.984) 


Nous avons donc: 


a 


mt) (7.985) 
2 2 2 2, 
VIT me, Se Sy a+ 


Soit: 


(7.986) 


Ce théorème nous permet de déduire l'intervalle de confiance du rapport de deux variances lorsque la 
moyenne théorique est connue. Puisque la fonction de Fisher n'est pas symétrique, la seule possibilité 
pour faire l'inférence c'est de faire appel au calcul numérique et nous noterons alors pour un intervalle 
de confiance donné le test de la manière suivante: 


2 
[1 dd. 1 % 
FerQrm) Sy Of Aa) Sy 


(7.987) 


Dans le cas où les moyennes {ÿ,{## Sont inconnues, nous utilisons les estimateurs sans biais des 
variances traditionnellement notés dans le domaine de l'analyse de la variance par: 


à -Xÿ et 2 = > (r Fr) (7.988) 


2 1 
SY = = 
#—15 Fe je 


Pour estimer les variances théoriques, nous utilisons le résultat démontré plus haut: 


2 
RE F(n-D et De m9 (7.989) 


Comme les F; sont indépendantes des X; (hypothèse!), les variables: 


CS 


| (7.990) 
X ‘À 
sont indépendantes l'une de l'autre. Nous pouvons donc appliquer la loi de Fisher-Snedecor avec: 
_ne2 
ve CT pey-1 con 
ox 


ainsi que: 
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hs 
= Gr > EL étl=m] (4290) 
y 
Nous avons donc: 
152 2 
Dix _ or es 0% _ SY cé . F { } (7.993) 
VI ae EE C2. nl,me-1 (A ss 
a e 
Soit: 
2 
Cr _ — "2 (7.994) 
œ El (2) Sy 


Ce théorème nous permet de déduire l'intervalle de confiance du rapport de deux variances lorsque la 
moyenne empirique est connue. Puisque la fonction de Fisher n'est pas symétrique, la seule possibilité 
pour faire l'inférence c'est de faire appel au calcul numérique et nous noterons alors pour un intervalle 
de confiance donné le "test de Fisher" de la manière suivante: 


1 Sr ox 1 o- 


—————— —< E ——————— —| (7995 
Fat — Le —1) Sy ee Fair 1) Le 


tout en se rappelant que son utilisation nécessite implicitement des contraintes de normalité des 
variables étudiées. 


R. A. Fisher (1890-1962) est, comme Karl Pearson, l'un des principaux fondateurs de la théorie 
moderne de la statistique. Fisher étudia à Cambridge où il obtint en 1912 un diplôme en astronomie. 
C'est en étudiant la théorie de l'erreur dans les observations astronomiques que Fisher s'intéressa à la 
statistique. Fisher est l'inventeur de la branche de la statistique appelée l'analyse de la variance. 


Au début du 20ème siècle, R. Fischer développe donc la méthodologie des plans d'expérience (cf. 
chapitre de Génie Industriel). Pour valider l'utilité d'un facteur, il met au point un test permettant 
d'assurer que des échantillons différents sont de natures différentes. Ce test est basé sur l'analyse de la 
variance (des échantillons), et nommé ANOVA (analyse normalisée de la variance). 


Prenons k échantillons de n valeurs aléatoires chacun. Chacune des valeurs étant considérée comme 
une observation ou une mesure de quelque chose ou sur la base de quelque chose (un lieu différent, ou 
un objet différent. bref: un seul et unique facteur de variabilité entre les échantillons!). Nous aurons 
donc un nombre total de N d'observations (mesures) donné par: 


N — Fa .n (7.996) 


si chacun des échantillons a un nombre identique de valeurs n (taille de l'échantillon) tel que 
# = #... = #4 NOUS parlons alors de "plan équilibré" à k niveaux (ou k modalités). 
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Remarque: Si nous avons plusieurs facteurs de variabilité (par exemple: chaque lieu compare à 
lui-même plusieurs laboratoires), nous parlerons alors d'ANOVA multifactorielle. Dès lors, s'il n'y a 
que deux facteurs de variabilité, nous parlons d'ANOVA à deux facteurs (voir plus loin pour plus de 
détails). 


Nous considérerons que chacun des k échantillons est issu (suit) d'une variable aléatoire suivant une loi 
Normale. 


Facteur 1 
Échantillon 1 Échantillon 2 Échantillon….ilÉchantillon k 
x] 2 re | Xi 
21 X2 de + 
m | 
Xi Xn2 p | Xien 
Moyenne: x Moyenne: x; | Moyenne: x Moyenne: X, 


Figure: 7.47 - Structure typique dite "croisée" d'une analyse de la variance à 1 facteur 


En termes de test, nous voulons tester si les moyennes des k échantillons de taille n sont égales sous 
l'hypothèse que leurs variances sont égales. Ce que nous écrivons sous forme d'hypothèse de la manière 
suivante: 


Autrement dit: les échantillons sont représentatifs d'une même population (d'une même loi statistique). 
C'est-à-dire que les variations constatées entre les valeurs des différents échantillons sont dues 
essentiellement au hasard. Pour cela nous étudions la variabilité des résultats dans les échantillons et 
entre les échantillons. Il revient exactement au même de poser que (formulation qu'on retrouve dans 
certains articles ou ouvrages): 


#0 : Ta = 0 
(7.998) 
À, : Ti > (] 


Nous noterons donc pour la suite i l'indice d'échantillon (de 1 à k) et j l'indice de l'observation (de 1 à 
n). Donc x;; sera la valeur de la j-ème observation de l'échantillon de données numéro i (nous avons 


choisi d'inverser la notation d'usage donc attention à ne pas vous tromper par la suite. nous sommes 
désolés. c'était une bêtise!). 


Selon l'hypothèse susmentionnée, nous avons: 


Xy = N(4,c?) (7.999) 


Nous noterons par x, la moyenne empirique/estimée (arithmétique) de l'échantillon i (souvent appelée 
"moyenne marginale"): 
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W We 
2x5 225 =%X (71000) 


En utilisant les propriétés de l'espérance et de la variance déjà démontrées plus haut nous savons que: 
x; = N(4,c? 1) et x=My,o?{N) (7.002) 


avec # qui est la moyenne des moyennes vraies 4 : 


1 À 
M=— 544 (71003) 
& =] 


Maintenant, introduisons 3 variances: 


1. La "variance totale" comme étant intuitivement la variance estimée sans biais en considérant 
l'ensemble des N observations comme un seul échantillon: 


{2 
Lx _ x) (7.1004) 


N-1 


Pr = 


LL 


où le terme au numérateur est appelé "somme des carrés des écarts totaux". 


2. La "variance entre échantillons" (c'est-à-dire entre les moyennes des échantillons) est aussi 
intuitivement l'estimateur de la variance des moyennes des échantillons: 


2x -) 
| (7.1005) 
Vy = 
&-—1 
où le terme au numérateur est appelé "somme des carrés des écarts entre échantillons". 


Comme nous avons démontré que si toutes les variables sont identiquement distribuées (même 
variance) et indépendantes la variance des individus vaut n fois celle de la moyenne: 


Tr = SV(Lin=V(X) (71006) 


_ 


alors la "variance des observations" (variables aléatoires dans un échantillon) est donnée par: 
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» 
#Z (x -?) (7.1007) 


Wa = A: Ve = J 
&—1 
Nous avons donc ci-dessus l'hypothèse de l'égalité des variances qui est exprimée sous forme 
mathématique pour les développements à suivre. 


3. La "variance résiduelle" est l'effet des facteurs dits non contrôlés. C'est par définition la moyenne des 
variances des échantillons (en quelque sorte: l'erreur standard): 


2 2 
(x -x) 2x L x) (7.1008) 
ED on k@) 


où le terme au numérateur est appelé "somme des carrés des écarts des résidus" ou encore plus souvent 
"erreur résiduelle". 


Au final, ces indicateurs sont parfois résumés sous la forme suivante: 


=\2 ©r 

Er = Z(x 7) ddlr =N-1=7-1 7 

” + _=Ÿ : _ Lu 
Qa=n2 (x -?) dela = k—1 Wa=— (71009) 

5 dé y 

2 
QR= Tax)  ddip=kn-n Ve £E 
ddl 


Remarquons que si les échantillons n'ont pas la même taille (ce qui est rare dans la pratique), nous 
avons alors: 


ii Qr 
Or = Lx -?) dre N1 Per 
- =12 24 
Qa=Dn(x-7) dla =k-1  Wy=<£| (71010) 
dal y 
_ 12 OR 
OR Z(xy-2) di-Zei-0 Vr=-Ée 
- ; ddl? 


Page: 517/4839 


[v3.0 - 2013] 


Remarques: 


R1. Le terme @- est souvent indiqué dans l'industrie par l'abréviation SST signifiant en anglais 
"Sum of Squares Total" ou plus rarement TSS pour "Total Sum of Squares". 


R2. Le terme ©, est souvent indiqué dans l'industrie par l'abréviation SSB signifiant en anglais 


"Sum of Squares Between (samples)" ou plus rarement SSk pour "Sum of Squares Between 
treatments". 


R3. Le terme @; est souvent indiqué dans l'industrie par l'abréviation SSW signifiant en anglais 
"Sum of Squares Within (samples)" ou plus rarement SSE pour "Sum of Squares due to Errors”. 


Indiquons que nous voyons souvent dans la littérature (nous réutiliserons un peu plus loin cette 
notation): 


QR=>(x -x) = BDs (x,-x) _C&= 


Ÿ ( E 1) ÿ (2; = D) i=1 ;=l 


k # 1 2 À . 
= 2x -DD— (x -7) = 2% -DS 
a ji@4-) 


= 


(7.1011) 


avec donc l'estimateur sans biais de la variance des observations: 


# 
2x -x) (7.1012) 


RH — 1 j=1l 
Avant d'aller plus loin, arrêtons-nous sur la variance résiduelle. Nous avons donc pour des échantillons 
qui ne sont pas de même taille: 


26% 1) 


Ouvrons maintenant une petite parenthèse. Prenons le cas particulier de deux échantillons seulement. 
Nous pouvons alors écrire: 


(7.1014) 


mm = 25 
ï Ca —1)+ 02 —1) M +% —2 


La = :) +2 (x -2) (x: À J +2 _ 2) 


Soit en introduisant l'estimateur du maximum de vraisemblance de la variance: 
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7. _ Ca = DST + Cr = DS 
L # +2 — 2 


(7.1015) 


Nous pouvons d'ailleurs observer que dans le cas particulier où: 
M=#=A (7.016) 
alors: 


” CAS SE +nSt 57  n(S +55) (SE +57) (DS +85) S+S his 
2 ST 9 M 2 A A pr, 


n+n-2 Un-—1) 2(n —T) 


Sè <P <S2 (71018) 
Supposons maintenant que nous souhaitions comparer avec un certain intervalle de confiance la 


moyenne de deux populations ayant une variance différente pour savoir si elles sont de natures 
différentes ou non. 


Nous connaissons pour le moment deux tests pour vérifier les moyennes. Le test-Z et le test-T. Comme 
dans l'industrie il est rare que nous ayons le temps de prendre des grands échantillons, 
concentrons-nous sur le deuxième que nous avions démontré plus haut: 


2-0 =D <us F4 ne —1) (71019) 
c c 
Et rappelons aussi que: 


S 
Sz=—— (71020) 


Vh 


Maintenant rappelons que nous avons démontré que si nous avions deux variables aléatoires de loi: 
N(4,c) Né, ) (7.1021) 
alors la soustraction (différencier) des moyennes donne: 


Na - PAL + à) (7.1022) 


Donc pour la différence de deux moyennes de variables aléatoires provenant de deux échantillons de 
population nous obtenons directement: 


. L : L ç2 2 
N2-2,/5h+58)=N +. _ (71023) 


#2 


Et maintenant l'idée est de prendre l'approximation (sous l'hypothèse que les variances sont égales): 
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Pr =. _— | 
N|X,-X, se zN|X,-X, + ]|2n| x, -2X,, AE (7.1024) 
Se M1, #4 1 7 


Cette approximation est appelée "hypothèse homoscédastique". 


Nous avons alors l'intervalle de confiance: 


X x Î Î x F 1 1 WA Pie 
(Z, -Z)- (Lire D<x-ns<(X,-X)+ (Lan (7.1025) 


Comme l'idée dans la pratique est souvent de tester l'égalité des moyennes théoriques (et donc que leur 
différence est nulle) à partir des estimateurs connus alors: 


(2-2) fe — Tai <S0<(Z,-ZX +, a Tiotr—1) (71026) 
7 # # #3 


avec: 
#A=M+A23 (7.1027) 


Dans la plupart des logiciels disponibles sur le marché, le résultat est uniquement donné à partir du fait 
que le 7; que nous avons est compris dans le 7°,;, correspondant à l'intervalle de confiance donné 
rappelons-le par: 


Ted. (y 1) = (2 - À )-(46 — à) 


(7.1028) 
#1] #3 


dans le cas de l'hypothèse homoscédastique (égalité des variances/homogénéité des variances). 


Remarque: Cette dernière relation est appelée "independent 2-sample T-test", ou "test-T 
homoscédastique" ou encore "test-T d'égalité des espérances de 2 observations avec variances 
égales" ou encore plus simplement mais un peu abusivement "'test-T à 2 échantillons", avec taille 
des échantillons différentes et variances égales. Souvent dans la littérature, les deux moyennes 
théoriques sont égales lors de la comparaison. Il s'en suit que nous avons alors: 


Tel. (y — 1) = 
1 ai (7.1029) 


Sinon, dans le cas plus général de l'hypothèse d'hétéroscédasticité (non égalité des variances), nous 
écrivons explicitement: 
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qoale. (x _ 1) 


(Z = X)-(4 — 4) 
s,$ (7.1030) 


#4 #2 


Donc: 


ra -D|<ÎT2@-D] 61080 


Remarque: La relation antéprécédente est appelée "independent two-sample T-test", ou "test-T 
hétéroscédastique" ou encore "test d'égalité des espérances: deux observations avec variances 
différentes". Si la taille des échantillons est égale et que les variances le sont aussi et que nous 
supposons les deux moyennes théoriques égales lors de la comparaison, il s'ensuit que nous avons 
alors: 


À2 — À 


9 (7.1032) 
u£ 
À 


Bref, fermons cette parenthèse et revenons à nos moutons... Nous en étions donc au tableau suivant: 


qoaie. (x _ 1) _ 


=\2 ©r 
Er = Z(x 7) ddlr =N-1=X2-1 = 
L 3, 7) = = 4 22 
5 dal , 
2 
QR=Z(x;-2)  oddle=k-n  Vr=-£e 
5 ddlà 


où nous avons donc dans le cas d'échantillons de même taille: 
délr = ddl, +ddls = k-1+k(x-D=k-1+k%-k=km-1 (71034) 


Ainsi que l'erreur totale qui est la somme de l'erreur des moyennes (interclasses) et de l'erreur résiduelle 
(intra-classes) et ce que les échantillons soient de même taille ou non: 


Or = Q a +Orl (71035) 


Effectivement: 


Qr=Z(xy-) 222 (4-7) =Z2((x-2)+(5-5)) 


ÿ i j i j 


=ZE(n-2) +22(x-7) +222 (0 -7)(5-7) 


(7.1036) 
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Or, nous avons: 


Car: 


Donc: 
Or = ZE À Ÿ +22(% -3) = Or +04 (7.1039) 
ï J i j 


Maintenant, sous l'hypothèse forte (qui va nous être indispensable un peu plus loin) que les variances 
vraies sont liées par la relation: 


oÀ = oi = cÀ =? (7.040) 


et donc que leurs estimateurs respectifs sont asymptotiquement égaux... ce qui dans la pratique n'est 
approxivement vrai que lorsque certaines conditions sont satisfaites (raison pour laquelle il faut 
absolument avant de faire une ANOVA exécuter un calcul de la puissance et de l'effectif d'une 
ANOVA) nous avons: 


Z(x-7 É 
OR = Ÿ 20 
#2 L pe ANR 


ce qui découle immédiatement de la démonstration que nous avions faite lors de notre étude de 
l'inférence statistique avec la loi du Khi-deux où nous avions obtenu (pour rappel): 


(7.1041) 


ar —12 _ 
> (4-15? m-n[ Lx -2) | 2 (4-2) (7.1042) 


= _ = 


PE à 


Pour déterminer le nombre de degrés de liberté de la loi du Khi-deux de: 


O4 (7.1043) 
= = 
Nous allons utiliser le fait que (par le même raisonnement que pour la relation antéprécédente): 
2 
S'ix. —7l 
— A (7.1044) 
Qr = A = vÈ 
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et que puisque Qr = © 4+@>, nous devons alors avoir: 


+ 
Or = La +Or _ La, Or = Ê +7 Th (1045) 


ÉD à à à 


Il s'ensuit de par la propriété de linéarité du Khi-deux: 


D 
2% (z à) (7.1046) 


: 2 
La = — = di 
= = 
Donc pour résumer nous avons: 
e 2 Or _,2 
“A = Hal et [22 AN) (71047) 
C'est maintenant qu'intervient la loi de Fisher dans l'hypothèse où les variances sont égales! Puisque: 
Œ-D 84 _ 2 (NDS 
———<#° = y et —#*=y2 , (71048) 
= k-l #2 ZN-k 


Ce que nous souhaitons faire c'est voir s'il y a une différence entre la variance des moyennes 
(interclasses) et la variance résiduelle (intra-classes). Pour comparer deux variances lorsque les 
moyennes vraies sont inconnues nous avons vu que le mieux était d'utiliser le test de Fisher. Or, nous 
avons démontré dans notre étude de la loi de Fisher un peu plus haut que: 


2 
Cr = _—_ (7.1049) 
pe imite) Sy 


où dans notre cas d'étude: 


2 i O4 
Ga jm. 54 Val Et  __ El 
a 1 N—k & A ET QR (71050) 
Z(x-3) NE 


Au vu de l'hypothèse de la première égalité (qui précède l'implication, nous comprenons mieux la très 
grande sensibilité des résultats de l'ANOVA à la non égalité des variances. 


Indiquons encore que la relation précédente: 


Fee = —| (71051) 
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est souvent indiquée dans la littérature sous la forme suivante: 


Fe N-t À Gao 
MSE 
où MSk est appelé "Mean Square for treatments" et MSE "Mean Square for Error”. Ce rapport va donc 
nous donner la valeur de la variable aléatoire F (dont le support est pour rappel borné à zéro à gauche). 
Comme il s'agit d'une loi qui n'est pas symétirque il est peu judicieux de faire un test bilatéral. On fera 
ains plutôt un test unilatéral à droite (la région de rejet étant à droite). 


L'interprétation de cette fraction est donc en gros la suivante: Il s'agit du rapport (normalisé au nombre 
de degrés de liberté) de la somme de l'erreur des moyennes (interclasses) et de l'erreur résiduelle (intra- 
classes) ou autrement dit le rapport de la variance interclasse par la variance résiduelle. Ce rapport suit 
donc une loi de Fisher à deux paramètres donnés par les degrés de liberté des classes respectives. 


Remarque: S'il y a seulement deux populations (échantillons), il faut bien comprendre qu'à ce 
moment l'utilisation du test-T de Student suffit amplement et est considéré comme équivalent! Au 
fait, l'ANOVA est une comparaison indirecte des moyennes, Student une comparaison directe... il 
est donc évident de deviner lequel est le mieux dans cette situation particulière! 


Tous les calculs que nous avons faits sont très souvent représentés dans les logiciels sous la forme d'une 
table standardisée dont voici la forme et le contenu (c'est ainsi que le présente Microsoft Excel 11.8346 
ou Minitab 15.1.1 par exemple): 


Source Somme des carrés  \idldu 72 Moyenne des |F Valeur critique F° 
carrés 
Inter- - =® Ox |MSK 
= [x -7 “| MSk=<2 |—— PR > EF, y 
Classe [PA Za( ) À 1 (ME € k1,N-) 
Intra- _\2 © 
OR= TV (x;-X k MSE = —< 
Classe Si Z{ d x) N-k 
12 
Total Qr =>(x -3) -1 
r 
Tableau: 7.12 - Terminologie et paramètres traditionnels d'un Tableau ANOVA (TAV) à un facteur 


ainsi, pour que l'hypothèse soit acceptée, il faut que la valeur de: 


Fr MSk Hit 
EN-E on 77 
PUR UUMSE 
soit plus petite ou égale au centile de la même loi F avec une probabilité cumulée correspondant à 1 
soustrait de niveau de confiance «x. 


La valeurs choisie du F critique est un peu malheureuse à mon avis dans les tableaux d'ANOVA (mais 
bon une fois que l'on sait que c'est ainsi...). Il est peut-être plus aisé de comprendre cette valeur si nous 
l'introduisons ainsi (le test unilatéral à droite ressort pédagogiquement mieux à mon avis): 
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P(FSE, N-1 i=l-Æ <i-& 
Il faut donc pour que le test ne soit pas rejeté que: 


FE 2a 


Donc la valeur critique de F correspond simplement et bêtement à la probabilité cumulée de la p-value. 


Il faut cependant bien se rappeler que pour utiliser l'ANOVA, on doit donc supposer que les 
échantillons sont issus d'une même population (données appariées) et suivent une loi normale. Il est 
donc nécessaire de vérifier la normalité des distributions et l'homoscédasticité (test de Levene par 
exemple). Dans le cas contraire, il faut utiliser des variantes non paramétriques de l'analyse de variance 
(ANOVA de Kruskal-Wallis ou ANOVA de Friedman). Ces tests ne sont pas encore démontrés en 
détails à ce jour sur le site. 


Remarques: 


R1. À noter que dans la pratique, la variance inter-classe est très souvent nommée "variance inter- 
laboratoires" et la variance intra-classe est in extenso souvent nommée "variance intra-laboratoire". 


R2. Il existe en ce début de 21ème siècle plus de 50 test ou procédures de comparaison de 
variances. L'opinion varie parmi les auteurs quant à leur pertinence et l'efficacité des tests 
d'homogénéité de variance (THV). Certains affirment que ces derniers sont indispensables à réaliser 
avant toute ANOVA, d'autres disent que ces tests sont de toute façon de piètre performance, 
l'ANOVA étant plus robuste aux écarts d'homoscédasticité que ce qui peut être détecté par les THV 
particulièrement en cas de non-normalité. En fait, toutes ces questions se rapport au problème dit de 
Behrens-Fisher, qui est celui de la comparaison de moyennes sans supposer l'équivariance. 
Cependant parmis la cinquantaine de tests existants, plusieurs études comparatives ont permis de 
dégager les tests suivants: Test de Bartlett, Levene et Brown-Forsythe. 


13.5. ANALYSE DE LA VARIANCE (ANOVA À DEUX FACTEURS SANS RÉPÉTITION) 


Nous allons voir maintenant le concept d'interaction qui est fondamental pour bien comprendre ce qu'il 
y a derrière l'ANOVA à deux facteurs (fixes) (ou "ANOVA à deux variables catégorielles fixes") sans et 
surtout avec répétition. Effectivement, ce n'est qu'avec l'ANOVA à deux facteurs avec répétition — par 
construction mathématique - que l'on peut statistiquement (sous certaines hypothèses) étudier 
objectivement si deux ou plusieurs facteurs interagissent de manière significative ensemble. 


Il nous faut donc, avant de passer à la partie mathématique pure, introduire quelques notions: 
Définitions: 


D1. Nous disons qu'il y a "absence d'interaction" quand la moyenne des réponses d'un facteur en 
fonction de ses niveaux varie de la même amplitude et avec le même signe que la moyenne des 
réponses d'un autre facteur en fonction de ses niveaux. Nous disons alors que les courbes de réponses 
dans le diagramme des interactions sont parallèles. 
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Remarque: Le parallélisme des courbes de réponses est normal en situation d'absence d'interaction, 
car cela signifie que quel que soit le niveau de l'un ou l'autre des facteurs, la variation (si elle existe) 
de la réponse sera toujours de la même amplitude. Ce qui est caractéristique de l'indépendance (du 

moins localement). 


D2. Nous disons que deux facteurs sont "en interaction" quand la moyenne des réponses d'un facteur 
en fonction de ses niveaux ne varie pas de la même amplitude ou/et pas avec le même signe que la 
moyenne des réponses d'un autre facteur en fonction de ses niveaux. Nous disons alors que les courbes 
de réponses dans le diagramme des interactions ne sont pas parallèles. 


Remarque: L'absence d'interaction est une hypothèse très forte et une observation rare. Souvent, 
nous avons des interactions ou de fortes interactions. 


Pour comprendre le concept, nous aurons recours à de petits exemples sans répétition qui permettront 
de se faire une idée qualitative du phénomène mais en aucun cas une approche scientifique de 
l'interaction. 


À chaque fois nous visualiserons les situations au moyen de deux types de représentations: un 
graphique illustrant les effets principaux d'une part et un diagramme des interactions d'autre part. 


Considérons le petit tableau suivant avec deux facteurs à deux niveaux ("variables explicatives") 
comportant donc 4 cellules ("variables d'intérêt"): 


3 
3 


Tableau: 7.13 - Premier exemple d'une petite ANOVA à deux facteurs sans répétition 


3 
3 


Nous aurons comme représentations avec un logiciel comme Minitab: 


Figure: 7.48 - Graphique des effets principaux avec Minitab 15 


Nous voyons bien qu'aucun facteur n'a un effet principal sur quoi que ce soit. Ce qui est relativement 
intuitif étant donné le contenu de tableau précédent. 


Le diagramme des interactions (appelé souvent "profileur" dans l'industrie) donne lui: 
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Diagramme des interactions pour Valeur 
des 


Moyennes des données 
. 
En 
2—— 
LS CTE Ni 2 
Facteur2 


Figure: 7.49 - Diagramme des interactions avec Minitab 15 


où nous pouvons constater que les facteurs n'interagissent pas entre eux (ou se neutralisent c'est 
selon..). Nous disons alors qu'il n'y a "(a priori) aucun effet ni aucune interaction (localement)". Au fait 
dans certaines expériences, l'absence d'interaction est une hypothèse très forte et donc souvent rare. 
Raison pour laquelle il faut faire attention aux mots choisis lors de l'interprétation des graphiques 
d'interaction (car ne pas passer par les calculs purs est délicat pour cette étape voire non scientifique!). 


Maintenant considérons le tableau suivant: 


Tableau: 7.14 - Deuxième exemple d'une petite ANOVA à deux facteurs sans répétition 


Il nous paraît clair que le Facteur 1 à travers la prise en compte de son niveau semble avoir une 
influence sur la réponse. Mais voyons les différentes représentations: 
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Graphique des effets principaux pour Valeur 
Moyennes des donnes 
Facuuri Factor? 
| —{ 1 — = À 
404 , 
354 
£ 
bol # + 2—+ {- 
‘ 
251 
204 L2 
LA _ L 
Move 1 Nvoau 2 Noa 1 Niveau 2 


gr avr des ré re actions perur Vadenar 


Disgramme des Interactions pour Valeur 
Moyens Get Gorrabis 


Figure: 7.50 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 
Détaillons plus le premier graphique comme l'a proposé un lecteur: 


Ce graphique comporte 2 parties: celle de gauche analyse les effets du facteur 1 à travers ses 2 niveaux 
; celle de droite en fait de même pour le facteur 2. 


Examinons de plus près la partie de gauche: 


Nous y voyons 2 points reliés par un segment de droite. Ici le premier point, celui pour le niveau 1, est 
situé à l'ordonnée 2 alors que le deuxième point, celui pour le niveau 2, est situé à l'ordonnée 4. 
Rappelons-nous maintenant que chaque point représente une moyenne. Ainsi l'ordonnée du premier 
point est bien située à la moyenne de (2 +2)/2= 2. 


Ceci étant dit et en espérant que cela a aidé à une meilleure compréhension, revenons à nos moutons. 


Il apparaît assez clairement dans le graphique du dessus que seul le niveau du Facteur 1 influence la 
réponse, alors que le Facteur 2 n'influence en rien la réponse. Nous disons alors qu'il y a effet principal 
(localement) du Facteur1. 


Sur le diagramme des interactions, nous avons la même information, mais sous une forme différente. 
Nous voyons que quel que soit le niveau du Facteur 2, les réponses sont horizontales et donc que 
celui-ci n'influence en rien les résultats. Nous sommes alors dans une situation où "(a priori) l'effet 
principal est (localement) le Facteur 1 et en absence d'interactions entre les facteurs". 


Voyons maintenant le tableau suivant: 


Page: 528/4839 


[v3.0 - 2013] 


Tableau: 7.15 - Troisième exemple d'une petite ANOVA à deux facteurs sans répétition 


Nous pouvons cette fois observer que le Facteur 2 a une influence mais pas le Facteur 1. Mais voyons 
aussi cela avec nos 2 types de représentations: 


Graphique des effets principaux pour Valeur 
Moyennes des donnes 


7 SE 2 © 7 SNS 


Diogrameme des interactions pour Valeur 
Moyens des Gore 


Figure: 7.51 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 


Nous observons bien sur le graphique que le Facteur 1 n'a aucune influence. Sur le diagramme du 
dessous c'est moins évident mais la superposition des deux droites montre que le Facteur 1 n'a pas 


d'influence. Nous disons alors qu'il y a "(a priori) effet principal (localement) du Facteur 2 et absence 
d'interactions entre les facteurs". 


Considérons maintenant le tableau suivant: 


3 
5) 


Tableau: 7.16 - Quatrième exemple d'une petite ANOVA à deux facteurs sans répétition 


1 
3 


Nous voyons que les deux facteurs ont une influence sur la réponse. Ce que montrent bien les deux 


représentations ci-dessous: 
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Graphique des effets principonsx pour Valeur 
Moyenraus des dorés 


Figure: 7.52 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 


Nous observons bien sur le graphique du dessus que le Facteur 1 a une influence sur la réponse et qu'il 
en est de même du Facteur 2 (et en plus de la même amplitude quel que soit le sens!). Sur le graphique 
du dessous c'est moins évident mais la même conclusion est valable. Nous disons alors que "(a priori) 


les deux facteurs sont (localement) significatifs et sans interactions". 


Passons au tableau suivant: 


| Niveaut 2 


4 


VU Niveau2 4 


2 


Tableau: 7.17 - Cinquième exemple d'une petite ANOVA à deux facteurs sans répétition 


qui sous cette forme n'est pas trivial à interpréter. Mais avec les représentations nous avons tout de 


suite des informations plus pertinentes: 
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Graphique des effets principaux pour Valeur 
Moyernes des dorées 


= 
350 


33 


1: 


275 


Figure: 7.53 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 


Nous observons bien sur le graphique ci-dessus qu'aucun des facteurs n'a d'influence sur la réponse a 
priori (même graphique qu'au tout début avec la même moyenne). Le diagramme du dessous nous 
donne une information complémentaire par contre (!!!): Les facteurs ont une influence croisée et 
comme cette influence croisée est de même amplitude, les effets s'annulent. Nous disons alors que les 
"deux facteurs sont (localement) en interaction F1*F2". 


Considérons maintenant le tableau suivant: 


1 
5) 


Tableau: 7.18 - Sixième exemple d'une petite ANOVA à deux facteurs sans répétition 


3 
3 


Ce qui nous donne les deux représentations suivantes: 
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Graphique des effets principaux pour Valeur 
Moyennes des donribes 


10 


25 


1 


25 


Disgremme des interactions pour Valeur 
Moyennes des données 


Figure: 7.54 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 


Nous observons bien sur le graphique du dessus que le Facteur 1 semble avoir une influence et que le 

Facteur 2 non (en moyenne!). Le diagramme des interactions du dessous nous donne, lui aussi, encore 
une fois, une information complémentaire (!!!): C'est que les facteurs sont en interaction. Nous disons 
alors que nous avons "(a priori) deux facteurs (localement) en interaction F1*F2 où l'influence du 


Facteur 1 est significative". 


Tableau suivant: 


3 


5) 


3 
d 


Tableau: 7.19 - Septième exemple d'une petite ANOVA à deux facteurs sans répétition 


Nous voyons que les deux facteurs ont une influence sur la réponse. Ce que montrent bien les deux 


représentations ci-dessous: 
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Graphique des effets principaux pour Valeur 
Moyennes des donrbes 


Disgramme des interactions pour Valeur 
Moyennes des Gorrabes 


Figure: 7.55 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 


Nous disons ici que nous avons "(a priori) les deux facteurs (localement) en interaction F1*F2 où 
l'influence du Facteur 2 est significative". 


Et enfin un dernier tableau 


1 
5) 


Tableau: 7.20 - Huitième exemple d'une petite ANOVA à deux facteurs sans répétition 


1 
1 


qui nous donne les deux représentations: 
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Graphique des effets principaux pour Valeur 
Moyennes des dons 


ŒTTA T ELTA 


Ld 


Diagramme des interactions pour Valeur 
Moyennes des donribes 


54 D 
Li L'E 


Futesi 
e— Phrvam 2 


Factour2 


Figure: 7.56 - Graphique des effets principaux et diagramme des interactions avec Minitab 15 


Nous disons ici que nous avons "(a priori) les deux facteurs (localement) en interaction F1*F2 où 
l'influence des deux facteurs est significative". 


Remarque: Une croyance (communément répandue) de personnes qui manquent d'expérience dans 
les laboratoires consiste à penser que pour qu'une interaction soit significative il est nécessaire que 
les facteurs qui la composent le soient également. 


Après tous ces tableaux, passons à partie mathématique: 


Nous avons vu précédemment comment effectuer une analyse de la variance à un facteur. Pour rappel, 
cela consiste donc à faire un test d'égalité des espérances pour k échantillons indépendants de n 
variables aléatoires chacun (dans le cas où tous les échantillons ont donc le même nombre de mesures). 
Chaque échantillon étant considéré comme une expérience sur un sujet différent ou identique considéré 
alors comme un facteur variable indépendant! 


Cependant il arrive dans la réalité que pour chaque échantillon on fasse varier un deuxième paramètre. 
Considéré alors comme un deuxième facteur variable. Nous parlons alors bien évidemment d'analyse de 
la variance à deux facteurs. De plus, nous allons considérer dans un premier temps pour simplifier les 
calculs que les variables aléatoires sont indépendantes! Donc un facteur n'a pas d'influence sur l'autre!!! 
En d'autres, termes il n'y a pas d'interaction entre les facteurs. Nous parlons alors d'une "ANOVA à 
deux facteurs sans interactions". 


Afin de déterminer la formulation du test à effectuer, rappelons que pour l'analyse de la variance à un 
facteur, nous avions décomposé la variance totale en la somme de la variance des moyennes 
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(interclasses) et de la variance résiduelle (intra-classes) telle que: 


Or =Qa+ORr (71056) 


en explicitant le fait que nous comparions les échantillons ; = 1. .&: 


Qr=Z(xy-7) 222 (4-7) =ZZ((xy-2)+(5-5)) 


ÿ i j i j 


"Ze -2) +227 +222 (0 -5)(x-7) 


(7.1057) 


ce qui nous avait donné au final: 
_ 12 _ 2 
Qr = 22 : x) +22 -?) = Op +O4 (7.1058) 
i + 


Pour l'ANOVA à deux facteurs nous partirons du tableau suivant ("Éch." est l'abréviation de 
"Échantillon"): 


Facteur À 
Facteur BlÉch.1 Éch.2 Éch….j Éch.r 
Éch. 1 Xi %2 | " Xi Moyenne: % 
Éch.2 %1 Xp | ” Xy Moyenne: x; 
Éch. i . . | xÿ . Moyenne: x, 
Éch. k Xe Xp | = sh Moyenne: x 
Moyenne: x Moyenne: x; Moyenne: x; Moyenne: X, x 


Figure: 7.57 - Structure typique dite "croisée" d'une analyse de la variance à 2 facteurs sans répétition 


pour lequel dans un laboratoire, le facteur maintenu fixe pendant qu'on fera varier l'autre sera appelé le 
"facteur bloc" et l'autre sera appelé le "facteur de traitement" et dans la pratique on fera en sorte que ce 
dernier ne soit pas effectué toujours dans le même ordre afin d'éliminer des éventuels effets d'inertie 
lors du passage d'un traitement à l'autre (les américains désignent les ANOVA à deux facteurs contrôlés 
sour les terme: "randomized block design"). 


Pour la suite, toute l'astuce consiste à décomposer la variance totale en comparant l'espérance des 
lignes (observations) indexées cette fois-ci avec ; =1..+ et des colonnes (échantillons) indexées avec 
j=1..r par rapport à la moyenne totale telle que: 
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Qr =D ixg-x) = DS Ixÿ x) =>[(&-7)+(%-7)+(x-7-7+7)] 
ÿ i j ÿ 
2, [x —-XI+Ix; x +21(X-xX)+Ix;—XINx, -7 x; +Xi+x -X 3%, +7 
ÿ (7.1059) 
__ (ter) FAT x; —Xi+IX; -x| +2UX-7i+17 -xIlx;-7 3%; +7) 
=> : 


ÿ XX +Xx 
FX XX; FX] 
Or, nous avons dans un premier temps: 


SAR -HUX, -XI=2V(X-XIS IX -Fi=0 
— J di ai 


5 : 5 (7.1060) 
 H ,» 
Donc il reste: 
(XX) +1x, -7| +21X%-XI+IxX;-XIx; -X-X7;+7x| 
Qr = > Lo (7.1061) 
I] +ixÿ-X% 7; +37 


5 
=25(X-X)+17,-7ilx -X-7,+7 (7.1062) 
5 
995 -7 === S'UX -YT DS: 
=2) (XX ilag-x x; +X1+25 17; -X||x; x -X;+7| 
ÿ ë 


= 1 
X=— }) a 
bre 
-_ls 
H = 2, Xÿ (7.1063) 
j 
1 
= 292, 
4 LA 
i 


Il s'ensuit alors que: 
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Z(%-T)(x-%-7;+7)= (x -2(5 Ph >>: 
ÿ 1 Î J J J 
=DIxX-Fir%-7x2 1 2,7 2,% +221 

1 j j ï Î (7.1064) 
SD -FirR-%r- Da + = DIT -F)(-rx +377) 

i ÿ i 
= (x -7x).0=0 

dd 

1 


et il vient alors immédiatement que nous avons de même: 
S'UxX rx XX -7i-= 
25 3/4 4% 2) 0 Gags) 
ÿ 


Donc il reste au final: 


(7.1066) 


ce que nous noterons sur ce site de la manière condensée suivante: 


©r = ©4 + Op + Oh (7.1067) 


où © 4, @A sont bien évidemment associés aux effets principaux (comparaison des moyennes 


marginales avec la moyenne totale). 


Donc en comparaison à l'ANOVA à un facteur nous avons un terme supplémentaire pour la variance 
totale. 


Dans l'ordre il est évident que la première somme des écarts par rapport au premier facteur colonne: 


2 (XX) (71068) 
ÿ 


aura au même titre que l'ANOVA à un facteur x —1 degrés de liberté. C'est-à-dire que sous les mêmes 
hypothèses que l'ANOVA à un facteur: 


2 (71069) 
= rl 


J 


La deuxième somme des écarts par rapport au deuxième facteur ligne: 
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S? 
5 


IT. 
x; 


#Il 


(7.1070) 


est nouvelle mais cependant on démontre de manière parfaitement identique au premier qu'elle aura 
r —1 degrés de liberté. C'est-à-dire que sous les mêmes hypothèses que l'ANOVA à un facteur: 


S" 
si 
ÿ 


nn 


2 


(X.—X| 


J 


— Ar 


(7.1071) 


Pour la troisième somme qui suit obligatoirement aussi une loi du Khi-deux (étant donné que la 
variance totale suit une loi du Khi-deux et que les deux premiers termes de la somme aussi!): 


Ù l 
ai Xÿ 
ÿ 


2 


XX, +X 


J 


(7.1072) 


c'est un peu plus délicat. mais il y a une astuce à la sauce physicienne...! Nous savons de par notre 
étude de l'ANOVA à un facteur que la somme des degrés de liberté de chaque terme doit être égale au 
nombre total de degrés de libertés. En d'autres termes, nous devons avoir pour l'ANOVA à deux 


facteurs: 


ddr = N-1=kr-1=(k-1)+(r-1)+977 (71073) 


Donc il manque bien évidemment: 


P=kor-1-[(&-D+6-D]=kr-1-k+1-r+H1=tr-k-r+1=(&-Dr-1) (71074) 


Ainsi: 


2% -%-x; +7) 


ÿ 


en 


Donc nous avons alors le tableau suivant: 


2 
= A1) 1) 


(7.1075) 


2 
O=r> IX -F| 
r 
2 
Qa = kdl 5x 
5 
—2 
QR=D IX XX; +X 


v 


ddlr=N-l=kr-1l Vr= 


ddl, = k-—1 


ddla=r-1 


date = (&-D(r-1 


Pa = —— 


Enfin, le reste est exactement le même que pour l'ANOVA à un facteur simplement que nous avons 
deux tests à effecteur cette fois-ci qui sont: 
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£a O5 
| -1 . 
F18-D6-0 n GE et F1 @-167-) L D (7.1077) 
= DE -1) Œ=DG-1 


Tous les calculs que nous avons faits précédemment sont très souvent représentés dans les logiciels sous 
la forme d'une table standardisée dont voici la forme et le contenu (c'est ainsi que le présente Microsoft 
Excel 11.8346 ou Minitab15.1.1 par exemple): 


Somme des carrés ddl y? Moyenne des carrés F Valeur critique F 
- = r-1 Ce MSkB \pir-# | 
ps - =8_ mien »=L(&-L(r 1) 
en r ZAR x] MSKE = MSE 
D 22 k-1 en MSkA \piF>- Ru vi 
Ca= ELU A) MSA = ET Fr 1 (&-1)(7 1) 
2lk-1\r- 
OR=Dia-R x +7) DE D og = Le 
ÿ &—1)(x-1) 
IN-1 


— 2 
Qr= > xx 
n 


Tableau: 7.21 - Terminologie et paramètres traditionnels d'un Tableau ANOVA (TAV) à deux facteurs sans répétition 


et la condition d'acception de l'hypothèse d'égalité des moyennes pour chaque facteur est la même que 
pour l'ANOVA à un facteur (voir le serveur d'exercice pour un exemple pratique et détaillé avec 
Microsoft Excel 11.8346). 


Évidemment, dans les développements ci-dessus, les facteurs A et B sont interchangeables dans les 
développements par symétrie! 


13.6. ANALYSE DE LA VARIANCE À DEUX FACTEURS À MESURES RÉPÉTÉES 


Jusqu'à présent nous avons examiné des ANOVA sur des expériences à un ou deux facteurs fixes 
(autrement dit: une ou deux variables catégorielles). Dans le cas à deux facteurs, nous avons considéré 
que pour chaque combinaison de facteurs nous n'avions qu'une seule mesure (cellule). Or, il peut arriver 
(et c'est préférable) que nous ayons plusieurs mesures pour une combinaison! 


Nous qualifions ce type d'étude de "plan expérimental à mesures répétées" et les résultats seront traités 
avec une analyse de la variance à deux facteurs à mesures répétées et avec interactions! Il s'agit d'un 
outil extrêmement important puisqu'il permet de valider des études menées par plusieurs laboratoires 
(ou employés) indépendants et il est également associé à de nombreux autres outils statistiques comme 
celui de l'étude de la reproductibilité et de la répétabilité (Étude R&R) pour ne citer que le plus connu 
dans le domaine industriel. 


Il faut comprendre qu'il est obligatoire dans le domaine de la statistique d'associer les interactions entre 
facteurs systématiquement lorsque nous avons affaire à une expérience à mesures répétées. Ceci pour 
la simple raison que le terme mathématique d'interaction n'apparaît que dans cette situation. 


Ainsi, il peut être intuitif (avant même de le démontrer) qu'une ANOVA à deux facteurs (fixes) à 
mesures répétées contient une interaction double, et deux effets principaux. Une ANOVA à trois 
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facteurs (fixes) et à mesures répétées aura in extenso une interaction triple, trois interactions doubles et 
3 effets principaux. Et ainsi de suite. 


Avant de commencer, nous allons considérer le tableau de mesures suivant où l'abréviation "Éch." fait 
référence au mot "échantillon": 


X11 | X12 Xi1r 
11 | 4212 tr 
Xnt1 | Xn12 Xatr 
%i | % %s | à 
#21 | #22 X12r 
X221 E7 X22r 
Xn21 Er 2 
21 | 22 y | ©. 
| A 
| Zÿ Air 
| ï %, 
Xi ET Xe 
4 EE © 
de ne er 
UE Xe | Xe 
X1 | X2 | X; | X, x 


Figure: 7.58 - Structure typique dite "croisée" d'une analyse de la variance à 2 facteurs avec répétition 


avec les propriétés habituelles des moyennes (pour rappel): 


1? 
X=-S "x 
1 ni 

F ja 
1. 
1 2 

i=1 
_ 122 - 
x. =D ZX 
F j=1 


(7.1078) 
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Et rappelons que pour l'ANOVA à deux facteurs sans réplications (et donc sans interactions), toute 
l'astuce avait consisté à décomposer la variance totale en comparant la moyenne des lignes indexées 
avec ; = 1... et des colonnes indexées avec j = 1... par rapport à la moyenne totale. 


L'idée va maintenant être à peu près la même à la différence que nous allons comparer l'espérance des 
lignes indexées avec ; =1..# et des colonnes indexées avec j = 1... non seulement par rapport à la 
moyenne totale mais aussi à celle de chaque ligne et de chaque colonne. 


Pour cela nous repartons de ce que nous avions obtenu pour l'ANOVA à deux facteurs sans réplication: 


Qr= D lxÿ-x) =D IX -X) +SUx, -X) +5 (x; -X-X;+X] (71079) 
ÿ ÿ ÿ 


Qr= D xx) =r> x -Xx) +40 IX, -Xx] +5 1x -x-Xx;+X | (71080) 
ÿ i J ÿ 


XII 


Mais dans le cas présent, il nous faut rajouter une sommation pour les réplications et adapter la notation 
pour les mesures. Donc, sans refaire tous les développements (c'est un peu culotté mais bon...), nous 
obtenons déjà directement: 


12 _ 3 2 : 2 
Or = >'(x —X =nrS IX —X | ; 
b] 


"a 
7 
où dans l'ordre, m est la réplication de l'échantillon i du facteur A et de l'échantillon j du facteur B. 


Il vient alors bien évidemment les variances interclasses pour les facteurs A et B qui sont immédiates: 


(7.1083) 


où © 4, @A sont bien évidemment encore une fois associées aux effets principaux (comparaisons des 
moyennes marginales avec la moyenne totale). 
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Maintenant, nous allons jouer un peu en introduisant sous la somme, en plus et en moins, dans le 
dernier terme: 


MI 


D x =. Xj+X) (71084) 
ÿre 


la moyenne des réplications: 


Xÿ (7.1085) 


que nous retrouverons in fine dans la somme des carrés totale: 


= 2 2 
“ SE -LIiTleT DEF, +T+X-Y 
2m TX; TX) = 2, KT A TX + A x) 
a aÿ 
SE -X-X7+7 FL ix x -7 45 
AUTRUI + Xp — Xÿ |] = 2 5 4. 2; TX.) 
ds ds ; (7.1086) 
SF 2x — L _ La . 
+2» 13; % —X;+Xx ||x ZT D Xe — 7 | 
#aÿ a 
She LE Ne = = = a S : 
=AD XX A; +X +22 17 x x; +X x + 2 Xe — Xl 
ÿ va et} 


Bien entendu, nous reconnaissons assez vite la variance intra-classes (appelée aussi souvent "erreur 
résiduelle" ou simplement dans le cas particulier de l'ANOVA à deux facteurs avec répétition "erreur de 
répétabilité"): 


2 
Or =D x —Xÿl (71087) 
mr 


et le terme que nous pouvons interpréter (par comparaison avec l'ANOVA à deux facteurs sans 
répétitions) comme étant la variance d'interaction: 


— — —_ _ 2 — = 
Q up = 2 (x; -X x; +7 | AD IX, — (Rx I=-(F;-7 1) (ice) 


ET 


Mais si notre hypothèse est juste, le terme: 
25 1% x +2. ll XX] (7.1089) 
pr 


doit s'annuler. Vérifions cela 


2 (Ki Xi 25 +2) ang — Xi = D Xmÿ = Ki MX — &. —Xj +7) 


mÿ my (7.1090) 
= 2,2,2 ,(xmÿ L %j IX — x. — x; +Xx| 
1 j m 


et donc pour i et j fixés il vient: 
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[Er -7,47)9'l>z …—Xx. | = 0 
jf M. #4; _ my CU (7.1091) 
— y; ———— 


Et donc la sommation sur tous les i et j sera aussi nulle par extension. Ceux qui ont un doute quant à 
l'annulation des deux termes du développement ci-dessus, pourront peut-être se rassurer en faisant une 
application numérique. 


Donc au final: 


An 

ei = D x x. 

mer 

- 12 = \2 = \2 2 (7.1092) 

= STE 7 NU 7 NT FT 7 FT La 7 
=AkD IX; x | +#r > \x; x | +22 ,1x; ZX; x; FX | + 2, Xoÿ 7; | 

Fr î ÿ a 

———yÿ— ou ——————————— 
eh 8 On À 


où pour rappel, n est donc le nombre de réplications, r le nombre d'échantillons du facteur A et k le 
nombre d'échantillons du facteur B (ces deux derniers paramètres sont souvent confondus par ceux qui 
font les calculs à la main). 


Donc en comparaison à l'ANOVA à deux facteurs sans réplication, nous avons un terme supplémentaire 
pour la variance totale. 


Dans l'ordre il est évident que la première somme des écarts par rapport au premier facteur colonne: 


= à 
DIX; -x (7.1093) 
: 


aura au même titre que l'ANOVA à un facteur et l'ANOVA à deux facteurs sans répétition 4; —1 degrés 
de liberté. C'est-à-dire que sous les mêmes hypothèses que ces deux ANOVA, nous avons: 


= \2 
S'UX,-7x [ 


ne 


La deuxième somme des écarts par rapport au deuxième facteur ligne: 


LS 


( 
— ta 


7.1094) 


HI 


DIX - (7.1095) 
: 


aura sous les mêmes hypothèses la propriété: 


P (7.1096) 
— dy] 


Grâce au raisonnement effectué à l'aide de l'ANOVA à deux facteurs sans répétition, nous savons que 
pour le terme d'interaction: 
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57%. -X;t+X] (71097 
nous avons: 


ER . 
> 3% -X;+7x 
5 © (7.1098) 
= — A(k-1)(>-1) 


Il reste à déterminer le nombre de degrés de liberté du dernier terme: 


2 
PALTE Xÿ |  (7.1099) 
na 


Pour ce faire, nous procédons de la même manière qu'avec l'ANOVA à deux facteurs sans répétitions. 
Nous savons de par notre étude de l'ANOVA à un facteur que la somme des degrés de liberté de chaque 


terme doit être égale au nombre total de degrés de liberté. En d'autres termes, nous devons avoir pour 
l'ANOVA à deux facteurs: 


ddr = N-1=nkr-1=(k&-1)+(r-D+(k-D-10+22? (71100) 
Donc il manque bien évidemment: 


207 = nier —1—[(&-1)+r-1)+(&- Dr -D]= kr -1-&+1-r +1 kr kr +1 


(7.1101) 
= nkr-1-k+1-r+1-kr+ktr-1=2kr-kr=N-kr=kr(n-T 
Ainsi: 
2 
S'{x  —X.l 
ii % ” (7.1102) 
ne T : 
eo N—k 
Donc nous avons alors le tableau suivant 
Q => {x -7 Ÿ dl,=N-i=nt-1 V,= er 
er Et ddl r 
na 
= S IX -7 ddiz=r-1 7, = 25 
= 12 
Qa=nkD ir, -X l ddl 4 = k—1 7, = 24 (7.1103) 
rl É dal 4 
= nS° re ep 
Onp = 1\X — À À; +xXx | Al ges (& Dér 1) Fax 
5 del sep 
OR 
CPRDRESSS ddl = N— kr V, = = 
Lis, ddl 


Enfin, le reste est exactement le même que pour l'ANOVA à deux facteurs sans réplication simplement 
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que nous avons trois tests à effecteur cette fois-ci qui sont: 


Da Oz Que 
_ &-i1 __r- (&-D(r- 0 
Fee — Eu ? FN — 2 06 -DN-k = TB (7.1104) 
N-k Frs NE 


Tous les calculs que nous avons faits précédemment sont très souvent représentés dans les logiciels sous 
la forme d'une table standardisée donc voici la forme et le contenu (c'est ainsi que le présente Microsoft 


Excel 11.8346 ou Minitab 15.1.1 par exemple): 


Somme des carrés ddl y? Moyenne des carrés F Valeur critique F 
Q=mEix rt PT ose 2 PIF>Fine | 
ï r—1 MSE 
= k-1 C4 MSkA |Pir-# | 
Qa=#KkS IX, -X | = sms &-LN ir 
A ; æ JASKA k-] MSE 
Ones (k-1)(r-1) MSKAE EE P(F>Æa-0n+) 
=n) (2x -2,+7 _ _ La 
5 (k—-1liir-1) 
2 : 
Or =D ZX — Xl IN-kr Mse - PR 
7 N— kr 
_. IN-1 
©r — > Xp _ x Il 
rs 


Tableau: 7.22 - Terminologie et paramètres traditionnels d'un Tableau ANOVA (TAV) à deux facteurs avec répétition 
et la condition d'acception de l'hypothèse d'égalité des moyennes pour chaque facteur est la même que 


pour l'ANOVA à un facteur (voir le serveur d'exercice pour un exemple pratique et détaillé avec 
Microsoft Excel 11.8346). 


Évidemment, dans les développements ci-dessus, les facteurs A et B sont interchangeables dans les 
développements par symétrie! 


13.7. ANOVA MULTIFACTORIELLE À MESURES RÉPÉTÉES 


L'ANOVA multifactorielle à mesures répétées ou appelée aussi "ANOVA multifactorielle à variables 
catégorielles et mesures répétées" (et très rarement "ANOVA équilibrée") est simplement le nom sous 
lequel les spécialistes désignent les ANOVA suivantes: 

- ANOVA à trois facteurs (fixes) avec ou sans répétition 

- ANOVA à quatre facteurs (fixes) avec ou sans répétition 

- ANOVA à cinq facteurs (fixes) avec ou sans répétition 


- IC. 


Évidemment, les ANOVA à un et deux facteurs (fixes) font aussi partie de la famille de l'ANOVA 
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multifactorielle mais elles sont rarement signalées en tant que tel dans les logiciels de statistiques et sont 
souvent disponibles de façon explicite dans les menus de ces mêmes logiciels (car ce sont les deux plus 
utilisées dans les écoles). Il faut savoir aussi que la majorité des logiciels de statistiques gèrent des 
ANOVA multifactorielles jusqu'à 15 facteurs fixes (variables catégorielles) à condition que le plan soit 
équilibré (c'est à dire que pour chaque niveau de chaque facteur, il y ait un nombre identique de 
mesures). Un tableur (comme Microsoft Excel) gère le plus souvent les ANOVA jusqu'à un maximum 
deux facteurs (fixes). 


Bon maintenant le lecteur risque d'être déçu (bon je suis aussi déçu de n'avoir qu'une seule vie.) car 
franchement je ne souhaite pas refaire les développements vus plus haut pour les ANOVA à un facteur 
et deux facteurs (fixes) pour 3, 4 et ce jusqu'à 15 facteurs car cela prendrait plus de 100 pages A4 sous 
une forme pédagogique et claire et en plus c'est basé toujours sur la même mécanique de 
développement (la théorie généralisée de l'ANOVA bien qu'étant beaucoup plus courte, elle est à mon 
goût indigeste). 


Remarque: Les ANOVA non équilibrées (non balancées) nécessitent un choix subtil de la manière 
de calculer les variances. En fonction de la manière de calculer, nous parlons d'ANOVA de type I, II 
ou IIT. Le choix de la méthode de calcul est même en ce début de 21ème siècle sujet à de vifs 
débats entre spécialistes. Raison pour laquelle nous nous abstiendrons d'étudier ce cas-là. 


13.8. TEST DE C DE COCHRAN 


Le test C de Cochran a pour objet la vérification de l'homogénéité des variances concernant plusieurs 
populations. Il s'agit d'un des tests préalables ou postérieurs (post hoc) utiles avant de faire une ANOVA 
balancée (équilibrée) et qui est recommandé par la norme ISO 5725 (de même que le test de Tukey que 
nous verrons beaucoup plus loin). 


Bien que l'idée du test de Cochran soit empirique, elle est néanmoins intuitive comme le sont les 
définitions des tests de Grubbs et Dixon. Pourquoi alors présentons-nous sur ce site en détails le test C 
de Cochran alors que nous avons mentionné que nous ne le ferions pas pour le test de Grubbs et Dixon? 
La raison en fait est simple: le test de Grubbs et Dixon nécessite des simulations par Monte-Carlo pour 
déterminer les valeurs critiques de rejet ou d'acceptation de l'hypothèse nulle, alors que la valeur 
critique du test C de Cochran peut être obtenue relativement facilement analytiquement. 


Ceci étant dit... nous définissons le test C de Cochran par le rapport: 
2 
SE 


Cj=— 
DE 


J 


où les $; sont les variances non biaisées des différentes sources de données au nombre de N composées 
chacune de n échantillons et l'hypothèse nulle est intuitivement l'égalité des variances contre 
l'hypothèse alternative qui est qu'une des variances est trop grande (donc mauvaise) et rejetée parce 
que aberrante. 


La norme ISO 5725 recommande de réitérer ce test jusqu'à ce qu'il n'y ait plus aucune variance 
aberrante (donc trop grande ET éloignée des autres variances). 
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Pour déterminer la valeur critique, inversons la définition du test C de Cochran et faisons quelques 
manipulations algébriques élémentaires: 


N pl nl 
s'e2 g2+|5s'52- 5$ S' gi 
mi J Zi J per i | 
= j= 1= i=i RES] (7.1106) 
(op = 5 = a —— = 1+ n 
5° s’ s 


Nous remarquons qu'à peu de choses près, le deuxième terme de la dernière égalité ressemble presqu'à 
une loi de Fisher. Comme la loi de Fisher n'est pas stable par l'addition, il faudrait que nous trouvions 
une manière de transformer le terme: 


S' o2 
Sÿ (7.1107) 
i=lik 


en une variance unique. L'idée est alors relativement simple mais encore fallait-il y penser... Nous 
savons que les $; sont des variances non biaisés avec un facteur 1/{#- 1j . Donc si les N échantillons 


(niveaux) sont tous indépendants, la variance globale est alors par stabilité de la loi Normale et en 
reprenant les notations de l'ANOVA: 


LÉ NW NN 
2 1 à 1 (ei 1 
S'aobal-j = 5e > 5 = 7; SE bp (e} 
1. . 1. .#—]1 (N—-1)(#-1), = . 
i=li#) i=li#) i=li#) 
(7.1108) 
L 1 o __ Rgobai-; 
iM—liix—1; gobd-} iN-Tliix-1; 
Dès lors: 
i né 
NS JL s+ & Cgiobai - j 
1, 7 1, (N—1\(x- 1 
CN NT 00) 
S; S$ Q; 
ñn-1 


Nous reconnaissons donc dans la dernière égalité le rapport de deux variances au carré. Nous avons 
alors identiquement à ce que nous avons démontré lors de notre étude de l'ANOVA à un facteur sans 
réplications: 


e LR 
F, = nd 
n-1,(N—1)(n-1} ç (7. ) 
gobal- Ogiobaï - j 
iNM-liix-1 


et donc il vient: 
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= N-1 
CR in 
n-1(N-1)(#1) 
qui est dès lors indépendant de j et donc le test unilatéral gauche (puisque par définition le rapport du 
test de Cochran doit être le plus petit possible) C de Cochran aura pour valeur critique: 


N-—1 Co 
CAN, n1i= | 1 + ———— (7.1112) 
EF n-1(N-1)(n-1) 


Il y a cependant un petit couac avec la relation précédente. Effectivement, nous savons que nous 
devons itérer le test plusieurs fois. Mais bien évidemment, plus nous effectuons de test sur un 
échantillon de données, plus grande est la probabilité de rejeter l'hypothèse nulle à un moment ou à un 
autre. Ce problème est appelé "inflation du niveau de confiance" et dans la vie réelle nous connaissons 
bien son application: plus on attend, plus la probabilité qu'un événement rare ait lieu est élevée. Bien 
évidemment, il faut alors réduire la valeur du seuil mais dès lors cela augmente la difficulté de détecter 
les vrais effets. Dès lors, la démarche est la suivante. 


Si nous considérons un test avec un niveau de signification 1 æ (correspondant donc à la probabilité 
cumulée de ne pas faire une erreur de type I) et que nous réitérons celui-ci de manière indépendante 
une deuxième fois. Alors, si les tests sont indépendants, de par l'axiome des probabilités, la probabilité 
de ne pas faire une erreur du type I sera le produit des probabilités: 


il—æil-æi- (1-aŸ (7.1113) 
et ainsi de suite pour n tests. Nous remarquons alors très vite que la probabilité cumulée de ne pas faire 
une erreur de type I décroit très vite. Par exemple, pour 10 tests réitérés indépendants avec un niveau 
de 5%, nous avons alors: 


(1-5% 0 = 59% (7.114) 


ce qui est catastrophique! Dès lors, si nous voulons un niveau de confiance sur tests réitérés d'une 
certaine valeur que nous noterons &, , il paraît évident qu'il faut résoudre l'équation suivante: 


(1-æi” =(1-a&, \ (7.1115) 


Soit (relation appelée parfois "équation de Sidàk"): 


1/ 1 
æ=1-(1-& ) F1 —_— (7.1116) 


(1— y l 
et avec un développement de Taylor au deuxième ordre il vient (cf. chapitre Suites Et Séries): 
ln  — 
æ=1-(1-&@) =1-(1-72@œ )=1& (71117) 


que nous appelons "approximation de Bonferroni", parfois "approximation de Boole" ou encore 


"approximation de Dunn”. Donc au final, nous avons: 
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Cia Mni=|1+ 


N-1 
aiN,n-1,(N—1)(n-1) 
Que nous pouvons calculer avec la versin anglaise de Microsoft Excel 14.0.6123 à l'aide de la formule: 
=1/(1+(N-1)/FINV(ALPHA/N:n-1;(N-1)*(n-1))) 


13.9. TEST D'AJUSTEMENT DU KHI-DEUX 


Nous allons étudier ici notre premier test d'ajustement non-paramétrique, un des plus connus 
certainement et des plus simples. 


Supposons qu'une variable statistique suive une loi de probabilité P. Si nous tirons un échantillon dans 
la population correspondant à cette loi, la distribution observée s'écartera toujours plus ou moins de la 
distribution théorique, compte tenu des fluctuations d'échantillonnage. 


Généralement, nous ne connaissons ni la forme de la loi P, ni la valeur de ses paramètres. C'est la 
nature du phénomène étudié et l'analyse de la distribution observée qui permettent de choisir une loi 
susceptible de convenir et d'en estimer les paramètres. 


Les écarts entre la loi théorique et la distribution observée peuvent être attribués soit aux fluctuations 
d'échantillonnage, soit au fait que le phénomène ne suit pas, en réalité, la loi supposée. 


En gros, si les écarts sont suffisamment faibles, nous admettrons qu'ils sont imputables aux fluctuations 
aléatoires et nous accepterons la loi retenue ; au contraire, s'ils sont trop élevés, nous en conclurons 
qu'ils ne peuvent pas être expliqués par les seules fluctuations et que le phénomène ne suit pas la loi 
retenue. 


Pour évaluer ces écarts et pouvoir prendre une décision, il faut: 


1. Définir la mesure de la distance entre distribution empirique et distribution théorique résultant de la 
loi retenue. 


2. Déterminer la loi de probabilité suivie par cette variable aléatoire donnant la distance. 


3. Énoncer une règle de décision permettant de dire, d'après la distribution observée, si la loi retenue est 
acceptable ou non. 


Premièrement, nous aurons pour cela besoin du théorème central limite et deuxièmement rappelons que 
lors de la construction de la loi Normale, nous avons montré que la variable: 


x = FL &— xp 


pa VJii-p) 


suivait une loi Normale centrée réduite lorsque n tendait vers l'infini (condition de Laplace) et que la 
probabilité p était très petite. 


En pratique, l'approximation est tout à fait acceptable. dans certaines entreprises... lorsque #2 >5 et 
p =<0.5 soit (c'était un des termes qui devait tendre vers zéro quand nous avions fait la démonstration): 
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50: (7.1121) 
pq 


Par exemple dans les deux figures ci-dessous où nous avons représenté les lois binomiales approchées 
par les lois Normales associées, nous avons à gauche x = 60,p = 1/6,#p = 10 et à droite 


ñ = 40, p = 0.05,xp = 2: 


0 2 4 6 6 1012141618202224 0 2 4 6 6 1012141618202224 


Figure: 7.59 - Approche de fonctions binomiales par fonctions Normales associées 


Rappelons enfin, que nous avons démontré que la somme des carrés de n variables aléatoires normales 
centrées réduites linéairement indépendantes suit une loi du Khi-deux à n degrés de liberté noté 7<(#). 


Considérons maintenant une variable aléatoire X suivant une fonction de distribution théorique 
(continue ou discrète) P et tirons un échantillon de taille n dans la population correspondant à cette loi 
P, 


Les n observations seront réparties suivant k modalités (classes de valeurs) CC, Ci dont les 
probabilités p., p., …, p, sont déterminées par la fonction de distribution P (se référer à l'exemple de la 


droite de Henry). 


Pour chaque modalité C; l'effectif empirique est lui une variable aléatoire k; de loi binomiale: 


Bn,r,) (71122) 


Cet effectif k; correspond en effet au nombre de succès "résultat égal à la modalité C;" de probabilité 
p; obtenus au cours des n tirages d'un lot expérimental (et non dans la population de la loi théorique 


comme avant). 
Nous avons démontré lors de l'étude de la loi binomiale que son espérance: 
E(K;) = np; (71123) 


représente l'effectif théorique de la modalité C; et sa variance est: 
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VGK)=#p;g = (-r)= xp (71124) 


car p; est relativement petite, ce qui donne 1- »; qui est assez proche de 1. Son écart-type est donc: 


ok, ) = #P; (7.1125) 
Dans ces conditions, pourvu que la modalité C; ait un effectif théorique np, au moins égal à 5, l'écart 


réduit: 


à À (7.1126) 


#P; T; 


entre effectif empirique et effectif théorique peut être approximativement considéré comme une 
variable normale centrée réduite comme nous l'avons vu plus haut. 


Nous définissons alors la variable: 


N NE 2 
D= DE = Um) (7.1127) 
i=l =] AP; 


où #, est souvent nommée "fréquence expérimentale" et #p, "fréquence théorique”. 


Signalons que cette variable est aussi parfois (un peu malheureusement) notée: 
2 
N'y —n! 
D= 0 (7.1128) 


ou le plus souvent: 


4 
us (7.1129) 


Cette variable D, somme des carrés des variables E;, nous donne une mesure de ce que nous pourrions 


LEA 


appeler une "distance" ou "différence" ou "écart" entre distribution empirique et distribution théorique. 
Notons bien cependant qu'il ne s'agit pas d'une distance au sens mathématique habituel (topologique). 


Rappelons que D peut donc aussi s'écrire: 


5. &-m) N(-4) 


= RP; 2=] ur 


D est donc la somme des carrés de N variables aléatoires normales centrées réduites liées par la seule 
relation linéaire: 


&+k+..+ky =2% (71131) 


où n est la taille de l'échantillon. Donc D suit une loi Khi-deux mais à N-1 degrés de liberté, donc un 
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degré de moins à cause de l'unique relation linéaire qui les lie! Effectivement, rappelons que le degré de 
liberté indique le nombre de variables indépendantes dans la somme et non pas juste le nombre de 
termes sommés. 


Donc: 


(& AP; Ÿ 
AP; 


2 i 
PWN-D=Y 
= 


Nous appelons ce test un "test non-paramétrique du Khi-deux" ou "test du Khi-deux de Pearson" ou 
encore "test d'ajustement du Khi-deux" ou encore "test de Karl Pearson". 


Ensuite, l'habitude est de déterminer la valeur de la loi du Khi-deux à N-1 degrés de liberté ayant 5% de 
probabilité d'être dépassée. Ainsi, dans l'hypothèse où le phénomène étudié suit la loi théorique P, il y a 
donc 95% de probabilité cumulée que la variable D prenne une valeur inférieure à celle donnée par la 
loi du Khi-deux. 


Si la valeur de la loi du Khi-deux obtenue à partir de l'échantillon prélevé est inférieure à celle 
correspondant aux 95% de probabilité cumulée, nous acceptons l'hypothèse selon laquelle le 
phénomène suit la loi P. 


Remarques: 


R1. Le fait que l'hypothèse de la loi P soit acceptée ne signifie pas pour autant que cette hypothèse 
soit vraie, mais simplement que les informations données par l'échantillon ne permettent pas de la 
rejeter. De même, le fait que l'hypothèse de la loi P soit rejetée ne signifie pas nécessairement que 
cette hypothèse soit fausse mais que les informations données par l'échantillon conduisent plutôt à 
conclure à l'inadéquation d'une telle loi. 


R2. Pour que la variable D suive une loi du Khi-deux, il est nécessaire que les effectifs théoriques 
np; des différentes modalités C; soient au moins égaux à 5, que l'échantillon soit tiré au hasard (pas 


d'autocorrélation) et qu'aucune des probabilités p, ne soit trop proche de zéro. 


Ce test d'ajustement souffre cependant d'un gros défaut: il nécessite de regrouper les mesures dans des 
classes C; et dans la pratique il n'existe pas de théorème absolu (du moins à ma connaissance) pour 


choisir le nombre de classes (et in extenso leur largeur). C'est cette raison qui fait que le test 
d'ajustement (conformité) du Khi-deux est resérvé pour des distributions discrètes où le problème du 
choix des classes en se pose pas. 


Il nous faudra cependant créer des tests d'ajustement qui ne nécessitent pas l'utilisation de classes et 
nous allons voir de suite les outils ad hoc pour cela (test de Kolmogorov-Smirnov ou Anderson-Darling 
pour ne citer qu'eux). 


Exemple: 


Supposons que les naissances à un hôpital, pour une certaine période de temps, se répartissent comme 


suit: 
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(Observations 120 130 (125 128 (80 [70 75 (728 


Tableau: 7.23 - Mesures pour l'exemple du test du Khi-deux 


Nous remarquons qu'il y a eu au total 728 naissances. Nous nous posons alors la question suivant: 
Combien devrait il y avoir de naissances, en théorie, à chaque jour s'il n'y a pas de différence entre les 
jours? Ceci représente l'hypothèse nulle. En fait l'hypothèse nulle indique que les différences entre les 
fréquences observées et les fréquences théoriques sont relativement petites. Nous prenons donc pour 
acquis que si aucune différence n'existe il devrait y avoir le même nombre de naissances à chaque jour. 
Puisqu'il y a au total 728 naissances pour les 7 jours en théorie il devrait y avoir 728/7-104 naissances 
à chaque jour. Nous avons donc maintenant le tableau suivant: 


Jour ____L M MJ V S D Tol 
(Observations 120 130 1125 128 80 70 75 [728 
Théorique 104 |104 (104 |104 |104 /104 |104 1728 


Tableau: 7.24 - Comparaison par rapport à l'attendu 


Le total des fréquences observées est égal au total des fréquences théoriques. Il s'agit donc d'examiner 
la différence entre les fréquences observées et les fréquences théoriques (supposées suivre une loi 
uniforme) en suivant la relation du Khi-deux. En d'autres termes, nous allons faire un test d'ajustement 
entre une fonction de distribution empirique (observée) et la fonction de distribution uniforme. Nous 
avons alors: 


RICE Ÿ 


(120 104 sur 104 Aie 104 À Aie 104 ee. 104? 


104 104 104 104 104 
(70-1042 (75-104 
À —_—— © + —— 
104 104 


(16)? (26 (217 (24) (-24) (-34Ÿ (-29) 
D 
104 104 104 104 104 104 104 
= 200,076 441, 576, 576 1156 341 
104 104 104 104 104 104 104 


= 2.46+6.5+4.24+5.54+5.54+11.12+8.09 = 43.49 


Le v est donc de 43.49. Comme tel ce chiffre signifie peu de chose. Il faut interpréter ce résultat 
grâce à l'aide de la table des valeurs critiques du P . On comprend qu'il est très peu probable que la 
fréquence observée et la fréquence théorique soit identique. Nous acceptons qu'il puisse y avoir une 
certaine différence (nous rejetons donc l'hypothèse). 


13.10. TEST D'AJUSTEMENT DE KOLMOGOROV-SMIRNOV 


En statistiques, le test de Kolmogorov-Smirnov est un test d'hypothèse basé sur une distance empirique 
utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition 
continue (ou pour comparer deux échantillons et vérifier s'ils sont dépendants ou non car semblables ou 


dissemblables). 
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Pour introduire ce test, nous avons choisi l'approche de Lilliefors qui permet d'éviter des calculs 
complexes. Par ailleurs, les logiciels qui proposent le "test de Lilliefors" ne proposent pas le test 
Kolmogorov-Smirnov puisque ce dernier n'est correct qu'asymtotiquement (ce qui est le cas de Tangra 
4.14). 


Imaginez donc que nous souhaiterions construire un test non paramétrique d'ajustement qui marche 
aussi bien pour les lois discrètes que continues et sans souffrir du même problème que le test 
d'ajustement du Khi-deux (regroupement en classes). 


Pour construire ce test, nous allons partir de la fonction de répartition empirique déjà définie au début 
de ce chapitre et donnée pour rappel par 


= [0,1] (7.1133) 


Notons maintenant F(x}, la loi vraie avec laquelle nous souhaiterions comparer À( x) et construisons 


la distance: 
D, (= Ë, (x)— F(x) (71134) 


Le problème avec ce choix de distance c'est. quel x faut-il alors choisir pour faire un test? Eh bien 
pour répondre il est simple de constater qu'il serait stupide de prendre le x pour lequel cette distance est 
minimale, car avoir un 2,, qui peut valoir-zéro n'apporte pas grand chose. Dès lors, on se reporte 


plutôt vers le plus grand écart en valeur absolue. Ce qui nous amène à redéfinir la distance 2,, ainsi: 


Le] 
D, (x) = suplË, (2) — F(x)| = sup Des = F(H|| (7.135) 
À . 


i=l 


où 2, (x) est appelée "distribution empirique de KoÏmogorov-Smirnov" (bon évidemment il faudrait 


prouver rigoureusement qu'il s'agit bien d'une distribution... mais pour l'instant c'est trop complexe au 
niveau du contenu du présent site, cependant cela peut se vérifier en faisant des simulations 
numériques). Avant d'aller plus loin relativement à la théorie, regardons un exemple pratique. 


Supposons que nous ayons mesuré les cinq valeurs suivantes: 
-1.2, 0.2, -0.6, 0.8, -1.0 (7.1136) 
soient ordonnées: 
% =—1.2,x% =-1.0,x3 =-0.6,x4 =0.2,x; =0.8 (7.1137) 
Nous voulons tester l'hypothèse nulle suivante: 
#0 -Ê(H = (x) (71138) 


où P(x) représente la fonction de répartition de la loi Normale centrée réduite. 
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La fonction de distribution empirique sera donnée par: 


et pour x «—1.2 
A 5 
1 1 
0.2=—=- pour —12 <x <—1 
# 5 
0.4 = 2=£ pour —1.0 < x <—0.6 
Fix) = . . (7.1139) 
0.6=—=- pour —0.6 < x <+0.2 
ñ 3 
0.8= si pour +0.2 < x <+0.8 
# 5 
1= 322 pour x > 0.8 
ñn 5 
Ensuite, nous construisons traditionnellement le tableau suivant: 

x Êta 20) | ÊG) - (x) 
= O0 10.115 0.115 
—1.2 0.2 10.115 0.085 
107 0.2 10.159 0.041 
—1.0 0.4 10.159 0.241 
LE 0.4 10.274 0.126 
—0.6 0.6 10.274 0.326 
+09 0.580 0.020 
+0.2 8 10.580 0.220 
+08 0.8 10.788 0.012 
+0.8 1 0.788 0.212 


Souvent associé au graphique comparant les fonctions de répartition empirique et théorique: 
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l{# 


lix F(x) = d(x) 


ds = 0.326 


-35  -3 -25 -2 -15 -1 -05 O0 05 1 15 2 25 4 35 


— | orm ale B- Fonction répartion empirique 


Figure: 7.60 - Représentation de l'approche du test d'ajustement de Kolmogorov-Smirnov 
Nous voyons alors que l'écart maximal observé st 0 326. Nous la noterons pour la suite: 


ds =0.326 (7.1140) 


que certains logiciels comme Minitab notent par l'abréviation KS. 


Le lecteur aura remarqué que le plus grand écart au-dessus de la courbe est mesuré par: 


sms (h Fa es (E 
D, =supi—--Fixih=sups—-»;}p (71141) 


i=1 L7 i=1 L7 


Le plus grand écart au-dessous de la courbe est mesuré par: 


n à — n à — 
DŸ =sup{ Fix = sr( -—) (7.1142) 
x 


i=1 # i=1 


Le plus grand écart est alors: 


) + nl # Ji i—] - , 
D, = sup, D,,D, | =supi—-};,7% -——+} (71143) 
i=1 LA # 


i=] 


Mais que faire de cette valeur? À quoi la comparer? Eh bien l'idée est relativement simple et consiste à 
générer n valeurs (donc cinq dans le cas présent) issues de la loi de distribution F(x) de l'hypothèse 
nulle et de les comparer à elles-mêmes. Autrement dit, il s'agit de faire une simulation de Monte-Carlo 
(cf. chapitre de Méthodes Numériques) 


Ainsi, dans le cas présent, nous générons 5 valeurs de N(0,1), ce qui nous donne par exemple la version 
anglaise de Microsoft Excel 11.8346 (je préfère parfois donner en anglais sinon le nom des fonction est 
trop long): 
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=NORM.S.INV(RANDBETWEEN(0;1000000)/1000000) 


Nous obtenons ainsi 5 valeurs de Z (notation habituelle de la variable aléatoire d'une loi Normale 
centrée réduite) qui ordonnées seront par exemple: 


-1.427, 0.082, 0.162, 0.294, 1.2 


et nous refaisons le même tableau qu'avant: 


92 


Z ÊÇZ) (PC) |$(z)- œ(7) 

-1427" 0 0.077 0.077 
1.427 0.2 (0.077) 0.123 
0.082” 0.2 0.533 0.333 

0.082 0.4 (0.533| 0.133 
0.162 04 (0564! 0.164 
0.162 0.6 (0.564! 0.036 
+0.2947 0.6 10.616, 0.016 
+0.294 0.8 [0.616| 0.184 
+1.2927 0.8 0.902! 6.102 
+1.292 1 |0.902|/ 0.098 


Tableau: 7.25 - Tableau du test de Kolmogorov-Smirnov 


Et nous avons donc l'écart maximal observé qui est de 0.333. Soit avec la version française de 
Microsoft Excel 14.0.6123: 


l iln 

2 0 
3 0.2 
4 0.2 
5 0.4 
6 0.4 
7 0.6 
: 0.6 
#, 0.8 
10 0.8 
11 1 
12 


D 


Valeurs aléatoires de Z Valeurs de Z tnées Normale (x) 


1292 -1.426 
1.292 -1.426 
0.082 0.082 
0.082 0.082 
-1.427 0.162 
-1.427 0.162 
0.162 0.294 
0.162 0.294 
0.294 1.292 
0.294 1.292 


Max 


Figure: 7.61 - Calcul dans Microsoft Excel 14.0.6123 


0.077 
0.077 
0.533 
0.533 
0.564 
0.564 
0.616 
0.616 
0.902 
0.902 


E 

Delta 
0.077 
0.123 
0.333 
0.133 
0.164 
0.036 
0.016 
0.184 
0.102 
0.098 

0.332677 


avec les formules explicites (malheureusement trop longues dans la version française du logiciel): 


Page: 557/4839 


[v3.0 - 2013] 


Vakeers Cr 


AOLNORMALE ST ANDARDINVERSE M{ALEA ENTRE BORNES(0:0000000)1000000) 
2 


AOLNORMALE ST ANDARDINVERSE M{ALEA ENTRE BORNES(0:1000000000000) 
Æ4 2AB£(05-A5) 
AOLNORMALE ST ANOARDINVERSE MALEA ENTRE BORNES(0:1000000)1000000) =AB#(Dé-A6) 
4 =ABS{OT-AT) 
AOLNORMALE $T ANDARDINVERSE M ALEA ENTRE BORNES(0:1000000/ 1000000) 2ADS{(DS-A8) 
8 MAOLNORMALE STANDARDN(CS1)  2ABS(DS-AS) 
AOLNORMALE. ST ANDARDINVERSE M(ALEA.ENTRE BORNES{0:000000)/1000000) AOLNORMALE STANDARD.N(C10:1)  2ABS(DIO-A 10) 
1 80 AOUNORMALE STANDARDN(CIE I) 2ABS(DIT-AN) 
Max =MAX(E ZEN) 


Figure: 7.62 - Fonctions explicites dans Microsoft Excel 14.0.6123 


avec la petite routine VBA correspondante vite fait mal faite qui va prendre le nombre d'itérations 
voulues dans la cellule K1 et va mettre la distribution empirique de Kolmogorov-Smirnov dans la 
colonne G de la feuille active: 


Sub simulNormal () 


Application.ScreenUpdating * False 
For 1 = 1 To Cellsi(il, 11) 
Calculare 
Range {"B2:B11"}).Select 
$Selection.Copy 
Range ("C2").Select 
Selection.PasteSpecial Paste:=xiPasteValues, Operation:=xiNone, SkipBlanks | 
t=False, Transpose:=False 
ActiveWorkbook.VWorksheets{("Normale"}.Sort.SortFields.Clear 
ActiveWorkbook.Vorksheets("Normaile"}).$ort.SortFields.aAdd Key:=Range("C2"}, 
SortOn:=x1S5ortOnValues, Order:=xlAscending, DataOprion:=#x1S0reNormal 
With ActiveWorkbook.Worksheets("Normale”} Sort 
.SerRange Range("Cz:C11") 
.Header = xliGuess 
.HatchCase = False 
.Orientarion = xITopToBorrom 
.SortMethod «= xlPinYin 
.Apply 
End With 
Range {"A1")j.Select 
Cells(i, 7).Value = Cells(12, 5) 
Next 1 
Application.ScreenUpdating = True 
End Sub 


Figure: 7.63 - Code VBA Microsoft Excel 14.0.6123 pour la simulation de Monte-Carlo 


Nous réitérons donc la procédure un bon millier de fois et nous obtenons la fonction de répartition 
(obtenue simplement en faisant un graphique de type nuage de points dans Microsoft Excel 14.0.6123 
de 2'000 simulations): 


100% 
90% 
80% 
70% 
60% 
50% 
40% 
30% 
20% 
10% 

0% 
0.00 0.10 0.20 0.30 040 0.50 0.60 0.70 0.80 


Figure: 7.64 - Fonction de réparition de Kolmogorov-Smirnov 
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et en appliquant un test unilatéral avec un risque æ = 5% nous obtenons pour le 95ème centile: 


Ds = 0.564 


Le lecteur retrouvera la même valeur dans les tables de Kolmogorov-Smirnov disponibles dans de 
nombreux ouvrages. Quelques milliers de simulations suffisent donc pour retrouver les valeurs des 
tables! 


Et maintenant, nous comparons: 


(Ds, = 0.564) > (dy = 0.326) 


et donc nous ne rejetons pas l'hypothèse nulle. 


Cependant, … il faut tout de même se méfier avec seulement cinq valeurs, il est tout à fait probable que 
l'hypothèse nulle ne soit pas rejetée pour d'autres lois de répartition que la loi Normale. 


Ainsi, comme le lecteur l'aura remarqué, pour chaque hypothèse nulle associée à une loi donnée, il faut 
tabuler la distribution empirique de Kolmogorov-Smirnov pour différentes valeurs de n et de & en 
utilisant des méthodes numériques. Dans la majorité des ouvrages on ne trouve qu'une seule table à 
l'aide d'un théorème puissant qui montre qu'en réalité, les valeurs critiques seront les mêmes. 


Remarque: Kolmogorov et Smirnov ont démontré que lorsque n tend est très grand et que la loi de 
l'hypothèse nulle est continue, il n'est plus nécessaire de tabuler une table de Kolmogorov-Smirnov 
pour chaque loi, car nous avons alors: 


Lis 1 —95;2 
lim PhD, <x)=1-23 (1 er 


donc la distribution 2,, est indépendante de la loi de l'hypothèse nulle. En simulant avec la 


méthode de Monte-Carlo, nous observons effective une convergence lorsque n dépasse la centaine. 
Mais dans la pratique, la grande majorité du temps, il est impensable d'avoir un tel nombre de 
mesures. D'où le fait que ce résultat théorique soit peu utilisé dans la pratique et justifie l'absence de 
démonstration. 


Pour clore, signalons au lecteur qu'il trouvera la démonstration mathématique du test d'ajustement 
d'Anderson-Darling dans le chapitre de Méthodes Numériques. Ce dernier test étant effectivement trop 
empirique pour avoir sa place ici. 


13.11. TEST DE NORMALITÉ DE RYAN-JOINER 


Considérons une variable aléatoire X dont nous souhaiterions vérifier la normalité ou pas. Et 
considérons une variable aléatoire ordonnée Y générée par une loi Normale centrée réduite. Pour 
comparer X et Y, nous allons centrer X et ordonner ses valeurs dans l'ordre croissant. 


Pour une même taille d'échantillon, si les valeurs ordonnées de X et Y pris deux à deux suivent une 
même loi, la régression linéaire de l'un en fonction de l'autre doit donner un coefficient assez proche de 
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1. En prenant la définition du coefficient de corrélation au carré, il vient alors: 


2 
cos(#,F) (7.1147) 


2 
FAX | Parcovar 


Y est imposé comme suivant une loi normale centrée réduite. Il vient alors: 


2 2 2 
2 cos(X, F) _|EGT)-E(A)E(T)| _| EC) _ {EU (7.148) 


PAT | Farchvarco ) | arcovar ar)  Var(X 


et si nous prenons l'estimateur du coefficient de corrélation: 


n 
2%" 
R£y= ————— (7.1149) 
> 1 2 
2 (l x; — Xi 
7 i=i 
Mais comme nous avons centré X, il vient: 
12 | 
32 19 
2 i= 
Rey = = ———— (7.1150) 
1 So 2 
dt à 
ua i=1 
Soit après simplification: 
1 * PA 2 ny 2 ñ 3 
ol 
x» — À x} > (2 )x > ax 
D, SR et 2 RNNe  Let 2 Go 
| LS 3 ni 7, 2 
_S" S' x: S' x: S° x: 
per, di 1 di 1 Et “1 
7 i= i=i i=i i=i 


Il s'agit de l'approche de Ryan-Joiner (implémentée dans Minitab) du test de Shapiro-Wilk. Les résultats 
des deux tests sont très similaires. Les coefficients 4; peuvent être facilement obtenus à l'aide de 


n'importe quel tableur à notre époque en utilisant une simulation de Monte-Carlo (cf. chapitre de 
Méthodes Numériques). Si un lecteur le souhaïte nous détaillerons comment obtenir les 4; avec 


Microsoft Excel pour un n donné. 


Il convient de signaler que les logiciels de statistique donne la racine carrée de la dernière égalité 
ci-dessous comme étant le coefficient RJ de Ryan-Joiner. 


Exemple: 


Considérons les 10 mesures de la colonne A déjà triées dans l'ordre croissant: 
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À 


0.1685 
0.1705 
0.1708 
0.1713 


Con IN 


on EE 


0.1728 
0.1732 
0.1735 
0.1739 
0.1740 
0.1747 


J 


À E D 
Mesures Rang G) NormalScore exacta, ZScore X, 
1.00 -1.5414 -1.947246 
2.00 -1.0008 -0.927745 
3.00 -0.6536 -0.77482 
4.00 -0.3309 -0.519945 
5.00 -0.1261 0.2446801 
6.00 0.1205 0.4485802 
7.00 0.3699 0.6015052 
8.00 0.6501 0.8054053 
9.00 1.0033 0.8563803 
10.00 1.5340 1.2132054 


Figure: 7.65 - Mesures ordonnées, rangs, coefficient de RJ et Z-score d'exemple 


Les formules sont les suivantes (données en anglais car plus petites pour la capture d'écran): 


Rang G) NormalScore exact a; 
=Coeff MonteCalolKi =(42-AVERAGE(SA$2#$24$11)/STDEV(SA$2:$4$11) 
=Coeff MonteCarlolLl =(43-AVERAGE(S24$2:$49$110)/STDEV(SA#2$24$11) 
=Coeff MonteCarlolM1 =(44 AVERAGE(S49$2$4%$10)/STDEV(SA#2#249$11) 
=Coeff MonteCarlol Ni =(45-AVERAGE(SA$2#$49$11)/STDEV(SA#2#24$11) 
=Coeff MonteCarlolO1 
=Coeff MonteCarlolP1 
=Coeff MonteCarlolOQ1 
=Coeff MonteCarlolR1 
=Coeff MonteCarlol51 
=Coeff MonteCarlolT1 


CO -J CO La RO Lo HD 


‘0 
o 


ZScore X; 


=(46-AVERAGE(SA$2$A$11)/STDEV(SA#$2#$2A$11) 
=(A7-AVERAGE(A#$2%A4$11)/STDEV($2$2:$4%11) 
=(48-AVERAGE(A$2%4$11/STDEV(S2A$2$44%11) 
=(A9-AVERAGE(SA$2:$A$11)/STDEV(SA#$2#$2A$11) 
=(410-AVERAGE(SA$2$24$10)/STDEV(ÉA#2#24$11) 
=(A11-AVERAGE(GA#$2$24$11)/STDEV(ÉA4#$2$24$11) 
Figure: 7.66 - Détails de la capture d'écran précédent avec la version anglophone de Microsoft Excel 14.0.6123 


Et donc nous avons dans une feuille nommée Coeff_MonteCarlo des simulations de Monte-Carlo pour 
déterminer les 10 coefficients 4, notés traditionnellement dans le cas de 10 mesures dans les tables 


ss 


sous la forme suivante: | 410,4210 


40/0 | - 


D'abord il faut créer 10 colonnes avec des générations de variables aléatoires normales centrées 


réduites sur à peu près 10'000 lignes avec la formule suivante (donnée en anglais): 


=NORM.S.INV(RANDBETWEEN(1;99999999)/100000000) 
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Vall Val? Val Valid Val Valé Val Val Val9 Vali0 
-099129 068284 01755 -068052 1.78189 -0.52315 076374 067829 -016533 1.461827 
09246 -174979 089753 135076 -174906 121639 -027363 069305 -0.51966 0.799353 
-026234 17695 026191 -11254 10938 041169 122103 08$903 OSé6dié -0.35126 
130528 -0.49696 -121058 -106516 1.461374 1.352495 -117436 -11672 -002356 -0.09223 
-110717 060102 030108 087667 -0.31205 096475 101134 033521 039329 013311 
-088378 -109298 -012637 041839 -120593 02952 056708 -1.39583 -009561 0.738012 
06153 -0.51951 -114361 18186 -04606 0.5296 -0.5367 -003046 116186 165168 
06199 -008476 090698 -1.27954 -0.50671 -006454 -0.52029 061259 -1.56543 -0.18526 
-0.53029 -0.70509 0.462723 -0.49299 -007783 O0.56007 -0.69865 095785 -019304 049944 
057066 -008925 -007208 095499 253707 173946 -15678 007032 033524 011992 
-0.53362 -124438 062274 -0.53446 -137429 086534 -10204 027698 029341 226824 
-033033 -0.53063 -074337 -098731 033377 -081831 056882 -138338 -076082 0.750353 
03074 015149 127588 104967 074692 033037 -103691 -014088 085939 -0.86295 
Figure: 7.67 - Génération des variables aléatoires normales centrées réduites pour les coefficient de RJ 


et ensuite il faut construire les ranges de toutes ces valeurs ligne par ligne tel que: 


( M O P Q R 
-1.53725 -10033 -065264 -036952 -011389 013027 038653 066225 100802 1.542536 
O1 O2 03 O4 O5 Oé O7 O8 09 O10 
-099129 -0.68052 -0.52315 -016533 01755 067329 068284 076374 161827 1.783189 
-1.74979 -174906 -0.51966 -0.27363 069305 0.79935 089753 09246 121639 1.35076 

-11254 -035126 -026234 026191 041169 OSédié 088903 10938 122103  1.7695 
-121058 -117486 -11672 -106516 -0.49696 -009223 -002356 130528 1.52495 161374 
-110717 -031205 013311 030108 033521 039329 060102 087667 096475 101134 
-139583 -120593 -109298 -088378 -012637 -009561 02952 041839 056708 0.738012 
-1.14361 -05367 -0.51951 -04606 -003046 0.5296 06153 116186 165163 18186 
-1.56543 -127954 -0.52029 -0.50671 -018526 -003476 -006454 061259 06199 090698 
-0.70509 -0.69865 -0.58029 -0.49299 -0.19304 -007783 049944 056007 062723 095785 
-1.5673 -0.08925 -007203 007032 011992 038524 057066 095499 173946 2.533707 
-137429 -124438 -102048 -0.53446 -053362 027698 029341 062274 086534 226824 
-1383383 -098731 -081831 -076082 -0.74337 -0.53063 -033033 033377 056882 0.750353 
EN -103691 -086295 -014088 015149 03074 033037 074692 085939 104967 127588 

Figure: 7.68 - Tri des simulations pour déterminer les coefficients de RJ 


re] 


on Un  & 


À 


] 


NO — 


pe 


avec les formules suivantes (données seulement pour les 4 premiers i faute de place dans la capture 
d'écran): 
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=AVERAGE(K3:K10000) =AVERAGE(L3:L10000) =AVERAGE(M3:M10000) =AVERAGE(N3:N 10000) 
O1 02 03 O4 
=SMALL($A3$/3:1)  =SMALL(SA3$32  =SMALL(SA3$/3,7 =SMALL($A3:$J3:4) 
=SMALL(SA4:$J4,1)  =SMALL(A4$J47)  =SMALL(A4$J4,7) =SMALL($A4:$J4;4) 


&W NO — 


Es 


-SMALL(SA5#151)  =SMALLA5#I5:2  =SMALL(SA5$15:7  =SMALLSA5#15:4 
-SMALL(SA6$I61)  =SMALLSA6$I6D  =SMALL(SA6$I6:,7) =SMALL(A6:$76:;4) 
-SMALLSA7S#I70)  =SMALL(A7#I7:2)  =SMALL(SA7#I7:7  =SMALL(SA7:$I7:4 
CI-SMALL(SAS8#18:1)  =SMALLAS#78:7) =SMALL($28:$78,7) =SMALL(SA48:$78:4) 

=SMALL($A9#J9:1)  =SMALL(A9#J9:7  =SMALL(SA9$79,7  =SMALL(SA9:$79:4 


I =SUMALL(ÉA410$710,1) =SMALLÉ410%$710;7 =SMALL($A10#$710;3) =SMALL($410:$710;4) 
=SMALL($411#711:1) =SMALL(411#711:2) =SMALL$A11#711;5 =SMALL($411:$711;4) 
=SMALL($412%$712;:1) =SMALL(#412#712;7%) =SMALL$A12#712;7) =SMALL($412$712;4) 
=SMALL(#413$713:1) =SMALL(#4134713:%) =SMALL#A13#713;7) =SMALL($413$713;4) 
UN =-SUMALL(ÉA14#1141) =SMALLÉA414$7147) =SMALL(A14#$714;3) =SMALL($414:$714;4) 
=SMALL(415%$715:1) =SMALL(415#715%) =SMALL$A15#715;7 =SMALL(415%$715;4) 
Figure: 7.69 - Détails du tri pour la détermination des coefficients de RJ 
avec la version anglophone de Microsoft Excel 14.0.6123 


Pour finir, il n'y a plus qu'à calculer le coefficient de corrélation entre les colonnes C et D de la 
première capture d'écran: 


Coefficient de Corrélation Ryan-Joiner (RT): 
=CORREL(C2:C11;:D2:D11) 


Figure: 7.70 - Calcul final du coefficient de corrélation de RJ 


Ce qui donne environ 0.963 (le carré de cette valeur étant très très proche du test de Shapiro-Wilk). 
Ensuite, pour savoir si on peut accepter ou rejeter l'hypothèse de normalité, il faudrait refaire la 
procédure avec en lieu et place mesures, des valeurs générées aussi aléatoires à partir d'une loi Normale 
et déterminer la valeur critique d'acceptation/rejet (normalement c'est très simple à faire mais on peut 
détailler sur demande). 


14. ROBUSTESSE 


Dans le domaine des statistiques inférentielles et tests d'hypothèses, la robustesse est un concept 
récurrent (les banques sont astreintes au stress testing de leurs modèles de risque). Nous en avons par 
ailleurs déjà fait mention plus haut. 


Définitions: 


D1. Un test est dit "test robuste" s'il reste valable alors que les hypothèses d'application ne sont pas 
toutes réunies. Ce peut être une taille d'échantillon un peu faible ou une loi de probabilité (loi normale 
pour les tests paramétriques) qui n'est pas très bien vérifiée. Par exemple, l'ANOVA est robuste par 
rapport à l'hypothèse de normalité mais pas par rapport à celle de l'homoscédasticité 


D2. Un indicateur est dit "indicateur robuste" s'il est peu sensible à la présence d'outliers (le coefficient 
de corrélation, par exemple, n'est pas très robuste). 


D3. Plus généralement, un modèle est dit "modèle robuste" lorsqu'il permet un prolongement des 
résultats (dans le temps ou pour une population). La robustesse s'applique aussi bien à une régression 
multiple qu'à une grille de score. 
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Par conséquent, à moins d'être uniquement descriptives, vos études devront respecter quelques règles 
pour que leurs conclusions soient généralisables. 


Première condition d'une bonne robustesse: les données. Intuitivement, chacun sait qu'on ne transforme 
pas un cas en généralité (ce qui ne relèverait pas des statistiques mais des discussions de comptoir). Une 
quantité suffisante de données permet de bâtir des modèles fiables et solides. À titre d'exemple, des 
prévisions établies à partir d'une série chronologique montrant une saisonnalité nécessitent au moins 
trois ou quatre ans d'historique. 


La quantité ne suffit pas, il faut la qualité. Mieux vaut s'abstenir que réaliser une étude sur des 
informations non fiables qui peuvent conduire à des décisions coûteuses. Par ailleurs, il convient 
d'éliminer ou d'imputer certaines observations (voir outliers). Si ce n'est pas possible, on se tourne vers 
des méthodes adaptées, par exemple celles qui utilisent la médiane plutôt que la moyenne. 


15. STATISTIQUES DE RANGS 


Les statistiques de rangs, appelées aussi "statistiques d'ordre", sont définies comme l'ensemble des 
techniques de calculs statistiques ou d'inférence statistiques qui ont pour objectif principal de se 
débarrasser de la connaissance d'une distribution paramétrée et en utilisant pour cela uniquement les 
rangs (ordonnés) des caractéristiques mesurées. Il s'agit d'un outil très puissant et très utilisé dans la 
pratique pour faire de la statistique non-paramétrée! 


15.1. TESTS DE RANG (NON PARAMÉTRIQUES) 


Comme nous l'avons déjà mentionné plus haut, nous parlons de tests paramétriques lorsque nous 
stipulons que les données sont issues d'une distribution paramétrée. Dans ce cas, les caractéristiques des 
données peuvent être résumées à l'aide de paramètres estimés sur l'échantillon, la procédure de test 
subséquente ne porte alors que sur ces paramètres. 


Rappelons aux lecteurs les tests le petit nombre de tests (du moins ceux qui ont des noms particuliers) 
que nous avons démontrés jusqu'à maintenant (nous espérons ne pas avoir commis d'erreurs trop graves 
dans le listing ci-dessous): 


(1) Test-T de Student 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

La moyenne lorsque l'écart-type théorique est inconnu 

Contrainte(s): 

Distribution Normale des données. 


(2) Test-p de l'intervalle de confiance de proportions 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

La proportion de bons ou mauvais éléments dans une population 

Contrainte(s): 

Distribution Binomiale (et asymptotiquement) Normale des données (# - » Z 5). 


(3) Test-p de l'égalité de deux proportions 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en unilatéral 
Concerne: 

L'égalité de deux proportions 

Contrainte(s): 
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Distribution Binomiale et asymptotiquement Normale des données (# -p 5) 


(4) Test binomial exact (égalité de deux proportions) 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

L'égalité de deux proportions. 

Contrainte(s): 

Distribution Binomiale (petit échantillon d'un grande population) 

(5) Test des signes (de la médiane) de deux échantillons appariés 

Type: 

Test d'hypothèse non-paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

L'égalité des signes (implicitement des différences) de données appariées 

Contrainte(s): 

Distribution Binomiale (petit échantillon d'un grande population) mais valeurs sous-jacentes continues. 


(6) Test-T de Student de deux moyennes d'échantillons appariés 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé unilatéral. 
Concerne: 

La différence de deux moyennes de deux échantillons identiques 

Contrainte(s): 

Distribution Normale des données 

(7) Test-Z 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance plus utilisé en bilatéral qu'en unilatéral. 
Concerne: 

La moyenne lorsque l'écart-type théorique est connu 

Contrainte(s): 

Distribution Normale des données 


(8) Test-Z de la moyenne à deux échantillons 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

La différence de deux moyennes lorsque les écarts-types théoriques sont connus 
Contrainte(s): 

Distribution Normale des données 

(9) Test du Khi-deux 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

La variance théorique 

Contrainte(s): 

Distribution Normale des données 

(10) Test-F de Fisher 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en bilatéral 
Concerne: 

La comparaison de deux variances théoriques 

Contrainte(s): 

Distribution Normale des données 


(11) Test-T homoscédastique 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en unilatéral 
Concerne: 

L'égalité de deux moyennes 

Contrainte(s): 

Distribution Normale des données et égalité des variances expérimentales 
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(12) Test-T hétéroscédastique 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance souvent utilisé en unilatéral 

Concerne: 

L'égalité de deux moyennes 

Contrainte(s): 

Distribution Normale des données et non-égalité des variances expérimentales (cas généralisé du Test-T 
homoscédastique) 

(13) Test de l'ANOVA à un facteur contrôlé 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance utilisé uniquement en unilatéral 
Concerne: 

L'égalité des moyennes des échantillons (supposés implicitement appariés) 

Contrainte(s): 

Distribution Normale des données avec variances théoriques identiques et variances expérimentales connues et 
indépendance des échantillons. Les résidus doivent in extenso aussi être normalement distributés 


(14) Test de l'ANOVA à deux facteurs contrôles avec ou sans répétition 

Type: 

Test d'hypothèse paramétrique de type intervalle de confiance utilisé uniquement en unilatéral 

Concerne: 

L'égalité des moyennes des échantillons fonction d'un paramètre variable contrôlable (ajustable). 
Contrainte(s): 

Distribution Normale des données avec variances théoriques identiques et variances expérimentales connues et 
indépendance des échantillons. Les résidus doivent in extenso aussi être normalement distributés. 

(15) Test d'ajustement (dit aussi "test d'adéquation de Pearson") du Khi-deux 

Type: 

Test d'ajustement paramétrique utilisé uniquement en unilatéral 

Concerne: 

Adéquation de valeurs expérimentales à une loi théorique 

Contrainte(s): 

Avoir suffisamment de classes d'intervalles et de données 

Remarque: Appelé "Test de normalité” si comparé à une loi Normale. 

(16) Test d'indépendance du Khi-deux 

Type: 

Test d'ajustement (étudié dans le chapitre de Méthodes Numériques) paramétrique utilisé uniquement en 
unilatéral 

Concerne: 

Vérifier la dépendance ou l'indépendance (différence) de données provenant d'une table de contingence. Vérifie 
donc si les moyennes sont différentes ou pas entre groupes en se basant sur la contingence 

Contrainte(s): 

Avoir suffisamment de classes d'intervalles et de données 

(17) Test de la médiane 

Type: 

Test d'hypothèse non paramétrique étudié dans le chapitre de Méthodes Numériques de type intervalle de 
confiance toujours utilisé en bilatéral 

Concerne: 

La médiane 

Contrainte(s): 

Un nombre d'échantillons suffisant pour faire un bootstrap. 

(18) Test de Mood (de la médiane) 

Type: 

Test d'hypothèse non paramétrique basé sur la classification de données supérieures et inférieurs à la médiane. 
Les données sont aussi parfois angées dans une table de contingence après quoi on calcule un test 
d'indépendance du Khi-deux et le test de la médiane. 

Concerne: 

Vérifier la dépendance ou l'indépendance (différence) de données provenant d'une table de contingence (vérifie 
donc si les médianes sont différentes ou pas entre groupes en se basant sur la contingence) 

Contrainte(s): 

Avoir suffisamment de classes d'intervalles et de données (puisque basé sur la loi hypergéométrique et Le test 
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d'indépendance du Khi-deux) 

(19) Test de Poisson à un et deux échantillons 

Type: 

Tests d'hypothèses paramétrique tantôt en unilatéral ou bilatéral basé sur les événements rares (dixit la moyenne 
de la loi de Poisson) 

Concerne: 

Déterminer un intervalle de confiance pour l'occurrence d'événements rares sur une période donnée afin 
d'identifier une anomalie ou une différence significative par rapport à des objectifs ou des nromes. 
Contrainte(s): 

Les événements suivent une loi de Poisson mais sont approximés dans le cas à deux échantillons par une loi 
Normale. 

(20) Test C de Cochran 

Type: 

Test d'hypothèse paramétrique utilisé en unilatéral 

Concerne: 

La détection d'une variance abérrante parmi un ensemble de variances avant d'effecteur une ANOVA. 
Contrainte(s): 

Suppose les données normalement distribuées. 

(21) Test de Ryan-Joiner (version simplifiée de Shapiro-Wilk) 

Type: 

Test d'hypothèse non-paramétrique utilisé uniquement en unilatéral sur le coefficient de corrélation. 
Concerne: 

Déterminer si des mesures une fois centrées et réduites peuvent être considérées comme normalement 
distribuées. 

Contrainte(s): 

Les mesures suivent une loi Normale (in extenso centrée réduite après normalisation). 

(22) Test du Kappa de Cohen 

Type: 

Test d'hypothèse paramétrique étudié dans le chapitre de Méthodes Numériques et utilisé uniquement en 
unilatéral 

Concerne: 

Tableau de contingence dichotomique (binaire) dont on souhaite vérifier si les agréments entre experts 
correspondent 

Contrainte(s): 

Les valeurs du tableau de contingence dichotomique suivent une loi Normale (in extenso centrée réduite après 
normalisation) et très très approximativement une loi du Khi-deux à un degré de liberté. 


(23) Test de McNemar (données appariées) 

Type: 

Test d'hypothèse paramétrique étudié dans le chapitre de Méthodes Numériques utilisé uniquement en unilatéral 
mais avec intervalle de confiance de la différence en bilatéral 

Concerne: 

Tableau de contingence dichotomique (binaire) dont on souhaite vérifier si les agréments entre experts 
correspondent avant et après (car les données ne sont pas indépendantes) 

Contrainte(s): 

Les valeurs du tableau de contingence dichotomique suivent une loi Normale (in extenso centrée réduite après 
normalisation) et très très approximativement une loi du Khi-deux à un degré de liberté. 

(24) Test exact de Fisher 

Type: 

Test d'ajustement (étudié dans le chapitre de Méthodes Numériques) paramétrique utilisé principalement en 
bilatérial 

Concerne: 

Vérifier si la configuration observée dans un tableau de contingence est une situation extrême par rapport aux 
situations possibles. 

Contrainte(s): 

Aucune en particulière 


Tableau: 7.26 -Tests courants et démontrés jusqu'à maintenant sur le présent site Internet 


Le lecteur intéressé pourra se référer à l'excellent ouvrage en langue anglaise de Gopal K. Kanji qui 
contient une présentation sommaire avec exemples des 100 tests statistiques paramètriques et non 
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paramétriques les plus utilisés dans le monde. 


Les tests non paramétriques (comme les deux tests du Khi-deux déjà vus) ne font eux aucune 
hypothèse sur la distribution sous-jacente des données. L'étape préalable qui consistait uniquement à 
estimer les paramètres des distributions avant de procéder au test d'hypothèse proprement dit n'est plus 
nécessaire. 


Lorsque les données sont quantitatives, les tests non paramétriques transforment les valeurs en rangs. 
L'appellation "tests de rangs" est alors souvent rencontrée. Lorsque les données sont qualitatives, seuls 
les tests non paramétriques sont utilisables. 


15.1.1. L-STATISTIQUES 


Avant de s'attaquer aux tests non paramétriques, donnons quelques définitions que lecteur risquerait de 
trouver dans la littérature hyperspécialisée et dont nous avons évité l'utilisation (du moins jusqu'à 
maintenant…). 


La médiane, la moyenne et l'étendue suggèrent l'utilisation de combinaisons linéaires de composantes 
du vecteur des statistiques d'ordre. 


Ainsi, notons ÆQ) 2...2 À @) une statistique d'ordre (donc les valeurs ordonnées dans l'ordre 
décroissant et numérotées par leur rang). Nous définissons alors la "L-statistique" par: 
h 
1, Dan (7.1152) 


i=1 


et donc le premier "L-estimateur" le plus connu est la moyenne arithmétique pour laquelle: 


1 
= (7.153) 
7 


Le deuxième L-estimateur le plus connu est la médiane pour laquelle nous avons lorsque n est impair: 


# +1 
lLi= : 
Ain — (7.1154) 
.. A+ 
0 iz — 
2 
et lorsque n est pair: 
1 x n 
— i=—,—+] 
din = 12 2 2 (7.1155) 
Ô sinon 


Enfin, le troisième L-estimateur le plus connu est l'étendue pour lequel nous avons: 


+1 i=1 
Ain = —1] i=}x (71156) 
0 sinon 


Page: 568/4839 


[v3.0 - 2013] 


15.1.2. TEST DE LA SOMME DES RANGS DE WILCOXON 


L'idée du "test de la somme des rangs de Wilcoxon" est la suivante: si nous rassemblons deux 
échantillons de mesures, et que nous rangeons les valeurs dans l'ordre, l'alternance des X, (de taille #,) 


et des F: (de taille #, ) devrait être assez régulière si les deux échantillons de loi de répartition F et 
respectivement G suivent la même loi de probabilité. Il s'agit donc d'un "test d'ajustement". 


Il ne s'agit donc pas comme le test d'ajustement du Khi-deux de comparer des mesures à une loi 
théorique, mais à d'autres mesures. 


Remarque: Le test de la somme des rangs de Wilcoxon est donc un test non paramétrique parce que 
nous n'avons pas besoin d'un quelconque indicateur de dispersion ou de position des variables 
aléatoires étudiées pour l'utiliser. De plus, c'est un test dit robuste dans le sens qu'il ne suppose pas 
la normalité des données. 


Prenons un exemple avant de nous attaquer à l'aspect théorique. Voici deux échantillons de taille 10 ( 
#, = #,) de variables quantitatives: 


1,318 040009032L43223 7% 
8.1, 5.5, 3.4, 7.9, 4.6, 1.6, 8.5, 7.1, 8.7, 5.7 


(7.1157) 


Remarque: Le test de la somme des rangs de Wilcoxon peut tout à fait être utilisé pour des variables 
ordinales (donc catégorielles mais à condition qu'elles soient en un nombre acceptable). 
Typiquement, le test de la somme des rangs de Wilcoxon est aussi utilisé pour analyser la réponse à 
des sondages en entreprise utilisant des échelles de Likert sur 7 points. 


Voici les statistiques d'ordre de l'échantillon de taille 20 (W = x, + x, ) regroupé et ordonné (les 10 
valeurs #, du premier échantillon sont soulignées): 


Les valeurs du premier échantillon X (dites "valeurs de traitement") ont tendance à être plus petites que 
celles du second Y (dites "valeurs de contrôle") ce que nous représentons souvent sous la forme 
graphique suivante (en trichant un peu avec Microsoft Excel 11.8346): 
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| sels 


DIE 2 

à : —$|- DOSe1 MSI S ET SAS SSI ESS ET 6" 657:9 

46 2 

D 2 

85 2 ! | | | 

3 AM 2 | | | | 

87 2 | | | | | | 

__ en [7 | | | | 
4 


+ 
Figure: 7.71 - Comparaison des valeurs de deux échantillons dans Microsoft Excel 11.8346 


L'idée est alors de chercher à savoir si cette tendance est significative. C'est-à-dire de savoir si nous 
avons une réelle différence du type Æ <GG entre leurs lois de répartitions respectives: 


100% 
90% 
80% 
70% 
60% 
50% 
40% 
30% 
20% 
10% 


0% 


Figure: 7.72 - Exemple générique de la comparaison de deux foctio de répartitions 


ou si elles peuvent considérées comme identiques. Pour cela, il faut bien étudier la notion de "rang": 


Étant donné un n-échantillon aléatoire X,.., X, d'une loi statistique continue quelconque, nous notons 
R; le rang des X, ordonnés dans une population d'échantillons. Le rang i est donc un nombre entier 


non nul et strictement positif compris entre 1 et N (somme des tailles de tous les échantillons). 
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Exemple: 


Dans: 


Nous avons les "statistiques d'ordre" respectives: 


X:R=17,R3=25,8 = 3.28; = 3.2,R =4.1... 


7.1160 
FR =16,R=34,8=46R0=55R1=57. 


Une fois le concept de "rang" défini, intéressons-nous à la somme dans le cadre de notre exemple avec 
les deux échantillons: 


La somme des rangs, notée traditionnellement #, (W pour Wilcoxon), du premier échantillon est alors: 
W,=2+3+4+5+7+9+12+13+15+18=88 (71162) 


et pour le deuxième échantillon: 


W, =1+6+8+10+11+14+16+17+19+20=122 (7.1163) 


Valeurs que nous appelons "statistique de Wilcoxon". 


Nous pouvons donc déjà constater qu'il y a effectivement une différence qui semble a priori non 
négligeable en termes de rang sur les deux échantillons. Tout le problème reste maintenant à construire 
un outil mathématique rigoureux permettant d'en conclure un fait avec une certaine certitude. 


Pour cela, introduisons d'abord la moyenne des rangs en utilisant le résultat démontré dans le chapitre 
de Suites et Séries en considérant un seul échantillon: 


S'i -120+9 2 (7.1164) 


En calculant cela, nous remarquons assez vite qu'il s'agit de l'espérance de la loi discrète uniforme 
démontrée plus haut dans ce même chapitre pour une variable aléatoire discrète dont les valeurs sont 
comprises entre 1 et n, soit exactement la définition du rang! Ainsi, nous avons le rang qui aura pour 
caractéristique de moyenne et de variance pour toute la population: 


- A+] 
= ÀR = —— 
X 5 : 
2_. (7.1165) 
À _ 
FR) = 
(R) D 


Pour ceux qui trouverais cette analogie douteuse voici sinon la démonstration de la variance en utilisant 
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la relation de Huyghens et la somme des carrées des entiers positifs démontrée dans le chapitre de 
Suites Et Séries: 


ñ 2 n 2 
V(R)=E(R?|-E(RŸ =D pie #-[) + (5) 


FT 2 re 2 
(2 
_in(2n+liin+l) (241) _ 2(2#+li#+11-31x" +2# +1] . 
ñ 6 4 12 
_ 2{2n° +2n+n+1)-37° - 673 _ Anl+4n+2n+2-3n?-6n-3 1 
12 12 12 


Mais évidemment pour un échantillon seul cela n'a aucun intérêt! Reprenons nos deux séries #,,F. 


respectivement de tailles égales #, = 10,#, = 10 sans distinction: 


1.6, 1.7, 2.5, 3.2, 3.2, 3.4, 4.1, 4.6, 5.3, 5.5, 
5.7, 5.7, 6.9, 7.1, 7.4, 7.9, 8.1, 8.4, 8.5, 8.7 


(7.1167) 


Nous avons alors les indicateurs statistiques de rangs sans distinction (il faut bien garder en tête que 
nous ne savons pas encore à ce niveau du développement si cela nous sera utile ou non): 


bi Le (x, +2 )(e, +2 +1) 
W,,= > R= = . 712210 
2 =1 i=l 2 
+2, ]+1 
y “À, S C ) = 10.5 (7.1168) 
2 
( x +, ) _ 
FR, 5) = D = 33,25 
et les indicateurs statistiques des rangs mais cette fois-ci avec distinction 
1.6, 1.7, 2.5, 3.2, 3.2, 3.4, 4.1, 4.6, 5.3, 5.5, | 
re —— (7.1169) 
5.7, 5.7, 6.9, 7.1, 7.4, 7.9, 8.1, 8.4, 8.5, 8.7 


Nous avons alors les indicateurs statistiques locaux: 
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W=SR,;=2+3+4+5+7+9+12+13+15+18 = 88 


WF, =DR,; =1+6+8+10+11+14+16+17+19+ 20 = 122 


_2+3+4+5+7+9+12+13+15+18 


1 
RL, = —_——— 5588 
(7.1170) 
0090). 
# ’ 10 

l — 12 
V(R)=—Z(R,;-R,) =27.16 

À ” 


V'(R,)= T2, _R,Ÿ = 33.56 


Ces calculs étant effectués, nous n'avons ceci dit rien de concrètement rigoureux pour l'instant en ce 
qui concerne le test de la somme des rangs de Wilcoxon dont l'objectif est pour rappel de vérifier si les 
deux échantillons suivent la même loi ou non (et donc ont in extenso les mêmes moments comme 
l'espérance, la variance, la médiane, etc.). 


Pour avancer, considérons les #, valeurs de l'échantillon X. Nous savons (cf. chapitre de Probabilités), 


qu'il y a alors: 


= —— —_— —— =" ——— 1171) 


grrr F" 1) (a, +, )! (x, +, j! 
#,1((», +2,)-2,)l #, Lx, | 


nombre de rangements possibles des Æ, dans la population des échantillons et que si le test de la 


somme des rangs de Wilcoxon se vérifie (c'est-à-dire: les lois de probabilités sont les mêmes pour les 
deux échantillons), les différents rangements sont équiprobables. 


Par exemple, si nous prenons deux échantillons avec respectivement chacun deux mesures (2 variables 
aléatoires de traitement et 2 de contrôle), nous avons : 


(#,+2,)1=41=24 (7.172) 


arrangements différents tous distincts: 


(12,34) (2.134) (312,4) (4,123) 
(L2,4,3) (2.143) (314,2) (413,2) 
(132,4) (23,14) (32,14) (42,13) 
(134,2) (23,419 (32,41) (4230 
(14,23) (2,413) (34,12) (4,3,12) 
(14,32) (24,31) (34,21) (4,3,2,1) 


Mais ce n'est pas ce que nous voulons dans le cas présent car déjà nous souhaiterions pouvoir distinguer 
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les deux échantillons et aussi ne pas prendre en compte les arrangements qui consistent uniquement en 
une permutation des variables d'un même échantillon. Nous avons alors (cf. chapitre de Probabilités): 


À, +A 4l 
cr “| à | (7.1174) 


7% 


combinaisons possibles! Effectivement avec deux échantillons comprenant deux variables de traitement 
(X) et deux variables de contrôle (Y), nous avons: 


Le — 0) 
1,2 3,4 7 
1,3 2,4 6 
1,4 23 5 
5.3 1, 4 5 
2,4 1,3 4 
3,4 12 3 


Tableau: 7.27 - Représentation des rangs de 2 variables de traitement et de contrôle 


Si l'hypothèse du test de la somme des rangs de Wilcoxon est juste, les 6 classements sont 
équiprobables. Nous en déduisons le tableau suivant: 


[Valeur de FF. BE 
1111/2111 


RBRE 
A AE 
ele le | |6 


Tableau: 7.28 - Probabilités associées au test de la somme des rangs Wilcoxon 
Ce tableau étant construit, supposons que nous observions pour la somme des ranges des variables de 


traitement: #, =7. Le seuil d'un test unilatéral donnerait alors conformément au tableau ci-dessus: 


P(W,27)=-217% (71175) 


nl 


ou si nous obtenions # = 3: 


P(W,23)==283% (71176) 


m|tLnA 


Nous rejetterions donc l'hypothèse d'une distribution identique entre les deux échantillons à tout seuil 
supérieur (ou respectivement inférieur) fixé à l'avance par la politique du laboratoire. en test unilatéral 
ou bilatéral (raison pour laquelle les logiciels donnent les valeurs unilatérales du test + bilatérales en 
même temps). 


Deux choses très importantes qu'il faut remarquer pour la suite sont que: 


- Premièrement dans la construction du tableau précédent (dont voici à nouveau une partie): 
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l 


Valeur de #. B 4 5 6 


__T 
6 


Tableau: 7.29 - Probabilités associées au test de de la somme des rangs Wilcoxon 


6 |6 |6 16 


Il y a une symétrie à la valeur 5, ce qui signifie que la loi de FF est symétrique dans ce cas particulier. 


Mais si nous prenons un autre exemple avec deux échantillons comprenant respectivement deux 
variables de contrôle et trois de traitements (deux variables aléatoires): 


Valeur de #. 6 7 8 b ho 


121112121211 
10 10 


Tableau: 7.30 - Probabilités associées au test de de la somme des rangs Wilcoxon 


l 
1010/10/10 10 


le lecteur pourra vérifier que quel que soit le nombre d'échantillons et le nombre de variables de 
contrôle et de traitement, le tableau de probabilités ci-dessus est toujours symétrique (bon il y a une 
démonstration mathématique de ceci mais je la trouve peu élégante). Mais au fait c'est assez intuitif, 


ù : + : 2 F + Z 
comme les combinaisons Ce * sont indépendantes du fait que les rangs soient rangés dans l'ordre 


croissant ou décroissant, il est forcé qu'il y ait une symétrie. 


- Deuxièmement les valeurs des variables mesurées ne rentrent pas en compte dans cette statistique 
paramétrique mais uniquement les valeurs tabulées des rangs avec leurs probabilités associées. 
Effectivement, comme vous avez pu le remarquer, nous n'avons pas eu besoin des valeurs explicites des 
variables aléatoires pour construire le tableau précédent. 


Maintenant, sachant que la loi de #7 est symétrique et discrète nous souhaiterions calculer son 


espérance (nous ne intéresserons pas au calcul de la variance de cette loi car nous trouvons qu'elle 
n'apporte dans la pratique aucune information utile). 


Le calcul de l'espérance est relativement facile. Effectivement, comme la loi est symétrique, l'espérance 
est alors la moyenne de la borne supérieure et inférieure des rangs. Voyons cela: 


- La plus petite valeur possible de 7. est en supposant qu'elle est dans l'échantillon X (les algorithmes 


informatiques déterminent automatiquement dans quel échantillon mais de toute façon dans la pratique, 
les échantillons ont quasiment toujours la même taille): 


FT . =1+..+2x, = 


L 
s,nin sr x ) 


n,(2, +1) (71177) 
- La plus grande valeur possible est naturellement (se souvenir que Ÿ = x, + x, ): 


W, max = 5 
’ 2 


N(N+1)- co (», +1) (7.1178) 


L'espérance de la somme des rangs d'un des deux échantillons vaut alors: 
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BF, = EE 27 RES 

1 LN(N+)-27, Ce, #1)-2, (e, +1) 

2 2 

sn —— 

2n, (2, +1)+ NN +1)-2, (x, +1)-2, (2, +1) 

4 

2,02, +D+NCN+1)-2, (2, +1) nn + +N-n2 nm, (71170) 
DE EE EE CS 

2 +n,+N°+N-n-(N-n,) n° +2n, +N2-(N-n,Ÿ 

4 4 

#2 +2n,+N7-(A7-2Nn, +77) On 4+ONn 1, + An, 
D CE CE 
= 5m (N+1) 


Donc au final: 
E(WF, ) = s' (W+1) (71180) 


Pour le calcul de la variance, qui nous sera utile pour faire au besoin une approximation que nous 
verrons plus loin, apparaît (malheureusement) la covariance car la connaissance d'un des rangs donnne 
une information partielle sur les autres. Nous avons donc: 


Le Fy 
AUAE a}Ëre +3 coviR,R; | (7.1181) 
i=| i=1 i jA 


Nous savons déjà au vu de ce que nous avons démontré juste plus haut que: 


2 IN? 1) #2,/(#2,+% P 
N°-1 7x Pr: (7.1182) 
CRETE 12 


Le problème reste donc le terme avec la covariance. Pour la calculer il existe des techniques 
rigoureuses tenant sur plusieurs pages et une astuce qui est beaucoup plus courte. L'astuce consiste à 
utiliser la variable globale de rang 7; que nous noterons avec i = 1...#+3#. Comme la somme des 7: est 


une constante, nous avons alors: 
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Mr +hy (2, +2,112, +2, +Di 
| (2) x tag 2; +2 


2 


y Fe y y y 
D à « f 
=0= > F(Z)+ >» S cov(T;,7; | (7.1183) 
i= =l  j=l 
JA 
2 
(2x +23] —1 | | 
=(2, die) eee +2,12, +27 —licov(Z,7;] 


Il vient alors: 


| 2 
(2, +2, | —] 7; +Ay +1 

COV(Z, 7] = <= 72 (7.184) 
121%, +2, —1) 12 


Nous pouvons alors reprendre le calcul initial en remplaçant les covariances par leur expression, la 
dernière relation obtenue pour les covariances calculées sur les 7; s'appliquant également (ce qui n'est 


pas forcément intuitif. mais l'astuce fonctionne) aux &, : 


(0e +#y F1) #y +2 +] 
= a (ay — 1] - —— 
12 12 


2 
#y GC +; 1), (2, —1)(2, +2, #)] 


LS 
ELA 
moe 
I 


eo ne: os mo 
wi pl &l- D 


| Se ne ie tre 7 
3% Li 


#, | ri +2%,%y +, —1)- (4 2, (2, +#, +1 ] (7.1185) 


+2n2n Ay +Az #5 a, 25 (2, +2, +1)+2, (2 +1, +1] 


3% Li 


+2nn, +224 #5 _# 257 _- +2 +A3%y +», | 


Es 


2 
FA; +A;A y 


Bb 
Bb 


“a 


]- 3% (23 +23 +1] 
E 12 


Soit au final: 


y (2, +2, +1li 
FlS'R MAC Ar, (7.1186) 
Fer 12 


i=1 


Ce qui est bien le même résultat que la méthode rigoureuse que l'on peut trouver dans certaines rares 
références. 


Exemple: 


E1. Passons à un cas pratique d'abord pour le cas exact. Considérons donc 2 échantillons comprenant 2 
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variables de traitement (X) et deux variables de contrôle (Y) (c'est un peu simpliste et absurde comme 
exemple mais cela facilite l'aspect pédagogique...), nous avons: 


SH 32. 
(7.1187) 
+ : A Le D 


Soit (la variable de traitement a donc le rangs 1 et 3 ce qui fait une somme de rang de 4): 


3.2, 5.5, 5.7, 8.1 (7.1188) 


LP . 


Soit: 


X:R =3.2,R3=5.7 


(7.1189) 
Y'R =55,8, =8.1 


Nous avons le tableau suivant comme nous l'avons montré plus haut: 


[Valeur de 


na tra 
66/6 [6 [6 


Tableau: 7.31 - Probabilités associées au test de la somme des rangs Wilcoxon 
avec dans le cas présent: 


W,=1+3=4 
(7.1190) 


EQ,)= 5, (N+1)= 2(4+1)=5 


Di 


Si nous choisissons le seuil de confiance traditionnel à 5% en bilatéral, nous avons selon le tableau 
ci-dessus que: 


P(W,27)=-217% (71191) 


ml 


P(W,<3)=-2=17% (71192) 


nl 


Donc en d'autres termes nous voyons qu'il y a: 
100% — 2. 2% = 66.86%  (7.1193) 


de probabilité cumulée que # soit compris entre 3 et 7 (la barre au-dessus du 6 signifie pour rappel que 
ce chiffre se répête à l'infini). Donc forcément 4 est compris dans l'intervalle bilatéral du 95%... et nous 
pouvons accepter l'hypothèse comme quoi les deux échantillons ne sont pas différents. La p-value 
correspondant en bilatéral est donc la moitié de 33.333333%. 
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Remarque: Au fait si nous voulions faire un exemple calculatoire manuel intéressant en jouant avec 
un seuil bilatéral de 5% (soit de 2.5% de chaque côté) il faudrait au moins 2 échantillons avec 4 
variables aléatoires, soit 70 combinaisons de rangs possibles. En-dessous de 4 variables aléatoires 
par échantillons, il est évident que le test bilatéral à seuil de 95% sera tel qu'on ne rejettera jamais 
l'hypothèse d'égalité. 


Si la taille des deux échantillons est assez grande (la majorité des praticiens considérent que chaque 
échantillon doit avoir au moins 20 individus), il a été montré par simulations que nous pouvons faire 
l'approximation (utilisée par beaucoup de logiciels de statistiques): 


LA = (+) 


TIGE) (7.1194) 
12 


bien évidemment en déterminant ensuite toujours la p-value en bilatéral. Avec l'exemple précédent ( 
n'ayant que 4 individus au total), nous avons donc: 


N(0,1)= 


Ce qui correspondant à une probabilité cumulée de 21.93%. Donc la p-value correspondante en 
bilatéral est d'environ 44% (à comparer à la valeur d'environ 33% avec le cas exact). 


15.1.3. TEST DE LA SOMME DES RANGS DE MANN-WITHNEY 


Le "test de la somme des rangs de Mann-Withney"' est au fait un test d'ajustement non-paramétrique 
très simple qui se déduit du test de la somme des rangs de Wilcoxon. Par ailleurs il en est inspiré à un 
tel point que nous l'appelons parfois dans l'industrie le "test de Wilcoxon-Mann-Withney" ou "test 
d'ajustement de Wilcoxon-Mann-Withney" ou encore"test MWW"' (sans spécifier à chaque fois qu'il 
repose sur la somme des rangs). 


Le but de ce test, identiquement au test de la somme des rangs de Wilcoxon, est de trouver un moyen 
de vérifier que deux échantillons indépendants non nécessairement de même taille sont issus d'une 
même loi ou non (in extenso sont issus d'une même population ou non) mais avec une approche 
différente! 


Remarque: Au même titre que le test de la somme des rangs de Wilcoxon, le test de la somme des 
rangs de Mann-Withney peut tout à fait être utilisé pour des variables ordinales (donc catégorielles 
mais à condition qu'elles soient en un nombre acceptable). 


Certains logiciels par ailleurs portent les choses à confusion car ils proposent le test de la somme des 
rangs de Wilcoxon sous le nom de test de de Mann-Withney... et inversement... et de plus n'indiquent 
pas ou ne proposent pas toujours le choix entre la version exacte ou approximative. Et en plus le test 
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de la somme des rangs de Wilcoxon et celui de la somme des rangs signés que nous verrons plus loin 
n'est pas différencié.… donc attention! C'est typiquement un problème dont la source est l'absence d'une 
norme ISO définissant la terminologie et les options qui doivent être disponibles. 


Pour voir en quoi ce test consiste, construisons le tableau de rangs utilisant deux échantillons 
comprenant deux variables de contrôle et trois variables de traitement, nous avons alors: 


1,2 3,4,5 12 
1,3 2,4,5 11 
1,4 2,3,5 10 
1,5 2,3,4 9 
2,3 1,4,5 10 
2,4 1,3,5 9 
2,5 1,3,4 8 
3,4 1,2,5 8 
3,5 1,2,4 7 
4,5 12. 6 


Tableau: 7.32 - Représentation des rangs de 3 variables de traitement et 2 de contrôle 


Dont nous déduisons le tableau suivant: 


Valeurs de #, JB EE) ER TO) 


1111212121]1 
10 10 


Tableau: 7.33 - Probabilités associées au test de la somme des rangs de Wilcoxon 


l 


10 1010/1010 


Maintenant imaginons que nous ayons une autre expérience à analyser utilisant deux échantillons 
comprenant trois variables de contrôle et deux variables de traitement (le symétrique du précédent 
donc!), nous avons alors: 


5 
3, 4,5 1,2 3 
2, 4,5 1,3 4 
2, 3,5 1, 4 5 
2, 3, 4 1,5 6 
1, 4,5 2, 3 5 
1, 3,5 2, 4 6 
1, 3, 4 2, 5 7 
1, 2,5 3, 4 7 
1, 2, 4 3,5 8 
1, 2,3 4,5 9 


Tableau: 7.34 - Représentation des rangs de 2 variables de traitement et 3 de contrôle 


Dont nous déduisons le tableau suivant (le lecteur remarquera que c'est exactement le même que le 


précédent en ce qui concerne les probabilités!!): 
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Valeurs de F, BABA 


a din 


10 101010 10110 10 


Tableau: 7.35 - Probabilités associées au test de de la somme des rangs Wilcoxon 


[ 


Eh bien l'idée du test de Mann-Withney est très simple: 


Plutôt que de tabuler des situations symétriques, il suffit de soustraire à chaque valeur de ,, la valeur 
WF, min afin que chaque tableau soit identique et qu'un des deux seul soit utile. Voyons cela d'abord avec 
le premier tableau: 


1,2 3,4,5 6 
1,3 2,4,5 5 
1,4 2,3,5 4 
1,5 234 3 
2,3 1,4,5 4 
2,4 1,3,5 3 
2,5 1, 3,4 2 
3,4 1,2,5 2 
3,5 1,2, 4 1 
4,5 1: 0 


Tableau: 7.36 - Représentation des rangs de 3 variables de traitement et 2 de contrôle 


Dont nous déduisons le tableau suivant: 


Valeurs de Fyy 10[1/2/3[4)5 


1111221211 
10 1011010 


Tableau: 7.37 - Probabilités associées au test de la somme des rangs Wilcoxon 


1 


10/10/10 


Maintenant imaginons que nous ayons une autre expérience à analyser utilisant deux échantillons 
comprenant trois variables de contrôle et deux variables de traitement, nous avons alors en utilisant la 
même idée: 
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WF, --n, (2, +1) 


1,2 


3,4,5 
2,4,5 1,3 
35 1,4 
25.4 1,5 
1,4,5 
1,3,5 
1,854 


FE 
2,4 
2,5 
1,2,5 3,4 
1,2,4 3,5 
1:23 4,5 6 


Tableau: 7.38 - Représentation des rangs de 2 variables de traitement et 3 de contrôle 


U RB'& & ND NN hR © 


Dont nous déduisons cette fois-ci exactement le même tableau que précédemment: 


[Valeurs de Fyy 10/1/2/3)4/5 


10 


Tableau: 7.39 - Probabilités associées au test de Mann-Whitney 


l 


10110 1010/1010 


raison pour laquelle la littérature mentionne qu'on peut prendre celui que l'on veut! 


Donc pour résumer, la variante de Mann-Whitney (dans le cas concret ici présent il s'agit de la variante 
dite "variante exacte de Mann-Whitney") consiste à tabuler pour les situations symétriques une variable 
notée #7 définie naturellement par: 


Wy =W, =, (2, +1)| (71196) 


notée aussi très souvent dans la littérature: 
E* = À 79" (# +1) (7.1197) 
car alors: 
Wyy €{0,12,.) (7.198) 
et donc: 
P(Wyy cu k\n,,n,)= P(Wy =k|x,,2,) (7.1199) 
Dans les tables que l'on peut trouver dans les livres, les probabilités sont données avec la valeur 


normalisée de U. Ainsi, si nous reprenons notre exemple précédent mais avec les notations d'usage dans 
la pratique (U au lieu de F5 ): 
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Valeurs de TAPIE 


Fleet te 
10 |10 


10 10 1010 10 


10 


Tableau: 7.40 - Probabilités associées au test de Mann-Whitney 


Nous voyons que la probabilité cumulée que £} = 2 est de 0.4. La table précédente se trouve dans la 
littérature parfois sous la forme suivante: 


Tableau: 7.41 - Représentation classique du test de Mann-Whitney 


où nous avons mis en rouge la colonne correspondant à notre exemple (27 = 2,x, = 2,#, = 3) et en vert 


et gras la valeur prise comme exemple dans le paragraphe précédent. Ensuite il convient au praticien de 
choisir avec ces tableaux s'il souhaite faire un test bilatéral ou unilatéral. 


Remarques: 


R1. Il est important de se rappeler que nous avons démontré par l'exemple que nous pouvons aussi 
bien prendre: 


Wy = WF, --n, (x, +1) (71200) 
que: 
Woy = W. L L 2 
EX =, EL (x, + ) (7.1201) 


puisqu'ils génèrent les mêmes tableaux! 


R2. W,> est traditionnellement noté U par les praticiens comme nous l'avons vu, d'où le fait que 


l'on retrouve dans la littérature ce test sous le nom de "test U de Mann-Withney" avec les tables de 
probabilités associées sous le même nom. Cependant attention à ne pas confondre avec le "test U de 
Wilcoxon" appelé parfois "test d'inversion de Wilcoxon" qui se base sur les alternances d'apparition 
des valeurs des échantillons lorsque regroupés (test qui ne sera pas développé ici). 


Pour voir la version approximative (asymptotique) du test U de Mann-Withney nous avons besoin de 
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l'espérance et de la variance. Pour cela, rappelons que nous avons donc vu que la somme des rangs 
normalisés était donnée par: 


1 
U,=R Sn (4 +1) (71202) 
mais nous pouvons aussi utiliser comme nous l'avons vu: 
1 


et puisque: 


avec pour rappel: 


N=mt+#3 (71205) 


nous avons donc: 


+1 +] 
ti +0, [a-2at)[e-2tet) 


2 2 

CNIN+T ma +l) #e2+1) (a+ lN+l) ma +1) #2(#3 +1) 
3 2 Du 2 2 2 
SAUNA, AU me #0 (7.1206) 

2 s 2 2 
Are r), AlA+1l #31% +1 
RE LS 
AA +429 FA HA HA HAS A A — A4 — HA — A7 
A 


La moyenne des deux U est donc la moyenne arithmétique de la somme. Nous avons donc: 


"y =+2 (7.1207) 


Ce qui signifie que LA ou L}, doit être suffisemment différent de cette dernière moyenne pour que l'on 


rejette l'hypothèse nulle comme quoi les deux échantillons proviennet d'une même loi de distribution. 
Mais pour déterminer la p-value, nous avons qu'il nous faut aussi l'écart-type. Donc cherchons-le! 


L'écart-type est le même que pour le test de la somme des rangs de Wilcoxon (puisque le deuxième 
terme dans l'expression des U est une constante dont la variance est nulle. Ainsi, il ne reste plus que la 
variance de la somme des rangs et nous avons déjà démontré plus haut qu'elle valait: 
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 — 42 (N+1) (1208 
U 12 


Reprenons l'exemple fait avec le test de la somme des rangs de Wilcoxon mais un peu modifié (pour 
que l'exemple soit plus parlant) c'est-à-dire: 


Exemple: 


É. d.1,18 
: 61,43,12 


(7.1209) 


Soit groupé et ordonné: 


Nous avons alors: 


A =(2+4)-1L5(241) 2 3 
2 (7.1211) 


U; = (14345)-23(341) 2 3 


Donc nous pouvons choisir n'importe lequel pour le test vu que les deux U sont égaux. Si nous 
regardons le tableau créé plus haut, avec (27 =3,x, = 2,#, = 3), nous avons donc une probabilité 


cumulée de 60% que U soit égal à 3. Donc nous ne rejetons pas l'hypothèse nulle (en unilatéral) comme 
quoi les deux échantillons proviennent de la même distribution. 


L'approximation en loi Normale donne alors: 


CLS 3-32 
2 À 


Ty RE 3.265511 (7.1212) 
RUSSES 


Donc la probabilité cumulée est de 50% avec l'approximation Normale ce qui correspondant à une 
p-value de 50%. Là encore nous ne rejetons pas l'hypothèse nulle. 


15.1.4. TRAITEMENT DES ÉGALITÉS 


Lorsque nous procédons à un test de la somme des rangs de type Wilcoxon-Mann-Withney ou autre, 
des égalités de rangs peuvent se produire. 


Reprenons pour l'exemple: 


N=n, +4, = 2+3=5 (7.1213) 


Page: 585/4839 


[v3.0 - 2013] 


avec les données suivantes: 


Données 17 [17 17 19/21 
en: 415 


Tableau: 7.42 - Exemple de problème en cas d'égalités 


Une solution conventionnelle consiste à attribuer à chaque "?" le rang moyen. Donc dans le cas présent, 
nous avons: 


?= =(1+2+3) =2 (7.214) 
Le tableau: 
1,2 3,4,5 12 
1,3 24 5 11 
1,4 23,5 10 
1,5 2, 3,4 9 
2,3 1:45 10 
2,4 3,5 9 
2,5 1, 3, 4 8 
3,4 LES 8 
3,5 1,2, 4 7 
4,5 1, 2,3 6 


Tableau: 7.43 - Représentation des rangs de 3 variables de traitement et 2 de contrôle 


devient alors dans ce cas particulier: 


Rs 1h 
29 2,4,5 11 
2,2 2,4,5 11 
2,4 D 2.6 9 
2,5 9,9 4 8 
29 2,4,5 11 
2,4 5.5 9 
2,6 5,54 8 
2,4 AD 9 
2,5 2,2,4 8 
4,5 120 6 


Tableau: 7.44 - Représentation des rangs de 3 variables de traitement et 2 de contrôle 


où A (remarquez la petite * en haut à droite!) représente la statistique de Wilcoxon lorsque nous 
sommes en présence d'égalités statistiques. La loi de A peut être plus ou moins différente de celle de 


F. . Effectivement: 
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Probabilité d 


e WF, 111,212/121]111 


Probabilité de g*__|110131310)31|0 
10] lolo! 10 


Tableau: 7.45 - Différence des deux tests statistiques en cas d'égalité ou non 


15.1.5. TEST DE LA SOMME DES RANGS SIGNÉS DE WILCOXON À 1 ÉCHANTILLON 


Le but du test de la "somme des rangs signés de Wilcoxon", appelé aussi parfois "test de la médiane de 
Wilcoxon", est d'utiliser une technique non paramétrique pour vérifier la symétrie ou non d'une 
distribution et donc in extenso faire une hypothèse sur la valeur de la médiane. L'idée est à la fois 
simple et subtile. 


Le principe et que si nous comparons les différences Z} des individus d'un échantillon par rapport à la 


médiane, nous savons que si nous avons (par exemple) un nombre impair d'individus tous différents 
(non égaux), alors nous aurons 50% des données au-dessus et en-dessous de la médiane. Ensuite, pour 
contrôler que la distribution des valeurs des individus vérifie une certaine symétrie, l'idée (simple mais 
astucieuse) consiste ensuite à: 


1. Calculer les différences en valeur absolue | | par rapport à la médiane 


2. Ranger ces différences absolues par ordre croissant et leur assigner leur rang respectif 


3. Calculer la somme des rangs des différences 2} qui à la base sont négatives 
4. Calculer la somme des rangs des différences Z} qui à la base sont positives 


et si l'échantillon a une distribution symétrique (donc la médiane est confondue alors avec la moyenne), 
il devrait y avoir une somme des rangs négatifs $_ qui n'est pas significativement différente de la 


sommes des rangs positifs &!, . 


Remarque: Pour rappel, lors de notre étude des tests pour échantillons indépendants de Wilcoxon 
ou Mann-Withney vus plus haut (qui n'ont pas obligatoirement la même taille), nous ordonnons 
ensemble les valeurs des deux échantillons et nous faisons un calcul sur les rangs de ces valeurs. 
Dans les tests pour échantillons appariés (donc de même taille), nous ordonnons les différences de 
valeurs (pas les valeurs!) et nous travaille sur les rangs des différences. 


Selon l'idée (principe) exposé plus haut, la somme des rangs qui portent le signe — vaut alors en 
moyenne: 
: n 
H =R =EIR = EÆil A +2. X2+.+n Z,i= D iEiX, | (71215) 
i=1 


Or, nous avons déjà démontré que l'espérance de la loi binomiale est: 


E(X,\=Mp (7.216) 
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Et comme dans notre cas N vaut 1 (une seule valeur...) et p vaut 2 (une chance sur deux d'avoir un 
signe négatif), il vient immédiatement en utilisant les démonstrations du chapitre de Suites Et Séries: 


_ daia+li #ix#+1i 
=—-————=7————— (7.121?) 
1 2 2 EI 


et pour la variance en utilisant aussi les résultats du chapitre Suites Et Séries: 


Le! Le] n 
ViR = FPS uX, |= S'VUX = S'ÉVIX;i (7.218) 


i=1 i=1 i=1 
et à nouveau en utilisant la variance de la loi binomiale et les résultats du chapitre Suites Et Séries: 


laia+lii2#+1li xin+lii2#+1li . 
mnt amant à mme 4 | 10 

: 6 24 

Évidemment la somme des rangs des différences négatives (respectivement positif) sera au minimum 
nul et vaudra au maximum #1 #+11 / 2. Donc l'espérance dans le cas d'un test bilatéral ne doit pas être 


trop proche d'une de ces deux valeurs extrêmes. 


Dans le cas où n est assez grand (supérieur à une trentaine), nous pouvons utiliser l'approximation de la 
loi Normale centrée réduite pour la variable: 


A\A+1l: 


NO ee ——  *  — (7.1220) 
RiA+li22 +1: 


24 


où $_ est donc la somme des rangs de signe négatifs. 


Enfin signalons qu'empiriquement si des différences par rapport à la médiane sont nulles, elles ne seront 
pas prises en compte dans les rangs. Si des différences sont égales nous prendrons un rang moyen... 


Exemple: 


Commençons avec le cas à un échantillon comparé à sa médiane expérimentale (à l'opposé de la 
comparaison à une médiane hypothétisée lorsque nous considérons a priori la distribution symétrique et 
unimodale). Considérons que nous avons mesuré les valeurs suivantes pour le diamètre d'une pièce: 


39, 20.2, 40, 32.2, 30.5, 26.5, 42.1, 45.6, 42.1, 45.6, 42.1, 29.9, 40.9 


Nous souhaitons donc savoir si la médiane expérimentale calculée (valant 40 dans le cas présent) de cet 
échantillon peut ne pas être rejeté comme indicateur central à un niveau de confidence de 5% en 
bilatéral (ce qui sera le cas si le nombre de différences positifs et négatifs est assez équilibré). Nous 
construisons alors le tableau suivant: 
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Mesures | Différence Valeur absolue Rang R, R 
39 si 1 2 2 
20.2 -19.8 19.8 11 11 
40 0 0 ; 
32.2 SE 7.8 6 6 
30.5 -9.5 9.5 8 8 
26.5 13.5 13.5 10 10 
42.1 1 2.1 4 [24 
45.6 5.6 5.6 65 |65 
42.1 2.1 2.1 4 [4.1 
45.6 5.6 5.6 65 |65 
42.1 21 2.1 4 |24 
29.9 -10.1 10.1 9 9 
40.9 0.9 0.9 1 1 

Somme: 26 | 46 


Tableau: 7.46 - Tableau de traitement pour le test 


A vue de nez l'égalité des rangs de ne s'annonce pas très bien mais allons quand même un peu plus 
loin. 


Remarque: Suivant les ouvrages la somme des rangs ne donne pas la même valeur car il y a plusieurs 
techniques pour calculer des rangs de valeurs qui sont identiques. Nous avons cependant choisi celle 
utilisée par le logiciel Minitab qui est d'usage dans la communauté scientifique et qui correspond à celle 
dont nous avons déjà dictées les règles plus haut. 


Si nous considérons que le nombre d'individus est suffisant.., nous utilisons l'approximation (même si 
dans le cas présent les conditions ne sont pas satisfaites): 


#nin+li 
SL + — 
Wi ED 2 — (7.1221) 
AA +122 +1: 
24 
Soit dans le cas présent: 
ain+li 
SE 4 9-3 
MO = 22 5 = -0549 (71222) 
nin+li2#+li 12747 
24 
et respectivement: 
ain+li 
NO = 4 2 46733, ;00 (7.1223) 
AiA +12» +1: 12.747 
24 
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Le premier cas correspond dans l'approximation à une loi Normale à une probabilité cumulée de 29.13 
% obtenue avec la versions française de Microsoft Excel 14.0.6123 à l'aide de la fonction: 


=LOINORMALE.STANDARD.N(-0.549; VRAI) 
et donc à un p-value d'environ 58.26 % en bilatéral. 


Le deuxième cas correspond dans l'approximation à une loi Normale à une probabilité cumulée à 
84.62% obtenue avec avec la versions française de Microsoft Excel 14.0.6123 à l'aide de la fonction: 


=LOINORMALE.STANDARD.N(1.02; VRAI) 


ce qui correspond à une p-value d'environ 30.76 % en bilatéral (un logiciel comme Minitab donne une 
p-value en bilatéral de 32% puisqu'il ne fait pas l'approximation en loi Normale). 


Pour le deuxième cas nous sommes à la limite mais au seuil choisi plus haut nous pouvons prudemment 
ne pas rejeter l'hypothèse comme quoi 40 est dans l'intervalle de confiance de la médiane (par ailleurs 
le test des signes amène à la même conclusion). 


Remarque: Un logiciel comme Minitab bien que proposant le test de Wilcoxon à 1 échantillon de la 
médiane donne pour médiane la valeur de 36.5 et donne pour intervalle de confiance de la médiane 
les valeurs 31.1 et 42.1. Si nous appliquons la méthode de boostrapping présentée en détails dans le 
chapitre de Méthondes Numériques nous obtenons comme médiane estimée 40 (pour moyenne 
38.733) et comme intervalle 30.50 et 42.10... Bon dans tous les cas nous arrivons de toute façon à 
ne pas rejeter l'hypothèse nulle mais quand même... 


15.1.6. TEST DE LA SOMME DES RANGS SIGNÉS DE WILCOXON POUR 2 ÉCHANTILLONS 
APPARIÉS 


Le "test de la somme des rangs signés de Wilcoxon pour 2 échantillons appariés" est basé à 100% sur le 
principe du test à 1 échantillon. La seule différence est que l'hypothèse nulle ou alternative est basée 
sur la différence de la médiane des données prises deux à deux de chacun des échantillons. Dans la 
majorité des cas, l'hypothèse nulle est que la médiane des différences est nulle contre l'hypothèse 
alternative qu'elle est significativement différente de zéro. 


Comme les développements mathématiques sont les même que pour le test à 1 échantillon, attaquons 
directement par un exemple. 


Exemple: 


Nous avons 2 logiciels (L1, L2) différents à comparer que nous voulons soumettre à 12 tâches (T1, T2, 
T3, …, T12) de calculs spécifiques mais identiques pour chacun des logiciels. Nous souhaiterions savoir 
si les logiciels ont un temps de traitement significativement différent ou non et si oui lequel est le plus 
performant. 


Nous avons alors le tableau suivant où le temps est en minutes et où les différences x; — y; sont notées 
d; : 
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che Lt M2, à lal]URans RER 
T1 24.0 23.1 0.9 10.9 1 1 
T2 6.7 204 !3.7 B.7 4 4 
T3 21.6 17.7 B.9 1B.9 5 5 
T4 23.7 Do.7 80 Bo | 25 25 | 
TS 37.5 42.1 |4.6 4.6 6 6 
T6 31.4 36.1 4.7 4.7 7 7 
T7 [14.9 21.8 6.9 6.9 10 10 
T8 37.3 40.3 L3.0 B.0 2.5 2.5 
T9 17.9 26.0 L8.1 8.1 | 11 [ 11. 
T10 45.5 15.5 0.0 0.0 : 
T11 29.0 35.4 |6.4 (6.4 9 9 
T12 19.9 25.5 L5.6 5.6 8 8 
Somme: 6.5 57.5 


Tableau: 7.47 - Tableau de traitement pour le test 


Nous voyons déjà que le logiciel L1 est globalement plus rapide que L2 et sans utiliser les tables 
exactes du test des signes de Wilcoxon, nous pouvons présenter que la différence est significative. 


Si nous considérons que le nombre d'individus est suffisant.., nous utilisons l'approximation (même si 
dans le cas présent les conditions ne sont pas satisfaites): 


aia+li 
is 
10,1: ee (7.1224) 
RiA +122 +1: 
24 
Soit dans le cas présent: 
air+l 
ST 85-39 
NO = "= 2 = -2392 (71225) 
RiA +122 +1: 12.747 
24 
et respectivement: 
aAiAa+li 
NON = meme mm 7 14 0 
RiA +122 +1: 12.747 
24 


Le premier cas correspond dans l'approximation à une loi Normale à une probabilité cumulée de 0.84% 
obtenue avec avec la versions française de Microsoft Excel 14.0.6123 à l'aide de la fonction: 


=LOI.NORMALE.STANDARD.N(-2.392; VRAI) 
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et donc à un p-value d'environ 1.68% en bilatéral. 


Le deuxième cas correspond dans l'approximation à une loi Normale à une probabilité cumulée à 
92.69% obtenue avec avec la versions française de Microsoft Excel 14.0.6123 à l'aide de la fonction: 


=LOI.NORMALE.STANDARD.N(1.454; VRAI) 


ce qui correspond à une p-value d'environ 14.62 % en bilatéral (un logiciel comme Minitab donne une 
p-value en bilatéral de 32% puisqu'il ne fait pas l'approximation en loi Normale). 


Pour le premier cas, dans l'approximation par une loi Normale, nous rejetons clairement l'hypothèse 
nulle comme quoi la médiane des différences est nulle (donc les deux échantillons sont 
significativement différents). Par contre avec le deuxième cas nous avons une conclusion inverse. 
Évidemment, dans un telle situation il ne faudrait pas utiliser une approximation par une loi Normale 
d'où la situation un peu délicate. 


Remarque: Avec un logiciel comme Minitab 15.1.2 qui ne propose pas le test de Wilcoxon pour 
échantillons appariés mais pour lequel il existe une astuce pour l'exécuter quand même, nous 
obtenons un p-value de 3.3%. D'autres logiciels donnent une p-value toujours inférieure à 5% (mais 
les valeurs différent d'un logiciel à l'autre...). 


15.2. TEST DE KRUSKAL-WALLIS 


Le test de Kruskal-Wallis un test non paramétrique souvent assimilé (un peu rapidement...) à une 
ANOVA non paramétrique à une voie pour comparer si deux populations ou plus ont même médiane 
(hypothèse nulle) à la différence qu'il ne nécessite donc pas les hypothèses nécessaires au 
fonctionnement de l'ANOVA. Quand plusieurs populations comparées passent à travers ce test, ce 
dernier ne dit pas quelle population est significativement différente mais uniquement qu'il y en a au 
moins une qui l'est. En réalité, comme nous allons le démontrer, le test de Kruskal-Wallis n'est qu'une 
extension du test U de Mann-Whitney vu plus haut pour un nombre de populations supérieur ou égal à 
trois. 


Pour étudier ce test, nous allons supposer que nous n'avons que deux populations et nous allons en faire 
une généralisation intuitive. Cette démarche est celle qu'aurait utilisée Wilcoxon avant que Kruskal et 
Wallis n'en fassent la démonstration générale rigoureuse. 


Pour étudier ce test, rappelons d'abord que (relations dont l'origine et in extenso la démonstration ont 
déjà expliquées lors de notre étude du test de Mann-Withney vu plus haut) la moyenne de la somme des 
rangs et l'écart-type de la somme des rangs sont donnés par: 


g-Vt#l 


BR=R=—— 


N°-1 


V(R)= oè= 5 


dans le cas où il n'y pas de valeurs doubles. Sous cette hypothèse, rappelons que % peut être assimilé 
au rang de la valeur médiane (dans le cas d'un nombre impair de mesures). 


Rappelons que la moyenne des tirages de n valeurs sans remplacement parmi N sera proche d'une loi 
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Normale, et nous avons déjà démontré tout au début de ce chapitre que: 


et que si la population n'est pas très grande, la variance doit être corrigée par le facteur de correction 
sur population finie que nous avions déjà aussi démontré: 


N—x 
= 127 (71229) 
Jp Va 


 - Nn D N-n 
? a NN-1 7 x N-1 


Dès lors, il vient: 


Nous avons alors dans le cas qui nous concerne avec les rangs (la variance des rangs étant la variance 
vraie: il n'y a pas d'estimateur!): 


N?-1 
D RNA 12 N-n _IN-LIN+UN-x (N+DiN-z1) (7.1231) 
R on N-1 nn N-1 12x N-1. 12% 


Maintenant, de manière à former un variable Normale centrée réduite Z nous pouvons centrer et 
réduire la variable aléatoire ê obtenue par échantillonnage en écrivant: 
& N+il 
R-R_ 2 
ZE — = 


(71252) 
Tr IN+liN-xi 
\ 12# 


où ê est donc la moyenne de la somme des rangs d'un échantillon de la population. Et au fait toute 


l'idée astucieuse du test de Kruskal-Wallis se trouve ici: la distribution statistique de la moyenne de la 
somme des rangs d'un grand nombre d'échantillons de N valeurs suit approximativement une loi 
Normale (revoir notre étude des limites des tirages sans remise)! 


Prenons le carré : 


Il 


2 
12 à MNHŸ 2. 
Dm | R | = fl (71233 

| 2 | ri 


L'approximation par la loi du Khi-deux n'étant valable que si n est assez grand comme nous en avons 
déjà parlé en détails lors de notre étude du test d'ajustement du Khi-deux. 


Et donc la parenthèse de la première égalité est égale au carré de l'écart du rang de la médiane. Raison 
pour laquelle on dit souvent qu'il s'agit d'un test de la médiane (mais c'est un raccourci abusif). 


Avant de continuer, insistons bien sur le fait que le scénario dans lequel nous nous trouvons est celui 
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d'un tirage d'un échantillon n parmi N, ce qui est équivalent à se retrouver avec deux échantillons (un 
de taille net l'autre de taille N-n) de même loi (provenant in extenso d'une même population). Il vient 
alors que (relations que nous allons utiliser un peu plus loin): 


A+; = + =n+(N-n)=N (7.123) 


et par extension du cas à un échantillon, si nous notons À; la somme des rangs des nombres de 
l'échantillon i, nous avons aussi: 


ni R +n,R; = À +R = À +IN-xiR =N RENTE ENN41 (7.1235) 


Il s'ensuit que si nous notons pour la suite À = À = — où R est donc la somme des rangs de 


l'échantillon ; = 1, nous avons: 


Ly(n+0-28 IN(N+t-R 
À | 
N—n N—n 


(7.1236) 
Si nous écrivons maintenant la relation démontrée plus haut: 


2 
—ÀR| =7"(D (71237) 


Eal> 


2 
12 (#2) 12 e 


(N+DIN-x)" 2 (N+D(N-n) 


sous la forme suivante (il s'agit d'un développement astucieux en marche arrière. à partir de la 
troisième ligne): 
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. < R? R 1 
R? - R+l à (NID NID 
12» une O+DR+ZCN+1) Re ( )> 1" ) 
iIN+IiuiN-x: 2 IN+TiN- x: IN+IiN-xi 
12x# 12x# 
128? 12(N + DR+3#(N +1)? 2 
: = LV +TDR+ 3x CN +1) CI2NRÈ —12NmiN +R +3IN+1T M 
_ INM+liN- mi _ NiN+liniN- x 
12NR2 —12NniN+liR+3N IN+lÈ x GIN+LININ+liriN-) 
_ NiIN+lia Ni NIN+lriN-x: 
(N- n)R +1 (N + n- Nu(N+DR+ RE 
— 4 _3iN+1 
NIN+1) e(N =#) 
2 

2 ÉLE) —2 F2 
RNA 34e te KR ,& —3 +1 
NiN+li| x N- x NiN+ll| x x 

2 p2 
| SL |-3N+1 
NIN+TUT # 


(7.1238) 


et nous retrouvons donc à la fin le fait que nous travaillions depuis le début avec deux échantillons, un 
de taille net donc l'autre (in extenso par tirage) de taille N-n. 


Le résultat précédent (qui était celui recherché depuis le début) peut être généralisé sous la forme 
suivante appelée "test H de Kruskal-Wallis" à un niveau de confiance donné en unilatéral (parfois cette 
relation est écrite sans les parenthèses pour la sommation ce qui peut prêter à une mauvaise lecture): 


cp? 
_ 12 sx —3iN+1iz vic-1) (7.1239) 
NiN+1i 1 4 


et si tous les x, sont égaux, nous retrouvons cette relation sous la forme fréquente: 


[ey 
FPE SR |-3(N+1)z 72(c-1) (71240) 
2NIN+1UT 


L'approximation suivant une loi du Khi-deux est cependant délicate lorsque la taille des échantillons (c) 
est petite (se référer à notre étude de la loi du Khi-deux). 


Exemple: 


Reprenons l'exemple de l'article original de Kruskal-Wallis. Nous considérons que nous avons trois 
machines à l'origine identiques mais dont deux ont subi quelques modifications. Nous avons mesuré la 
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production journalière un certain nombre de fois et avons obtenu le tableau suivant: 


Standard Rang Modifiée 1 Rang Modifiée 2 Rang Somme 
340 4 347 | 10 


5 | 339 
345 | 9 | 333 | 2 [| 343 [7 

330 | 1 | 344 | 8 | 349 11 

342 | 6 355 | 12 

338 | 3 

n 5 B 4 fi2 
R D4 14 40 (78 
R2/x [115.2 65.33 400 580.53 


Tableau: 7.48 - Tableau d'exemple pour le test de Kruskal-Wallis 
Nous avons alors bien: 
S? — = 
Dm=N=12 


1 (7.1241) 
DR = NIN+1=78 
ne 


et: 


ce p2 

He SR | pere 12 59053-31352 5.6562 22(2) c1249 
NiN+1: il # 12.13 

Or, nous avons: 


Pl/(2125.6561=0.059 (7.1243) 


Dans le cas présent, à un niveau de 5%, nous sommes donc à la limite avec l'approximation par une loi 
de Khi-deux. Comme l'ont montré Kruskal et Wallis, une simulation par Monte-Carlo donne une 
p-value de 0.049. 


Bref, dans cette situation il conviendrait plutôt de rejeter l'hypothèse nulle comme quoi les productions 
sont similaires. Et donc privilégier le fait que celles-ci soient plutôt différentes. Une recommandation et 
de refaire le test par paire des mesures pour voir ce qui est significativement différent deux par deux. 


15.3. TEST DE FRIEDMAN 


Le test de Friedman, recommandé par la norme NF ISO 8587 pour l'analyse sensorielle (test de 
classement), considère une expérience avec deux facteurs (le premier étant considéré comme le 
traitement et le second comme les blocs de tests au même titre que l'ANOVA à deux facteurs contrôlés 
sans répétition) que l'on analyse à l'aide des rangs car les valeurs des mesures ne satisfont pas les 
conditions d'application d'ANOVA. 


Associons, comme nous l'avons déjà fait à plusieurs reprises, la théorie à un exemple en partant du 
tableau suivant où huit sujets (blocs) B sous hypnose ont été soumis à quatre émotions (traitements) T. 
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Leur potentiel électrique épidermique a été mesuré (en millivolts) dans chaque cas (et l'ordre des 
traitements a été randomisé): 


23.1 ,57.6,10.5 123.6 111.9 |54.6 121.0 |20.3 
22.7153.2| 9.7 119.6 113.8 47.1 |13.6 23.6 
22.5153.7 10.8 121.1 113.7 139.2 113.7 |16.3 
22.6 153.1 | 8.3 |21.6113.3 137.0 114.8 |14.8 


Tableau: 7.49 - Tableau d'exemple des mesures pour le test de Friedman 


L'idée centrale et subtile est de ne pas affecter un rang à l'ensemble de la population des mesures 
comme c'est le cas pour le test de Kruskal-Wallis (on perdraïit alors le concept des blocs: in extenso du 
deuxième facteur) mais bien bloc par bloc tous supposés donc indépendants les uns des autres. 


Remarque: Nous ne traiterons pas (au même titre que lors de notre étude du test de Kruskal-Wallis) 
de la situation où des mesures sont à égalité avec d'autres dans un même bloc, les démonstrations 
actuelles n'étant pas vraiment convaincantes. 


Donc, à chaque valeur | x}. du tableau nous allons maintenant associer le rang #57.» 


correspondant à chaque traitement. Ce qui donnera: 
Émotion _|112/1314/516/718 
Be 4 14134/14)413 
312[2{1[4)13]11|4 
113[4]2[3/]2]2}]2 


Joie 
Tristesse 
BR 2 11321131 


Tableau: 7.50 - Tableau d'exemple des rangs pour le test de Friedman 


Bon maintenant que nous avons construit une sorte tableau d'ANOVA à deux facteurs contrôlés sans 
répétition non paramétrique que faisons-nous? Quelle est l'idée? Eh ben l'idée de base est la même que 
le test de Kruskal-Wallis: nous allons utiliser la propriété de la moyenne de la somme des rangs mais 
tout en ayant en tête que cette fois-ci la numérotation ne s'est pas faite sur l'ensemble des mesures du 


tableau mais bloc par bloc. 


Dans le cadre de notre exemple particulier nous avons donc: 


MENU NES 


hAlhhhBR-27R-337 
D h 4 B hi 4 [R =20/R, = 250 
4 DB D D D |R=19 R-2375 
1Bbh3h|R=4IR-175 


et en cas de non influence des traitements, nous nous attendons à avoir: 


R =R3=R3=Ry=R (71244) 
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ou aussi (c'est équivalent): 


R=R;=R;=R3=R (71245) 


S'il y a non influence des traitements ces quatre dernières valeurs devraient être égales et fluctuer 
autour de: 


HR=R=—=-—-=25 (7.1246) 


Nous pouvons pressentir que la fluctuation des À; autour de ## doit suivre une loi Normale centrée 
s'il y a vraiment non influence (il existe une démonstration de cela dans l'article original de Friedman 


mais elle comporte des lacunes par moments et donc nous nous abstiendrons de la présenter). Nous 
pouvons également réduire la loi Normale telle que: 


7-R-R_R-R_ R-R 


Ilè 


_ ei (7.1247) 
VB 12 
FE 


Il n'est pas toujours intuitif que l'erreur standard soit obtenue par la division de la racine de B (du 
nombre de blocs) car la majorité des praticiens ont pour intuition de diviser par la racine T du nombre 
de traitements lorsqu'ils étudient l'aspect théorique du test de Friedman. Mais cela peut se vérifier avec 
une application numérique soit en se rappelant que le calcul de la variance a; se fait à partir des B 


rangs d'un traitement donné, rangs dont les valeurs (dans l'exemple ci-dessus ces valeurs sont comprises 
8 fois entre 1 et 4) sont bien évidemment supposées pour un traitement donné indépendantes et 
identiquement distribuées. 


Nous avons donc: 


Contrairement au test de Kruskal-Wallis, nous ne faisons pas d'échantillonnage, donc nous ne devons 
pas corriger l'écart-type à l'aide du facteur de correction sur population finie (fcp) pour diminuer sa 
valeur. 


L'idée de Friedmann (du moins c'est ainsi que nous allons le présenter) est de dire que l'écart-type de la 
somme des rangs des traitements obtenue de façon identique que lors du test de Kruskal-Wallis (dont 
l'origine a été détaillée lors de notre étude du test de Mann-Withney): 


met 2. 
ë2 = (7.1249) 
ET 


n'est cette fois-ci qu'un estimateur de l'écart-type vrai et qu'il faut utiliser la relation entre l'estimateur 
non biaisé et biaisé pour corriger cette estimation (relation démontrée lors de notre étude des 


estimateurs): 
Page: 598/4839 


[v3.0 - 2013] 


Dès lors: 
2 2 
Lf: T+ Lf; TH 
D 72 _t=i +18 Re : 
2,24 a  —  _— (T1) (71251) 
#1 T ôk T Fe 


où nous avons retiré un degré de liberté au Khi-deux pour la raison déjà rencontrée maintes fois dans le 
présent chapitre. 


Soit après quelques simplifications élémentaires nous obtenons le "test Q de Friedman": 


2 
128 Lf: T+1 2 
_ + —— | F=1}) (1255 
e T2 2 | si | 


Pour en revenir à notre exemple il vient alors: 


à : T 2 
ne L(p_THŸ 128 Dfg_4#1 
27H) 2 4(4+1),5 2 


2 2 2 4 
- 24 (375-2) +(250-2) +(2575-2 +(175-2 | [2645 
5 2 2 2 2 


La valeur critique de v? iT—1\ au seuil de 5% est de 7.65. Donc nous ne rejetons pas l'hypothèse 


(7.1253) 


comme quoi les traitements n'ont aucune influence (absence de différence entre les traitements). La 
probabilité cumulée correspondant à 7.65 (donc la p-value) est de 9%. 


15.4. STATISTIQUES DES VALEURS EXTRÊMES 


La statistique des valeurs extrêmes est un domaine très important dans la finance et l'ingénierie de la 

qualité (pour ne citer que les deux exemples les plus connus) qui permet d'étudier l'interpolation et la 
justification asymptotique des distributions. Comme le lecteur va le voir, cette statistique constitue de 
par sa construction un sous-domaine des statistiques d'ordre. 


Remarque: Un exemple d'application pratique mondialement connu est son utilisation dans des 
résultats qui vont suivre dans le cadre des cartes de contrôle de la qualité (cf. chapitre de Génie 
Industriel). 


Soient #,,X,,...,4, des variables aléatoires supposées indépendantes et identiquement distribuées de 
loi F et de densité f. Rappelons que nous définissons la statistique d'ordre i notée #;,, par: 
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Ans SAS SAS, (71254) 


» 


En posant: 


W,=X;=min(X,X,.,X,) 
M,=X,=max(X,X..,2X,) 
Les variables #, et 4f, définissent les statistiques d'ordres extrêmes et leur écart: 
D,=M,-W, (71256) 
et dite "déviation extrême". Nous accepterons comme triviale la relation: 
min (X Mira, )=-m ax (- Ain —Xanr-Xin) (7.1257) 


1,7 * a," 


Déterminons maintenant la fonction de répartition de Àf, : 


LE, 


Fy(x)= P((M, Sx})= AÊC& <x | (7.1258) 


car dire que f, £ x équivaut à dire que pour chaque #;,, nous avons #,, © x (pas facile à deviner 
qu'il faut avoir cette approche...). 


Nous avons alors puisque les variables sont indépendantes (cf. chapitre de Probabilités): 


Fig (x) = AA. <»)}- IP(X £x)= [TF8 =[FOT (7.1259) 


=] 


et par suite nous avons évidemment la fonction de distribution: 
Ju (2) = #A[FATT = © Ba (= 2F@T (7.1260) 


Respectivement en se basant sur la même idée: 


_. 


By (@)= P({W, Sx})=1-P({H, > x})=1 A 


(4, 2) 
= ]- [IP(X, >) et II(- PH, Sx))=1-[T(- FR) 


2=l 


= 


(7.1261) 


=1-(1-F(x)) 


et par suite nous avons évidemment la fonction de distribution: 


fr =#f@[1- FT = + Br (x) = 2 ( ={i- F(D)") (7.1262) 
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Il vient alors: 


+o Ho 
E(R)= ECM, -W,)= E(M,)- EP) = | af Goax- [ xfy (ax 
Er hs (156% 
T + © a : : 
= ati Armée Prod = [x [Tr (1-11 rco7) le 


en ayant utilisé la linéarité de l'espérance et le fait que pour les deux fonctions de distribution nous 
travaillons sur la même variable aléatoire. 


En faisant une intégration par parties (cf. chapitre de Calcul Différentiel et Intégral): 


E(R)=R- Trêfrer - (i-[1- #67) Jr 


ä x[F@T -f1-[1- r@T)]. - [ral -(1-1-r@) 01260 


—© 


L TG-tr@7 -[1- FT ax 


en n'oubliant pas que F{—-c0)= 0 et F+o)= 1. 


Maintenant considérons le cas particulier où la fonction de répartition suit une loi Normale centrée 
réduite: 


FX) = e[=#) (7.1265) 
T 


Nous avons alors: 


8-Tp-or-n-rorpe Jh-e(E4) -r-e(E A) à (7.1266) 


Faisons un changement de variables: 


FH 0 = dx=Ody (7.1267) 


T dx € 


ÿ = 


Nous avons alors: 
si La 72 
R= o| (1- œ(») -[1-œ(>)] y (7.1268) 


et nous trouvons alors la relation donnée (99% du temps sans démonstrations) dans les livres de 
statistiques des procédés: 
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+0 
d() = [ 


— 


appelée "constante de Hartley" et don 


( -æ(») -[1-&(»)f y (7.1269) 


C: 


R=aod;(#)| (7.1270) 


Cette constante est donc impossible à ce jour à calculer formellement. Soit il faut passer par des 
approximations en série de Taylor des termes de l'intégrale, ce qui devient un cauchemar pour n grand, 
soit par un calcul utilisant la méthode de Monte-Carlo (cf. chapitre de Méthodes Numériques). Comme 
c'est relativement long à implémenter dans un tableur, les ingénieurs qualité préfèrent utiliser des tables 
dans lesquelles nous trouvons par exemple: 


| Valeurs de n Valeurs de 4,(#) avec distribution normale 
| 2 1.128 

3 1.693 
| 4 2.059 
| 5 2.326 
| 6 2.534 

7 2.704 

8 2.847 
| 9 2.970 
| 10 3.078 

Tableau: 7.51 - Valeurs tabuleés de la constante de Hartley 


Voyons maintenant la variance de l'étendue en utilisant toujours la relation de Huyghens: 


VCR)= E(R?)-E(RŸ = E(R?)-od5(x) (71271) 


Le calcul de E(#°) est très peu digeste (du moins je n'ai rien trouvé de satisfaisant aux exigences de 


Sciences.ch), la plus petite démonstration complète tient sur 3 à 4 pages A4 et n'apporte formellement 
rien puisque nous finissons sur une intégrale non calculable à la main (par contre si quelqu'un a une 
démonstration simple, détaillée et élégante qu'il n'hésite pas à se manifester!). C'est pour cette raison 


qu'après avoir posé: 


HF = LA (7.1272) 
T 


si nous écrivons comme le font de nombreux ouvrages techniques: 


il vient alors que: 


TR = E(W?)-d2 (x) = Od3(n) (71274) 
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Mais comme nous ne connaissons pas l'estimateur du maximum de vraisemblance non biaisé de 
l'écart-type &, nous allons utiliser la relation démontrée: 


R=od;(#) (7.1275) 


Pour avoir finalement un estimateur biaisé de la variance de l'étendue: 


d (GR d:R 
ë HOUR Er (7.1276) 
d2@)  d 


Voici quelques valeurs tabulées de 4; : 


Valeurs de n} Valeurs de 4;(x) 

avec distribution normale 
1.128 
1.693 
2.059 
2.326 
2.534 
2.498 
2.459 
2.423 

10 2.931 


Tableau: 7.52 - Valeurs tabuleés de la constante d3 


LIN QU B|'wIN 


15.4.1. TEST (DE L'ÉTENDUE) DE TUKEY 


Supposons que nous avons Zÿ Variables aléatoires centrées réduites et indépendantes. Et notons U une 
variable aléatoire suivant une loi du Khi-deux à v degrés de liberté. 


Définissons maintenant pour des raisons qui paraîtront évidentes un peu plus loin, "l'étendue 
Studentisée" (l'origine du nom provient de sa ressemblance avec la définition de la loi de Student) par: 


maxiZ;i-miniZ;i 


Cr = RIT > 


et tentons de déterminer si cette relation suit une loi connue et une application possible (nous 
retrouvons au numérateur ce que nous avions défini plus haut comme étant la "déviation extrême" mais 
avec une autre notation). 


(7.1277) 


Pour cela, montrons que nous tombons sur la définition ci-dessus en considérant un cas un peu plus 
général où nous avons X; variables aléatoires indépendantes qui suivent une loi Normale W\ j4, diet 
avec l'écart type : 

tel 


s2 = —Y'(Z- uY (7.1278) 


À ;=] 
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et étudions le rapport: 


maxi; i-min 4; Rr 


(7.1279) 
5% S% 


Maintenant, procédons aux transformations classiques déjà vues et démontrées et utilisées maintes fois 
depuis le début de ce chapitre: 


Um 
LA Re 
ä (7.1280) 
2 Vox 
U= 7, = D 


Et nous avons alors: 


max 74 — tin #74 
max (#5 mini Ai T T 


5% U 


| 7.1281 
maxiÆ,i-minii ) 


U 


voi TVV 


max | Z; -miniZ;) 


JT 7 kr 


Donc voilà déjà pour la première étape. Pour l'instant, même si nous ne savons toujours pas si cette 
définition loi suit une distribution connue, nous pouvons déjà poser la définition très intéressante 
suivante (le terme de gauche est toujours positif): 


Q 
QG 


max(Æ#;)-min(Æ4;)S<Qe,1-xS%x (7.1282) 
ou autrement écrite: 
Rx SOkvyi-aS* (7.1283) 


et donc nous pouvons calculer quelle est la probabilité cumulée d'une une étendue obtenue par mesures 
comparée à étendue critique Kg. Correspondant directement à un seuil & imposé. Ce qui nous 


amène à pouvoir écrire que: 
PlRy Sky itl= 1€ (71284) 


Maintenant, rappelons que nous avons vu plus haut que la fonction de distribution de la déviation 
extrême était donnée par une relation à non connaissance non calculable analytiquement: 
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fr(I = 8, ILFGP -[1-[1-Ff ] (7.1285) 


Donc la fonction de distribution Q ,1-{ n'est par conséquence pas assimilable à une loi connue quand 
Fixi est une loi quelconque. Il faut donc malheureusement tabuler cette distribution par la méthode 


de Monte-Carlo (cf. chapitre de Méthodes Numériques) ou se réferer à des tables déjà existantes. 


Maintenant pour continuer, nous faisons un crochet par l'ANOVA à un facteur contrôlé que nous avions 
étudié. Rappelons d'abord que nous avons démontré que que pour des variables aléatoires 
indépendantes et identiquement distribuées nous avions: 


(7.1286) 


Te = — 
# A 


et puisque l'ANOVA est aussi basé sur l'hypothèse que: 
o=o1=0=0a? (71287) 

cela implique qu'asymptotiquement les estimateurs ont la même propriété: 
” = 5 L cè = 5? (7.1288) 


Nous savons aussi que l'écart-type de la moyenne d'un échantillon de l'ANOVA est donc donné la cadre 
et les hypothèses de l'ANOVA par: 


ÉT. = 


T 
—— (7.1289) 
À 


Mais dans le cadre de l'ANOVA, nous avons aussi montré que sous les hypothèses imposées, nous 
avions: 


5" %j 7%] 
2 ÿ (7.1290) 
S° = MSE = 
N-k 
Il vient alors que: 
S = ne (7.1291) 
# 


est un estimateur de: 


(7.1292) 


Et comme nous avions démontré que: 
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(N-—X)MSE Ê Gi 
———— = Yÿ-x (71293 
eu 
Il vient alors que: 
RS mures 
k re k (71294) 
Ca 
k 


Dès lors, nous sommes naturellement amenés à constater que la relation que nous avons définie plus 
haut: 


max(Z;i-min(X;)<Opyi-aSx (71295) 


Peut-être utilisée dans l'étude de l'ANOVA sous la forme: 


= LE 2 
M 4 ! x; i-tnin! x; i<Q% Ni 1-0 ms (7.1296) 
; > x 


pour faire un test préalable ou postérieur (post hoc) à une ANOVA à un facteur contrôlé pour vérifier 
l'hypothèse d'égalité des moyennes et identifier quelles sont les moyennes aberrantes. Donc le test de 
Tukey est souvent accompagné du test C de Cochran que nous avons déjà étudié plus haut lorsque nous 
faisons une ANOVA. 


Soit, dans le cadre de l'ANOVA, nous devrions rejeter l'hypothèse d'égalité des moyennes des 
échantillons si: 


2 .. MSE | 
maxix i-minix 2 @Qx rit-aa4l | (01297) 
? 7 À 
ou autrement écrit: 
max(Xi-miniXiZR, cs (7.128) 


Il est quasi immédiat alors que nous pouvons alors construire l'intervalle de confiance suivant: 


(XX Ron S 44 — Hj SÛX — 3; | + Ricit| (7.1299) 


15.5. COEFFICIENT DE CORRÉLATION DES RANGS DE SPEARMAN 


Le coefficient de corrélation des rangs de Spearman, noté À; est le coefficient de corrélation de la 
suite (RG), S()),i = 1...» , des rangs inspiré naturellement du coefficient de corrélation linéaire de 


Pearson vu au début de ce chapitre: 


E[(R-R)(S -5)] E(RS)- E(R)E(S) 
gs (71300) 


F(R)7(S) (e(e)-s())(e(s)-#(5)) 
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Prenons un exemple avant de nous attaquer à l'aspect théorique. Des mesures d'une population de taille 
10 (nous avons repris les mêmes valeurs que celles prises pour les études des tests de rangs non 


paramétriques précédents): 


9.7 8.1 
3.2 SA 
8.4 3.4 
4.1 14 
6.9 4.6 
2.3 1.6 
17 8.5 
3.2 71 
2.5 8.7 
7.4 5,7 


Tableau: 7.53 - Exemple de mesures 


avec leurs rangs respectifs selon l'idée d'approche de Kendall (idée simple mais à laquelle il fallait 


penser!): 


En TES En 
9.7 7 8.1 


| 8 
3.2 3 55 | 4 
8.4 10 34 | 2 
4.1 5 79 | 7 
6.9 8 46 | 3 
5.3 6 16 | 1 
17 1 85 | 9 
32 4 71 | 6 
2.5 2 87 | 10 
7.4 9 57 | 5 


Tableau: 7.54 - Valeurs mesurées et rangs respectifs 


Maintenant démontrons que la relation donnée précédemment se simplifie drastiquement car les valeurs 
de R, comme celles de S, parcourent la suite des n premiers entiers. Or nous avons démontré dans le 


chapitre de Suites et Séries que: 


donc: 


ECR) = E(S) 


Il vient alors: 


= ax +1) 


(7.1301) 


_lx(a+D  #+1 


(7.1302) 
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Nous avons également démontré dans le chapitre de Suites et Séries que: 


hs =  _— (7.1304) 


donc: 


E(R?) = E(s?) sp), ere) (7.1305) 
A 6 
Il vient alors: 


| a+DCr+D L SL | a+ D(22+D-3(2+1) 
6 2 


12E(R.S)-3(2+1) 12E(R.S)-3(n? +2n+1) 


: (2n +2) 2n+1)—3{n? +2n+1) | An? +2n +4n+ 2-37 — 6n— 3 


12— S; — Gr En 3 
_12E(R.S)-3n" -67-3 DAS FDP (7.1306) 
12 À. F4 
DS an 63 | 22% RECU LDRS Ÿ 3(n+1ÿ 
m2 #21 2 y» 1 CE (8 +1)(2 — 1) 
12 rh 6S'2RS 
2 "_ 3{x+1) 2 RÈ 3(n+1) 


Maintenant jouons un peu pour obtenir une expression encore plus simplifiée en observant que: 


n 


LR - SŸ +: — 2R,S, +8 = Pi -2DRS +58 (7.1307) 


=] =] 


= =1 


il vient alors que: 


2DRS SR +2 LR ras SR +5 82 - DE (7.1308) 


= = 2=l 
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Nous avons alors: 


de 2 : 
62,2R5; 32 +1) | (2# +25 ia) 32 +1) 


i=l =] 


A ne 
De U Los. . (7.1309) 
65 d2 
_ (Èr +25 os » 
a(x? —1) n—1  n(n°?-1) 


Or, nous avons démontré que: 


aGa+ TC» +T (7.1310) 


DP-DReps- 


= 


Dès lors: 


>dÿ 6> 4? 


_ 2n(n+T(22+D  3(2+1) L mi _2@+DQr+) %u+D_ 


0 AE nel Tr 1) PT n-1 n°0 
6542? 
_ 2@+1)(2#+1) _3(:+@r+1) 5 
Ga Dér+D (x Dée+1) (x -1) Gi 
65 d? 
_ 2e +(2#+1)-3%2+1)r+1) 5 
(2 —T(x+1) a(n? — 1) 
65 42 65" d2 
_ 2@n+1)-3(+1) | 24 _An+2-3n-3 Zi 
(2 —1) n(n? 1) (x —1) n (n° -1) 
65 d? 65 42 
A#— 1 = ee 


(n-D né n(n2-0 


Ainsi, nous trouvons la fameuse relation disponible dans tous les livres de Statistiques au final: 


ñn 
65 4? 
2 * l'(R1312) 


ETES 


Le coefficient de Spearman reprend les propriétés essentielles du coefficient de Pearson à savoir que: 
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—1SRs<+1 (71313) 


et prend la valeur 0 lorsque les variables sont indépendantes (en n'oubliant pas les subtilités importantes 
y relatives déjà mentionnées lors de notre étude du coefficient de Pearson). 


Remarque: Toujours conséquence du fait qu'il soit non paramétrique, le coefficient de corrélation de 
Spearman peut traiter les variables intrinsèquement ordinales: un indice de satisfaction, une 
appréciation ou une note attribuée, etc. 


16. CALCULS D'ERREURS/INCERTITUDES 


Il est impossible de connaître (mesurer) la valeur exacte d'une grandeur physique expérimentalement, il 
est très important donc d'en déterminer l'incertitude. 


Nous appelons bien évidemment "erreur", la différence entre la valeur mesurée et la valeur exacte. 
Cependant, comme nous ignorons la valeur exacte, nous ne pouvons pas connaître l'erreur commise 
quand même... Le résultat est donc toujours incertain. C'est la raison pour laquelle nous parlons des 
"incertitudes de mesure". 


Nous distinguons deux types d'incertitudes: 


1. Les "erreurs systématiques": elles affectent le résultat constamment et dans le même sens (erreurs 
des appareils de mesures, limites de précision, etc.). Il faut alors éliminer, ou corriger le résultat, si 
possible ! 


2. Les "erreurs accidentelles" (statistiques): il faut alors répéter les mesures, calculer la moyenne et 
évaluer l'incertitude en utilisant les outils de statistique. 


Le deuxième type d'erreurs fait un très gros usage de tous les outils statistiques que nous avons 
présentés jusqu'à maintenant. Nous ne reviendrons donc pas dessus et nous nous concentrerons alors 
uniquement sur quelques nouveaux concepts. 


16.1; INCERTITUDES ABSOLUES ET RELATIVES 


Si la vraie valeur d'une grandeur est x (supposée connue théoriquement) et la valeur mesurée est x;, 


alors Âx, est "l'incertitude absolue" (l'incertitude due aux appareils de mesure) ou "erreur absolue". 
L'intervalle de confiance de la mesure est alors notée: 
Xo 7 Am <x<x + ÂÀx, (71314) 
ou: 
X=ZXp+tÂx (71315) 


"L'incertitude relative" ou "erreur relative" est quant à elle définie par: 
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L'incertitude absolue permet de connaître l'approximation du dernier chiffre significatif de celle-ci. Par 
contre, lorsque nous désirons comparer deux mesures ayant des incertitudes absolues afin de déceler 
laquelle a la plus grande marge d'erreur, nous calculons l'incertitude relative de ce nombre en divisant 
l'incertitude absolue par le nombre, et transformons en pourcentage. 


En d'autres termes, l'incertitude relative permet d'avoir une idée de la précision de la mesure en %. Si 
nous faisons une mesure avec une incertitude absolue de 1 [mm], nous ne saurons pas si c'est une bonne 
mesure ou non. Ça dépend si nous avons mesuré la taille d'une pièce de monnaie, de notre voisin, de la 
distance Paris-Marseille ou de la distance Terre-Lune. Bref, ça dépend de l'incertitude relative (c'est- 
à-dire du rapport de l'incertitude absolue sur la mesure). 


16.2. ERREURS STATISTIQUES 


Dans la plupart des mesures, nous pouvons estimer l'erreur due à des phénomènes aléatoires, appelée 
"erreur aléatoire", par une série de n mesures x,%,,...,2,,...,X, et Ce à l'opposé de "l'erreur 


systématique" qui est la part non aléatoire de l'erreur. 
L'erreur aléatoire permet d'introduire les notions de: 


- Répétabilité: qui est définie comme l'étroitesse de l'accord entre les résultats de mesurages successifs 
d'une même grandeur, effectués avec la même méthode, par le même opérateur, avec les mêmes 
instruments de mesure, dans le même laboratoire, et à des intervalles de temps assez courts (voir plus 
un peu plus bas un traiement et une définition plus rigoureuse conforme aux normes internationales). 


CR 1 


- Reproductibilité (parfois appelé "justesse"): qui est définie comme l'étroitesse de l'accord entre les 
résultats de mesurages successifs d'une même grandeur, dans le cas où les mesurages individuels sont 
effectués: suivant différentes méthodes, au moyen de différents instruments de mesure, par différents 
opérateurs dans différents laboratoires. 


Ces deux notations sont toujours regroupées sous le sigle "R&R" ou "Étude R&" dans l'industrie. En 
général, l'accord est moins bon quand il s'agit de reproductibilité. 


Remarque: Il existe des logiciels informatiques basés sur l'ANOVA à deux facteurs avec répétition 
comme Minitab qui générent des rapports très détaillés pour les analyses R&R. 


Ces deux types d'erreurs peuvent être illustrés par le tir à la cible de façon plus générale: 
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ni juste ni fidèle ("imprécis") pas juste mais fidèle 
(erreur aléatoire + systématique) (erreur systématique) 
(©) @) 
juste mais pas fidèle juste et fidèle ("précis") 
(erreur aléatoire) (erreurs faibles) 


Figure: 7.73 - Types d'erreurs en ingénierie de laboratoire 


Comme nous l'avons vu plus haut, la valeur moyenne arithmétique sera alors: 


et l'écart moyen (estimateur biaisé démontré plus haut): 
3 — Îl< 2 l< 2 
& =K=—$(x-u) =-0 (x -x) (71318) 
#il il 
et l'écart quadratique moyen ou écart-type (estimateur sans biais): 
1 À _2 
a = —ÿ: x -X) (71319) 
m1 


il 


et nous avions démontré que l'écart-type de la moyenne était donné par: 


1 dix -7) 


—— (7.1320) 
ain —li il 


=N2 
DT = —— = — ———— LE nt | = 


et comme nous l'avons vu, après un grand nombre de mesures indépendantes, la distribution des erreurs 
sur une mesure suit une loi Normale telle que nous puissions écrire (si nous n'avons pas assez de 
mesures, nous utiliserons l'I.C. basé sur la loi de Student): 


A -TKr<XT+TE 68% 
7, -20<x < x +29 954% 
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bref nous pouvons réutiliser tous les outils statistiques vus jusqu'ici dans le domaine de la mesure en 
laboratoire ou ailleurs! 


Le résultat d'une mesure doit ainsi comporter en toute rigueur 4 éléments. Par exemple: 


125.3 [Kg] + 17 [Kg] &=2) (71322) 
D rs EE “ } , f.1944 


où nous avons: 

1. La valeur numérique avec un nombre correct de décimales 
2. Unité de la mesure selon le standard du système international 
3. Incertitude élargie de &.er (intervalle de confiance) 


4. La valeur entière du k utilisée pour l'intervalle de confiance. 


16.3. RÉPÉTABILITÉ 


La répétabilité r, mesure de l'écart probable entre deux mesurages sur des objets de même nature, dans 
un même laboratoire, sous des conditions opératoires semblables, est définie normativement (dans les 
normes ISO 5725:1987 et AFNOR NF X 06-041 Fidelité des méthodes d'essai) dans le cas 
monodimensionnel par: 


PIX -ZX|<ri=p (71323) 


où p est une probabilité élevée, généralement égale à 95% et X,,X; deux variables indépendantes et 
identiquement distribuées selon une loi Normale d'espérance et variance inconnues | 44, |. De par 


la stabilité de la loi Normale, il vient alors: 
A - A =N Lu, i- Ni 4, |= N(0,27 | (7.1324) 


Or, nous avons vu au début de ce chapitre dans le cadre de l'étude de l'intervalle de confiance de la 
moyenne que: 


ô 
rfr =?) = 0.025 (7.1325) 
T 


Donc in extenso: 


et dès lors en utilisant les tables, nous avons: 


Ê nu 196 (7.1327) 
a 
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Et donc: 


ÿd=1.96a (7.1328) 
Soit avec la notation des normes pour laboratoires: 
rz196a (7.1329) 


Mais dans le cas présent, nous avons un variance doublée. Donc il vient: 


2196202770] (71330) 


Nous retrouvons dans la relation disponible dans la norme avec le fameux coefficient de 2.77. 
Evidemment après il est évident que la valeur de r doit être minimisée! 


16.4. PROPAGATION DES ERREURS 


Soit une mesure x+ Ax et y = f(x) une fonction de x. Quelle est l'incertitude sur y si nous connaissons 


uniquement l'incertitude d'un appareil de mesure mais qui ne serait pas donnée sous forme d'écart-type 
statistique? 


Lorsque Ax est petit, f(x) est remplacé au voisinage de x par sa tangente (il s'agit simplement de la 
dérivée bien sûr): 


à 
Ày = ar (7.1331) 
dx 


mais si y dépend de plusieurs grandeurs x, z, t mesurées avec les incertitudes Âx, Âz,  : 
Y=f(x,z,t) (71332) 


l'erreur maximale possible est alors la différentielle totale exacte (cf. chapitre de Calcul Différentiel Et 
Intégral): 


2 = lax+ 
üx 


dl + 
& 


à 
da (7.1333) 
dé 


Ce que nous notons aussi souvent: 


Ce qui conduit à: 
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Il apparaît ainsi clairement qu'une opération mathématique ne peut améliorer l'incertitude sur les 
données. 


Remarque: Le résultat d'une multiplication, d'une division, d'une soustraction ou d'une addition est 
arrondi à autant de chiffres significatifs que la donnée qui en comporte le moins. 


Si l'incertitude de l'appareil de mesure est donnée sous forme statistiques (écart-type), il est évident dès 
lors que nous allons utiliser les propriétés de la variance déjà vues au début de ce chapitre... pour des 
cas simples. 


16.5. CHIFFRES SIGNIFICATIFS 


Dans les petites écoles (et aussi les plus grandes parfois), il est demandé de transformer une mesure 
exprimée en une certaine unité en une autre unité. 


Par exemple, en prenant les tables, nous pouvons avoir le type de conversion suivante: 


140 [48] = 140: 0.45359237 [kg/1b]= 63.5029318 [&g] (7.1336) 


Vient alors la question suivante (que l'élève peut avoir oublié..). Au départ d'une mesure dont la 
précision est de l'ordre de 1 [lb] (donc de l'ordre de 0.5 [kg]), une simple conversion d'unité 
pourrait-elle amener à une précision au 1/10 [mg] près ? 


De cet exemple il faut donc retenir qu'une marge d'incertitude est associée à toute valeur mesurée et à 
toute valeur calculée à partir de valeurs mesurées. 


Dans les sciences exactes, tout raisonnement, toute analyse doit prendre cette incertitude en compte. 


Mais pourquoi des chiffres sont-ils significatifs et d'autres pas alors ? Parce qu'en sciences, nous ne 
rapportons que ce qui a objectivement été observé (principe d'objectivité). En conséquence, nous 
limitons l'écriture d'un nombre aux chiffres raisonnablement fiables en dépit de l'incertitude: les chiffres 
significatifs. La précision que des chiffres supplémentaires sembleraient apporter est alors illusoire. 


Il faut alors savoir arrondir selon des règles et conventions: 


- Lorsque le chiffre de rang le plus élevé qu'on laisse tomber est supérieur à 5, le chiffre précédent est 
augmenté de 1 (exemple: 12.66 s'arrondit à 12.7). Dans la version anglaise de Microsoft Excel 11.8346: 


=ROUND(12.66;1)=-12.7 


- Lorsque le chiffre de rang le plus élevé qu'on laisse tomber est inférieur à 5, le chiffre précédent reste 
inchangé (exemple 12.64 s'arrondit à 12.6). Dans la version anglaise de Microsoft Excel 11.8346: 
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- Lorsque le chiffre de rang le plus élevé qu'on laisse tomber est égal à 5, si un des chiffres qui le 
suivent n'est pas nul, le chiffre précédent est augmenté de 1 (exemple: 12.6502 s'arrondit à 12.7). Dans 
la version anglaise de Microsoft Excel 11.8346: 


=ROUND(12.64;1)=-12.6 


=ROUND(12.6502;1)=12.7 


- Sile chiffre de rang le plus élevé que nous laissons tomber est un 5 terminal (qui n'est suivi d'aucun 
chiffre) ou qui n'est suivi que de zéros, nous augmentons de 1 le dernier chiffre du nombre arrondi s'il 
est impair, sinon nous le laissons inchangé (exemples: 12.75 s'arrondit à 12.8 et 12.65 à 12.6). Dans ce 
dernier cas, le dernier chiffre du nombre arrondi est toujours un chiffre pair. Les tableurs ne respectent 
pas vraiment cette dernière règle, effectivement avec la version anglaise de Microsoft Excel 11.8346 
nous avons: 


=ROUND(12.75;1)=12.8 
=ROUND(12.65;1)=-12.7 


Au fait dans la pratique ces règles sont peu utilisées car les logiciels (tableurs) n'intègrent pas des 
fonctions adaptées. Il est alors d'usage d'arrondir simplement à la valeur de la décimale la plus proche. 


Les chiffres significatifs d'une valeur comprennent tous ses chiffres déterminés avec certitude ainsi que 
le premier chiffre sur lequel porte l'incertitude (ce dernier significatif occupe le même rang que l'ordre 
de grandeur de l'incertitude). 


Souvent, les sources de données ne mentionnent pas d'intervalle de confiance (c'est-à-dire une 
indication +/-). Par exemple, lorsque nous écrivons #7 = 25.4 [kg] nous considérons 
conventionnellement que l'incertitude est du même ordre de grandeur que le rang du dernier chiffre 
significatif (soit le chiffre incertain). 


En fait, seul le rang décimal de l'incertitude est implicite: sa marge réelle n'est pas précisée. 
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Notes personnelles: 
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L'algèbre est la science du calcul des grandeurs ou structures représentées par des lettres 
(Larousse). 


8. CALCUL ALGÉBRIQUE 


D. la section d'Arithmétique de ce site, nous avons beaucoup écrit sur différents théorèmes 


utilisant les nombres abstraits afin de généraliser l'étendue de la validité de ces derniers. Nous avons 
cependant peu abordé la façon dont nous devions manipuler ces nombres abstraits. C'est ce que nous 
allons voir maintenant. 


Comme vous le savez peut-être déjà, le nombre peut être envisagé en faisant abstraction de la nature 
des objets qui constituent le groupement qu'il caractérise et ainsi qu'à la façon de codifier (chiffre arabe, 
romain, ou autre système..). Nous disons alors que le nombre est un "nombre abstrait" et lorsque nous 
manipulons ces types d'objets nous disons que nous faisons du "calcul algébrique" ou encore du "calcul 
littéral". 


Définition: Le "calcul littéral" consiste à calculer avec des variables (c'est-à-dire avec des lettres) 
comme on le ferait avec des nombres. 


Pour les mathématiciens il n'est souvent pas avantageux de travailler avec des valeurs numériques 
(1,2,3...) car ils représentent uniquement des cas particuliers. Ce que cherchent les physiciens, 
ingénieurs ainsi que les mathématiciens, ce sont des relations applicables universellement dans un cadre 
le plus général possible. 


Ces nombres abstraits appelés aujourd'hui communément "variables" sont très souvent représentés par 
l'alphabet latin (pour lequel les premières lettres de l'alphabet latin a, b, c, … désignent souvent les 
nombres connus, et les dernières x, y, z, … les nombres inconnus.), l'alphabet grec (aussi beaucoup 
utilisé pour représenter des opérateurs mathématiques plus ou moins complexes) et l'alphabet hébraïque 
(dans une moindre mesure) 


Bien que ces symboles puissent représenter n'importe quel nombre, il en existe cependant quelques-uns 
aussi bien en physique ou en mathématique qui peuvent représenter des constantes dites Universelles 
(vitesse de la lumière c, la constante gravitationnelle G, la valeur Pi, le nombre d'Euler, ….). 


Remarque: Il semblerait que les lettres pour représenter les nombres ont été employées pour la 
première fois par Viète au milieu du 16ème siècle. 


Une variable est donc susceptible de prendre des valeurs numériques différentes. L'ensemble de ces 
valeurs peut varier suivant le caractère du problème considéré. 


Rappels (nous avions déjà défini cela dans le chapitre traitant des Nombres dans la section 
d'Arithmétique): 


R1. Nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques qu'elle 
est susceptible de prendre entre deux bornes. 


Page: 622/4839 


[v3.0 - 2013] 


Soit a et b deux nombres tel que a<b. Alors: 


R2. Nous appelons "intervalle fermé d'extrémités a et b", l'ensemble de tous les nombres x compris 
entre ces deux valeurs et nous le désignons de la façon suivante: 


[ab]={xeR|a<x£<b} (81) 


R3. Nous appelons "intervalle ouvert d'extrémités a et b", l'ensemble de tous les nombres x compris 
entre ces deux valeurs non comprises et nous le désignons de la façon suivante: 


Ja. b={xeR|a<zx<b} (82) 
R4. Nous appelons "intervalle fermé à gauche, ouvert à droite" la relation suivante: 
[a,B={xeRl|a£<x<b} (8.2) 
R5. Nous appelons "intervalle ouvert à gauche, fermé à droite" la relation suivante: 
Ja, b]={xeR|a<x<b} (84) 
Remarque: Si la variable peut prendre toutes les valeurs négatives et positives possibles nous 


écrivons dès lors: J-=, +a[ où le symbole "« " signifie “infini”. Evidemment il peut y avoir des 


combinaisons d'intervalles ouvert et infini à droite, fermé et limité à gauche et réciproquement. 


Définition: Nous appelons "voisinage de a”, tout intervalle ouvert de IR contenant a (c'est un concept 
simple que nous reprendrons pour définir ce qu'est une fonction continue). Ainsi: 


Ve>0,la-#,a+el (85) 


est un voisinage de a. 


1. ÉQUATIONS ET INÉQUATIONS 


L'algèbre élémentaire consiste à partir des définitions de l'addition, soustraction, multiplication, et 
puissance et de leurs propriétés (associativité, distributivité, commutativité, élément neutre, inverse, ..) 
- ce qui constitue selon l'ensemble sur lequel nous travaillons un corps ou un groupe commutatif abélien 
ou non (cf. chapitre Théorie des Ensembles) - à manipuler selon un but fixé des "équations algébriques" 
mettant en relation des variables et constantes. 


Nous allons définir de suite après ce qu'est une équation et une inéquation mais nous souhaitons d'abord 
définir certaines de leurs propriétés: 


Soit A et B deux polynômes (ou monômes) quelconques - voir définitions un peu plus loin - les 
expressions: 


AD B,A=B,A<B,A<B,A2B (8.6) 


Vérifient les propriétés suivantes: 
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P1. Nous pouvons toujours ajouter ou ôter aux deux membres d'une inéquation ou équation un même 
polynôme en obtenant une inéquation ou équation équivalente (c'est à dire avec les mêmes solutions ou 
réductions). Nous disons alors que l'égalité ou l'inégalité restent "vraies" par l'opération d'addition ou de 
soustraction membre à membre. 


P2. Si nous multiplions ou si nous divisons les deux membres d'une équation ou inéquation par un 
même nombre positif nous obtenons également une inéquation ou équation équivalente (nous avons 
déjà vu cela). Nous disons alors que l'égalité ou l'inégalité reste "vraie" par l'opération de multiplication 
ou division membre à membre. 


P3. Si nous multiplions ou si nous divisons les deux membres d'une inéquation par un même nombre 
négatif et si nous inversons le sens de l'inégalité, nous obtenons alors une inéquation ou équation 
équivalente. 


1.1. ÉQUATIONS 


Définition: Une "équation" est une relation d'égalité entre des valeurs toutes abstraites (autrement dit: 
deux expressions algébriques) ou non toutes abstraites (dès lors nous parlons d'équations à une 
inconnue, deux inconnues, trois inconnues, … ) reliées entre elles par des opérateurs divers. 


La maîtrise parfaite de l'algèbre élémentaire est fondamentale en physique-mathématique et dans 
l'industrie!!! Comme il existe une infinité de types d'équations, nous ne les présenterons pas ici. C'est le 
rôle de l'enseignant/formateur dans les classes d'entraîner le cerveau de son auditoire pendant plusieurs 
années (2 à 3 ans en moyenne) à résoudre énormément de configurations différentes d'équations 
algébriques (exposées sous forme de problèmes de tous les jours, géométriques ou purement 
mathématiques) et ce afin que les élèves manipulent ces dernières sans erreurs en suivant un 
raisonnement logique et rigoureux (ce n'est qu'en forgeant que l'on devient forgeron...)!!! 


En d'autres termes: Un professeur/formateur et un établissement ad hoc sont irremplaçables pour 
acquérir un savoir et avoir un retour d'expérience!!! 


Nous avons tenté, ci-dessous, de faire une généralisation simpliste des règles de base de l'algèbre 
élémentaire. Cette généralisation sera d'autant plus simple à comprendre que le lecteur aura l'habitude 
de manipuler des quantités abstraites: 


Ainsi, soit a, b, c, d, e, …., x, y des nombres abstraits pouvant prendre n'importe quelle valeur numérique 
(nous restons dans le cadre des nombres classiques scolaires et industriels….). 


Soit = (la lettre majuscule grecque se prononçant "Xi") représentant un ou plusieurs nombres abstraits 
(variables) opérants entre eux d'une façon quelconque tel que nous ayons des monômes (un seul 
nombre abstrait) ou polynômes (poly = plusieurs) algébriques différents distinguables ou non (nous 
faisons donc ici une sorte d'abstrait de l'abstraction ou si vous préférez une variable de plusieurs 
variables). 


Propriétés (il s'agit plus d'exemples au fait que de propriétés..): 


P1. Nous aurons toujours £ = # si et seulement si le terme = à gauche de l'égalité représente le même 
terme = que celui qui est à droite de l'égalité. Si cette condition est satisfaite nous avons alors : 
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Sinon: 


5-S=# (8,8) 
où nous excluons donc les cas où tous les = sont identiques entre eux (sinon nous revenons à P1). 


P2. Nous avons: 


=1&l1-1&5-# (89) 


[1] | [1] 


qui vérifie la symbolique de l'équation £ = * dans le cas seulement où les éléments # sont identiques 
entre eux (nous excluons bien évidemment le cas avec dénominateur nul). 


Nous avons sinon dans le cas où tous les # sont strictement différents: 


(8.10) 


[1] | [1] 
# 
{1] | [1] 


Nous pouvons avoir: 


(8.11) 


[1] | [1] 
I 
[1] | [1] 


dans le cas où une simplification (ou non) des termes contenus dans les = amène à une identité de la 
relation binaire (non nécessairement égale à l'unité). 


P3. Si tous les = sont strictement identiques, alors: 
She cos) l 1 
us RE — (12) 


Sinon nous avons: 


—_ 
CR 
Ce 


[1] 


."# (8.13) 
qui ne peut s'écrire sous forme condensée simple. Il peut aussi arriver que: 
E'H'..'E=f# (814) 


avec le = à droite de l'égalité identique à aucun, un ou encore plusieurs = du membre gauche de 
l'égalité. 


P4. Nous pouvons avoir: 


sans que nécessairement les exposants du numérateur ou dénominateur soient égaux (nous excluons le 
dénominateur nul) 


Sinon nous pouvons avoir: 
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“i [1] 
nm mn 
Il 
[1] 
© 
E 
| [ 

Il 
[1] 
tm 
[l 
ta 
c 
a 


mais il n'est cependant bien évidemment pas impossible d'avoir quand même = =] ou =%-# =] (nous 
excluons le cas avec dénominateur nul) 


P5. Nous avons si tous les = sont strictement identiques aux dénominateurs: 


Mais. il est également possible que dans l'expression précédente certains = différents s'annulent 
cependant entre eux dès que leur division mutuelle est égale à l'unité (nous excluons le dénominateur 
nul). 


Si tous les = de la relation précédente sont identiques, la relation est égale à l'unité. 


Sinon nous avons: 


mais il n'est cependant pas impossible d'avoir quand même: 
S/5/5/5..5 =5# (8.19) 


avec le = à droite de l'égalité identique à aucun, un ou plusieurs = du membre gauche de l'égalité ou 
même il est tout à fait possible d'avoir: 


=#% (8.20) 


Le Le Len 
nininir 


[1] 


P6. Soit L représentant indifféremment soit exclusivement l'addition ou exclusivement la soustraction 
nous avons (au signe près): 


ISLELSL... LE=h"# (621) 


si tous les Æ sont identiques entre eux ou si la combinaison d'un nombre indéterminés de = sont égaux 
au = présent à droite de l'égalité. 


Sinon quoi nous aurons: 


SELS. Lex (622) 


— 


il peut cependant arriver que le = à droite de l'égalité soit identique à aucun, un ou plusieurs = du 
membre gauche de l'égalité. 


1 


Nous pouvons également avoir: 
EE. GE.pE = DE (8.23) 


si et seulement si les = sont tous égaux (ou décomposable égaux) et les puissances = non 
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nécessairement égales. 


A partir de la connaissance des ces 7 règles/exemples de base, nous pouvons résoudre, simplifier ou 
montrer qu'une équation simple possède des solutions ou non par rapport à un problème ou énoncé 
donné. 


Ainsi, soit Y une opérande ou une suite d'opérations quelconques sur une ou des abstractions d'abstrait 
5 et parmi tous les & , une (ou plusieurs) dont la ou les valeurs numériques est ou sont inconnues (les 
autres étant connues). Alors, nous devons pouvoir trouver ou démontrer qu'une équation du type: 


5 = VE 
possède ou non des solutions. 
Dans le cas d'une équation avec la valeur absolue ( sratet ues) du type: 
[PE] = YE 


avec le deuxième membre strictement positif (sinon la relation précédente serait un non sens) cela 
équivaut bien sûr d'après la définition de la valeur absolue à écrire: 


Tants dE te 


Remarques: 


R1. La présence de la valeur absolue dans une équation algébrique dont nous cherchons les 
solutions double souvent le nombre de solutions. 


R2. Une équation est dite "équation conditionnelle", s'il y a des nombres dans l'ensemble de 
définition des expressions qui ne sont pas solutions (ce qui est en fait le cas le plus fréquent). 
Inversement, si tout nombre de l'ensemble de définition est solution de l'équation alors l'équation est 
dite "équation identité". 


Nous pouvons parfois avoir à résoudre (et non à simplifier) un "système d'équations". Qu'est-ce que 
c'est ?: C'est un ensemble d'au moins 2 équations à résoudre (et non à simplifier!). La particularité du 
système ? : L'ensemble des solutions du système est l'intersection des solutions de toutes les équations 
à résoudre. Quel est son utilité ?: Elle est sans fin, ces systèmes permettent de résoudre des problèmes 
faisant intervenir des applications des mathématiques à d'autres domaines. A cause de la variété 
illimitée des applications, il est difficile d'établir des règles précises pour trouver des solutions. La 
marche à suivre que voici peut être utile pour autant bien sûr que le problème puisse être formulé sous 
forme d'équations: 


1. Si le problème est posé par écrit, le lire plusieurs fois soigneusement, réfléchir aux faits donnés ainsi 
qu'à la quantité d'inconnues à trouver (résumer l'énoncé sur une feuille de papier est souvent plus 
qu'utile pour les gros problèmes!). 


2. Choisir une lettre qui représente la quantité inconnue. C'est l'un des pas décisifs dans la recherche de 
la solution. Des phrases contenant des mots comme: trouver, quoi, combien, où, quand ; devraient vous 
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renseigner sur la quantité inconnue. 


3. Faire éventuellement un dessin (de tête ou sur papier) avec des légendes. 


4. Dresser une liste des faits connus et des relations concernant les quantités inconnues. Une relation 
peut être décrite par une équation dans laquelle apparaissent d'un seul ou des deux côtés du signe égal 
des énoncés écrits à la place des lettres ou des nombres. 


5. Après avoir analysé la liste de l'étape 4, formuler une ou plusieurs équations qui décrivent 
précisément ce qui est énoncé avec des mots. 


6. Résoudre l'équation ou le système d'équation(s) formulée(s) à l'étape 5. 


7. Contrôler les solutions obtenues à l'étape 6 en se reportant à l'énoncé de départ du problème. Vérifier 
que la solution concorde avec les conditions de l'énoncé. 


Les méthodes de résolutions des systèmes d'équations sont traitées en détails dans le chapitre de 
Méthodes Numériques (vous y verrez la méthode) et également dans le chapitre d'Algèbre linéaire de la 
présente section (vous y comprendrez pourquoi la méthode est telle quelle). 


1.2. INÉQUATIONS 


Précédemment nous avons vu qu'une équation était une égalité composée de différents calculs avec 
différents termes (dont au moins une "inconnue" ou un "chiffre abstrait"), et que "résoudre" une 
équation revenait à calculer la valeur de l'inconnue de l'égalité, alors que la "simplifier" revenait à 
minimiser mathématiquement le nombre de termes (en factorisant ou autre.) et que développer 
revenait à mettre à plat tous les termes. 


Pourquoi avons-nous besoin de rappeler la définition d'une équation ? Tout simplement parce que pour 
l'inéquation, c'est le même système. La différence ? Si l'équation est une égalité, l'inéquation est une 
inégalité: comme l'équation, l'inéquation est composée de différents calculs avec différents termes reliés 
entre eux par des opérateurs quelconques, dont au moins une inconnue. 


Différence entre égalité et inégalité: 
- Egalité: Symbolisée par le signe = 


- Inégalité: Symbolisée par les relations d'ordre d'égalités strictes et larges < , < , > , >. 


> — >; > 


Lorsque nous résolvons une inéquation, notre inconnue peut-avoir un intervalle de valeurs qui satisfont 
à l'inéquation. Nous disons alors que la solution de l'inéquation est un "ensemble de valeurs". C'est la 
différence fondamentale entre une égalité (plusieurs solutions) et une inégalité (intervalle de solutions) ! 


Rappelons les signes que nous pouvons rencontrer dans une inéquation: 


ALI 


< : Se lit "strictement inférieur à” ou "strictement plus petit que”. Dans ce cas, le plus souvent, la 
valeur butoir numérique n'est pas comprise dans le domaine et nous pouvons représenter alors le 
domaine avec un crochet ouvert à gauche |]... ou à droite ...[ selon que la valeur butoir est positive ou 
négative. 


ou 


> : Se lit "strictement supérieur à" ou "strictement plus grand que". Dans ce cas, le plus souvent, la 
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valeur butoir numérique n'est également pas comprise dans le domaine et nous pouvons représenter 
alors le domaine avec un crochet ouvert à gauche ]... ou à droite .[ selon que la valeur butoir est 
positive ou négative. 


Remarque: Attention cependant pour les deux cas précités, il existe des situations où le domaine est 
imposé par l'ensemble de nombres sur lequel nous travaillons (penser par exemple à une inéquation 
où pour certaines valeurs les solutions appartiennent à l'ensemble des complexes). Dans ce cas, les 
valeurs butoirs à l'ensemble de nombres sur lequel nous travaillons peuvent imposer des crochets 
fermés. 


à 17 


£ : Se lit "inférieur ou égal à "ou "plus petit ou égal à". Dans ce cas, la valeur butoir numérique est 
comprise dans le domaine et nous pouvons représenter alors le domaine avec un crochet fermé à 
gauche [.. ou à droite | (mais pas nécessairement les deux!) selon que la valeur butoir est positive ou 
négative. 


ou 


> : Se lit "supérieur ou égal à" ou "plus grand ou égal à". Dans ce cas, la valeur butoir numérique est 
également comprise dans le domaine et nous pouvons représenter alors le domaine avec un crochet 
fermé à gauche [... ou à droite …] (mais pas nécessairement les deux!) selon que la valeur butoir est 
positive ou négative. 


Remarque: Nous renvoyons le lecteur au début de ce chapitre où nous avions défini la manière 
d'écrire des domaines de définition. 


L'objectif des inéquations est la plupart du temps (excepté le côté esthétique) d'avoir au moins parmi 
l'ensemble des termes une valeur numérique qui permet de définir le domaine de solution (de tous les 
termes abstraits de l'inéquation) qui satisfait l'inéquation. 


Il existe plusieurs façons de représenter les domaines de définition des variables qui satisfont à 
l'inéquation. Nous allons voir à travers un petit exemple quelles sont ces possibilités: 


Soit une inéquation linéaire (du premier degré) en x à une seule inconnue à laquelle nous imposons une 
contrainte particulière arbitraire pour l'exemple (évidemment l'expression peut contenir plus de 
termes...): 


x<2 
nous avons dans l'inéquation ci-dessus déjà simplifié tous les termes qui étaient superflus. 


Résoudre l'inégalité revient à chercher les valeurs de x inférieures à 2. Bien sûr, il n'existe pas une seule 
solution dans IR mais un ensemble (intervalle) de solutions et c'est cela même le principe des 
inéquations! 


Pour résoudre l'inéquation, nous observons d'abord le type d'inégalité imposée ("stricte" ou "égal"). 
Ensuite, dans les petites classes (et pas seulement parfois...) nous représentons l'ensemble I 
traditionnellement par un tableau tel que: 
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Tableau: 8.1 - Résolution d'inéquation 


Nous savons intuitivement que la solution de notre inéquation regroupe toutes les valeurs inférieures à 
2 (2 exclu des solutions) et ce jusqu'à -w. Nous écrivons alors cet intervalle ou domaine sous la forme 
suivante: 


S =]-c,2 (8.28) 


Ensuite, nous pouvons représenter graphiquement l'ensemble des solutions (cela aide à comprendre et 
prépare l'étudiant à la résolution de systèmes d'équations et d'inéquations et aux variations de 
fonctions). Pour cela, nous reprenons le modèle de schéma du système numérique, et y plaçons notre 
valeur butoir (nous n'en avons qu'une dans cet exemple mais parfois il peut y en avoir plusieurs dû au 
fait qu'il y a une singularité ou des racines pour certaines valeurs du domaine de définition), soit 2: 


Tableau: 8.2 - Construction des points particuliers de l'inéquation 


et enfin, nous délimitons au stylo de couleur (...) l'ensemble des solutions de -co à 2 exclu: 


Tableau: 8.3 - Mise en place du type de bornes de l'inéquation 


A la valeur 2, nous n'oublions pas de marquer le signe ….[ pour montrer que cette valeur est exclue des 
solutions. Et voilà, le tour est joué et le concept est extrapolable à des inéquations beaucoup plus 
complexes. 


Remarques: 


R1. Parfois au lieu de représenter les tableaux comme nous l'avons fait, certains professeurs (c'est 
un choix complètement artistique) demandent à leur élèves d'hachurer les cases du tableau et d'y 
dessiner de petits ronds, ou encore se servent de petites flèches, ou encore de dessiner le graphique 
des fonctions de l'inéquation (cette dernière méthode est certes esthétique mais prend du temps..). 


R2. Dans le cadre d'inéquations de degré supérieur à 1, il faut (voir plus loin ce que cela signifie 
exactement) d'abord déterminer les racines de l'inéquation qui permettent de déterminer les 
intervalles et ensuite par essais successifs, déterminer quels intervalles sont à rejeter ou à conserver. 


Nous pouvons également (au même titre que les équations) parfois avoir à résoudre un "système 
d'inéquations". Qu'est-ce que c'est ?: C'est un ensemble d'au moins 2 inéquations à résoudre. La 
particularité du système ? : L'ensemble des solutions du système est l'intersection des solutions des 
toutes les inéquations à résoudre. 


Autrement dit, la méthode est la même que la précédente, à la différence près que notre tableau 
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(représentant les domaines de solutions) comportera une ligne supplémentaire par inéquation 
supplémentaire dans le système plus une ligne de synthèse qui est la projection des domaines de 
solutions possibles du système. 


Ainsi, un système à n inéquations aura un tableau récapitulatif à x +1 lignes. 


Mathématiquement, les domaines (car il peut y en avoir plusieurs qui sont disjoints) peuvent s'écrire 
comme un ensemble de domaines: 


S={l..lL.L..L…..D (6:29 


Les systèmes d'inéquations sont très fréquents dans beaucoup de problèmes de la mathématique, 
physique, économétrie, etc. Il est donc important de s'entraîner à les résoudre pendant vos études avec 
l'aide de votre professeur. 


Par exemple, voici une possible représentation du domaine de solutions d'un système d'inéquations pris 
du chapitre de Méthodes Numériques où nous étudions la "recherche opérationnelle". 


X1 +4x3 = 160 


Figure: 8.1 - Représentation graphique plane d'un système d'inéquations 


2. IDENTITÉS REMARQUABLES 


Les identités remarquables sont des sortes de relations magiques, qui nous servent le plus souvent pour 
la factorisation ou la résolution d'équations algébriques. 


Rappelons certaines notions qui ont déjà été vues dans le chapitre de théorie des ensembles de la 
section d'arithmétique (nous supposons le concept d'élément neutre connu puisque déjà défini): 


Commutativité: 


atbh=b+aeta'b=ba (830) 
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Associativité: 


at(b+c)=(a+tb)+c eta'(b'c)={(a'b)"e (8.31) 
Distributivité: 
a'(b+c)=a'b+a'c (8.32) 


Les mêmes observations sont valables avec l'opération de soustraction bien évidemment dans les 
domaines de définition adéquats. 


Nous pouvons vérifier avec des valeurs numériques (en remplaçant chaque nombre abstrait par un 
nombre choisi au hasard), ou par développement (ce serait mieux, ainsi vous êtes sûr d'avoir compris ce 
dont quoi nous parlions), que les identités algébriques suivantes sont vérifiées (ce sont les plus 
connues): 


1. Identité du second degré: 
(a+ Di = a +2ab+b? (8.33) 
2. Identité du troisième degré: 


(a +b)° = a +3a°b +3ab? +bŸ (8.34) 


Ne 2 2 . 
Remarque: Nous pouvons très bien poser que (a +(c+ d)} = (a + b} où nous avons bien 


évidemment posé que à =£+4 (nous faisons un "abstrait d'abstraction" ou plus couramment: un 
"changement de variable")...: 


(a+b+e) = a? +2a(b+c)+(b+c) = a? + +67 +2ab+2bc +Dac (8.25) 


Nous pouvons remarquer ainsi qu'en toute généralité, pour calculer le développement de {4 + 8)", nous 


utilisons le développement de {4 + h}"}, c'est-à-dire calculé avec la valeur précédente de n. 
Nous remarquons les propriétés suivantes pour a et b: 

P1. Les puissances de a décroissent de n à 0 (4° = 1, donc il n'est pas noté dans le dernier terme) 
P2. Les puissances de b croissent de 0 à n (3? = 1, donc il n'est pas noté dans le dernier terme) 
P3. Dans chaque terme, la somme des puissances de a et best égaleà n 


P4. Les coefficients multiplicateurs devant chaque terme se calculent en faisant la somme des 
coefficients multiplicateurs de deux termes du développement obtenu avec la valeur précédente de b 
(voir la figure ci-dessous). 


Les coefficients binomiaux peuvent alors être obtenus par construction du "triangle de Pascal" 
ci-dessous: 
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p=0 

F p=i 
n=0 + 1 À p=2 
n=l + 1 1 "i p=3 
n=2 + 1 2 1 A p=4 
n=3 + 1 3 3 1 Pi p=5 
n=4 1 4 6 4 1 AP p=é6 
n=5 + 1 5+ +10 10 5 1 Pi p=7 
n=6 + 1 6 15 20 15 6 1 eu 
n=7 &æ 1 7 21 35 35 21 7 1 


Figure: 8.2 - Construction à la main du triangle de Pascal 
Dont chaque élément est donné par (cf. chapitre de Probabilités): 


A 


pl(x-p)l 
avec #,peN,. 


Nous pouvons alors démontrer que: 


n 
(a+b) = 5 Cora" ?b?| (8.37) 
p=Ù 


ce qui constitue le fameux "binôme de Newton" (que nous réutiliserons à de multiples endroits sur le 
site) ou appelé aussi "théorème binomial". 


Démonstration: 


Cette relation se démontre simplement par récurrence en supposant la relation précédente vraie et en la 
calculant pour le rang 1 : 


(a+b} = a+b=Clalp +Clalbl=a+b (838) 


Montrons que si elle est vraie pour n alors elle est vraie pour n+1: 
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(a+b)"% = (a+b)(a+b)" = (a+b) 5 Cia" Ph? 
p=Ù 


n n 
DO PR Ca be. 
p=Ù p=0 


n n-l 
= Cat +5 Chat Pr + ST Chat Pt + CPE 
p=l p=0 


n ñn 
= Cart +5 Cart Ppr +5 Cr a" PDP +CRbP* (8.39) 


= Cat +2 (c +C' 


ma Jar Pb? + CrbPt 
p=l 


ñ 
= Cart " >: Ca +C'b7tl 
p=l 


n+l 
— >. Ce 
p=Ù 


La relation est vraie au rang n+1, elle est donc vraie pour tout n. 


OIC.Q.F.D. 


Pour ce qui est des identités remarquables avec des valeurs négatives, il est inutile d'apprendre par 
coeur l'emplacement du signe "-". Il suffit de faire un changement de variable et une fois le 
développement fait de refaire le changement de variable dans l'autre sens. 


Exemple: 
(a - bÿ = (a +c} = +2act+te = a + 2a(-b)+ (-bÿ 
SG (8.40) 
= a? -2ab+(-b}(-b) = a? - 2ab + b? 
et ainsi de suite pour toute puissance n. 
Nous pouvons bien sûr mélanger les genres tels que (fameux exemple particulier): 


(a+b)(a -b)=a(a-b)+b(a-b) =a?-b? (8.41) 


et quelques relations remarquables pratiques supplémentaires qui sont souvent utilisées dans les petites 
classes pour les exercices: 


a +h5=(a+b}(a? -ab+b?) 

a -b = (a-bj(a? +ab+b?) 
(x+a)(x+b) = x? +(a+bix+ab (8.42) 
(x+a)(x-b}= x? +(a-b)x-ab 
(x-a){x-b}= x? - (a +b)x +ab 
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et autre cas très fréquent: 


(ax +b)(ex + d) = acx? +(ad +bc)x+bd (8.43) 


Remarque: Lorsqu'à partir du terme de droite (sous forme numérique simplifiée) le professeur 
demande à ses élèves en tant qu'exercice d'obtenir la factorisation à gauche de l'égalité, il n'existe 
pas d'autres moyens que de procéder par essais successifs. 


Bien sûr, il y a encore un beaucoup plus grand nombre de relations utiles (dont une partie découle d'une 
généralisation de celles présentées ci-dessus) que le lecteur découvrira par ses propres raisonnements et 
en fonction de sa pratique. 


Remarque: Il est bien sûr possible de multiplier des polynômes entre eux et de distribuer les termes 
multiplicatifs. Inversement, il est souvent demandé aux élèves des petites classes de faire la 
procédure inverse ("factoriser" ou "décomposer" un polynôme) afin qu'ils s'habituent à la 
manipulation des identités remarquables. Décomposer en un produit de facteurs est une opération 
importante en mathématiques, puisqu'il est ainsi possible de réduire l'étude d'expressions 
compliquées à l'étude de plusieurs expressions plus simples. 


3. POLYNÔMES 


Définition (simpliste): Nous appelons "polynôme algébrique P(x)" une fonction de degré x» e N qui 
s'écrit: 


Er) =a,r +a, 87 +..+ax +a| (8.44) 


ou de façon plus condensée par: 
« k 
BA) = dax (8.45) 
KD 


Remarques: 
R1. Le n en indice du P(Xx) est parfois omis car explicitement défini dans l'énoncé. 


R2. Le lecteur qui aura parcouru le chapitre de Théorie Des Ensembles, se rappellera certainement 
que l'ensemble des polynômes de degré n ou inférieurs forment une structure d'espace vectoriel! 


Définition (ensembliste): Soit k un anneau (cf. chapitre de Théorie Des Ensembles) et y e N°. 
"l'anneau des polynômes" en n indéterminées (ou variables) k[X ZX, ] est construit à partir d'un 


LR | | 


polynôme élémentaire, appelé "monôme" de la forme: 


Lt 27 (8,46) 


où À e & est le "coefficient du monôme", #1,...,»8, sont des entiers > 0 et où 47 ..Æ% forme la 
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"partie littérale du monôme", Ainsi, par construction, un polynôme est une somme d'un nombre fini de 
monômes appelés alors "termes du polynôme". 


Ainsi, le cas particulier commun utilisé dans les petites classes et présenté au début est k[X], c'est-à-dire 
l'anneau des polynômes à une variable à coefficients dans k. Tout élément de k[X] s'écrit donc: 


n 
> ax (8.47) 
= 

avec a;eki=0.retreN. 


Remarques: 
R1. Notez bien que les puissances sont toujours positives (ou nulles) dans k[X] !!! 


R2. Nous disons que deux monômes sont semblables s'ils ont la même partie littérale. 


Définition: Nous nommons "racine" ou "zéro de polynôme", la ou les valeurs x telles que "l'équation 
polynomiale" P(x) = 0 soit satisfaite à la condition qu'au moins un des 4, avec # > Q soit non nul. 


Si le polynôme admet une ou plusieurs racines >, nous pouvons alors factoriser ce dernier sous la forme 


(nous le démontrerons rigoureusement de manière générale plus loin): 
P(D=(x-n) G-n3) ."(x-n)'(x-n) (849 


afin que quand x prend la valeur d'une des racines, l'expression ci-dessus soit nulle. C'est ce que nous 
appelons par convention "factoriser un polynôme”. 


Les identités algébriques sont des formes particulières de fonctions polynomiales. Considérons une 
constante c et une variable x et: 


x 
# x _K #-k # _Ù # x 1 #1 x _x-l 1 x x 
CE à > Cie ER mGDE A HÉSE E E G x +CSe (64) 
ki 


Nous voyons que si nous posons: 
Cic° =4,, Ce =, ce =œ,Cic" =@ (8.50) 
nous retrouvons: 
(c+x) = ax +a il +..+ax +a (8.51) 


Définition: Le "coefficient dominant" d'un polynôme est le coefficient de son monôme de plus haut 
degré. 
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3.1. DIVISION EUCLIDIENNE DES POLYNÔMES 


Plaçons nous à présent dans l'anneau k[X]. Si PA) € &[XZ], nous notons deg(P) le degré du polynôme 
P(X) à coefficients dans un anneau k (les réels ou les complexes... peu importe!) 


Remarque: Par convention, deg{0) = -co 
Soit: 


& m 
u(X)=YuX, MX)= >vX EX] (8.52) 
10 = 


avec 77 > 0. 
Alors il existe deux polynômes uniques 4(Æ41,r(A1) € &[ÆZ1] tels que: 
deg(r) < deg{v)=me (8.53) 
et: 
u(A) = g(A)-v(A) +r(4) (8.54) 
Démonstration: 


Si u(X) = 0 le résultat est évident. Supposons que 4(4 # 0 et montrons l'existence par récurrence sur 
le degré k de u(X). 


Si k = 0 alors q(X) = 0 (puisque »»# > 0 ) et donc r(X) = u(X) fait l'affaire. 
Supposons l'affirmation vraie pour tout £< } : 
Soit u(X) de degré #& = »# +1. Si »»2 > » +1 alors q(X) = 0 et r(X) = u(X) font l'affaire. 


Sinon, si 2 < »# +1 alors en écrivant: 


u(X) et grHem ZT) (G.55) 


Vrr 


nous réduisons u(X) à un polynôme de degré < # puisque v(X) est de degré m (et qu'il existe)! 


Effectivement, le terme: 


ntgntim, VX) (8.56) 


mn 
élimine (au moins) le terme de plus grand degré z;,, X"* 


Par hypothèse de récurrence, il existe f(X),9(X) tels que: 
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n(X)— Gr CR) = FX) VCD) + g(X) (8:57) 


Vyr 


avec deg{g) <#. Donc: 
u(X)= ET T)) VD +8 (850) 


et: 


gt) = gere [CD , r(X)= g(X) (8:59) 


font l'affaire. 


Donc par récurrence nous observons que la division euclidienne existe dans l'anneau des polynômes 
k[X]. 


OIC.Q.F.D. 


Remarque: Cette démonstration nous a permis dans le chapitre de théorie des ensembles de montrer 
que cet anneau est "principal". 


3.2. THÉORÈME DE FACTORISATION DES POLYNÔMES 


Nous allons maintenant démontrer une propriété importante qui est au fait à l'origine illustrée (entre 
autres) par les identités remarquables que nous avons vues plus haut: 


Si une fonction polynôme P(X\ € &[ X] à coefficients dans k de degré # > 1 a une racine x =7 dans 
l'anneau k, alors nous pouvons factoriser P(x) par (x - r) tel que: 


P(x)=(x-r)Q(x) (8.60) 
où Q est une fonction polynôme de degré n-1 (et peut donc être dans certains cas un simple monôme). 


Autrement dit, "factoriser un polynôme", c'est l'écrire sous la forme d'un produit de polynômes. La 
factorisation est donc une opération qui transforme une somme en un produit. 


Démonstration: 


L'idée consiste à effectuer la division euclidienne de P par (x-r). D'après le théorème précédent, il 
existerait un couple (Q, R) de polynômes tels que: 


P(x)=(x-r)O+R (8.61) 
et selon le résultat obtenu du théorème précédent sur la division euclidienne: 


deg(AÀ) < deg(x-r) (8.62) 
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Or, degfx-—r) =1, donc deg(Ài= 0 (ou —-c par convention). R est donc une fonction polynôme 


constante. Par ailleurs, par hypothèse, r est une racine de P. Nous avons donc: 
O= P(r)=(r-r)O(r)+R(r) (8.63) 


Donc Æfr) = 0. Donc R est la fonction polynôme nulle et le théorème est pratiquement démontré. Il 
reste encore à prouver que deg{@) = #—1, ce qui est une conséquence immédiate de la relation: 


deg(P\} = degix-r)+deg{Q) (8.64) 
D'où: 
n=l+deg(O) (8.65) 


OIC.Q.F.D. 


De cette propriété de factoriser un polynôme vue précédemment, appelée "théorème de factorisation", 
nous pouvons donner un avant-goût d'un théorème beaucoup plus important: 


Montrons que si nous avons une fonction polynôme F(X) € &[ 1] de degré » e N à coefficients dans 


k, alors elle possède au plus un nombre fini n de racines (certaines étant éventuellement confondues) 
dans k. 


Démonstration: 


D'abord, puisque P a un degré, P n'est pas la fonction polynôme nulle. Ensuite, raisonnons par 
l'absurde: 


Si la fonction P possède p racines avec 2 > *#, en notant ñ 7) CES racines, NOUS aVONS, d'après le 


théorème de factorisation précédent (appliqué p fois): 
P( = (x-n)(x-2).(x-r,)00) (8.66) 
où Q est donc une fonction polynôme de degré: 
n—p<0 (8.67) 


Or, comme par définition un polynôme en est un si seulement son degré appartient à N , le polynôme Q 
doit donc être le polynôme nul tel que: 


O(x)=0 (8.68) 
Il s'ensuit que: 
P(x) =0 (8.69) 
ce qui contredit l'hypothèse initiale comme quoi P n'est la fonction polynôme nulle d'où: 


P£<A (8.70) 
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OIC.Q.F.D. 


3.3. ÉQUATIONS DIOPHANTIENNES 


Si nous généralisons le concept de polynôme avec plusieurs variables tel que: 
P=P(x,y,z) (8.71) 

nous appelons alors "équation diophantienne" une équation de la forme: 
P(x,y,z) = 0 (8.72) 


où P est un polynôme à coefficients entiers (ou rationnels) dont nous cherchons les radicaux 
strictement dans j ou Q. Des exemples classiques d'équations diophantiennes sont: 


- Les triplets pythagoriciens (ou triades) tel que: 
a +b1=6c (8.73) 


- Le grand théorème de Fermat dont la conjecture dit que si n est supérieur à 2, il n'existe pas d'entiers 
X,ÿ,Z non nuls pour lesquels: 


x" + y* = 7" (8.74) 


Pour la démonstration il faudra attendre un peu que les auteurs du site aient le temps de la comprendre 
également (...). 


3.4, POLYNÔMES DE DEGRÉ 1 


Soit: 
b 
P(x) =axth=alx+—| (875) 
a 
Si 4 # Q alors le polynôme admet une unique racine simple: 
b 
r=—— (8.76) 
a 


tel que P(r) = 0. 
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Remarques: 


R1. Il faut toujours prendre l'habitude de vérifier l'existence de la solution dans l'équation d'origine 
pour s'assurer de la validation du domaine de définition de la solution. Effectivement, il existe des 
solutions aux développements de résolution d'une équation qui ne vérifient pas l'équation d'origine 
et c'est ce que nous nommons des "solutions étrangères" ou encore "racines étrangères". 


R2. Si les coefficients du polynôme de degré 1 sont tous réels alors la racine est réelle. 
R3. Si un des coefficients est complexe alors la racine est nécessairement complexe. 
R4. Si les deux coefficients sont complexes, alors la racine est soit complexe soit réelle. 


R5. Nous disons que deux équations sont équivalentes si elles admettent le même ensemble de 
solutions. 


Voici quelques propriétés que nous considérons comme triviales et que nous admettrons donc sans 
démonstrations: 


P1. Si nous ajoutons (ou si nous retranchons) un même nombre à chaque membre d'une équation, nous 
obtenons une équation qui a les mêmes solutions que l'équation dont nous sommes partis (et ce quel que 
soit son degré!). 


P2. Si nous multiplions (ou si nous divisons) chaque membre d'une équation par un même nombre non 
nul, nous obtenons une équation qui a les mêmes solutions que l'équation dont nous sommes partis (et 
ce quel que soit son degré!). 


3.5. POLYNÔMES DE DEGRÉ 2 


Soit le polynôme à coefficients réels (trinôme du second degré): 


BY #& 
P{ x) = ax +bxte=al| x+— —#— 
24 da 
Si nous représentons ce polynôme graphiquement sur la plan réel, cela donne: 


a >Û0Û a <Û 


parabole parabole 


souriante triste 


Figure: 8.3 - Représsentation des polynômes en fonction du signe du terme de degré 2 
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Si nous dérivons cette fonction (cf. chapitre de Calcul Différentiel et Intégral) et cherchons en quel 
point la tangente s'annule, nous la trouvons toujours sur le point d'inflexion de la parabole (qui 
correspond aussi à son axie de symétrie): 


axe de symétrie 


Figure: 8.4 - Point d'inflexion de la tangente 


Si 4 # 0 alors nous avons: 


| = ——— x+ 
24 4a? 24 24 24 


2 2 — 2. . 2 _ 
| b b* —-4ac LR b° — 4ac _ b + fo 4ac (8.78) 


Nous avons alors une "racine double" (ou "racine de multiplicité 2") que nous notons: 


_-b+4/b? -4ac (8.79) 


24 


Aa 


tel que F{r) = 0 et où nous définissons un nouveau terme appelé "déterminant du polynôme" ou 
"discriminant" qui allège souvent les écritures: 


À =b?-4ac| (8.80) 


Remarque: Il faut aussi toujours prendre l'habitude de vérifier l'existence de la solution dans 
l'équation d'origine pour s'assurer de la validation du domaine de définition de la solution au cas où 
la solution serait "étrangère". 


Si le polynôme du deuxième degré en x comporte deux racines, nous pouvons alors factoriser de 
manière irréductible (selon le théorème fondamental de factorisation des polynômes vu plus haut) de la 
manière suivante: 


P(x)=a(x-n)(x-") (8.81) 
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Nous démontrons, à partir de l'expression des racines, sans trop de peine les relations dites "relations de 
Viète": 


__ | : 
ntA=-—-eétrn'A =— (8.82) 
a a 


Avec le signe de a et celui du discriminant À nous avons: 


a >0 a <0 
À > 0 
h >0 
a >Û0Û a <Ù 
hä =0 
h =0 
a >0 a <0 


Figure: 8.5 - Caractéristique graphiques en fonction de la valeur du discriminant 
Donc: 


- Si A < 0 le polynôme n'admet pas de zéros réels et ne se décompose pas en un produit de facteurs 
réels du premier degré mais de facteurs complexes. Ainsi (il est nécessaire d'avoir lu la partie traitant 
des nombres complexes dans le chapitre des Nombres de la section d'Arithmétique du site): 


ON R n0 10. 


is 24 24 24 


et nous savons que nous pouvons écrire tout nombre complexe sous une forme condensée (formule 
d'Euler) et comme les racines complexes d'un polynôme du second degré sont conjuguées (nous 
connaissons ce terme) nous avons: 


- potilo+2kz) , 
fa re (8.84) 


où (rappel) r est le module des racines complexes (module égal pour les deux racines) et l'argument 
des racines complexes (égales en valeur absolue). 


- Si À = 0 alors le polynôme possède une seule solution qui est bien évidemment: 
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Pa = : (8.85) 
12 2 


- Si À » 0 alors le polynôme possède deux solutions définies par les relations générales que nous avons 
déjà données précédemment. 


En ce qui concerne le cas complexe, prenons comme exemple le polynôme suivant du second degré: 
x2+1=0 (8.86) 


qui admet donc uniquement deux racines complexes qui sont i et -i. Dans le plan réel ce polynôme sera 
représenté avec Maple par: 


>plot(x12+1,x=-5..5); 


-2 -1 (a) 1 2 
x 


Figure: 8.6 - Exemple de tracé d'un polynôme de degré 2 qui admet que des solutions complexes 


où nous voyons bien qu'il n'y a aucune solution (zéros) réelle. Alors qu'en nous plaçant dans les 
complexes, nous avons: 


>plot3d(abs(-(re+[*im)2+1),re=-2..2,im=-2..2,view=[-2..2,-2..2,-2..2],orientation= 
[-130,70],contours-50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=-10000); 
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Figure: 8.7 - Le même polynômes mais en jouant avec la représentation 


où les deux zéros sont bien visibles sur l'axe imaginaire en -1 et +1. Evidemment quand c'est la 
première fois que l'on voit une fonction représentée sur une figure en prenant en compte les valeurs 
complexes on essaie d'y retrouver la parabole correspondante au cas purement réel. Pour cela, il suffit 
de couper la surface ci-dessus en deux sur l'axe imaginaire et nous avons alors: 


>plot3d(abs((re+1*im)\2+1),re=-2..2,im-0..2,view-=[-2..2,-2..2,0..2],orientation= 
[-130,70],contours-50,style-PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=-10000); 
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Figure: 8.8 - Un petit zoom toujours sur le même polynôme 


où nous retrouvons notre parabole bien visible sur la coupe de la surface. Ainsi, nous pouvons nous 
demander si les valeurs complexes ne sont pas une extension naturelle de notre espace conventionnel 
échappant à notre sens physique commun et nos appareils de mesures. 


Evidemment de ce qui a été vu jusqu'à maintenant nous en tirons que si un polynôme admet une ou 
plusieurs racines alors ce même polynôme est divisible par (x-7,). 


3.5.1. NOMBRE D'OR 


Il existe un polynôme de degré deux dont la solution est fameuse de par le monde. Ce nombre est 
appelé la "divine proportion" ou "nombre d'or" et se retrouve en architecture, esthétique ou encore en 
phyllotaxie (c'est-à-dire dans la disposition des feuilles autour de la tige des plantes). 


Ce nombre vaut: 


1+:/5 
ÿ =1.61803399 (5-87) 
2 
et appartient à l'ensemble des nombres irrationnels car il ne peut pas s'écrire sous forme de fraction 
entière, mais c'est un nombre algébrique puisqu'il est la solution positive de l'équation: 
x? -x-1=0 (8.88) 


3.6. POLYNÔMES DE DEGRÉ 3 


Bien que rare à résoudre en physique théorique ou lors de ses études, la résolution d'un polynôme du 
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3% degré est assez récréative et montre un bon exemple d'un raisonnement mathématique déjà mature 
(nous devons ces développements à Scipione del Ferro et Jérome Cardan mathématiciens du 16ème 
siècle….). 


Soit l'équation: 
ax +bx°? +ex+d=0 (8.89) 


avec les coefficients tous dans IR (pour commencer...). Dans un premier temps, le lecteur pourra voir 
que les raisonnements que nous avons appliqués pour les polynômes de degrés inférieurs coincent 
rapidement (excepté pour des cas particuliers simplistes bien sûr...). 


Nous allons contourner le problème par des changements de variables subtils mais tout à fait justifiés. 


Ainsi, rien ne nous empêche de poser que: 


1X = _ (8.90) 
34 


et qu'en divisant le polynôme de degré 3 par a d'écrire: 


p+r+frete =0 
4) “(e- à] 1 A (8.91) 
(r- D +4 su !| Le 2x ++ Le +20 


En regroupant les termes de même ordre: 
X3 + y +2 à 2 __ ={( 
a? 5 3 a 
(8.92) 


re +x[s- ERE = “il 


et posons (rien, mais alors absolument rien ne nous l'interdit): 


b 
Dx=X-— 
(1) x _» 
b? 
(AT ST (8.93) 
2b° ch à 
= _— + — 
Da Ve” 0e 


où (1) est connu si et seulement si X est connu et où p, q sont de toute façon connus. 


Le polynôme: 
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P=X°+pX+g (894) 


étant de degré impair, il admet- comme permet de le constater tout tracé visuel d'un tel polynôme à 
coefficients réels - au moins une racine réelle, appelée "racine certaine" (vérifiez! Vous verrez bien par 
une représentation graphique d'un polynôme de degré impair que cela est trivial). 


Maintenant, nous faisons un autre changement de variable (nous en avons tout à fait le droit) subtil: 
X=u+y (8.95) 


en imposant la condition que u,v doivent être tels que %uv = -p (rien ne nous empêche d'imposer une 
telle contrainte) et nous avons alors: 


P=XŸ+pX+g={(u+v) -Zuv(u +v) +q =0 | 
 . (8.96) 


Dès lors nous avons: 
Qu +0 = -g 


ce — -7° 3 (8.97) 
BV = — S Suv = — 
27 F 


Nous pouvons très bien faire une analogie entre les deux relations (1°) et (2) et les relations de Viète 
que nous avions obtenues pour le polynôme de degré 2 qui rappelons-le étaient: 


__ à - | 
ntA=-— et ñn'rn"— (8.98) 
d da 


à la différence que nous avons maintenant (nous adoptons une autre notation pour ces racines 
intermédiaires): 


3 3 


Z,=u @tz;,=Y (8.95) 


ce qui nous donne pour le polynôme P en imposant (toujours par analogie) 4 = 1 une nouvelle 
équation: 


3 
Z?+9Z-2_=0 (8100) 
Dh 
dont z,,z, sont les racines. 
Cette dernière équation a pour discriminant: 


3 
A=@ + 42 (8101) 
27 


Prenons maintenant le cas par cas: 


- Si À > 0, l'équation en Z admet deux solutions z,,z, dont la somme va nous donner indirectement la 
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valeur de X puisque par définition X = 4 +v et z, = u° et = v°. Nous voyons que nous avons tous 


les ingrédients pour trouver la première racine de l'équation initiale qui sera la racine certaine (ou "zéro 
certain"). Ainsi: 


2 3 2 3 
= =: rs q E P q É P 2 
outil Na nes nn on a (8.102) 


comme / > 0 et que les racines supérieures sont cubiques nous avons nécessairement À, € IR si tous 
les coefficients de l'équation originale sont bien dans IR. 


- Si A =0, nous le savons, l'équation en Z admet une racine double et puisque le discriminant comporte 
une puissance carrée de q cela signifie nécessairement que p est négatif. 


Le polynôme P admet donc lui aussi une racine double et de même pour l'équation d'origine. Nous 
avons vu par ailleurs que pour un polynôme du second degré si le discriminant est nul les racines sont: 


b 
——— (8.103) 
24 


alors par analogie: 


= X,=utv=ifz +3, =23, 2 fe (8.104) 


- Si A < Q nous devons à nouveau utiliser les nombres complexes comme nous l'avons fait lors de notre 
étude du polynôme de degré 2. Ainsi, nous savons que l'équation en Z admet deux solutions complexes 
telles que: 


et à nouveau comme les racines sont conjuguées nous pouvons écrire sous la forme condensée: 


22 =re #2) (8.106) 


et comme: 


X =u+y = z + äfz, (8.107) 


nous avons donc: 


ito+28x) _ilw+2ks) 


FA =u, +v =u + = 31. Siv+2ks) + 3/5 lo 2ks) mis + + fre 3 (8.108) 


Comme %,,v, Sont conjugués, nous avons nécessairement X, € R. 
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3.7. POLYNÔMES DE DEGRÉ 4 


L'équation polynomiale à résoudre ici est: 
ax +bx +cx +dx+e=0 (8.109) 


avec 4x £ÛÜ. 


Remarque: Nous devons cette méthode de résolution à l'italien Ludovico Ferrari mathématicien 
italien du 16ème siècle également. 


Quitte à diviser par a nous avons: 
x +b'x +c'x? +d'x+e'=0 (8.110) 


Puis, en posant: 


l'équation se réduit: 


CHOSE 


4 42 3 4 4 42 | 4 
1 à Ll 
il 2 ë" b { 3 
+c —2y—+—|+d'|y-—|+e (8.112) 
Ë 74 æ | “ 4 
4 3 3.2 3 2 2 3 13 ls 1 13 ' 
=» +(b-bN y +1-2b +c+-b += —- -ch-—b +4 
y +(-b)y | 4° "8 }» É 27 16 }» 
4 
CP np las 
256 À 64 16 


où nous voyons que le coefficient devant Y° s'annule. Ainsi, tout polynôme du type: 


P(D = x" +bx +cx +dxte (8.113) 
peut être écrit sous la forme suivante: 
> +c"y +d"y+e"= 0 (8.114) 


En posant: 
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(8.115) 
14 
[5 Li née 


Remarque: Si 4"= 0, l'équation à résoudre est en réalité une "équation bicarrée". Le changement 
de variable X = y? permet alors de se ramener à une équation polynomiale du deuxième degré (ce 


que nous savons facilement résoudre). 


Nous introduisons maintenant un paramètre t (que nous choisirons judicieusement par la suite) et nous 
réécrivons l'équation polynomiale sous la forme suivante: 


(x + - [C2 ec) x? - dx+( -é)|- O (8.116) 


Remarque: Si le lecteur développe et distribue tous les termes de la relation précédente il retombera 
bien évidemment sur 3444524 42" 0. 


L'idée sous-jacente est d'essayer de faire en sorte que la partie entre crochets de l'expression 
précédente puisse s'écrire comme un carré tel que: 


(2 —c") x? - d+( -e) =({x-4YŸ (8117) 
Car dans ce cas, en utilisant: 
ab =(a+b){a-b) (8.118) 
Notre équation polynomiale peut alors s'écrire: 
(x +) _(x-1ÿ = ((2 +4) +(x- 2)) (x +4)-(x- 1) =0 (8.119) 


et nous n'aurions plus qu'à résoudre deux équations polynomiales du deuxième degré (ce que nous 
savons déjà faire). 


Or, pour que nous puissions écrire: 
(ac) -dx+(2-6)=(x- 2) (8.120) 


il faudrait que l'expression du deuxième degré à gauche de l'égalité n'ait qu'une seule racine. Or, nous 
avons vu dans notre étude des équations polynomiales du deuxième degré que cela signifiait dès lors 
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que le déterminant est nul: 


A=b?-4gc=0 (8121) 


et que la racine s'exprimait par: 


Ce qui correspond dans notre cas: 
A=d"-4(%-cyf# -æ")=0 (8.123) 
et donc que: 
AÇ2t Ye? — e')= d' (8.124) 
avec: 


ea) __dà 
2(2t-d) At-2c 


(8.125) 


Donc finalement, si t est tel que 4(24 y? — g'}= d'?, alors nous avons: 


(4-0) x - dk +(# €) =(2%-c)(x-4)(x2-4)= (2-0 (x . — (8.126) 


puisque le théorème fondamental des polynômes nous donne pour un polynôme du deuxième degré 
n'ayant qu'une seule racine: 


PC = ax +bx+e = a(x- nx-")=a(x-"x ÿ (8.127) 
Pour conclure, il suffit de voir que trouver un nombre t vérifiant la relation: 
A(26—cy(E2 —e}= d'? (8.128) 
est un problème de degré 3 que nous savons déjà résoudre par la méthode de Cardan. 


De telles méthodes générales n'existent plus pour les degrés égaux ou supérieurs à 5 comme nous le 
verrons à l'aide de la théorie de Galois (cf. chapitre d'Algèbre Ensembliste), 


3.8. POLYNÔMES TRIGONOMÉTRIQUES 


Définition: Nous appelons "polynôme trigonométrique" de degré N toute somme finie: 


N 
Sn(O= > ce"? (8.129) 
n=-ù 


où c, € €. 
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Un polynôme trigonométrique peut aussi être écrit en utilisant les fonctions trigonométriques usuelles 
grâce aux transformations suivantes: 


N N 
Sn(9 = +2 ce" +5 ce" (8.130) 


n=l n=l 


Soit en utilisant la formule d'Euler (cf. chapitre sur les Nombres): 


NN 1 
SO) = co +2 ec, (cos(x8) +i sin(n8))+5 ec, (cos(n8)—-isin(x#)) (8.131) 
n=l 


n=l 


Ce que nous pouvons réécrire aussi sous la forme: 
N N 
SO =co+> (cu t+e,)cos(n8) +5 i(c, -c_,)sin(xé) (8.132) 
=l n=l 


En posant alors: 
ap = 2 Au =Cnton b=ilcy-Cn) (8133) 


Il vient: 
ds N 
Sy (8) = 7 +5 a, cos(n8) +5 b,sin(x8) (8.134) 
= n=l 


Nous verrons longuement dans le chapitre des Suites Et Séries comment utiliser ces polynômes dans le 
cadre de l'étude des séries de Fourier. 


3.9. POLYNÔMES CYCLOTOMIQUES 


Si n est un entier naturel, nous appelons "polynôme cyclotomique" ce que nous notons 
traditionnellement ®, et que définissons comme étant le produit de tous les monômes (x — &) où & 


est une racine primitive n-ème de l'unité de €. 


Pour rappel une racine n-ème de l'unité (parfois appelée "nombre de De Moivre") est un nombre 
complexe dont la puissance n-ème vaut 1. 


Ainsi, l'ensemble des racines n-èmes de l'unité est l'ensemble: 
G, ={xeCtelquex" =1} (8.135) 


qui est un groupe cyclique (voir la Théorie Des Ensembles dans la section d'arithmétique du site et le 
chapitre d'Algèbre Ensembliste dans la présente section). 


EQLI 


Nous appelons alors "racine primitive n-ème de l'unité" ou "R.P.N." tout élément de ce groupe 
l'engendrant. 


Les éléments de G, sont donc du type: 
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Dikz A 
Le (8.136) 


avec ÿe #. Nous écrivons alors l'ensemble des G, sous la forme: 
dikz 
ee * avecke{0.x | (8.137) 


Un petit exemple de polynôme cyclotomique: 
Diini=ir ex tir IE Fe x* -1 (8.138) 


avec: 
Gy=de + =le + =i,e + =-le * =-j} (8.139) 


qui sont donc les racines quatrièmes de l'unité (autrement dit chacun de ces nombres mis à la puissance 
4 donne 1). Elles forment le groupe G, et celui-ci ne peut-être engendré que par i et -i (générateur du 


groupe selon ce qui a été vu dans le chapitre de Théorie des Ensembles). 


Donc un polynôme cyclotomique est le produit de facteurs qui s'écrit: 


Zik 
D, (2) [Ib . | (8.140) 


avec & € {0..# -1} et k étant premier par rapport à n. 


Les polynômes ont un grand nombre de propriétés que nous n'aborderons pas ici puisque ce site ne se 
veut pas être un ouvrage de mathématiques supérieures. 


3.10. POLYNÔMES DE LEGENDRE 


Définition: les polynômes de Legendre sont définis par (lire de préférence les chapitres de calcul 
différentiel et intégral ainsi que d'analyse fonctionnelle avant): 


ÉD de. 
P(x) en nl }* (8.141) 


où À, est donc un polynôme de degré n. Nous retrouverons ces polynômes dans la résolution 
d'équations différentielles en physique (propagation de la chaleur, physique quantique, chimie 
quantique, etc.). 


Démontrons que selon la définition du produit scalaire fonctionnel (cf. chapitre d'Analyse Fonctionnelle 
et de Calcul Vectoriel) les polynômes de Legendre sont orthogonaux. 


Démonstration: 
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Soit P un polynôme de degré < »- 1. Il suffit de montrer que {P,|P}= 0, c'est-à-dire que P, est 
orthogonal à l'espace des polynômes de degré inférieur à n. Nous avons en effet: 


a 


il 4” 


{P,|P}= [ÉONCERS _(1- YP(x)dx (8.142) 


en intégrant par parties nous obtenons: 


1 1 4” 


at D" d"1 à. Lo œ 
{P,|P\= . (x É) AE TE P ee nn TS PGDdx 
+ (8.143) 


TE [- 1: SPC dx 


Attention pour le terme nul ci-dessus, seulement le terme {1 — x ÿ* y est dérivé. Donc puisque x est au 
carré, quelque soit la dérivée la valeur sera toujours la même. Ce qui justifie que le terme soit nul. 


En continuant de la sorte nous obtenons après n intégrations par parties: 


(ÆlP}= (- DE fa-s D POdx = D 


=“ 
OIC.Q.FD. 
Remarque: Le terme dérivé est nul puisque le polynôme dérivé est de degré n-1 


Voici quelques propriétés utiles en chimie quantique des polynômes de Legendre: 
PI. Etbel 


Démonstration: 


De in ll a : 
PDC no CD dés") 6145 
Re ne el 00e 


et par la formule de Leibniz (cf. chapitre de Calcul Différentiel Et Intégral) nous avons: 


EL, 
al 2e > 5 = — 


(+ x): = (= 2) (8.146) 


d'où: 


HO 2*:(-D''#l=1 (8.147) 
ab2 
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OIC.Q.FD. 
P2. P(x) = 2-2) sin est pair: 
Démonstration: 
Si nest pair, cs {1- x?}" est une fonction paire et donc: 
Be LR) 40 
est paire. 
OIC.Q.FD. 
P3. P(-x) = -P,(x) sin est impair. 
Démonstration: 
Si n est impair, hs {1- x*)" est impaire et donc: 
E(x) = D -xÿ* (8.149) 
est impaire. 
OC.Q.FD. 


Nous allons à présent démontrer la validité de la relation de récurrence suivante pour les À, (relations 
que nous utiliserons en physique): 


(RUES IR = AE Ur SAP SR) (8.150) 
pour #m>1. 
Démonstration: 


x, est un polynôme de degré » +1, il existe dès lors des 4, € R tel que ce polynôme peut s'exprimer 


comme combinaison linéaire de la famille de polynômes constituant la base orthonormale (base qui 
permet donc d'engendrer xr, ): 


n+l 


xP (re Jo (8.151) 
3? 


nous pouvons dès lors écrire: 
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ak) Sa, Ra. lRÉ @152 


mais nous choisissons & < #- 2 (parce que xÆ est dès lors de degré » - 1): 
1 
(ele fre (x)R (dx =(P,|xP.}=0 (8.153) 
= 


Donc à. |Æ f =0 c'est-à-dire que nous devons avoir 4, = 0. Par suite: 


Xe © GntlËns] * GnËn * Ann (8.154) 


Par les propriétés des polynômes de Legendre vues précédemment, nous pouvons écrire les égalités: 


a (tira: le 6a +6" (6.156) 
et: 

2PR = led 4 Pa (6.156) 
d'où: 


a =0Uetl= jte (8157) 


Le coefficient dominant de À, est défini (rappelons-le) par le coefficient du monôme du plus grand 


degré. Ainsi, il est donné par: 


E.(x) (ra). = P,(x) = ED 4° ,2n 


212" 2x" 12" dx” 
1? nl 17 n—n 
6 — = (eu) TE — (22 Gr 0.22") 
-T (22(2» - 1)... (2n—(n- Dr )= —  (2"(» - 1). CRISE AE n 
Donc: 
2») 
dom (BR) (8.159) 


Remarque: Le lecteur vérifiera au besoin pour un n donné que: 


2n(2n- 1.041) = ED (8.160) 
A ! 


(8.158) 
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La relation: 


Xe © GnnËne * Ann * GE (8.161) 


que nous avons obtenu ci-dessus nous impose que le coefficient dominant du polynôme de la 
combinaison linéaire soit égal au coefficient dominant du polynôme x£, (nous avons éliminé le {-T)* 


qui se simplifie): 
: (2x) (2x + 2)l | 
Ag EN pes (10 
après simplification, nous obtenons: 


nt (13227 (2n +2)1  (2» +1) (22429 2n +1 


et ce qui donne finalement facilement: 


# 
nu = ——— 8.164 
RTE 


La relation: 
Xe © GnnËne * Ann + GnEns (8.165) 
devient dès lors: 
(22 +DxP =(n+DPut2P (8.166) 
OC.Q.FD. 
Voici les six premiers polynômes de Legendre: 


B=1R=x,2 = 3/2x -1/2,R =5/2x% -3/2x, P =3518x -15/4r +3/8,... (8.167) 
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Notes personnelles: 
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9, ALGÉBRE (ET GÉOMÉTRIE) ENSEMBLISTE 


Nix allons aborder sur ce site l'étude des structures ensemblistes de manière très pragmatique 


(puisque rappelons que ce site est dédié aux ingénieurs). Ainsi, il sera fait usage du minimum de 
formalisme et seulement les démonstrations des éléments que nous considérons comme absolument 
essentiels à l'ingénieur seront présentées. Par ailleurs, de nombreuses démonstrations seront faites par 
l'exemple et nous nous focaliserons en grande partie sur la théorie algébrique des groupes car elle a une 
place presque prédominante en physique plus que pour les autres structures ensemblistes. 


1. ALGÉBRE ET GÉOMÉTRIE CORPORELLE 


Les symétries des figures géométriques, des cristaux et de tous les autres objets de la physique 
macroscopique font l'objet depuis des siècles d'observations et d'études. En termes modernes, les 
symétries d'un objet donné forment un groupe. 


Depuis le milieu du 19ème siècle, la théorie des groupes a pris une extension énorme, et ses 
applications à la mécanique quantique et à la théorie des particules élémentaires se sont développées 
tout au long du 20ème siècle. 


Dans une lettre de 1877 au mathématicien Adolph Mayer, Sophus Lie écrit qu'il a créé la théorie des 
groupes en janvier 1873. Il s'agit bien sûr des groupes qu'il appelait "groupes continus" et qui sont 
appelés aujourd'hui "groupes de Lie". Lie cherchait à étendre l'usage des groupes du domaine des 
équations algébriques, où Galois les avait introduites, à celui des équations différentielles. 


Dès 1871, la notion de générateur infinitésimal d'un groupe à un paramètre de transformations était 
apparue dans son oeuvre. C'est l'ensemble des générateurs infinitésimaux des sous-groupes à un 
paramètre d'un groupe continu qui forme ce que nous appelons aujourd'hui une algèbre de Lie. 


Ce furent Wigner et Weyl qui montrèrent le rôle prééminent de la théorie des groupes, et de leurs 
représentations en particulier, dans la nouvelle mécanique quantique que développaient Heisenberg et 
Dirac. L'idée générale de la théorie des représentations est d'essayer d'étudier un groupe en le faisant 
agir sur un espace vectoriel de manière linéaire : nous essayons ainsi de voir le groupe comme un 
groupe de matrices (d'où le terme représentation"). Nous pouvons ainsi, à partir des propriétés 
relativement bien connues du groupe des automorphismes de l'espace vectoriel (cf. chapitre de Théorie 
des Ensembles), arriver à déduire quelques propriétés du groupe qui nous intéresse. 


Nous pouvons considérer la théorie des représentations de groupes comme une vaste généralisation de 
l'analyse de Fourier. Son développement est continu et elle a, depuis le milieu du 20ème siècle, des 
applications innombrables en géométrie différentielle, en théorie ergodique, en théorie des probabilités, 
en théorie des nombres, dans la théorie des formes automorphes, dans celle des systèmes dynamiques 
ainsi qu'en physique, chimie, biologie moléculaire et traitement du signal. À l'heure actuelle, des 
branches entières des mathématiques et de la physique en dépendent. 


Avant de commencer, nous renvoyons le lecteur au chapitre traitant de la Théorie Des Ensembles pour 
qu'il se rappelle de la structure et des propriétés fondamentales qui constituent le groupe et également 
au chapitre d'Algèbre Linéaire (car nous en utiliserons quelques résultats). 
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1.1: GROUPES CYCLIQUES 


Le groupe cyclique (dont la définition a déjà été vue dans le chapitre de Théorie des Ensembles) va 
nous servir de base dans le cadre de l'étude des groupes finis. Par ailleurs, plutôt que de faire des 
développements généralisés nous avons préféré prendre des exemples particuliers afin de présenter 
l'idée de groupe cyclique (approche plus adaptée à l'ingénieur). 


Nous allons donc prendre l'exemple fort sympathique des heures de la montre. avec trois approches 
différentes qui successivement (!) permettront d'aborder un groupe cyclique simple. 


- Première approche: 


Imaginons donc une horloge avec une aiguille qui peut prendre 12 positions possibles (mais pas de 
positions intermédiaires). Nous noterons de manière spéciale les 12 positions possibles: 0 T,2,.11 (le 


trait au-dessus des nombres n'est pas innocent!). 


Rien ne nous empêche sur l'ensemble de ces positions de définir une addition, par exemple: 


2+3=5,3+2=5,5+7=-0,9+5=2,1-8=5 


ce qui est similaire aux résultats que nous obtenons lorsque dans notre quotidien nous faisons des 
calculs avec notre montre. 


- Deuxième approche (première extension) 


Si nous observons bien notre montre, nous remarquons qu'à chaque fois que nous rajoutons 12 (ou 
retirons..) à une valeur des heures de notre montre alors nous tombons sur un ensemble de nombres 
bien déterminé qui sont aussi dans Æ. Ainsi (évidemment dans le cadre d'une montre seules les 
premières valeurs positives nous intéressent la plupart du temps mais ici nous faisons des maths alors 
nous généralisons un peu.…..): 


0:=0+12Z = {..—24,-12,0,12,24,...} 
1:=1+122= {..,-11,1,13,25,...) 
2:=2+12# = {...,-10,2,14,26,...) 


Nous retrouvons ici un concept que nous avions déjà vu dans le chapitre de Théorie Des Nombres. Il 
s'agit de classes de congruences et l'ensemble de ces classes forme l'ensemble quotient Z /12Æ . Si nous 
munissons cet ensemble quotient d'une loi d'addition, il est normalement facile d'observer que celle-ci 
est une loi interne à l'ensemble quotient, qu'elle est associative, qu'il existe un élément neutre et que 
chaque élément possède un symétrique (inverse). 


Ainsi, cet ensemble quotient muni uniquement de la loi d'addition (sinon en ajoutant la multiplication 
nous pouvons former un anneau) est un groupe commutatif. 


- Troisième approche (deuxième et dernière extension): 
Voyons une troisième et dernière approche qui explique pourquoi le groupe quotient est cyclique. 


Si nous projetons la rotation des aiguilles de notre montre (toutes les rotations dans l'algèbre 
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ensembliste se font traditionnellement dans le sens des aiguilles d'une montre!) dans € et que nous 
définissons: 


Nous avons alors 12 - ,0 _j et: 
Vaker x=x42%# (94) 


ce qui explique pourquoi le groupe quotient (&! 12#,+) est appelé "groupe cyclique" (par 


isomorphisme de groupe selon ce qui a été vu en théorie des ensembles). Son isomorphe est noté C;;. 


Si nous représentons dans € l'ensemble isomorphe C;; nous obtenons alors sur le cercle unité un 
polygone ayant n sommets comme le montre la figure ci-dessous: 


Figure: 9.1 - Groupe cyclique d'ordre 12 


Par ailleurs, le nombre d'éléments composants 7% /12Æ étant fini, (&! 12Z,+) est fini. Contrairement au 


groupe (Æ,+) qui est lui un groupe discret infini. 


Ce concept de finitude sera peut-être plus évident avec l'exemple que nous ferons de suite après avec 
8} 4F, où le lecteur observera que cet ensemble a le même nombre d'éléments que €; . 


Remarque: Les mathématiciens appellent €, le "groupe des racines n-èmes de l'unité". Une racine 
n-ème de l'unité (parfois appelée "nombre de De Moivre") est donc un nombre complexe dont la 
puissance n-ème vaut 1. Par ailleurs, pour un entier n donné, toutes les racines n-èmes de l'unité 


sont situées sur le cercle unité et sont les sommets d'un polygone régulier à n côtés ayant un sommet 
d'affixe 1. 


Ce qui intéresse les physiciens particulièrement dans un premier temps ce sont les représentations des 
groupes finis (aussi les groupes continus que nous verrons plus loin). Ainsi, la représentative de Æ/ ##, 
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nous est connue puisque la rotation dans le plan complexe est donnée comme nous l'a montrée notre 
étude des complexes dans le chapitre sur les Nombres: 


| —) | —) 
COS — sin — 
EC: ñ 
| =) | 2z) 
An | — COS — 
# # 
avec # E[0,#—1]. Cette représentative est un sous-groupe du groupe des rotations O(2) sur lesquelles 


nous reviendrons plus loin. Le groupe des rotations du plan étant lui-même un sous-groupe du groupe 
linéaire GL(2) (nous en donnerons une définition précise et un exemple plus loin). 


Au fait, les mathématiciens sont capables de démontrer que tous les groupes quotients %j #7, sont 
cycliques à isomorphisme près avec €. Les mathématiciens disent aussi que Æj *Æ est un quotient 


fini du groupe monogène #,. 


Cette approche est par contre peut-être un peu abstraite. Alors, si le lecteur se rappelle du chapitre de 
Théorie Des Ensembles nous avons vu une définition bien précise de ce qu'était la cyclicité d'un groupe: 
Un groupe G est dit cyclique si G est engendré par la puissance d'au moins un de ses élémentsz € G 
appelé générateur tel que: 


Vérifions que ce soit bien le cas pour le groupe: 
G={ZI48,+) (9.7) 
qui constitue un cas scolaire. 
Nous noterons les éléments qui constituent ce groupe: 
{0,12,3} (9.8) 
Ceci étant fait, il convient de faire attention que dans la définition ensembliste du groupe cyclique nous 
parlons de "puissance" si la loi interne du groupe est la multiplication mais si la loi interne est l'addition, 
nous avons alors: 
G={x.a,R€Æ) (99) 
Le premier élément générateur du groupe: 


G={Z/4Z,+} (9.10) 


est l'élément 1. Effectivement: 
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1=11=1 

1+1=2.1=2 | 
(9.11) 

1+1+1=3.1=3 


1+1+1+1=4.1=0 


Le deuxième élément générateur du même groupe est 3: 


3=1.3=3 
3+3=2.3=2 

(9.12) 
3+3+3=3.3=1 


3+3+3+3=4.3=0 
Par contre, le lecteur pourra vérifier que 2 n'est pas générateur de ce groupe! 


Au fait, en ce qui concerne les groupes G& = (Z/ Cr A +) les mathématiciens arrivent à démontrer que 


seuls les éléments du groupe qui sont premiers avec n sont générateurs (c'est-à-dire les éléments dont le 
plus grand commun diviseur est 1). 


Voilà pour notre introduction aux groupes cycliques. Passons maintenant à une autre catégorie de 
groupes. 


1.2. GROUPES DE TRANSFORMATIONS 


Le groupe des rotations est celui qui intéresse le plus les physiciens surtout dans les domaines des 
matériaux, de la chimie, de la physique quantique et de l'art. Les mathématiciens apprécient eux 
l'étude des groupes de rotations dans le cadre de la géométrie bien évidemment (mais pas seulement) et 
les informaticiens tout autant les groupes linéaires. Nous avons d'ailleurs vu un exemple de groupe de 
rotations juste précédemment. 


Définition: Nous appelons "groupe linéaire d'ordre n" et nous notons GL(n) les matrices inversibles 
(donc le déterminant est non nul selon ce que nous avons vu dans le chapitre d'Algèbre Linéaire) dont 
les coefficients sont dans un corps quelconque: 


GL(x) = {AE M, | det(A)# 0} (9.15) 


Un exemple simple et important de groupe linéaire est celui du sous-"groupe des transformations 
affines" du plan qui est traditionnellement noté (c'est intuitif): 


F: May) = My): É (9.14) 
» 


ml 
UD  R& 
+ 
+ + 
& € 
+ + 
© & 


avec &,b,c,d,&, 8 € IR,ad — bc # Ô (nous verrons le pourquoi du comment de l'inégalité un peu plus 
loin). 


Prenons un exemple pratique: 


F:MG» MU») x'=0.5x-04y+0.5 _. 
: Mix, 2 Vi: 9.15) 
: 72 lue 0.8x+0.2y-1.5 
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ce qui appliqué à un cercle donnerait: 


Figure: 6.2 - Transformations affines sur un cercle 


Cette transformation est une manière de définir les ellipses comme images d'un cercle par une 
transformation affine. 


Les coefficients &, £ sont sans importance pour la forme de l'image. En fait, ils induisent bien 
évidemment des translations sur les figures. Nous pouvons donc nous en passer si nous cherchons 
seulement à la déformer. 


Ainsi, il nous reste: 


x'=ax+by 
F:M{x,y) —=M\{x',y): (9.16) 
J'=cx+dy 


ce qui peut s'écrire sous forme matricielle: 


La transformation se réduit donc à la matrice: 


F = (9.18) 
€ à 


et comme nous l'avons vu en algèbre linéaire, la multiplication matricielle est associative mais n'est pas 
commutative, donc la transformation linéaire ne l'est pas non plus. 


1 0 
(9.19) 
Q 1 


L'élément neutre est la matrice: 


bu 
Il 


et l'inverse de F est: 
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Fl- 


à —b 

ad-bc ad-bc |_ 1 k … (9.20) 
—C a ad — bc 

ad—bc ad—bc 


et comme nous avons imposé &4 — be # 0 tout élément y possède donc un inverse. Ainsi, le groupe 
linéaire affine est non commutatif et. forme bien un groupe... 


Définition: Nous appelons "groupe spécial linéaire d'ordre n" et nous notons SL(n) les matrices 
inversibles dont les coefficients sont dans un corps quelconque et dont le déterminant est égal à l'unité: 


SL(n) = (AE, | det(A)=1} (9.21) 
Il s'agit évidemment d'un sous-groupe de GL(n). 


En reprenant l'exemple précédant et en se rappelant que le déterminant d'une matrice carrée 
bidimensionnelle est (cf. chapitre d'Algèbre Linéaire): 


det(F) = ad be =1= det{ #°) (9.22) 


nous remarquons bien géométriquement ce que signifie d'avoir un déterminant unitaire dans ce cas! 
Effectivement nous avons vu dans le chapitre d'Algèbre Linéaire lors de notre interprétation 
géométrique qu'avoir un déterminant équivaut à une surface. Ainsi, le fait d'avoir ad-bc unitaire permet 
donc que quel que soit l'ordre de la transformation, nous avons l'aire qui vaut toujours 1. Ainsi, le 
groupe spécial linéaire conserve les surfaces. 


Définition: Nous appelons "groupe orthogonal réel d'ordre n" et notons O(n) les matrices orthogonales 
(cf. chapitre d'Algèbre Linéaire) # xX# données par: 


O(x) = {4 e M, (R)| 474= 1) (9.23) 


Par ailleurs, nous avons démontré dans le chapitre d'Algèbre Linéaire lors de notre étude des matrices 
de rotations que 47 4= 7, implique det(A) = +1. 


C'est le cas par exemple de la matrice de O(2) vue précédemment (elle appartient au groupe orthogonal 
mais aussi au groupe des rotations que nous verrons plus loin): 


(2x) (#z) 

COS — Sin — 

# À 

| (2) (2x) 

SN! — COS — 
# # 


qui est orthogonale comme il est facile de le vérifier. 


(9.24) 


Remarque: O(1) est constitué aussi de l'ensemble des matrices triviales.. [1],[-1] 


Définition: Si À € O(x#} et que nous avons det(4) = 1 alors nous obtenons un sous-groupe de O(n) 
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appelé "groupe spécial orthogonal réel d'ordre n" et noté SO(n): 
SO(n) = [A EM, (R) | A7 A = 2, , det(A) = 1 (9.25) 


La matrice de rotations donnée précédemment fait partie de ce groupe puisque son déterminant est égal 
à l'unité! Par ailleurs, ce groupe occupe une place très spéciale en physique et nous le retrouverons 
maintes fois. 


Le sous-groupe SO(2), appelé aussi parfois "groupe cercle" et noté $l, que nous avions aussi étudié 
dans le chapitre de Géométrie Euclidienne a une représentative donnée par la matrice: 


Fe 8 —-sin ; 
(9.26) 


ang cosg 


et occupe une place à part dans la famille des groupes SO(n) avec n supérieur à l'unité. Effectivement il 
est le seul à être commutatif. Par ailleurs, il est isomorphe à ,*#* soit à U(1) le groupe multiplicatif des 


nombres complexes de module 1. C'est aussi le groupe de symétrie propre d'un cercle et l'équivalent 
continu €, . 


Le sous-groupe SO(3) donné par la matrice (cf. chapitre de Géométrie Euclidienne): 


1 0 ( 
Q cos —-sin&g| (927) 
0 sing cosg 


pour la rotation autour de l'axe X dans l'espace tridimensionnel n'est pas commutatif. Par ailleurs les 
quaternions, dont la représentative est donc SO(3), forment un groupe non commutatif aussi (par 
rapport à la loi de multiplication) comme nous l'avons vu dans le chapitre sur les Nombres. 


Par rapport à un vecteur unitaire on se rend facilement compte visuellement parlant que SO(3) est un 
sous-groupe fermé de GL(3), c'est-à-dire de l'ensemble des groupes linéaires de dimension 3. 


Remarque: SO(1) est constitué de la matrice [1]. 


Définition: Nous appelons "groupe unitaire d'ordre n" et nous notons U(n) les matrices dont les 
composantes sont complexes (dans le cadre de ce site le plus souvent) ou réelles et qui sont 
orthogonales: 


Un) = [A e M,(C)| 4 A= Ia} (9.28) 


Remarquons par ailleurs que toute matrice unitaire à coefficients complexes et à une dimension. (de 
U{n) donc...) est un nombre complexe de module unitaire, qui peut toujours s'écrire sous la forme #E . 


Nous en avons déjà vu un exemple aussi sur le site lors de notre étude des spineurs dans le chapitre de 
Calcul Spinoriel. Il s'agit des matrices de Pauli (utilisées dans le chapitre de Physique Quantique 
Relativiste) données par: 
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0 1 Q 1 0 
T, = 1 =|. : = (9.29) 
1 0? i 0 Q —] 


Définition: Nous appelons "groupe spécial unitaire d'ordre n" et nous notons SUfn) les matrices dont 
les coefficients sont complexes et qui sont orthogonales et dont le déterminant est unitaire: 


SU(») = {4€ M,(C)| A 4= 1,,det(4) =1) (0.30 


Remarque: U(1) est égal à SU(1) et il s'agit donc du cercle unité complexe égal à #Ë . Par ailleurs, 
SO(2) est commutatif et isomorphe à U(1) car c'est l'ensemble des rotations du plan. 


Un exemple connu est toujours celui des matrices de Pauli mais simplement écrites sous la forme 
utilisée en Physique Quantique Relativiste (voir chapitre du même nom): 


| Dir 0 1]. i O0 
ia, =|. IT. = 10, = _[ (9.31) 
i 0 d —1 0 Q 


qui font partie de SU(2) et qui comme nous l'avons montré (implicitement) au début du chapitre de 
Calcul Spinoriel est isomorphe au groupe des quaternions SO(3) de module 1 sur la sphère de dimension 
3 (notée 55). Relation que les mathématiciens appellent dans le cas présent un "homomorphisme de 
revêtement"... 


Remarque: Le groupe spécial unitaire possède une importance particulière en physique des 
particules. Si le groupe unitaire U(1) est le groupe de jauge de l'électromagnétisme (pensez au 
nombre complexe apparaissant dans les solutions de l'équation d'onde!), SU(2) est le groupe associé 
à l'interaction faible, et SU(3) celui de l'interaction forte. C'est par exemple grâce à la structure des 
représentations de SU(3) que Gell-Mann a conjecturé l'existence des quarks. 


Avec une approche différente de celle vue dans le chapitre de Calcul Spinoriel comment montrer que 
les matrices de Pauli sont les bases de SU(2)? 


D'abord, rappelons que nous avons montré dans de Calcul Spinoriel que toute rotation dans l'espace de 
trois dimensions pouvait s'exprimer à l'aide de la relation: 


- 8 8 92 _ 
R[LE]= costa ing Le (9.32) 
2 2 2 


Et nous avons vu dans le chapitre d'Informatique Quantique qu'une formulation explicitée et 
décomposée de la relation précédente était: 
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.. 
COS—  —j Me 
—isi—  Cos— 
2 
cos — sin g 
me 2 (9.33) 
&, (9)= 
Sil—  Cos— 


et donc que tout élément de SU(2) est produit de ces trois matrices qui font chacune décrire à 
l'extrémité d'un vecteur dans l'espace une courbe! 


Maintenant, nous remarquons que ces trois matrices sont égales à: 
1 0 | 
R,(8)=R,(8)=R, (8)= o 1l © 


lorsque 8 = 0. Nous obtenons alors la matrice identité. Donc si nous cherchons la tangente en ce point 
conjoint, nous pouvons dès lors construire une base (3 vecteurs orthogonaux). 


Regardons ceci: 


Er — PL ( _ 
So] 272, 2 2 z | |-3e 
46 0 |-j_cos— BL SL? ( Er É 
2 21. 
LP Lee 0 - 
dR, (8) 2 2 21 2 | is (9.35) 
- y d 
48 Lo LL one : ( EM : 
2 2 Le 
1, 2 1. 
d8 (8) [72 © | |! if 
48 | 0 ie" 0 1; 2L0 -1 - 


et ce sont en d'autres termes les générateurs infinitésimaux du groupe SU(2). SU(2) a donc une base qui 
est une Algèbre de Lie selon le vocabulaire des mathématiciens. 


Ce résultat est assez remarquable. Puisque SU(2) et SO(3) sont isomorphes, nous pouvons alors 
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obtenir la base de l'Algèbre de Lie de SO(3) alors avec la même méthode!!! 


Voyons ceci! Nous avons vu dans le chapitre de Géométrie Euclidienne que les matrices de rotations 
étaient données par (nous changeons le R par un U afin de ne pas confondre avec les matrices 
précédentes): 


1 0 ( cosy 0 —-siny cos$g sing 0 
U,=|0 cosg sing UE, =| 0 1 (ll U, = |-sm@ cosÿ 0 (9.37) 
0 -sn8 cos8 any 0 cosy 0 () l 


Nous remarquons à nouveau qu'en # = y = #= Ü la courbe que fait décrire à un vecteur les trois 
matrices de rotations passe par: 


1 0 0 
U,=U,=U,=|0 1 O0| (6) 
0 0 1 


Alors de la même manière que pour SU(2), nous calculons les dérivées en ces angles pour déterminer 
les matrices de base génératrices de SO(3): 


0 0 (el 0 © 0 
e =|0 -sin8 cos8 =|0 0 1|=X, 
=Û0 = 2, A _—_ 
0 -cos8 -sin8 PS 0-1 0 
au —siny OÙ —-cosy RS 
Pr =| 0 0 0 =[0 0 0!=X, (93) 
F y=0 cosY Ô -siny LE 1 0 0 
_ -sing cos 0 0 E1i 0 
re =|-cosf# —-sin# 0 =|-1 0 0=#, 
ÿ g=0 0 0 ( 0 0 0 0 


L'algèbre de Lie de SO(3) admet donc pour base: 
(X,,2,,X,) 640 
En physique, on préfère travailler avec des matrices complexes. Nous introduisons alors les matrices: 
(Ji miZ, ul, =if,.J,=ix,) Gan 
Il faut alors remarquer que si nous définissons: 


0 0 0] [o 0 -il [o 0 + 
Ja=J,+ti,=|0 0 il+ilo o 0-10 0 à (4) 
0-i 0| |i o 0! |r1-i 0 
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nous avons trivialement pour la complexe conjuguée de la matrice transposée: 


(4) =J, (943) 


et au fait. nous avons aussi les relations de non-commutation (ce que nous pouvons développer sur 
demande): 


AA |= iJ, (9.44) 
(cycl.) 


et aussi la relation de commutation: 
p 


ce que satisfont aussi les matrices de Pauli et. pour rappel (ou information pour ceux qui n'ont pas 
encore lu le chapitre de Physique Quantique Ondulatoire) les J, sont les opérateurs du moment 


112 
“4 |- O (9.45) 


(cycl.) 


cinétique total du système de couplage spin-orbite!!! 


1.3. GROUPES DE SYMÉTRIES 


Le groupe de symétries d'un objet noté X (image, signal etc. en 1D, 2D, 3D ou autre) est le groupe de 
toutes les isométries (une isométrie est une transformation qui conserve les longueurs) sous lesquelles il 
est invariant avec la composition en tant qu'opération. 


Tout groupe de symétries dont les éléments ont un point fixe commun, ce qui est vrai pour tous les 
groupes de symétries de figures limitées, peut être représenté comme un sous-groupe du groupe 
orthogonal O(n) en choisissant l'origine pour point fixe. Le groupe de symétries propre est alors un 
sous-groupe du groupe orthogonal spécial SO(n), et par conséquent, il est aussi appelé le groupe de 
rotations de la figure. 


Dans ce qui suit, nous allons interpréter la composée de deux opérations de symétries ou de rotations 
comme une multiplication au même titre que pour les permutations. 


Définitions: 


D1. Le "groupe des symétries", appelé aussi "groupe des invariants", de X est l'ensemble des symétries 
de X, muni de la structure de multiplication donnée par composition qui laisse X invariant. 


D2. "L'ordre" d'un groupe est le nombre total de toutes ses symétries uniquement (y compris l'identité!). 
Exemples: 


E1. Le coeur: 
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Figure: 6.3 - Analyse du groupe de symétrie du coeur 


a un groupe de symétries total à 2 éléments, à savoir l'application identité id et l'application 7, qui est la 


réflexion dans l'axe vertical (sous-groupe de symétries à 1 élément). Cette forme possède donc un 
groupe de symétries d'ordre 2. Nous observons que le symétrique est donné aussi via la relation 
r,°r, = id 


E2. La lettre: 


Figure: 6.4 - Analyse du groupe de symétrie de phi 


a un groupe de symétrie total à 4 éléments, à savoir l'application identité id, les deux réflexions 7, et #, 
et la rotation par l'angle 7 que nous noterons £, (sous-groupe de rotations à 1 élément). Cette forme 
possède donc un groupe de symétries d'ordre 3. 


Dans ce groupe nous avons 7, 97, =£, (et c'est commutatif!), £, o£, est la rotation par un angle 2x, ce 
qui est la même application que l'application identité, donc £, of, =id. 


Ainsi, le groupe de symétries de cette lettre est commutatif et la loi de composition est bien interne. 
C'est donc bien un groupe. 


E3. Le pentagone régulier: 


Figure: 6.5 - Analyse du groupe de symétrie du pentagone régulier 


a un groupe de symétries total à 10 éléments à savoir les 5 rotations id é5 55. fais É6nis-t8sis Ainsi que 
les 5 réflexions dans les 5 axes de symétries. C'est donc un groupe de symétries d'ordre 5 correspondant 
au groupe cyclique Z/5Æ. 
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Remarque: Plus généralement, le groupe de symétries d'un n-gone régulier (si n est impair) a 
exactement 2n éléments. Ce groupe s'appelle le "groupe diédral d'ordre n" et est noté le plus 
souvent 2, (il faut faire attention car certains auteurs ne multiplient pas n par le facteur 2 ce qui 


fait que l'indice représente alors directement l'ordre et non le nombre d'éléments). 


Le pentagone a donc Â}, pour groupe diédral et Z/5Æ en est un "sous-groupe distingué" (nous 
reviendrons plus tard sur cette notion de sous-groupe distingué). 


E4. Le groupe diédral 2; d'ordre 3 des isométries d'un triangle équilatéral (polygone régulier) a 6 


éléments que nous noterons (afin que l'écriture soit moins lourde): 


De = (id bris tamis C1, 02.03} (9.46) 


où &,@,0; sont les symétries par rapport aux trois bissectrices (respectivement médiatrices). La 
ue PL ym 


table de compositions de ce groupe diédral montre aussi que ce groupe est non-commutatif: 


p 
[a] G 
3 1 
T 
7 De id Éyi3 arts | A | & | & 
id id \Ey3 arr | A | & | & 
bas rss da || 
fans  éans| 1 5m || 
Last A | | © | id léyys fans 
T T3 | O3 | OO léanis | d léyis 
a T3 | M | SG émis Éani3 | id 


Tableau: 9.1 - Sy 


métries du groupe diédral d'ordre 3 


Nous reviendrons sur cet exemple lorsque nous introduirons un peu plus loin le concept de groupe 
distingué lors de notre étude des groupes de permutations et la définition des groupes distingués. 


E5. Regardons un dernier exemple appliqué à la chimie en énumérant les opérations de symétries qui 
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laissent la molécule WA; (tétraèdre) invariante. 


Le groupe de transformations contient 6 éléments: l'identité id, €’; qui est la rotation de 2x/3, cs la 
rotation de 4x7} 3 (que nous noterons par la suite C’_;) toutes deux selon l'axe Z (perpendiculaire au 
plan XY donc...) et 3 axes &,@:,@, de symétrie/réflexion passant chacun par le milieu d'une des arêtes 
de base au milieu de l'arête opposée comme le montre la figure ci-dessous (pyramide vue du dessus): 


Figure: 6.6 - Opérations laissant invariant un tétraèdre 


La combinaison des différents éléments de symétries montre que la table de compositions est (ce qui 
prouve que la loi est interne et que nous travaillons donc bien dans un groupe): 


he d'a la | |CG |Ca 
id d|a | æ& | æ& | C |C: 
(a al id Cl CG | T | T 
T | CG | id | Ca a | a 
T EA Ca) C3 | id | T | a 
C3 Ga ms |a | Cu | id 
C Cala | æ | id | G 
Tableau: 9.2 - Compositions de transformations du tétraèdre 


Attention à l'ordre des opérations dans le tableau ci-dessus, nous appliquons d'abord l'élément de ligne 
puis l'élément de colonne! 


Nous constatons que le groupe n'est donc pas commutatif. 
1.3.1. ORBITE ET STABILISATEUR 


Nous allons voir maintenant deux définitions que nous retrouverons en cristallographie (leur nom n'est 
pas innocent!). 


Définition: L'orbite d'un élément x de E est donnée par: 
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Orb, ={g-x,g€G} (9.47) 


L'orbite de x est l'ensemble des positions (dans E) susceptibles d'être occupées par l'image de x sous 
l'action de G. Les orbites forment évidemment une partition de E. 


Exemple: 
Considérons un ensemble E sur lequel agit un groupe G, par: 


E ={S0,8, 5,83, 84,85) (9.48) 


l'ensemble des 6 sommets d'un hexagone sur lequel nous faisons agir le groupe G= {id f5 513 tamis) - 


Nous observons déjà trivialement que G est bien un groupe! 


Maintenant, prenons un élément de EF, par exemple S;. 
Son orbite va donc être par définition: 
Orbs = (id (So) = Stars (So) = 82 vÉar13 (So) = Sa} (0.49) 
Définition: Le stabilisateur x d'un élément de E est l'ensemble: 
Stab,={geG|gx=x} (9:50) 

des éléments qui laissent x invariant sous leur action. C'est un sous-groupe de G. 
Pour reprendre notre exemple précédent. Son stabilisateur va être réduit à: 

Stabs = {id} (9.51) 


1.4. GROUPES DES PERMUTATIONS 


Les groupes symétriques ont une importance non négligeable dans certains domaines de la physique 
quantique mais aussi en mathématiques dans le cadre de la théorie de Galoiïs. Il convient donc d'y 
porter aussi une attention toute particulière. 


Rappelons d'abord (cf. chapitre de Probabilités) que dans un ensemble {1,...,#} il y a n! permutations 


possibles. Les mathématiciens disent, à juste titre, qu'il y a n! bijections et appellent ce nombre "ordre 
du groupe de permutations". 


Prenons par exemple l'ensemble {1,2,3}. Cet ensemble à 3! permutations possibles qui sont notées dans 
le cadre des groupes de permutation de la manière suivante: 


{(D), (1 2), 3,0 3), (2 2 3), (2 3 2)} (0:52) 


Ce qui se lit dans l'ordre: application identité id, 1 amène sur 2 ou 2 sur un 1 (en termes de position!), 1 
amène sur 3 ou 3 sur 1, 2 amène sur 3 ou 3 sur 2, 1 amène sur 2 qui amène sur 3 qui amène sur 1, 1 
amène sur 3 qui amène sur 2 qui amène sur 1. 
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Soit de manière plus explicite: 


it 
UD ON = NN UN NN RD RD = NN 
[es] 


et que la composition de deux permutations est une loi interne: 
(1 2jef1 3 21=24,33=02 3% 65 


avec un élément neutre qui est bien l'identité id. Nous avons donc bien un groupe non commutatif. 
Rappelons également au lecteur que certains éléments du groupe, s'ils sont bien choisis, peuvent former 
un sous-groupe. C'est l'exemple de: 


{(), ( 2)} (9.56) 
qui est un sous-groupe de $; (il est facile de vérifier qu'il possède toutes les propriétés d'un groupe). 


Définition: Un sous-groupe H d'un groupe G est appelé "groupe distingué" si, pour tout g de Gettouth 
de H, nous avons que ghg” est élément de H. Les mathématiciens appellent cela un “"automorphisme 
intérieur". 


Voyons d'abord un exemple géométrique parlant après quoi nous reviendrons à cette définition avec $; 


Exemple: 


Nous avons vu plus haut les éléments du groupe de symétrie diédral d'ordre 3 du triangle équilatéral. 
Géométriquement ils correspondent tous à des déplacements dans le plan dans lequel se trouve le 


triangle. Nous avions obtenu pour rappel le tableau de compositions suivant: 
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2 
Lay] Ta 
3 il 
T 
7 De id éyys léarrs| A | & | 
id Id lÉgis fans) A | & | & 
Ér13 as bars) da |a | 
PTE lan) dd 5m | la 
Last A | | 3 | id lEyys las 
T O3 | O3 | O léaprs) id léyss 
T3 T3 | Gi | D léoris éarr3| id 


Tableau: 9.3 - Symétries du groupe diédral d'ordre 3 
D'abord, nous constatons facilement à l'aide de ce tableau que nous avons: 
- Le sous-groupe formé de {id} d'ordre 1 
- Le sous-groupe formé de {id 5,3 fais} d'ordre 3 
- Le sous-groupe formé de {i4,c;} d'ordre 2 
- Le sous-groupe formé de {i4,a,} d'ordre 2 
- Le sous-groupe formé de {i4,a;} d'ordre 2 


Parmi ces 5 sous-groupes, voyons lesquels sont distingués (cela est relativement facile à visualiser à 
l'aide du tableau de compositions): 


- Le sous-groupe formé de {id} 


- Le sous-groupe formé de {id 65,3 tamis) 


Nous allons voir maintenant une chose remarquable! En numérotant par 1, 2 et 3 les sommets du 
triangle équilatéral et en prenant les rotations dans le sens des aiguilles d'une montre, nous pouvons 
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identifier les éléments de 2; aux éléments suivants de &; : 


1 
id = 

| 
= 
= 


et reconstruire la même table de compositions (copie de la précédente mais juste avec le changement 
d'écriture. hé hé!): 


(9.57) 


WW ND NN ND 


(23) | 432) | (3) (13) (12) 
432) | {3 | A2 | C3 
(1) (123) (12) (23) (13) 
(12) (13) (1) 32 l'OS 
(23) 2) | (23) (1) (132) 
(1 3) 23 | G32) | (23 (1) 


Tableau: 9.4 - Composition du groupe distingué 


Bon... ce petit interlude fermé, revenons au groupe distingué de #, (car il va être important pour notre 
introduction aux groupes de Galois) et rappelons d'abord que: 


G= {(1), ( 23,01 3,62 3),(1 2 3),(1 3 2)} (9.58) 
et nous voyons que le sous-groupe distingué est formé de: 
A ={(1,(1 2 3,1 3 2)} (9:59) 
Définition: Pour tout sous-groupe H stable par les automorphismes intérieurs d'un groupe G, nous 
appelons "indice de H dans G"' le quotient de l'ordre du groupe G par l'ordre du sous-groupe H et nous 


l'écrivons [G/H]. 


Par exemple, l'indice du sous-groupe {(1), (1 2)}dans le groupe $; est 6/2 c'est-à-dire 3. Ce concept 
nous sera très utile lors de notre introduction aux corps de Galois plus loin. 


Considérons maintenant, la permutation particulière & pour aborder le sujet sous un angle différent 
mais équivalent: 


{1,2,3,4} —"5{3,2,4,1} (9.60) 


Les mathématiciens ont pour habitude de noter cela, dans un premier temps, sous la forme: 


1 2 3 4 
(9.61) 
3 2 4 1 


avec: 
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at) =3,0(2) = 2,0(3 =4,0(4)=1 (0.6) 


Etant donné & et T, deux permutations, il est naturel de regarder leur composition T° (rappelons 
que cela signifie d'abord 4, puis T comme pour la composition de fonctions). 


Ainsi, si: 
1 2 3 4 1 2 3 4 
= = (9.63) 
3 2 4 ] 2 1 4 3 
Alors: 
1 2 3 
ToT= (9.64) 
4 1 3 2 
et: 


Maintenant, l'idée est d'interpréter la composition comme une multiplication de permutations. Cette 
multiplication est alors non-commutative comme nous venons de le constater dans l'exemple précédent. 
Nous avons en général ToT£Tod. 


Chaque bijection a un inverse (une fonction réciproque). Dans notre exemple il s'agit de évidemment 


de: 
n 1 2 3 4 : 
= (9.66) 
4 2 1 3 


Géométriquement, pour calculer l'inverse "1 d'un élément «7, il suffit de prendre la réflexion du 
dessin de dans un axe horizontal comme le montre la partie gauche de la figure ci-dessous: 


Il 2 3 { To ecoT 
e : 3 À 
3 4 1 2 3 4 
Figure: 6.7 - Exemples de composées et d'inverses de permutations 
Définitions: 


D1. L'ensemble des permutations d'un ensemble avec n éléments, muni de cette structure de 
multiplication, s'appelle le "groupe des permutations d'ordre n" ou "groupe des substitutions d'ordre n", 


et se note $, ou encore S(n). 
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D2. Nous disons qu'un élément & de £&,, est un "cycle d'ordre k", ou un "k-cycle", s'il existe 


d,4,...,4; E{L..,x} tel que: 

- & envoie & SUT &>, 43 SUT 3,431 SUT 3, et 4x SUT & 
- & fixe tous les autres éléments de &, 

et nous notons le cycle de la manière & = (4,4:,...,4). 


Pour mieux comprendre reprenons notre exemple de &, : 


1 23 4 
= (9.67) 
3 2 4 1 


Ce groupe symétrique est un 3-cycle noté æ ={1 3 4) car dans l'ordre: 1 envoie sur 3, 3 envoie sur 4 
et 4 envoie sur 1 (et le 2 n'étant pas mentionné il reste fixe). Nous pouvons noter cela aussi des façons 
suivantes équivalentes: æ =(3 4 1} ou encore a =(4 1 3). 


Définition: L'ordre d'un k-cycle est k (d'où le nom!). 


Effectivement si nous reprenons & ={1 3 4), nous avons alors: 
c'=(143)et g=ig (9:68) 


Définition: Nous disons qu'une permutation & est un "cycle" s'il existe x e N tel que & est un 
k-cycle. 


Attention! Toute permutation doit s'écrire comme un produit de cycles disjoints (c'est-à-dire qu'un 
nombre qui apparaît dans un cycle ne doit pas apparaître dans un autre cycle). Par exemple, dans &, 


nous avons: 


(23456789 
"15 28 37 164 9 


]-0 5 7 63 8 4) (9.69) 


Donc cette permutation est un produit d'un 4-cycle et d'un 3-cycle disjoint. 
Nous laisserons d'ailleurs le lecteur vérifier par lui-même que l'ordre de ce groupe $, est 12... 


Remarque: Les mathématiciens peuvent démontrer que si & est un élément qui a une 
décomposition en c cycles disjoints de longueur #,,#,,...,*, alors l'ordre de & est le plus petit 


commun multiple des ordres de tous les cycles disjoints qui le composent. 


Nous supposerons également intuitif que dans le vocabulaire commun, un 2-cycle dans $,, s'appelle 
aussi une "transposition". 


Allons un petit peu plus loin. Nous nous proposons de montrer par l'exemple que l'ensemble des 
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transpositions engendre £!,,. Autrement, dit, toute permutation s'écrit comme un produit de 


transpositions. 


Reprenons notre exemple (il s'agit d'une permutation paire): 


TT 43 420 51 9.70 
e=|, , 4 [034-4340 cr) 


En général, un k-cycle s'écrit donc comme produit de k-1 transpositions. 


Définition: Soit æ € $, une permutation. Nous disons que & est "permutation paire" si, dans une 


écriture de &æ comme produit de transpositions, il y a un nombre pair de transpositions. Nous disons 
que & est "permutation impaire" si, dans une écriture de &æ comme produit de transpositions, il y a un 
nombre impair de transpositions. 


Finissons par un petit complément... Nous avons que $; est un groupe des permutations d'ordre 3 avec 
donc 3!=6 permutations possibles. 


Si nous énumérons les 6 permutations nous avons vu que nous obtenons: 
{(1), (1 2),(4 3),02 3),(1 2 3),(1 3 2)} (271) 
Parmi celles-ci certaines seulement peuvent être écrites comme un produit pair de transpositions: 
(1 2 3}-(1 2)(G3 1)et(1 3 2)-(1 3)(2 1) (2.72) 


Les permutations paires forment avec la permutation identité id, un sous-groupe (non commutatif) que 
nous appelons le "groupe alterné d'ordre n" et que nous notons 4, . C'est facile de le vérifier avec 


l'exemple précédent. 
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Notes personnelles: 
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10. CALCUL DIFFÉRENTIEL ET INTÉGRAL 


L. calcul différentiel est un des domaines les plus passionnants et vastes de la mathématique, et il 


existe une littérature considérable (colossale) sur le sujet. Les résultats initiés par des scientifiques comme 
Fermat, Newton, Leibniz, Euler et compagnie depuis la fin du 17ème siècle retrouvent des implications 
dans absolument tous les domaines de la physique, de l'informatique, de l'électronique, de la chimie, de la 
finance, de la biologie et de la mathématique elle-même. 


Les mathématiciens ont rédigé une telle quantité de théorèmes depuis sa naissance au milieu du 16ème 

siècle sur le sujet que la validation d'un échantillon de ceux-ci est parfois délicate car nécessitant à eux- 
seuls la vie d'un homme pour être parcourus (c'est un problème que la communauté des mathématiciens 
reconnaît) et vérifiés (ce qui fait que parfois personne ne les vérifie….). 


Ce constat fait, nous avons choisi de ne présenter ici que les points absolument nécessaires à la 
compréhension des outils fondamentaux de l'ingénieur. Les puristes nous excuseront donc pour l'instant de 
ne pas présenter certains théorèmes qui peuvent leur sembler indispensables mais que nous rédigerons une 
fois le temps venu... 


Nous allons principalement étudier dans ce qui va suivre ce que les mathématiciens aiment bien préciser 
(et ils ont raison): les cas généraux des fonctions réelles à une variable réelle. Les fonctions plus 
complexes (à plusieurs variables réelles ou complexes, continues ou discrètes) viendront une fois cette 
partie terminée. 


Remarque: Nous ne nous attarderons pas à démontrer les dérivées et primitives de toutes les fonctions 
car comme il y a une infinité de fonctions possibles, il y a également une infinité de dérivées et de 
primitives. C'est le rôle des professeurs dans les instituts scolaires d'entraîner les élèves à appliquer et 
à comprendre le raisonnement de dérivation et d'intégration par des applications sur des fonctions 
connues (l'Internet ne remplacera très probablement jamais l'école à ce niveau). 


1. CALCUL DIFFÉRENTIEL 


Soit une fonction f réelle à une variable réelle x notée f{x) (nous nous limitons à ce cas de figure pour 
l'instant et étudierons les dérivées partielles dans des espaces à un nombre de dimensions quelconques 
plus loin) continue au moins dans un intervalle où se situe l'abscisse a. 


Définitions: 


D1. Nous appelons "pente moyenne", ou encore "coefficient directeur" le rapport de la projection 
orthogonale de deux points x, # x; de la fonction f non nécessairement continue sur l'axe des abscisses et 
des ordonnées tel que: 


LH _ JC) fn) _ fm th) fn) _ f(at+h)- f(a) 


x S * (x +h)-(x) k 


Ce qui se représente sous forme graphique de la manière suivante avec une fonction particulière: 
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x X3 = À + À 


Figure: 10.1 - Exemple de calcul de la pente moyenne 


Remarque: À signifiant "un delta” exprime le fait que nous sous-entendons une différence d'une 
même quantité. 


Nous supposerons comme évident (sans démonstration) que deux fonctions dont les pentes sont les 
mêmes dans un même intervalle de définition, y sont parallèles (ou confondues). 


Nous démontrerons dans le chapitre de Géométrie Analytique que deux fonctions dont la multiplication 
des pentes vaut -1 sont perpendiculaires. 


D2. Nous appelons "nombre dérivé en a" ou "pente instantanée" ou encore "dérivée première", la limite 
quand h tend vers 0 (si elle existe) du rapport de la projection orthogonale de deux points x # x 


infiniment proches de la fonction f continue (dans le sens qu'elle ne contient pas de "trous"') sur l'axe des 
abscisses et des ordonnées tel que: 


Le jm 9 JO - yo) (10.2) 


dx k-0 


Une interprétation graphique donne donc bien que f'(a) est le coefficient directeur (la pente de la tangente 
au point d'abscisse a). 


Remarques: 


R1. d signifiant un "différentiel" exprime le fait que nous sous-entendons une différence infiniment 
petite d'une même quantité. 


R2. Nous renvoyons le lecteur au chapitre d'Analyse Fonctionnelle pour la définition de ce qu'est une 
fonction continue. 


D3. Soit fune fonction définie sur un intervalle I et dérivable en tout point a de I, la fonction qui à tout 
réel a de 1 associe le nombre f'(a) est appelée "fonction dérivée de f sur l" et est notée f'. 
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Remarque: Au niveau des notations les physiciens adoptent suivant leur humeur différentes notations 
possibles pour les dérivées. Ainsi, considérons la fonction réelle à une variable f(x), vous trouverez 
dans la littérature ainsi que dans le présent site les notations suivantes pour la dérivée première: 


df (x) 
dx 


=d,f(9 = fG)= fx) (02 


d = 
ri (x) = 


ou encore en considérant implicitement que f est fonction de x (ceci permet d'alléger un petit peu la 
tailles des développements): 


Sp Las is (10.4) 


Nous pouvons de la même manière définir les dérivées d'ordre 2 (dérivée d'une dérivée), les dérivées 
d'ordre 3 (dérivée d'une dérivée d'ordre 2) et ainsi de suite. Nous rencontrerons par ailleurs très 
fréquemment de telles dérivées en physique (et même en maths pour l'analyse fonctionnelle). 


Précisons que les dérivées d'ordre 2 ont une interprétation très importante en physique et dans le domaines 
de l'optimisation (cf. chapitre de Méthodes Numériques). Effectivement, si le signe de la dérivée première 
est positif puis devient négatif quand x croît, alors nous devinons facilement que nous parcourons un 
maximum local d'une fonction (point où la dérivée est nulle) et que si le signe de la dérivée première est 
négatif puis devient positif quand x croît, alors nous parcourons un minimum local de la fonction (point où 
la dérivée est aussi nul). En d'autres termes, lorsque la pente change de signe (s'annule en changeant de 
signe) la fonction passe par un extremum (minimum ou maximum) et la tangente est "horizontale" en ce 
point: parallèle à l'axe des abscisses. Par contre, lorsque la dérivée d'ordre 2 (dérivée secondes) est nulle, 
c'est que la courbure de la fonction s'inverse. Nous parlons alors de "point d'inflexion". 


Voici un exemple très ludique d'une fonction avec sa dérivées première et seconde avec Maple 4.00: 


>plot([tanh(x),diff(tanh(x),x),diff(tanh(x),x$2)],x=-5..5,color-[red,green,blue]); 
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Figure: 10.2 - Plot de la fonction tangente hyperbolique, sa dérivée première et seconde 


Maintenant, suite à un problème de compréhension de la part d'un lecteur dans un des chapitres du site, 
précisons une technique utilisée fréquemment par les physiciens. Considérons une dérivée d'ordre 2 telle 
que: 


3 _n_d'f@)_ ddf)\_dfa 
RTE -F(22)-2(570) us 


Si nous regardons le d/dx comme un opérateur différentiel nous pouvons bien évidemment écrire: 


d{d d à 4 
LI) = para C0) = (2) JG) (06) 


Finalement nous avons: 


2 2 
Se -[ +) f(x) (10.7) 
x 


et donc il vient après simplification par f{x): 


sinon quoi nous ne pouvons pas avoir cette égalité si l'opérateur agit explicitement sur une fonction dans 
une relation mathématique ou physique quelconque. 
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Cela peut paraître évident pour certains mais parfois moins pour d'autres. et il était visiblement utile de 
préciser cela car c'est souvent utilisé dans les chapitres de Relativité Restreinte, Relativité Générale, 
Physique Quantique Corpusculaire et Physique Quantique Ondulatoire. 


Indiquons et démontrons maintenant deux propriétés intuitivement évidentes des dérivées et qui nous 
seront plusieurs fois indispensables pour certaines démonstrations sur ce site (comme par exemple dans le 
chapitre de méthodes numériques ou ici même...). 


Considérons d'abord deux nombres réels 4 <ë et fune fonction à valeurs réelles continue sur [a,b] et 
dérivable sur Ja,bl telle que f (a) = f (à). Alors nous voulons démontrer qu'il existe bien évidemment au 
moins un élément c de Ja,bl tel que f ‘(c) = Ô (c'est typiquement le cas des fonctions polynômiales!). 


Cette propriété est appelée "théorème de Rolle" et donc explicitement elle montre qu'il existe au moins un 
élément où la dérivée de f est nulle si en la parcourant nous revenons à la même valeur des images pour 
deux valeurs distinctes des abscisses, c'est-à-dire qu'il existe au moins un point où la tangente est 
horizontale. 


Démonstration: 
Si fest constante, c'est immédiat. 


Dans le cas contraire, comme f est continue sur l'intervalle fermé borné [a,b] elle admet au moins un 
minimum global ou maximum global compte tenu que nous nous basons sur l'hypothèse que 

J'(a) = f(à) et que f n'est pas constante. L'extrema est atteint en un point c appartenant à l'intervalle 
ouvert Ja, b[ (le fait de prendre l'intervalle ouvert permet dans certains cas d'éviter d'avoir un extrema à 
nouveau en a ou en b). 


Supposons comme premier cas que f{c) est maximum global. La dérivée de la fonction f entre c et un 
deuxième point a alors un signe connu. 


Pour h strictement positif et tel que c+h appartienne à l'intervalle [ab]: 


fC+H-10) 9 
À 


En considérant la limite quand h tend vers 0, le nombre dérivé f (£) est négatif. 


Pour h strictement négatif et tel que c+h appartienne à l'intervalle [a,b]: 


fC+h)-10 , 9 
hr 


En considérant la limite quand h tend vers 0, le nombre dérivé f'(c) est positif. 
Au bout du compte, la dérivée de f est nulle au point c. 


La démonstration est analogue si f(c) est un minimum global, avec les signes des dérivées qui sont les 
opposés. 


OIC.Q.F.D. 
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Maintenant, considérons deux réels 4 <& et f(x) une fonction continue sur [a,b] et dérivable sur ]Ja,bl. 
Alors, nous nous proposons de montrer qu'il existe au moins un réel € €], Ë[ tel que: 


F@)-f(a)=f(cXè-a) (ou) 


Ce qui peut aussi s'écrire sous la forme suivante: 
Lo +8) F0) = fo +s EE (1012) 
avec 5 €J0,I[. 


Géométriquement cela signifie qu'en au moins un point c du graphe de la fonction f(x), il existe une 
tangente de coefficient directeur: 


JE) — fa) 
b-a 


(10.13) 


Graphiquement cela donne: 


1 
! 
! 
! 
1 


> 


(QI PS CS 


# b 


Figure: 10.3 - Représentation graphique du théorème de Rolle 
Démonstration: 


Nous avons d'abord: 


J@)- fa) 


h(x)=(x-a). rer 


+ f(a) (10.14) 
car la pente de A(x) est bien évidemment ( f(b) — f(a)){(b—a) et comme lorsque x = & nous devons 
avoir f(a) il s'ensuit donc la relation donnée précédemment. 


Ensuite, pour démontrer qu'un tel point c existe, l'idée est de rapporter les deux points a et b à la même 
ordonnée ce qui en fait nous ramène au théorème de Rolle et pour cela, nous définissons une fonction g 
par: 


_f@)-f(@) 
b— 


ä 


g(x) = j@-H0= 10 -|(x-0) +4@ | (10.15) 
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qui est telle qu'effectivement g(à) = g(&) … et en l'occurrence égal à 0 (mais cette valeur importe peu). 
Dès lors, le théorème de Rolle vu précédemment nous indique qu'il existe un point entre a et b où la 
dérivée de g(x) est nulle tel que g'{£) = 0 . Et en constatant que: 


sto=fto- OO) 
ba 


nous obtenons: 


ge) = fe) (10.17) 


f@)=f@) _; 
b-a 


Soit après simplification: 
f@)- f{a)= f')(b-a) (o18) 
OIC.Q.F D. 


Puisque le terme de gauche représente un accroissement fini du terme de droite, alors ce résultat est 
appelée "théorème des accroissements finis" (TAF). 


A l'aide de ce petit théorème et des outils mathématiques introduits précédemment, nous pouvons 
construire un petit théorème fort utile et puissant en physique. 


Définition: Nous appelons "règle de L'Hôpital" (également appelée "règle de l'Hospital" ou "règle de 
Bernoulli") le procédé qui utilise la dérivée dans le but de déterminer les limites difficiles à calculer de la 
plupart des quotients et qui apparaissent souvent en physique. 


Démonstration: 


Considérons deux fonctions f{x) et g(x) et telles que f {&) = g{æ) = 0 alors nous pouvons écrire: 


FX) _ f(a)x-a_ f(x)xra _ f(x) (a) x-a 


EE —— — 2 — = —— (10.19) 
g(x) g(G)x-a x-a g(x) x—a  g(x)-g(a) 


Alors selon la définition de la dérivée: 


PL D LC et 2 PE À 2 M A 
mag() me x-a g(i-g@)  (a+h)-a g@+h)-g(a) ga) 


CIC.Q.F.D. 


Nous pouvons généraliser ce résultat précédent initialement basé sur la contrainte un peu trop forte: 
f(a)=g(aæ)=0 (10.21) 
Démonstration: 


Rappelons donc que selon le théorème des accroissements finis, si f(x) est dérivable sur un intervalle ]a,b 
[et continue sur [a,b] alors il existe un réel c dans l'intervalle [a,b] tel que: 
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| b)— fa 
J'E)= FC) FQ) (10.22) 
b—a 
Si le théorème se vérifie pour deux fonctions satisfaisant aux mêmes contraintes alors nous avons deux 
fonctions telles que: 


ro LD à ç-EOTEG) on 
ba b-a 


Si g'(c) est non nul nous avons alors tout à fait le droit d'écrire le rapport (certains appellent cela le 
"théorème des accroissements fini généralisé"…): 


J'e) _Ff@)-fG@)  b-a  _ f@)-f(@) 


g'{c) b-a g)-g(a) g(b)-g(a) (10.24) 


ce qui sans perdre en validité tant que c est dans l'étau [a,x] peut s'écrire: 


J'E) _ fG)- fe) 


2) e-g@) 


Ainsi, lorsque x — & ce qui implique que l'étau [a,x] se referme et donc € — 4 nous avons: 


ira L O2 ti DL - + H) _ a+ f(@) (the _S@ 
#ag'(c) xag(x)-g(a) gla+h)-g(a) (a+h)-a gla+h)-g(a) ga) 


Ainsi, nous venons de prouver quand dans la démonstration précédente de la règle de l'Hôpital la relation: 


J@th)-f(@) (ath)-a _ f{a) 
(a+h)-a (a+k)-g(a) ga) 


(10.27) 
que nous avions est vraie en toute généralité et qu'il n'est pas nécessaire que f (&) = g(æ) = 0 soit vrai 


pour que le résultat soit juste! 


OIC.Q.F.D. 


1.1. DIFFÉRENTIELLES 


Nous avons indiqué précédemment ce qu'était un différentiel d. Mais il existe en fait plusieurs types de 
sortes de différentielles d'une fonction (remarquez que nous distinguons le genre masculin et féminin du 
terme): 


1. Les différentiels 

2. Les différentielles partielles 

3. Les différentielles totales exactes 
4. Les différentielles totales inexactes 


Rappelons que nous appelons "différentiel df" d'une fonction f à une variable la relation donnée par (voir 
texte précédent): 
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Cependant, pour exprimer l'effet d'un changement de toutes les variables d'une fonction f de plusieurs 
variables, nous devons utiliser un autre type de différentiel que nous appelons la "différentielle 
totale" (dérivée en deux sous-familles: différentielle totale exacte et différentielle totale inexacte). 


Soit par exemple, une fonction f{x, y) des deux variables x et y. L'accroissement df de la fonction f, pour un 
accroissement fini de x à x+ Ax et de y à y + Ày est: 


Àf = f(x+,y+2y)-f(y) (1029) 
que nous pouvons aussi écrire: 
À = fx +,y + dy) f(x. y+4y)+ f(x,y +4) — f(x,y) (10.30) 
ou encore: 


Ja + pt) fr +) |, fr + y) 7 f(x.y) 


Af = … À. 


Ày (10.31) 


Pour des accroissements infiniment petits de x et y: 


df = Him [AE + A + A) GT + 2) À |, + (2 ED à, —. 


äx 0 x y 
Intéressons-nous dès lors aux deux termes au passage à la limite: 


fx + dx, y + dy) - f(x,y + dy) " Jx,y + dy) f(x, y) 
dx dy 


Le premier terme de gauche, nous le voyons, ne donne finalement que la variation en x de la fonction f{x, 
y) en ayant y constant sur la variation. Nous notons cela dès lors (si la connaissance des variables 
constantes est triviale, nous ne les indiquons plus): 


Ê €] -2 - N- Jar dr.r à JGrt) 


et de même: 


(10.35) 


2 L# _JGr+d)- SG») 
: «D dy 


Remarque: Quand une variable est fixée pour étudier la variation de l'autre, certaines auteurs ou 
professeurs des anciennes générations aiment à dire: "toutes choses égales par ailleurs f varie en 
fonction de … de façon ...". Bref, c'est un usage que l'on retrouve dans d'autres domaines (comme les 
régression linéairs à plusieurs variables explicatives) mais qui se perd... 


Les deux expressions: 
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af af 
et CS (10.36) 
dy |, ôx }, 


sont ce que nous appelons des "différentielles partielles" ou plus simplement "dérivée partielle". 


Il vient dès lors: 


of df 
df == dx+—à ).37 
if Fe x | (10.37) 


qui est la "différentielle de f". Les thermodynamiciens parlent souvent eux de la "différentielle totale 
exacte de f" ou plus simplement "différentielle exacte de f". 


La relation précédente est un cas particulier de ce que les mathématiciens appellent en toute généralité une 


"forme différentielle": 
df = M{x,y)dx+ Nx,y}dy | (1036) 


nous y reviendrons un peu plus loin... Il est d'usage de noter: 


. F (x, 7 
= (10.39) 
Nx, y) 


donc sous forme d'un champ vectoriel. 


Il est important de se rappeler de la forme de la différentielle totale car nous la retrouverons partout dans 
des opérateurs particuliers en physique, dans la mécanique des fluides, dans la thermodynamique, etc. 


Géométriquement, les dérivées partielles peuvent être interprétées comme suit: la fonction f{x, y) définit 


une surface dans IR?, dont l'intersection avec la plan Y = Yo est une courbe: 
xk f(x Yo) (10.40) 


La dérivée partielle 8, f est alors la pente de cette courbe en tout point x. Nous avons alors naturellement 


la fonction suivante pour la pente au point {Xg,}g |: 
Ga 
FC Yo) = FC :Y0)+ A 0r20)(x— 2%) Goa1) 
De la même manière, la tangente à la courbe: 


»R (7) (104) 


aura pour expression: 
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F (0-7) = 16000)+ Xn»Yg ÜY—Ygi (043) 


Le plan localement tangent au point {X5,} | déterminé pas ses deux tangentes est alors donné par: 


8 6) 
LP = (ge) + À (90 IÜX— Xg +S Cox J(Y—}0}) (10.4) 


où nous reconnaissons la forme de la différentielle totale exacte en réarrangeant les termes: 


E- 


af 
—dx+——dy (10.45 
- à y (10.45) 
Ainsi, par exemple, la surface représentée par la fonction: 
f = Pa. De à (10.46) 


est représentée ci-dessous avec les deux tangentes passant par le point: 


(x,70)=(0.3,0.D (10.47) 


et dont les équations respectives sont: 


a di 

De ed F-ÿ 2x * “| ET 

üx 0.3,0.1 3,01 (10.48) 
= 0.905 — 0.543i x — 0.31= -0.543x +10679 

et: 

of. x yè = x 
LG. D = San) mm )o-0)=e d -2ye Ÿ Ÿ (y) 

6,2 039.1 039.1 (10.49) 


= 0.905-0.181(y- 0.11 =-0.181y+0.9231 


Figure: 10.4 - Les deux tangentes de la fonction au point d'intérêt 
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Nous avons le plan tangent en ce point qui est alors donné par: 


| 0. | | 
LG = fG0.20)+ 2) 30 || X— Xg + (x (y | 
8x (2, (10.50) 


Z 0.905 -—0.543(x—0.31-0.181( y — 0.1) = -0.543x- 0.181y + 1.086 


Figure: 10.5 - Les deux tangentes de la fonction au point d'intérêt avec la plan tangent 


Remarque: De la même manière, pour une fonction de plus de deux variables, par exemple f{x, y, z), la 
différentielle totale df est: 


Es 
#Ù] 


Dans l'équation ci-dessus, la différentielle df a été calculée à partir de l'expression de la fonction f. 
Puisqu'il existe une fonction f qui vérifie l'expression de df la différentielle df est dite alors aussi 
"totale exacte". 


df af af CA af 
dxt+t|=| d+|— dz = = dx + = dy + — dz 
i de]. : 2]. ôx : dy 5 dz nn 


Æ 


Profitons pour faire une indication importante sur l'utilisation des dérivées partielles par les physiciens (et 
donc dans les nombreux chapitres y relatifs du site). Nous avons vu plus haut que si f dépend de deux 
variables x, y nous avons: 


Y ,..®# 
df ==—dx+=—dy (10.52 
f Ha) (0 
et s'il ne dépend que d'une variable nous avons alors: 
df = LS (10.53) 
ôx 


et alors: 
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LE A (10.54) 
dx  ôx 


raison pour laquelle les physiciens mélangent allègrement les deux notations... 


Maintenant, il faut cependant savoir qu'il existe également des différentielles totales exactes qu'aucune 
fonction ne vérifie. Dans ce cas, nous parlons de "différentielle totale inexacte" et pour déterminer si une 
différentielle totale est exacte ou inexacte, nous utilisons les propriétés des dérivées partielles (cas très 
important en thermodynamique! !!). 
Soit la fameuse forme différentielle générale (cela fait appel à de la géométrie différentielle): 

az = Mix, y)dx + N(x,y)dy (10.55) 


où M(x, y) et N(x, y) sont des fonctions des variables x et y. Si dz est une différentielle totale exacte, alors: 

& & 

dz = —dx+— dy (1056) 

ôx dy 

Il faut donc que in extenso: 
& 
MG» = et ND = (1057) 
äx dy 


ou encore, en effectuant une seconde dérivation, que: 


_4M 9 &)- dz 


e — — 
dy Ox | dy 


En (le dyâx 
pour que la forme différentielle, soit une différentielle totale exacte. 


Avant de continuer, nous avons besoin d'un résultat donné par le "théorème de Schwarz" (mais qui a été 
démontré à la fin du 17ème siècle par un des frères Bernoulli) qui s'énonce de la manière suivante: 


Soit une fonction f, si: 


ag À 4? 
HS et PE (10.59) 

"&" d' xdy  dyêx 
sont continues alors nous avons (il faut vraiment vérifier que ce soit le cas!) un résultat très important dans 
la pratique: 


4 ÿ 
(A 0-Yo) = e 


+ Fo: Yo) (10.60) 


pour tout (%,30)€ © où U est le domaine de définition où f est continue (et donc dérivable). 


Démonstration: 


Nous considérons l'expression: 
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À = Go + &, Yo + #) — fCro + £, Yo) — F(x0, Yo + #) + (x0. Yo) 


Posons: 


g(2):= FG, yo +) — Go) et 0): Go + £, >) — Fo.) 


Nous avons alors: 


À = gro + &) - gx) = WO0 +4) W(Ya) (10.63) 


Par le théorème des accroissements finis: 


= go + &) - gGxo) = L' gx + sk) 
ÆH = w(ÿo + 4) wyo) = w'Oyo +14) 
(10.64) 


avec 5,£€]0,1[. En reprenant les définitions de g et w nous obtenons: 


(10.61) 


(10.62) 


H = &: g'(xo +5) = [D rek0 + tro + ot») 


B = he On +80) = he D (a + k, 90 + 2h) Lago + 4) 
dy dy 


(10.65) 


en appliquant à nouveau le théorème des accroissements finis aux deux membres entre parenthèses nous 


trouvons: 


(ro + sk, Yo + 5h) 


2 
H=k'h: A 
dyôx 
af - 
A = he EE (0 + 2,90 + 0) 
axdy 


(10.66) 


avec 5, el0,1[. Pour finir: 


2 
ER + 5k, Jo + 5h) = 


a 
dvâx _. (xo + k, Yotéh) (10.67) 


et par continuité lorsque #,# — 0, nous avons: 


4 a 
RCA 00) = FL Go) (10.68) 


Plus simplement écrit: 
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PF _Pf 


—— =——| (10.69) 
dydx  dxdy 


Donc si f s'exprime sous forme différentielle totale exacte alors les différentielles croisées sont égales (la 
réciproque n'est pas forcément vraie). 


OIC.Q.F.D. 


Par récurrence sur le nombre de variables nous pouvons démontrer le cas général (c'est long mais c'est 
possible, nous le ferons si besoin il y a...). 


Donc finalement pour en revenir à notre problème initial, nous avons donc: 


8?z 8?z 


dxdy  dyax 


(10.70) 


Ce qui nous donne finalement la "condition de Schwarz": 


C'est donc la condition que doit satisfaire une forme différentielle pour être une différentielle totale exacte 
et la condition qu'elle ne doit pas satisfaire pour être une différentielle totale inexacte!!! C'est une 
propriété très important pour l'étude de la Thermodynamique! 


Afin de ne pas confondre les deux types de différentielles, nous utilisons le symbole 3 pour représenter 
une différentielle totale inexacte: 


ôz=Maäx+Ndy (10.72) 


et d pour une différentielle totale exacte: 
dz = Maäx+ Ndy (10.73) 


La distinction est extrêmement importante car seules les différentielles totales exactes qui satisfont donc: 


ont une intégrale qui ne dépend que des bornes d'intégration (puisque toutes les variables changent en 
même temps). Dès lors les différentielles totales inexactes dépendent des bornes d'intégration, ce qui 
signifie que: 

Z2 

J8z #2; -2 (0.75) 

ZA 


et donc: 
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Ÿ Ôz Æ0 (10.76) 


Alors que (voir plus loin la partie traitant des intégrales curvilignes): 
Z 
I=Zz, -Zz = (077 


Z 


soit (voir la démonstration détaillée plus loin lorsque nous traiterons des intégrales curvilignes): 
ba =0 (10.78) 


Autrement dit, la variation d'une fonction dont la différentielle est totale exacte, ne dépend pas du chemin 
suivi, mais uniquement des états initiaux et finaux car elle s'exprime comme le gradient d'une fonction 
(voir la démonstration par l'exemple dans le chapitre d'Électrostatique quand nous vérifions que la 
différence de potentiel est indépendante du chemin). Nous appelons une telle fonction qui satisfait à une 
différentielle totale exacte en physique, une "fonction d'état" et en mathématique une "fonction 
holomorphe" (voir le chapitre d'Analyse Complexe pour plus de détails), c'est-à-dire une fonction dont la 
valeur ne dépend que de l'état présent et futur, et non de son histoire. 


Cette distinction est très importante et particulièrement en thermodynamique où il convient de déterminer 
si une quantité physique est une différentielle totale exacte (une "fonction d'état” donc) ou non afin de 
savoir comment évoluent les systèmes. 


Exemple: 


Un exemple important de forme différentielle en thermodynamique, est le travail élémentaire 5# d'une 
force exercée sur un corps en mouvement dans le plan Oxy, nous avons: 


ôW = Fodr=Fdx+tFdy (1079) 
Æ et F, ne dérivent pas nécessairement d'un même potentiel U(x, y) tel que: 


ou au 
8x y 


ä est donc une différentielle totale inexacte! 
1.2. DÉRIVÉES USUELLES 


Nous allons démontrer ici les dérivées les plus fréquentes (une petite trentaine) que nous puissions 
rencontrer en physique théorique et mathématique ainsi que certaines de leurs propriétés (en fait, nous 
allons toutes les appliquer dans les sections relatives à la Mécanique, l'Ingénierie, l'Atomistique, les 
Mathématiques Sociales, etc.). La liste est pour l'instant non exhaustive mais les démonstrations étant 
généralisées, elles peuvent s'appliquer à un grand nombre d'autres cas similaires (que nous appliquerons/ 
rencontrerons tout au long de ce site). 


1. Dérivée de x“: 


Partons d'abord d'un cas particulier, la dérivée de x*: 
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Soit donc a un réel quelconque fixé, alors: 


(a+) -@  . a +3ah+3ah +h-a . 3a°h+3ah° +# 
A "2 = |__| 
k-0 k &-0 kB k-0 k 


= lim 3a° +3ah + = 3? 


(10.81) 


Le nombre dérivé en a de la fonction cube est donc f ‘(a) = 34°. 


Nous pouvons généraliser ce résultat pour tout entier naturel positif ou négatif n et nous allons voir que la 
fonction f définie sur IR par f(x) = x* est dérivable et que sa dérivée f est définie par f {x} = #x*7. 


# 4-1 
D Can = DGA +Ca" à 
Le] 


… (a+h}-a* 
fe, EE = im © 
&= 0 k &>Û k EÛ k 
OT Rue 
# x x X—, 
D Cia k° +a° -a D Cya hr se (10.82) 
im D Can" 
k-0 k k-0 ne 0e 
x—2 #| 
= ira | S Chat + CG | 2 CR 2 pa 
0 {x -1)l 


Ainsi, nous avons (quelques exemples peuvent être utiles pour comprendre la portée de ce résultat): 
FG= x = F2 = 2x 
fG=x = f'(x)=-x? (10.83) 


HOPRTERIO ETES 


Nous voyons donc qu'en ayant déterminé la dérivée d'une fonction de la forme x*, nous avons également 
déterminé la dérivée de toute fonction qui est mise sous cette forme tel que: 


l 
fG)=—=x" et f)=Vx= x"* (10.84) 
* 
Cependant, les fonctions: 


1 +./@ PER 


ne sont pas dérivables en x = Q puisque la fonction n'y est plus définie (division par zéro). De plus, en ce 
qui concerne la fonction comportant la racine (puissance non entière), la dérivée n'est pas définie dans 
EF 


Cependant, le résultat précédent donne un résultat intéressant pour les fonctions constantes telle que: 


SGD = CE = cx) (10.86) 


il n'est alors pas difficile de déterminer la dérivée qui vaut simplement: 
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FD =c" 0x =0 (1087) 


Donc la dérivée de toute fonction constante est nulle (il est important de se souvenir de ce résultat quand 
nous étudierons les propriétés des intégrales) !!! 


2. Dérivée de la fonction f{x)=cos(x): 


Soit donc a un réel quelconque fixé, alors (attention! il est utile de connaître les relations trigonométriques 
remarquables que nous démontrons dans le chapitre de trigonométrie dans la section de géométrie): 


. fath+al. [ath-a 
D de —2 sin sin ; 
a EE 
#0 k #0 À 
. f2athl. (x . [A 
—2sin sin | — sin | — (10.88) 
2 2 . f2ath l:: 2 , 1 
= lim =lim| -2sin — lim = —-2 sin(a)— 
k=Û à k-Ù 2 2 #0 Le 2 
2 
= — sin(a) 
Puisque: 
litn _- G) =] (10.89) 
x 0 x 


Effectivement, rappelons que la fonction sin(x) est assimilable (visuellement et mathématiquement) à une 
droite de fonction f (x) = x au voisinage de x +0. 


Donc pour résumer: 
(x) = cos(x) = f(x) = -sin(x) (10.90) 
3. Dérivée de la fonction f{x)=sin(x): 


Soit donc a un réel quelconque fixé, alors (attention! il est utile de connaître les relations trigonométriques 
remarquables que nous démontrons dans le chapitre de Trigonométrie dans la section de géométrie): 


ath+tal. [ath-a 
inta+ 3) —sin(a) 2cos D sin 9 
Fe cn 2 IP 
E0Û k #0 k 
2cos __! sin : sin è 10.91 
| 2 2] . 2a +h\\ 1. 2 Fo 
= lim = lim] 2cos —lim = 2cos(a)— 
k=Û h k+0 2 2 #0 À 2 
2 
= cos(a) 


Donc pour résumer: 


F(x)= sin(x) = f(x) = cos(x) (10.92) 


Page: 707/4839 


[v3.0 - 2013] 


4. Dérivée de la fonction log, (x): 


La dérivée de la fonction log, (x) est égale à M log, (e), c'est-à-dire si: 


y = f(R) =log,(x) (10.93) 


alors: 
! L l 
y'= fr 7 log (e) (10.94) 


Démonstration: 


Si Ây est l'accroissement de la fonction y = 1og,(x) pour un accroissement correspondant Âx de la 
variable x, alors: 


y + Ày = log, (x + Ax) 


Ày = log, (x + Ax) -log, (x) = log, è 


10.95 
LE os, [1+ ©) ( ) 
x 


et nous pouvons écrire: 


1 Âx 
D = og, (+) (10.96) 


Multiplions et divisons par x l'expression figurant dans le membre droit de la dernière égalité: 


LR A 14 . 142 ” (10.97) 
x x Âx x x x 


Désignons la quantité — par &. Il est évident que æ — 0 quand Âx tend vers zéro pour un x donné. Par 
x 
conséquent: 


4 _1 _ 
— = —| 1+æ 
ed og(1+@æ)a (10.98) 


Or, nous retrouvons ici une autre provenance historique de la constante d'Euler (cf. chapitre d'Analyse 
Fonctionnelle) où: 
: 
iml+aæ)* =e (10.9) 
+ 0 
Ainsi: 


Ày l L. À 
y = fin 2e lim log, (1+ a) : — 1084 (e) (10.100) 
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CIC.Q.F.D. 


Un cas particulier important est le cas où a=e. Nous avons alors: 
—. 
y =in(x)=y'=— (10.101) 
x 


5. Dérivée d'une somme de fonctions: 


Soient u et v deux fonctions. La fonction somme s = &# +v est dérivable sur tout intervalle où u et v sont 
dérivables, sa dérivée est la fonction s' somme des fonctions dérivées u' et v' de u et v. 


Ce résultat se généralise pour une somme d'un nombre quelconque fixé de fonctions. 
Démonstration: 
Soient a un réel fixé et u et v deux fonctions définies et dérivables en a: 


Qu +v)(a +h) -(u+vi(a) | lim“ + h) + via + h) -u(a) - via) 


lim 

&-—0 k &=0 kB 

: lim *@ +h)-u(a)+v(a+h)-v(a) _ im u(a+h)-u(a) re via +h)-v(a) (10.102) 
k=0 h k=0 ps #0 k 


= u'(a) + va) 
Donc la dérivée d'une somme est la somme des dérivées. 


CIC.Q.F.D. 


6. Dérivée d'un produit de fonctions: 


Soient u et v deux fonctions. La fonction produit ? © #°V est dérivable sur tout intervalle où u et v sont 
dérivables, sa dérivée première est la fonction p'telle que: 


p'=u'v+uv' (10.103) 
Démonstration: 


Soient a un réel fixé et u et v deux fonctions définies et dérivables en a: 


bim (uv)(a +h)—(uv)(a) | Lim u(a + kjv(a + h)-u(aïv(a) 


im p 1m ps (10.104) 


Nous rajoutons à cette dernière relation deux termes dont la somme est nulle tels que: 
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lim u(a+h}jv(a+h)-u(a)v(a) | lim u(a + hjv(a + h) -u(a)v(a + h) +u(a)v(a + k) - u(a)v(a) 


k-0 k 0 k 
ua+hjv(a+hk)-u(a)v(a+hk) .. u(ajv(a +h) -uia)v(a) 
ln k M h 
: nf + k) -u(a) +»]+ tr [ hk)- via) x) 
E-0 h 
= li es + h) + hr RTE en 
= u'(a}v(a) +u(a)v'{a) 
(10.105) 


CIC.Q.F.D. 


Mais il existe une formulation plus générale que la dérivée première d'un produit: 


Considérons pour cela toujours nos deux fonctions u et v, n fois dérivables sur un intervalle I. Alors le 
produit uv est n fois dérivable sur I et: 


n 
(uv) = D Cul EE) (10.106) 
k=0 


et ceci constitue la "formule de Leibniz" que nous avons utilisée dans le chapitre de Calcul Algébrique 
pour l'étude des polynômes de Legendre (qui nous sont eux-mêmes indispensables pour l'étude de la 
chimie quantique). 


La démonstration de cette expression est très proche de celle faite pour le binôme de Newton (cf. chapitre 
de Calcul Algébrique). 


Démonstration: 
Soit: 
YO =uv (10.107) 


(uv 


D'autre part: 
GO) _ D -0, (6) (0-5 _ (DO 
(uv) "= DC 00 OO Lun (0.108) 
k=0 
La relation est ainsi bien initialisée. 
La démonstration se fait par récurrence. Ainsi, le but est de montrer que pour Y# 0e N quesi: 
@) _© k) (m-k 
(uv) = 5 Cu 0109) 
k=0 


alors: 
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CH) Lt a+, (k). (2H) 
(uv) = 5 CE uv (10.110) 
k=0 
Nous avons donc: 
(uv)t#) . (Os | 1 S c? (vtr) | _ 5 ce ((L(® CE + 0 La ) ) 
k=0 


k=0 
(10.111) 


ñ ñ ñ 
= + C Ê | u (&-H) VE) + nu) EH) } = » ci 6H), (r —k) rs FE ss 100), frt-k) 
&=0 k=0 k=0 


Nous allons procéder à un changement de variable dans la première somme pour ne plus avoir le terme en 
k+1. Nous posons pour cela j = &+1: 
| #1 5 1 
» Cru ),,(r-k) > Crutye (D) (10.112) 
k=0 j=1 
Si nous revenons à la lettre k, nous avons donc: 
ñ rH 
2 Cru D GR) 2 ?, Cru D 0113) 
k=0 =] 
Nous avons donc: 
nH ñ 
(vtt) = Cri a HE) + > Cru RE (10.114) 
k=1 k=0 
Nous voulons réunir les deux sommes. Pour cela, nous écartons les termes en trop dans chacune d'elles: 
ñn ñn 
{uv} #) _ OAI nie Gi +5 Cu rte +3 Cru) Cr) + Cu (0),,(rt1-0) (10.115) 
k=1 k=1 
Ce qui donne donc: 


ñ ñ 
(uv)(#) = 4) + > Ci (9 EH) + Nr ct un 00), ,CrH1-k) ra Vf#) 


k=1 k=1 
(10.116) 


n 
= #0 +5 (ci +C? ji ais + 6H) 
kml 
D'après la formule de Pascal (cf. chapitre de Probabilités), nous avons: 
ce + ce _ ch 
ru TC =Cr (10.117) 


Donc: 


ñn 
Gay) =D LS CO PE ED 0118) 
el 
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Or: 


D 2 cr CC) Gt) 2 ot, OC) (0 110) 


Donc: 


rh 
(uv)(#) => CP nl (10.120) 
&=0 


OIC.Q.F.D. 
7. Dérivée d'une fonction composée: 


Soit la fonction composée f = g°4 de deux fonctions g et u dérivables, la première en u(x), la seconde 
en x, la fonction dérivée f' est définie par f' = (g'ou)u", c'est-à-dire: 


J'x)= g'&(x))'u'(x) (10.121) 
Démonstration: 


Soient a un réel fixé et u une fonction définie et dérivable en a et g une fonction définie et dérivable en u 


(a): 


in Eu) +h) - gou)(a) _;. gtu(a +) - gCu(a) 
k-0 h #0 h 


(10.122) 
posons &= u(a + k) = u(a) , ROUS avons alors: 

litn k = 0 92 

: û (10.123) 


continuons notre développement précédent: 


in suta+h)- gtu(a) _,, g&u(a)+#)- gta) _. g@ue)+ 2) - gta) k 


k0 h #0 h &=+0 k h 
eut) -gu@), k _L ga +k))- gta), u(a+x)-u() 
k-0 & k+0 }  K+0 & 0 k 


= g(&(a))'u (a) 


(10.124) 
OIC.Q.F.D. 


Donc la dérivée d'une fonction composée est donnée par la dérivée de la fonction multipliée par la 
"dérivée intérieure". Par ailleurs, ce type de dérivation est très important car souvent utilisé en physique 
sous la dénomination de "dérivation en chaîne". 


Voyons de quoi il s'agit. La dernière relation obtenue peut être écrite sous une autre forme si nous posons 
y = f(g(x) et u = gx): 
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1. 
À où oo 


8. Dérivée d'une fonction réciproque: 


Si la fonction f est continue, strictement monotone sur un intervalle 1, dérivable sur 1, alors la fonction 
réciproque f”! est dérivable sur l'intervalle {1) et admet pour fonction dérivée: 


1 


vef() (#7) ED) 


(10.127) 


En effet, nous pouvons écrire: 


ny =p= fx SO) (1012 
C'est-à-dire (application identité): 
x= fO)=S UG)= ST of) (0129) 
Par application de la dérivation des fonctions composées: 
SGG)'= SF") F2 = (2'=1 (0130) 
d'où: 


D À: | 
JO) 7 Fo) (10.131) 


Pour une variable x, nous poserons pour la dérivée de la fonction réciproque: 


£ 1 
FD'=—— (Go132) 


Jo) 
10. Dérivée de la fonction arccos(x): 


En utilisant le résultat précédent de la fonction réciproque, nous pouvons calculer la dérivée de la fonction 
arccos(x): 

FH" = (arccos(x))'= —l_- L. _ — : "il 1 

f'O) -sin@) sin(y) Â-cos (y) 1-x 


— (10.133) 


11. Dérivée de la fonction arcsin(x): 
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En utilisant le résultat précédent de la fonction réciproque, nous pouvons calculer la dérivée de la fonction 
arcsin(x): 


1 


TE ee ro Mer pi 


12. Dérivée d'un quotient de deux fonctions: 


FT (2)'= (arcsin(x))' = 


La fonction fŸ =u/{v est dérivable sur tout intervalle où les fonctions u et v sont dérivables et où la 
fonction v est non nulle et: 


Démonstration: 


La fonction f peut être considérée comme le produit de deux fonctions: la fonction u et la fonction 1/. 
Une produit de deux fonctions est dérivable si chacune d'elle est dérivable, il faut donc que la fonction 
u soit dérivable et que la fonction 1/v soit également dérivable ce qui est le cas quand v est dérivable non 


nulle. 
u\ th | 1\ u' -v'| u'v-uv' 
| = fu l'autel eu le — (0.136) 
y v v v v v v 


13. Dérivée de la fonction tan(x): 


CIC.Q.F.D. 


Par définition (cf. chapitre de Trigonométrie) nous avons: 


sin(x) 


J{x) = tan(x) = CE 


(10.137) 


et en appliquant donc la dérivée d'un quotient vue précédemment, nous avons: 


2 : 2 
f'@= cos“ (x) + sin“ (x) : 1 6 


cos?(x) cos? (x) 
ou encore: 


. 2 
GER RES one 


F'@) = 


cos 2x cos?(x) 
14. Dérivée de la fonction cot(x): 


Par définition (cf. chapitre de Trigonométrie), x # &'x7 (te Z): 


(x) = cot(x) = =G 5 (10.140) 
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et donc (dérivée d'un quotient à nouveau): 


1+ tan? (x) 1 2 
ES I , 
JF'(x) iQ Ari œ (cot" (x) +1) (10.141) 
ou encore: 
; __1+tan7(x) ER __cos’(z) : __ cos7(x) +sin?(x) _- : 
Le tan?(x) tan?(x) sin?(x) sin?(x) sin’(x) re 


15. Dérivée de la fonction arctan(x): 
Nous utilisons les propriétés dérivées des fonctions réciproques: 


l l 
VrxeR f'{x) = ———— = 414 
1+ tan? {arctan(x))  1+ Fa D 


16. Dérivée de la fonction arccot(x): 
Selon la même méthode que précédemment: 


VreR —— — | 
1+cot” (arccot(x)) 1+x 


3 (10.144) 


17. Dérivée de la fonction #*: 


Nous verrons lors de notre étude des méthodes numériques (cf. chapitre de Méthodes Numériques) que le 
"nombre d'Euler" peut être calculé selon la série: 


qui converge sur IR . En dérivant terme à terme cette série qui converge, il vient: 


+o xF1 + PA 
VrxeR j{n- px — = =* (10.146) 
2 D Oér&-1l 


Ainsi l'exponentielle est sa propre dérivée. Ainsi, nous pouvons nous permettre d'étudier les dérivées de 
quelques fonctions trigonométriques hyperboliques (cf. chapitre de Trigonométrie), 


18. Dérivée de la fonction sinh(x): 


Rappel: 
sinh(x) = {a “ à ) (10.147) 
2 


Donc trivialement: 
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sinh'(x}) = { +e”) =cosh(x) (10.148) 


19. Dérivée de la fonction cosh(x): 


Rappel: 
cosh(x) = te +e”) (10.149) 
2 . 
Donc trivialement: 
1 1 x TX ! 
cosh'(x) = :( —@ ) = ginh(x) (10.150) 


20. Dérivée de la fonction tanh(x): 


Puisque par définition: 


sinh(x} 
tanh(x) = 10. 
(x) ARTE (10.151) 
Donc en appliquant la dérivée d'un quotient nous obtenons: 
2: 12 
tanh'(x)} = ue ne) = _— (10.152) 
cosh*(x)} cosh* (x) 


Ou encore: 


cosh? (x) - sinh?(x) _ = sinh?(x) _ : 


-tanh?(x) (10.153) 
cosh?(x) cosh?(x)} œ 


tanh'{x) = 


21. Dérivée de la fonction coth(x): 


Rappel: 


Yx # O,coth(x) = (10.154) 


1 
tanh(x) 
et donc: 


1-tanh?(x) ” 1 


— ————=1-coth2({x) (10155 
tanh? (x) tanh?(x) SAONE" 


coth'(x) = - 


22. Dérivée de la fonction arcsinh(x): 
Nous appliquons les propriétés des dérivées des fonctions réciproques: 


AS 10.156 
cosh(arcsinh(x)) 95) 
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Or (voir à nouveau le chapitre de Trigonométrie): 


1= cosh?(arcsinh(x)) _ sinh’(arcsinh(x)) = cosh?(arcsinh(x)) x? (10.157) 
et donc: 
1+x2 = cosh?{arcsinh(x}) (10.158) 
Etant donné que cosh ne prend que des valeurs positives, nous avons: 


cosh(arcsinh(x}) = 4 +x2 (10.159) 


Donc finalement: 


arcsinh'(x}) = ; 
_ (10.160) 
sf + x? 


23. Dérivée de la fonction arccosh(x): 
Nous appliquons les propriétés des dérivées des fonctions réciproques: 


l 
Vx 1 Rx) = — 
x arccosh'(x} Haha (10.161) 


Or selon la même méthode que précédemment: 
1= cosh?(arccosh(x}) = sinh?(arccosh(x)) =x- sinh?(arccosh(x}) (10.162) 
d'où: 
-1+x2= sinh?(arccosh(x}) (10.163) 
Etant donné que arccosh ne prend que des valeurs positives nous avons alors: 
sinh{arccosh(x)} = fe? -1 (10.164) 


Donc: 


Yx >1 arccosh'(x) = 


1 
(10.165) 
x? —] 


24. Dérivée de la fonction arctanh(x): 
En appliquant les propriétés des dérivées des fonctions réciproques: 


1 1 
Vre]l-LT  arctanh{x) = => 5566 
tan re 7 


25. Dérivée de la fonction arccoth(x): 
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En appliquant les propriétés des dérivées des fonctions réciproques si [x] >1: 


1 
1-coth{{arccoth(x})  1-x 


arccoth'{x) = 7 (10.167) 


26. Dérivée de la fonction 4”: 
Avec a >0: 
a” =expÜn(a”")) = exp(x'in(a)) (10.168) 
Donc (dérivée d'une fonction composée): 
J'{x) = exp(x'in(a))'in(a) = a" ‘In(a) (10.169) 
2. CALCUL INTÉGRAL 


Nous allons aborder ici les principes élémentaires et de base du calcul intégral. La suite (avec plus de 
rigueur) viendra en fonction du temps qui est à la disposition des responsables du site. 


2.1. INTÉGRALE DÉFINIE 


L'idée première du concept d'intégral est de calculer l'aire algébrique (surface) entre une courbe et son 
support: 


0| a b 


Figure: 10.6 - Aire (surface) à calculer sous une courbe continue bornée 


Une valeur approchée de l'aire sous une courbe peut être obtenue par un découpage en n bandes 
rectangulaires verticales de même largeur. En particulier on peut réaliser un encadrement de cette aire à 


l'aide d'une somme majorante A;, et d'une somme minorante À, pour un découpage donné. 
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4 Ÿ 


= rl y = f(x) 


X x 
& b es b 


Somme minorante Somme majorante 


Figure: 10.7 - Représentation graphique des sommes majorante ou minorante 


Supposons que le nombre n de bandes tende vers l'infini. Comme les bandes sont de même largeur, la 
largeur de chaque bande tend vers 0 (objectivement il n'est pas nécessaire que la largeur des sous- 
intervalles du découpage soit la même partout). 


Si les sommes À;, et À, ont toutes deux une limite lorsque, le nombre n de bandes, tend vers l'infini, 
alors l'aire A sous la courbe est comprise entre ces deux limites. 


Nous avons: 


lim 4,£A4£limAs (0170) 


X*— w 
Si ces deux limites sont égales, leur valeur est celle de l'aire sous la courbe. 
D'où une première définition directe de l'intégrale définie ou dite "intégrale de Riemann": 


Soit un intervalle [a, b], divisé en n parties égales, soit fune fonction continue sur l'intervalle [a, b], soit 
À, la somme algébrique minorante et soit 4;,, la somme algébrique majorante. Nous appelons 
"intégrale définie" de f, depuis a jusqu'à b, notée: 

è 


[/G) dx (10.171) 


2 
le nombre À tel que: 


A = lim À, = lim A3 (10.172) 


pourvu que cette limite existe. Si cette limite existe, alors nous disons que f est "intégrable" sur [a, b] et 
l'intégrale définie existe. Le symbole: 


b 


Î (10.173) 


[ei 


n'est que que le symbole de la somme discrètre mais appliquée aux cas d'éléments infiniments petits. 
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Les nombres a et b de l'intégrale sont appelés les "bornes d'intégration": a est la "borne inférieure", b est 
la "borne supérieure". 


Intuitivement, il est évident que lorsque à = 4, nous étendons la définition ainsi: 
2 
[7@ dx =Q (10.174) 
2 


Enfin, signalons qu'il est tout à fait possible que l'intégrale soit négative ou même complexe puisqu'il 
s'agit d'une surface algébrique! 


Remarques: 

R1. D'autres lettres que x peuvent être employées dans la notation de l'intégrale définie. Ainsi si fest 
è è è 

intégrable sur [a, b], alors ff (x) dx = [Ed (£) dt = ff (s) ds etc. C'est la raison pour laquelle la variable 
2 2 2 


x de la définition est dite "variable muette". 


R2. Comme nous le verrons plus loin, il est essentiel de ne pas confondre "intégrale définie" et 
"intégrale indéfinie". Ainsi, une intégrale indéfinie, notée JF (x) 4x est une fonction, ou, plus 


précisément, une famille de fonctions appelées aussi "primitives de f" (voir plus bas) alors qu'une 


3 
intégrale définie, notée [f (x) dx est une constante. 
2 


Voyons une deuxième approche de définition de l'intégrale, un peu plus rigoureuse que la précédente 
(suite à la demande de plusieurs lecteurs). Nous utiliserons par tradition cette fois-ci, le S de la surface au 
lieu du A de l'aire. 


Soit fune fonction bornée sur [a, b]. Nous considérons une subdivision € de son support [a, b] que nous 
notons: 


T={ =4<X4 <X2... <Xn <4 =D) (10.175) 


où les intervalles ne sont pas obligatoirement de tailles équivalentes. 


Nous pour à = 1,2,3,...,#: 


m= inf _f() , M= sw _f | 
3€] 3; À et el x, x | (10.176) 
Définitions: 


D1. Nous appelons "somme de Darboux inférieure" associée à fet & la surface: 
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h 
Jab] 015 Dr x — Hu 
i= 


ab] (ff, 


Figure: 10.8 - Principe du calcul de la somme de Darboux inférieure 
D2. Nous appelons "somme de Darboux supérieure" associée à fet € la surface: 
ñ 


Sab] (f,oi= TM (X% —%1) 
i=1 


Sfa,b] (f,o1 


Figure: 10.9 - Principe du calcul de la somme de Darboux supérieure 


Une fonction est dite "Riemann-Intégrable sur [a, b]" si et seulement si les deux surfaces susmentionnées 
coïncident lorsque les intervalles deviennent infiniment petit. 


Le nombre correspondant à ces surfaces est alors appelé "l'intégrale de Riemann de f sur [a, b]|" est noté: 
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b 
[f(x)dx (10.177) 


a 
L'ensemble des fonctions Riemann-intégrables sur [a, b] est noté kb. 


Les sommes de Darboux ne sont pas très utiles pour le calcul effectif d'une intégrale, par exemple à l'aide 
d'un ordinateur, car il est en général assez difficile de trouver les inf et sup sur les sous-intervalles. On 
considère plutôt: 


Le] 
ab] À1= Dix x fix ou S b f)=>(x-%1l/(x%) Go178) 
gas] /= CES 


La somme de Riemann se définit à partir du fait que nous notons: 


ÂX; =X%—% 1 (10.179) 


et que: 

f(x)=f(&) (0180) 
où: 

& e[x1,x] ao 
Dès lors: 


Se qas](fi= Sfar (fie LA i& IA (10.182) 


Mais comme il faut bien choisir un é;, souvent on prend soit celui à droite, soit celui à gauche, dès lors en 
prenant au hasard la "méthode des rectangles à gauche": 


n 
Sz> f(x%1)lAx (10183) 


i=] 


Ce qui nous donnerait pour l'exemple ci-dessous: 
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y 


b= Xx4 


Figure: 10.10 - Principe du calcul de la méthodes des rectangles à gauche 
Soit: 


4 
S = DJS ix \Ax, = f \%p  Àx +fix À) + jf X3 \Àx +fix \Àx4 


i=1 


= JG) -%i+f)ie -%i+/(8)18 2 1+ fa) x 6) 


(10.184) 


Mais c'est facile pour une fonction en escalier. mais cela l'est moins pour une fonction continue pour 
laquelle nous n'obtiendrions qu'une valeur approchée de la surface réelle! L'idée est alors de prendre des 
intervalles de plus en plus petits: 


É AS 
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ÿ 


Figure: 10.11 - Principe du calcul de l'intégrale de Riemann avec la méthode des rectangles à gauche 


Et dès lors, à la limite, nous obtenons la quantité voulue: 


b 
| | f(x)dx (10.185) 


lim Àx; — 

a 
Le fait de chercher cette limite s'appelle "calculer l'intégrale", et plus spécifiquement de la méthode 
choisie: "intégrale de Riemann". 


2.2. INTÉGRALE INDÉFINIE 


Nous avons vu précédemment lors de notre étude des dérivées, le problème suivant: étant donnée une 
fonction F(x), trouver sa dérivée, c'est-à-dire la fonction: 


F'(x) = f(x) (10.186) 


Définition: Nous disons que la fonction F(x) est une "primitive" ou "intégrale indéfinie" de la fonction f 
(x) sur le segment [a, b], si en tout point de ce segment nous avons l'égalité F'x) = f(x). 


Une autre manière de voir le concept d'intégrale indéfinie est de passer par le "théorème fondamental du 
calcul intégral (et différentiel)" appelé aussi parfois "théorème fondamental de l'analyse" dont les 2 
propriétés s'énoncent ainsi: 
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Soit fune fonction continue sur un intervalle fermé [a, b]. 


x 
P1. Si À est la fonction définie par AfZ) = Il f{£)d£ pour tout X dans [a, b], alors A est la primitive de f sur 
2 


[a, b] qui s'annule en a (ou en d'autres termes: f{t) est la dérivée de A) 


; 
P2. Si F est une primitive de fsur [a, b], alors Î f(e)dt=F(b)-F(a). 


Démontrons la première propriété du théorème fondamental: 
Démonstration: 


Soit la fonction: 
X 
A(X) = [© dt (10.187) 


Si fest positive et # > O0 (la démonstration dans le cas où # <Q est proposée similaire) et comme X >&, 
nous pouvons nous représenter A(X) comme l'aire sous la courbe de f depuis ? = 4 jusqu'à += X. 


J 


x 


a X AH 
Figure: 10.12 - Représentation graphique de l'aire 


Pour démontrer que À est une primitive de f, nous allons prouver que À'= f . Selon la définition de la 
dérivée: 


A'(X) Pr)... 
&=+0 h 


Etudions ce quotient: A(X + #)- A{X) est représentée par l'aire de la bande de largeur h, prise en 
sandwich entre deux rectangles de largeur h. 


Soit M le maximum de fsur l'intervalle [| Æ,X4 + #] et m le minimum de f sur ce même intervalle. Les 
aires respectives des deux rectangles sont Mh et mh. 


Nous avons alors la double inégalité suivante: 
mh < A(X+hk)-A(X)<£Mh (10.189) 


Comme h est positif, on peut diviser par h sans changer le sens des inégalités: 
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Lorsque } — 0* et si fest une fonction continue, alors M et m ont pour limite f{X) , et le rapport: 
q P PP 


A(X+h)-A(X) 


(10.191) 
À 


qui est compris entre m et M, a bien pour limite f{X). 


Comme A'(X\)= f(X) pour tout X, ceci nous montre que la dérivée de la fonction aire est f. Ainsi A est 


une primitive de f. Comme A{a) = 0, A est bien la primitive de f qui s'annule en a. 
P 


CIC.Q.F.D. 


Avant de commencer la démonstration de la deuxième propriété du théorème fondamental, donnons et 
démontrons le théorème suivant qui va nous être indispensable: Si Æ(x) et Æ,(x) sont deux primitives de 


la fonction f{x) sur le segment [a, b], leur différence est une constante (ce théorème est très important en 
physique pour ce qui est de l'étude de ce que nous appelons les "conditions initiales"). 


Démonstration: 


Nous avons en vertu de la définition de la primitive: 


F0) = CG) 
F0) = f(x) 


(10.192) 
pour Vxe[a,b]. 
Posons: 
A(x)-Æ(x) = (x) (10.193) 
Nous pouvons écrire: 
F'C2) —F5(2) TAG) - EC)" = px) = f(x) — f(x) = 0 (10.194) 
Il vient donc de ce que nous avons vu pendant notre étude des dérivées que g{x) =c*. 
Nous avons alors: 
E(x)-Æ(x =c* (10195) 


CIC. Q.F.D. 


Il résulte de ce théorème que si nous connaissons une primitive quelconque F(x) de la fonction f{x), toute 
autre primitive de cette fonction sera de la forme: 
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F(x)+c* (10.196) 
Donc finalement, nous appelons "intégrale indéfinie" de la fonction f{x) et nous notons: 


[Car (10.197) 


toute expression de la forme F{x)+c* où F(X) est une primitive de f(x). Ainsi, par convention d'écriture: 


RE = F(x) +c*| ie 


si et seulement si F'{x) = f(x). 


Dans ce contexte, f(x) est également appelée "fonction à intégrer" et f{x)dx, “fonction sous le signe 
somme”. 


Géométriquement, nous pouvons considérer l'intégrale indéfinie comme un ensemble (famille) de courbes 
telles que nous passons de l'une à l'autre en effectuant une translation dans le sens positif ou négatif de 
l'axe des ordonnées. 


Revenons-en à la démonstration du point (2) du théorème fondamental de l'analyse: 

Démonstration: 

Soit F une primitive de f. 

Puisque deux primitives diffèrent d'une constante, nous avons bien: 
A(X)=F(X)jtc* (10199) 


ce que nous pouvons écrire aussi: 


X 


[FAQ dé = F(Æ}Hc* (10.200) 


2 


pour tout X dans [a, b]. Le cas particulier X = 4 donne [Æ (£) dt =0 et donc F(a)+c* =0 et 
2 


c* =-F{a). En remplaçant, nous obtenons: 
ff) dt=F(X)-F(a) (10201) 


Comme cette identité est valable pour tout X de l'intervalle [a ; b|, elle est vraie en particulier pour X = à. 
D'où: 
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CIC.Q.F.D. 


Ce dernier résulétat montre aussi quelque chose d'utile!: Il n'est pas nécessaire lorsque nous évaluaons une 
intégrale de prendre en compte la constante de la primitive générale puisque celle-ci s'annule de par la 
différence des deux primitives!! 


Remarques: 


R1. Le théorème fondamental qui montre le lien entre primitive et intégrale a conduit à utiliser le 
même symbole Il pour écrire une primitive (introduit par Leibniz à la fin du 17ème siècle), qui est 


une fonction, et une intégrale, qui elle, est un nombre. 


R2. Nous avons également démontré dans le chapitre de Mécanique Analytique comment calculer à 
l'aide d'une intégrale la longueur d'une courbe dans le plan si la fonction f{x) est explicitement connue. 


Voici quelques propriétés triviales de l'intégration qu'il est bon de se rappeler car souvent utilisées ailleurs 
sur le site (si cela ne vous semble pas évident, contactez-nous et nous le détaillerons): 


P1. La dérivée d'une intégrale indéfinie est égale à la fonction à intégrer: 
(f/@er) -(F@+e*)"= (0205) 
P2. La différentielle d'une intégrale indéfinie est égale à l'expression sous le signe somme: 


d | [ JGdx) = FAR (10.204) 


P3. L'intégrale indéfinie de la différentielle d'une certaine fonction est égale à la somme de cette fonction 
et d'une constante arbitraire: 


[ar = F(x)+c* (0.205) 


P4. L'intégrale indéfinie de la somme (ou soustraction) algébrique de deux ou plusieurs fonctions est 
égale à la somme algébrique de leurs intégrales (ne pas oublier que l'on travaille avec l'ensemble des 
primitives et non des primitives particulières!): 


[A (x) + jf, (x) Jdx = [AGdx + [4 (x)dx (10.206) 


Démonstration: 


Pour démontrer cela nous allons prouver que la dérivée du membre de gauche permet de trouver le 
membre de droite et inversement (réciproque) à l'aide des propriétés précédentes. 


D'après P1 nous avons: 


(fLAG) + A Gr) = (D +A(2) (10.207) 
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Vérifions s'il en est de même avec le membre de droite (nous supposons connues les propriétés des 
dérivées que nous avons démontrées au début de ce chapitre): 


(fAGEr + (A ar) = ([AGE) + ( (AG) = AG + LE 0200 
OC.Q.F.D. 
P5. Nous pouvons sortir un facteur constant de sous le signe somme, c'est-à-dire: 
[ef Car = c° [Gex (10.209) 
Nous justifions cette égalité en dérivant les deux membres (et d'après les propriétés des dérivées): 


| [“S Gdx)'= cf (x) 
(c* [ Far)" = c* | f FGDax)" = cf (2) 


(10.210) 


P6. Nous pouvons sortir un facteur constant de l'argument de la fonction intégrée (plutôt rarement utilisée) 


[/tandx - rar +c* (10.211) 
a 
En effet, en dérivant les deux membres de l'égalité nous avons d'après les propriétés des dérivées: 
i 1 te |: 
(ftanax) - [Fe +e | = f(ax) (10,212) 
a 


P7. L'intégration d'une fonction dont l'argument est sommé (ou soustrait) algébriquement est la primitive 
de l'argument sommé (respectivement soustrait): 


[7 +B)dx = F(x+b)+c* (10213) 


Cette propriété se démontre également identiquement à la précédente à l'aide des propriétés des dérivées. 


P8. La combinaison des propriétés P6 et P7 nous permet d'écrire: 
1 e 
[7 {ax + b)dx =—F(ax+b)+c" (10.214) 
a 


P9. Soit fune fonction continue sur [a,b], nous avons pour tout c appartenant à cet intervalle: 
à € à 
[ftoax=[ f(ax+ [fax (0215) 
a a Ê 


Ce théorème, appelé parfois "relation de Chasles" (de par son pendant vectoriel), découle immédiatement 
de la définition de l'intégrale indéfinie. F étant une primitive de f sur [a,b] nous avons: 


F(c)-F(a)+F@)-F(&)=F@)-F(a) (10.216) 
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P10. Voilà une propriété souvent utilisée dans le chapitre de Statistiques du site (nous ne trouvons pas de 
moyen d'exprimer cette propriété par le langage courant donc...): 


ky) 
L [ FO - _ FAO) - FG))) = Fu) 220 


Elx) 


= ptet) 0) - 


Es F7 FDA O7) 


(10.217) 
Voyons deux propriétés qui nous seront parfois utiles pour calculer des intégrales difficiles: 


P11. Si une fonction est paire (cf. chapitre d'Analyse Fonctionnelle), l'intégrale sur des bornes symétriques 
équivaut à: 


+ I] +L (il +L 


[fGoax= | féax+ | fox = | femax+ | fax 
=I -L ( 1 0 


. . . . (10.218) 
Er d'eau + | far | seau + | rGax= 2 | (ax 
=—X [1 0 0 0 (il 


P12. Si une fonction est impaire (cf. chapitre d'Analyse Fonctionnelle), l'intégrale sur des bornes 
symétriques équivaut à: 


- . . : ” 

| J(x)dx = | F(x)dx + | J{x)dx = | — f{—x)dx + | f{x)dx 

ce _ ÿ Le À (10.219) 
+L +L +2 +L 

= | JCnar+ | fox = - | f(wjdu+ | f(Ddx=0 
0 0 TL 0 


2.3. INTÉGRALE DOUBLE 


L'idée des intégrales doubles est de mesurer le volume de la zone délimitée par le graphe d'une fonction 
de deux variables, au-dessus d'un domaine D du plan (ci-dessous D est rectangulaire). 
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Figure: 10.13 - Exemple d'une fonction à deux variables au-dessus d'un domaine 


Il va sans dire que les intégrales doubles sont extrêmement importantes aussi dans tout le domaine des 
mathématiques appliquées! 


Là encore, l'idée est la même que l'intégrale définie. Si nous adaptons une approche simpliste, nous 
décomposons la fonction continue en un escalier et le volume à calculer se réduit alors à faire la somme 
des volumes de parallélépipèdes: 


_-] Se 
Figure: 10.14 - Décomposition du volume en parallélépipèdes grossiers 


Dès lors: 
Va fix.) Axdy = fix, AY; A; (10.220) 


Pour une fonction continue, nous procèdons par approximations successives: nous calculons des sommes 
de Riemann pour des subdivisions de plus en plus fines du domaine D: 
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tj 


--2 
Figure: 10.15 - Décomposition du volume en parallélépipèdes de plus en plus fins 


et donc à la limite: 
Vallfixyidrd= || fixpiddr 6, 
D D 


Par contre, quand on veut intégrer sur un domaine qui n'est pas rectangulaire, les choses se compliquent à 
priori... Voyons comment contourner le problème. 


Pour cela, nous allons construire le domaine D fermé borné de la façon suivante. 


x € [a,b] 


ixyieos 
sd y e[u(D,vt] 


(10.222) 


où le lecteur aura remarque que le support de y est la variable x par l'intermédiaire de deux fonctions u et 
v. C'est ce que nous appelons alors un "domaine du type [" (et donc si c'est y qui paramétrise x alors il 
s'agit domaine de type II). 


Ce qui peut s'illustrer par la figure ci-dessous: 
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(e] ä x b 


Figure: 10.16 - Exemple d'un domaine de typel 


où nous remarquons que cette approche simpliste (il existe d'autres approches possibles mais qui 
nécessitent de faire appel à la théorie de la mesure) nécessite que le domaine soit simplement connexe 
(qu'il n'y ait pas de trous hors du domaine D entre u(x) et v(x)) ou décomposé en sous-domaines disjointes 
simplement connexes. 


Indiquons que dans la pratique (voir les différents chapitres du site et particulièrement celui sur les 
Formes Géométriques) les doubles intégrales se font souvent sur des volumes de révolution ce qui 
simplifie considérablement la paramétrisation. De plus, nous verrons plus loin qu'il est possible de change 
de système de coordonnées pour simplifier encore plus les doubles intégrales, ce qui fait que la 
paramétrisation semble disparaître. 


Bref, nous pouvons donc intégrer de la manière suivante: 


b[ vCx) 
Well fy)dxdy= || | f(xy)dy|dx (10.223) 
D au(x) 


Donc nous transformons l'intégrale double en deux intégrales simples emboîtées. 
2.3.1. THÉORÈME DE FUBINI 


Nous allons voir un théorème important utilisé à de nombreuses reprises dans différents chapitres du site 
et qui permet d'inverser l'ordre d'intégration. 


En se rappelant que: 


xE [a,b] 


ixyieDs 10.22: 
F7 y [uv] 


nous pouvons aussi utiliser: 
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yelc.d] 
x e[aæ(y), 80] 


(10.225) 


sens] 


Ainsi avec cette paramétrisation nous pouvons écrire: 


. b[ v@x) a( 8) 
F= | fGyjdxdy= || | fc» ldx= || | f@yax|dy (0226) 
D a \ au x) c Lay) 


Nous pouvons ainsi changer l'ordre d'intégration, le calcul est différent, mais le résultat est le même. Mais 
ce n'est pas cela qui nous intéresse en réalité ici. 


Considérons une fonction telle que: 


Fy)= Ex) y) (10.227) 


Alors: 
es b[ vGx) b[ vCx) 
W=Il F(x,.y)dxdy = | | Jx, y)dy dx = | | x) y)dy |dx (10.228) 
D a Lux) au(x) 


Supposons que le domaine est un rectangle (nous faisons cette simplification sinon la démonstration se 
complique nettement). C'est-à-dire: 


xE[a,b] 


—. Le a] (10.229) 


snenesl 


Dès lors par la propriété de linéarité des intégrales: 


“ 2: È _ 
F=l| | xw0)ay a row Jar (x) vo 


a Lux) ac a c 


(10.230) 


b fé à > à 
= [et L on la = [ vo | goax = | p(odr | >)d 


a Ce) [ey a a [ey 


2.4. INTÉGRATION PAR CHANGEMENT DE VARIABLES 


Lorsque nous ne pouvons facilement déterminer la primitive d'une fonction donnée, nous pouvons nous 
débrouiller par un changement de variable astucieux (parfois même très subtil) pour contourner la 
difficulté. Cela ne marche pas à tous les coups (car certaines fonctions ne sont pas intégrables 
formellement) mais il vaut la peine d'essayer avant d'avoir recours à l'ordinateur. 


À nouveau, nous ne donnons que la forme générale de la méthode. C'est le rôle des professeurs dans les 
écoles d'entraîner les élèves à comprendre et maîtriser ce genre de techniques. De plus, les chapitres 
traitant des sciences exactes sur le site (physique, informatique, astrophysique, chimie, .) regorgent 
d'exemples utilisant cette technique et servent ainsi implicitement d'exercices de style. 
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Soit à calculer l'intégrale (non bornée pour l'instant): 


[/Gdx (10.231) 


bien que nous ne sachions pas calculer directement la primitive de cette fonction f{x) (en tout cas nous 
imaginons être dans une telle situation) nous savons (d'une manière ou d'une autre) qu'elle existe (nous ne 
traitons pas encore des intégrales impropres à ce niveau). 


La technique consiste alors dans cette intégrale à effectuer le changement de variable: 
x =@{£) (10.232) 


où 4£) est une fonction continue ainsi que sa dérivée, et admettant une fonction inverse. Alors 
dx = @'(f)dt, démontrons que dans ce cas l'égalité: 


[# (x)dx = [# ((E))@'E)dt (10.222) 


est satisfaite. 


Nous sous-entendons ici que la variable t sera remplacée après intégration du membre droit par son 
expression en fonction de x. Pour justifier l'égalité en ce sens, il suffit de montrer que les deux quantités 
considérées dont chacune n'est définie qu'à une constante arbitraire près ont la même dérivée par rapport à 
x. La dérivée du membre gauche est: 


(fr) = f(x) (10.234) 


Nous dérivons le membre droit par rapport à x en tenant compte que t est une fonction de x. Nous savons 
que: 


== PE) (10.235) 
Nous avons par conséquent: 
d d dé 1 : . 
O0 (PC 0) 2007 CO) 20 0-70) (026 


Les dérivées par rapport à x des deux membres de l'égalité de départ sont donc égales. 
[IC.Q.F.D. 


Bien évidemment, la fonction x = 4£) doit être choisie de manière à ce que nous sachions calculer 
l'intégrale indéfinie figurant à droite de l'égalité. 


Remarque: Il est parfois préférable de choisir le changement de variable sous la forme £ = 4x) au lieu 
de x = W£) car cela à une large tendance à simplifier la longueur de l'équation au lieu de l'allonger. 
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2.4.1. JACOBIEN 


Considérons un domaine D du plan u,v limité par une courbe L. Supposons que les coordonnées x,y soient 
des fonctions des nouvelles variables u,v (toujours dans le cadre d'un changement de variables donc) par 
les relations de transformations: 


di sun 
ane D KefeD' 


(10.237) 
où les fonctions g,v) et #{u,v) sont univoques, continues et possèdent des dérivées continues dans un 
certain domaine D' que nous définirons par la suite. Il correspond alors d'après les relations précédentes à 
tout couple de valeurs u,v un seul couple de valeur x,y et réciproquement. 


Il résulte de ce qui précède qu'à tout point P(x,y) du plan Oxy correspond univoquement un point P'(u,v) 
du plan Ouv de coordonnées u,v définies par les relations précédentes. Les nombres v et u seront appelées 
"coordonnées curvilignes" de P et nous verrons des exemples concrets et schématisés de ceux-ci dans le 
chapitre de Calcul Vectoriel. 


Si dans le plan Oxy le point P décrit la courbe fermée L délimitant le domaine D, le point correspondant 
décrit dans le plan Ouv un certain domaine D. Il correspond alors à tout point de D'un point de D. Ainsi, 
les relations de transformations établissent une correspondance biunivoque entre les points des domaines 
D et D'. 


Considérons maintenant dans D'une droite x; = £*. En général, les relations de transformation lui font 
correspondre dans le plan Oxy une ligne courbe (ou inversement). Ainsi, découpons le domaine D' par des 
droites x =" et y =“ en de petits domaines rectangulaires (nous ne prendrons pas en compte dans la 
limite, les rectangles empiétant sur la frontière de D"). Les courbes correspondantes du domaine D 
découpent alors ce dernier en quadrilatère (définis par des courbes donc). Évidemment, l'inverse est 
applicable. 


Considérons dans le plan Ouv le rectangle As' limité par les droites: 


u = cu + Au =c* 


(10.238) 


t & 
v=c" v+Av=c 


et le quadrilatère curviligne correspondant Às dans le plan Oxy. Nous désignerons les aires de ces 
domaines partiels également par Às' et As. Nous avons évidemment: 


Às'= AgAY (10.239) 
Les aires As' et As peuvent être en général différentes. 


Supposons donc dans D une fonction continue Z = f(x,y). Il correspond à toute valeur de cette fonction 
du domaine D la même valeur z = Fu,v}) (ce qu'il faut vérifier) dans D', où: 


Fliu,vi=fix,yi= fiœiu,vi,giu,vil (10.240) 


Considérons les sommes intégrales de la fonction z dans le domaine D. Nous avons évidemment l'égalité 
suivante: 
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D fps = 5 F(u,v)As (10.241) 
Calculons Às , c'est-à-dire l'aire du quadrilatère curviligne 4 ,Æ,,8 ,Æ dans le plan Oxy: 
Déterminons les coordonnées de ses sommets: 


Æix,}Ni 2% =@iu,vi Y = iu,vi 
BiX3,Yal Xa = @iut+ Âu,vi Ja = Plu + Au,vi 


(10.242) 
BIiX%,731 2 = @iut+Au,v+Avi y, = diu + Au,v+ Avi 


HR ix4,Val 24 = @iu,v+ | Da = Piu,v + Avi 


Nous assimilerons dans le calcul de l'aire du quadrilatère 4,Æ,,8,Æ les arcs AB ,BE,E2E,EE à des 
segments de droites parallèles. Nous remplacerons en outre les accroissements des fonctions par leurs 
différentielles. C'est dire que nous faisons abstraction des infiniment petits d'ordre plus élevé que Aux et 
Av. Les relations précédentes deviennent alors: 


X = Piu,vi Yi = Pin, vi 
#3 = piu,vi+ 2 Au Ya PR a 
Qu die 
(10.243) 
soi EAP, nedlive Pass, 
du dv du dv 
PT) Le PR Pr md 


dv dv 


Sous ces hypothèses, le quadrilatère curviligne AE2ZÆ peut être assimilé à un parallélogramme. Son aire 
Âs est approximativement égale au double de l'aire du triangle A&Z , aire que nous pouvons calculer en 


utilisant les propriétés du déterminant (comme nous le démontrerons dans le chapitre d'Algèbre Linéaire, 
le déterminant dans EF? représente un parallélogramme alors que dans E* celui-ci représente le volume 


d'un parallélépipède): 
es (es 
sa | 11 4 
un 2% 


Tel que (c'est là qu'il faut faire le meilleur choix pour que l'expression finale soit la plus simple et la plus 
esthétique, nous procédons par essais successifs et faisons enfin le choix ci-dessous): 


As & [det(,,)|= |det(af)|= = lea - anal (10244) 


Page: 73714839 


[v3.0 - 2013] 


» 


Es (X3 — X2,Y3 Va) 


Ex, 2) 


EC — X,}3 = }) 


Figure: 10.17 - Représentation graphique du déterminant 


Ainsi, nous avons: 


Âs 2 |detiñ,, | -|Di£.8, | 


1% Xi 1Xz — Xl 
det 3 1 3 2 

(IBM! 1} 7} 
=lr-nim-mi-is-xix - mi 


L'EZTEZ 6, va un + La +] 


(10.245) 


RES -22%6 un 82 2226 
du dv dv — Ou dv dv du 
de îp 
= [deti Ji] Av =|det| 94 9v Las: 
PEUR 
du dv 


Par conséquent la relation suivante (contenant ce qu'il est d'usage d'appeler le "déterminant fonctionnel"): 


ep dp 
Às = |det 2 3 Às' (10.246) 
Gui dv 
avec: 
de êp 
J=|% ® (10.247) 
% 9% 
du dv 


qui est la "matrice jacobienne" (alors que son déterminant est appelé le "jacobien" (tout court)) de la 
transformation de coordonnées de IR? — R°. En appliquant exactement le même raisonnement pour K*, 
la matrice jacobienne s'écrit alors (en changeant un peu les notations car sinon cela devient illisible): 
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dP 8P 0 

du dv dw 

30 80 80 
JE EE El Los 

de nr 

OR OR KR 

du dv  dw 


Bref, à quoi cela sert-il concrètement ? Eh bien revenons à notre relation: 
Âs = dt J |As' (10.249) 


qui n'est finalement qu'approximative étant donné que dans les calculs de l'aire As nous avons négligé les 
infiniment petits d'ordre supérieur. Toutefois, plus les dimensions des domaines élémentaires As et As' 
sont petites, et plus nous nous approchons de l'égalité. L'égalité ayant finalement lieu quand nous passons 
à la limite (finalement en maths aussi on fait des approximations. hein !), les surfaces des domaines 
élémentaires tendant vers zéro: 


.…. À 
[deti J | = lim — (10.250) 
| As" 


Appliquons maintenant l'égalité obtenue au calcul de l'intégrale double (nous pouvons faire de même avec 
la triple bien sûr). Nous pouvons donc finalement écrire (c'est la seule manière de poser la chose qui ait un 
sens): 


Durs = S'F(uv)4s 


Ü (10.251) 
D fps & D F(u,vi(detiJ [As 


Passant à la limite, nous obtenons l'égalité stricte: 


[ fx, yidxdy = [Fe fdet iJ \|auav (10.252) 


Telle est la relation de transformation des coordonnées dans une intégrale double. Elle permet de ramener 
le calcul d'une intégrale double dans le domaine D au domaine D', ce qui peut simplifier le problème. 


De même, pour une intégrale triple, nous écrirons: 


J] FX, y,2)drdydz =Jfr cr. mldet(D)ldudvaw 6 


Déterminons maintenant le Jacobien pour les systèmes de coordonnées les plus courants (nous renvoyons 
à nouveau le lecteur au chapitre de Calcul Vectoriel pour plus d'informations concernant ces systèmes): 


1. Coordonnées polaires x = r cos #,y = rsin : 
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0 
ür à —r si 

det| 7 20] ler ns De =] Go254) 
dy dy ang rcos# 


ôr d$ 
Comme r est toujours positif, nous écrivons simplement: 
det(Ji=r (10.255) 


2. Coordonnées cylindriques x = rcos ÿ, y = r sin @,z =z (cf. chapitre d'Algèbre Linéaire pour le calcul du 
déterminant): 


& & & 
De cos$ -rang# 0 cos gr cos #'l-cos #00 
det|® o Ed =det\sang rcos# 0 =|+rsin sin #'1-rsin #00] =|r| 
ne 0 0 1]| +0-sing 0-0-rcosd'0 

dz Oz dz 
8r dp & 
(10.256) 


Comme r est toujours positif, nous écrivons simplement: 
fdet(J]=r (10.257) 


3. En coordonnées sphériques x = r sin & cos #, y = rsin &sin #,z = rcos& (cf. chapitre d'Algèbre Linéaire 
pour le calcul du déterminant): 


&x x ôx 
N e : an£cos$ -randang rcos8cos# 
dt? C2 2 || = \det andsan# rsingcos$ rcos8sn# 
dr d$ 08 
cos # (] —rsin 8 
ë à & 
dr ôd$ 08 


— sin 8 cos #r sin 8 cos dr sin 8 — sin Pc sin #0 


-r sin sin psin Osin dr sin 8 —r sin Fsin Ÿr cos sin cos 4) 


+rcos nrésin #0 — r cos cos dr sin #cos # cos ÿ 


1 sin® 9 cos” gr? + sin° sin? dr? -|r? sin sin? cos 8+r° cos? Pcos? psin 8 | 


: 342 2: 2 2 . . 2 2 2 . 
= |-sin 87° —r" sin cos a =|-r sin éisin" 9+cos 8 =} sin 8] 
(10.258) 


Comme #? est toujours positif, nous écrivons simplement: 
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2 : : 
[det: J | = 7" sin 9 avec sin 82>0 (10.259) 


2.5. INTÉGRATION PAR PARTIES 


Lorsque nous cherchons à effectuer des intégrations, il est très fréquent que nous ayons à utiliser un outil 


AL 


(ou méthode de calcul) appelé "intégration par parties". Il existe différents degrés d'utilisation de cet outil 
et nous allons commencer par le plus simple et qui est le plus utilisé dans tous les chapitres traitant de 
physique sur le présent site. 


Nous partons d'abord de la dérivée du produit de deux fonctions démontrée plus haut: 
(JE) g@)=f Ge@+fE@ sg) (10.260) 

nous avons donc: 
JE): 8@) = (FO -86))' FE) 6) (10261) 

et il vient: 


b b b b 
[FO 80e = [O0 SO 20 k- [706 eO)'4- [50 gt (026) 


après une dernière simplification nous avons enfin la fameuse relation très importante: 


b b 
[FO -eoat= FO 8 - [70 86e | (0263 


Mais nous allons parfois avoir besoin de la généralisation de cette dernière relation. Nous pouvons 
démontrer que si f et g sont deux applications (fonctions) de classe £'* (dérivables n fois) sur [a,b] dans 
€, alors : 


ë à è è 
POP EDS + CD [SO ga (10264) 
2 £-0 a 2 


Démonstration: 


Procédons par récurrence sur n (attention ce n'est pas forcément facile à comprendre comme souvent avec 
les démonstrations par récurrence!). 


Tout en sachant la relation vraie pour n=1, nous la supposons vraie pour n (comme donnée dans la relation 
précédente!) et nous la démontrons pour n+1 (donc nous devons retomber sur la relation précédente mais 
avec n+1 au lieu de n): 
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è à 
[FO eat = F0 ME - (FO d° Oat 


#— è è 
DORA = 2 rire + CD [PO eat 
0 a 2 
(10.265) 


# è è 
= 10 "OT: à + D [© 0e 
1 a a 


# è è 
Dr” + CD (F0 Ode 
£0 a a 


Remarque (proposée par un internaute): l'astuce dans cette démonstration est de bien voir que 
-(-1)" donne un signe moins quand n est pair et un plus quand n est impair et de même Te) 


donne un signe moins quand n est pair et un plus quand n est impair. 


Pour n=1 nous retrouvons la formule bien connue et qui sera très très souvent utilisée sur tout le site: 


à è 
[F0 g'Odt =F@) ON = fF'@: get] (10266) 


CIC.Q.F.D. 


2.6. PRIMITIVES USUELLES 


Il existe en mathématique et en physique un grand nombre de primitives ou de fonctions définies sur des 
intégrales que nous retrouvons assez fréquemment (mais pas exclusivement). Par ailleurs, toutes les 
primitives démontrées ci-dessous seront utilisées dans les sections relatives à la Mécanique, l'Ingénierie, 
l'Atomistique, les Mathématiques Sociales, etc. Donc, comme dans n'importe quel formulaire, nous vous 
proposons les primitives connues mais avec les démonstrations! 


Cependant, nous omettrons les primitives qui découlent déjà des dérivées que nous avons démontrées plus 
haut. Ce qui signifie par exemple que nous supposerons connues les deux primitives très importantes 
(certainement les plus utilisées dans l'ensemble des pages du site): 


(sin(max = — cos(x) 
u (10.267) 
| cos(x)dx = sin(x) 


Sinon voici déjà une liste de quelques intégrales fréquentes (le lecteur en rencontrera de toute façon bien 
d'autres - développées dans les détails - lors de son parcours du site): 


1. Primitive de f (x) = tan(x) : 


Par définition nous avons donc: 
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[rat dx = En dx (10.268) 


Nous utilisons le changement de variable 4 = cos(x), du = -sin(x)dx et ainsi: 


| 1 
GE) ax =-fhau = he nes) na 


Donc: 

F(x) = In |cos(x)| (10.270) 
2. Primitive de f(x) = cot(x): 
Par définition nous avons donc: 


cos(x) 


Jcot(x) ax = | 


dx (10.271 
sin(x) 


Nous utilisons le changement de variable t = sin(x), du = cos(x)dx et: 


cos(x) L 1 L _ | 
re e [du In fl In (sin( x)| (10.272) 


Donc: 
F(x) =in sin(x)| (10.273) 
3. Primitive de f(x) = arcsin(x): 


Nous intégrons par parties: 
x 
l'arcsin(x)dx = x'arcsin(x) - [dx (10274) 
[ FF - x? 


Si nous posons y; = 1 x? , Ce qui nous donne dx = -2xdx, nous obtenons: 


(l —dx (Tr ==" Go 


1-x2 
Donc: 
F(x) = x'arcsin(x) + f-x2 (10.276) 
4. Primitive de f(x) = arccos(x): 


Nous intégrons à nouveau par parties: 
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x 
1- x2 


[LL arccos(x)dx = x'arccos(x) +[ dx (10.277) 


Si nous posons 3; = 1-x°?, (du = -2xdx ), nous obtenons: 
x 1 f 2 
© x = [du = -Qu = -4fÎ- x 
Les GE NA (10.278) 


Donc: 


F(x) = x'arccos(x) - 4/1 - x (10.279) 
5. Primitive de f(x) = arctan(x) : 
Nous intégrons encore une fois par parties: 


X 


1 dx (10.280) 


fr arctan(x)dx = x' arctan(x) “[ 


Si nous posons 3; = 1 +x°?, (du = 2xdx ), nous obtenons: 


x 
ee 


dx = [xd - su kel = ET +x2) (10.281) 
Donc: 
1 2 
F(x) = x'arctan(x) — 5 ‘In(l+x") (10.282) 


6. Primitive de f(x) = arccot(x) : 
Encore une fois. nous intégrons par parties: 


X 


fr arccot(x) dx = x' arccot(x) h dx (10.283) 


1+x° 


Si nous posons 3; = 1 + x°?, (du = 2xdx ), nous obtenons: 


x _el 1. À. 2 
F 52 dx "fra nr in kel > In{l+x*) (10.284) 
Donc: 
F(x) = x'arccot(x) + sin +x2) (10.285) 


7. Primitive de f(x) = xe* avec a € R\{0}: 


Une intégration par parties nous donne: 
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x 1 x 1 1 1 
fr ax = ge - — fe” ax =—e" -—e" = (x - 3) (10.286) 
a a a a a 


Donc: 


1 1 
F(x)= €" (2x - Z) (10.287) 
æ d 


Remarque: Une autre intégrale très importante avec l'exponentielle en physique est celle que nous 
avions démontrée lors de notre étude de la loi de Gauss-Laplace en statistiques et probabilités 
(détermination de la moyenne). 


8. Primitive de f(x) = In(x) : 
faGax = [Le In(x)dx (10.288) 

en intégrant par parties nous trouvons: 

fl ‘In(x)dx = xin(x) - fr = xin(x) -x= x(In(x) -1) (10.289) 

+ 
Donc: 
F(x) = x' (n(x)-1) (10.290) 
9. Primitive de f(x) = xin(ax) avec 4 € R\{0}: 
Une intégration par parties nous donne: 
l l 2 

frin(ax)dx = 5 Fin (ax) - 5 ca Lie Le = ce In(ax) — 27 (10.291) 

Donc: 


F(x) = 3 ln(ax) = 2% (10.292) 


10. Primitive de f(x) = &* pour & >? Ü,a # Î: 
fm) =a"  f{x)=a"'in(a) (10.293) 
Ainsi il vient: 
JA) Lx F2 F 
LD ef = faadx (02 
Le + lee le 0 


Il vient: 
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-L e 


1407 et fa*dr = [/GDAR = F(D (10205) 


= 
d'où: 


J() _ a 


FG) = Infa) Ina) 


(10.296) 


11. Primitive de f(x) = log, (x) : 


Pour (4 > Ü,a “ 1) sachant que (voir les propriétés des logarithmes dans le chapitre d'analyse 


fonctionnelle): 


In(x) _ 1 
In(a) Ina) 


log, (x) = In(x) (10.297) 


nous avons en utilisant la primitive de In(x): 


F(x) = —"—" (In(x) -1) (10.298) 
In(a) 
12. Primitive de f(x) = tanh{x) : 
Nous avons: 
sinh({x) 
tanh(x)dx = à. 
[ anh(x)dx es X (10.299) 


Nous utilisons le changement de variable & = cosh(x),du = sinh(x)4x et obtenons: 


Er dx = [= du = In (x =in(cosh(x)) (10.300) 


Donc: 

ÆF(x) =In(cosh(x)) (10.301) 
13. Primitive de f(x) = coth(x) : 
Nous avons donc: 


cosh @ 
ED — 


[coth(x) dx = [ (10.302) 


Nous utilisons le changement de variable # = sinh(x),du = cosh(x)dx et obtenons: 


cosh{x) L ‘ : _ | 
ET dx [au in fl In fsinh(x)| (10.303) 


Donc: 
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F(x)=in{fsinh(x)) (10.204) 
14. Primitive de f(x) = arcsinh(x) : 
Nous intégrons par parties: 


X 


Fe dx (10.305) 
+x 


[LL arcsinh(x)}dx = x' arcsinh(x) a 


Si nous posons 3; = 1 + x°, (du = 2xdx ) nous obtenons: 


[== dx = Er = Vu = 1+ x° (10.306) 


Donc: 

F(x) = x. arcsin k(x) — + (10.307) 
15. Primitive de f(x) = arccosh(x) : 
Nous intégrons par parties: 


x 


dx (10.308) 
x? —] 


Si nous posons x; = x? 1, Ce qui nous donne du = 2xdx, nous obtenons: 


[—% (TZ du = fu = 2 -1 (10.309) 
5-7 


[LL arccosh(x)dx = x'arccosh(x) s | 


Donc finalement: 


F(x) = x: arccosh(x)- #x°-1 (10.310) 
16. Primitive de f(x) = arctanh(x) : 
Nous intégrons par parties: 


x 
1-x2 


[LL arctanh(x)dx = x'arctanh(x) -[ dx (10.311) 


Si nous posons x; = 1 - x?, Ce qui nous donne dx = -2xdx, nous obtenons: 


SL LE EP D 
Le x. du ja] in | (10.312) 


Donc finalement: 
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F(x) = x'arctanh(x) + in SE k) (10.313) 


17. Primitive de f (x) = arc cot A(x) : 
Nous intégrons par parties: 


X 


1: th(x)dx = x: th (x) — à , 
(l arccoth(x)dx = x' arccoth(x) É me x (10.314) 
Si nous posons 3; = 1 - x? , (du = -2xdx ) nous obtenons: 
en dx =- du == inu= taf - x? (10.315) 


Donc finalement: 
1 2 
F(x) = x' arccoth(x) ‘sh l x | (10.316) 
18. Primitive de f(x) = sin" (x) avec # > 2: 
_— RER: | . 7 . ë 
Posons À, = fan x' dx, Une intégration par partie donne: 
= féor get loe- en _ 2.,.:..n72., 
fe fsinx sin x'dx=-cosx'sin" x+(x D [cos xs" zu (0317 
en remplaçant 665? x par 1- sin? x dans la dernière intégrale, nous obtenons: 
. .n=1 
1,=-cosx-sin" x+(#-1)(/,2-1,) (10.318) 
et donc: 
_i 3 
Le = (-cosx ‘an XTIA— Di) (10.319) 
19. Primitive de f(x) = cos" (x) avec # > 2: 
Dans ce cas nous avons la formule de récurrence 
l = à 
[ces xdx = =(C = D fcos" 2 xdx +sin x' cos” ‘x} (10.320) 
ñ# 
qui se démontre de la même façon que la relation de récurrence précédente. 
20. Primitive de f(x) = tan? (x): 


Sachant que tan'{x) = 1+ tan? (x), nous avons: 
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france : [tan —1)dx = tan(x) -x (10.321) 


Donc: 

F(x) =tan(x)—x (10.322) 
21. Intégrale de f(x) = cot? (x): 
Sachant que cot'{x) = -1- cot {x}, nous avons: 

fer (x)dx = ft cot'(x) —1)dx = -—cot(x) -x (10.323) 

Donc: 

F(x) = -cot(x)-x (10.324) 
22. Primitive de f(x) = sin ? (x): 
En utilisant les relations trigonométriques remarquables, nous avons: 


. 2 2 
rs dx = ee - fi + cot*(x)) dx =-cot(x) (10.325) 


selon la primitive cot” (x). Donc: 
F(x) = -cot(x) (10.326) 
23. Primitive de f(x) = cos ? (x): 


En utilisant encore une fois les relations trigonométriques remarquables, nous avons: 


l Fa sin? CA) + cos? (x) 


pee : l cos? (x) di fe + tan” G}ax = tan(x) (10.327) 


selon la primitive tan? (x). Donc: 
F(x) =tan(x) (10.328) 


24. Primitive de f(x) = sin (x): 


Nous faisons la substitution x = 2arctan(f) (£ = tan 5] ). Sachant que: 


x 
2tan|— 
sin(x) = (10.329) 
1+tan2| ? 
2 
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(cf. chapitre de Trigonométrie) nous obtenons alors: 


et dx = 


sin(x) = : : dt (10.330) 
1+é 


1+4 


(selon la dérivée de arctan{(x) ). Donc: 


EN. dt =lnfl= in 
sin x 


x 

ln (10.331) 
2 

et: 


F(x) = In 


tan : (10.332) 
5 
25. Primitive de f(x) = cos"! (x): 
: FT : : ne 
Sachant que cos x = sin Ê + J (cf. chapitre de Trigonométrie) nous avons: 


1 l 


re ti x 
cos(x) sax +2] (10.333) 
2 


Nous faisons le changement de variable x + =u (du = 4x): 


=) 


l l 


pere si [ (+ A SE = ) 
2 


du =in =În 


tan 
(+ :) (10.334) 


(selon la primitive de sin !(x)). Donc: 


F(x) =In 


Æ 
tan | 2? + © (10.335) 


l 


26. Primitive de fÉx) = re 


x 
Nous faisons la substitution x = 2arctan(f) (£ =tan 5] ). Sachant que (cf. chapitre de Trigonométrie): 


n 
B. 
Dl# 


COS x = (10.336) 


1+ tn 


Ds 
a” 
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nous obtenons: 


— #2 2 
COS x = " et dx = cc bi (10.337) 
(selon la dérivée de arctan(x)). Donc: 
l x 
Éerere ul = fie ={t=tan|—| (10338) 
1+cos(x) 2 


et: 
zx 
F(x) = tan (:) (10.339) 


1 


27. Primitive de f(x) = ——— : 
1— cos(x) 


Nous faisons à nouveau la substitution x = 2arctan(f) (comme précédemment). Nous trouvons alors: 


l 1 l x 
Ï- L 4x = [a = . = —çcot Ë (10.340) 
et donc: 
x 
F(x) =- ur (10.341) 
——. 1 
28. Primitive de F x) = ———: 
1+sin(x) 


Sachant que: 
| XX 
sin x = COS (x- <) (10.342) 


Nous avons alors: 


Î a. —— à 0.343 
1+sin x +cos(x— 2) (10.343) 


En faisant le changement de variable: 
7 
= LD avec du =dx (10.344) 


nous obtenons: 
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[— — à = [——— du = 
1+sin x 1+cos{u) À 


D'où: 
x ZX 
Fix) =tan| —-— 10.346 
(x) a (à sh ) 


1 


29. Primitive de (x) = ——— : 
1 sin( x) 


Par le même raisonnement que précédemment en utilisant le cosinus nous obtenons: 
x 
F{x) =-—cot| ———| (10.347) 
2 4 


30. Primitive de f(x) = sinh”"(x) avec # > 2: 
Posons: 
L= Jsinh” (max (10.348) 


Une intégration par partie donne (nous avons démontré lors des dérivées usuelles que la primitive du sinus 
hyperbolique était le cosinus hyperbolique): 


L = [sinh(x) sinh"” Codes coh(nsah" (x) - (= | cosh2(x).sinh"2(x}x (10.349) 
en remplaçant cosh?(x) par 1+sinh?(x) dans la dernière intégrale, nous obtenons: 
1, = cosh(x)sinh"" (x) (#17, +14,) (10.350) 
et donc: 
17 1 : 1 l 
1, = [sinh (x)dx = —{cosh(x) sinh" (x) —(#- D) (10.351) 
# 
Ainsi: 


[sinh? (x)dx = (cosh x-sinhx- x) (10.352) 


- 
2 
31. Primitive de f(x) =cosh”(x) avec # > 2: 


Dans ce cas nous avons aussi la relation de récurrence: 


Ia] cosh*(x)dx = 2 {sinh() cosh" 1 (x) +(x— 1) ls ) (10.353) 
x 
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qui se démontre de la même façon que ci-dessus. Ainsi: 


[cosh?(x)ax = = (cosh(x) -sinh(x) + x) (10.354) 


32. Primitive de f(x) = tanh? (Xi: 
Sachant que (démontré lors des dérivées usuelles): 
tanh'{x) = 1-tanh?(x) (10.355) 
nous avons: 
Jtanh?(xax = [ (1=tanh'(x})dx = x tanh{x) (10.256) 
Donc: 
F(x)=x-tanh(x) (10.357) 
33. Primitive de f(x)= coth2(x): 
Sachant que (démontré lors des dérivées usuelles): 
coth'(x) = 1— coth? (x) (10.358) 
nous avons: 
[coth° (x}dx = fa- coth'(x))dx =x—coth(x) (10.359) 
Donc: 


F(x)=x-cothx (10.360) 


34. Primitive de Fx)= ——: 
TIMItUVe de sinh 2(x) 


Nous avons en utilisant la primitive de coth?(x): 


M ii 
[ : - dx = (77 = J(coth° x — 1jax =—cothx (10.361) 
sinh° x sinh°x 
Donc: 


F(x)=-cothx (10.362). 


35. Primitive de À (x) = ere 


Nous avons en utilisant la primitive de tanh° (x): 
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1 cosh?(x) — sinh? (x) 
cosh?(x) n) ei = [(1-tanh#(x))dx = tanh(x) (10.363) 


Donc: 


F(x) = tanh(x) 


36. Primitive de f (x) = — ; 
sinh(x)} 
Nous faisons la substitution: 


dt 
t=e* avec dx =— (10.364) 
£ 


Nous obtenons en utilisant la dérivée arctanh(x): 


[ - ; dx = [ = — dx = [ £ dé = ee” = —2arctanh(f) = —-2arctanh(e*) 
sinh(x} ee” d -) 1 (10.365) 
Ê 
et: 
F(x) =-2arctanh(e”*) (10.366) 
37. Primitive de f(x) L 
. Primitive de = : 
cosh(x) 
Nous faisons la substitution: 
dt 
t=e* avec dx = (10.367) 
Nous obtenons en utilisant la dérivée arctan(x): 
1 2 : 2 
—— dx = | ——— dx = | ——— dt = | ——— dt = 2arctan(f) = 2arctan(e” 
le x Bee e * ] [3 +1 E QE, (10.368) 


T3 


F(x)= 2arctan(e*) (10.369) 


et donc: 


1 


38. Primitive d X)] = ————— ; 
rimitive de f(x) che 


Nous faisons la substitution: 
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Nous obtenons: 


2 


Mere 


Éreeree ax= | 


Nous obtenons donc la primitive: 


F(9 =- 1= 
(2) : Li 


: 


39. Primitive de f (x) = nee : 


Nous faisons la substitution: 


dt 
£ = exp(x) avec dx = ms 


Nous obtenons: 


1 2 
éd 


— cosh x 


Nous obtenons donc la primitive: 


Fix) = 
40. Primitive de f (x) : 
. Primitive de = —————— |: 
1+sinh(x) 
Nous faisons la substitution: 
Nous obtenons: 
1 
Eee 
1+sinh x 


dt 
f=e* avec ee. 


(10.370) 
———à- [ : 5 dé =— 
(aus) re 

2 e*-] 


+e* e*+1 


(10.373) 


e*—] e*—]1 


{= vod 10.376 
= E P (10.376) 


——— Àt 
1 


= tanh a) (10.372) 


(10.377) 


(10.371) 


(10.374) 
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: 1 


2 1 1 
a ed oo 


D'où 
2 1 1 1 
Emo en Pre are 
L 1 ta e*+1- 2] ds 
= nt V2|- nf++ 2) 7 En NL Far] 
Donc: 
| EG #1 V2] 


(10.380) 


ES 7" xp +1+ V2] 


1 


41. Primitive de f (x) = re : 


Nous faisons la substitution habituelle: 
dé 
t=e* avec dx =— (10.381) 
£ 


Nous obtenons: 


J——a- Fi à = = à (10.382) 


— sinh x —e"+e —2t+8" —-1 
Or: 
22 co) 
Pet letter Ur M) 
D'où: 
2 1 1 1 
lle last) 
, LE +2]. 1 e*—1+/2] CPS 
= Zlut- 1+V2|- inf- 1- A+ FEAT F" Pre Er 
Donc: 
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1 le*-1+2] 
FX) = in ————> (0385) 


Ÿ2 e*-1- V2 


42. Primitive de f(x) = 6° sin(bx) avec a,b € R.a° +b? #0: 


Une première intégration par parties donne: 
x l MX .…: b 2x e 
Je sin(bx)dx = —e sin(bx) -— [e cos(bx)dx (10.386) 
a a 
Une deuxième intégration par parties donne: 
 : LL. :. bi l à br à. 
Je sin(bx)dx = —e" sin(bx) —-—| —e cos(bx)+— fe sin(bx)dx | (10.387) 
a aa a 
d'où l'égalité: 
m à À æ b mx Ft a. 
Je sin(bx)dx=—e sin(bx) -—e cos(bx)-—[e sin(bx)dx (10.388) 
a a a 


Ainsi en redistribuant la relation précédente: 


F(x) = [e® sin(bx)dx = (asin(bx)—bcos(bx)) (10.389) 


e 
& +b° 
43. Primitive de f(x) =e% cos(bx) avec a,b e R.a° +b° #0: 


Un raisonnement analogue à celui d'avant montre que: 


ax 


F(x) = (aæcos(bx) +bsin(bx)) (10.390) 


a +b? 
44, Primitive de f(x) = xsin(ax) avec 4 e R*: 


Une intégration par parties nous donne: 
: 1 l 1 = 
Fix) = fxsin(ax)ax =—— xcos(ax) + — fcos(ax)ax =——xcos(ax) +—sin(ax) (10.391) 
a a a a 


45. Primitive de f(x) = xcos(ax) avec 4 e R*: 


Une intégration par parties nous donne: 


F(x) = fxcos(ax)ax _ l xsin(ax) — L fsin(amax = Lilas ra cos(ax) (10.392) 
a a a a 


46. Primitive de f (x) = avec 4 £ b: 


1 
(x—-a)(x—-b) 
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Nous avons la relation suivante: 


LE 
Caen alor ea 


Par suite: 

jp 

(x—a)(x—b) a—b"\(x-a) (x-b) a—b\" (x-a) (x —b) 

(10.394) 
= ! (in|x-al-in|x-2|) = : In ie 
a—b a—b |x-b 
Ainsi: 
1 | 
F(x) = Fi | 0309 
47. Primitive de f(x) = ;—> avec a # Ü: 
dé —x 


Nous avons en utilisant le résultat précédent: 


l 1 1 1 x-a l x+a 
2 dx = | —— à = -| ————ûÎx = -—h}—|\=—1 10.396 
I —X : mere ner es É 24 ET 24 te 
Donc: 
1, |x+a 
F(x) = —In | (10.397) 
2a |x-a 
48. Primitive de f(x) = ;—3 avec a # D: 
a +x 


En faisant le changement de variable: 
X= au avec dx=a.du (10.398) 
Nous obtenons en utilisant la dérivée de arctan(x): 


1 
a? +x° 


1 
1+u° 


F(»=| a=" | 


du = L arctan(u) = os (2) (10.399) 
a a a 
49. Soit: 
1, = | | 
#+l [ ue = ÿ1 (10.400) 


avec # € N. Nous avons: 


Page: 758/4839 


[V3.0 - 2013] 
1-x° x 


: l x 
re ee red 


2 2 


(10.401) 
A x rés 


Or cette dernière intégrale se résout par parties: 


1 1 
Een : re A Per rt [ae % 
| (10.402) 


E 2% x x 
2n(1- x°) 2n 
Donc: 


l l 2n—] 
RE ) 7 
2a(1- x*}° 2# 2a(1- x<}° 2n 


(10.403) 


Que nous retrouvons plus fréquemment dans la littérature sous la forme: 


x 
2nlg = — + (2x -1)2,) (10.404 
rH Q- y" al ( ) 


Identiquement au développement suivant, nous avons pour (le signe change): 


= | dx 
F Tel (10.405) 
la relation suivante: 
Lu = — + (2 = 17 
Rlyy = 7 n| (10.406 
# qi 2 ( ) 


Vous pourrez trouver une application de ces deux primitives dans le modèle cosmologique newtonien de 
l'univers dans le chapitre d'Astrophysique ainsi que dans le chapitre de Relativité Générale dans le cadre 
de l'étude de l'effet Shapiro! 


1 
50. Primitive de (x) = FETE 


1 1 
Nous avons en utilisant les primitives de =" (vue avant) et —— (vue plus haut): 


Q- x js 


1 1 x 1, |x+1 
F( = x (tn et) (10.407) 


1- x 
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51. Primitive de (x) = FETE 


1 
Nous avons en utilisant les primitives de =— 
(1+x°) 
1 
2 


1 * 
FO= [ré (a +arctante) (10.408) 


52. Primitive de f(x) = VA a? avecaeR’: 


1 
+ (vue avant) et — (vue plus haut): 
1+x 


Nous pouvons sans perte de généralité supposer & > 0. Remarquons que le domaine de définition de f est 


]-00,-a]L[a,+o0. 


Nous allons déterminer une primitive de f uniquement sur l'intervalle [4,+€% (car c'est celle dont nous 


aurons besoin dans certains chapitres). 
Faisons le changement de variable: 
x=a@a.coshé£é (10.409) 


avec donc: 


£ = arccosh ( ; dx =asinh(f)df (10.410) 
a 


où nous considérons la fonction cosh : IR, —[1,+c0{ avec pour réciproque la fonction 


arccosh :[1+c0[— IR, donnée par (cf. chapitre de Trigonométrie): 


arccosh(y}=in L+ -1) (10.411) 


Nous obtenons alors en utilisant la primitive de sinh? x: 


a 


[ x? — a? dx = a? [sinh?s. di = — (coshésinht—£) 


. , (10.412) 
=. (Eat [arcosh (2x) — arccosh (+) 
2 la a a 


or (cf. chapitre de Trigonométrie) comme: 


sinh?u = cosh?u —1 (10.413) 


sinh [acces ( x) = [cosh? [acces ( x) —1= Le —] 
a \ a a 


Donc: 


(10.414) 
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et en utilisant un autre résultat du chapitre de Trigonométrie: 


arccosh(x) = In (x +2 — 1) (10.415) 


nous avons alors: 


(10.416) 


2 2 
{5 x a? (24 F-#))-£(5 Fa {xt VF) +i(a)) 
a à 


étant donné que les primitives sont données à une constante près, nous pouvons écrire: 


2 


nr ie Lin(x+ x? - a?) (10.417) 


pour x24&. F est donc une primitive de ,/,2_,2 sur [a,+01. 


53. Primitive de f({x)= 2 - x? avecaeR’: 


Nous pouvons sans perte de généralité supposer & > 0. Remarquons que le domaine de définition de fest 
[-a, a]. 


Nous faisons la substitution: 
x=asin{f) (10.418) 
avec: 
dx =acos(f)dt (10.419) 


Nous obtenons: 


2 
[Ve — x/dx= a? [Mi — sin? £ cos(£)dé a] cos? (£)df = — +sin(£)cos(£)\ 


a? . (# x ne: 
= —| arcsin| — |+—cos| arcsin — 
2 ä a ä 


où nous avons utilisé la primitive de cos*(x) avec # = 2 démontrée plus haut. Or nous avons: 


cos(arcsin y) = ÿ — sin Z(arcsin y) = Ÿ — y? (10421) 


(10.420) 


Donc: 
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5 3 & XX x "a XX Ê à X XÏS 2 
[Va — x" dx =—| arcsin —+—cos{arcsin —) |=—| arcan—+- = =—arcsin—+—#YŸaq"—x" (10.422) 
2 & à a 2 & a Cr 


2 


et: 
2 
a > Æ. 7 
F(x) = TL arcsin— +SVe — x? (10.423) 
a 


54. Primitive de f{x) = AA +x? avecaeR’: 
Nous pouvons sans perte de généralité supposer & > Ü. 
Faisons le changement de variable: 
x=a"sinhf (10.424) 


avec donc: 
. 1 | 
£= arcsinh|—x|,4x= acoshff)df (10.425) 
a 
Nous obtenons: 


2 
[* x? + a? dx = a] cosh? ft = TU + sinh£ coshé) (10.426) 


en ayant utilisé la primitive de cosh ? démontrée plus haut. 


Ainsi: 


2 2 
[ x? +a?dx = — +sinh£cosh#)= Pacs (2) ri cosh{arcsinh ÉD) (10.427) 
a) a a 


Mais comme nous avons vu dans le chapitre de Trigonométrie: 


arcsinh (2) =in É . le ra) in (x +127 + a? ] —In(a) (10.428) 
a ä à 


- X D - X x? 1 2 9 
cosh(arcsinh| — [= ,f1+sinh"| arcsinh| —||=,f1+— =-—1Va" +2" (10.429) 
a a a” a 


Donc nous avons finalement: 


et: 


2 


F(x) = Tin (x+ Jr +a? | + SV +x (10.430) 
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où le In(a) a encore une fois été omis car les primitives sont données à une constante près. 


; —1 
55. Primitive de f(x) = | 2 -x| avecaeR": 


Nous pouvons sans perte de généralité supposer & > Ô. 
Nous faisons la substitution: 
x=asin{(f) (10.431) 
avec: 
dx =acos(f)dé (10.432) 


Nous obtenons: 


acosé dt 


1 
a \1-sin*é (10.433) 


acost.dt = | 


F(x = [=] —— —— 
Va? - x Va? a sin? # 


1 x 
| acost. dt = [1 dt =t = arcsin = 
&COSsÉ ä 


1 *# 
56. Primitive de À (x) = F5 dVeaeR : 
a +x 


Nous pouvons sans perte de généralité supposer & > 0. 
Faisons le changement de variable: 
x=«a-sinhf (10.434) 


avec: 
£= arcsinh É x) ax = acosh(£)df (10.435) 


ä 


Nous obtenons de la même manière que pour les intégrales usuelles précédentes: 


à = fi sis arcsinh + (10.436) 


et sachant que (cf. chapitre de Trigonométrie): 


arcsinh(y) =in > +41»? +1) (10.437) 


Nous obtenons alors au final la primitive importante suivante: 
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où le In(a) a encore une fois été omis car les primitives sont données à une constante près! 


En procédant de même, mais en utilisant le cosinus hyperbolique au lieu du sinus hyperbolique, nous 
avons bien évidemment: 


1 
F(x)= “x - In[x+ -à) (10.439) 


Nous réutiliserons ces deux dernières relations dans des cas pratiques importants des chapitres de 
Mécanique Analytique, Génie Civil (où la constante a valant 1, In(a) est de toute façon nul!) et de 
Relativité Générale (où a sera non nul et donc il ne sera pas possible d'omettre la constante In(a)). 


3. FONCTION DE DIRAC 


La fonction de Dirac, appelée aussi "pic de Dirac" ou encore "fonction delta”, joue un rôle pratique très 
important aussi bien en électronique et informatique qu'en physique quantique ondulatoire et physique 
quantique des champs (cela permet de discrétiser un continuum) ainsi que dans le domaine du génie civil 
(voir les chapitres du même nom pour des exemples). 


Signalons avant d'aller qu'il est abusif de parler de "fonction" car une fonction est une application d'une 
ensemble de départ (généralement l'ensemble des réels ou complexes à une ou plusieurs dimensions) dans 
un ensemble d'arrivée (généralement l'ensemble des réels ou complexes à une ou plusieurs dimensions). 
Alors que le domaine de définition de la fonction de Dirac n'est pas un ensemble de nombre mais en toute 
rigueur des fonctions! 


Pour la présenter simplement, considérons d'abord la fonction définie par: 
PO 
a 2 2 


(10.440) 
f(x) = 0 si k>S 


La représentation de y = f(x) est un rectangle de largeur a, de hauteur 1/a et de surface unité. La fonction 
de Dirac peut être considérée comme la limite, lorsque 4 — Q de la fonction f(x). On a donc: 


Ê(x)=0ax#0 


(10.441) 
O(x)=wsax=0 | 


avec: 


+7 


+o 
(l O(x)dx = [SGax =1 (10.442) 


où € est un nombre plus grand que 0 aussi petit que nous le voulons. 


Page: 764/4839 


[v3.0 - 2013] 


Remarque : Comme le lecteur l'aura remarque lorsque nous avons introduit la fonction f{x) initiale, la 
fonction delta de Dirac qui en découle a donc la dimension de l'inverse d'une longueur. 


Pour une fonction g(x) continue en x=0 on a: 
+o 
HQE = g(0) (10.443) 


Par extension nous avons: 


Ê(x-w)=04x#2, 
: (10.444) 
Ê(x-M)=0H1=X 


et pour une fonction g(x) continue en x,: 


fe@8G@ — Xp)dx = g(Xp) (10.445) 


Il est alors assez aisé de définir la fonction de Dirac dans l'espace à 3 dimensions par: 
OCT — F5) = OCx — Xÿ)8(Y — Yy)O(Z —Zy) (10.446) 
4. FONCTION GAMMA D'EULER 


Nous définissons la fonction Gamma d'Euler (intégrale Eulérienne de deuxième espèce) par l'intégrale 
suivante: 


+ 


= 
fx) = [° e“dt| (10.447) 


avec x appartenant à l'ensemble des nombres complexes dont la partie réelle est positive et non nulle (donc 
les réels strictement positifs sont inclus dans le domaine de définition aussi...)! Effectivement, si nous 
prenons des complexes avec une partie réelle nulle ou négative, l'intégrale diverge et est alors non définie! 


Remarque: Nous avons déjà rencontré cette intégrale et certaines de ses propriétés (qui vont être 
démontrées ici) lors de notre étude des fonctions de distribution Bêta, Gamma, Khi-deux, Student et 
Fisher en statistiques (cf. chapitre de Statistiques). Nous utiliserons également cette intégrale en 
maintenance (cf. chapitre de Techniques De Gestion), en théorie des cordes (cf. chapitre de Théorie 
Des Cordes) et dans d'autres domaines de l'ingénierie (voir la section correspondante). 


Voici un tracé graphique du module de la fonction Gamma d'Euler pour x parcourant un intervalle des 
nombres réels (attention dans Maple 4.00b à bien écrire GAMMA en majuscules!!!): 


>with(plots): 
> plot(GAMMA(x),x=-Pi..Pi,y=-5..5); 
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Figure: 10.18 - Plot de la fonction Gamma d'Euler dans Maple 4.00b 


et la même fonction tracée avec Maple 4.00b mais dans le plan complexe cette fois-ci et toujours avec en 
ordonnée le module de la fonction Gamma d'Euler: 


>with(plots): 
>plot3d(abs(GAMMA(x+y*T)),x=-Pi..Pi,y=-Pi..Pi,view=0..5, grid=[30,30],orientation-[-120,45] 
axes=frame,style=patchcontour); 


Figure: 10.19 - Plot de la fonction Gamma d'Euler dans le plan complexe avec Maple 4.00 


Cette fonction est intéressante si nous imposons que la variable x appartienne aux entiers positifs et que 
nous l'écrivons sous la forme suivante: 


+o 


Dix) = PE (10.448) 
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Intégrons par partie cette dernière fonction: 


+o +o 
Tifx) = 04 = ref" + ji LUE = ref" +x'Ttx-D (10.449) 


Comme la fonction exponentielle décroît beaucoup plus vite que £* nous avons alors: 
ot = x Dofx-1) (10.450) 
Dans la littérature, nous retrouvons fréquemment les notations suivantes (qui portent alors à confusion): 


TG) = Dix -1)=T(x)= fra 


. (10.451) 


lo(x) =P(x+D= GE 
Ce qui nous amène à réécrire le résultat sous une forme plus classique: 
Féx+D=2T(x)| (10452) 
De la relation [,(x) = x' l,fx -1), il vient par récurrence: 


T2) = xx -DTo(x-2) =. = (0x1 (10.453) 


T,(0) = Tr) = fre = Re = ef" =-9% -(-e)=1 (0454) 


ce qui donne: 
Fine r-Ti-2e.,=2l (045) 
Donc: 
Fox) = xl (10.456) 
ou autrement écrit pour x > 0,€ N: 


Un autre résultat intéressant de la fonction gamma d'Euler est obtenu lorsque nous remplaçons t par y° et 
calculons celle-ci pour x =1/2. 


D'abord, nous avons: 


2 
Ps sen (10.458) 
dy dy 
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ensuite: 


1 #e 1, ko 
ra(; ]- [2 4 Es r4 2ydy = 1 (10.459) 
= 0 


Or, comme nous l'avons démontré dans le chapitre de Statistiques lors de notre étude de loi de de Gauss- 
Laplace, cette dernière intégrale vaut: 


1 Ko 
L (3) 2 [ ed=N7 (10460) 
0 


4.1. CONSTANTE D'EULER-MASCHERONI 


Ce petit texte fait juste office de curiosité relativement à la constante d'Euler e et à presque tous les outils 
de calcul différentiel et intégral que nous avons vus jusqu'à maintenant. C'est un très joli exemple (presque 
artistique) de ce que nous pouvons faire avec la mathématique dès que nous avons suffisamment d'outils à 
notre disposition. 


De plus, cette constante est utile dans certaines équations différentielles où nous la retrouverons. 


Nous avions vu dans le chapitre d'analyse fonctionnelle que la constante d'Euler e est définie par la limite: 


+ +0 [#4 


1 & 
e= lim Ë h j (10.461) 
Dans un cas plus général nous pouvons très facilement démontrer de la même façon que: 
1-— ) =" (10.462) 
LU 


Cela suggère évidemment: 


+ 1] # 
(x) = one = lim rfi] dt (10.463) 
#—+ +0 # 


par changement £ = ‘4 de variable nous écrivons: 


1 


1 
(x he, = Jim ne 


+ +o 


x l 


1 
Lo M (1=u) du = (t-u) | EL -u)" du 
x 


à | (10.464) 
Dee De _— 
x x(x +1) xx +1)..(x+x) 
TG = #tr 


. xfx +1)..(x +x) 
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Pour transformer cette expression nous pouvons écrire: 


_ grrr) = Q*h*} = gt Quixi-H1-1/241/2-.1/ 41/2) = gt 0+U24.+l air il ‘e* x/2, Le g*'* (10.465) 


#° ‘e 


Or la quantité: 


lÆ Er ee Li —In(#) (10.466) 
2 # 


tend vers la limite Y# 0.5772.., appelée "constante d'Euler-Mascheroni" ou également "constante 
Gamma d'Euler", lorsque n tend vers l'infini. 


D'où: 


La 

= ale "lle 

(x) = lim nhe rer tet tent = lim cet 1 5 (10.467) 
#— +0 xx + D..(x +x) A +0 xx +1)..(x+x) 


Divisons chacun des termes du produit (x + 1)..(x +#) par l'entier correspondant pris dans n!, nous 
obtenons donc: 


1 ur e"* Em {x+1). 2 [Je HR ce” km | 4e f". 


nl ik x {k 


5. INTÉGRALES CURVILIGNES 


0.468) 


Les intégrales curvilignes sont aussi très importantes en physique. Le lecteur les retrouvera ainsi dans le 
chapitre de Mécanique Classique, Magnétostatique et Électrodynamique pour calculer le travail d'une 
force ou encore la "circulation d'un champ", ou encore dans le chapitre de Géométrie Euclidienne pour le 
calcul du centre de gravité de courbes (fonctions) pesantes, ou encore dans le chapitre Formes 
Géométriques pour le calculer la surface de certains corps de révolution mais aussi en Physique 
Quantique Corpusculaire pour la fameuse "intégrale de chemin" (qui n'est d'autre que le terme utilisé par 
les physiciens pour dire "intégrale curviligne") ou encore pour le calcul d'intégrales particulières utilisant 
le théorème des résidus démontré dans le chapitre d'Analyse Complexe ou encore pour de nombreuses 
transformations d'état dans le chapitre de Thermodynamique. Raison pour laquelle il n'y aura pas ici 
d'exemple d'application tellement ils sont nombreux dans les autres chapitres. 


Avec la définition des ce intégrales, nous pourrons démontrer deux résultats très importants détaillés dans 
le chapitre de Calcul Vectoriel et qui sont respectivement le théorème de Green, le théorème de Stokes ou 
encore le théorème des résidus démontré dans le chapitre d'Analyse Complexe et déjà mentionné dans le 
paragraphe précédent (c'est suffisamment important pour le mentionner deux fois!). 


5.1. INTÉGRALE CURVILIGNE D'UN CHAMP SCALAIRE 


Considérons une courbe C paramétrée (cf. chapitre de Géométrie Différentielle) par une fonction 
vectorielle 7 (£) avec te [a,è] de classe £'! par morceaux (cette condition est nécessaire pour que l’on 


puisse intégrer sur la courbe sans problèmes). 


Page: 769/4839 


[v3.0 - 2013] 


Définitions: 


D1. La courbe est dite "courbe fermée" si Fa) = F(b) 


D2. La courbe est dite "courbe régulière" si Y£e [ab] r'é)#0 
Rappelons qu'une courbe paramétrée peut être écrite sous la forme suivante (toute fonction vectorielle 
peut être écrite sous cette forme): 


: - + Fe) 
rG)= x(£hi +y()j = (10.469) 
0) 


Considérons une fonction ou un "champ scalaire" f(x,y} définie dans un voisinage de C. Subdivisons 


[ab] en n sous-intervalles À£ de même longueur tel que: 
H =a<h <..<t,=b (10.470) 


Nous choisissons sur chaque sous-intervalle un point £ € [4 ER L Soit As; la longueur de l'arc de C 


reliant les points {xi4i,yié il et (x{é4 1, Vié;4 11, l'intégrale de f de long de C est définie comme étant 


"l'intégrale curviligne" ou "intégrale de chemin": 
o 2 S j * [ % 
| f(x, y)ds = lirn 2,Jlxlé |,ylé ||As, (0471) 
e +0 7] 


Ce qui comme nous le savons, peut s'écrire (cf. chapitre de Géométrie Différentielle ou Formes 
Géométrique ou encore Mécanique Analytique): 


b 
| J{x,yids = | féxlei,yiéb 
C a 


et qui peut évidemment immédiatement être étendu au cas à 3 variables et plus. 


dr ; 
si 10.473 
di ( ) 


L'intégrale curviligne est linéaire, c'est-à-dire que si = C1 LC; et que Ci NEC est un point, alors 


Soit sous forme vectorielle: 


b 
[ f(x, y)ds = [f(F(#)) 
é a 


(sans aller dans la définition rigoureuse de ce qu'est l'union de deux courbes...): 
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[fapds= | fxpas+ | fps  Gour 
C é 152 


5.2. INTÉGRALE CURVILIGNE D'UN CHAMP VECTORIEL 
Considérons un champ de vecteur (par exemple un champ de force) tel que: 


B a (x, y) 


F, (x , = FE, (x y} +Æ,(x,y)j (10.475) 


et une élément infinitésimal d'une courbe (chemin) €’? morceaux tel: 


_ fax : … 
dr = | | = dxi +dyj (10.476) 
dy 


L'idée est alors de considérer que le produit scalaire (projection de champ vectoriel sur l'élément de 
chemin) représente le travail le long de l'élément différentiel: 


es 


Æod” (10.477) 


Par conséquent le travail sur tout le chemin sera donné par (en utilisant au passage la propriété de linéarité 
de l'intégrale): 


Fodr=[(r,(xyhdx+8, (x pis [Ex dx +[ 8, (xp) Gouve) 
C C HS 


ce qui peut évidemment se généraliser à n dimensions. Indiquons que lorsque l'intégrale curviligne (de 
chemin) d'un champ vectoriel est étendue à une courbe fermée, nous parlons alors de "circulation du 
champ vectoriel". 


Comme: 


arG) =f'(f) (10.479) 
dt 


Nous avons alors une écriture assez courante: 


[Fodr = [F(FOior et = [8 (xt) Oin +, (0,70) Old Go e0) 
C C C 


En physique souvent les problèmes sont dans le plan et nécessitent le passage aux coordonnées polaires, 
ce qui en outre facilite les calculs. 
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Exemple: 


Calculons le travail de la force de pesanteur déplaçant une masse M du point A# i& ,à,a | au point 


M3 (3,8 ,023 | le long d'un chemin arbitraire C. Les projections de la force de pesanteur sur les axes de 


coordonnées sont: 
F,=0,F#,=0,F =-mg (10.481) 


Le travail accompli est alors: 


[Fodr=[(FGydr+E, (a yd+E (x ydr=-[med=-melz ou) 
C C C 


et nous retrouvons un résultat connu du chapitre de Mécanique Classique. 
Une intégrale curviligne d'un champ vectoriel À le long d'une courbe € est indépendante du chemin 


d'intégration si: 


Î FodF= [ F odr (10.483) 


pour toute courbe €’, ayant les mêmes points de départ et d'arrivée. De plus, si le champ de vecteurs 
satisfait (où G en physique est typiquement un potentiel): 


à 
FREE ” h 
Ga = F =gradiG)i=Vi(G) (10.484) 


tel que (le lecteur y reconnaîtra une forme différentielle totale exacte): 


F odr = F,(x,y)dx + F, (x, yhdy = LACS . =dG (10.485) 
Ox dy 


Alors l'intégrale de chemin sur une courbe arbitraire dépend uniquement de la différence des valeurs de la 
fonction G aux deux extrémités! 
Démonstration: 


Si la forme différentielle du champ de vecteur satisfait bien une différentielle totale exacte, nous avons: 
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E 
Was=| ((a 02 F Le. 2h-(: | FE), ONE = CO 
4\ 0x dy Ox di Oy dt (10.486) 
=Gizribi,yléll-Gxt4i,yié 4 
OC.Q.F.D. 


Donc l'intégrale curviligne d'une différentielle totale exacte ne dépend pas du chemin d'intégration mais 
seulement des extrémités. Nous en déduisons également que si À dérive donc d'un potentiel scalaire et 
que À = B, l'intégrale curviligne est alors nulle. 


En physique ce résultat s’interprète en disant que le travail fourni par une force À dérivant d'un potentiel 
scalaire s'exerçant sur une particule élémentaire lors d'un déplacement fini ne dépend pas du chemin suivi. 


Définitions: 


D1. Lorsque la courbe C est fermée et que l'intégrale de chemin a un résultat indépendant du sens dans 
lequel ce chemin est parcourue, nous utilisons la notation (la lettre sous l'intégrale pouvant évidemment 


varier….): 
TJ (10.487) 


| dis 


Si cette intégrale fermée est toujours nulle, nous disons que le champ vectoriel intégré est un "champ 
conservatif" et "dérive d'un potentiel scalaire" (et donc satisfait le théorème de Schwarz pour pouvoir être 
écrit sous forme de différentielle totale exacte) puisque ceci découle de la démonstration donnée déjà juste 
plus haut. 


D2. Lorsque la valeur de l'intégrale de chemin fermée dépend du sens de parcours, nous utilisons la 
notation suivante (la lettre sous l'intégrale pouvant évidemment varier...): 


É L 


Ainsi, si le sens est direct (c'est-à-dire "anti-horlogique" ou encore "trigonométrique") comme la notation 
de gauche, son signe sera positif; si au contraire le sens est horlogique son signe sera négatif (voir la 
démonstration dans le chapitre d'Analyse Complexe). Nous parlons alors respectivement souvent de "sens 
négatif" ou "sens positif". 


Ainsi, pour résumer, une intégrale curviligne (de chemin) est entièrement définie par l'expression sous le 
signe de l'intégrale, la forme de la courbe d'intégration et le sens d'intégration. 
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Remarque: Le lecteur pourra trouver des démonstrations de propriétés très importantes des intégrales 
curvilignes dans le chapitre de Calcul Vectoriel comme le théorème de Green-Riemann ou encore une 
étude d'application particulière aux fonctions holomorphes dans le chapitre d'Analyse Complexe. 


6. ÉQUATIONS DIFFÉRENTIELLES 


Définition: En mathématiques, une "équation différentielle" (E.D.) est une relation entre une ou plusieurs 
fonctions inconnues et leurs dérivées jusqu'à l'ordre n. "L'ordre" d'une équation différentielle correspond 
au degré maximal de différentiation auquel une des fonctions inconnues y a été soumise. 


Par rapport à notre objectif d'essayer de voir comment la mathématiques décrit la réalité sensible, les 
équations différentielles remportent un franc succès, mais sont également la source de bien des soucis. 
D'abord des difficultés de modélisation (voir par exemple le système d'équation différentielles de la 
relativité générale...), des difficultés de résolution (il n'existe pas de méthode générale!), puis des 
difficultés proprement mathématiques, enfin des difficultés liées au fait que certaines équations 
différentielles ne sont pas stables par nature et donnent des solutions chaotiques (voir le chapitre de 
dynamique des populations pour des exemples simples flagrants!). 


Remarque: Les équations différentielles sont utilisées pour construire des modèles mathématiques de 
phénomènes physiques et biologiques, par exemple pour l'étude de la radioactivité ou la mécanique 
céleste. Par conséquent, les équations différentielles représentent un immense champ d'étude, aussi 
bien en mathématiques pures qu'appliquées. 


L'équation différentielle d'ordre n la plus générale peut toujours s'écrire sous la forme: 


Ffxy,y'...,»")= Ô 


Nous ne considérons sur ce site que le cas où x et y sont à valeur dans R . Une solution à une telle ED. 
sur l'intervalle ? CR est une fonction y € C* (Z,IR) (une fonction y: ? IR qui est n fois continûment 
dérivable) telle que pour tout x € 7, nous ayons: 


Fx,7(,> 0,7" (x) 0 


Remarques: 


R1. Pour des raisons qui seront développées par la suite, nous disons aussi "intégrer l'E.D." au lieu de 
"trouver une solution à l'E.D.". La première expression se retrouve particulièrement dans la littérature 
anglo-saxonne. 


R2. Étant donné que tout le site Internet est bourré d'exemples d'équations différentielles avec 
conditions initiales (on parle alors de "problème de Cauchy") et de méthodes de résolutions dans les 
chapitres sur la mécanique, la physique atomique, la cosmologie, l'économétrie, les suites et séries, 
etc., nous ne ferons pas d'exemples ici et ne nous intéresserons donc qu'à l'aspect théorique minimal. 


6.1. ÉQUATIONS DIFFÉRENTIELLES DU 1ER ORDRE 


Une équation différentielle du 1er ordre est donc une E.D. qui ne fait intervenir que la première dérivée y. 
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Définition: Une équation différentielle du 1er ordre est dite "E.D. d'ordre 1 à variables séparées" si elle 
peut s'écrire sous la forme: 


J)y'= gx) (10.491) 


Une telle équation différentielle peut s'intégrer facilement. En effet, nous écrivons: 
(10.492) 


Puis symboliquement: 


Job = dde [fond = [etdxte® (10405) 


Remarque: Nous écrivons ici explicitement la constante d'intégration arbitraire -# £ [R (qui est 
implicitement présente dans les intégrales indéfinies) pour ne pas l'oublier! 


Il s'agit donc d'abord de trouver des primitives F et G de f et de g, et ensuite d'exprimer y en terme de x (et 
de C): 


F(y) = G()+c* se y= F(G(x) +c#*) (10.494) 


La constante d'intégration est fixée lorsqu'on demande que pour un x = x, donné, nous ayons une valeur 


donnée de y{x}= y{x) = »,. Nous parlons alors de "problème aux valeurs initiales". 


6.2. ÉQUATIONS DIFFÉRENTIELLES LINÉAIRES 


Définition: Une équation différentielle d'ordre n est dite "E.D. linéaire" (E.D.L.) si et seulement si elle 
est de la forme: 


Ep) = f(x) (10.495) 


Avec: 
L(y) = a,(x)y +a,(x)y'+a,(x)y' +... + a, (y (10.496) 


Voyons maintenant une propriété qui peut sembler négligeable au premier coup d'oeil mais qui va prendre 
de l'importance plus loin! 


Nous allons montrer que L est une application linéaire: 
. tj _ + HS ti 
L(y +z) = > a; {x} +2) L > a; (x}y + Y'a {x} = L(y)+Z(z) (10.497) 
iD i 0 iD 
Et pour tout À e R: 


LA = La GX)" = 45 a = AL) 0408 
i 3 
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Nous disons alors que l'E.D. linéaire représente un modèle linéaire si les multiples de cette fonction (ou 
toute combinaison linéaire) sont aussi solution. Ainsi, en physique, pour un système linéaire, 
l'amplification de la cause implique une amplification de l'effet (les systèmes sont souvent linéaires dans 
le cas scolaires mais dans la réalité ils sont plutôt l'exception!). 


Définition: L'équation différentielle (c'est la plus courante en physique): 
£(y)=0 (10.499) 
s'appelle "équation homogène" (E.H.) ou "équation sans second membre" (ESSM) associée à: 


Z(y) = f(x) (10.500) 


Nous allons maintenant démontrer une propriété importante des E.H.: l'ensemble {So} des solutions de 
E.H. est le noyau de l'application linéaire L (ce qui rappelons-le signifie: £{Sa)= 0 ) et l'ensemble {S} des 
solutions à Z(}y) = f(x) est donné par: 


S= Yy +50 = b, +Yh Lx e{S } avec Er, }= f(x) (10501) 


c'est-à-dire que les solutions de la forme: 
Y=Yp +Yn (10.502) 


où y, est une "solution particulière" de Z(y) = f(x) et y; la "solution homogène", parcourent toutes 
les solutions de l'E.D. 


Démonstration: 


La première affirmation sera supposée évidente. 
En ce qui concerne la 2ème partie, toute fonction de la forme y, +3 est solution de Z(y) = f(x). 


En effet c'est trivial et cela découle de la définition du concept de noyau (cf. chapitre de Théorie Des 
Ensembles): 


y, +33)= 20, )+20n)= f(x)+0= f(x) (10.503) 
CIC.Q.F.D. 


Ce qu'il est important aussi de comprendre avec les E.D. linéaires avec second membre, c'est que si nous 
trouvons des solutions à L(y) avec un second membre donné et des solutions à la même E.D. avec un autre 
second membre (différent!), alors la somme de toutes ces solutions, sera solution de l'E.D. avec la somme 
des seconds membres!!! 


Il existe de nombreuses manières de résoudre les équations différentielles linéaires ou non linéaires de 
manière exacte ou approchée. Citons les quelques méthodes que nous analyserons plus loin par l'exemple 
(mais qui se trouvent déjà de très très nombreuses fois dans les chapitres de physique): 


- La "méthode du polynôme caractéristique des E.D." (voir plus bas) utilisée un peu dans tous les chapitre 
de Physique/Chimie du présent site. 
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- La "méthode du facteur intégrant" (voir plus bas) pour la culture générale mais utilisée à ce jour sur 
aucun cas pratique du site. 


- La "méthode de variation de la constante" (voir plus bas) et utilisée à ce jour uniquement dans le 
chapitre de Génie Industriel. 


- La "méthode des perturbations des E.D." (voir plus bas) utile pour la physique quantique ondulatoire et 
le physique quantique des champs. 


Signalons également d'autres méthodes très utilisées (grands classiques scolaires) mais qui sont 
prinicpalement traitées au cas par cas dans les différents chapitres du site car les approches de résolution 
sont trop nombreuses et particulières: 


- La "méthode de séparation des variables E.D." (équation de la chaleur dans le chapitre de 
Thermodynamique, équation des vagues dans le chapitre de Génie Marin & Météo, équation d'évolution 
de Schrôüdinger dans le chapitre de Physique Quantique Ondulatoire, vibration d'un tambour dans le 
chapitre de Mécanique Ondulatoire) dont nous verrons un cas très particulier et simple plus bas mais pour 
laquelle il vaut mieux se référer aux chapitres mentionnés pour des exemples concrets. 


- La "méthode matricielle de résolution des E.D." et "solution triviales des E.D." (modèle de Lotka- 
Volterra dans le chapitre de Dynamique des Populations, résonance de spin électronique ou nucléaire dans 
le chapitre de Physique Quantique Relativiste, modèle de Lorenz dans le chapitre de Génie Marin & 
Météo). 


- La "méthode de la transformée de Fourier des E.D." ou la "méthode de la transformée de Laplace des 
E.D." (équation de la chaleur dans le chapitre d'Analyse Fonctionnelle, résolution de l'équation de Black 
& Scholes dans le chapitre d'Économie, équation de la poutre sous charge ponctuelle dans le chapitre de 
Génie Civil) 


- Les "méthodes numériques des E.D." pour résoudre les équations différentielles avec l'ordinateur quand 
elles n'ont pas de solutions analytique connues (équation de la chaleur dans le chapitre de Méthodes 
Numériques). 


6.3. MÉTHODE DU POLYNÔME CARACTÉRISTIQUE 


La résolution des équations différentielles simples (à coefficients constants et sans second membre la 
plupart du temps...) utilise une technique faisant appel à un polynôme caractéristique de l'équation 
différentielle dont nous verrons les détails dans les développements à suivre sur quelques cas particuliers 
courants en physique. 


C'est une méthode relativement simple à mettre en place lorsque nous cherchons les solutions homogènes 
de l'équation sans second membre (ESSM). Dans le cas contraire, celui de la présence d'un second 
membre, nous additionnons les solutions de l'équation homogènes aux solutions particulières. 


6.3.1. RÉSOLUTION L'E.H. DE L'E.D.L. À COEFFICIENTS CONSTANTS D'ORDRE 1 


Considérons l'E.D.L. à coefficients constants suivante: 


D +ay = f() 


qui est une version simplifiée de l'E.D.L à coefficients constants générale suivante: 
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d 
a"? +b'y=0 (10.505) 
dx 
où: 
b' 
@=— (10.506) 
a' 


Nous écrivons son équation homogène (ESSM) associée: 


d 
4 +ay=0 (10.507) 
dx 


Ce qui peut s'écrire: 

d 

D = dx (10.508) 
Ÿ 

d'où: 


In( y} = -ax +" = y, =e 


” te E — _ 
axrc ee" ge A =Cg % (10509) 


Il y a derrière cette solution homogène une infinité de solutions: à chaque valeur donnée à C correspond 


une solution. 


Il faut encore à cette solution homogène ajouter la solution particulière y, et nous disposons pour cela 
d'une collection de recettes, qui dépendent du type de la fonction f{x) du second membre de l'équation. 


Nous les verrons au cas par cas dans les différents chapitres de Physique. 


6.3.2. RÉSOLUTION DE L'EH. DE L'E.D.L. À COEFFICIENTS NON CONSTANTS DE L'E.D.L 


D'ORDRE 1 


La solution générale des équations différentielles linéaires homogènes (ESSM) d'ordre 1 à coefficients 


non constants: 


a(x)y +B(x)y = 0 (10,510) 


peut toujours se réduire à la forme suivante: 


y'+g(x)y=0 (0511) 


gx 2 


(10.512) 


Bon évidemment il y a la solution y = 0... mais cherchons à faire mieux. Nous avons donc: 


=-g(x) (10.513) 


& [SX 
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Il vient donc: 


In(y)=-G{x) + (10514) 
où G(X) est une primitive de g(x). Dès lors: 
y me 60) 2 49 ÉD) (10,515) 


Il est aussi fréquent de retrouver ces développements sous une autre écriture un tout petit peu plus 
explicite qui est la suivante: 


Nous repartons donc de l'équation différentielle sans seconde membre à coefficients non constante: 
dy 
a(x) Fa +b(2)y=0 (10.516) 


après réarrangement: 


ä b 

ee - es (10.517) 

y a(x) 
Et donc: 

miypi+c ex (10.518) 
" a(x) 
Soit: 
nt) 


Ce résultat nous sera très utile pour calculer la transformée de Fourier d'une fonction Gaussienne 

(cf. chapitre Suite Et Séries), transformée de Fourier qui est indispensable pour résoudre de manière assez 
générale l'équation de la Chaleur (cf. chapitre de Thermodynamique), résolution qui nous permettra enfin 
de démontrer l'équation de Black & Scholes (cf. chapitre d'Économie). 


6.3.3. RÉSOLUTION L'E.H. DE L'E.D.L. À COEFFICIENTS CONSTANTS D'ORDRE 2 


Considérons l'E.D.L. à coefficients constants suivante: 


d?y dy 
— + g = + by = (10.520 
re a Fa y = f(x) ) 


qui est une version simplifiée de l'E.D.L à coefficients constants générale suivante: 


2 
a V4 


——+c'y=0 (10.521) 
dx? dx 


Page: 7179/4839 


[v3.0 - 2013] 


NS 


ou: 


dans laquelle la fonction du second membre est nulle. Nous pouvons assez rapidement entrevoir une 
solution du type (en s'inspirant de la forme des solutions des E.D. du 1er ordre): 


y= A8 XTT (10.524) 


où ? est une constante. Ce qui nous donne alors: 
ARR X+T Laiker *+T LhieRXtT = (10.525) 
Ce que nous pouvons simplifier en: 


K?+aK+b=0 (10.526) 


LEA 


Si notre hypothèse de départ est bonne, nous n'avons qu'à résoudre en K cette "équation 
caractéristique" (ECAR) ou "polynôme caractéristique" de l'équation homogène pour trouver la solution 
homogène: 


2 — 
_ za + Va” — 4b (10.527) 


dont les solutions dépendent du signe du discriminant du polynôme caractéristique: 
À=a?-4b (10.528) 
- Si le discriminant est strictement positif, soit À > 0: 
Alors nous savons que le polynôme caractéristique possède deux racines distinctes et nous avons alors: 


», = ACT + peRX +6) (10,529) 


A LL 


où KT=e"* et K,86 =c*!'. Nous disons alors que la solution est "retardée" ou "avancée" selon les 
1 2 


valeurs de ces constantes. Mais l'essentiel est de remarquer que si y; (x) est solution, alors y,(x +Ax) est 
toujours solution! 


Nous parlons alors de "solution générale de l'équation homogène". Il y a derrière ce résultat une infinité de 
solutions: à chaque valeur donnée aux constantes À, B correspond une solution. 


Les physiciens écrivent aussi parfois cela sous une forme particulière en posant d'abord: 
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avec donc: 


a+£$=K «&-B=K; (410.531) 


Et en utilisant les fonctions de trigonométrie hyperbolique (cf. chapitre de Trigonométrie): 


8x — 8x 

cosh( 8x) = —— 
| BL Rs (10.532) 

sinh(,5x) = NE 


d'où finalement la possibilité d'écrire la solution homogène sous la forme (lorsque nous omettons l'avance 


ou le retard 5 =T=û): 


Ya = 8% (Ci cosh(&)+C sinh(6£)) (10.533) 


Par ailleurs, montrons que les solutions de l'ESSM forment un espace vectoriel de dimension 2 


(correspond donc à l'ordre de notre E.D.)! 


En effet: 


- La fonction zéro: y = Ü est solution de l'ESSM (ça c'est inutile de le démontrer... évident!). 


- La somme ou soustraction des solutions reste solution (ça nous l'avons déjà démontré plus haut) 


- Les éléments de la base de l'espace vectoriel (les solutions de l'ESSM) sont linéairement indépendants 


(ça c'est intéressant car nous en aurons besoin!). 


Posons: 
Yn = AA + hf) (10.534) 
Alors: 
: = d ‘ + A Ûl 
É LÀ 2/2 (10.535) 
Ya = Af + A 


Ces relations injectées dans l'ESSM sous forme généralisée: 


2 
a V4 


——+c'y=0 (10.536) 
dx? dx 


donne alors: 
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ay, + bp, +op, =alAf +2 % |+élañ+2%]|+claf +27] 


= À (añ +2 +cf )+ 4 (af +bf +cf ]= à 0+20=0 


(10.537) 


Donc nous avons bien une structure d'espace vectoriel. 

Rappelons que inversement deux fonctions sont linéairement dépendantes si: 
Vi AD =A4 S (2 (410.538) 

- Si le discriminant est nul, soit À = 0: 

L'équation caractéristique possède une racine double réelle K. 


En allant un peu vite nous dirons alors: 
>» = 4e C4) (10.530) 


et que c'est fini. mais au fait ce serait oublier que la base vectorielle doit être formée de deux solutions 
indépendantes! 


Donc la deuxième solution est probablement... de la forme: 
Æ(x+t) 


V2 = z(x}e (10.540) 


Alors: 
Fe L KeFC+t),(x) +z (x)e À (XF) 


di: _ KR HE) ,(x) + KeR OH) 2x) + Kz'(x)e RIT) + 2 "(x)e ÉCXTT) (10.541) 
= Ke EH), (x) +0 Ke 8 MH) (x) + 2 x)e À X+E) 


Si nous l'injectons cela dans l'ESSM sous forme généralisée: 


d'y ,d 
a+ += 0 (1054) 
dx dx 


alors: 
af ke 09; + 2KeF 04), +z "JE CHT) | +8(kF649, + z'eF (#1) | + ce FX) =Û 
gR(XH) (ak? +BK +c)z +eRCx+t) (2ak +86)z+ ae RCE); 0 (10.543) 
(ak? +8K+c)z+(24X +5)2'+a2" = 0 

Soit dans notre cas: 


K?+aK+b\z+(2K+a)z'+z"=0 (10.544) 
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Or, les deux valeurs de K réelles sont justement solutions de: 


K?+aK+b=0 (10.545) 


La relation antéprécédente se réduit alors à: 
(2K+aiz'+z"=0 (10546) 


et comme nous sommes dans le cas d'étude où le discriminant est nul, il vient: 


Donc la relation antéprécédente se réduit au final à: 
z"=0 (10.548) 
Nous en déduisons: 
z"=0—2z'=c" —=2z= Bx+e" (10.549) 


Donc finalement: 


2 RUX+T) 


Ya = (8x+c*) (10.550) 


Ce qui donne pour la solution générale de l'ESSM: 


KG+HE) 0551) 


Ya = (Gix+C)e 
- Si le discriminant est négatif, soit À <0: 


L'équation caractéristique possède deux racines complexes conjuguées (cf. chapitre d'Algebre): 


K =a@+i8,K, =&-—i8 (10.552) 


Dès lors: 
y, = Ada#8)0+5) | p(ai8Xx+6) 
gode) ACT) p, ad), -HAx+6)  ,a(it) 4 CE) à Ur dpi Ax+6) 
= 4e #T)(cos( 8x + 78) +i sin( 8x +78) +Be A À(cos(8x+ 48) —isin( 8x + %)) pu 
= Ya + Ya2 


Or, si nous cherchons plutôt des solutions réelles, nous pouvons toujours poser A et B égaux tels que: 


5 1 
= Cu + Yn2 } + Vu É V2) = 6 CT os( 8x4 78)+ e VS Din( 8x + 58) 


= ee Los(Bx+ Te) + 6% Ain ( Bx+ 45) = e A'cos(8x +78)+B'sin( 6x + 68) 
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Et si nous posons que le retard et respectivement l'avance sont nuls (5 = T7 = Ô ), alors nous retrouvons la 
relation disponible dans la plupart des livres: 


Ya = € (A'cos( 8x) +B'sin(Bx)) (10.555) 
où À' et B' sont donc deux constantes réelles quelconques. Il existe une autre forme importante à cette 


dernière relation (souvent utilisée en électronique par exemple). Effectivement, Il est possible, pour tout A' 
et B' réels, de trouver C' et ® réels tels que l'égalité suivante soit vérifiée: 


A'cos(Bx)+ B'sin( 8x) = C'cos(f-#) (10556) 


Nous posons: 
C'=4#4%2+p2 (410557) 
alors: 


‘int 8x) = C'| À Le 
A'cos( 6x) + B'sin( 6x) = C Ë cos( 6x) + D: sn(B) | (10.558) 


Il est alors possible de trouver # tel que: 


A B 
— =cos® et —=sin 10.559 
$ UT. $ (10.559) 


La quantité de départ s'écrit ainsi: 
A'cos( 8x) + B'sin( 8x) = C'[cos Scos(Bx) +sin psin( 8x) | =C'cos ($ = #) (10.560) 


Finalement: 


Ya = C'e%cos(-#) (10.561) 


Nous pouvons donc faire le résumé suivant: 


2 
pos) 4600 à 2 E000 


ne cos (8x) +B' sin(8x)) 


Tableau: 28.1 - Solutions types de l'E.H. de l'L'E.D.L. à coefficients constants 
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6.4. MÉTHODE DU FACTEUR INTÉGRANT (D'EULER) 


La technique du facteur d'intégration est utile lorsqu'il s'agit de résoudre des équations différentielles de la 
forme: 


D'+f(x)y= gx) (10.562) 


Nous n'avons pas à ce jour de cas pratique d'application de cette technique dans les autres chapitres du 
site. Il faut donc voir cela comme une présentation pour la culture générale. 


L'idée de base étant de trouver une fonction f(x), appelée "facteur d'intégration", par laquelle peut être 


multipliée notre équation différentielle pour ramener le terme de gauche de l'égalité à une simple dérivée. 
Par exemple, pour une équation différentielle linéaire comme celle ci-dessus, nous choisissons assez 
souvent le facteur d'intégration suivant (mais ce n'est de loin pas la seule possibilité et ce choix ne permet 
pas de tout résoudre!): 


M(x)=e"@2 (10.563) 
Nous avons alors: 
D (y+ f(oy)= ge (10.564) 

ou en distribuant: 

p'e TT + f(nye"® = g(ne ® (10565) 
Ce qui peut donc être vu comme: 

v'eO) + F'p)ye C9 2 g(xje FC) (10.566) 
ou encore plus fort (et c'est là que réside toute l'astuce)...: 
FC) |: FO Go567) 


| ye = g(x}e 


Nous pouvons alors prendre la primitive par rapport à x: 
[| ve 709 l'dx = | ge x (10.568) 
et trivialement (!) nous avons la primitive de gauche qui est immédiate: 


ye FC L  g(oe ax (10.569) 


Page: 785/4839 


[v3.0 - 2013] 


Soit: 
ver = [ g(me ax (10.570) 


Ce qui est parfois écrit: 


1 


| ax lewe DE dx (10.571) 
eg 


Ÿ 


Exemple: 
Considérons l'équation différentielle: 
y'+2-4=0 (10.572) 
X 
Que nous mettrons sous la forme: 
dy 


1 
—+—y=4 (10.573) 
dx x 


Nous voyons alors que (en assumant que x soit strictement positif): 
l 
f()=-—F(x)=in(x) (10.574) 
x 


Nous avons alors: 


(10.575) 


Hasard faisant (l'exemple est exprès simple), nous avons cette égalité qui se simplifie puisque: 


ex) = x (10.576) 


en: 
dy 1 
(2 +2) =4x (10.577) 
x 


Ce qui peut se condenser en: 


(xy)'=4x (10.578) 
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En intégrant: 


l(xyl'dx=|4xdx (10.579) 
Il vient alors immédiatement: 
__n.2 fe 
x = 2x +€ (10.580) 


Soit: 


fe 
C 
Y=2x+— (10.581) 
x 


6.5. MÉTHODE DE SÉPARATION DES VARIABLES 


La méthode de séparation des variables est une technique très fréquente en physique dès que nous avons 
des équations différentielles du deuxième ordre. De nombreux exemples très complets et pratiquent se 
trouvent déjà de part et d'autres dans les différents chapitres déjà précédemment mentionnés. Nous allons 
ici juste en présenter un cas particulier par principe juste histoire de bien faire les choses mais au 
minimum vital! 


Considérons le cas fréquent en physique d'équation différentielle partielle du type: 


2 
SU où =0 (10.582) 


%° 
La solution de cette équation nécessite donc de trouver une fonction U qui dépende de x et de y tel que: 
U=U(x,y) (10.583) 


En physique, l'idée consiste alors à poser que nous pouvons toujours trouver une solution dite séparable 
de la forme: 


Ulx,yl=Æ{(x)F(y) (10.584) 
Ainsi, l'équation différentielle s'écrit: 


8 X(xiY (y) X(x)7(>)_, 
x dy 


(10.585) 


Ce qui peut se simplifier en: 
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Après réarrangement est il d'usage en physique de noter cette dernière égalité sous la forme condensée: 


Cette égalité ne peut avoir lieu que si chacun des termes est une constante puisque X ne dépend que de x 
et Y que de y. Il vient alors: 


Et chaque équation différentielle par alors être résolue indépendamment de l'autre et une fois les solutions 
trouvées on les multiplie pour donc déterminer l'expression de U. 


6.6. MÉTHODE DE VARIATION DE LA CONSTANTE 


L'idée de la méthode de variation de la constante est la suivante: si nous avons une solution particulière 
affectée de constantes, nous savons qu'en fonction des conditions initiales celles-ci sont bien déterminées. 
L'idée est alors de généraliser en posant que ces constantes sont des fonctions. Dans certains cas 
évidemment les développements mathématiques montreront que les fonctions sont obligatoirement des 
constantes. 


L'idée sous-jacente de cette méthode, c'est de se dire que les solutions de l'équation différentielle (linéaire) 
avec second membre vont ressembler aux solutions de l'équation homogène. Comme le terme de droite va 
perturber cette solution, nous faisons varier uniquement les constantes (qui n'en seront plus), mais nous 
restons sur la "base" des solutions homogènes, pour chercher des solutions proches. Après, nous vérifions 
que ce raisonnement à la physicienne donne bien toutes les solutions de l'équation. 


Voyons avant de passer au cas général un exemple simple en considérant l'équation différentielle suivante: 
J'E)+by() =1 (10.589) 
pour laquelle la solution particulière de l'équation homogène (ESSM) est: 
To (À = 4e % (10.590) 
La méthode de variation de la constante consiste alors à poser: 
A= AE) (10.591) 
et donc: 
»0 6 = Abe À - bA(fe % (10.592) 


Or de par l'équation différentielle avec second membre, nous avons: 
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»0 0 +0 (= 12 »0 © = 1-0 (0 = 1- B4e Pt (10.595) 


Donc en utilisant les deux dernières relations il vient: 


1 1 = Et —Èt 
Yo (= Ale ” — bA(fe 
J . = A)= 8 (10504 
Ja (9 = 1-b4e 
et il s'ensuit que: 


A(£) = Let (10.595) 


où nous avons éliminé la constante d'intégration parce que nous voulons c'est une solution particulière! La 
solution générale particulière (pg) est alors la somme de la solution particulière homogène et celle avec la 
variation de la constante: 


D'o,pe (6) = 4e 70 + AE) Pt = 407% +de # = Ag Pt + (10.596) 


Ainsi, en généralisant l'exemple précédent, nous avons donc une équation différentielle de la forme: 
Y'E+bDÉ)=6€ (10.597) 
La solution particulière générale sera alors: 
CM 6E):=Coté)ro E) (10.598) 
Nous avons alors: 
70 0) = Co) 6) + Co E)ro @) (10.59) 


d'où injecté dans l'équation différentielle d'origine: 


Ch 6) © + Co O0 ©) + 80) Ca (Ovo (© = c(E) (10.600) 
RO e— 
7) Lt) 


Soit après factorisation des termes semblables: 


MODNOE OP NOEL OCTO) M OIEO RU 


Nous avons donc la relation ci-dessus et la solution particulière à l'équation différentielle homogène (donc 
sans seconde membre): 
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CE» © - Col vo ©) +8) En] = ct) 


0 = OC É»() 


> HÉO»mÉ=cÉ (0602) 


Nous trouvons donc: 


cé) 


(= 
Le 10) 


(10.603) 


et il suffit alors d'intégrer cette équation pour trouver Cf {} . Ensuite, la solution générale particulière (pg) 


est alors la somme de la solution particulière homogène et de celle avec la variation de la constante. 


6.7. SYSTÈMES D'ÉQUATIONS DIFFÉRENTIELLES 


Voyons maintenant des développements particuliers qui vont aussi bien être utiles en physique quantique 
que dans la résolution de systèmes particuliers d'équations différentielles (et particulièrement une qui est 
connue en théorie du chaos!). 


Indiquons d'abord au lecteur avant d'aller plus loin que le cas plus complexe non homogène (avec seconde 
membre) et avec coefficients inconnus est traité directement par l'exemple dans le chapitre de Génie 
Industriel lors du traitement de la fiabilité d'un système réparable sous la forme d'une chaîne de Markov 
avec traitement par les déterminants et valeurs/vecteurs propres. 


Pour commencer cette première approche, il va nous falloir introduire le concept d'exponentiation d'une 
matrice: 


L'ensemble des matrices #*X# à coefficients dans € noté 44, (€) est un espace vectoriel pour l'addition 
des matrices et la multiplication par un scalaire. Nous notons 1 la matrice identité. 


Nous admettrons qu'une suite de matrices À, converge vers une matrice À si et seulement si les suites de 


coefficients des matrices À, convergent vers les coefficients correspondants de A. 
Exemple: 


Dans À, (C) la suite de matrices: 


l{x# 2 
0 # +1 (10.604) 
# 


converge vers: 


0 2 
(10.605) 
0 ]1 


lorsque* — C2. 
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Sixe €, nous avons vu lors de notre étude des nombres complexes (cf. chapitre sur les Nombres) que la 
série: 


e k 
D — (10.606) 
ko €! 


converge et sa limite est notée 4". En fait ici il n'y a aucune difficulté à remplacer x par une matrice À 
puisque nous savons (nous l'avons montré lors de notre étude des nombres complexes) que tout nombre 
complexe peut s'écrire sous la forme suivante (le corps des nombres complexes est donc isomorphe au 
corps des matrices réelles carrées de dimensions 2 ayant cette forme): 


Lama O0 -17, fa 
X=4aTiI =a4 oi 1 0 — b à (10.607) 


et qu'un nombre complexe au carré est équivalant à mettre sa forme matricielle au carré: 


2_22 
—b* —2ab 
x? = (a+ib) (a +ib) = a? +aib+iba —b°? = (a - p? } + 2abi = : . (10.608) 
2ab a? -b? 


Effectivement: 


a BP [a -blla -5] [a-p2 24 
= = 10.605 
b a b a || a ab a -b? te 


Nous définissons alors l'exponentielle d'une matrice 4€ M, (CT) comme la matrice limite de la suite: 


w k 
ef = D — (10610) 
0 €! 


Si la matrice À est diagonale il est évident que son exponentielle est facile à calculer. En effet, si: 


À 0 4 0 
ÂA= ., = A = ., (10.611) 
: 0 4 
Par suite: 
co ri 
—— 0 
= 1[* 0 2% e1 0 
ler =, = ., = , (10.612) 
Lo aÿ : 4) | ex 
2e 
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Or, il apparaît évident qu'une matrice non diagonale va être beaucoup plus compliquée à traiter! Nous 
allons alors utiliser la technique de diagonalisation soit une réduction des endomorphismes (cf. chapitre 
d'Algèbre Linéaire). 


Alors, remarquons que si $'€ M, (€) est inversible et si 4e 4, (€) alors: 


SAS _ GAG-l (10.613) 


Ceci découle du fait que (penser au changement de base d'une application linéaire comme ce qui a été 
étudié dans le chapitre d'Algèbre Linéaire): 


(SAS) = SASPF ASP AS IS. SP AS = SAÏST (10.614) 


Donc: 


"=> 


ne w A* r 
(À &]s l Go615) 


0 


Ce développement va nous permettre de ramener le calcul de l'exponentielle d'une matrice diagonalisable 
à la recherche de ses valeurs propres et de ses vecteurs propres. 


Exemple: 


Calculons 24 où: 


3 —4 
A= (10.616) 
—6 ] 


Les valeurs propres de A sont À =-3, À, =7 et les vecteurs propres associés sont: 


Effectivement: 
ee 2e) +") 
6 él Al 
En posant: 
s- 2 1] 
=l3 2 (10.619) 
Nous avons: 
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avec: 


a ES 3 
ST = 3/5 2/5 (10.621) 


Par conséquent: 


3 0 3 0 
1 e. 3 7 3 _0,7 
gt = { ) sd 1) -$l° : | + ” : Le “ - . (10.622) 
8 51%" -3e" %e°+2e 
Maintenant, rappelons que dans le cas des nombres réels nous savons que si x,Y € R alors: 


ge**Y = g%e) (10.623) 


Dans le cas des matrices nous pouvons montrer que si À, 8 € M4, (C) sont deux matrices qui commutent 


entre-elles c'est-à-dire telles que AB = BA, alors: 
gB SAGE (10.624) 


La condition de commutativité tient au fait que l'addition dans l'exponentielle est quant à elle 
commutative. La démonstration est donc intuitive. 


Un corollaire important de cette proposition est que pour toute matrice À € Àf, (C) , e4 est inversible. En 
effet les matrices À et —-A commutent, par conséquent: 


e40 4 = 4292] (10625) 
Nous rappelons qu'une matrice À à coefficients complexes est unitaire si: 
AAT=7 (10.626) 
La proposition suivante nous servira par la suite. 


Montrons que si À est une matrice hermitienne (dite aussi "autoadjointe") (cf. chapitre d'Algebre Linéaire) 
alors pour tout £€R, 2*4 est unitaire. 


Démonstration: 


Can: = 4) ge #A LA (10.627) 
Donc: 
(et, gt = GA A RAA) L } (10.628) 
C.Q.F.D. 


Rappelons que cette condition pour une matrice autoadjointe est liée à la définition de groupe unitaire 
d'ordre n (cf. chapitre d'Algèbre Ensembliste). 
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Une des premières applications de l'exponentielle de matrices est la résolution des équations différentielles 
ordinaires. En effet, de l'équation différentielle linéaire ci-dessous avec comme condition initiale 
(0) = » et où À est une matrice: 


J'@) +A4y(@) = 0 (10.629) 
la solution est donnée (cf. chapitre de Calcul Différentiel et Intégral) par: 
y@ =Ce * (10.630) 


Nous retrouvons fréquemment ce genre de systèmes d'équations différentielles en biologie (dynamique 
des populations), en astrophysique (étude des plasmas) ou en mécanique des fluides (théorie du chaos) 
ainsi qu'en mécanique classique (systèmes couplés), en astronomie (orbites couplées), en électrotechnique, 
etc. 


Exemple: 


Supposons que nous ayons le système d'équations différentielles homogène (sans termes constants) 
suivant: 


x'=3x-4y 
10.631 
Y'=-6x+y ( ) 


A 3 4 
= 632 
_g 1] (063) 


et son exponentielle (voir les développements faits plus haut): 


La matrice associée est alors: 


5 


à l(2e +3" 29-29" n 
FT S(3e 3e" 3e +207 ne 


La solution générale du système est donc: 


x 2e + +2" 2 er de 
=@ (10.634) 


+2 
Y 2e À — 39" à 45" 
Nous avons donc: 


x=C (2e* +37) +C, (2e* - 2e") do #4 
y=û (3% -3e")+c; (3% +267) dcr (10.635) 


En calculant la dérivée des relations précédentes et en comparant à: 


x'=3x-4y 
0.636 
or (10.636) 
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nous déterminons facilement les constantes pour obtenir: 


E'-6B'=1E —-6E =6B'—>E£'=-B 


3 (10.637) 
—64'+D'=-3D'=47)'= 64" = 2" a 


ce qui nous donne finalement: 


x= A'e? +B'et 


3 


E (10.638) 
Y==4'e % _ pot 


6.8. MÉTHODE RÉGULIÈRE DES PERTURBATIONS 


Très fréquemment en physique (de pointe), un problème mathématique ne peut pas être résolu de manière 
exacte. Si la solution est connue il y a parfois une telle dépendance de paramètres que la solution est 
difficile à utiliser en tant que telle. 


Il peut arriver cependant qu'un paramètre identifié de l'équation différentielle, que nous noterons par 
tradition avec la lettre grecque € , soit tel que la solution soit disponible et raisonnablement simple pour 
g=0. 


Le souci ensuite est de savoir comment la solution est altérée pour un £ non-nul mais petit quand même. 
Cette étude est le centre de la théorie des perturbations que nous utilisons par exemple dans le chapitre de 
relativité générale pour calculer la précession du périhélie de Mercure. 


Comme la théorie dans le cadre général est trop complexe par rapport aux objectifs du site, nous nous 
proposons une approche par l'exemple d'abord avec une simple équation algébrique et ensuite avec ce qui 
nous intéresse: une E.D. 
6.8.1. THÉORIE PERTURBATIVE DES ÉQUATIONS ALGÉBRIQUES 
Considérons l'équation polynômiale suivante: 

x2-1=#x (10.639) 
Nous savons de par notre étude du chapitre d'analyse fonctionnelle, que cette équation polynômiale admet 


deux racines qui sont trivialement: 


. 2 2 


4 


Pour € petit, ces racines peuvent être approximées par le premier terme en développement de série de 
Taylor (cf. chapitre de Suites Et Séries): 


2 
n=1+2+ 2 +0(5) m=-1+2-Ë +0(e) aocai) 
> 8 2 8 
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La question et de savoir si nous pouvons obtenir les deux relations précédentes sans a priori de 
connaissances sur la solution exacte de l'équation polynômiale initiale? La réponse est bien évidemment 
affirmative avec l'aide de la théorie des perturbations. 


La technique se base en quatre étapes: 


1. Dans la première étape, nous assumons que la solution de l'équation polynomiale est une expression du 
type série de Taylor en £. Nous avons alors: 


x=Xo+eX + X +0O(E) (10.642) 
où Xp, À, X2 sont bien évidemment à déterminer. 
2. Dans la deuxième étape, nous injectons la solution hypothétique dans notre équation polynômiale: 
2 
(Xo+en +2Xx,+0() -1=e(Xo+eX% +82X,+0()) (oi) 
Comme: 
2 
= X$+0{eX +e2X, +O(8))Xo +(eX +2X, +0()) 
2 
= Xè+2(ex +3, +0(8))Xo +{(exi +e2x,) +2(2x + 2x,)o@)+07e)) 
2 2 2 3 
= XF +2(8x +e2X,)X5 +(2X + X,) +0(e) 
= X6+0{eX +2X,) Xo +(e237 +263 X, +e*X2)+0(6) 
= X9+0{e% +e2X,)X +(2X7)+0(&) 
= X2+26X X, +e°(X7 +2X,X,)+0(e) 
(10.644) 


et: 
ex= EXn+eX +O(8) (10645) 
Il vient finalement que l'équation polynômiale s'écrit: 
X8-1+6(2X0% -Xo)+ (47 +2X0X2- A )+O(8)=0 (10.646) 


3. Dans la troisième étape nous égalisons successivement les termes avec 0 tel que: 
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(e°) 
O(e):2X5% - Xy =0 
( (10.647) 


O(e?): X2+2X0X -X =0 
O(&):. 


4. Quatrième et dernière étape, nous résolvons successivement les équations polynômiales ci-dessus pour 
obtenir: 


: 
8 
En injectant ces résultants dans la solution hypothétique: 

x=Xo+ek+eX)+0O(8) (10.649) 
il est évident d'observer que nous retombons sur la solution certaine: 


a 


£ 3 e € 3 . 
nr re LE do (10.650) 


6.8.2. THÉORIE PERTURBATIVE DES ÉQUATIONS DIFFÉRENTIELLES 


La théorie des perturbations est aussi souvent utilisée pour résoudre un bon nombre d'équations 
différentielles. C'est le cas par exemple en mécanique des fluides, en relativité générale ou en physique 
quantique. 


A nouveau, plutôt que de faire une théorie ultra abstraite et générale, voyons le concept sur un exemple tel 
que précédemment. 


Considérons l'équation différentielle suivante: 

y"=-Ey"-1 (0651) 
ou autrement écrit: 

D'+Eey'=-1 (10.652) 
avec les conditions aux limites: 

y(0)=0,y(0)=1 (0.653 

La résolution exacte est relativement facile à obtenir: 
D'abord nous commençons par l'équation homogène: 


J'+Ey'=0 (10.654) 
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C'est donc une équation différentielle linéaire d'ordre 2 avec des coefficients constants, équation qu'il est 
relativement aisé de résoudre dans le cas général. Soit l'équation: 


>"+py'+gy = 0 (10.655) 


Le 


Supposons que la fonction y qui satisfait cette équation différentielle soit de la forme y =2°” où K peut 


être un nombre complexe. Nous avons alors: 
Ke +pKeŸ +ge® =0 ou K?+pK+qg=0 (10.656) 


pourvu, bien sûr, que 3** - 0. Cette dernière relation est donc l'équation quadratique auxiliaire de 
l'équation différentielle (polynôme caractéristique). Elle a deux solutions/racines (c'est une simple 
résolution d'un polynôme du deuxième degré) que nous noterons dans le cas général: #,,#,. Ce qui 
signifie que: 


k29%* +pk a + ge = 0 et KT + pKne PT =0 (10.657) 


sont satisfaites pour les deux racines. Si nous faisons la somme puisque les deux sont égales à la même 
constante: 


k k x 
(x22 +Kie"? |] +p (& FT Ke ? |] +g ( eV +e ») =0 (10.658) 
Ainsi, il est immédiat que la solution générale de l'équation homogène de y est du type: 
Ya = Aeë + Be (10.659) 


où À, B sont bien évidemment des constantes à déterminer. Nous résolvons maintenant le polynôme 
caractéristique: 


K?+gekK=0 (10.660) 


Il vient immédiatement que: 
—e+ Ve K,=-E€ 
K3 = ————— = " (10.661) 


Donc: 
Yn = 4e ** (10.662) 
Maintenant une solution particulière à: 
Y'+Ey' =] (10.663) 
est relativement trivialement une solution du type: 


Yp = BX (10.664) 
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où B est bien évidemment une constante à déterminer et qui vaut simplement une fois injectée dans 
l'équation différentielle: 


J'+ey'=-1—=0+868 = ET (10.665) 
E 


Soit: 
À te 
Yp =—-—+c (10.666) 
€ 
D'où finalement la solution générale: 
- x 
V=Y, +98 = 4e +0" (10.667) 
E 


Ensuite, avec les conditions initiales qui sont pour rappel 
y(0)=0,y(0=1 (10.668) 


il est très facile de trouver A: 
_ (l 
y(0)=0 = 40 0 22e 2 44 OS = A (10669) 
€ 
Nous avons aussi: 


y'0)=1=-E46" "0 = +c# = 64 + =] 


LL te (10.670) 
safe es 
€ € ze 


IL est loisible de choisir que «* = 0 ce qui nous donne: 


A=- Es (10.671) 
€ 


Dès lors: 


te 


= X 
Y=Yy +Yn = 4e ete (0672) 


devient: 


E+1l - x 1+6 - x 1+6 1+e : x 
HUSRS Se + = (1-2 “)-< (10.673) 


2 — ——— 
ge? E 2 E Es ES 
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Maintenant que nous avons la solution générale, si & est petit nous pouvons prendre le développement 
d'ordre 4 en série de Maclaurin de l'exponentielle (cf. chapitre de Suites Et Séries). Tel que: 


Pa 1-ent eh PR +O(éx) (10.674) 


Injecté dans y cela donne (vous remarquerez que nous exprimons parfois explicitement par 
anticipation... le terme d'ordre 5): 


= {es 224133 O(etxt)}+{ ex lo,ls,s o(stxt)] = 
€ Ë E  (o67s) 
= pe ext4s- es 22 of À ‘)-< 
€ 6 2 2 € 
réf )+e (ét) O(# x") 


Maintenant que nous avons ce développement, ce que nous souhaitons montrer c'est qu'à partir d'un 
développement perturbatif nous pouvons retrouver le même résultat en série et ce sans aucune 
connaissance préalable sur la solution. 


A nouveau, le développement pour cela se fait en 4 étapes: 


1. Dans la première étape, nous assumons que la solution de l'équation différentielle est une expression du 
type série de Taylor en £. Nous avons alors: 


Y=YotEn + y +O(E*) (10.676) 
Où Yp:)1,.32 sont bien évidemment à déterminer. 


2. Dans la deuxième étape, nous injectons la solution hypothétique de notre équation différentielle dans 
celle-ci avec les conditions initiales et nous développons le tout. 


D'abord l'équation différentielle: 


eye (mt en "+ 72 "+ O(e))+e (0 + en +6 y2 + 0(E°)) +1 —— 
= (0 "+1)+e(n "+0 )+e (2 "+ ')+O(E)= 0 ds 
ensuite les conditions initiales: 
»(0) = a (0)+ Em (0)+ & y2(0)+ O(E*) = 0 


»'O = 0 (0-1)+ en (0+#2% 0)+0()=0 


3. Dans la troisième étape nous égalisons successivement les termes avec 0 tel que: 
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O{): p"+i=0 »(0)=0 »'(O-1=0 
O(E): "+30 =0 n(0)=0 »'(0)=0 
O(E): y2"+m'=0 »2(0)=0 »2(0)=0 
O(E?): 


(10.679) 


4. Dans la quatrième étape nous résolvons les équations différentielles listées précédemment (si vous ne 
voyez pas comment nous les résolvons n'hésitez pas à nous contacter!): 


l 
Yo =x- x 


1 5 1 
=—_x2 +22 (0.680 
À > 6 ( ) 


1 1 
CR ES à 
Ya 6 


En injectant ces relations dans la solution supposée développée en série de Taylor et injectée dans 
l'équation différentielle: 


Y = Yo + EN + y +O(E*) (10.681) 


Nous retombons sur: 


1 1 1 1 1 
Y = rx +e(-5é +) a Es x) O(Px ) (10.682) 
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Notes personnelles: 
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11. SUITES ET SÉRIES 


L. suites et séries ont une très grande importance dans la mathématique appliquée et c'est la raison 


pour laquelle nous y consacrons un chapitre entier. Nous les retrouverons par ailleurs souvent dans les 
différents chapitres de la section de Mécanique lorsque nous aurons besoin de faire quelques 
approximations mineures (..) ainsi qu'en dans les chapitres d'Économie et de Techniques de Gestion. Il 
conviendra cependant de la part du lecteur de ne pas confondre dans ce qui va suivre le concept de "suite" 
de celui de "série" qui tout en étant similaires sur le fond ne s'analysent mathématiquement pas toujours de 
la même manière. 


Nous avons souhaité dans ce chapitre rester dans des choses simples sans trop partir dans les concepts 
topologiques des suites et séries. Cependant, la personne intéressée par des définitions plus rigoureuses 
pourra se reporter dans le chapitre traitant des Fractales (section d'Informatique Théorique) et de 
Topologie où de nombreux concepts sur les suites sont définis (supremum, infimum, sous-suite, théorème 
de Bolzano-Weierstrass, etc.). 


1. SUITES 


Définition: Une "suite" d'un ensemble est une famille d'éléments indexée par l'ensemble des entiers 
naturels (cf chapitre sur les Nombres) ou par une partie de celui-ci. De manière vulgarisée, nous disons 
qu'une suite est une liste d'objets mis en ordre, chacun ayant un numéro d'ordre. Nous notons 
classiquement une suite par: 


(4,) ou (2) (1.0) 
où l'indexation se fait parfois (par tradition.) sans le 0. 


Pour quelques suites, nous indiquons le premier terme à (si l'indexation commence par 1 au lieu de 0), 
ainsi qu'une formule pour obtenir n'importe quel terme #,# à partir du terme précédent x, quel que soit 
# > 1. Nous appelons une telle formulation une "définition récurrente", et la suite est dite définie "par 
récurrence" (et de même si elle est indexée à partir de 0 au lieu de 1). 


Avant de voir quelques exemples de familles de suites qui seront utilisées dans les différents chapitres du 
site (Dynamiques des populations, Économie, Physique nucléaire, etc.) voyons un petit paquet de 
définitions comme il est de tradition en mathématique. 

Définitions: 


D1. Des nombres (en suite) sont en "progression arithmétique" s1 la différence de deux termes consécutifs 
est une constante r appelée la "raison". 


D2. Des nombres (en suite) sont en "progression géométrique" si le rapport de deux termes consécutifs est 
une constante r appelée aussi la "raison". 


D3. Des nombres (en suite) sont en "progression harmonique" si les inverses de deux termes consécutifs 
sont en progression arithmétique. 
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Dès lors, une "suite" est arithmétique, géométrique, harmonique si ses termes sont respectivement en 
progression arithmétique, géométrique, harmonique et b est la moyenne arithmétique, géométrique, 
harmonique de a et c si les nombres a, b, c sont en progression arithmétique, géométrique, harmonique. 


Remarque: Pour les définitions des moyennes citées ci-dessus voir le chapitre de Statistiques 


D4. Une "suite majorée", est une suite telle qu'il existe un réel M tel que Ÿx € N, u, < 
DS. Une "suite minorée", est une suite telle qu'il existe un réel m tel que Ÿx € N, x, 2 
D6. Une "suite bornée", est une suite telle qu'elle est à la fois majorée et minorée. 


D7. Une suite (4,,) est appelée "suite croissante" si Vr € NN, ,y —u, > 0 


D8. Une suite (4, ) est appelée "suite décroissante" si Va € N, ,y —#, 0 
D9. Si une suite est croissante ou décroissante, nous disons qu'elle est "monotone". 
D10. Une suite (x, } est appelée "suite constante" si Vx € N, u,y = 4, 


1.1. SUITES ARITHMÉTIQUES 


Définition: Nous disons que des nombres ou que des "termes" en progression forment une "suite 
arithmétique" lorsque leurs valeurs numériques différent d'une valeur r appelée la "raison" de la suite telle 
que: 


Uyy = tr (11.2) 


où rest donc la "raison" de la progression. Nous avons alors bien évidemment si l'indexation commence à 


partir de 0: 


Ainsi, la suite: 
2,nA+t1,2A+2,2+3,..,R+i (114) 
où n est une constante est une suite arithmétique de raison r = 1. 
La suite: 
RHÉLATELATPEAFIL TI ZX (ls 
est une suite arithmétique de raison ” = X, etc. 


Ainsi, si nous notons par 4, un terme quelconque de la suite (4, ) de raison r, nous avons: 


LL te _ _ _ = 
u,=C ,U =Uüp+r,ü = +r=u+2r,..u, =u,+n-r (116) 
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Nous avons les propriétés suivantes pour un tel type de suite: 


P1. Un terme dont le rang est la moyenne arithmétique des rangs de deux autres termes est la moyenne 
arithmétique de ces deux termes. 


Démonstration: 


Considérons maintenant (x, ) une suite arithmétique de raison r donnée selon le développement précédent: 
u, =ü,+A:T (11.7) 


et soient &,b,4 € N tels que & + = 24, nous avons alors: 


atb at 
u, tu, =u, + (a)r tu + (br = 2u, + 2 ; r=2|12,+ ; r = des © 2 (11.8) 
2 


et donc: 


_ 


Ua Up avec *& @+b) 
2 2 


(11.9) 


OIC.Q.F.D. 


P2. Pour trois termes consécutifs en progression arithmétique, le deuxième terme est la moyenne 
arithmétique des deux autres. 


Démonstration: 


Ua TUy u ck= tt)  @)+G@+2) ant 


+ __:# gave =n+1 (11.10 
2 “#2 2 2 2 Po 


lg 


OIC.Q.F.D. 


S1 LU, ,U3,l4,...,4,,. €St une progression arithmétique de raison r, alors la n-ème somme partielle 


5, (c'est-à-dire, la somme des n premiers termes à la puissance 1) est donnée par: 


5, == [24 +x-r| où y => lu +u, | (11.11) 


lorsque l'indexation se fait à partir de 1. 
Démonstration: 
Nous pouvons écrire la série: 


S, = tu + us +... +4, 


11.12 
= + +7) + es + 2r) + us +37) +... + + Dr) é 


En jouant avec la deuxième ligne, nous obtenons: 
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S, = (a ii + in +..+i)+(r+2r+3r+..+ (a Dr) (1.13) 


Ce qui se simplifie encore: 
S, = An +r(1+2+3+..+-1) (1.14) 
Nous démontrerons quelques lignes plus bas que la série de Gauss simple: 


1+2+3+.+x% (11.15) 


est égale à: 


#(# +1 
S = tal (11.16) 
FA 
Nous avons alors in extenso pour: 
1+2+3+..+0G%-D «117 
la relation suivante: 
#— Lx 
M de (11.18) 
2 
Il vient alors: 
(x — l}» 


S, = Au, +r == [24 +r(n- )] (11.19) 


Nous voyons avec cette dernière relation que si #, = 7 = 1 nous retombons sur la série de Gauss simple. 


Comme: 
ü#, =) +r(#—1) (1120) 


lorsque l'indexation se fait à partir de 1. Il vient alors: 


Ka =" [4 +u,] (1120 


OIC.Q.F.D. 


Nous verrons d'autres types de sommations un peu plus bas lors de notre étude des séries! 


1.2. SUITES HARMONIQUES 


Définition: Nous disons que des nombres (1/a, 1/b, 1/c,...) forment une "suite harmonique" lorsque leurs 


inverses sont en progression arithmétique. Nous représentons cette progression par: 


1 1 (11.22) 
a 7 22 
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où a, b, C, …, h, k, | désignent des termes au dénominateur en progression arithmétique de raison r. 
D'ailleurs, nous supposerons, dans ce qui suit, qu'il n'y a aucun dénominateur nul. 


En partageant cette série en groupes renfermant successivement 2* termes, nous observons que chacun de 
ceux-ci est plus grand que le dernier de son groupe: 


et que la somme des termes de chaque groupe est plus grande que 1/2 . La somme des termes de la série 
augmente donc indéfiniment; nous disons alors que la série est une "série divergente" (nous reviendrons 
plus en détail sur ces concepts de convergence et divergence plus bas). 


1.3. SUITES GÉOMETRIQUES 

Définition: Une "suite géométrique" est une suite de nombres tels que chacun d'eux est égal au précédent 
n multiplié par un nombre constant q que nous appelons la "raison" de la progression. Nous désignerons 
par: 


ñ#, g'A, ga, g "A, 


Ainsi, si nous notons par #, un terme quelconque de la suite (4,), nous avons (trivial): 


= 2% 
U, — 4 


Voici quelques propriétés pour un tel type de suite (sans démonstration pour l'instant. sauf demande car 
triviales pour la plupart): 


P1. (triviale) Le quotient de deux termes d'une même suite est une puissance de la raison dont l'exposant 
égale la différence des rangs des deux termes (simple rapport de termes de puissance). 


P2. (triviale) Si nous multiplions ou divisons terme à terme deux suites géométriques, nous obtenons une 
troisième suite géométrique dont la raison égale le produit (respectivement le quotient) des raisons des 
progressions données (simple opération avec les raisons des deux séries d'origine). 


P3. Dans une suite géométrique, un terme dont le rang est la moyenne arithmétique des rangs de deux 
autres termes est la moyenne géométrique (: ) s) de ces deux termes (relisez 
plusieurs fois au besoin). 


Démonstration: 
Soit une suite géométrique réelle positive de raison q, nous avons: 
x 


Lu, —u,4 


Soient a,b deux termes de la suite géométrique, nous avons alors: 


Page: 810/4839 


[v3.0 - 2013] 


et ainsi: 


Uy = a -üy | (11.28) 
EIC:QF.D. 


Nous avons comme corolaire que pour trois termes consécutifs en progression géométrique, le deuxième 
terme est la moyenne géométrique des deux autres. 


Démonstration: 


y = NUA Ug = Uyyy = afy Uyyg (11.29) 


avec: 


L-(@tè) _@)+(+2) _2n+2  : 
2 2 2 


COIC.Q.F.D. 


Il existe cependant quelques suites particulières qui ont des propriétés particulières que nous retrouvons 
très fréquemment en mathématique ou physique théorique. Sans trop entrer dans les détails, voici une 
petite liste (non exhaustive de ces dernières): 


1.4. SUITE DE CAUCHY 


Il est souvent intéressant pour le mathématicien, autant que pour le physicien, de connaître les propriétés 
d'une suite ayant un type de progression donnée. La propriété la plus importante étant la limite vers 
laquelle elle tend. 


Remarque: Le lecteur qui n'est pas à l'aise avec la topologie peut sauter le texte qui va suivre en 

attendant. et celui qui souhaite en savoir plus sur les suites de Cauchy peut se reporter au chapitre de 

Topologie et particulièrement au chapitre consacré aux Fractales (section d'Informatique Théorique). 
Définition: Soit (X, d) un espace métrique (cf. chapitre de Topologie), nous disons que la suite: 


(x news EX VAEN (1131) 


converge vers * € À si par définition: 
Ved)0,WeNtelquez2N—d(x,,D£E (1132) 


En d'autres termes plus nous avançons dans la suite, plus les points sont proches (au sens de la métrique d 
) les uns des autres. 


Cependant la définition précédente de la convergence pose problème car la limite x doit être connue. Dans 
la plupart des cas intéressants, x est malheureusement inconnue. Pour sortir de cette impasse, Cauchy a 
l'idée de proposer la définition suivante: 
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Nous disons par définition que la suite (x, },n d'éléments de X est une "suite de Cauchy" si: 


Ve >0,1We N tel que Va, 2 Nonad(x,,A)£E (1133) 


Il est clair alors que toute suite convergente est une suite de Cauchy (bon il y a quelques subtilités 
auxquelles nous ne ferons pas référence pour l'instant). 


Remarque: Ce critère facilite certaines démonstrations car il permet de montrer l'existence d'une limite 
sans faire intervenir sa valeur, en général inconnue. 


Maintenant, montrons qu'une suite convergente est de Cauchy. 


Démonstration: 


Soit une suite 4, convergeant vers Î (qui nous est inconnu donc!) et £ > Ü (choisi au hasard). Il existe 
alors selon la définition d'une suite convergente, # eN tel que: 


n>2N=d{u,,i) £— (1134) 


|" 


le choix d'écrire £/2 est complètement arbitraire mais au fait nous anticipons juste le résultat de la 
démonstration afin que celui-ci soit plus esthétique. 


Alors pour 2,4 2 M (au fait connaître le N en question importe peu puisque cela doit marcher pour 
n'importe lequel. bon n'oublions pas quand même que N dépend de £/2) nous avons selon l'inégalité 
triangulaire (cf. chapitre de Calcul Vectoriel): 

d (x | <d(u,.i)+d{iu,) (11.35) 


x? 


et puisque d (ui) £ 


| 


ce qui revient à écrire: 


C'est peut-être un peu abstrait alors voyons un exemple avec la suite harmonique (divergente comme nous 


=. 1 
le savons déjà) x, = 2 . D'abord, rien ne nous interdit de prendre # > Z (sinon cela va être dur de faire 
KZ 


une différence entre deux termes.….). 
Dès lors nous prenons la distance euclidienne: 


ES | # 1 2» 1 
a(u,, dt) un us AE LE LE (11.38) 
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D'abord le lecteur remarquera que dans tous les cas k < 2# puisque compris entre # +1 et 2n. Ce qui nous 
amène à pouvoir écrire: 


Wn+1l<k£<2n (1139) 


Donc à partir de cette égalité 1l vient automatiquement que chaque terme de la somme de gauche ci- 
dessous sera plus grand que chaque terme de la somme de droite suivant: 


maintenant l'idée est de voir que la somme de gauche est donc plus grande ou égale à :=1/2 et cela quel 
que soit n. Ainsi, l'idée c'est que nous ayons trouvé un epsilon pour lequel le critère de Cauchy est mis en 
défaut. Car dans le cas contraire nous aurions dû avoir: 


donc la suite n'est pas convergente. 
OIC.Q.F.D. 


Donc, ce n'est pas parce que des points se rapprochent les uns des autres qu'ils convergent vers un point, 
car ce point n'existe peut-être pas. 


Exemple: 
Le meilleur exemple est certainement le suivant: 


Prenons À = Q et: 
d(p,g) =|p-a| «142 
Soit z un nombre irrationnel et 4; EQ, avec lz 9 | £1/j. 


Les g,,4,... forment une suite de Cauchy. En effet: 
1 1 
Qu = Gal 12 = Gl+1z BIS —+— (1143) 
m A 


et donc |g, -4,]£ € si», 21/28. Nous avons donc trouvé un N qui satisfait à notre définition d'une 


suite de Cauchy. Or cette suite ne converge pas dans Q@ sinon z serait rationnel. 


Remarque: Les mathématiciens utilisent ce fait pour définir l'ensemble des irrationnels en utilisant 
quelques concepts topologique supplémentaires. 
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Nous venons de voir qu'une suite de Cauchy n'est pas forcément une suite convergente dans X. La 
réciproque toutefois est vraie: toute suite convergente est une suite de Cauchy. 


1.5. SUITE DE FIBONACCI 


Si nous calculons une suite de nombres commençant par 0 et 1, de telle sorte que chaque terme soit égal à 
la somme des deux précédents, nous pouvons former la suite: 


0, 1,2,3,5,8, 13,21, 34, 55, 89, 144. 
par conséquent, si nous désignons les différents termes par: 
Lo li, Ua... 
nous avons la loi de formation: 


Uus2 Huy] + le, 


La suite de Fibonacci possède des propriétés nombreuses fortes intéressantes, qui seront développées 
ultérieurement. Il s'agit cependant de la première "suite récurrente" connue (d'où le fait que nous en 
parlions sur ce site). 


L'origine de cette suite viendrait d'un problème de lapins posé à Fibonacci en 1202. Partant d'un couple, 
combien de couples de lapins obtiendrons-nous après un nombre donné de mois sachant que chaque 
couple produit chaque mois un nouveau couple, lequel ne devient productif qu'après deux mois. Nous 
avons alors: 


- Début: Un couple de bébés lapins qui vont grandir 

- Premier mois: Un couple de lapins adultes (qui feront des bébés le mois prochain...) 

- Deuxième mois: Un couple de lapins adultes et un couple de bébés donc 2 couples 

- Troisième mois: Deux couples de lapins adultes et un couple de bébés donc 3 couples 

- Quatrième mois: Trois couples de lapins adultes et deux couples de bébés donc 5 couples. 
etc. 


Prenons un exemple réel, cette fois-ci: le coeur de certaines fleurs, les écailles d'un ananas ou d'une 
pomme de pin forment deux familles de spirales enroulées en sens inverse. Sur une pomme de pin, vous 
compterez 5 spirales dans un sens et 8 dans l'autre, sur l'ananas, 8 et 13, sur la fleur de tournesol 21 et 34. 
Chaque fois, nous obtenons des nombres de Fibonacci ! 


Une illustration de ceci consiste à faire le simple schéma suivant (appelé "spirale de Fibonacci") qui 
reproduit les nombres de Fibonacci sur un plan quadrillé: 
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Figure: 11.1 - Spirale de Fibonacci 


Nous utilisons également ce genre de suite pour montrer l'utilité du principe d'induction présenté dans le 
chapitre de Théorie Des Nombres se trouvant dans la section d'Arithmétique. 


2. SÉRIES 


Le physicien a souvent besoin pour résoudre simplement et formellement des problèmes, d'approximer 
certains "termes" (cf. chapitre de Théorie De La Démonstration) de ses équations. Pour cela, il utilisera 
les propriétés de certaines séries. 


Il existe, une quantité phénoménale de séries et de théories gravitant autour de ces dernières, mais nous 
citerons en particulier les séries de Taylor (utilisées un peu partout), les séries de Fourier (théorie du 
signal et en mécanique ondulatoire) et les séries ou fonctions de Bessel (physique nucléaire) dont nous 
ferons une étude sommaire ici. 


Définition: Soit donnée une suite numérique infinie: 
A, En Es Ays. (1147) 
L'expression: 
té tat..t+ta, +... (11.48) 
est appelée "série numérique". 


Définition: La somme partielle des n premiers termes de la série est appelée "somme partielle" et notée 


5, : 


S. 


x tt t..t+a, (1149) 
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Si la limite notée S suivante existe et est finie: 


S=lims <0 
Sue à (11.50) 


nous l'appelons la "somme de la série" et nous disons que la "série converge" (elle est donc de Cauchy). 
Cependant, si la limite n'existe pas, nous disons que la "série diverge" et n'a pas de somme (pour plus de 
détails voir le sous-chapitre plus loin traitant des critères de convergence). 


Montrons par ailleurs que si 24 est une série numérique convergente alors: 
lim x, =0 5 
À sr) 


Démonstration: 


Nous supposons d'abord que 24 est bien une série convergente et notons par S sa limite. Posons: 


ñ nl 
Sn = DU Sn = DU» (11.52) 
k=0 k=0 
Alors: 
En — Sy = y (11.53) 
Or, si la série est convergente: 
lim s,= lim s,, =$ 
io ñ Sd n-l (11.54) 
Donc: 
lim s,— dim s,,= limfs,-s,,)= mu =$-#=0 155 
mio * no "1 LA - 1) n>+ko * (ER 


OIC.Q.F.D. 


Voyons comment calculer la somme partielle des quelques séries classiques: 
2.1. SÉRIES DE GAUSS 


Les séries arithmétiques de Gauss sont l'expression de la somme de n premiers entiers non nuls élevés à 
une puissance donnée sous une forme condensée. L'application de cette forme condensée de série a une 
utilité pratique en physique (voir les chapitres y relatifs) lorsque l'on souhaite simplifier l'expression de 
certains résultats ainsi que dans les chapitre de Statistiques lors de notre étude des statistiques non 
paramétriques. 


Gauss avait trouvé une méthode séduisante en 1786 pour déterminer cette expression lorsqu'il avait 9 ans 


En à 
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S =1+2+3+.+(0-1)+x 
Si =at(a-1)+(2-2)+..+2+1 (11.56) 


‘ 28, = Ce +1) + C2 + D) + Ce +1) +..(e +1) + (0 + D 


En simplifiant, nous trouvons facilement: 
#(n +] 
MT = (11.57) 


pour # > 0. Indiquons que chaque somme intermédiaire de la série (1, 3, 6, 10, 15, etc.) est appelée 
"nombre triangulaire" puisqu'il est possible de le représenter sous la forme suivante: 


Figure: 11.2 - Nombres triangulaires 1, 3,6, 10 et 15 


Nous pouvons continuer ainsi pour des ordres supérieurs (nous les présentons non en tant qu'exercices 
mais parce que ces relations sont utiles!): 


Calculons maintenant le cas très important que nous retrouverons dans un certain nombre d'autres 
chapitres (Economie, Physique Quantique Ondulatoire, etc.) et qui est la somme des n premiers carrés 
(toujours non nuls). 


Posons pour cela: 


S=1+2+3+.+n 


(11.58) 
S, =1+2+..+# 


nous savons que (binôme de Newton): 
(+1) —k = 3% +3 +1 (11.59) 
nous pouvons donc écrire et ajouter membre à membre les n égalités suivantes: 


2-1 =31+31+1 
Pres +2] 
#-7=33%+33+1 
(11.60) 
(a+ D 2 = 317 +3 x +1 
(a+1) -1=3 (47+2% +, +x)+3 (1+2+.x)+7 
(a+) -1=3 8 +3 S + 


Avec quelques manipulations algébriques élémentaires: 
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38, = (n+ D} -1-3$ = (1 +1$ 1-3 D. 


(11.61) 


= (a+) sn 0 - EDP LL 'a -3x| 
2 2 
d'où: 
S = 7? [2x° +4n+2-2- 30] ED 6% +#) (11.62) 
6 6 
Finalement: 


_ na +1)(2» +1) 


(11.63) 


Terminons avec la somme des n premiers cubes (non nuls). Le principe étant le même que précédemment, 
nous posons: 


S=l#2+..+n 
S = +2 +.+# (1164) 


S=P+2%+.+» 
Nous savons par ailleurs que (binôme de Newton): 
(+1) -&t = 48 +6k?+4k+1 (11.65) 
Nous obtenons en faisant varier k de 1 à n, n relations que nous pouvons ajouter membre à membre: 


2-1 =4F +6 1 +4:1+1 

3-2 -4:#+6:2*+4:2+1 

sine (11.66) 
(a+) -nt =4 2% +6:n +4:2+1 


Nous avons donc: 
(x+D-1=4.58, +65 +4.Si+n (1167) 
Ce qui donne après développement: 


26H00 20 Gr 


(x+D*-1=4.8, +6. 
Et après une première simplification: 


(a+ -1=4.5, +n(n+1)(2n+1)+2#(m+1)+n (11.69) 


et une deuxième: 
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4.83 =-n(n+1)(2n+1)- 2 (2 +1) 2 + (041) —1 


(22 42) (224 1)) — (22 2422) — + +405 + 602 + an +1) 1 

(11.70) 
=-(2# + n° +2xr° +») +n4 +47 + Ar? +n 
= n° +27 +72 = n° Ce +22 +1) = (a +1) 


Le résultat final est donc: 


ou écrit autrement: 


Évidemment, nous pouvons continuer ainsi longtemps mais à partir d'une certaine valeur de l'élévation de 
la puissance les choses se compliquent un petit peu (de plus, la méthode est un peu longue). Ainsi, un des 
membres de la famille des Bernoulli (c'était une famille de mathématiciens assez doués...) a montré une 
relation générale fonctionnant pour n'importe quelle puissance en définissant ce que nous appelons le 
"polynôme de Bernoulli". 


Terminons avec un dernier cas particulier dont nous aurons besoin lors de notre étude des séries de 
Fourier. Nous posons: 


SO = +0 ++ (173) 


Nous voulons exprimer cette expression sous forme de fraction rationnelle. Pour ce faire, nous multiplions 
tout par ;2. Nous avons donc les deux expressions: 


Sn = X+ HN D 7 dE 
(11.74) 
AS, = 2 +2 +. + xl 
Nous soustrayons la première de la deuxième: 
ES D Er er (11.75) 
Finalement: 
2n+H 
X — 
5, = —— (11.76) 
x° — 1 
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2.1.1. NOMBRES ET POLYNÔMES DE BERNOULLI 


Comme nous venons de le voir plus haut il est possible d'exprimer la somme des n premiers entiers non 
nuls élevés à une puissance donnée selon (les quatre premiers ont été démontrés précédemment) les 
relations suivantes où nous avons posé # = #+ 1 avec n' le nombre de termes dont nous voulons la somme 
0 non compris (d'où le signe négatif que nous n'avions pas plus haut): 


So = }# 
Saint LD 
2 2 2 
Sn, Per) 
3 2 6 2 
sl» 1,641, #@- 1 (11.77) 
4" 2” 4 4 
_ — 2 _ — 
ses intel 1,220 DOn- DC -3n- 7) 
5 2 3 30 30 
2 12 
jp ie 2n — T2 —1) 
6 2 12 12 12 


Jacob Bernoulli remarqua ensuite que les polynômes #, avaient la forme: 


1 1 = : 
S,=——n sn +Èn l+0.x? É h. (11.78) 
B+ 


Dans cette expression, les nombres {1,—-1/2,1/12,0,...) semblent ne pas dépendre de p. Plus 
généralement, après tâtonnement on remarque que le polynôme peut être écrit sous la forme: 


a 
k 2! 1 
s,=} l'{ = | ii 
io #l(p+1 k) . 
(11.79) 
B n7* B 
sr re x? + 22 par LES pp nr 2+..+ 


Ol p+1 1! 2! 31 Ti 


Ce qui donne par identification les "nombres de Bernoulli": 
Bo = 1,8, =—1/2,8, =1/6,83 =0,.. (11.80) 


Par la suite, les mathématiciens dans leurs recherches sont tombés au hasard sur le fait que les nombres de 
Bernoulli pouvaient être exprimés par la série: 


Œz)= — 


co 
ar avec |z|<27 (1181) 
k=0 


En d'autres termes, la fonction génératrice des nombres de Bernoulli serait G(z). Si nous développons les 
premiers termes de cette série: 
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r _4\ T1 2 3 LL si 6 ë 
nd Sn = 
z 21" 31 4! 2 


— - : 
12 720 30240 1209600 
Démonstration: 


Nous avons vu dans notre étude des nombres complexes (cf chapitre sur les Nombres) que 


2 
Z Z 

et =l+—+— +... (11.83) 
1! 21 


Dès lors: 


—?l 
z° z 
Z+—+—+.. z À “1 
Gz)=|—21 3 | 142424.) «189 
Z 21 31 


Posons maintenant: 


G{(z) = dy + Z +437 +. (11.85) 


Nous avons alors: 


Z z° 2 
A “(ao +az+a2 +..)=1 (11.86) 


Nous voyons (en distribuant) que: 


2 
ee. 24.) % à ,&),2 
LE +. (ao +az+az +...) at(a+® a+). Ps CULSD 


par suite pour que tout cela soit égal à l'unité 1l faut que: 


dy = 
a 
& 2-0 
2l 
(11.88) 
& à 
da 24 + 
21 3 
De la deuxième équation nous tirons: 


De la troisième équation nous tirons: 
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1 1 
da = ee (11.90) 


etc. 
En continuant ainsi nous montrons que: 


a ae (11.91) 
3 4 720 ns 


Il est évident que cette méthode ne nous permet de calculer à la main que les premiers termes de cette 


série. 
Ainsi, en se basant sur: 


co & 
Z Z 
C{z) = = 22 8 — (11.92) 
ge —1 & 


nous trouvons que les premiers nombres de Bernoulli sont les suivants: 


Hi) 0 | 
BEEN 
HT 0 | 


Tableau: 11.1 - Nombres de Bernoulli 


Le lecteur aura remarqué que 3; = 0 lorsque n est impair et différent de 1. 


OIC.Q.F.D. 
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Nous voyons bien par ailleurs, que les valeurs des nombres de Bernoulli ne peuvent pas être décrites 
simplement. En fait, ce sont essentiellement des valeurs de la fonction & de Riemann (voir plus bas) pour 
des valeurs entières négatives de la variable, et ces nombres sont associés à des propriétés théoriques 
profondes qui dépassent le cadre d'étude de ce site. Par ailleurs, les nombres de Bernoulli apparaissent 
également dans le développement en série de Taylor des fonctions tangentes circulaire et hyperbolique, 
dans la formule d'Euler-Maclaurin (voir plus bas). 


Avec une petite modification, il est possible de définir les "polynômes de Bernoulli" 8, (x) par: 


Ze 


GG, D == YBR (195) 


ge — k—0 &l 


avec donc: 
G(z.0)=G{(z) (11.94) 
Par ailleurs, il est aisé de remarquer que: 


5x æ Jp & 
OCZ, x) . 287 ze D = (7) Z_ 
êx g° —] k—0 dx &l 


(11.95) 


et donc il est facile d'en déduire: 


© dB.(x À © z* 
LES Bi — (1196 
2 x kr 2 (190 


Démonstration: 


D'un côté nous avons: 


co 7* co Pas! co 7% 
zG(z, x) =} B:(x) — = > (x) — =} 23 (x) (41197) 
k=0 k! k=0 kl k=1 (&-1)! 
et d'un autre nous avons: 
co k 
zG(z, x) = ES (11.98) 
i—0 dx | 
Donc: 
© dB(Dz € z* 
2: — = > Br (x) (11.99) 
i0 dx &l pe (&-1) 


OIC.Q.F.D. 


Et par identification des coefficients nous en déduisons: 
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0%); (11.100) 
dx 
et pour &>1: 
SL (11.101) 
dx 


Il est alors aisé de déduire que les Æ, (x) sont des polynômes de degré k: 
B (x)=1 


1 
PAS 


B; (x) = morte 


BD = -Èr+5x (11.102) 


1 
Btn=xt-20 +x2- — 
a (x) 0 
S 5 1 
BD = 2 = 2x + x = x 
5 (2x) 5 e 


Voici un tracé de ces polynômes: 


B{x) B.x)  B,() 


Figure: 11.3 - Quelques polynômes de Bernoulli 


Ce qui est remarquable c'est qu'à l'aide des polynômes de Bernoulli, nous voyons qu'il est possible d'écrire 
les $, sous la forme suivante: 


n-l 1 


S,= DE = — {8,4 (x) 8 
p 2 mn ph (1) Lu) (11.103) 
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Certains écrivent cette relation encore autrement. Effectivement, de la relation précédente, nous pouvons 
écrire: 


n-l 


(p+DD'E? =B,u(r)-28,4(0) (11.104) 
k=0 


Et en utilisant: 


dB) _ pp (x) (11.105) 
dx 
Il vient: 

dB, (x) 

pH 

— 7, _"(P+1)-8, 0) 

lp: 
né arr »4 (2) (11.106) 


& & 
1 | 1 CS 
= B, (mdr = . Ba (dr = Ba GO = (Ba (0 — 8,4 0] 


Donc nous venons de démontrer: 


nl 


& 
Ze =[28,@a& «ion 
&=0 0 


Cependant, nous pouvons maintenant nous demander ce qu'il advient de la somme partielle de suites 
arithmétiques et géométriques telles que présentées au début de ce chapitre. 


2.2. SÉRIES ARITHMÉTIQUES 


Nous avons démontré plus haut que la somme partielle de la série de Gauss (analogue à la somme des 
termes d'une suite arithmétique de raison r=1) s'écrivait donc: 


_n(n+1) 


i (11.108) 


si nous notons non pas n la valeur du n-ème terme mais 4, , le développement que nous avions fait pour la 
série de Gauss nous amène alors à: 


Au, +1 
= Gin +1) (11.109) 
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ce qui nous donne la somme partielle des n-termes d'une suite arithmétique de raison r quelconque (ou 
plus simplement: la somme partielle de la série arithmétique de raison r). 


Remarque: Le lecteur aura observé que la raison r n'apparaît pas dans la relation. Effectivement, en 
reprenant (toujours) le même développement fait que pour la série de Gauss, le terme r se simplifie. 


2.3. SÉRIES GÉOMÉTRIQUES 


De même, avec un somme géométrique où nous avons pour rappel: 
L x 
ü, =%,4" (11111) 


nous avons donc: 


S 


Li] 


gs, =üytüat..tu, tu, (11.112) 


= tu t..+u,, tu, 


D des = 0 Fa = FA, 1 FU 4-0, 


La dernière relation s'écrit (après simplification): 


Se don el SM = (11.113) 
et si 4 “1, nous avons: 
Un 4 
Se (1114) 
1-g 


ce qui peut s'écrire en factorisant 4, : 


(11.115) 


Si q est positif et inférieur à 1, lorsque n tend vers l'infini nous avons le résultat qui sera très utilisé dans le 
chapitre d'Economie: 


= ü 
n—>+00 STE (11.116) 


Exemple: 
Soit la suite de raison qg—2 suivante: 
12+1:21+1.22+1023+..+102 =1+0+4+8+.+0% (11117) 


pour calculer la somme des quatre premiers termes {1,2,4,8}, nous prenons la puissance de 2 équivalent 


de »# = 3 (le zéro n'étant pas pris en compte). Nous obtenons alors bien $, = 15. 
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2.3.1. FONCTION ZÊTA ET IDENTITÉ D'EULER 


7 MA 


L'allemand Riemann a baptisé "zêta" une fonction déjà étudiée avant lui, mais qu'il examine lorsque la 
valeur est un nombre complexe (cf chapitre sur les Nombres). Cette fonction se présente comme une série 
de puissances inverses de nombres entiers. C'est la série: 


l:1 : | 
strate (11.118) 


Remarque: Il est traditionnel de noter s la variable dont dépend cette série. 


Cette série a une propriété intéressante mais si l'on reste dans le cadre des puissances entières positives et 
non nulles: 


1 
= #+1 xl 
ne =: ep F (11.119) 
X _X x (1-4) 1 
zx 
quand # — + nous avons alors: 
m1 - 1,1 1 1 
Dh tt = — 
sit À *# ” 3-1 (1120) 
x 


Si nous faisons x = 2°, nous obtenons la somme des puissances inverses de 2 et de même avec x = 3° tel 
que: 


1 1 1 
di +++ ++ = ——— 
4 8° a 1-2 
n5 
11.121 
1 1 1 1 
— + — + + et +, = —— 
3° q° 97: 395 1 


Si nous faisons le produit de ces deux expressions, nous obtenons la somme des puissances de toutes les 
fractions dont le dénominateur est un nombre produit de 2 et de 3: 


1 1 1 
+ + —— +. 


| _ 5 5 5 NS _ 
jh at 002 4 37 6 CE (11.122) 


Si nous prenons tous les nombres premiers à gauche, nous obtiendrons à droite tous les nombres entiers, 
puisque tout entier est produit de nombres premiers selon le théorème fondamental de l'arithmétique (cf. 
chapitre de Théorie Des Nombres), et c'est l'identité fondamentale d'Euler: ce que nous appelons 
maintenant la "fonction zêta de Riemann" est à la fois un produit fini et la somme des puissances inverses 
de tous les entiers: 
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l l Le LE. 1. 1 l 


Re LES = + — + ,,,+ 


l, 1 1 1 25 7% 4 5 6 (235) (11.123) 


dl 
ct) om P ‘) 11.124) 
n=i # p 1-1 (11.12 


où p sont les nombres premiers. 


Nous proposons maintenant au lecteur de sauter ce qui va suivre concernant la fonction zêta de Riemann 
et d'y revenir une fois les séries de Fourier présentées plus bas dans ce chapitre maîtrisées et comprises. 


Nous supposons pour ce qui va suivre que les séries de Fourier sont maintenant connues et que l'égalité de 
Parseval a été étudiée (puisqu'elle est aussi démontrée plus bas). Nous allons chercher à déterminer la 
fonction zêta de Riemann pour deux valeurs (s valant respectivement 2 et 4) qui nous seront utiles lors de 
la valorisation d'intégrales dans certains chapitres de la section de Mécanique. 


Pour déterminer la valeur de £ (2) , nous allons exprimer la fonction: 
f@)=x Vrel-2x] (1125) 


sous forme de série de Fourier (ne pas oublier qu'il y a deux manières traditionnelles de définir une série 
de Fourier et que nous avons fait le choix des physiciens/ingénieurs!!!): 


œ 
a | 
Fr)= T+ri an cos(2x) +, sin(xx)\ (11.126) 


n=l 


Rappelons que comme nous l'avons démontré lors de notre étude des séries de Fourier, les coefficients de 
Fourier &p ,4,,2, s'obtiennent en résolvant: 


L J(ncos(nxidx Bb, = 


; f{x)sin(@ex)dx (11.127) 


et en utilisant l'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral). Nous avons alors: 
8 par p ! £ 
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TI2 l 
LE | xx = = ( Jane E[rf, )ec 


-T/2 Fe 


TA x _. 
äy . Î JG) cos(ndr= À Î xcos(ax)dx = [eme : Î sin(#x) à 
Fe # 


l 2] 
= — ; = 0 
FT 
. 7 (11.128) 
1. 2 
b, = — Î f(x) nee — | xsinx)dr= = _ i xsin(ax)dx 
Le” —# Le 
ES LÉ É . té 
. + _ACOs(#x)| cos(#x) _. l L ee) 1 sin(2x) 
X # RSR, 7 ñ - # Le 
. 1 cest | = py# 2 
X ñ# Le ñ# 
Il vient alors: 
_ 4 : 5 . _ nH 2 
TS r= 245 (a, cos(ax)+ à, sin(ax)1= > b, sin(xx) = > (—1)  —sin(xx) (11.129) 
n=l ni 4 #8 


Mais le théorème de Parseval démontré lors de notre étude des séries de Fourier nous donne aussi (se 
rappeler que suivant le choix de la définition de la série de Fourier et des coefficients associés, le 


théorème de Parseval s'exprime un peu différemment!): 


ai 
1@=x=Ÿ € ee 415 (22 
#Æl e ”i 


2 


Il vient alors immédiatement: 


La] 2 Lea] 
J(x)=x= S Dos = = DE l _S fn J = = 


si 7 n=i n=1 


Mais nous avons aussi vu lors de notre démonstration du théorème de Parseval que: 


T2 2 jo 
= | HOHOLE dé vis +8] (11132) 
_T/2 4 n=l 


Il vient alors dans notre cas: 


Le 


#2 


GE 


M 
. Î x2ax = 2 (11.133) 
JT ‘ 


= 
Il 
_ 


Donc: 


+BÎ (11.130) 
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37 œ 5. 3 co œ 
LE opt SIT En | ST LT SL Gus 
27 3 1,2 ‘0x| 3 3 a a 2 
dl #5 n=1 # n=l # Æ n=1 # 
Donc: 
QE d 
CD=2-7=— (11.135) 
n=l # 


Pour déterminer la valeur de £ (4), nous allons procéder de même, mais avec la fonction: 


f(H=x Vre [27] (1136) 
sous forme de série de Fourier: 
1_D 
FÉl=X = D + 2 ,lancos(#x) +8, sin(xx)| (11.137) 
n=l 


Pour cela, nous allons calculer les coefficients de Fourier conformément au choix d'écriture fait lors de 
leur étude et en utilisant l'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral): 


T/2 7 


Î fax = . Î Ae= LE 


_T/2 37 


Te 1 2 sin(xx) [7 : 
FT # 


Î JG cosmdr= À Î x? cos(nx)dx = 
-T/2 #7 


LÉ 7 
2 . 2/0 


=—— | xsin(xx)dx = - 
IA # 


#7 #7 


LÉ 
: — cos(2x) à 


# 


7 TA -# 


__ ee <a] + _— 
ITA 7 # # 


_2 TA 2 7 1 7 
_ Î f(x) sin(ax)dx = — Î x? sin(#x)dx = — Î x sin(nx)dx 
TR EL” 7. 


= (D À (11.138) 


ITR LC] 


LÉ té 
: 2 - cos(#x) 
7 


=r A 


—# 


7 cos(2x) Se 
+ | 2x x |= —| | xcos(xx)dx 
x | - 


— 


h . a|-- 2: : . a|-- 2 ef 


À 
7 ITA 


ES 
, " 3 cos(#x) 
X # 


7 = 


| # 
: 2 . sin(2x) 
# 


TA 


— 7 #7 


Il vient alors: 


œ œ 
4 
fs PT Dan cos(nx) = — +5 Æ e —7 C05(2x) (11.139) 
=] n=i # 


Page: 830/4839 


[v3.0 - 2013] 


Mais le théorème de Parseval démontré lors de notre étude des séries de Fourier (voir plus bas) nous 
donne aussi: 


à À 14 aÿ 12, 2,,2 | 
f=x cr 7 cos(ux) = + 2 lan +b, | (11.140) 
n=1l # n=l 


Il vient alors immédiatement: 


+86(4) (11.141) 


o[# 


ns pal 
rires x2 = +5 (-1# + cos) = PE — 
n=1 Fe 3 n=1 7 


Mais nous avons aussi vu lors de notre démonstration du théorème de Parseval que: 
T2 


2 co 
— | JOfoa= +15 (a FR] (11.142) 


712 4 2% 


Il vient alors dans notre cas: 


1 ? 7 
— À xtdx= +864) (11143) 
27 : 3 


— 
Donc: 
EU É 
1 x 7° 17 (-x) 7 TD 7 
| = —+8£(4) = —| —- = — +864) = — =— +52 (4 
| 9 a) LÉ 5 9 A 57 9 a) 
LA (11.144) 
4 4 4 4 4 
TX 97 57 4x 
DB ——-— =) = — — —— = 8 (4) = —— =8£(4 
5 9 £(4) 25 45 £(4) 25 £(4) 
Donc: 
® À 
AOPDIE EEE (11.145) 
n=1 # 0 


2.4. SÉRIES DE TAYLOR ET DE MACLAURIN 


Les séries de Taylor et de Maclaurin constituent un outil pratique très puissant pour simplifier des 
modèles théoriques ou des calculs informatiques (modélisation de fluides ou champs dans l'espace). Elles 
sont utilisées énormément dans tous les domaines de la physique mais on les retrouve aussi dans 
l'industrie notamment en ingénierie (plans d'expérience, méthodes numériques, gestion de la qualité), 
statistiques (approximations d'intégrales), finance (processus stochastiques), analyse complexe... Nous 
conseillons donc vivement au lecteur de bien lire les développements qui vont suivre. 


Soit un polynôme (à une variable): 


# 
BP (x) =S ax (11.146) 
ki 
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Nous avons trivialement pour ce dernier: 


P(0) = ay (11.147) 


Soit maintenant la dérivée du polynôme P(x): 
P(D =D tax (11.148) 
ps 
donc: 
P0)=1l'æ@ (11.149) 
et ainsi de suite avec P"(x),P'"(x)..…. tel que: 
Pr = DE Dax"? = P"(0) =1 2" 
K=2 


P')= EG -DE-2)a,x"* > PO) =12:3a, 
3 (11.150) 


70 EDGE — 2). (E (2 Dax" = PO) = nf a, 
ZX 


Il s'ensuit que: 


3 Le] 
-P0a - 0 1 d?P(0) _1d*P(0) 1 d"P(0) 


+, Un —— (1.151) 
1l 4 V2 01 42 2 a 2e PUR ge 


Donc finalement notre polynôme peut s'écrire: 


LA 
E(x = > — x*| (11.152) 


relation que nous appelons "série de Maclaurin limitée" ou tout simplement "série de Maclaurin" d'ordre k 
+]: 


En appliquant maintenant le même raisonnement mais en centrant le polynôme sur la valeur x = x,, nous 
avons: 


P(x) = > a 2) (11.153) 
K=0 


et ainsi le développement précédent devient: 


L 12P@) 
dx k 


(x-%})*| (1.154) 


(2) = 
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qui n'est d'autre que l'expression générale d'un polynôme exprimé sous une forme dite de "série de Taylor 
limitée" d'ordre k+1. Cette fonction peut être assimilée à un polynôme tant que n est fini. Mais si nest 
infini, comme nous le verrons plus loin, cette série converge vers la fonction dont nous cherchons la 
représentation sous forme de somme de termes. 


Ainsi, certaines fonctions f{x) pouvant être approchées par un polynôme P(x) (une somme de puissances 
autrement dit.) centré sur la valeur x, peuvent être exprimées sous la forme: 


d* (%o) dd f(x) . 
J(x) = > (x 2) = > : (x-2%)* (11155) 


Relation souvent designée sous le nom de "théorème de Taylor". 


Par contre cette dernière relation n'est pas juste pour toutes les fonctions ne pouvant pas s'exprimer sous 
forme de polynômes. Dès lors nous disons que la série n'est pas convergente pour ces dernières. Nous en 
verrons un exemple plus bas. 


La dernière relation s'écrit aussi de manière plus conventionnelle..…: 


n k 
f@= PR r 


(x- a 0 (11.156) 


Revenons brièvement à l'approximation de f{x) proche et centrée en x,: 


dè 
J@)= 2. (x — 2x0) (11.157) 


Certaines personnes n'aiment pas utiliser cette formulation car on risque d'oublier que l'approximation 
pour quelques termes n'est bonne que tant que l'on ne s'éloigne pas trop de x, avec x. Raison pour laquelle 
il arrive souvent que nous posions: 


x= ZX +Ah=Zxp+h4 (11158) 


avec x, fixé et h variable mais petit (!) et ainsi il vient alors une forme d'écriture courante des séries de 
Taylor: 


d* n Lk Jk 
LD pe BP ES 


J Go +4) = >. 


(xo) (11.159) 


Voyons un exemple d'application avec une série de Maclaurin (avec x, étant nul) de la fonction sin(x) et 
Maple 4.00b: 
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>pfn]() = sum(D@@N(#(a)il*(x-a) i,0.n); 

>p11:= taylor(sin(x),x=0, 12); 

>p11:= convert(pll,polynom); 

>with(plots): 

>tays:= plots[display](sinplot): 

for 1 from 1 by 2 to 11 do 

tpl:= convert(taylor(sin(x), x=0,1),polynom): 

tays:= tays,plots[display]([sinplot,plot(tpl,x=-P1..2*Pi,y=-2..2, 
color-black,title-convert(tpl,string))|) od: 
>plots[display]([tays],view=[-P1..2*P1,-2..21); 


-2 


Figure: 11.4 - Approximation de la fonction sinus par un développement de Maclaurin sur Maple 4.00b 


Nous voyons donc bien dans cet exemple que la série de Maclaurin ne permet que d'approcher une 
fonction en un point avec un nombre limités de points. Mais plus nous prenons de termes (mettre 100 
termes dans l'exemple précédent) plus la validité est grande sur tout le domaine de définition de la 
fonction. Au fait il est possible de démontrer que la fonction sin(x) est exactement exprimable en série de 
Maclaurin lorsque le nombre de termes est infini. Nous disons alors que son "reste" est nul. 


Par contre ceci n'est pas vrai pour toutes les fonctions. Par exemple avec la fonction: 


F @)= 


(11.160) 
= 


>p[n](@) = sum(D@@N(#(a)il*(x-a) i,0.n); 

>p10:= taylor(1/(1-x"2),x=0,10); 

>p10:= convert(p10,polynom); 

>with(plots): 

>tays:= plots[display](xplot): 

for 1 from 1 by 2 to 10 do 

tpl:= convert(taylor(1/(1-x°2), x=0,1),polynom): 

tays:= tays,plots[display]([xplot,plot(tpl,x=-2..2,y=-2..2, 
color-black,title-convert(tpl,string))]|) od: 
>plots[display]([tays],view=[-2..2,-2..21); 
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-2 


Figure: 11.5 - Contre-exemple d'approche par Maclaurin sur Maple 4.00b 


Nous voyons bien ci-dessus que peu importe le nombre de termes que nous prenons, la série de Maclaurin 
converge seulement dans un domaine de définition compris entre ]-1,1[. Cette intervalle est appelé le 
"rayon de convergence" et sa détermination (celle des singularités) est un point crucial dans de nombreux 
domaines de l'ingénierie, de la physique et de l'analyse. Nous y reviendrons plus en détails dans le 
chapitre d'Analyse Complexe. 


Par contre nous pouvons décaler la série de Maclaurin de la fonction précédente afin d'approcher la 
fonction avec une série de Taylor en un autre point non singulier comme par exemple en x, valant 2: 


>p[n](x) = sum((D@@N(f(a)il*(x-a) 1,1-0..n); 

>p10:= taylor(1/(1-x"2),x=2,10); 

>p10:= convert(p10,polynom); 

>with(plots): 

>tays:= plots[display](xplot): 

for i from 1 by 2 to 10 do 

tpl:= convert(taylor(1/(1-x"2), x=2,1),polynom): 

tays:= tays,plots[display]([xplot,plot(tpl,x=0..5,y=-2..2, 
color-black,titleconvert(tpl,string))|) od: 
>plots[display]([tays],view=[-0..5,-2..21); 
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-2. 0 
Figure: 11.6 - Décalage possible de l'approche par Maclaurin avec Maple 4.00b 
Nous étudierons une généralisation au plan complexe des séries de Taylor précédentes dans le chapitre 


d'Analyse Complexe pour obtenir un résultat très puissant permettant aux physiciens de calculer des 
intégrales curvilignes compliquées. 


2.4.1. DÉVELOPPEMENTS DE MACLAURIN USUELS 


Nous allons démontrer ici les développements de Maclaurin les plus fréquents (une petite dizaine) 
jusqu'au deuxième ordre que nous puissions rencontrer en physique théorique et mathématique (en fait, 
nous avons développés uniquement ceux qui sont utilisés dans l'ensemble du site). La liste est pour 
l'instant non exhaustive mais les démonstrations étant généralisées, elles peuvent s'appliquer à un grand 
nombre d'autres cas (que nous appliquerons/rencontrerons tout au long de ce site). 


Remarque: Les développements de Taylor (donc ailleurs qu'en zéro) étant très rare (il y en a un ou 
deux sur l'ensemble du site mais ils sont détaillés dans le chapitre respectif), nous les omettrons. 


1. Développement de Taylor-Maclaurin de f(x) = 2” : 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 
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Û _ de” x 
fM= Te 


DCE EE 2 = & (11.161) 
3x 
eg 
| du | =#" 
dx 


Il vient alors que: 


3 k 1 2 3 
Aaze = 210 - CROP PRE AOP PARC ,14P0) 


x x _— 
me dé 0 ai ll di 2! ar? 31 dé 
x 2 3 x 
14 1H xl la : +14 d 3 
O1 lx=0 1! 4 2! 4x? 3l de 
x=0 x=Û x=0 
= 19,0 +—e* Le x 1 m4 dnr1902 
ûl 11 = 21 = 31 = 1l 21 | 
1 2 3 
2 À RE: 
=Îl+—x+—x +— 1+x+—+ 
1l 2! 31 21 3 


(11.162) 


2. Développement de Taylor-Maclaurin de (x) = sin(x) : 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 


J'a= 


'Ha(e) a = cos(x) 


Fate, TT = cos) =sin(x) (11163) 
ä x x 


JR) = TR SNS ES cos(x)} 
Il vient alors que: 
AC & sin(x) 

3 k 0 2 3 
29 1 d'P(0) += lé at il 1 4! P(0) d PC) 1 +14 si 1 +19 P(0) 
0%! dr 0 dx 1 dm 2 & 31 de 

2 3 : 
. Lsin(o _ : a PL — Sri 1 4 a” sin(x) n ; 14 —_ : 
Ql 1 ax | 2l dé. 31 4x LH 
1 l 1 l = - 1 
TT sin(0)x° + 1760502) 0 # sa@l 0 x 205%), * Ni 3 
n 
= X—— 
31 


(11.164) 
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3. Développement de Taylor-Maclaurin de f(x) = cos(x): 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 


F9 = LE = sin) 
A 
2 
F"@)= Fe - LAS = Lsin(x) =—Cos(x) (11.165) 
X 
3 = ll 
Fr) PR RL 


À 3 . dx 
Il vient alors que: 


J3 (x) = cos(x) 
3, 1 d*P(0) À _ 1 4° P(0) D .1dPO 3, 1 d?P() 2 + 1220 3 


= St 
ot! dé 0 a Mr di 21 dx? | 4 
2 à 
= Lcos(x), L Fat ee, Ji, 14 _ rte cos(x) “ 
Ql x | 21 4x Li 31 de Le 
1 1 1 2. I = lo 1.3 
= cos(0)x 7 20) r=0 # 51,20 +3 sin), 0 x ni 3° 
2 
E— 
2! 


(11.166) 
4. Développement de Taylor-Maclaurin de f(x) = tan(x) : 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 


F'= no - ù = 1+tan? (x) 
dx cos? (x) 
ps _ d'tan(x) _ d dtanfx)_ d | 1 ]- > sin( 
ne dé “dx dx dx | cos? (x) cos” (x) 
: 4 E afsncs r (11.167) 
ms _ à tan(x) | cos” (x)) cos” (x 
F7 = de + dx n dx 
; .… 2 
| —— ons ES | _ (x) : —— 


Il vient alors que: 
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J3(2) & tan(x) 
3 k ( 1 2 3 
ee APR ACT , 14 PO) 1,14 aUr, +14 0 
mo! dx O1 dx il dd 2! dx 31 dx 
2 3 
(+800) sidi) 3, 1d'tm) 2 
ûl 1l 4x :=0 21 gx 31 4e ee 
; . 2 
ont 41] pelom@ 2,1 2 LG) 
0] 1! cos (x) Per 21 cos” (x) me 31Ù cos“ (x) cos (x) L=0 
3 
PLACE TE 
11 31 3 


(11.168) 
5. Développement de Taylor-Maclaurin de f(x) = arctan(x) : 
D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 


__d'arctan(x) _ ] 


F'@) 


dx 1+x2 
2 
$"@ = d _” - da) 2 1 )-+ x 
x * , X\I+Hx (1+x2| 
x 1 (11.169) 
ä Fe - 3 ä Tuer 
: d° arctan(x) re) PT y 
LD = RTE = = — © >#-2 
dx dx dx 
— _ : — 2 
= + DR EL 
(1+x° | Ü1+x2l (1+x2| (1+x2] 


Il vient alors que: 
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Ja (2) & arctan(x) 


: 2 0 _1 dr0 nid PO, 0 2,14 PO : 
2 3 
= — arctan(x)| _h x Nr … 14 et a se arctan(x) E 
U Of bo 2 dé |, 3 æ& |, 
_- _ 2 
=— arctan(0)x 4 3 xl - — Ê+ , - 8x | E 
| IH+X leo 21432) [li+zxil  (+xi) 
x=0 x=0 
1 2 x 
=—X- — = X-—— 
Il 31 3 
(11.170) 
6. Développement de Taylor-Maclaurin de f(x) = ue - 
+ 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral 
l'expression générale de la dérivée d'un quotient de deux fonctions. Il vient alors: 


= 
(a 

J'o= == 
dx 
At 

= TE - 
dx 


Il vient alors que: 


1 
il+xi 
m3) 
à 1+x __dà 1 : 
dx dx  dxlijaz |] (ax 1.171) 
à _ 
i1+xi 6 
dx il+xi 
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1 
Xj= —— 
J3(x) - 
3, 1 4“ P(0) 1 dÜP(0) 0 14 P(0) 1. 1 d?P(0) 1 d°P(0) 
D + + ra 
0%! dx O1 dx il dd 2! dx 31 dr 
11 1) (5) 2) 
x | Dal Utx)] y,1 U+x) 2,1 Utx]| 3 
OUt+x/L on 1 dx 2 dx CRE 
x=0 x=Ù x=0 
- li -1 l _ 4 2 - ?— 6 - Æ 
“(1+xi r=0 il+xi L=0 i1+xi L=0 
1.7 22 CCS 
11 21 31 
(11.172) 


Il s'ensuite immédiatement une autre série de Taylor que nous retrouverons aussi un certain nombre de 
fois: 
l ä 1 


à ER 2 
| ZX! 


7. Développement de Taylor-Maclaurin de f(x) = ÿ1+ x : 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral 
l'expression générale de la dérivée d'un quotient de deux fonctions. Il vient alors: 


; d-f+x 1 1 
FA = == 
dx 2 1+x 
f"@ PSS 1 ]--{ 1 
x2 dx dx dx \2 +x 4 (1+ x)/2 
(11.174) 
1 1 1 
74 372 d 72 
1" d +x #+x) 1 (it 3 1 
dé dx _ 4 dx | Biero 2 


Il vient alors que: 
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BD = NVI+x 
k (n] Î 2 3 
514 or OP PRO PRE RUE PRE 0) PO) 3 
cout! & 0! dx 1l add 21! dx 31 dr 
1 o 1ddi+x ,1d 2,f+x . 14 /+xl 3 
= — +7] X +— F4 x 
ol x=0 11 xl TRUE dd 
x=0 x=0 
n. (1.1 2, 13 1 3 
= —ÿ1+ + ——— a EE —— — 
Ti r| 0 * 12 Ar lo 21444, 87 | 318 442) . 
X=| Ye 
-1,41,,11%,193 1. 1 3, lb 3 
O1 112 214 318 BU 24 “dé 


(11.175) 


Il s'ensuite immédiatement une autre série de Taylor que nous retrouverons aussi un certain nombre de 
fois: 


Jfa(n = 2 Tr e2g fist 7, ee DE PJ (11.176) 


2 2-4 2.4.6 


= 
8. Développement de Taylor-Maclaurin de f(x) =In(1+ x) : 


D'abord rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que la 
dérivée de la fonction logarithme. Il vient alors (nous retrouvons très vite les termes d'une des séries 
développée un peu plus haut): 


din(l+zx) _ 1 
FA —_—_———— ——— 
Fe dx  1+x 
f"@ = d? SE) d din(l+ x) _ a 1 ]-- 1 
di dx dx dx\itx) (1+ x) 
(11.177) 
5 d|-— 2 d — 
1" =4 In(+x) il+xi - (1+xi 2 
de dx 4 dx (1+ x) 


Il vient alors que: 
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AD =In(+» 


3 k ] 1 2 3 
1 4” P(0 1 4 P(0 1 d'P(0 1 4° P(0 1 4” P(0 
_ à 14*P(O) x _ 140P(0) 0, 14'P(0) 1, 1 d' PC) 2, 14°PO) 


= X = Æ ZX X — 
0! dx 0! ax 1 dd 2! dx? 31 de 


3 
x 


2 3 
L Lua+xl . a 4 ldln(+ x) « 14 In(1+ x) Ê 14 In(1+ x) _ 
QI 7 1 :=0 21 dx? 31 de 
7 x=0 x=0 
= —In(i+ x)| x TEE x _— 47 ; x 
0 Ul+zxko  2l{1+x} 3lj+x8 : 
X= 
= EE  - oi 
1! 21 31 3 
(11.178) 


9. Considérons maintenant le cas important pour le modèle de Langevin du paramagnétisme qu'est le 
développement de Taylor approximé de la fonction cotangente hyperbolique (cf. chapitre de 
Trigonométrie), définie pour rappel par la relation: 

e*+e ? 


e —e 


coth({x) = 


(11.179) 


Pour cela, nous allons utiliser la notation de Landau avec des expressions du type ©(x") en se rappelant 
que nous venons de démonter un peu plus haut que: 


2 
= 1+x+ +0) (11.180) 


lorsque x — 0. 
Pour la cotangente hyperbolique nous avons alors: 


2 2 


4e 1+x+2 +0 )+1- x +7 +0(F) 
EE 
ge —g * +0, À 4 Ê » 4 
1+xt+—+—+0(x")-1+x-—+—+0(x") 
2 3l - 3l (11.181) 
_ 2+x/+0O(7) _2+x7+0(x°) 1 | 
NC POSE RE ETS 
2x + + Or) 14 +0) 
———+— 
A 


À présent il faut se rappeler comme nous venons de le démontrer un peu plus haut que: 


1 
—=1-x+x +. (11.182) 
1+x 
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pour |x|<1. Donc: 


2 
As + -iÿ7 064 


2 6 2)? 
x (11.183) 
1H +6) | 
6 
et pour finir en remplaçant ceci dans l'expression précédente nous trouvons: 


x x Z 3 2 
HG rt. tr i00)) #4 
e* =g ? 2x 6 


(11.184) 


x? 
be = +O(x 22 +O(x) 


2x 


2.4.2. SÉRIES DE TAYLOR D'UNE FONCTION A 2 VARIABLES 
Nous allons voir ici comment approcher une fonction f{x, y) de deux variables réelles par une somme de 
puissances (série de Taylor). Ce type d'approximation est très utilisé dans de nombreux domaines de 


l'ingénierie (voir chapitre de Génie Industriel et de Méthodes Numériques). 


Nous cherchons donc une approximation de f{x, y) au point f (xn +, Ya + 4). Pour cela, posons (rien ne 
nous interdit a priori de le faire) que: 


x=x6)=2%0+ht et y=yC)=70+kf (11.185) 
Nous avons alors: 
F@=f(2@,»7@) «1186 
La valeur de (l'astuce est là!): 
FD = J(x®D,r(D) = F (0 + #, Yo +&) (11.187) 


peut être approchée en utilisant son expression en série de Taylor autour de la valeur 0 telle que: 


1 La) à f0) 1 d* f(0) 
HOË 2 (-4)* = Dm er. (0) D 
2 
= f (0) +1. don Elo. + LIL 0 0) (11.188) 
21 dt? dt” 
L FAGOR) r F6), »O) 1 d'fGE).»E) 
= f (xp, Yo) +1  — ox, DE -dE (O)+..+— ie 7 (0) 


Or, nous avons: 
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Ex +# 
RO) _ "D _æ 
dt dt dt 


= CAPPRE : E +2); 
6x y 6x dy 


et: 


of), E(df) 
216070 44/6020) à TD ? 
dt? de? Fe 
da à Ÿ y æ) Lada) 
Gr"), . d 


4 ôx 
à 
x y 
dt 
Fu Par dy + dy — . LME 
8x | 8x @ dy | x dy 
dt? 


2 2 
An EL + dub à J k EE + (dy si) 
X 


Oxdy &° 
di? 


Selon le théorème de Schwarz (cf. chapitre de Calcul Intégral Et Différentiel): 


PS LS 
Bxdy  dyêx 


(11.191) 


Nous avons alors: 


dy y (x +h)+ da (Yo +#) À hat + pe 


dé (11.189) 


(11.190) 


2 2 
(d a 24 + 2dxdy Ci +2 LT Far) à 
ZX 


CMACGONIO)EE Oxdy ° 


et nous démontrons par récurrence que: 


CEE CEE 
dt” ox © 


Nous avons alors finalement: 


(11.192) 
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df(xE),»E)) 1 d'fGO,»E) 


Fo +40 +8) = Goo) +1 OO) Ho es A 
= f(x Yo) += ( LL Lg) +— 2] (0) +... 


(11.194) 
1 1 
= Go. 90)+ po D) + EE Co 
l 
+ — 
2 


ca 8 & 
É TT (x x0-)0)# 1 Lot + PT Ge + 


ou sous une autre forme équivalente simplifiée: 


LE L (0: Yo) 
À æ | 2 | (11.195) 
ren 2) (x- 19) Era Re 2 enr |+. 


Ou encore si nous définissons une matrice H appelée "matrice Hessienne" donnée par: 


Pf &f 
2 8 
Æ = ox A (11.196) 
Pf f 
Oxdy c'e 


nous pouvons aussi écrire: 


ñ 
Huit Mon ee rte» Prat k\H (11.197) 
8x dy 2 k 


2.4.3. FORME QUADRATIQUE 


Maintenant nous allons avoir besoin pour le chapitre de Méthodes Numériques d'énoncer une propriété 
importante (qui aurait tout à fait sa place uniquement dans le chapitre de Calcul Différentiel Et Intégral): 


Soit fune fonction définie et dérivée sur un intervalle I et soit a un élément de I. Si f est telle que 
f'{a) = 0 alors nous disons qu'elle a un extremum local en a. 


Remarque: La réciproque est fausse, la fonction x en est un exemple. Sa dérivée est nulle en 0 mais il 


n'y a pas d'extremum local en ce point. Donc il faut être prudent! 


Cependant, soit fune fonction définie et dérivée sur un intervalle I et soit a un élément de I. Si f est telle 
que f''(&) = 0 et si f' change de signe en a alors f admet un extremum local en a. 
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Pour maintenant revenir à notre développement de Taylor à deux variables, nous savons que si 


‘Xp, Yo ! est un extremum local de f alors dans un premier temps (cf. chapitre de Calcul Différentiel Et 
Intégral): 


@ ÿ 

—|%,Yoi=—i{%,Yni=0 (11198) 

ax" 070 . 40 : 70 

Cependant nous venons de voir que cette condition n'est pas suffisante à garantir que ! xg,}p ! soit un 
extremum local. 


Reconsidérons le développement de Taylor de f ci-dessus en tenant compte de la condition précédente. Le 
développement se simplifie alors en: 


1j 2 0 $ P f 2 
Un +, yn +£i= fix, Yn i+— x, ni +2 Un, Yon A + {Xn, Fa 11.199 
f\% Yo F 20.0 ae 2) YO EE 2) V0 7 | 20:V0 ( ) 


Nous savons alors par définition que pour que i xg, Ya ! soit un minimum local (respectivement un 


maximum local) il suffit que l'expression entre crochets soit positive (respectivement négative). Étant 
donné que les dérivées secondes de f sont continues, il suffit donc que l'expression: 


® f 2,8 ® f 2 
qgihÆ = —\ 39,70 14° +2 Ü2x0,0 VA& + —©i 2x0, Ya 1° | (11.200) 
a Exûy d° 


soit positive (resp. négative) quels que soient h ou k et qu'elle soit nulle que si # = & = 0 . Nous disons 
alors que q est une "forme quadratique définie positive (resp. définie négative)". 


Pour simplifier l'écriture et être conforme aux traditions posons maintenant: 


ca cs cs 
=7 (3,90 |,è= A 070 = TT tx 1,#= Àx,k=Ay (11201) 


Nous pouvons alors réécrire q comme suit: 
gi Ax, Ayi= ahx +2bAxhy +cAy? 


_22 2 2 (11.202) 
SE jo tafax+ 2) Lder(#)Ay? +a[ ax +22) 


a a a a 
Où H est toujours matrice hessienne de f évaluée en i xg,Y9 !. 


Nous voyons donc que q est définie positive (minimum local) si & > 0 et deti À 1 > 0, définie négative 


(maximum local) si & <0 et detiÆi>0. 


En revenant aux dérivées partielles ces conditions se réécrivent comme suit: 


- Définie positive (minimum local) si: 
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2 
2 2 2 2 
J af df 6) . 
——{ Xp, Yo | > Ô et detiHi=—\x),70 l —<\ 20 >Ÿ0 1= UX0 0 ! > Ô (11.203) 
a? a d 


- Définie négative (maximum local) si: 


a 2 2 2 
TT (xp) <0 et db(Aÿ= Try (a 00) Ô Î 
êx dy x dy 


a 


2 


En conclusion nous voyons que le signe du déterminant de la matrice hessienne ainsi que celui de 

27 nous permettent d'obtenir une condition suffisante pour déterminer si nous sommes en présence d'un 
nn local. 

2.4.4. RESTE DE LAGRANGE 


Il peut y avoir un intérêt dans certaines applications numériques (cf. chapitre de Méthodes Numériques) à 
connaître l'erreur d'approximation du polynôme Æ,(x) par rapport à la fonction f(x), x . 


Définissons pour cela un "reste" &,(x), tel que: 
R,(x) = f(D -2.(x) (11205) 
La fonction À ,(x) est appelée "reste de Lagrange". 


Considérons maintenant une fonction f{x) qui est (# + 1} fois dérivable sur un intervalle qui contient x;,. 
Pour une valeur x de l'intervalle, différente de x,, nous nous proposons de démontrer qu'il existe un 


nombre z situé entre x, et x tel que: 


Fe) 
{x +1 


#+l 


ÉR=4) (11.206) 


RC) = ——< 


Démonstration: 


Soit une fonction g(t) une fonction définie par la différence d'une fonction f(x) supposée connue et une 
approximation de Taylor de cette même fonction: 


F (x —12)?+..+ 


(ne) (2H) 
. O7 +É (074) 


g(#) = f(x) ro+re (a+ 


u (x) a+ 
= f(x)- oc ED (xD +. + D (x sy" }- Rx DR 


+ 
0) 


FAO] 
2] 


(11.207) 


avec bien sûr: 
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(n-H) #2 
D © Cm (11.208) 


{x- 20)" {a +! 
Nous voyons que g(f) s'annule bien pour la valeur £ = x. 


Dérivons maintenant g(t) par rapport à t, nous trouvons: 


20 =-SO-S OC D-S"OG-0-S"O&-06 17 +122 La 5° 
(n-H) (11.209) 
+. À TL 2" +8, +0 ET 
(x = x0) 
Après simplification: 

(rH) à 
8-2 LG +R a+ D 29 (11210) 

(x x)" 


Selon le théorème de Rolle (cf. chapitre de Calcul Différentiel Et Intégral), il existe une valeur £ =z pour 
laquelle la dérivée g'(£) s'annule. Donc: 


0 TE TL - 2) RGO (11211) 
Nous pouvons simplifier l'équation par (x-z)": 
RG TE O (11212) 
ce qui s'écrit aussi: 
R, (x DO x)" =0 (11213) 


+) 


et nous trouvons donc pour maximum de À, : 


(11.214) 


OIC.Q.F.D. 


Nous voyons que plus le polynôme Æ (x) est de degré élevé, plus il approxime la fonction f(x) avec 
exactitude. Que se passe-t-il lorsque # — © ? 


{k) 
Px) = De Go) (x =) die 
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Supposons que f(x) admette des dérivées de tout ordre (ce que nous notons £'® ) pour toutes les valeurs d'un 


intervalle quelconque contenant x, et soit À, le reste de Lagrange de f(x) en x,. Si, quel que soit x dans 
l'intervalle: 


lim R,(x)=0 (1216) 


alors f(x) est exactement représentée par P(x) sur l'intervalle. 
Démonstration: 


Elle découle simplement de l'expression de Æ (x) lorsque # — ©. 


Effectivement, si nous prenons une infinité de termes pour Æ,(x), la correspondance avec la fonction 
approchée est parfaite et donc le reste est nul. 


OC.Q.F.D. 


Le polynôme: 


nl 
P(x) DYARCUPErSE (11.217) 


in À 


est appelé "polynôme de Taylor" ou "série de Taylor". Si x, = Ô, il est appelé "polynôme de Maclaurin" 
ou "série de Maclaurin". 


2.4.5. FORMULE DE TAYLOR AVEC RESTE INTÉGRAL 


Nous allons voir ici un théorème qui nous sera utile dans le chapitre de Statistique pour relier la loi de 
Poisson et la loi du Khi-2 qui est utilisée dans les logiciels statistique pour le test de Poisson des 
événements rares (c'est la seule application pratique utilisée dans les entreprises qui nous est connue à ce 
jour). 


Remarque: Si quelqu'un possède une démonstration plus pédagogique dont le début fait un peu moins 
"formule tombée du ciel", nous sommes preneurs! 


Soit f une application de n+1 fois dérivable dans l'intervalle [a, b]. Nous avons a alors : 


50 =(b-a)r'la P ET 


era ES pos LP 27 eq crois 
! A! A! 


où il est important (pour la bonne compréhension de ce que nous ferons dans le chapitre de Statistiques) 
que le lecteur remarque dans le développement que quand la dérivée s'arrête au n-ième terme dans la série, 
l'intégrale (le reste) a un facteur 1/n!, une puissance en n et une dérivée en n+1. Donc in extenso, comme 
nous allons le démontrer ci-après, si nous arrêtons le développement des termes à n-1, l'intégrale (le reste) 
aura un facteur 1/(n-1)!, une puissance en n-1 et une dérivée n-ième. 


Démonstration: 
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La démonstration se fait par récurrence. Nous considérons d'abord la formule tombée du ciel: 


2 
EE f'(a)+… Bal a +1 [e- eÿ fl (1219) 


FE)-f(a)=(b-a)f{a)+ : ti 


Nous montrons qu'elle est correcte pour k — 0 et ensuite nous faisons une récurrence sur k pour 
&e{0,1,..,n) 


Pour k = 0, nous avons la relation bien connue (cf chapitre de Calcul Différentiel Et Intégral): 
è 1 
F@)-f(a)= [FO «220 


Supposons la propriété vraie pour & < x: 


(ë-a) 


FE) —f@)=(8-a)f (a+ — 


f'a)+.…. el EE pi = IX (os ÿ pe (11221) 
Nous intégrons par parties (cf. chapitre de Calcul Différentiel Et Intégral) le terme: 


LP ee Gi 


a de 
Nous avons alors: 
ë 
al (b-2)" 7 0 (0at = ES (8 = ra) + 5 Le" 70) a8 (11.223) 

d'où: 

J @) — f{a) = 

k-H 
Bai a+ Es »+ ant FE) (a  — il | (b— PAUL ED (yat (11.224) 


OIC.Q.F.D. 
2.5. SÉRIES DE FOURIER 
Nous appelons par définition "série trigonométrique" une série de la forme: 
a: cos(0:x)+ 8, ‘sin (0:x)+a,'cos(x)+b sin (x)+...+a,cos(ax)+h ‘sin (mx) (11225) 


ou sous une forme plus compacte: 


De , cos(ax) +b, ‘sin (ax) (11.226) 


m0 
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Les constantes &4,,b, (# = 1,2,..€ N*) sont les coefficients de la série trigonométrique plus souvent 


nommés "coefficients de Fourier". 


Remarque: Nous avions déjà fait mention de ce type de série lors de notre étude des types de 
polynômes existants puisque les séries de Fourier ne sont au fait que des polynômes trigonométriques. 
(cf. chapitre de Calcul Algébrique). Par ailleurs, nous avons vu comme exemple dans le chapitre 
d'Analyse Fonctionnelle lors de notre étude du produit scalaire fonctionnel que les fonctions sinus et 
cosinus constituaient les bases d'un espace vectoriel. 


Si la série converge, sa somme est une fonction périodique f{x) de période T = 2x7 , étant donné que sin 
(nx) et cos(nx) sont des fonctions périodiques de période 2x7 . De sorte que: 


f(x)=f(x+2R) (11227) 


Posons maintenant le problème suivant: Nous nous donnons une fonction connue, périodique quelconque f 
(x) continue par morceaux de période 27 . Nous nous demandons s'il existe une série trigonométrique 
convergeant vers f(x) moyennant des conditions sur cette série. 


Supposons maintenant que la fonction f{x), périodique et de période 27, puisse être effectivement 
représentée par une série trigonométrique convergeant vers f{x) dans l'intervalle [0, T1, c'est-à-dire qu'elle 
soit la somme de cette série: 


Fr) (a, Ù cos(xx) +b, ‘an (x) (11.228) 
#1) 


Supposons que l'intégrale de la fonction du premier membre de cette égalité soit égale à la somme des 
intégrales des termes de la série ci-dessus. Ceci aura lieu, par exemple, si nous supposons que la série 
trigonométrique proposée converge absolument, c'est-à-dire que la série numérique suivante converge (de 
par la propriété bornée des fonctions trigonométriques): 


Wol+lBo+ lt + lel+ + ++ Rif 01220) 


La série: 
La 


DC cos(nx) +, ‘sin (ax) (11.230) 


#0 


est alors majorable et peut être intégrée terme à terme de 0 à T (où T = 2x7) ce qui nous permet de 
déterminer les différents coefficients de Fourier. Mais avant de commencer exposons les intégrales 
suivantes qui nous très seront utiles par la suite: 


T T 


Ie ‘cos(kx)dx = 0 IF =T/2 

r r 

Ee “sin( &r)dx = 0 (7) ass sin( &x)dx = 0 (27) (11.231) 
Fr r 

1 ax)" sin( £x)dx = 0 loi : (kx)dx = T2 
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Avec #,kEN et n#X Avec #keN et x=kZx0 


Avant de continuer, démontrons la valeur que prennent ces six intégrales (suite à la demande des 
internautes). Mais d'abord, rappelons que comme #,# € N alors: 


(ntk)=weN et(r-£)=veZ (11232) 


1. Nous procédons en utilisant les relations trigonométriques remarquables (cf chapitre de Trigonomeétrie) 
et les primitives des fonctions trigonométriques élémentaires (cf chapitre de calcul Différentiel Et 
Intégral): 


T T 

Î cos(#x) cos(&x)dx = J cos(xx + x) + cos(ax — kx)dx 

0 0 

L | sin(ux +) _ sin(ex — 4) | ni ÉC +7) _ sin((x - 2) à 

C2 »+k n-k Jh 2Ù n+k n—k . 
1 EX : = ' ne = L . 1 E L _. 

72 w y R: w y 2 w y 

: —— : a : (5-2 = 

3 w y 2lw v) 


car comme nous l'avons vu dans le chapitre de Trigonométrie sin(&zr) = Ü,&€ Æ et comme T = 2x, les 
deux différences précédentes ont tous les termes qui sont nuls tel qu'au final: 


T 


10e cos(kx)dx = O (11234) 


2. Pour la deuxième intégrale, nous procédons selon les mêmes techniques et mêmes propriétés des 
fonctions trigonométriques: 


1 


T T 
[ cos(xx) sin(x)dx = 5] (sinéex + x) + sin(ex — x) )dx 
0 


T 


1 (- cos(xx +kx) _ cos(ax — x) | M : 5 COS (Wx) 0 | 


2 nr #—k JG 2 w Ÿ 40 (1235) 
_ [22- en) cos(w: 0) : cos(v: 2) 
= 2 W V 2 w y 
NERNISNNENNEnT 
7 9Ù » v 0Ù y v}) 2 + le 


3. Et nous continuons ainsi pour la troisième, toujours selon les mêmes propriétés: 
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T ; Es 
[sinçer) sin(kx)dx = g (cos(ux — &x) —cos(ux +Ax))dx 
(a) 0 


: ; PET à A+ 0 - y w h 
: (2 L un) (E 0) _sin(w. ?) = 
2 y w 2 y w 


4. Encore une fois selon les mêmes méthodes (cela devient routinier...) pour & z 0 d'abord: 


T r 
[cos (Ax)dx = [ 


É +cos(2kx) 
(e] 0 


15, 17 
Jer= far + 2 [vos 
2 no) 


Li . d . r _ 1 Li. | ) 
= xt +—sin( 2x) = —(T-0)+—(sin( 247) — sin(2&-0)) (11237) 
Ph Tina TRUE) C0) 


et pour # = 0 il vient immédiatement: 


r à 
[ cos’ (0: x}dx = [ax =T (11.238) 
0 0 


5. Encore une fois. (bientôt au bout...) pour & 4 0 d'abord: 


T T T 
[cos() sin(ix)ax = | (sin(&x + 4x) + sin{x — 4x) dx = dl sin(2ko)dx 
(E (E 


(el 
L :- cg) - ee) L (20 _ cos(2£. 2) (11.239) 
_ ; CAÙ k& 


2x 4 & & 


( 


et pour # = 0 il vient immédiatement: 


T 
[cos()sin(éodx = 0 (11240) 
(el 
6. Et enfin la dernière (...): 
 d 
foin” (dx = (En ie 2 à feosCadr 


= À - = snCHÉ = T- 0) — ZE (in CAN) - sin(2&" 0)) (11.241) 


-lr-Lto-o-1lr 
2 4x 2 
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Ce petit travail fait, revenons maintenant à nos moutons... Pour déterminer les coefficients 4, multiplions 


les deux membres de l'égalité: 


FC (2, cos(ax) +b, "sin (ax) (11.242) 


LE 


par cos(kx) : 
J{x)cos(kx) = > (a, cos(xx)cos (&x) +, sin(xx)cos(kx)) (11.243) 
n=Ù 


La série du second membre de l'égalité est majorable, étant donné que ses termes ne sont pas supérieurs en 
valeur absolue aux termes de la série positive convergente. Nous pouvons donc l'intégrer terme à terme 
sur tout segment borné de 0 à T: 


T co T T 
[7@ cos(&x)dx = + 4, [ cos(xx)cos(Ax)dx +b, [ items) (11.244) 
0 #=0\ 0 û 


Nous avons démontré plus haut que quelles que soient les valeurs entières que prennent k ou n le 
deuxième terme de la parenthèse est toujours nul. Il ne reste alors plus que: 


T co T 
[7 cos(ix)dx = Da [ cos(#x)cos (4x)dx (11245) 
0 #=0 0 


Or, nous avons démontré plus haut que l'intégrale à droite est toujours nulle si n et k sont différents. Il ne 
reste alors que le cas où n et k sont égaux. C'est-à-dire: 


T "à T 
[7 cos(&x)dx = 43 [ cos(&xr)cox(Ax)dx = &, [ cos? (&x)dx (11.246) 
(a) (n] (a) 


Dans cette situation, nous avons d'abord le cas particulier où k est nul. Dans ce cas: 
r I 
[f(max = ap [ x = @p] (11247) 
0 0 

Soit: 


1° 
ap = OS (11.248) 
(nl 


Il est évident que le coefficient 4 représente donc la moyenne du signal ou de sa composante continue si 
elle existe. 


Dans le cas où k n'est pas nul, nous avons: 
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T T 
[fo cos(x)dx = 4, [ cos” (Ax)dx = a ! (11.249) 
(n] 0 


D'où nous tirons: 
T 
2 
dx = [7 cos(Æx)dx (11.250) 
0 


Pour déterminer les coefficients &, nous procédons de la même manière mais en multipliant cette fois-ci 


les deux membres de l'égalité par sin(&x) : 


f(x) sin(&x) = > (æ, cos(x)sin(&x) +, sin(ax)sin(&x)) (11251) 


n=0 


La série du second membre de l'égalité est majorable, étant donné que ses termes ne sont pas supérieurs en 
valeurs absolues aux termes de la série positive convergente. Nous pouvons donc l'intégrer terme à terme 
sur tout segment borné de 0 à T: 


co T T 
HOTTE [a feste) sin(lx)ax + b, [ sin(ax) ah 41252) 
n=Ù 0 0 


Nous avons démontré plus haut que quelles que soient les valeurs entières que prennent k ou n le premier 
terme de la parenthèse est toujours nul. Il ne reste plus alors que: 


T co T 
[7 sin(Ax)dx = 2. bj sin(#x) sta (11.253) 
0 


n=Ù O 


Or, nous avons démontré plus haut que l'intégrale à droite est toujours nulle si n et k sont différents. Il ne 
reste alors que le cas où n et k sont égaux. C'est-à-dire: 


T T T 
[Go sin(ooax = 8, [sin(oo sin(enax = à, sin? (dx (1252 
0 0 0 


Dans cette situation, nous avons d'abord le cas particulier où k est nul. Mais nous voyons de suite que nous 
avons une indétermination par zéro. Il vaut mieux alors considérer le cas général d'où nous tirons: 


T T 
[Go sin(oax = 8, [sin? (dax = à, - (11.255) 
[a] [e) 


D'où nous tirons aisément que: 
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T 
b = =| f{dsin(dx (11.256) 
T5 


Dès lors, pour la situation où k est nul le coefficient est alors nul! 


Donc finalement les coefficients de Fourier sont donc déterminés par les intégrales: 
1f 27 27 
äp = = [rex 4, = [ro cos(2x)dx =2[7 (A sin(ax)dx (11257) 
Ti Ti Ti 


Mais comme c'est embêtant d'avoir trois résultats pour les coefficients nous allons jouer un peu avec la 
définition de la série de Fourier. 


Effectivement en sommant de 1 à l'infini plutôt que de 0 à l'infini nous avons: 


+<o 
J@)= _ +2 (a, cos(ex)+b, sin(xx))| (11258) 


x=l 


Ce qui permet alors de n'avoir qu'à se rappeler de (4 inclus donc!): 


= [Go sin@x)ax (11.259) 


Les physiciens ont quant à eux pour habitude de noter ces deux dernières relations sous la forme suivante: 


2 T2 2 ri2 
a = RCE x )a [ F@) cos(æk lt 


: T2 | 
r12 r!2 (11.260) 
-< [ JO&(7 DE [ JE) sin (@kt) dé 
Tia aTia 


Cette décomposition possible de toute fonction périodique continue par morceaux approchée par une 
somme infinie de fonctions trigonométriques (sinus ou cosinus) consistant en une fonction fondamentale 
et ses harmoniques est appelée "théorème de Fourier" ou encore "théorème de Fourier-Dirichlet". 
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square wave 


sawtooth wave 


L 
x 
L 
À 
DS L 1.5 2 £E 
Figure: 11.7 - Exemples d'approches de fonctions par série de Fourier (source: Mathwolrd) 


La série de Fourier permet donc implicitement de représenter toutes les fréquences contenues dans un 
signal périodique dont la fonction est connue mathématiquement. On se demande bien pourquoi parler des 
séries de Fourier quand, dans la pratique, nous ne connaissons pas vraiment la représentation 
mathématique de ce signal? Cela nous amènera à mieux comprendre le concept de la transformée de 
Fourier à temps discret, que nous verrons un peu plus loin, qui n'a nul besoin d'une représentation 
mathématique d'un signal continu échantillonné dans le temps. 


Nous constatons par ailleurs que si f(x), soit la fonction périodique dont nous cherchons l'expression en 
série trigonométrique de Fourier, est paire alors la série devra être paire aussi et donc ne comporter que 
des termes en cosinus (le cosinus étant pour rappel une fonction paire) ce qui implique que à, = 0 et dans 


le cas contraire d'une fonction impaire &,, = 0 (le sinus étant pour rappel une fonction impaire)! 


Il convient de noter, et c'est important pour la suite, que comme nous l'avons vu dans le chapitre de Calcul 
Algébrique lors de notre étude des polynômes trigonométriques, les séries de Fourier pouvaient donc 
s'écrire sous la forme complexe suivante (en changeant un peu les notations et en passant la somme à 
l'infini): 


+0 . 
JA= 7 ce (11261) 


n=—<0 


et nous avions vus que: 
An = 2g A =CntCn by mil —C_n) (8.262) 


Soit: 
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Ce qui nous donne: 


2. D 
=[/@ cos (xx }dx — [JG sin (#x)dx 


r 
0 0 _i 
E= —_——————————— = — (( (cos (ax —i sin(#x) kdx 
L 2 Tr [# ) k (11.264) 
12 
—inx 
= — d 
rl x 
Donc: 
1f 
= S [De ax (11.265) 
TS 
Exemples: 


El. Lors de la décomposition d'un signal continu, nous disons abusivement que les coefficients 

&, ,®, représentent chacun (implicitement) une fréquence distincte associée à une amplitude que nous 
visualisons sur un graphique par des lignes verticales. Ce graphique représente le spectre en fréquence du 
signal décomposé. Nous pouvons également adjoindre une autre représentation qui se nomme "spectre de 


phase". Ce spectre nous donne la phase du signal harmonique (en avance ou en retard de phase). 


[X{&]| 


— 


etetete mette) | Lhbrrnrnts 


19-17-1S=103=11.-9 8 9 11 13 DS 17 19 


13 15 17 19 


Figure: 11.8 - Exemple d'amplitudes et de fréquences associées aux différents coefficients 


Voyons maintenant comment décomposer un signal périodique connu en plusieurs signaux d'amplitudes et 
de fréquences distinctes. 


Prenons comme exemple, un signal à onde carrée périodique défini sur une période T=2 et d'amplitude A 
tel que: 
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— À —] <£é <0 


£) = 266 
JF) L Deer (1269 


A la période T2 correspond comme nous le savons une pulsation: 


= ZT (11.267) 


Calculons en premier lieu les coefficients c4 à l'aide de l'intégrale permettant de déterminer ces 
coefficients (le choix des bornes de l'intégrale suppose donc que le signal est périodique par construction!) 


_1 és El “km 3, 1I(0 4 km l'y, im 
a =] fOe ae [ 0e a==[f" A9 dt + [° 4e 2 


= QG: 4 l > _ _ , (ll _ till 
a= (| #rat-[e#rat)- À — er] +4 e| 
2 ol 0 2 Lit —1| 21\3&7 0 


] (11.268) 
À sel: ps.) all oËT QT | 
LS FL ‘ Ê 1] 2| kr À LT 


En prenant k = 2, nous avons: 


A 1 j —ï 
C) = l-z(e #7 +e #)|- Q (11.269) 


De même pour k = 4,6,8 ainsi que pour tout nombre pair. 


Pour ce qui est des nombres impairs, nous aurons: 


: A 1 iT 7 os 2A _ A 1 137 37 _ 2A 
a = 4-3 (e +e JE = 5 +e ) "337 (11.270) 


Les coefficients seront alors: 


0 , 
& pair 
Cx =] 24 : (11.271) 
—  Kimpar 
TT 


Il y a un seul hic dans cette relation, le coefficient c4 ne peut être calculé selon cette relation car on peut 
voir que si k = 0 dans le résultat ci-haut, nous aurons une valeur infinie et c'est du moins impossible. Le 
coefficient €4 est soit nul ou non nul mais jamais infini. 


Pour trouver le coefficient cn, nous devons calculer l'intégrale pour k=0. Le coefficient ch est alors 
déterminé par: 
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C1 nn. 1 1) 1 
co = 7] F (6e Ge = il f Cdt = :l HO +] f(Oat 
| o | i (11.272) 
co = Pi No sir Lo = 0 


Le spectre en "fréquence" (attention à l'abus de langage!) et en amplitude sera alors de la forme suivante 
pour # =—5,..,+5 et A=1 les fréquences nulles n'étant pas représentées: 


© 
© 


Figure: 11.9 - Spectre de fréquence des coefficients de la série de Fourier 


L'abus de parler de fréquences pour les coefficients de Fourier amène donc à avoir des fréquences 
négatives en abscisse. mais ce n'est qu'une question de vocabulaire (il n'y a aucun rapport direct avec les 
vraies fréquences) auquel il faut s'habituer. 


Le spectre d'amplitude et de phase se calcule selon les relations: 


lle HA +0 et RE (11.273) 


Il est alors relativement aisé de remarquer que si T tend vers un nombre de plus en plus grand, les pics du 
spectre se rapprochent de plus en plus. Ainsi, lorsque T tend vers l'infini le spectre devient continu. 


Le spectre de phase donnera ce qui suit pour les valeurs impaires: 
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Le, 
a 


Figure: 11.10 - Spectre de phase des coefficients de la série de Fourier 


Il est même possible pour l'exemple d'obtenir relativement facilement le spectre des fréquences dans 
Microsoft Excel 11.8346 (le lecteur pourra trouver un exemple beaucoup plus détaillé et intéressant dans 
le serveur d'exercices sur les Suites et Séries)!!! 


Effectivement, il suffit pour cela d'échantillonner par exemple notre signal 128 fois (Microsoft 
Excel 11.8346 a besoin de 2* échantillons et ne fonctionne que sous cette condition!). Nous divisons alors 
l'intervalle —1 <£ < 0 en 64 échantillons et idem pour l'intervalle Q > £ > 1: 
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j -0.1094 -] 
-0.0938. -| 
-0.0781 si 
00625 -1 
-0.0469 -1l 
-0.0313 1] 
-0.0156 1 
0.01563. 1 
0.03125 1 
0.046838 1 
3, 00625 1 
1 
1 
1 


0.07813| 
0.09375 
010938 


0.828313 
0.84375| 
_0.85938 
0.875. 
0.890631 
0.90625! 
0.921838 
0.9375) 
0.95313 
0.96875| 
_0.98438 


| | 
mm mime ls les + 


1 
Fi 
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Ce qui donne sous forme graphique (attention! pour que la transformée de Fourier discrète fonctionne bien 
dans Microsoft Excel 11.8346, il faut que la fréquence d'échantillonnage - correspondant au nombre de 
mesures dans une seconde - soit au moins 100 fois supérieure à la fréquence du signal d'origine sinon quoi 
le résultat peut être aberrant!): 


Figure: 11.11 - Représentation graphique de la série de données sous Microsoft Excel 11.8346 


Ensuite, il suffit d'aller dans le menu Outils/Utilitaire d'Analyse et choisir l'option Analyse de Fourier: 


Data Analysis | 


Analysis Tools 
nova: Two-Factor Without Replication 


Descriptive Statistics 
Exponential Smoothing 


Random Number Generation x] 


Figure: 11.12 - Caputre de la boîte de dialogue de l'utilitaire d'analyse de Microsoft Excel 11.8346 


Vient ensuite la boîte de dialogue suivante qu'il faut remplir comme indiqué (on voit que l'abscisse n'a 
aucune importance!): 


x 
SE  ——— 
Input Range: [+e$2:$85129 K] 
Cancel 
F Labels in First Row _cenel_ | 


utput options 


€ Output Range: [sc$2 x] 
© New Worksheet Ply: [ 


© New Workbook 


D Inverse 


Figure: 11.13 - Paramètres de l'outil Analyse de Fourier de Microsoft Excel 11.8346 
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Vient alors le tableau suivant pour les coefficients: 


-1 -1,0 
3] -0.9844 -1.-1.99999999999904+81.4709677441666i 
M4] -0.9688 -10 
BEA -0.9531 -1-1.99999999900996+27. 1133384847048i 
ME] -0.9375) -10 
-0.9219 -1.-1.99999999999997+16.2155716073538i 
LG | -0.9063, -1,0 | 
9 | -0.8906 -1-1.99999999999997+11.5262840102376i 
64| -0.0313 -1.0 
65| -0.0156 -1.-1.99999999999993+4.90972442178759E- 
66! 0.01563 10 
0.03125 1.-2-4.90972442178546E-002i 
68 | 0.04688 10 . 
0.0625 1.-2-0.147528863044895 
0.07813| 10 
0.09375 11-2-0.246676472273474i 
| 0.875 1 -2.00000000000003-8.9064044488288 
0.89063 10 
0.90625 1 -2.00000000000003-11.5262840102376 
0.92188 10 
0.9375 1.-2.00000000000005-16.2155716073538 
0.95313 10 
0.96875 1.-2.00000000000009-27.1133384847049 
H28| 0.928438 10 
1 1.-2.00000000000032-81.4709677441667i 


Tableau: 11.3 - Coefficients de Fourier 


Il reste à calculer le module des nombres complexes avec la fonction MODULE.COMPLEXE( ) de 
Microsoft Excel 11.8346 et de diviser le résultat par 128 pour chacun des coefficients €, mais nous 


voyons déjà que chaque coefficient pair est nul ce qui correspond bien au résultat théorique obtenu plus 
haut. 


Nous avons alors en mettant l'indice n en face de chaque module: 
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-] -1 0 0 0 
-0.9844 -1.-1.99999999999994+81.470967/4416661 | 0.6366837 -] 
-0.9688 -1 0 0 -2 
-0.9531 -1-1.99999999999996+27.1133384847048 | 0.2123985 -3. 
-0.9375 -1 0 0 -4 
-0.9219 -1,-1.99999999999997+16.215571607353& | 0.1276441 -5 
-0.9063. -10 | 0 -6| 
-0.8906 -1,-1.99999999999997+11.52628401023761 | 0.0913946 -7 
-0.0781 -1,-1.99999999999999+0.24667647227348"A | 0.0157434 -59 
-0.0625 -1 0 ( -60 
-0.0469 -1.-1.99999999999998+0.147528863044911i 0.016675  -61. 
-0.0313. -10 | 0! 62 
-0.0156 -1,-1.99999999999993+4.90972442178759E- 0.0156297 -63 
0.01563 1,0 0 64 
0.03125 1.-2-4.90972442178546E-002i .0.0156237 63 
0.04688 1 0 0 62 

69 0.0625 1,-2-0.147528863044895 0.0156675 61 
0.07813 10 ( 60 
0.89063. 1,0 | 0 8 
0.306235 1:-2.00000000000003-11.5262840102376  0.0913946 ?| 
0.92188 1 0 0 6 

0.9375 1:-2.00000000000005-16.2155716073538& | 0.1276441 5 
0.95313 1 0 ( 4 
0.96875 1 -2.00000000000009-27.113338484704%X  0.2123985 3| 
H28| 0.928438 10 0 2 
l 1,-2.00000000000032-81470967/44166 1 | 0.6366837 l 

Tableau: 11.4 - Module coefficients complexes 


En en traçant un graphique à points (toujours dans Microsoft Excel 11.8346) un peu personnalisé des 
colonnes D et E, nous obtenons finalement (nous avons restreint l'axe des abscisses à [-5,+5] pour en 
faciliter la lecture): 
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Figure: 11.14 - Spectre de fréquences de la transformée 


A comparer avec les calculs théoriques (graphique déjà présenté plus haut)...: 


© 
© 


05} 


04+ 


Figure: 11.15 - Spectre de fréquence calculé plus haut à la main 


Nous verrons un exemple pratique et plus détaillé dans le chapitre d'Économie lors de notre étude des 
séries temporelles. 


E2. Prenons un autre exemple identique au précédent mais sous une autre approche. Nous définissons une 
fonction périodique de période 277 comme suit: 


1 —JT<x <Û 


Firi= a (11.274) 


OSx<x7 


Calculons les coefficients de Fourier (nous translatons les bornes des intégrales puisque la fonction est 
périodique rien ne nous en empêche!): 
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2% # 24 
= = [ J{r cos(xx)dx = ll cos(ax)dx + [ -] xt 
27 û FT 


# 2# ° : L 24 (11.275) 
= r cos(xx dx — [ trs e [ee : sin(#x) | L 
A0 # 7 # dl #: ls 
et: 
» 24 1 #7 27 
b,=— [ f(x) sin(ax)dx = Al 1sin@ax)dx + [ Han) 
2Æ a|à 
“ FT 2# 
_ 2 [ sin(#2x)dx — [ sn = ee + cos(xx) | 
7 (El pe FT # # # 
mn ES = COR) | _ (cost = cos(ux)f . 
" 2 lr # | TA 
= {00529 — cos(T#) — cos(Tx) +1) 
ITA 
= L {00527 - 2cos(rx)+1) 
JA 


Nous remarquons que à, vaut 0 pour n pair et vaut 4x7/x# pour n impair. 


La série de Fourier de la fonction considérée s'écrit donc: 


#0 #0 
FR) = 5 (a, cos(xx)+b, sin(xx)) = 5" 8, sin(xx) 


| ee | | La (11.277) 
_4 ë Lsin(Gx ,sin(5x) , ,sin(2x+) +. 
#| 1 3 5 2x+1 


Ce quie dans Maple 4.00b s'écrit: 
>S:=(4/Pi)*Sum(sin((2*n+1)*x)/(2*n+1),n=0..N); 
et que nous pouvons tracer à l'aide de la fonction: 


>plot({subs(N—4,S),subs(N=8,S),subs(N=16,S)}, 
x=-Pi..Pi,color-[red,green,blue],numpoints—200); 


Ce qui donne trois traces pour 4, 8 et 16 termes de la série en rouge, vert et bleu: 
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Figure: 11.16 - Exemple de série de Fourier dans Maple 4.00b avec 4, 8 et 16 termes 
Pour 50 termes nous obtenons: 


> plot(subs(N=50,S),x=-P1..Pi,numpoints—800); 


Figure: 11.17 - Exemple de série de Fourier dans Maple 4.00b avec 50 termes 


Nous voyons les effets de bord appelés "phénomène de Gibbs". Il est possible de montrer ceux-ci se 
produisent à la valeur de l'abscisse correspondant à x = x7/ 2# et que et que le pic culmine à +1.179 pour 
toute valeur de n. Voyons cela! 


Nous venons donc de montrer que: 


#0 #0 
FR) = 5 (a, cos(xx)+b, sin(xx)) = 5" 8, sin(xx) 


nn nue (11.278) 
: a] sin(x) " sin(3x) 4 sin(5x) à sin(2x +1 +. 
AL 1 3 5 2x+1 


Ce qui peut s'écrire: 
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f()= 2 [cos(£) + cos(3) +... + cos(2x + 1) Ja 
0 


4? — . 

=] | EA + if +..+6/2#0t dr 
7: 
0 


en utilisant la démonstration faite plus haut comme quoi: 


3 2 x 2 
Sy = X+x PR QU 
2 
x° —1 
Nous avons alors: 
4? 
f{=—| \Es TOR + Li 
7: 
( 
4% [Gnmdit it 4? ane if] 4% [| 2nt 
ar — RE = IR F + 
LL RE LU ge le —e | 0 g —e 


Rappelons que lors de notre étude des nombres complexes (cf. chapitre Nombres) nous avions démontré 
que: 


sin(x) = 


Ce qui nous amène donc à: 


f@ = 4 FE a grnit _ _4 _ 
_ Le SE he nn 
: # f a cos(2#ft) +isin(2#£)—1 = 2 É a cos(2x#f) + isin(2nf) L 
h LE 2i sin(é) Le isin(£) isin(éf) à sin(f) 
: Lin a ES D bi _2 | n|- icos(2xf) ses L— 
Æ\ i sin(f) isin(é)  isin(é) sin(£) sin(£)  2sin(é) 
: 2 f a] sin(2#f) _; Ca, +1 L 2° sn) ” 
Ti sin(f) 2 sin(£} Fi sin(f) 


Nous allons nous intéresser aux petites valeurs de x. Donc nous pouvons alors faire un développement au 
première ordre en Maclaurin du dénominateur (mais pas du numérateur à cause de la présence du n): 


mr * sin(2nf) 
JE = 4 


#0 


Nous faisons un changement de variable: 
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: 2nx . 
CT “sin(e) ds _ 2 | LOF 27 | sinc(xkés 
7 S 2»r n Fr; 


2# 


où nous avons utilisé la notation traditionnelle du "sinus cardinal" dans la dernière relation (car cette 
fraction est fréquente en physique raison pour laquelle elle a une notation spécifique). 


Comme ce qui nous intéresse est de déterminer le maximum du phénomène (la perturbation) de Gibbs, 
nous voyons que celle-ci a lieu dans le cas particulier que nous avons présenté (voir figure ci-dessus) à 
chaque multiple de Æ et comme le dénominateur de l'expression de l'intégrale va diminuer en fonction 
que le multiple est plus grand, il vient que le plus grand maximum est au point où 2#x = x (le point 0 à 
l'opposé va annuler l'intégrale donc il faut l'éliminer de notre choix). Nous avons alors: 


Ar 
#h 5 


et la valuation de cette intégrale ne peut être faire que numériquement à notre connaissance, il vient: 
Fbbs (2 & 1.179 

Soit environ 18% au-dessus de la valeur limite attendue. 

2.5.1. PUISSANCE D'UN SIGNAL 


Un signal périodique possède une énergie infinie et une puissance moyenne nulle (cf. chapitre 
d'Electrocinétique). Sa puissance moyenne sur une période est alors définie par: 


l 2 
P,= A A0] d (1127) 
Si nous développons cette équation, nous avons: 


1 pm: 1 Ce — 27 Kat 
AE 10H10 te AO DE h } 
(11.280) 


Z à [SO war = Xe = Z ef 
&=—0 &=-00 


= 


+ 
1; 


Cela signifie que la puissance d'un signal à temps continu périodique est égale à la somme des coefficients 
de Fourier au carré. C'est ce que l'on nomme le "théorème de Parseval". Cela signifie que si nous avons un 
signal quelconque que nous pouvons décomposer en série de Fourier, nous pouvons connaître la puissance 


de ce signal uniquement à l'aide des coefficients spectraux. 


Dans la réalité, comme nous ne pouvons déterminer mathématiquement l'expression de ce signal, nous 
utilisons la discrétisation ou l'échantillonnage et ensuite à l'aide d'une transformée de Fourier discrète, 
nous pouvons calculer la puissance de ce signal en utilisant uniquement les coefficients spectraux. Cela 
nous donne une caractéristique du signal. 
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Indiquons aussi le résultat suivant qui nous sera utile dans le chapitre de Thermodynamique pour l'étude 
du corps noir et qui est aussi intimement liée à des propriétés très importantes la fonction zêta de 
Riemmann: 


D lex P Set + lex if == > 2 +b£ 

k=-00 k=-00 =-00 k=-00 
1 Sp2,,2) 1 2,21, 1/22), 18 2,,2 

=— ), l&ÿ + bi = — Î, läÿ + bÿ |+—!l4ÿ + |+— 2 lag +bi | (11.281) 
V3... 14 124, 

= — dÿf +2. 5 {ag + ]= += la +5 | 

4 k=1 k=1 


La relation suivante: 


2 
2 _aÿ 


1S 2,2 
= +0 lag +bg |] (11.282) 
4 254 


est appelée "égalité de Parseval". 


Suivant la définition de la série de Fourier et de la définition du coefficient 4 qui en découle 
immédiatement, nous avons aussi fréquemment dans la littérature: 


Len) 
2 1 
> kel = aÿ +5 lai +) (11.283) 
k=-00 k=1 


2.5.2. TRANSFORMÉE DE FOURIER 


Les séries de Fourier sont un outil très puissant pour l'analyse de signaux périodiques par exemple, mais 
l'ensemble des fonctions périodiques est petit comparé à l'ensemble des fonctions que nous rencontrons 
dans les problèmes physiques. Ainsi, allons-nous introduire un nouvel outil d'analyse extrêmement 
puissant qui s'étend à une classe de fonctions plus générale. 


La transformée de Fourier (TF) est ainsi utilisée tant pour les signaux périodiques que pour les signaux 
apériodiques. 


Pour cela, nous repartons de notre étude sur les séries de Fourier en notation complexe d'une fonction 
périodique de période T en considérant que celle-ci devient de plus en plus grande jusqu'à la faire tendre 
vers 7 — +00. Dès lors les raies spectrales se rapprochent peu à peu pour se transformer en un specte 
continu. 


Ainsi, reprenons les expressions démontrées ci-avant: 


1 T2 | 
_ [ f(De "dx (11.284) 
-T12 


+0 . 
Fixl= 2 °n6 En = 7 
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que nous pouvons écrire de manière équivalente sous la forme traditionnelle suivante (dans laquelle il est 
d'usage de mettre le facteur 1/T plutôt dans f{t)): 


14 2#, 12 2%, 
JO=Z ZX ae œ= | f@e T dt (1285 
k=— —T12 


et écrivons encore cela pour des besoins ultérieurs sous la forme suivante: 


y or 2% ri2 _ 23, 
JO=— Las ? = | f@e T dt (1286 
7 j=co fa 
et posons: 
27rk 
y =—— (11287) 
T 


Ainsi, quand T — +, la pulsation tend vers zéro et nous avons &, — & car nous passons de valeurs 
discrètes à valeurs continues qui parcourent l'ensemble des réels (pour tous les k). Donc de: 


1 Se 27T rt T2 at 
FE) = — —CcLe Cr = [ Je df (11.288) 
FF = -r/2 
nous passons à la limite soit: 
T—+#0 æœ—@ (11280) 


et cela implique aussi que: 


= me = me € me _ a QC 
T T T TT (11.290) 


Nous obtenons ainsi pour les coefficients (nous changeons de notation car l'ancienne est inadaptée): 
M it 
F(@) = [ fe dé (11291) 
—<© 
et pour la série infinie (dont la somme devient une intégrale): 
17 jot 
FE) = — [ F(æje d&@ (11292) 
27, 


Attention!!! Pour faire la différence entre la fonction donnée et son équivalent dont nous cherchons 
l'expression en somme infinie, nous les noterons dorénavant différemment. Aïnsi, il vient: 
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1 +co 
10 = | F(@e 
27 


it 


ko | 
de  F(a)= | fe at (1295) 


Donc la série de Fourier discrète devient une fonction continue. 
Définitions: 
D1. Nous appelons "transformée de Fourier (TF)" de f la relation: 


7 
(11.294) 


F(F())(e) = F(@)= Troc 


—(0 


notée parfois aussi sous la forme suivante: 
FG@)= [fe at (11295) 


appelée aussi parfois "densité spectrale d'amplitude". 


D2. Nous appelons "transformée de Fourier inverse (TFI)" de F la relation: 


+o | 
FT (F(@))(6) = (6) nr [ F(oe "io (11.296) 
27 


Toute technique de transformation de ce type (car il y en a plusieurs!) s'appelle une "transformation 
intégrale". 


Remarque: Il existe de nombreuses manière d'écrire la transformée de Fourier en fonction du choix de 
la valeur initiale de T. 


Certains physiciens préfèrent symétriser ces deux expressions en mettant le même coefficient dans les 
deux sens, qui sera par exemple 1/./27 . Cela donnera: 


LUE 


L PF... ; 
FO) = F(a = | (0e dt F'(F(a))= 10 = 7] T rcoe (11.297) 


Donnons également la forme tridimensionnelle qui nous servira de nombreuses fois en mécanique 
ondulatoire, électrodynamique, optique ondulatoire ou encore dans les divers chapitres de physique 
quantique: 


F(&)= — [ects oe pr 1 F(k)e > (11.298) 
(2x) (2x 


Pour que les choses soient peut-être plus claires, montrons de manière générale que la transformée de 
Fourier Æ précédemment écrite est une isométrie (conserve la norme). 
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Remarquons tout d'abord que pour tout f, g nous avons le produit scalaire fonctionnel: 


foF(g)=F"(f)og «1299 


Mais puisque les fonctions sont dans l'espace des complexes, comme nous l'avons vu dans le chapitre de 
Calcul Vectoriel, nous devons alors utiliser la notation du produit hermitien: 


(f|F(e)}= (F(J)le) (11.300) 
Rappelons quand même que: 


(flg}= [Per (11.301) 


Démonstration: 


Nous voulons donc démontrer l'égalité: 
AO ODEES 
Soit explicitement: 


(|F(&)}= [FF (er (11.303) 


E" 
Mais les variables à intégrer doivent être les mêmes et pour que .F (g) soit implicitement dépendante de 
Fil faut donc prendre la transformée de Fourier en # . Tel que: 
1 


F(F)= lee Tax (11304) 


Ainsi: 


COIF(O)= [OF "7 -J;@| PL Lee) tre a“ 
(11.305) 
L Jr L fer) 


(27° LA 


Soit en utilisant le théorème de Fubini (cf. chapitre de Calcul Différentiel Et Intégral): 


a Jr) J e(E}r (F)(Ha"k = (Fr (F) |&) FASO 


A l'aide de ce résultat, nous avons donc aussi démontré (c'est immédiat): 


(IF ()}= [| 


FF (e)= FU dle)= le «1307 
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Nous n'avons pas précisé les bornes: elles sont infinies dans chaque définition (nous intégrons sur tous les 
& our possibles). 


OIC.Q.F.D. 


Voyons maintenant deux propriétés intéressantes de la transformée de Fourier: 


P1. Si f est paire, il vient une simplification de la transformée telle que: 


FUNDS TE [ 706 a a- |] F0 "a a+ [sos je a 


l 
er S Ï (te = 


+ . . 
= _|- {ro | r(oe sa). El fe ia + Trona) (11.308) 
Eli Ï (| 


Li ot —iot _27T 
- HOIC +6 jt = = HO 


P2. Si f est impaire, nous procédons de la même manière que ci-dessus et nous obtenons: 


. + 
FUGX@)=- TE | HO sn (art (ao 
(el 


P3. Propriété très importante des transformées de Fourier qui nous sera utile en finance (cf chapitre 
d'Economie) et également dans le cadre de l'étude de l'équation de la chaleur (cf chapitre de 
Thermodynamique). 


Rappelons d'abord que la transformée de Fourier est donnée par: 
Lt + at 
F(FO)(@) = F(@) = —= | fe "at (1310) 
27 a 
Nous souhaitons voir ce qu'il se passe si: 


Fia,f()i= Fe dé (11311) 


us [ à 

2x : 
00 

En faisant une intégration par parties (cf chapitre de Calcul Différentiel Et Intégral): 


b b 
[SO 20-10 208 -[ 0 80 ais) 


il vient: 
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1; —i@f 


Fiê F0) = 


1 jf C0 1 + : —ÿ ot 
7° OS os À (pat 


(11.313) 


| 


+0 
d 7 
io | et (pt =io F Troc tk Lt =i@F(@) 
27 Le Fr 
où nous nous sommes mis dans la situation avec: 
lim f(£)= 0 3 
er (11.314) 


Donc: 
F(d;.f()\=i@F(@) (11315) 


De manière générale: 


Fi f@i=tiæe"F(æ) (11316) 


Remarque: La branche de "l'analyse harmonique", ou "analyse de Fourier 2D", est la branche des 
mathématiques qui étudie la représentation des fonctions ou des signaux comme superposition d'ondes 
de base. Elle approfondit et généralise les notions de série de Fourier et de transformée de Fourier. Les 
ondes de base s'appellent les harmoniques, d'où le nom de la discipline. Durant ces deux derniers 
siècles, elle a eu de nombreuses applications en physique et en économie sous le nom "d'analyse 
spectrale", et connaît des applications récentes notamment en traitement des signaux, mécanique 
quantique, neurosciences, stratigraphie, statistiques. 


% Exemples: 


El. Voyons donc un exemple (parmi les deux fondamentaux) d'une transformée de Fourier que nous 
retrouvons en physique quantique aussi bien qu'en optique ondulatoire. 


Nous allons calculer la transformée de Fourier de la fonction suivante: 


a: d 


2 2 


Figure: 11.18 - Fonction dont nous souhaitons calculer la TF 


Nous avons donc: 
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Fe +0 
F(F0)= = | 0e ae [ joe fa = [ joe Far 


-a12 -a12 F2Rf dde (1.317) 
__ À f[ -isfa _ infa hf i-afe)_ iafa)) _ À ai 
: 2x7 | Br! ang (2 sin (6) 
sin(xfa) 


où sinc est le sinus cardinal. Nous retombons donc sur le sinus cardinal (si nous prenons le module au 
carré) de la décomposition d'une onde monochromatique diffractée par une fente rectangulaire. Ainsi, il 
semble possible d'étudier les phénomènes de diffraction en utilisant la transformée de Fourier et ce 
domaine se nomme "l'optique de Fourier". 


F2. La transformée de Fourier d'une fonction intégrable f est donnée par: 


1 7 . 
F(o)=— | fe a (1318) 


2x _, 


Considérons la fonction intégrable de type Gaussienne: 


2 
ft@=e # (1319) 
avec a > 0 défini sur R. 
Nous voulons calculer sa transformée de Fourier car il s'agit d'un cas très important et en particulier utile 
pour la résolution de l'équation de la chaleur que nous traiterons dans le chapitre de Thermodynamique et 


pour résoudre l'équation différentielle de Black-Scholes dans le chapitre d'Économie. 


L'astuce géniale, si nous voulons éviter de faire de l'analyse complexe sur 3 pages A4, consiste à 
remarquer que F(&) est solution de l'équation différentielle linéaire suivante: 


æ 
Y'(B)+—Y7=0 (11.320) 
24 


où y est une fonction de ®. 


En effet en dérivant F(&) nous obtenons: 


+ +0 
d ] “lat d O1 [ -æ? d ct 
F'(@) = £ — —— — dt 
@ de fox * Fe ”d@ =) dæ 
(11.321) 
id ©. 1 + L | 
= | € af° [ite A | = —— | | —é Sn” 
2 27 
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Une intégration par parties nous donne: 


2 
or ti ., -af 1 ot je Tr. jet | ie 
F{a)=—— | 6e" | * |dt= | AuE - [ira] dt 
27 27 2a - 2a 
UT (11.322) 
_æ 1 PE 1 Te “at y, 
2a J27 * _ 2a fox : 


On reconnaît l'expression de la transformée de Fourier de f. Par conséquent: 
æ 
F'(@)=-— F(æ) (11323) 
24 


Ceci montre que F(&) est bien solution de l'équation différentielle ci-dessus. 


Nous avons démontré dans le chapitre de Calcul Différentiel et Intégral que la solution générale de cette 
équation différentielle est donnée par: 


y= 4e %@) (11.324) 
où Ae IR. Et comme dans le cas présent: 
æ 
gÉx)=— (11.325) 


La primitive G(x) est donc facile à calculer et il vient: 


E … 
y = e Fr (11.326) 
Par conséquent: 
" 
F(@) = 4e 4 (11.327) 


Pour déterminer la constante À il suffit de remarquer que: 


F(0)= —| T a 0 2 1 et y 2 1 F ; 
=—— |e e Ê=—— |e É=——>,]— = —— (11328) 
27 re 2x : 2x Na a 


et donc: 
. 


F(@) = Tee (11.329) 
(e: 


Il est alors d'usage de dire que la transformation de Fourier d'une Gaussienne est une autre Gaussienne. 
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2.6. SÉRIES DE BESSEL 


Les fonctions de Bessel sont très utiles dans de nombreux domaines de pointe de la physique faisant 
intervenir des équations différentielles délicates à résoudre. Les domaines dans lesquels nous les trouvons 
le plus souvent sont la calorimétrie (conduction de la chaleur), la physique nucléaire (physique de 
réacteurs), et la mécanique des fluides. 


Ces séries sont cependant très peu détaillées dans les écoles universitaires et il est souvent du rôle de 
l'élève de chercher les compléments d'informations dont il a besoin sur le sujet dans la bibliothèque de son 
école. Nous avons voulu présenter ici les développements permettant d'éviter cette démarche tout en 
restant chez soi devant son ordinateur (de plus les livres sur le sujet sont assez rares...). 


Remarque: Nous parlons habituellement par abus de langage des "fonctions de Bessel" au lieu des 
"séries de Bessel". 


Il existe une quantité non négligeable de fonctions de Bessel maïs nous allons nous restreindre à l'étude de 
celles qui sont les plus utilisées en physique. 


2.6.1. FONCTION DE BESSEL D'ORDRE ZÉRO 


La fonction connue sous le nom de "fonction de Bessel d'ordre zéro", est définie par la série de 
puissances: 


x x x 


13 52. 21.42.61 L 


C'est lors de l'étude des propriétés de dérivation et d'intégration que Bessel a trouvé que cette série de 
puissance est une solution à une équation différentielle que l'on retrouve assez fréquemment en physique. 
C'est pourquoi elle porte son nom. 


Si 4, représente le r-ème terme de la série, nous voyons aisément que: 


r+l — 


=—— (11331) 
u,  (2r) 


qui tend vers zéro quand ” — ® , quelle que soit la valeur de x. Cela a pour conséquence que la série 
converge pour toutes les valeurs de x. Comme il s'agit d'une série de puissance positive, la fonction 
J,(x) et toutes ses dérivées sont continues pour toutes valeurs de x, réelles ou complexes. 


2.6.2. FONCTION DE BESSEL D'ORDRE N 


La fonction J, (x), connue sous le nom de "fonction de Bessel d'ordre n", est définie, lorsque n est un 
entier positif, par la série de puissance: 


(11 229 
(11:3552) 


x” | x? x° | 
SE  __ _ _. 
07 al 2.(2n#+2) 2.4(2n+2)(2n+4) 


qui converge pour toutes valeurs de x, réelles ou complexes. 
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lat 


Figure: 11.19 - Tracé de quelques fonctions de Bessel 


et dans Microsoft Excel 11.8346 ou Maple 4.00b la fonction précédente se trouve sous le nom BESSELJ. 
Par exemple pour obtenir le graphique précédent dans Maple, il suffit d'écrire: 


> plot([BesselJ(0,x),BesselJ(1,x),BesselJ(2,x),BesselJ(3,x)],x-0..20); 


Voyons qu'en particulier, pour x = 1 nous avons: 


: r x 
ANS" 32-3427 Lu 
BE dd Put deb: Ù 
et quand # = 2: 
2 4 6 8 
(à = = ee = +. Ul 4) 


314 46 be Dee 2.810 


Nous pouvons noter que f, (x) est une fonction paire de x quand n est pair, et impaire quand n est impair 
(cf. chapitre d'Analyse Fonctionnelle). 


En dérivant la fonction J, (x) et en comparant le résultat avec la série J,(x) , nous voyons sans trop de 
peine que: 


a) _ 


—$, 11.335 
D 1x) (11.335) 


Nous trouvons également sans trop de difficulté, la relation suivante: 
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Là (x) = x JG (x) (11.336) 
dx 


En utilisant le fait que: 


Han, =} (x) (1337 


et en l'incluant dans la précédente relation, nous trouvons: 


d [ dix) 
—|x——— | +xf, (x) = 0 (411338 
a ra 0€ } ( ) 


ou écrit autrement: 


2 
4 Ji (x) +2 +xf(x) = 0 (11.339) 
x 


dx° 
y = Jifx) est donc une solution de l'équation différentielle du second ordre: 


d { à 
— oc (11.340) 
dx 


ou écrit autrement: 


2 
327 7, D 4m =0 (11.341) 
dx" dx 
Ou Encore: 
2 
27,18,,-0 (11.342) 
dx x dx 


Une solution à une équation de Bessel de paramètre n qui n'est pas un multiple de f,(x) est appelée 
"fonction de Bessel du second type". Supposons que u soit une telle fonction et posons v = J,(x) ; alors 
d'après la relation: 


29 4 dy +xy =0 (11.343) 
dx? dx 
nous avons: 
xu"+u'+zxu = 0 et xv"+v'+zxv=0 (11.344) 
En multipliant la première relation par v et la seconde par u et après soustraction, nous obtenons: 


xGu"v-uv")+u'v-uv'=0Q (11345) 


nous avons donc également: 
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d 
pl v-uv'=u"v+u'v'-u'v'-uv"=u"v-uv" (11.346) 
Æ 


nous pouvons donc écrire: 
d pe 
—[xfu'v-uv}]=0 (11347 
dx 

effectivement car si nous développons, nous trouvons: 


d 

—[xu'v-uv)]= lu 'v+ zu "v+xm'v'=l'uv'- xu'v'- xuv" 
dx (11.348) 
= xfu"v+u'v'-u'v'-uv")+u'v-uv'= x(u"v-uv")+u'v-uv'=0 


Pour que l'égalité: 
CET 
—[xfu'v-uvi]=0 (11349) 
dx 


soit satisfaite, nous avons: 


En divisant par xy°, nous avons: 


u'v-uy' BE 
— ©" — (11351) 


v° xv° 
ce qui est équivalent à: 
d (u B _—. 
—|-|=— (1352) 
dx\v] 2m 


de suite, par intégration il vient: 


où À est une constante. Consécutivement nous avons, puisque v = f(x) : 
u = AJ (x) + BJ, (x) L dx 
_ SN Fr 11.354 
0 0 E T3 (x) ( ) 


où rappelons-le, A et B sont des constantes, et 8 # 0 si u n'est pas un multiple de J, (x) par définition. 


Si dans la dernière relation, J,(x} est remplacé par son expression en termes de série nous avons: 
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Pour ceux qui veulent vérifier cette dernière relation (je n'aime pas ce genre de calculs algébriques) avec 
Maple 4.00b il suffit d'écrire: 


>1/x*taylor(1/(series(BesselJ(0,x),x))"2,x=0,5); 


Dès lors: 
l ae | à 
J dx=J l À — + — +. 
frs flat PE Te | 
2 2 4 
x FF 
= l += + + — +. (11.356) 
pa to | 7 I 128 | 
x 3x 
= J (1 À — — — +. 
o(log() + 
consécutivement si nous posons: 
2 4 
SE: : 
Fr) = Jo (mn) log(x) +— -— +...) (11.357) 
a (x) = Jj(x)log(x) PTT | 


où (x) est une fonction de Bessel particulière du second type appelée "fonction de Bessel-Neumann du 
second type d'ordre nul". 


Identiquement au fait que J, (x) — 1 quand x — 0, l'expression F,(x) à cause du terme log(x) quand x 


est petit tend vers (x) — -æ quand x — +0. 


Finalement, il vient de ce que nous avons vu précédemment que J,(x) et (x) sont des solutions 
indépendantes de l'équation différentielle: 


2 
dy,læ, 


= 358 
dx? x dx TNA 


La solution générale étant donc: 
= AJ (x)+ BK (x) (11359) 
où A,B sont des constantes arbitraires et x > 0 afin que f(x) soit réel. 
Si nous remplaçons x par kx, où k est une constante, l'équation différentielle devient: 


2 
lady, 1 +y = 0 
k° dx? x kdx (11.360) 


en multipliant le tout par &?, nous trouvons la forme générale de l'équation différentielle: 


d'y 14 
+ +2 = 0! (11.361) 
dx“ xdx 
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dont la solution générale est: 


y» = A (æ)+ BP] (1362) 


où & > O afin que F,(&x) soit réel quand x >» 0. 


Au fait, les fonctions de Bessel viennent des solutions de l'équation différentielle étudiée précédemment et 
solutionnées par la méthode de Frobenius. Posons: 


d? 
Ly (ere) (11.363) 


et faisons la substitution: 
ÿ = x +o xl +cxft +025 Ts (364) 
en substituant dans Ly, nous obtenons: 
Ly = p°x%1+(0+1) a xf +[(0+ 22e +1]x 4 +[C0+3/e + 24. (11365) 


Choisissons maintenant les £, afin de satisfaire l'équation différentielle tels que: 


(e +1) =0 

ON PE 
FE EE (11.366) 
(e+3) a +a =0 


Dès lors, à moins que © soit un entier négatif, nous avons: 


neue. 0 
1 
+2 
te ) (11.367) 
C2 l 


#7 (p+47 (o+2(o+4ÿ 


En substituant ces valeurs dans la relation: 
Y = x +e xt +cx/ + 03x19 +. (11.368) 


nous obtenons: 


X X 


2 4 


(11.369) 


dès lors: 
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2 
T4 D + = Ep = 6x9 (11370) 
dx? dx 


si nous posons © = Ü dans l'avant-dernière relation, nous obtenons: 


2 4 2 4 
rome Pr SE (11.371) 


2.6.3. ÉQUATION DIFFÉRENTIELLE DE BESSEL D'ORDRE N 


Nous avons défini les séries de Bessel comme étant: 


2 4 


J ne QE  _ _——. 
2 Dal 2C@n+2 2.40@n+202n+4) | 


Posons: 


PAR 4 
y = JG Rte x 2-(2n+2) 2-4(2n+2)(2n +4) ON 


et dérivons ainsi: 


2 +2 2 +4 
sc)" #-@+t2 x, (+4) x 1354 
ee 


2-(2n+2) 2-4(2nx+2)2n +4) : 
Mais nous avons aussi: 


2 .x+1 2. n+4 
1375 
FPT Ont) 24ai20aid 


Par soustraction: 


x 
x? y = 7 4 = x y (11376) 
= : 


Ce qui donne finalement: 


— O0 (11.377 
rSfx$ a] x )y=0 ( ) 


Ce qui s'écrit également: 


d° d 
4 Es +:® = 0 -#)y=0 (11.378) 
qui est appelée "l'équation différentielle de Bessel d'ordre n" ou plus simplement "équation de Bessel". 
Au fait, la plupart des écoles ou sites Internet donnent cette équation différentielle comme une définition 
et pourtant il est clair qu'il y a un raisonnement rigoureux derrière cette équation. 
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La solution est donc du type: 


y=2nlJ, (x) (11.379) 
ce qui s'écrit encore parfois en utilisant la fonction gamma d'Euler: 
pe? Pit) J, (x) = ei A (x) (11.380) 
Il s'ensuit que: 


PA, 4, 


dé. dE +(x°-#°)J, (0 = 0 (11381) 


et donc que y = J, (x) est solution de cette équation différentielle. 


3. CRITÈRES DE CONVERGENCE 


Lorsque nous étudions une série, l'une des questions fondamentales est celle de la convergence ou de la 
divergence de cette série. 


Si une série converge, son terme général tend vers zéro lorsque n tend vers l'infini: 


lim a, =0 (1138) 


Ce critère est nécessaire mais non suffisant pour établir la convergence d'une série. Par contre, si ce critère 
n'est pas rempli, on est absolument sûr que la série ne converge pas (donc elle diverge!). 


Trois méthodes sont proposées pour approfondir le critère de convergence: 
1. Le test de l'intégrale 
2. La règle d'Alembert 
3. La règle de Cauchy 


Dans les paragraphes suivants, nous admettrons des séries à termes positifs. Le cas de la série alternée 
sera vu ultérieurement. 


3.1. TEST DE L'INTÉGRALE 
Soit la série à termes positifs décroissants: 

dtaætat..t+ta, +... (11.383) 
c'est-à-dire: 

d 24 242..24, 2. (11384) 
et soit une fonction continue décroissante telle que: 


JD=a.f(2)=2...f(n)=a, (11385) 
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nous pouvons alors affirmer que: 


1. Si l'intégrale: 
Fe (11.386) 


converge, la série converge également. 


2. Si l'intégrale: 
[er (11.387) 
diverge, la série diverge également. 


Remarque: En aucun cas l'intégrale ne donne la valeur de la somme de la série ! Le test de l'intégrale 
donne simplement une indication sur la convergence de la série. Avant de faire le test de l'intégrale, il 
est important de vérifier que les termes de la série soient strictement décroissants afin de remplir la 
condition 4 24, 24 2.24, 2... 


3.2. RÈGLE D'ALEMBERT 
Si dans une série à termes positifs: 


td tat..t+ta, +... (11.388) 


le rapport &, 4 /&, (assimilable à une fonction prise en son entier) a une limite finie L lorsque # — ® : 


ds 
L=lim (11.389) 
&, 


1. Si Z < 1, la série converge 

2. Si Z >1, la série diverge 

3. Si Z = 1 on ne peut rien dire 

et nous définissons le "rayon de convergence" comme: 
R=1/2Z (11390) 

3.3. RÈGLE DE CAUCHY 

Si dans une série à termes positifs: 


td tat..t+ta, +... (11391) 


la quantité ta, a une limite finie L lorsque # — ® telle que: 
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avec à nouveau les mêmes considérations que pour la règle d'Alembert: 
1. Si Z < 1, la série converge 

2. Si Z >1, la série diverge 

3. Si Z = 1 on ne peut rien dire 

3.4. THÉOREME DE LEIBNIZ 


Nous avons considéré jusqu'à présent des séries à termes positifs. Nous allons considérer dans cette partie 
des séries dont les termes sont alternés, c'est-à-dire des séries de la forme: 


a data at. (a, > 0) (11.393) 


Définition: Une série est dite "série alternée" si deux termes consécutifs de cette série sont de signe 
contraire. 


Si dans une série alternée les termes en valeur absolue vont en décroissant: 
A 74} D...) ?.… (11.394) 
et si: 


lima, =0 (11305) 
#0 


alors la série converge, sa somme est positive et n'est pas supérieure au premier terme. 


Si S est la somme de la série et #, une somme partielle, alors: 


[S-S [<a (1396) 


Remarque: Il est important de vérifier que les valeurs absolues des termes de la série soient strictement 
décroissantes afin de remplir la condition précédente. 


3.5. CONVERGENCE ABSOLUE 


Définition: Une série à termes variables est dite absolument convergente si la série formée avec la valeur 
absolue de ses termes converge: 


a t-al+a +l-al+..+l-a,l+. (a, >0) «1397 


Si une série alternée de termes est absolument convergente, la série absolue qui en découle converge 
aussi. 


Nous pouvons généraliser la règle d'Alembert au cas des séries à termes quelconques: 
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atæatata,t.ta +. (a, >0) (11.398) 


Ainsi, le rapport leu / a, | a une limite finie L lorsque pour # — ® nous avons: 


Aus 


y 


Z=lim 


*—w 


(11.399) 


toujours avec les mêmes conclusions que pour la règle d'Alembert normale. 


3.6. THÉOREME DU POINT FIXE 


Le théorème du point fixe n'est pas vraiment utile en physique (implicitement il est indispensable mais les 
physiciens utilisent souvent des outils mathématiques dont les propriétés ont déjà été validées au préalable 
par des mathématiciens), cependant nous le retrouvons en théorie du chaos (les vortex, tourbillons, etc...) 
ainsi qu'en informatique théorique (voir chapitre traitant des fractales en particulier le triangle de 
Sierpinski). Nous ne saurions donc que recommander au lecteur de prendre le temps de lire et de 
comprendre les explications et développements qui vont suivre. 


Soit (X,d), un espace métrique complet (cf chapitre de Topologie ou des Fractales) et soit TX — X une 
application strictement contractante de constante L (voir les fonctions lipschitziennes chapitre de 
Topologie), alors il existe un unique point & € À tel que : 

F(æ)=@ (11400) 


& est alors dit le "point fixe" de T (penser par exemple à cos(x}=x ). De plus si nous notons par: 


TX) = TT. T(x)..)) 
x fois 


(11.401) 
l'image de x par le n-ème itéré de T, nous avons alors: 
æ=lim(T"(x)) VxeX (11402) 
X—v 


et la vitesse de convergence peut d'ailleurs être estimée par: 


1=5 


d(æ, T'(x)) £ d(x, T(x)) (11403) 


Remarque: Vous pouvez vous amuser avec votre calculatrice de poche ou celle de votre système 
d'exploitation en choississant un nombre au hasard et en en prenant le cosinus de manière itérative. 
Vous verrez que vous tendrez 0.74 et donc que in extenso il s'agit de la solution de cos(x}=x. 


Démonstration: 


Soit x e À. Nous considérons la suite (T"(x)},. définie comme ci-dessus. Nous allons d'abord montrer 


que cette suite est une suite de Cauchy (voir plus haut dans le présent chapitre ce qu'est une suite de 
Cauchy). 
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En appliquant l'inégalité triangulaire (cf. chapitre d'Analyse Vectorielle) plusieurs fois nous avons: 


ACTE (x), T2) SET), TT (2) + TA), TE GR) + + (TE (x), T'(x) 
(11.404) 


AT (2), T'(x)) £ L'd(T" (x), TU x)) << EL d(T(x),x) (11.405) 
donc: 


AT (x), TC) LP 4 PR 4 EE) (TX), x) = LP dTG), 2) (+ L+ +. +1") 


et Q+L+ Pa apps LE Re AT PCT EN < : 
1-2 1-2 1-2 
(11.406) 


:d(T(x), x) (+) 


pour finir: 


O£Z<1— lim — =0 (11407) 


#0 | — 


c'est-à-dire que dans un premier temps (T"(x)),. est bien une suite de Cauchy. 
(X,d) étant un espace complet nous avons que (T*(x)},.# converge, et nous posons: 
æ=limT"(x) (11.408) 
X— 0 


A présent, nous vérifions que & est bien un point fixe de T. En effet T est uniformément continue (car 
lipschitzienne - voir le chapitre de Topologie) donc à fortiori continue ainsi: 


< ce 
car T est contmue 


æ =lim 7*{x) = lim TT" (x)) Tim T° (x)) = T(@) (11.409) 


Il reste à vérifier que ®& est l'unique point fixe (du coup nous aurons démontré que # ne dépend pas du 
choix de x). Supposons que nous ayons aussi T{y) = y alors: 


d(y,®)= d(T{y), T(@))< L'd(y,æ)— d(y,æ) =0=}y=@ (11410) 


Une estimation de la vitesse de convergence est donnée par: 


d(T'Y (x), T' (2) < _ 


‘“d(T(x),x) (1411) 


d(,) est continue par rapport à chacune des variables donc: 
lim AT" (x), T°) = di T0, TG) = d(@,T'(D) (1412) 


et les limites préservent les inégalités (non strictes) donc: 
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d(æ,T"(x)) < _. d(T(x),x) (11.413) 


OIC.Q.FD. 
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Notes personnelles: 
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12. CALCUL VECTORIEL 


L. calcul vectoriel ou "analyse vectorielle" est une branche des mathématiques qui étudie les 


champs de scalaires et de vecteurs suffisamment réguliers des espaces euclidiens (voir définition plus 
loin). 


L'importance du calcul vectoriel provient de son utilisation intensive en physique et dans les sciences 
de l'ingénieur. C'est de ce point de vue que nous le présenterons, et c'est pourquoi nous nous limiterons 
le plus souvent au cas de l'espace usuel à trois dimensions. Dans ce cadre, un champ de vecteurs 
associe à chaque point de l'espace un vecteur (à trois composantes réelles), tandis qu'un champ de 
scalaires y associe un réel. 


Remarque: Imaginons par exemple l'eau d'un lac. La donnée de sa température en chaque point 
forme un champ de scalaires, celle de sa vitesse en chaque point, un champ de vecteurs (voir 
définition plus loin). 


Des notions physiques telles que la force ou la vitesse sont caractérisées par une direction, un sens et 
une intensité. Ce triple caractère est mis en évidence par les flèches. Celles-ci sont à l'origine de la 
notion de vecteur et en constituent l'exemple le plus suggestif. Bien que leur nature soit essentiellement 
géométrique, c'est leur aptitude à se lier les unes aux autres, donc leur comportement algébrique, qui 
retiendra principalement notre attention. Partagé en classes d'équivalence l'ensemble qu'elles forment 
représente le modèle classique d'un "espace vectoriel". Un de nos premiers objectifs est la description 
détaillée de ce modèle. 


Remarques: 


R1. Avant de lire ce qui va suivre, nous conseillons au lecteur d'avoir au moins parcouru en 
diagonale le chapitre traitant de la théorie des ensembles dans la section d'arithmétique. Nous y 
définissons ce qu'est un "espace vectoriel" en utilisant les outils de la théorie des ensembles. Ce 
concept bien que non absolument indispensable vaut la peine quand même de s'y attarder pour voir 
comment deux domaines des mathématiques s'imbriquent et aussi histoire. d'aborder les choses au 
moins un peu rigoureusement. 


R2. L'analyse vectorielle contient beaucoup de termes et de définitions qu'il faut apprendre par 
coeur. Ce travail est pénible mais malheureusement nécessaire. 


1. NOTION DE FLÈCHE 


Nous désignerons par U l'espace ordinaire de la géométrie élémentaire et par P, Q, … ses points. Nous 
appellerons "flèche" tout segment de droite orienté (dans l'espace). 


La flèche d'origine P et d'extrémité Q sera notée PO ou abrégée par une lettre unique (latine ou 
grecque) choisie arbitrairement telle que par exemple: F. 


Nous considérerons comme évident que toute flèche est caractérisée par sa direction, son sens (car 
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pour une direction donnée elle peut pointer dans deux sens), son intensité ou grandeur (longueur) et 
ainsi que son origine. 


2. ENSEMBLE DES VECTEURS 
Définitions: 


D1. Nous disons que deux flèches sont "équivalentes" si elles ont la même direction, le même sens et la 
même intensité. 


D2. Nous disons que deux flèches sont "colinéaires" si elles ont seulement la même direction. 


Partageons l'ensemble des flèches en classes d'équivalence: deux flèches appartiennent à une même 
classe si et seulement si elles sont équivalentes. 


D3. Chaque classe d'équivalence de flèches constitue un "vecteur" ou plus exactement un "vecteur 
libre" car son origine n'est pas prise en compte (dans le cas où son origine est bien définie, nous avons 


z 


alors un "vecteur lié"). 


Rangeons, en outre, les flèches dégénérées (c'est-à-dire de la forme F5) en une classe distinguée que 
nous appellerons "vecteur nul" et noterons à qui ont une direction et un sens non définis. et 
d'intensité nulle. 


L'ensemble des vecteurs sera lui désigné par V. Il faut souligner que les éléments de V sont des classes 
de flèches et non pas des flèches individuelles. Il est cependant clair qu'une flèche quelconque suffit à 
déterminer la classe à laquelle elle appartient et il est donc naturel de l'appeler "représentant de la 
classe" du vecteur. 


Traçons le représentant d'un vecteur ÿ à partir de l'extrémité d'un représentant d'un vecteur * . La 
flèche dont l'origine est celle du représentant de x et l'extrémité celle du représentant de ÿ détermine 
un vecteur que nous noterons * + ÿ . L'opération qui associe à tout couple de vecteurs leur somme 
s'appelle "addition vectorielle". 


as 


TT + 


Figure: 12.1 - Exemple d'un somme de deux vecteurs 


A l'aide d'une figure, il est facile de montrer que l'opération d'addition vectorielle est associative et 
commutative, autrement dit, que: 


et: 


Il est en outre évident que le vecteur nul ÿ est l'élément neutre de l'addition vectorielle, autrement dit, 
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où —x désigne le vecteur opposé de x, c'est-à-dire le vecteur dont les représentants ont la même 
direction et la même intensité que ceux de x, mais le sens opposé. Deux vecteurs dont la somme est 
nulle sont alors appelés "vecteurs opposés" puisque la seule chose qui les différencie est leur sens... 


Il s'ensuit aussi que si deux ou plusieurs vecteurs ont la même direction, la même intensité et le même 
sens alors ce sont des "vecteur égaux". 


L'opération inverse de l'addition vectorielle est la soustraction vectorielle. Soustraire un vecteur revient 
à additionner le vecteur opposé. 


Remarques: 


R1. L'addition s'étend, par récurrence, au cas d'une famille finie quelconque de vecteurs. En vertu 
de l'associativité, ces additions successives peuvent être effectuées dans n'importe quel ordre, ce qui 
justifie l'écriture sans parenthèses. 


R2. La multiplication entre deux vecteurs est un concept qui n'existe pas. Par contre, comme nous 
le verrons un peu plus loin, nous pouvons multiplier les vecteurs par certaines propriétés d'autres 
vecteurs que nous appelons la "norme" et encore d'autres petites choses. 


2.1. PSEUDO-VECTEURS 


En physique, lors de l'énoncé de ce que nous appelons le "principe de Curie", les physiciens font 
mention de ce qu'ils appellent des "pseudo-vecteurs". Il s'agit du vocabulaire simple pour parler de 
quelque chose de tout aussi trivial mais fondamentalement peu de gens en font vraiment usage. Mais il 
peut quand même être utile de présenter de quoi il s'agit. 


Au fait, vecteurs et pseudo-vecteurs se transforment de la même manière dans une rotation ou une 
translation (nous verrons plus tard dans ce chapitre comment effectuer mathématiquement ces 
transformations). Il n'en est pas de même dans la symétrie par rapport à un plan ou à un point. Dans ces 
transformations nous avons par définition les propriétés suivantes: 


P1. Un vecteur est transformé en son symétrique. 
P2. Un pseudo-vecteur est transformé en l'opposé de son symétrique. 


Voici une figure avec des exemples types (le choix des lettres représentant les vecteurs n'est pas dû au 
hasard; elles sont un clin d'oeil aux propriétés des champs électriques et magnétiques étudiés dans la 
section d'Électromagnétisme du site): 
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par rapport à un plan par symétrie par rapport à un plan 
Figure: 12.2 - Différences de transformations entre un vecteur et un pseudo-vecteur 


Ben voilà... c'est tout sur les pseudo-vecteurs... 


2.2. MULTIPLICATION PAR UN SCALAIRE 


1! 


Le vecteur æ:x appelé "produit du nombre & par x", est défini de la manière suivante: 


Prenons une flèche représentative de x et construisons un flèche de même direction, de même sens ou 
de sens opposé, suivant que & est positif ou négatif, et d'intensité [el fois l'intensité de la flèche 


initiale; la flèche ainsi obtenue est un représentant du vecteur &:X ; si æ& = 0 ou x = (, nous posons 


æ'x=0. 


L'opération qui consiste à effectuer le produit d'un nombre par un vecteur est appelé "multiplication par 
un scalaire". 


Nous vérifions aisément que la multiplication par un scalaire est associative et distributive par rapport à 
l'addition numérique vectorielle, autrement dit que: 


Ho iri= ler Dir 
(&@+ B)°x=@œ'xt+É'X (124) 
aix+yi=ax+aÿy 

Voyons de suite un exemple concret mondialement connu des vecteurs: 


2.2.1. RÈGLE DE TROIS 


Revenons un peu sur la "règle de trois" (appelée parfois "règles des rapports et proportions" ou encore 
"méthode de réduction à l'unité") souvent définie dans les petites classes de manière intuitive mais sans 
démonstration digne de ce nom. Cette règle est certainement l'algorithme le plus usité de par le monde 
qui sert à identifier un quatrième nombre quand trois sont donnés et que les quatre nombres sont 


linéairement dépendants. 
La règle de trois est dérivée sous deux versions: 
V1. Simple et directe si les grandeurs sont directement proportionnelles 


V2. Simple et inverse si les grandeurs sont inversement proportionnelles 
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et lorsque deux variables X et Y sont proportionnelles nous le notons: 


XæœF (125) 


Supposons maintenant que X puisse prendre les valeurs x,,x,. Y prendra les valeurs linéairement 


dépendantes y,,y, alors le rapport proportionnel suivant: 


A LD 2 


x di 


(12.6) 


est dit "rapport simple et direct". 
Démonstration: 


Soient deux vecteurs À = (,,x,),Ÿ = (m,,y,) colinéaires et donc proportionnels à un facteur près tels 
que: 


X-#Y<s ue ie =À wn 
1 
OIC.Q.F.D. 


Remarque: Si ce rapport n'est pas égal, alors il faut passer à l'utilisation d'autres outils tels que la 
régression et in extenso l'extrapolation. 


- Le rapport proportionnel suivant: 


est dit "rapport simple et inverse". 
Démonstration: 


Soient deux vecteurs À = (x,,x,),Ÿ = (m,y,) colinéaires et donc proportionnels à un facteur près tel 
que: 


X-#e À = y =px ©1721 (12.9) 
1 A M 


OIC.Q.F.D. 


Remarque: Si ce rapport n'est pas égal, alors il faut passer à la régression linéaire (cf. chapitre de 
Méthodes Numériques). 


En gros, il suffit que nous connaissions trois variables sur les quatre pour résoudre cette simple équation 
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du premier degré. 


Les conversions de monnaies ou d'unités de mesure se font à l'aide de la règle de trois simple directe ou 
indirecte. Les calculs de parités (calcul prévisionnel fait par un importateur d'un certain pays ayant ses 
propres unités de mesures et de monnaie, qui recherche parmi plusieurs offres étrangères (dans des 
systèmes d'unités de mesures et de monnaies qui diffèrent de l'importateur), laquelle est la plus 
avantageuse ou inversement) se font également avec la règle de trois. 


Remarque: Nous appelons également "règle conjointe simple ou inverse", une série de règles de 
trois directes ou indirectes. 


Dans de tels calculs, les agents du marché d'échange ont remarqué que la plupart du temps, les rapports 
étaient des valeurs proches de l'unité. Ils ont été ainsi naturellement amenés à définir "le pourcentage" 
comme étant la proportion d'une quantité ou d'une grandeur par rapport à une autre, évaluée à la 
centaine (en général du moins … ): 


Soit un nombre xe IR alors sa notation en pourcentage sera: 
x'% = x'100 (12.10) 
Soit un nombre ze IR alors sa notation en pour-mille sera: 
x" =x'1000 (12.11) 
3. ESPACES VECTORIELS 


Définition: Nous appelons "espace vectoriel" un ensemble E d'éléments désignés par X,ÿ.,.. et appelés 
"vecteurs", muni d'une "structure algébrique vectorielle" définie par la donnée de l'addition 
(soustraction) vectorielle et la multiplication par un scalaire. Ces deux opérations satisfaisant les lois 
d'associativité, de commutativité, de distributivité, d'élément neutre et d'opposé comme nous l'avons 
déjà vu dans le chapitre de Théorie Des Ensembles. 


Pour plus d'informations sur ce qu'est un espace vectoriel dans le sens "ensembliste" le lecteur devra se 
reporter au chapitre de Théorie Des Ensembles où ce concept est défini avec plus de rigueur. 


Remarque: Muni de ces deux opérations, un espace vectoriel est dit "vectorialisé". 


Pour tout entier positif n, " désignera l'ensemble des n-uplets de nombres disposés en colonne: 


d 
3 
. (12.12) 
dy 


et R* est à l'évidence munie d'une structure d'espace vectoriel. Les vecteurs de cet espace seront 


appelés "vecteurs-colonne". Ils seront souvent désignés plus brièvement par: 
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ou encore plus simplement par: 
(&) (2.14) 
Le nombre 4, est parfois appelé "terme" ou "composante d'indice i" de (&) ; 


3.1. COMBINAISONS LINÉAIRES 


Dorénavant, sauf mention explicite du contraire, les vecteurs seront les éléments d'un espace vectoriel 
E. 


Définition: Nous appelons "combinaison linéaire" des vecteurs %,%,,...,X%, tout vecteur de la forme: 
GA + x +... +@x (12.15) 
où&,%,...,&, Sont des nombres appelés "coefficients de la combinaison linéaire”. 


Le vecteur nul est combinaison linéaire de & % +&,%, +...+ 4,2%, avec tous les coefficients égaux à 


zéro. Nous parlons dès lors de "combinaison linéaire triviale". 


Définition: Nous appelons "combinaison convexe", toute combinaison linéaire dont les coefficients 
sont non négatifs et de somme égale à 1. L'ensemble des combinaisons convexes de deux points P et Q 
d'un espace ponctuel À, (ayant une origine) est le segment de droite P et Q. Pour s'en rendre compte, il 


suffit d'écrire: 
aP+(l-@0=0+P-0) (1216) 
de faire varier & de 0 à 1 et de constater que tous les points du segment sont ainsi obtenus. 


Si le vecteur x est combinaison linéaire des vecteurs %,%,,...,%, et chacun de ces vecteurs est 


combinaison linéaire des vecteurs ÿ,,ÿ,,...,ÿ,, alors * est combinaison linéaire de 5,,ÿ,,..., 7. 


3.2: SOUS ESPACES VECTORIELS 


Définition: Nous appelons "sous-espace vectoriel de FE" tout sous-ensemble de E qui est lui-même un 
espace vectoriel pour les opérations d'addition et de multiplication par un scalaire définies dans E. 


Un sous-espace vectoriel, en tant qu'espace vectoriel, ne peut être vide puisqu'il comprend au moins un 
vecteur, à savoir son vecteur nul, celui-ci étant d'ailleurs forcément le vecteur nul de E. En outre, en 
même temps que les vecteurs * et ÿ (s'il en contient d'autres que le vecteur nul), il comprend 
également toutes leurs combinaisons linéaires &x + 6ÿ. 


Inversement, nous voyons aussitôt que tout sous-ensemble jouissant de ces propriétés est un 
sous-espace vectoriel. Nous avons ainsi établi la proposition suivante: 


Un sous ensemble S de E est un sous-espace vectoriel de E si et seulement si S est non vide et &x + 8ÿ 
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3.3. FAMILLES GÉNÉRATRICES 


Il en découle que si nous avons une famille de vecteurs (A x, roma] l'ensemble des combinaisons 
linéaires de %,%,,...,X, peut être un sous-espace vectoriel S de E, plus précisément le plus petit 


sous-espace vectoriel de E comprenant %,%,,...,X4. 


Les vecteurs %,%,....,X%, qui satisfont à la condition ci-dessus sont appelés "générateurs" de S et la 
famille (x, % Peer À , famille génératrice de S. Nous disons aussi que ces vecteurs ou cette famille 


engendrent S. 


Remarque: Le sous-espace vectoriel engendré par un vecteur non nul est formé de tous les 
multiples de ce vecteur. Nous appelons un tel sous-espace "droite vectorielle". Un sous-espace 
vectoriel engendré par deux vecteurs non multiples l'un de l'autre est appelé "plan vectoriel". 


3.4, DÉPENDANCES ET INDÉPENDANCES LINÉAIRES 


Ce qui va suivre est très important en physique: nous conseillons donc au futur physicien de prendre 
vraiment le temps de bien lire les développements. 


Si &,,8,,8, sont trois vecteurs de j* dont les représentants ne sont pas parallèles à un même plan (par 
convention une flèche d'intensité nulle est parallèle à tout plan), alors tout vecteur x de j* peut 
s'écrire de manière unique sous la forme: 


X=œe te, +@e& (12.17) 


où &,&,,@, € IR sont des nombres. 


ae, 


Figure: 12.3 - Exemple d'un construction d'un vecteur dans un espace à trois dimensions 


En particulier, la seule possibilité d'obtenir le vecteur nul comme combinaison linéaire de &,,8,,8, est 


d'attribuer la valeur triviale 0 à & ,&,,&,. 
Réciproquement, si pour trois vecteurs &,,8,,8, de j/* la relation: 


= qe te, +8, = 0 (12.18) 
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implique & =&, = &, = 0, aucun des vecteurs ne peut être combinaison linéaire des deux autres, 


autrement dit, leurs représentants ne sont pas parallèles à un même plan. 


Sur la base de ces observations, nous allons étendre la notion d'absence de parallélisme à un même plan 
au cas d'un nombre quelconque de vecteurs d'un espace vectoriel E. 


Nous disons que les vecteurs %,%,,.., x, sont "linéairement indépendants" si la relation: 
Ge + Me +... + ue, = 0 (12.19) 


implique nécessairement & =&, =. = &, = 0, autrement dit, si la combinaison linéaire triviale est la 
seule combinaison linéaire de %,%,,..,X, qui soit nulle. Dans le cas contraire, nous disons que les 


es 


vecteurs %,X%2,., x, SOnt "linéairement dépendants". 


Si l'attention est fixée sur la famille (%,,%,...,X,) plutôt que sur les termes dont elle est constituée, nous 
disons que celle-ci est une "famille libre" ou "famille liée" suivant que les vecteurs x%,%;,,.,x, sont 
linéairement indépendants ou dépendants. 


3.5. BASES D'UN ESPACE VECTORIEL 


Définition: Nous disons qu'une famille finie de vecteurs est une base de E si et seulement si: 
1. Elle est libre. 
2. Elle engendre E. 


D'après cette définition, toute famille libre %,%,...,X, est une base du sous-espace vectoriel qu'elle 
engendre. 


® Exemple: 


Si nous considérons € comme IR -espace vectoriel (cf. chapitre de Théorie des Ensembles), alors 
puisque tous les éléments de € s'écrivent 4 +: , les éléments qui engendrent € sont 1 et i (les deux 
sont libres). 


Une base de € (qui est de dimension 2) comme IF -espace vectoriel est donc la famille finie libre {1,i}. 


Pour qu'une famille de vecteurs (& ,8,,...,8,) soit une base de E, il faut et il suffit donc que tout vecteur 
x de E s'exprime de manière unique sous la forme d'une combinaison linéaire des vecteurs &,,8, ,...,8, : 
& 


(12.20) 


X = Hé TX +. TX, 


La relation ci-dessus est une décomposition de * suivant la base (3 ,8,,...,8,) où les coefficients 
%, 23, 2%, SONt les composantes de 7 dans cette base. En présence d'une base, tout vecteur est donc 
entièrement déterminé par ses composantes. 


Proposition: 


Si x,,x,,..,x, Sont les composantes de x et »,,y,...,y, celles de ÿ , alors: 
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À T Mis A9 Ÿ Vases An FT Yy (2.21) 
sont les composantes de x + ÿ. 
En d'autres termes, additionner deux vecteurs revient à additionner leurs composantes et multiplier un 


vecteur par un scalaire revient évidemment à multiplier ses composantes par ce même scalaire. La base 
est donc un outil important car elle permet d'effectuer les opérations sur les vecteurs au moyen 


d'opérations sur les nombres. 
1)\{0 0 
011 0 
LE LUE 2:22) 
0J(0 l 


forment un base que nous appelons "base canonique" de jg* (nous travaillerons dans les espaces 
complexes dans un autre chapitre). 


Exemple: 


Les vecteurs-colonnes de jp* : 


Remarque: Dans le cadre de l'espace à trois dimensions, les bases sont très souvent assimilées à un 
trièdre (effectivement si vous reliez les extrémités des trois vecteurs par des traits vous obtiendrez 
un trièdre imaginaire). 


3.0. ANGLES DIRECTEURS 


Il est clair qu'un seul angle ne peut décrire la direction d'un vecteur dans l'espace. Nous utilisons alors la 
notion "d'angles directeurs". Il s'agit de mesurer l'angle du vecteur } par rapport à chacun des axes 


positifs de la base: 


Figure: 12.4 - Représentation des agnles directeurs 
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Si: 


… 


Ü = (t,M3,%3) = 1 F1 +4 ‘i+t ‘& (12.23) 
alors: 
ü = IE ]cos(é,) 


Ua = IE]cos(8,) (12.24) 

us = JE ]cos(é,) 
Les valeurs: 

cos(&,),cos(8,),cos(&) (12.25) 

sont appelées les "cosinus directeurs" de ÿ}. 
Les 3 angles mentionnés ne sont pas complètement indépendants. En effet, 2 suffisent pour déterminer 
complètement la direction d'un vecteur dans l'espace, le troisième pouvant se déduire de la relation 
suivante (obtenue à partir du calcul de la norme du vecteur, concept que nous verrons un peu plus loin): 


cos” (8,) + cos*(8,) + cos” (&)=1 (12.26) 


De plus, les cosinus directeurs sont les composantes scalaires d'un vecteur de norme unitaire # ayant la 
même direction que j}: 


| 


= à =(cos(8,),cos(8,),cos(&)) (12.27) 


C3} 


3.7. DIMENSIONS D'UN ESPACE VECTORIEL 


Nous disons que E est de "dimension finie" s'il est engendré par une famille finie de vecteurs. Dans le 
cas contraire, nous disons que E est de "dimension infinie" (nous aborderons ce type d'espaces dans un 
autre chapitre). Tout espace vectoriel de dimension finie et non réduit au vecteur nul admet une base. 
En fait, de toute famille génératrice d'un tel espace nous pouvons extraire une base. 


La dimension d'un espace vectoriel est notée: 
dim(E) (12.28) 


Tout espace vectoriel E de dimension finie non nulle n peut être mis en correspondance biunivoque 
(c'est-à-dire en bijection) avec 1p*. Il suffit de choisir une base de E et de faire correspondre à tout 
vecteur x de E le vecteur-colonne dont les termes sont les composantes de x dans la base choisie 
(c'est du blabla de mathématicien mais ce sera utile quand nous aborderons des espaces plus 
complexes): 


Page: 907/4839 


[v3.0 - 2013] 


E R* 
À 

= x _ 
ZX. 


Cette correspondance conserve les opérations d'addition et de multiplication par un scalaire que nous 
avons déjà vues; en d'autres termes, elle permet d'effectuer les opérations sur les vecteurs par des 
opérations sur les nombres. 


Remarque: Nous disons alors que E et jp* sont "isomorphes" ou que la correspondance est un 
isomorphisme (cf. chapitre de Théorie Des Ensembles). 


3.8. PROLONGEMENT D'UNE FAMILLE LIBRE 


Soit {X,x....,x.) une famille libre et {w,,v,,...,v, ) une famille génératrice de E. Si (%,,%,,..,x,) n'est 
1° #2 k De EE” 1° #2 k 
pas une base de E, nous pouvons extraire une sous-famille (%,,%,,...,v,) de (m,,v,...,v,) de telle 


manière que la famille (%,,%,,...,%4,Vh,V;2,..,V4) Soit une base de E. 


Remarque: Une telle étude a son utilité lors de passage d'espace mathématique ayant des propriétés 
données à un autre espace ayant des propriétés mathématiques différentes. 


Démonstration: 


H1. Nous supposons qu'au moins un des vecteurs Y, n'est pas combinaison linéaire des vecteurs 
F2. 4, SinON (%,%,..., X,) engendrerait E et serait donc une base possible de E. Notons ce vecteur 


Ÿ,,. La famille (%,%,,...,%,,v,) est alors une famille libre. En effet, la relation: 
an +..+ ax + Ava =0 (12.30) 


implique alors tout d'abord que & = 0 , autrement ÿ;, serait combinaison linéaire des vecteurs 
À, 2%, %,, et ensuite & =... = &, = Ü, puisque les vecteurs %,%,,...,X, sont linéairement 


indépendants. 


Si la famille (%,,%,,...,X%,,V,) engendre E, elle est une base possible de E et le théorème est démontré. 
Dans le cas contraire, le même raisonnement nous assure l'existence d'un autre vecteur ÿ;, ….. Si la 
nouvelle famille en découlant n'est pas une base de F, alors le procédé d'extraction de vecteurs ÿ, de 
(%,ÿ,,..,v,) se poursuit. Lorsqu'il s'arrête, nous aurons obtenu un "prolongement" de (%,,%,,...,X%,) en 
une famille libre engendrant E, c'est-à-dire une base de E. 


OIC.Q.F.D. 


Il en retourne un corollaire: Tout espace vectoriel de dimension finie et non réduit au vecteur nul admet 
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une base. En fait, de toute famille génératrice d'un tel espace, nous pouvons donc extraire une base. 


3.9. RANG D'UNE FAMILLE FINIE 


Définition: Nous appelons "rang d'une famille" de vecteurs la dimension du sous-espace vectoriel de E 
qu'elle engendre. 


Montrons que le rang d'une famille de vecteurs (%,%,,...,x,) est inférieur ou égal à k et qu'il est égal à 
k si et seulement si cette famille est libre. 


Démonstration: 


Ecartons d'abord le cas trivial où le rang de la famille (%,%,,...,%,) est nul. D'après le corollaire vu 


précédemment, nous pouvons alors extraire de cette famille une base du sous-espace vectoriel qu'elle 
engendre. Le rang est donc inférieur ou égal à k suivant que (%,,%,,...,%,) est une famille liée ou non. 


OIC.Q.F.D. 


3.10. SOMMES DIRECTES 


Définition: Nous disons que la somme S+T de deux sous-espaces vectoriels S et T de E (cas particulier 
appliqué à un espace de dimensions 2 !) est une "somme directe" si: 


SnT={0} (1231) 


Dans ce cas, nous la notons: 


En d'autres termes, la somme de deux sous-espaces vectoriels S et T de E est directe si la 
décomposition de tout élément de S+T' en somme d'un élément de S et d'un élément de T est unique. 


Ce concept de décomposition trivial va nous être très utile dans certains théorèmes dont le plus 
important sur ce site est certainement le théorème spectral (cf. chapitre d'Algeèbre Linéaire), 


De la somme directe nous pouvons introduire la notion de "sous-espace complémentaire" appelé encore 
"sous-espace supplémentaire" (selon les pays...): 


Supposons que E soit de dimension finie. Pour tout sous-espace vectoriel S de E, il existe un 
sous-espace vectoriel T (non unique) de E tel que E soit somme directe de S et T. Nous disons alors que 
Test un "sous-espace complémentaire" de S dans E. 


Démonstration: 


Ecartons d'abord les cas triviaux où $ = {0} et S=E. Le sous-espace vectoriel S admet une base 
(&,8,..,8,), où & est inférieur à la dimension n de E. Par le théorème du prolongement d'une famille 
libre, cette base peut se prolonger en une base (4 ,...,8,,8,,,...,8,) de E. Soit T le sous-espace vectoriel 
engendré par la famille (&,,,,...,8,). Si X est un vecteur quelconque de E, alors + = 5 +£,où Sest un 


vecteur de S et ; un vecteur de T. En outre, ST = {0} car aucun vecteur, excepté le vecteur nul, ne 
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peut être combinaison linéaire des vecteurs &,,...,8, et des vecteurs &,,,,...,8,. Nous en concluons donc 


que: 


OIC.Q.F.D. 


4. ESPACE AFFINE 


L'espace G de la géométrie élémentaire est à la fois usuel et la source de la notion "d'espace affine" que 
nous allons introduire. 


NS 


Cet espace G est associé à "l'espace vectoriel" géométrique V par la correspondance entre flèches et 
vecteurs étudiés jusqu'ici! La définition suivante ne fait que mettre en évidence les traits dominants de 
cette correspondance: 


Définition: Soit U un ensemble non vide d'éléments que nous appellerons "points" et désignerons par 
les lettres P, Q, … ; soit en outre E un espace vectoriel. Supposons qu'à tout couple de points (P,Q) 
corresponde un vecteur noté PQ. Nous disons alors que U est un "espace affine" d'espace directeur 


(ou dit simplement abusivement de "direction") E si les conditions suivantes sont satisfaites: 


C1. Pour tout point P fixé, la correspondance entre couples (P,Q) et vecteurs x est biunivoque, 
autrement dit, pour tout vecteur x il existe un point Q et un seul tel que x = PQ. 


C2. Pour tout triplet de points (P,Q,R): 
PO+OR=EPR (1234) 
C'est la fameuse "relation de Chasles"- 


C3. Si P est un point et x un vecteur, pour exprimer que Q est l'unique point tel que x = PQ, nous 


écrivons: 
Ê=P+X (1235) 


Bien qu'un peu abusive, cette écriture est conforme à l'usage et suggère bien le sens de l'opération 
qu'elle désigne. 


Les propriétés suivantes découlent directement de la définition d'espace affine: 
PL P+(r+m = (P+Try 


P2. Pour tout point P, pp = ÿ. Cela résulte de la condition PO +QR = PR dans le cas où nous avons 
P=Q0=R. 


P3. PQ = -QP. Il suffit de poser R=P dans la relation de Chasles PO +QR = PR. 


P4. Règle du parallélogramme: 
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Soit le polygone de sommets (dans le sens des aiguilles d'une montre) P, F'0".Q et arêtes 
PP',P'Q0',00' PQ: 


# eà 


P (e) 


Figure: 12.5 - Polygone vectoriel 


Nous avons: 


si et seulement si: 


ce qui donnerait alors un parallélogramme! 

En effet, en remplaçant R par Q' dans la relation de Chasles il vient: 
PO+Q0'=PQ' (12.38) 

et en faisant de même mais en remplaçant R par Q' et Q par P' nous avons: 
PP'+P'Q'= PQ (12.39) 

Nous avons alors en égalisant ces deux dernières relations: 

PO+Q00'= PP'4+P'Q' (12.40) 
ce qui force l'égalité susmentionnée que nous voulions démontrer. 


Précédemment, nous avons vu ce qui faisait qu'un espace G pouvait être muni d'une structure d'espace 
vectoriel (nous avons vu que nous disons que ce dernier était dès lors "vectorialisé"). Dans le cas 
général d'un espace affine U, le procédé est le même: 


Nous choisissons un point quelconque O de U. La correspondance entre couples (©, F} et vecteurs de 
l'espace directeur étant alors biunivoque nous définissons l'addition de points et la multiplication d'un 
point par un scalaire par les opérations correspondantes sur les vecteurs de E. Muni de ces deux 
opérations, U devient un espace vectoriel, appelé "vectorialisé de U relativement à O". Nous 


désignerons cet espace par L/, et appellerons O "l'origine". 


Vu la manière dont les opérations ont été définies, il résulte que £#, est isomorphe à l'espace directeur 
E; 
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U, F 
P=aO+rIexz 
Toutefois, cet isomorphisme dépend du choix de l'origine O et en pratique cette origine est choisie sur 


base de données inhérentes aux problèmes posés. Par exemple, si une transformation affine admet un 
point invariant (qui ne bouge pas), il y a avantage à choisir ce point comme origine. 


Remarques: 


R1. Lorsque nous parlons de dimension d'un espace affine, nous parlons de la dimension de son 
espace directeur. 


R2. L'espace G de la géométrie élémentaire est un espace affine. En effet, sa direction est l'espace 
géométrique V et les conditions de définition d'un espace affine sont satisfaites. Il faut bien noter 
qu'au couple de points (P,@) est associé le vecteur PO et non pas la flèche PQ. En fait, la flèche 
pouvant être identifiée au couple de points, nous voyons que ce que postule la définition d'un 
espace affine n'est rien d'autre qu'une forme abstraite de correspondance entre flèches et vecteurs. 


R3. Tout espace vectoriel E peut être considéré comme un espace affine de direction E lui-même si 
au couple de vecteurs (*,ÿ) est associé le vecteur ÿ - X. En effet, les conditions de définition d'un 
espace affine sont dès lors satisfaites. 


5. ESPACES VECTORIELS EUCLIDIENS 


Avant de définir ce qu'est un espace vectoriel euclidien, nous allons au préalable définir quelques outils 
mathématiques et quelques concepts. 


Nous pouvons, en choisissant une unité de longueur, mesurer l'intensité de chaque flèche, autrement dit, 
déterminer sa longueur. Nous pouvons aussi mesurer l'écart angulaire de deux flèches (ou vecteurs) 
quelconques d'origine commune (non nécessairement distinctes) en prenant comme unité de mesure 
d'angle par exemple le radian. La mesure de cet écart est alors un nombre compris entre 0 et 7, appelé 
"angle" des deux flèches. Si les deux flèches ont même direction et même sens, leur angle est nul et si 
elles ont même direction et sens opposé, ce même angle est x. 


Les flèches représentatives d'un même vecteur x ont toutes la même longueur. Nous désignerons cette 
longueur par la notation: 


il 


et l'appellerons "norme" de x. Il est clair que la longueur d'un vecteur est nulle si et seulement si sa 
norme est nulle. Nous dirons qu'un vecteur est unitaire si sa norme est 1. 


Si x est un vecteur non nul: 
TL 
IF 


est un vecteur unitaire colinéaire (nécessairement...) à x dont la norme est égale à l'unité et que nous 


—Xx 
Fr 
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notons #. 


Nous appellerons "angle des vecteurs non nuls" * et ÿ l'angle de deux flèches d'origine commune 
représentant l'une x et l'autre ÿ. 


Plus rigoureusement cependant une "norme" sur un espace vectoriel réel (ou complexe) E est une 
application | |: Æ —1IR* vérifiant les propriétés : 


P1. Positivité: 
vVre£ fx|20 «24 
P2. Linéarité: 
VieR,vre£ |4%|-|4||*| «245 
P3. Nullité: 
vVre£E |fl-0æx-0 (1246) 
P4. Inégalité de Minkowski (inégalité triangulaire): 


vrÿez |*+»|<fx|+l5] 229 


Remarques: 


R1.Ces propriétés sont principalement imposées par notre approche intuitive de l'espace euclidien 
(espace vectoriel de dimension finie sur le corps des réels et muni d'un produit scalaire que nous 
verrons plus loin) et de son interprétation géométrique. 


R2. Nous démontrerons un peu plus loin la propriété P4 sous la dénomination "d'inégalité 
triangulaire" et nous ferons une étude un peu plus générale de cette inégalité sous la dénomination 
"d'inégalité de Minkowski" dans le chapitre de Topologie. 


9.1. PRODUIT SCALAIRE VECTORIEL 


Définition: Un "espace vectoriel euclidien", est un espace vectoriel (réel et de dimension finie pour les 
puristes) possédant une opération particulière, le "produit scalaire" que nous noterons (notation 
spécifique à ce site Internet) en ce qui concerne le cas particulier des vecteurs: 


Hess - +05 a249) 
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Remarques: 


R1. Nous trouvons dans certains ouvrages (pour information) la notation (x |ÿ} ou encore {x | ÿ} 


lors de la généralisation de cette définition comme nous le verrons un peu plus loin. 


R2. Le produit scalaire a une importance énorme dans l'ensemble du domaine des mathématiques et 
de la physique; ainsi nous le retrouvons dans le calcul différentiel et intégral (de par le produit 
scalaire fonctionnel), en topologie, en physique quantique, en analyse du signal etc. Il convient 
donc de bien comprendre ce qui va suivre. 


R3. Le produit scalaire peut être vu comme une projection de la longueur d'un vecteur sur la 
longueur d'un autre. 


Ce produit scalaire possède les propriétés suivantes (dont la plupart découlent de la définition même du 
produit scalaire) dans un espace euclidien: 


P1. Commutativité: Xoÿ = ÿox 
P2. Associativité: &{x 0 y) = (&@x)o y = Xo(æÿy) 


P3. Distributivité: Xo(y +7) =xoy+xoZ 


Qt 


P4. Si foÿ=0:vVr#0—ÿ- 
P5. fxf=Xox et 07 > 0 si +40 
P6. (ax + 8ÿ)o7 = a(xoz)+ B(ÿo7) 


Seule cette dernière propriété nécessite peut-être une démonstration (de plus un des résultats de la 
démonstration nous servira à démontrer une autre propriété très importante du produit scalaire): 


Démonstration: 


Soit: 
praj,x = |xlcos 8 : v| (12.49) 
pr] ‘ 


qui constitue la "projection orthogonale vectorielle" (le v en indice du proj signifiant "vectoriel") du 
vecteur x sur la normalisation à l'unité du vecteur ÿ. 


A l'aide du produit scalaire, le vecteur praj,X peut être exprimé autrement il suffit de prendre la 


relation que nous avons vue plus haut: 


|Alylcos 8=x0yS& cos8 = —— (12.50) 


[x] 


Page: 914/4839 


[v3.0 - 2013] 


et de l'introduire dans praj,x avec les vecteurs adéquats pour obtenir: 


praÿx = [lcosel L5|-pl 7] lle Fe se os 
FT API Pi CÉRTRET 


Cette expression vaut également dans le cas où x est nul, à condition d'admettre que la projection 
orthogonale du vecteur nul est nulle. 


La norme de pra x s'écrit: 
2re}, 


(12.52) 


_ oÿ xov 
Lori 2 = 9 - F2 


br WF 


Si ÿ est unitaire, les relations de projections précédentes se simplifient et deviennent: 


7 


proj,x = (Xov)v et |prai,x|| = = És op] ( 53 


Par des considérations géométriques élémentaires (distributivité du produit scalaire), il est facile de se 
rendre compte que: 


proji, (x + ÿ) = proj,x + praj,ÿ et proj,&x = &praj,X (12.54) 
Si nous revenons maintenant à la démonstration de: 
(ax + 6Bÿ)oZ = ixoZz)+ B(yoZ) (12.55) 
Nous avons donc dans un premier temps: 
proi, (@x + $ÿ) = praj,ax + praj,8y = &proj,x + Bpraj,ÿ (12.56) 


et, d'après la définition la propriété de la projection orthogonale, il vient alors immédiatement en faisant 
la correspondance terme à terme: 


praj, (ax + 8ÿ) = apraj,x + Éprai,ÿ 
ax + Bo. Toz ÿoz. (12.57) 
(æx 8y)°Z7 07, g9 07 


Tor Zoz ZoZ 


d'où la propriété P6 qui s'ensuit par multiplication des deux membres de l'égalité par 77 et après 
simplification par Z. 


OIC.Q.FD. 
Définitions: 
D1. L'espace vectoriel E est dit "espace vectoriel proprement euclidien" si Yxe Æ — [x] Al 


D2. Nous disons que les vecteurs * et ÿ sont des "vecteurs orthogonaux" s'ils sont non nuls et que leur 


produit scalaire est nul (leur angle est égal à x} 2 ). 
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Une base (3,8,,8,) de V est dite "base orthonormale" si les vecteurs &,,8,,4, sont orthogonaux deux à 


deux et unitaires (donc constituant une famille libre). 


Remarque: Nous verrons en calcul tensoriel (nous aurions pu le faire ici aussi mais bon...) comment 
à partir d'un ensemble de vecteurs indépendants construire une base orthogonale. C'est ce que le 
lecteur pourra trouver sous le nom de "méthode d'orthogonalisation de (Gram-)Schmidt". 


Par le raisonnement géométrique, nous voyons que tout vecteur est la somme de ses projections 
orthogonales sur les vecteurs d'une base orthonormale, autrement dit, si (&,8,,8,) est une base 


orthonormale: 
F=(Roâ)à +(Ro8,)à + (Ho) (1250 


Cette décomposition s'obtient également par la propriété de P6 du produit scalaire. En effet, x,,x,,x; 
étant les composantes de x : 


xoà = (na + 7282 +283) °& = À (& °&) + 2x (8 °A)+% (& °&) = À] (12.59) 
puisque &, 08, = 1 et &,08 = &,0& = 0 de même: 
Xoë8 = x et xX0o8 = x (12.60) 


d'où la décomposition. 


Soit x,%,,%; et M,)2,: les composantes respectives des vecteurs x et ÿ dans une base 


orthonormale canonique (&,8,,8,) nous pouvons écrire le produit scalaire sous la forme: 
20 = (an + 28 +248) 00e +282 +)3@) (12.61) 
de la propriété P6 du produit scalaire: 


x9ÿ = me 0 (8 +ÿ282 + ÿ38) + 2282 08 + Jaër +738) + 238, SOA8 + yo8 + J38:) 
(12.62) 


en utilisant la propriété P1 et à nouveau P6: 

x29ÿ= Aa + Ja t38)08 + ane te t38)08 + x 0e + 383 + 738,) 08; 
— 

L - a —  _. 2 
On ty tna)oa =rnacatya ca tag" [Ex | Th 

: L D _ on. | sd 
na +18 t8)08 = Me 08 + 738, 08, + J38, 082 © Va A = Ya 

E L . . ni . Lun 
na tr T8) 08 = Je 08 + Joe 08 te 08 = Ya [Es | =}: 

(12.63) 


Ce qui nous donne finalement la décomposition: 


20) = A} + 2V2 t %)3| (12.64) 
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qui constitue l'une des relations les plus importantes dans le domaine du calcul vectoriel et que nous 
appelons "produit scalaire canonique”. 


5.1.1. INÉGALITÉ DE CAUCHY-SCHWARZ 
La relation: 
(X+Po(f+ = #of+foÿ+ÿor+ÿoÿ=Xor+ÿoÿ+2Xoÿ (12.65) 


s'écrit également trivialement sous la forme suivante si nous utilisons la notion de norme et la définition 
du produit scalaire: 


(E+5)(2 +5) = [745 Al 5 +225 0266 


Il est intéressant de remarquer que si les deux vecteurs x et ÿ sont orthogonaux, nous retrouvons le 
résultat d'un théorème fameux: le théorème de Pythagore! 


Effectivement, dès lors nous avons si les deux vecteurs sont orthogonaux: 
Xoÿ=0 (12.67) 


Ce qui nous donne: 


|E+5f = If 4 OI (12.68) 


Cette relation est très importante en physique-mathématique. Il faut s'en souvenir ! 


Nous appelons également "inégalité de Cauchy-Schwarz" l'inégalité, valable pour tout choix des 
vecteurs * et ÿ, la relation: 


Frs IIbI] 026 


Ce qui s'écrit aussi: 
Eeÿf S(xox)-(yoÿ) (12.70) 


D'abord nous considérerons comme évident que l'égalité n'a lieu qu'en cas de colinéarité des deux 
vecteurs. 


Démonstration: 


Nous nous plaçons dans le cas où #,ÿ # Ü. Alors, pour YA € IR nous avons trivialement selon les 
propriétés du produit scalaire: 


(f+4ÿ)o(1+4ÿ)=%0x+24%0ÿ+4/ÿeÿ2>0 (1271) 
Il s'agit donc d'une simple équation du deuxième degré où la variable est 4. En se rappelant de ce que 


nous avons vu lors de notre étude des polynômes du deuxième degré (cf. chapitre de Calcul 
Algébrique) la relation précédente (le fait qu'elle soit toujours supérieure ou égale à zéro) est satisfaite 
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que si le discriminant 32 _ 4,- est négatif ou nul. En d'autres termes, si: 


4(#05) -4(fox)(ÿoÿ)<O (1272) 
Soit après simplification: 
(Reÿ) —(xox) (yo y) £<0 = (ieÿ) <(xox) (Fo) (12.73) 
OIC.Q.FD. 


Lorsque E est R*, l'inégalité de Cauchy-Schwarz s'écrit avec les composantes des vecteurs: 


S ab < Fe ae (12.74) 
il il 


Dans le cas particulier où #,h, = 1 elle devient: 


ou encore: 


ce qui montre que le carré de la moyenne arithmétique est inférieur ou égal à la moyenne arithmétique 
des carrés. Ce résultat est important pour l'étude des statistiques. 


Par ailleurs, en vertu de la propriété du cosinus et de l'inégalité de Cauchy-Schwarz nous pouvons 
écrire: 


Xo 
15 ÿ 1 (12.77 


AR 


relation que nous retrouvons également dans le cadre de l'étude des statistiques (cf. chapitre de 
Statistiques). 


5.1.2. INÉGALITÉ TRIANGULAIRE 


En majorant 2% ÿ par 2[x|||>|| (de par l'inégalité de Cauchy-Schwarz!) et en mettant ceci dans la 


relation établie déjà précédemment: 
le+5f ef +5 +255 0275 
Nous obtenons: 


+ RÉ PÉ + 21FI- (F1 150 6279 
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ce qui entraîne la fameuse "inégalité triangulaire" (très utile dans l'étude des suites et séries pour l'étude 
des convergences ainsi qu'en topologie): 


FR] 6200 


Remarque: La généralisation de cette inégalité relativement aux propriétés des normes telles que 
nous le verrons en topologie, donne ce que nous appelons "l'inégalité de Minkowski". 


En appliquant une fois l'inégalité triangulaire aux vecteurs x et (ÿ - x) et une autre fois aux vecteurs 


(*-ÿ) et ÿ nous obtenons la variante: 


IF ILS IA 51] 2.60 


5.1.3. PRODUIT SCALAIRE (GÉNÉRAL) 


Voyons maintenant une autre manière un peu plus générale (s'appliquant à des vecteurs ou fonctions), 
formelle et abstraite pour définir le produit scalaire tout en tentant de rester le plus simple 
possible (attention dans le cas général la notation du produit scalaire change!): 


Définition: Soit E un espace vectoriel réel (!). Une "forme bilinéaire symétrique positive" sur E, est une 
application: 


. — KR 
(12.82) 


Gr 5) 
qui vérifie (par définition!): 
P1. La positivité: 

VreE fx2)=(x|*)20eR* (1283) 
P2. La nullité (définie): 
VIEE fxx)=(%|*)=0—7-0 (12.84) 
P3. La symétrie : 
ver KEn-465,9e/4|5=-65/% (285) 

P4. La bilinéarité (forme bilinéaire) avec, dans l'ordre, la "linéarité à gauche" et la "linéarité à droite": 


(Ar+4ÿ 2) A |2)+4(5f2) 


A{%|2) 
Re i x (2:66) 
GlA4ÿ+42)- A4(|5)+4(7[2) 


VX, ÿ,2)e Æ°,V(A de R° | 
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Remarque: À nouveau, ces propriétés sont principalement imposées par notre approche intuitive de 
l'espace euclidien et de son interprétation géométrique. 


Définition: Un espace E muni d'un produit scalaire est appelé un "espace préhilbertien". Si E est de 
dimension finie, nous parlons alors "d'espace euclidien". 


Nous avons vu en topologie ( | e de gie) que les propriétés du produit scalaire sont les 
briques de bases pour définir une norme et donc une distance dans un espace métrique. Cette distance 
sera alors donnée selon ce que nous avons obtenu en topologie: 


vVijez d(x,ÿ}=|*-5| 


Définition: Nous disons qu'un espace E muni d'un produit scalaire { | } est un "espace Hilbertien" ou 


"espace de Hilbert" si cet espace est complet pour la métrique définie ci-dessus. 


En d'autres termes, avoir un espace métrique muni donc d'une distance générée par un produit scalaire 
est une chose. Ensuite, avoir une distance mesurable en est une autre. Un espace de Hilbert a donc des 
distances mesurables au sens topologique du terme car l'ensemble sur lequel on travaille est continu et 
n'importe quel point peut-être approché indéfiniment (imaginez avoir une règle et que vous ne puissiez 
pas avec cette règle approcher les points qui définissent les dimensions de votre objet... ce serait 
gênant). Donc sans espace complet une grande partie des théorèmes de l'analyse fonctionnelle ne 
pourraient pas être utilisés dans l'étude des espaces vectoriels et cela serait très gênant en physique 
quantique ondulatoire par exemple. 


Formellement, rappelons qu'un espace métrique est complet si toutes les suites de Cauchy ( 
ies) de cet espace sont convergentes (cf. s) dans un espace 
métrique (cf. « | pie). 


5.2. PRODUIT VECTORIEL 


Le produit vectoriel de deux vecteurs est une opération propre à la dimension 3. Pour l'introduire, il 
faut préalablement orienter l'espace destiné à le recevoir. L'orientation étant définie au moyen de la 
notion de "déterminant", nous commencerons par une brève introduction à l'étude de cette notion. 
Cette étude sera reprise plus tard dans le détail lors de l'analyse des systèmes linéaires dans le chapitre 
d'algèbre linéaire. 


Définition: Nous appelons "déterminant" des vecteurs-colonnes de 1? (pour la forme générale du 
déterminant se reporter au chapitre d'Algèbre Linéaire): 


(.}(e) 


et nous notons: 


le nombre (produit soustrait en croix): 
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Gb — Ab, (12.90) 


Nous appelons déterminant des vecteurs-colonnes de mg? (cf. chapitre d'Algèbre Linéaire): 
al{fälfa 
& |. l.lcl (291 
a] (8) 


G Pi Cal (12:92) 


et nous notons: 


&z C3 
le nombre: 
b, oc; h © h à 
ET 743 +& 
Bb, oc C3 b, €, (12.93) 


=ab,c tab + abc, - abc, - ac, abc 


Ainsi, la fonction qui associe à tout couple de vecteurs-colonnes de 1m? (à tout triplet de vecteurs- 
colonnes de 1p°) son déterminant est appelée "déterminant d'ordre 2" (respectivement d'ordre 3). 


Le déterminant a comme propriété d'être multiplié par -1 si l'un de ses vecteurs-colonnes est remplacé 
par son opposé ou si deux de ses vecteurs-colonnes sont échangés (la vérification étant simple nous 
nous abstiendrons de la démonstration, sauf sur demande). En plus, le déterminant est non nul si et 
seulement si ses vecteurs-colonnes sont linéairement indépendants (la démonstration se trouve quelques 
lignes plus bas et est d'une grande importance en mathématique). 


Définition: Soit x,,x,,x; et »,3,,y, les Composantes respectives des vecteurs x et ÿ dans la base 


orthonormale (3,8,,8,). Nous appelons "produit vectoriel" de * et ÿ, et nous notons indistinctement: 
XXÿY=XA) (12.94) 
le vecteur: 
CoYs 7 2))8 + Co 095) + Cada = 2M)S (12.95) 


ou sous forme de composantes: 


X3Y3 7 4} 
xXÿy=| zx» -x3; || (12.96) 
AY: — X2Y 
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Remarques: 


R1. La première notation est la notation internationale due à Gibbs (que nous utiliserons tout au 
long de ce site), la deuxième est la notation française due à Burali-Forti (assez embêtante car se 
confond avec l'opérateur ET en logique). 


R2. Il est assez embêtant de retenir par coeur les relations qui forment le produit vectoriel 
habituellement. Mais heureusement il existe au moins trois bons moyens mnémotechniques: 


1. Le plus rapide consiste à retrouver l'une des expressions des composantes du produit vectoriel et 
ensuite par décrémentation des indices (en recommençant à 3 lorsque qu'on arrive à 0) de connaître 
toutes les autres composantes. Encore faut-il trouver un moyen simple de se souvenir d'une des 
composantes. Un bon moyen est la propriété mathématique suivante de deux vecteurs colinéaires 
permettant facilement de retrouver la troisième composante (celle selon l'axe Z): 


Soit deux vecteurs colinéaires dans un même plan, alors: 


Nous retrouvons donc bien l'expression de la troisième composante du produit vectoriel de deux 
vecteurs (non nécessairement colinéaires. eux!). 


2. La seconde mais que nous verrons lors de notre étude du calcul tensoriel consiste à utiliser le 
symbole d'antisymétrie (également appelé "tenseur de Levi-Civita"). Cette méthode est 
certainement la plus esthétique d'entre toutes mais pas nécessairement la plus rapide à développer. 
Nous donnons ici juste l'expression sans plus d'explications pour l'instant (elle est également utile 
pour l'expression du déterminant par extension): 


ES 


(XXÿ), = Exx;Y, (12.98) 


3. Cette dernière méthode est assez simple et triviale aussi mais elle utilise implicitement la 
première méthode: la i-ème composante X* ÿ est le déterminant des deux colonnes privées de leur 


i-ème terme, le deuxième déterminant étant cependant pris avec le signe "-" tel que: 
=. = Pa Dale [A Pile [X Ml 
0 1 1 ci 1 ie (12.99) 
& Js 3%  }3 ä Ja 


Il est important, même si c'est relativement simple, de se rappeler que les différents produits vectoriels 
pour les vecteurs d'une base orthogonale sont: 


Le produit vectoriel jouit aussi propriétés suivantes que nous allons démontrer: 


P1. Antisymétrie: 
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XXÿ=-(ÿXX) (12.101) 
P2. Linéarité: 
(ax + BY)XZ = QxXZ) + B(YXZ) (12.102) 
P3. Si et seulement si * et ÿ sont linéairement indépendants (très important !): 
XXÿ#Ü (12.103) 
P4. Non associativité: 
XX(YXZ)#(XXY)XZ (12.104) 


Les deux premières propriétés découlent directement de la définition et la propriété P4 se vérifié 
aisément en développant les composantes et en comparant les résultats obtenus. 


Démontrons alors la troisième propriété qui est très importante en algèbre linéaire. 
Démonstration: 


Soient deux vecteurs X(x,x,,x;) et ÿ(»,2,3:). Siles deux vecteurs sont linéairement dépendants 
alors il existe & tel que nous puissions écrire: 


Si nous développons le produit vectoriel des deux vecteurs dépendants à un facteur & près, nous 
obtenons: 


XXÿ)=xxXar= (402% - 2an)e + (24m - 142)8 +(nAx - x AMm)e (12.106) 


Il va sans dire que le résultat ci-dessus est égal au vecteur nul ÿ si effectivement les deux vecteurs sont 
linéairement dépendants. 


OIC.Q.F.D. 


Si nous supposons maintenant que les deux vecteurs * et ÿ sont linéairement indépendants et non 
nuls, nous devons démontrer que le produit vectoriel est: 


P3.1. Orthogonal (perpendiculaire) à x et ÿ 
P3.2. De norme |x||lÿ|sin 8, où 8 est l'angle entre x et ÿ 
Démonstration: 


Commençons par la première propriété P3.1 (première importance en physique!): 
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x x y _. "3 
xe(xxy)=2|? *|-x art “ex x %l=0 (2107 
3 } & 3 % Ya NT 

3 3 3 


ce qui montre bien que le vecteur x est perpendiculaire au vecteur résultant du produit vectoriel entre 
xetÿl! 


OIC.Q.FD. 
Terminons avec la deuxième propriété P3.2 (aussi de première importance en physique!): 
Démonstration: 


Soit le carré de la norme du produit vectoriel |xx ÿf . D'après la définition du produit vectoriel nous 


avons: 


0 
|* x ÿ| = (Y3 7 432) + (M x) + (2 — 231) 
= (xt +2 + )OE +32 +35) (a + 292 +23) (12.108) 


= IA LÉ IR D cos 8 = IR (1-02 8) = Do sin? 9 


Donc finalement: 


FT Fr 2] 02 109 


OIC.Q.F.D. 


Nous remarquerons que dans le cas où E est l'espace vectoriel euclidien, la norme du produit vectoriel 
représente l'aire (surface) du parallélogramme construit sur des représentants x et ÿ d'origine 
commune. 


Figure: 12.6 - Représentation géométrique du produit vectoriel 


Si x et ÿ sont linéairement indépendants, le triplet (XX ÿ,X,ÿ) et donc aussi le triplet (X, ÿ, X *X ÿ) 
sont directs. 


En effet, (z,,z,,z,) étant les composantes de ** ÿ (dans la base (4 ,3,,8,)), le déterminant de passage 
de (4,8,,8,) à (XX y,X,ÿ) (par exemple) s'écrit: 
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A À À 

=2 +72 +7 (12.110 
Z2 % Jal=A tZ3+Z (12110) 
Z 4 Ya 


Ce déterminant est donc positif, puisqu'au moins un des z; n'est pas nul, d'après la troisième propriété 
d'indépendance linéaire du produit vectoriel. 


Voici encore quelques propriétés très importantes d'utilité pratique du produit vectoriel (en physique 
particulièrement) qui sont triviales à vérifier si les développements sont effectués (nous pouvons les 
faire sur demande si jamais!): 


P1. XX(ÿX2)=(Xo2)ÿ-(X0oÿ)7 


Remarque: Cette dernière relation est parfois appelée la "règle de Grassmann", ou plus couramment 
"double produit vectoriel" et il est important de noter que sans les parenthèses le résultat n'est pas 
unique. 


P2. (xx ÿ)o(zxv)=(roz)(ÿov)-(x0v)(ÿ0z) 
P3. (XXÿ)oZ =-(XXZloÿ 

P4. (xxÿ)oz=xo(yxz) 

PS. [Ex ÿf = (402) (po5) -(re5) 


5.3. PRODUIT MIXTE 


Nous pouvons étendre la définition du produit vectoriel à un autre type d'outil mathématique que nous 
appelons le "produit mixte": 


Définition: Nous appelons "produit mixte" des vecteurs X,ÿ,7 le double produit: 
Xo(yXZ) (12.111) 


souvent condensé sous la notation suivante: 


D'après ce que nous avons vu lors de la définition du produit scalaire et vectoriel , le produit mixte peut 
également s'écrire: 


elFxZlc0s8 «21 


Nous remarquerons que dans le cas où E est l'espace vectoriel euclidien 1g?, la valeur absolue du 
produit mixte symbole le volume (orienté) du parallélépipède, construit sur des représentants x,ÿ,7 
d'origine commune. 
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Remarque: Il est assez trivial que le produit mixte est une extension à 3 dimensions du produit 
vectoriel. Effectivement, dans l'expression du produire mixte, le produit vectoriel représente la 
surface de base du parallélépipède et le produit scalaire projette un des vecteurs sur le vecteur 
résultant du produit vectoriel ce qui donne la hauteur h du parallélépipède. 


De par les propriétés de commutativité du produit scalaire, nous avons: 
(xXÿ)oZ=Zo(xXY) (12.114) 


et le lecteur vérifiera sans aucune peine (nous le ferons s'il y a demande) en développant les 
composantes que: 


(XXÿ)joZ=Xo(YXZ) (12.115) 


Le produit mixte jouit également des propriétés que le lecteur ne devrait avoir aucun mal à vérifier en 
développant les composantes mis à part peut-être P3 qui découle des propriétés du produit scalaire et 
vectoriel (nous pouvons développer sur demande si jamais! ): 


P1. [29,271 =[2,X,y]=[ÿ,Z,x]= {ÿ,x,2]= -[Z,ÿ,x]- -[x,Z,ÿ] 
P2. [ax + 8ÿ,Z,v]= a&x,z,v]+ 4ÿy,7,v] 
P3.[%,y,7] # 0 si et seulement si *,ÿ,7 sont linéairement indépendants 


es 


P4. (XX ÿ)x(Zxv) =[2y,v] Z-[xÿ,Zl y 


Remarque: Nous reviendrons sur le produit mixte lors de notre étude du calcul tensoriel car il 
permet d'arriver à un résultat très intéressant en particulier en ce qui concerne la relativité générale! 


6. ESPACES VECTORIELS FONCTIONNELS 


Soit Ce l'ensemble des fonctions réelles k-fois dérivables dans l'intervalle fermé [4,2]. Nous 


désignerons les éléments de cet ensemble par les lettres FA £... 


La valeur de f au point t sera bien évidemment notée f(#). Dire que ÿ = 3 équivaudra donc à dire 
que: 


FO = gt), vtela.b] (2.116) 


De manière abrégée, nous écrirons f{f) = g(f), le signe = indiquant ainsi que les deux membres sont 
égaux pour tout t de l'intervalle [4,b]. 


Considérons les deux opérations suivantes: 
- F0 + &() définie par la formule (F + g)(e) = F(0 + 86) 


- æf définie par la formule (æ f}(#) = &f(é) 
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Ces deux opérations satisfont à toutes les conditions des vecteurs d'un espace vectoriel que nous avons 
déjà définies au début de ce chapitre (associativité, commutativité, vecteur nul, vecteur opposé, 
distributivité, élément neutre) et munissent donc (SH d'une structure d'espace vectoriel. Le vecteur 


nul de cet espace étant bien évidemment la fonction nulle et l'opposé de f étant la fonction - f. 


Il est intéressant de constater que #0 en tant qu'espace vectoriel est une généralisation de j* au cas 
continu. Nous pouvons en effet concevoir tout vecteur (4) de jg* sous la forme d'une fonction réelle 


définie dans l'ensemble {1,2,...,x} : la valeur de cette fonction au point i est tout simplement 4;. 


Remarque: Les polynômes de degré n et à une inconnue forment aussi un exemple d'espace 
vectoriel fonctionnel de dimension n+1 (à chaque coefficient du polynôme correspond une 
composante du vecteur). 


Le champ d'application privilégié de la théorie abstraite du produit scalaire est constitué par les espaces 
vectoriels fonctionnels. Nous appelons ainsi aussi produit scalaire canonique dans C7, 3, l'opération 


définie par la relation: 
es è _ 
Jogs= [FOEOd (12.117) 
2 


Cette opération définit bien un produit scalaire, les propriétés de ce dernier sont vérifiées et, en outre, 
l'intégrale: 


b 
fof= Fi =[FPo& aus 


est positive si la fonction continue f n'est pas identiquement nulle. 


7. ESPACES VECTORIELS HERMITIENS 


L'objectif de ce qui va suivre n'est pas de faire une étude détaillée du sujet des espaces vectoriels 
complexes mais juste de donner le bagage et le vocabulaire minimum nécessaire à l'étude de certaines 
théories physiques comme la physique quantique par exemple. 


Lorsque les scalaires qui apparaissent dans la définition de la notion d'espace vectoriel sont des 
nombres complexes (cf. chapitre sur les Nombres), et non plus des nombres réels, nous parlons alors 
"d'espaces vectoriels complexes". 


Remarque: Rigoureusement dans la communication courante, il devrait systématiquement être fait 
mention si nous parlons d'espace vectoriel réel ou d'espace vectoriel complexe... 


Citons quelques exemples d'espaces vectoriels complexes : 


E1. L'espace vectoriel ç* des vecteurs-colonnes à n termes complexes (q! étant identifié à €). Nous 
rencontrerons, entre autres, de tels vecteurs dans le chapitre de Physique Quantique Relativiste. 
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E2. L'espace vectoriel des polynômes à coefficients complexes en une indéterminée. Nous 
rencontrerons ce genre d'espaces dans les chapitres de Physique Quantique Ondulatoire ou encore de 
Chimie Quantique. 


E3. L'espace vectoriel des fonctions complexes d'une variable réelle ou complexe dérivables ou non. 
Nous rencontrerons ce genre d'espace très fréquemment dans la section de Mécanique globalement et 
surtout dans les chapitres d'Électrodynamique ou encore de Mécanique Ondulatoire. 


Il s'agit ici d'adapter ce que nous avons fait précédemment aux espaces vectoriels complexes. 
L'exemple suivant nous montre que nous ne pouvons pas transposer telles quelles les définitions 
précédentes. En effet, considérons l'espace vectoriel ç*. Comme pour ]R*, nous pourrions être tenté 
de définir un produit scalaire sur ç* par: 


ä } 
vrpeC",x-|:|5-| : |[={r|ÿ)=xm+.+xy, (12119) 
Xy Ya 


avec x;,y, € €. 


Malheureusement, nous nous apercevons que cette définition n'est pas satisfaisante car nous aurions 
alors: 


| *}= ï +..+x (12.120) 


et cette quantité n'est pas en général un nombre réel dans l'espace des complexes ce qui viole la 
propriété de positivité du produit scalaire et donc empêche d'introduire tout concept de distance. 


Nous ne pourrions donc plus définir une norme en posant |x| = , LE [*}. Pour que {x| 7} soit un 


nombre réel positif nous voyons qu'il faudrait plutôt définir le produit scalaire comme ceci : 
+ x DRE —— . Se 
VrjeC" (r|P)= nm +.+2m (12.121) 
Dans ce cas nous avons: 
… — — 2 Nm” 
{xl x\= HAT. +, 2 = | +... +x, | (12.122) 


qui est bien un nombre réel positif. A partir de là, nous pouvons à nouveau définir une norme sur 
l'espace vectoriel complexe ç* en posant: 


HENGHE Laf +.+lxf (12.123) 


Nous allons à présent montrer comment définir un produit scalaire sur un espace vectoriel complexe 
dans le cas général. 
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7.1. PRODUIT HERMITIEN 


Définition: Soit H un espace vectoriel complexe (!). Nous appelons "produit scalaire" ou plus 
exactement "produit hermitien" sur H, une application: 


.. SC 
(12.124) 


ER |) 
qui vérifie : 
P1. La positivité: 
VreH NE -{x|#}>20ERT (12.125) 
P2. Nullité (définie): 
Vie H @(r2)={x[#)-0x-0 (12126) 


P3. Symétrie hermitienne : 


vépez? =, e/flÿ)=-6l8 (2107 


P4. La bilinéarité (forme bilinéaire) change un peu aussi. ce qui fait que nous parlons alors de 
"sesquilinéarité". Nous parlons alors, dans l'ordre, d'anti-linéarité à gauche et de linéarité à droite tel 
que : 


vasnenvaneclrt#P)-AGEHAGR) 
(|A +42)= 46717) +4 (717) 


Remarques: 


R1. Certains mathématiciens mettent l'anti-linéarité à droite. C'est simplement une question de 
convention qui n'a aucune importance. 


R2. Le lecteur remarquera peut-être sans peine que si les éléments des définitions précédentes sont 
tous dans JR alors la sesquilinéarité se réduit à la bilinéarité et le caractère hermitien à la symétrie. 
Donc le produit hermitien se réduit au produit scalaire. 


R3. Nous souhaitons donner pour l'instant uniquement le minimum sur le vaste sujet que sont les 
espaces vectoriels complexes afin que le lecteur puisse lire sans trop de peine le début du chapitre 
de Physique Quantique Ondulatoire. 


Lorsque nous munissons un espace vectoriel complexe d'un produit scalaire alors au même titre qu'un 
espace vectoriel réel devient un espace vectoriel euclidien ou préhilbertien, l'espace vectoriel complexe 
devient donc ce que nous appelons un "espace vectoriel hermitien" (terme assez souvent utilisé dans le 
chapitre de Physique Quantique Ondulatoire). 
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Définition: Encore une fois, nous disons qu'un espace H muni d'un produit hermitien { | } est un 


"espace de Hilbert" si cet espace est complet pour la métrique définie ci-dessus. 


Ainsi, les espaces de Hilbert sont une généralisation comprenant les produits scalaires et produits 
hermitiens des espaces euclidiens, préhilbertiens et hermitiens. 


7.2: TYPES D'ESPACES VECTORIELS 


Pour résumer tout cela: 


- Nous appelons espace préhilbertien (réel ou complexe) tout espace vectoriel, de dimension finie ou 
non, muni d'un produit scalaire. 


- Nous appelons espace de Hilbert (réel ou complexe) tout espace préhilbertien complet (en tant 
qu'espace normé). 


- Nous appelons espace euclidien tout espace vectoriel réel de dimension finie muni d'un produit 
scalaire. 


- Nous appelons espace hermitien tout espace vectoriel complexe de dimension finie muni d'un produit 
scalaire. 


Nous savons que tout espace vectoriel (réel ou complexe) normé de dimension finie est complet. Ainsi, 
les espaces euclidiens et les espaces hermitiens sont des espaces de Hilbert (respectivement réels ou 
complexes). 


8. SYSTÈMES DE COORDONNÉES 


Nous allons aborder ici, l'aspect des changements de coordonnées des composantes de vecteurs non pas 
d'une base à une autre (pour cela il faut aller voir le chapitre d'Algèbre Linéaire) mais d'un système de 
coordonnées à un autre. Ce type de transformation a un fort potentiel en physique (ainsi qu'en 
mathématique) lorsque nous souhaitons simplifier l'étude de systèmes physiques dont les équations 
deviennent plus facilement manipulables dans d'autres systèmes de coordonnées. 


Définition: En mathématiques, un "système de coordonnées" permet de faire correspondre à chaque 
point d'un espace à n dimensions, un n-uplet de scalaires. 


Remarque: Dans beaucoup de cas, les scalaires considérés sont des nombres réels, mais il est 
PERD d'utiliser des nombres complexes ou des éléments d'un quelconque corps ( 

s). Plus généralement, les coordonnées peuvent provenir d'un anneau ou 
d'une autre structure algébrique apparentée. 


Bien que nous soyons dans un chapitre et une section de mathématiques du site, nous nous permettrons 
dans ce qui va suivre de faire une liaison directe avec la physique pour ce qui concerne les expressions 
de la vitesse et de l'accélération dans différents systèmes de coordonnées (désolé pour les matheux...) 
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8.1. SYSTÈME DE COORDONNÉES CARTÉSIENNES 


Nous ne souhaitons pas trop nous attarder sur ce système car il est bien connu de tout le monde 
habituellement. Rappelons cependant que la plupart du temps, en physique, les systèmes cartésiens 
dans lesquels nous travaillons sont pp? (deux dimensions spatiales), pp? (trois dimensions spatiales) voir 
‘ou ç* (trois dimensions spatiales et une temporelle) lorsque nous travaillons en relativité. 


Les systèmes cartésiens sont représentés par des vecteurs de base orthonormés (dans le sens qu'ils sont 
linéairement indépendants et de norme unité) qui forment une "base euclidienne" d'un espace vectoriel 
euclidien… 


Dans 1° (cas le plus fréquent), il y a trois vecteurs de base notés traditionnellement: 
8,,8,8 (12.129) 


Dans ce système, la position d'un point P (repérable par un vecteur 7 ) est définie par le triplet de 
nombres noté (en calcul tensoriel): 


(%,%,%) (12.130) 
et en physique plus conventionnellement: 
(x,Y,Z) (12.131) 


où habituellement la coordonnée (z) représente la hauteur (la verticale), la coordonnée (x) la largeur et 
la coordonnée (y) la longueur (évidemment ces choix sont complètement arbitraires). 


Ce point P peut être repéré par un vecteur noté arbitrairement x dans la base (3) par la relation 
(utilisant la notation tensorielle): 


En physique, si nous travaillons avec des coordonnées, c'est toujours pour pouvoir déterminer 
l'emplacement d'un élément. Or, comme nous le verrons plus rigoureusement en mécanique analytique, 
le physicien travaille avec les notions suivantes (chaque élément dépendant souvent du temps): 


- Position: 7 = {x{£}, y(£),Zz(£), €) 


ent 


- Vitesse: . =F=ÿ=(x(6),ÿ(),2(6),6) 
£ 


ete 


- Accélération: . =ÿ == (x), ÿ(O,Z7(6),6) 
£ 


Maintenant voyons comment s'expriment ces différentes notions dans des systèmes tels que les 
coordonnées sphériques, cylindriques et polaires. 
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8.2. SYSTÈME DE COORDONNÉES SPHÉRIQUES 


Le choix de commencer avec ce système de coordonnées n'est pas un hasard. Il a pour avantage d'être 
une généralisation des systèmes cylindrique et polaire dont nous retrouverons par la suite plus 
facilement les expressions de la position, de la vitesse et de l'accélération. 


Nous représentons traditionnellement un système à coordonnées sphériques de la façon suivante: 


Z 


Figure: 12.7 - Représentation du système de coordonnées sphériques 


Nous voyons très clairement si nous connaissons bien les relations trigonométriques élémentaires (voir 
le chapitre du même nom dans la section de géométrie) que nous avons les transformations: 


r= Jr +» +2,06r< 0 


ga = secos[£] Pre O0<8<xr 


et inversement: 
x=rsinêcos$ y=ran8sing z=rcos® (12.134) 


Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base sphérique que nous 


choisissons de noter &,,8,,8, avec les vecteurs de la base cartésienne 8, ,8,,8,. 


Nous avons, comme nous pouvons le voir sur le schéma ci-dessus: 
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8, = — = —————— 
Fr Fr Fr 
= sin #cos ge, +sin dsin #, +cos de, 
( sin cos Ÿ — sin Osin Ÿ 
- 8, Xe, l Le l . 
Ej=— = — O|x| sin 9sin # | =—- sin #cos 
sing sing sin 8 
1 cos 8 0 
, — sin # sin Ÿ ( 
= ( + sindgcos#|=-28 sin f+e cos 
sin sin 9 ns “ 9 
(el () 
-sin#) fanôcosf cos fcos 8 — Ü. sin sin Ÿ 
g =8xe, =| cosÿ |X| an8sing |=|0-san8cos#—(-sin#)cos 8 
(el cos # — sin Ÿ. sin D sin #—cos pain Pcos Ÿ 
cos cos 8 
= sin cos 4 = 8,cos@ cos #+8, cosOsing—e, sin 8 


— sin #- sin Dsin Ÿ#— cos pain cos Ÿ 


Indiquons qu'en divisant par sin 4 pour le deuxième vecteur de base, nous nous assurons ainsi de par 
les propriétés de la norme du produit vectoriel que: 


EA = (FE lsiné=1 «2136 


sera bien normalisé à l'unité! 


Remarque: Il est important de remarquer que le produit vectoriel de deux vecteurs de base donne 
toujours le troisième vecteur de base perpendiculaire (comme pour les coordonnées cartésiennes 
donc!). 


Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune de ces coordonnées: 
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de, 


ôr 


_ 


8, 


=28,cos#cos#+e cosôsin #6, sing =, 


e LL. . à … .  _ 
EP on 


de, de, L LL. L. L 
—=0— = 0 —=-2, cosf-e,sin #= -(e, sin +e, cos E) (12.137) 


ër ‘48 ‘ag 


— = 8, sin@cos-8,sin&sin#-8, cos 8 = -e, 
88 

de, : . : : 

—— = 8, cosbsang+e cosdcosf=e, cos ÿ 


(fr) 
Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation 4 
exprimée en coordonnées sphériques: 
”  _…  _ de, de de, 
dr = d(re,) = 2 dr + rde, = 8 dr + r| —dr + Tr 38+ Tr à 
ür 98 d® (12.138) 


= 8,dr +e,rd8 +e,r sin &d 


Pour exprimer la vitesse et l'accélération en coordonnées sphériques, nous aurons également besoin des 
dérivées par rapport au temps: 

s Où .. 06, 5. OM ; 223 à: 

CA Lp + + $= 8,0 +6,6sin 8 
êr 98 0$ 


ä es pe = 5 0 +8,cos 8 12.139 
+ 36 Sd ee 
. 6. 6. 


= Er) dal à. sin 0 +8, cos 8) $ 


Donc si nous faisons maintenant un peu de physique, nous avons: 


d, (r sin 8cos #) F sin 8cos #+r cos Ocos ÉÔ— r sin sin hŸ 


x 
v=r=|»l|=| 4, {(rsin8sng) |- F sin Osin #+r cos Osin #9 +r sin cos hP 
Z d, (r cos 8) cos 8 r sin 68 
sin cos Ÿ r cos êcos ÿ —r sin Ê sin Ÿ 
= | an ôsin$ |r+|rcos 8 sin 9+ r sin # cos $ (12.140) 
cos # —rsin ÿ () 
cos 8 cos Ÿ — sin Ÿ 
=8,r+r| cos sin 9+rsin 8 cos ÿ D=8,r+r860+r sin 6,6 
— sin 8 ( 
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ce qui nous amène donc à (nous aurons besoin de cette relation en astrophysique): 


v=7re, +e,r8 +8,rdsin 8 (12.141) 


Il est intéressant de remarquer que nous arrivons au même résultat en passant par la méthode suivante 
qui est peut-être moins intuitive: 


D=f=grt+ré, (12.142) 
et en y substituant la dérivée obtenue plus haut: 


8, eg, æ p=80+é,psin® (12.143) 
dr 00  0p 


En ce qui concerne l'accélération nous obtenons: 


x d, (Fsin 8 cos d+r cos Bcos 9 — r sin Psin f) 
=v=|ÿ;|- d,(Fsin 8sin #+r cos Bsin #0 + r sin 9 cos dé) 
Z d,(Fcos 8—r sin 88) 


& 


(F sin Scos +r cos 8 cos #9 —r sin sin gd) + cos cos #0 -rsin cos $08 
+r cos 8cos #Ô — r cos sin HO) — (F sin Psin ÉÊ+r cos Isin PO +r sin Pcos ff 
+r sin Psin SP) 

= | (rsin 9sin#+rcos Ssin #9 +r sin cos Pr) + (r cos dsin $6-—r sin 8sin $08 
+r cos Pain $0+r cos #cos ÉO) + (r sin cos gÉ+r cos #cos #O — r sin Ssin ff 
+r sin cos #Ë) 
(Fcos 8 — Fsin 88) —(r sin 99 +r cos 899 +r sin 88) 


sin #cos cos cos Ÿ 
= (F-r82)| sin Ssin # |+(2F8+r8)| cos Bsin # 
cos ÿ — sin ÿ 
— sin Ÿ —cos # 
+(2rsin 8+ 2r cos 808 +r sin 8)| cos $ |+rsin af sin Ÿ 
0 0 
cos Ÿ 
= (F-r87)8 +(2F8 +r6)é, +(2F sin G+2r cos EËP+r sin 8P)8, —r sin 8° | sind 
0 
(12.144) 


Or, nous avons: 
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2 2 : 

cos Ÿ cos fsin* #+cos fcos” 8 sin #cos cos cos Ÿ 

sing |=| sin gsin? g+sin fcos? 89 | = sin 8| sin 8sin Ÿ |+cos | cos Fsin Ÿ 
12.145 
( () cos 8 — sin ù 

= sin de, +cos 8e, 
Donc il vient: 
a=(F-r8)8, + (250 +r0)8, + (2r sin 8f+ 2r cos Sp +r sin pe, 
(12.146) 


-rsin 8 (sin 8, +cos 68, ) 


Soit au final: 


aus ir re -rf sine) ii À (r + 2r8-rf sin cos 8) 


L | (12.147) 
+8,(résin 8 + 2r6fcos 8 + 2r sin 8) 


8.3. SYSTÈME DE COORDONNÉES CYLINDRIQUES 


Le système de coordonnées cylindriques (très utile dans l'étude des systèmes à mouvements 
hélicoïdaux) est assez semblable à celui des coordonnées sphériques puisqu'il peut être vu comme une 
tranche de la sphère. Soit le schéma: 


Figure: 12.8 - Représentation du système de coordonnées cylindriques 


il vient sans peine qu'en coordonnées cylindriques: 
4 . 
r = JF + y g= secos[?) ÿ = sesi(2) et g = arctan F2) (12.148) 
Fr Fr x 


et inversement: 
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x=rcos® y=rsin# 


Z=Z (12.149) 


Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base cylindrique que nous 
choisissons de noter &,,8,,8, (au lieu de #, 8.2 comme cela se fait traditionnellement) avec les 


vecteurs de la base cartésienne &,,8,,8,. Nous avons, identiquement à ce que nous avons fait pour les 


coordonnées sphériques: 


Fr xt, _ 
8, =—=——s<2,cosf#te sing 
F Fr 
i OUR à » . (12.150) 
8, = —©=-8,sinŸte, cos 
sin # 
8, “8, 


Indiquons qu'en divisant par sin $ , nous nous assurons de par les propriétés de la norme du produit 


vectoriel que: 


EA = siné=1 2159 


sera bien normalisé à l'unité! Dans le cas des coordonnées cylindriques l'angle étant de toute façon 
droit, nous ne serions pas obligé d'indiquer cette division, mais nous avons fait ce choix par souci 
d'homogénéité avec les développements précédents. 


Remarque: Il est important de remarquer que le produit vectoriel de deux vecteurs de base donne 
toujours le troisième vecteur de base perpendiculaire (comme pour les coordonnées cartésiennes et 


sphériques donc!). 


Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune de ces coordonnées: 


6, _ 0. 
8r “‘à$ 
dé, dë, 
8r ‘ag 
88, _. @, 
& ‘af 


de 

EE æ mn UT 

e,snp+e,cosÿ=e,, — 
Zz 

_ ....  _ dé, 

_ _ = — . = 519 
2,cos Se, sing = -8,, — (12.152) 
de, 

0 —==0 
& 


Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation 47 
exprimée en coordonnées cylindriques: 


dr =dire)= 6 dr tr ER drtr 


8, 


dr 


de, 


og, 


de, 


dz 


dr + 


d#+ 


dz|=e.dr+tredé (12.153) 


Pour exprimer la vitesse et l'accélération en coordonnées cylindriques, nous aurons également besoin 


des dérivées par rapport au temps: 
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8, = a+ 26 + = 2 = 4 

D on nn (12.154) 
dd 

ë ne ; = 0 
D à 


Donc si nous faisons maintenant un peu de physique, nous avons (rappelons que la composante z est 
indépendante des autres composantes cylindriques): 


ce qui nous amène à: 


+e,rÿ+e,z| (12.156) 


Pour l'accélération nous obtenons (exactement la même démarche que pour déterminer l'expression de 
la vitesse): 


a=8, (F-r#?)+3, (ré+2rd)+&z| G2157 


8.4. SYSTÈME DE COORDONNÉES POLAIRES 


Le système de coordonnées polaires est très semblable à celui des coordonnées cylindriques puisqu'il 
peut être vu comme un retranchement d'une dimension (la hauteur) du système cylindrique. 


À 


X 


Figure: 12.9 - Représentation du système de coordonnées polaires 


Ainsi, il vient sans peine qu'en coordonnées polaires: 


x : 
r = Ne + y g= secos[?) g = sesi(2) et #= arctan F2) (12.158) 
r r x 


et inversement: 
x=rcos@y=rsin@ (12.159) 


Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que je choisis 
de noter &,,8, (au lieu de $,$ comme cela ce fait traditionnellement) avec les vecteurs de la base 
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cartésienne &,,8,,2,. Nous avons identiquement à ce que nous avions fait pour les coordonnées 


sphériques: 


. FF xt, _ 
8 ==" =$ cosfté sing 


5 (12.160) 


= -8,sing+e,cos Ÿ 


Explications pour la seconde ligne: en divisant par sin &, nous nous assurons de par les propriétés de la 
norme du produit vectoriel que | ; | = |&,|IlE, sin # = 1 sera bien normalisé à l'unité. Dans le cas des 


coordonnées polaires l'angle étant de toute façon droit, nous ne serions pas obligé d'indiquer cette 
division, mais nous avons fait ce choix par souci d'homogénéité avec les développements précédents. 


Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune de ces coordonnées: 


d8, de, _- n 4 

7 =(,7=-5 anŸ+e cosd=e8 

87 “4$ ” ; d 

de de (12.161) 
8 8 

— = 0, = -8 cos 8 sind = -8 

dr El ° É É 


Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation 47 
exprimée en coordonnées polaires: 


Es 


es d$ 
ôr a (12.162) 


de, 
rh = D = 3 3 = 7 Le 
dr = diré,)=8,dr + rde, =e.dr+r # 


= 8,dr +e rdÿ 


Pour exprimer la vitesse et l'accélération en coordonnées polaires, nous aurons également besoin des 
dérivées par rapport au temps: 


: _d8,. dé. _ 
7 8r 36 20 
_ _ (12.163) 
_ E eg LE — _ 
= rrt—@= -e 
&r 36” # 


Donc si nous faisons maintenant un peu de physique, nous avons: 


V=r=æertre, (12.164) 


ce qui nous amène à: 


v=re,te,rg| (12.165) 


où le premier terme est la composante radiale de la vitesse et le second la composante tangentielle de la 
vitesse (angulaire). 


Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer 
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l'expression de la vitesse): 


a=8,(F-#r)+2,(2r#+ré) 


où le premier terme est l'accélération radiale, le second l'accélération centripète, le troisième 
l'accélération de Coriolis et le quatrième l'accélération tangentielle. 


9, OPÉRATEURS DIFFÉRENTIELS 


Définition: Définir un champ scalaire, vectoriel ou tensoriel, dans un volume V, c'est définir une 
application qui, à tout point x de ce volume V, associe respectivement une grandeur scalaire, 
vectorielle ou tensorielle. 


Ainsi, l'application f qui, à tout point x de V, de coordonnées spatiales x, y, z associe la valeur scalaire 
FX) = f(x,y,z) est un champ scalaire dans V. 


En chaque point d'un volume traversé par un fluide en mouvement, le vecteur qui coïncide à chaque 
instant avec la vitesse de la particule changeante qui passe en ce point à ce même instant définit un 
champ vectoriel 3D, éventuellement variable dans le temps. Les champs ainsi définis constituent un 
outil mathématique de base dans l'ensemble de la physique. 


Remarque: Lorsque nous représentons graphiquement un champ scalaire, l'ensemble des points 
continus de valeur égale constitue ce que l'on appelle des "isolignes" ou plus couramment "courbes 
de niveau”. 


Le gradient, la divergence et le rotationnel sont les trois principaux opérateurs différentiels linéaires du 
premier ordre que nous allons présenter ici. Cela signifie qu'ils ne font intervenir que des dérivées 
partielles (ou différentielles) premières des champs, à la différence, par exemple, du laplacien qui fait 
intervenir des dérivées partielles d'ordre 2. 


Nous les rencontrerons en particulier dans les chapitres traitant de la mécanique des fluides, de 
l'électromagnétisme ainsi qu'en physique quantique ondulatoire où ils permettent d'exprimer facilement 
certaines propriétés. 


9.1. GRADIENTS D'UN CHAMP SCALAIRE 


Le gradient est un opérateur qui s'applique à un champ de scalaires et le transforme en un champ de 
vecteurs. Intuitivement, le gradient indique la direction de la plus grande variation du champ scalaire, et 
l'intensité de cette variation. Par exemple, le gradient de l'altitude est dirigé selon la ligne de plus grande 
pente et sa norme augmente avec la pente. 


Soit un champ scalaire tridimensionnel f(x, y,z), où x et y et z sont les coordonnées cartésiennes d'un 
point M de l'espace. Lorsque M se déplace dans l'espace selon le vecteur 47 de composantes dx, dy et 
dz, le champ scalaire f varie de df selon la différentielle totale: 


ÉPRCPNLA 
dx 


df = CAE 
ÿ À 
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A partir de cette relation, nous pouvons définir "l'opérateur gradient" d'un champ scalaire tel que: 


df = grad(f)odF = V(f)odF (12.168) 


grad(f) (12.169) 


est un terme vectoriel appelé le "gradient du champ scalaire f". Pour condenser l'écriture, nous utilisons 
parfois le symbole *; nommé le "nabla du champ scalaire f". 


Le vecteur obtenu par le calcul du gradient a les quatre propriétés suivantes: 


P1. Ses composantes représentent la variation (pente) de la fonction f selon les différentes directions de 
l'espace. 


P2. Sa norme est la variation maximale de f en fonction de la distance. 
P3. Sa direction est selon la variation maximale de f en fonction de la distance. 
P4. Le sens indique les valeurs où f augmente. 


A partir de la définition et de la différentielle totale, nous obtenons 


LA Ep + dde =V(P}odr = V(F),dx +V(F),dy +V(F),dz (12.170) 


ax dy z 
Ce qui nous amène à poser que: 


Ÿ _Ÿ y. -Ÿ# ? -Ÿ 217 
VO ax VU) D "VX LL 


et donc que finalement l'opérateur "gradient en coordonnées cartésiennes" est donné par: 


Ÿ = 22 (12.172) 
dx dy dz 


Finalement nous voyons que le gradient d'un champ scalaire f(x, y,z) est le champ vectoriel dont les 
composantes en chaque point sont les trois dérivées du champ scalaire f par rapport aux trois 
coordonnées spatiales, notées ici x, y, z. 


La variation de f pour un déplacement 4 est donc le produit scalaire de 47 par le gradient du champ 
f. Or, un déplacement infinitésimal 4F effectué le long d'une isoligne (décrivant une isosurface), du 
champ scalaire tridimensionnel f(x, y, z) n'engendre aucune variation df de f. Le produit scalaire évoqué 
est donc nul dans ce cas, ce qui implique que 4F et Ÿ({f) sont perpendiculaires. 


En considérant cette fois un déplacement perpendiculaire aux isolignes, nous montrons facilement que 
le vecteur gradient de f est dirigé depuis les faibles valeurs de f vers les fortes valeurs de f. Son module 
étant d'autant plus grand que f varie rapidement au voisinage du point considéré. 
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Par sa direction, son sens et son module, le vecteur gradient d'un champ en un point comporte donc des 
indications sur la manière dont varie le champ autour de ce point. 


Remarque: Une des conditions nécessaire et suffisante pour qu'un champ de vecteurs soit le 
gradient d'un champ scalaire f est que ce champ vectoriel soit irrotationnel (voir plus loin l'opérateur 
rotationnel d'un champ vectoriel). 


Après avoir défini le gradient en coordonnées cartésiennes x, y, z nous devons nous intéresser à 
l'expression de cet opérateur dans d'autres systèmes de coordonnées. Il est fréquent en physique d'avoir 
à utiliser les coordonnées cylindriques, polaires et sphériques pour simplifier l'étude formelle de 
systèmes physiques. Ainsi, si nous faisons référence à notre étude des systèmes de coordonnées, nous 
avons (rappel) d'abord en coordonnées polaires: 


dr =e,dr+erd@ (12.173) 


Or, avec la définition du gradient en coordonnées cartésiennes, nous avons en coordonnées polaires la 
définition suivante: 


df =ŸV(fjodF (12.174) 


Si nous exprimons la différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral) de 
df nous obtenons les relations suivantes: 


df = Par + IL = V(P)odF = V(P)o(8dr +érd#) (12175) 
Lg 
Ce qui nous permet d'obtenir la relation: 


df Far + Ed= VU e(Gdr +8,rd #) = V(f),dr +V(F),rdd (12.176) 


donc: 
df = Par + d6 =V(P),dr +V(P),rd# (12.177) 


ce qui nous amène à: 


Ainsi le "gradient en coordonnées polaires" s'exprime comme: 


Ÿ = É 12 (12.179) 


8r r 4$ 


Occupons-nous maintenant de l'expression du gradient en coordonnées cylindriques. Rappelons que 
lors de l'étude des différents systèmes de coordonnées nous avons obtenu pour les coordonnées 
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cylindriques: 


dr =e,dr +e,rd® (12.180) 


Donc nous savons déjà que l'expression du gradient en coordonnées cylindriques sera identique à celle 
en coordonnées polaires à l'exception de l'ajout de la composante verticale z indépendante des autres 
coordonnées. Ainsi, nous obtenons l'opérateur "gradient en coordonnées cylindriques": 


) 
—,—,— || 02160 


Occupons-nous maintenant de l'expression du gradient en coordonnées sphériques. Rappelons que lors 
de l'étude des différents systèmes de coordonnées nous avons obtenu pour les coordonnées sphériques: 


dr =e,dr+te,rdô+ersn&d# (12.182) 


Or, avec la définition du gradient en coordonnées cartésiennes, nous avons en coordonnées sphériques 
la définition suivante: 


df =V(f)odF (12.183) 


Si nous exprimons la différentielle totale de df nous obtenons les relations suivantes: 
df = E yr4 © dé+ = ® 4e- V(foar =V(f) o(8,dr+8çrd8+8,r sin £a ÿ) (12.184) 
ôr 0$ 98 


Ce qui nous permet d'obtenir la relation (nous utilisons maintenant la notation qui use de l'opérateur 
"nabla"): 


Lar r+ db + Pa = V(F)o(8, dr +48 +äsr sin 8df) 
(12.185) 


= V(F), dr + V(),rd8+ VF), rsin 846 


La relation: 


Var + a6+ 40 - VF), dr+V(fherd8+V(f),rsin&é (12.186) 


Nous impose: 


. LV V(F)e = _ (12.187) 


vu), | rain 9 d® 


ms VON, = 


Ainsi l'opérateur "gradient en coordonnées sphériques" s'exprime comme: 


5.219 1 2 


ôr r 08 ran8 d$ 


(12.188) 


Nous avons donc finalement vu toutes les expressions de l'opérateur gradient dans les systèmes 
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cartésiens, polaires, cylindriques et sphériques. 


9.2. GRADIENTS D'UN CHAMP DE VECTEURS 


Le gradient d'un champ vectoriel f (x, y,z) est le champ dit "champ tensoriel" défini par les 9 relations 


suivantes en coordonnées cartésiennes: 


Ga 
dy dz 
EP A (12.189) 
dy  dz 
B 
dy  dz 


Nous utiliserons un tel gradient lors de notre étude dans le chapitre de Génie Météo de l'effet Papillon 
dont l'origine vient de la détermination des équations de Navier-Stokes en Mécanique des Milieux 


Continus. 


Par les 4 relations suivantes en coordonnées polaires: 


A 
— är 
voie &f 

Ga 


dr 


(12.190) 


Par les 9 relations suivantes en coordonnées cylindriques: 


CA 
dr 
dr 
LA 
dr 


CA 
àz 
LA 
dz 
LA 
àz 


(12.191) 


Par les 9 relations suivantes en coordonnées sphériques: 


&% 1 
&  rd8 


1% 
r sin 9 0 
1 df, 


| (219% 
r an 8 dÿ 


1_% 


rsin 8 4$ 


Nous avons donc finalement vu toutes les expressions du gradient d'un champ vectoriel dans les 
systèmes cartésiens, polaires, cylindriques et sphériques. 
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9.3. DIVERGENCES D'UN CHAMP DE VECTEURS 


La divergence s'applique à un champ de vecteurs et le transforme en un champ de scalaires. 
Intuitivement, et dans les cas le plus courant, la divergence d'un champ vectoriel exprime sa tendance à 
provenir ou converger vers certains points. 


Cependant, il faut distinguer deux contributions à la divergence que nous définirons rigoureusement un 
peu plus loin: l'une due aux variations de direction appelée la "divergence directionnelle" et l'autre due 
aux variations de modules (norme) appelée la "divergence modulaire". Ainsi, pour des champs simples, 
nous pouvons imaginer des cas où la divergence ne serait que modulaire et d'autres, où elle ne serait 
que directionnelle. Nous pourrions aussi construire un champ où les deux types de divergence 
coexistent, mais d'effets contraires (convergence modulaire et divergence directionnelle par exemple). 


Prenons par exemple un vecteur f de l'espace et faisons lui traverser une surface S quelconque. Les 
physiciens assimilent alors la quantité f qui se dirige suivant la normale à la surface au flux de f à 


travers S. 


Pour se convaincre de cette analogie nous pouvons imaginer un fluide coulant sur une surface plane, le 
flux à travers la surface est évidemment nul, par contre si le fluide coule verticalement à travers une 
surface horizontale le flux sera maximal. Il est alors immédiat de vouloir représenter le flux par le 
produit scalaire de f avec la normale # de la surface S. 


Remarque: Il faut toujours prendre garde à la direction de # car en un point quelconque d'une 
surface on a en général deux normales. 


Si la surface est plane la normale est la même partout mais si elle change suivant les endroits, nous nous 
intéresserons alors à un petit élément de surface ds. 


Si un petit élément de flux est défini par: 


alors le flux total sera donné par: 


= [{7 cA)as (12.194) 
Fr, 


ce qui est parfois noté (c'est un peu abusif mais pourquoi pas...): 


D=[fo48 (12.195) 
. 


Supposons maintenant que notre vecteur f déplace un point f(x, y,z) de l'espace en 
M'(x + dx, y + dy,z +dz) à travers un parallélépipède rectangle de côtés dx, dy et dz: 
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Figure: 12.10 - Déplacement du vecteur à travers un parallélépipède 


Nous pouvons décomposer le mouvement (flux) à travers chaque face du parallélépipède 
(décompositions dans la base orthonormée). Par exemple, si nous nous intéressons à l'élément 
décomposé du flux à travers la face (dy, dz) décrite par les sommets BCFG nous avons bien 
évidemment # = (1,0,0). 


Il nous faut encore déterminer comment représenter le flux F pour cette direction. Comme le flux est 


une fonction, c'est-à-dire que chacune de ces composantes peut être dépendante des trois composantes 
de l'espace (si nous prenons le cas particulier d'une fonction dans g°) nous avons: 


JF, (x, 7,2) 
F=|f,(23,2)| (2196 
Ja (2Y,2) 


Remarque: Ceux qui ne sont pas convaincus peuvent aller lire le début du chapitre 
d'Électrodynamique où nous prenons le champ électrique comme (excellent) exemple. 


Alors la variation du flux selon x sera donnée par: 


J,(x + dx,y,2) F,(x, 7,2) 
J,=|$,+dxr,2)|-| f, (7,2 | 42199 
J(x+dx,y,2)/ \(x,7,2) 


ce qui nous donne: 
. , | 
dD, =(f, 0%, )drdr =(f,(x+dx,y,2) — f, (x,y,2))dyaz = > didpds (12.190) 
x 
De même pour les deux autres faces: 
_— #, 
d®, = #2 cÀ, )dxdz =(J,>+ dy,2)- f,(x,y,2))dxdz - É 
(12.199) 


d®, = (£ cA, )dxdy = (£.(x»,2z+d7)- f,(x,y,2))dxdy = 2 dupe 


d'où en sommant: 
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a _ _ 
do, %,% dxdydz = div(f)dW = Ÿ o SW (12.200) 
x & & 


Par rapport à la première expression de , le terme dxdydz est donc un élément de volume et non plus 
de surface. Nous avons aussi un résultat intéressant: 


œ=f[(v cf)ar =[(fox)as (12.201) 
F 5 


Remarque: Voir les exemples pratiques dans le chapitre d'Électrodynamique où par exemple pour le 
champ électrique la divergence est nulle pour une charge sphérique libre car les vecteurs pointent 
dans des directions différentes (divergence directionnelle) et les modules décroissent comme 
l'inverse du carré du rayon (convergence modulaire). Les deux contributions sont en oppositions et 
donc la divergence totale est nulle. 


Le développement ci-dessus est appelé "théorème d'Ostrogradsky" ou "théorème de Gauss- 
Ostrogradsky" ou encore "théorème de la divergence" et définit en fait la divergence totale de f dans 


un volume comme le flux de f à travers les parois du volume (surface Gauss), ce qu'exprime bien le 
nom divergence. 


Nous définissons l'opérateur "divergence" par la relation suivante (la notation tensorielle a été utilisée 
afin d'abréger l'écriture) dans un espace à n dimensions: 


div(f}=Vof= SH (12.202) 
il 0x, 


Ainsi, nous avons pour l'opérateur "divergence en coordonnées cartésiennes": 


Si la divergence d'un champ de vecteurs est identiquement nulle en tous les points d'un repère Eulérien, 
l'intégrale triple du flux de ce champ à travers un volume V sera: 


P= [IT o fa” =0 (12204) 


Il en résulte que le flux de ce champ de vecteurs à travers les bords du volume est nul, c'est-à-dire que 
le flux entrant compense le flux sortant. Nous disons qu'un tel champ de vecteurs de divergence nulle 
présente un flux conservatif. 


Pour déterminer l'expression de la divergence en coordonnées polaires rappelons les relations 
démontrées plus haut: 
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CR Le 
on (12.205) 
e *e 

e £ r æ ,: — 

8, =— = -8 sing+e, cos Ÿ 

Ÿ sing h d 


Soit à présent f : R? —>R? une fonction vectorielle. Nous avons : 
F= RE, +Se, = f,8, + ge (12.206) 


Connaissant l'expression de &,,2, en fonction de &,,8,, à partir de l'expression ci-dessus nous en 
déduisons : 

J,=cos$.f, -smné.jÿ, 

J,=sn#. jf, +cosÿ jé 


(12.207) 


à … = 6) 
La divergence de f est définie par Vo f = Ÿ, + LA . Nous avons : 


Vof = V(f)oë, +V(7,)08, (12.208) 


Le premier terme vaut (application du gradient en coordonnées polaires!): 


8r * r of 
= LP °ë, 41% °ë, (12.209) 
or r 0$ 
es ls 
&r r 0$ 


En additionnant les deux termes et en exprimant les dérivées partielles des fonctions f,.f, en fonction 


des dérivées partielles des fonctions , f, à l'aide des relations : 


J, = cos. jf, -sin fs 
J,=sing.f, +cosÿ js 


(12.211) 


Nous obtenons : 
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= cos’ 7 — cos dsin s7 _ sin 4- ain ff, +cos sa cos if; — sin ve (12.212) 


+sin? = +sin gcos pt + l cos gs gf, +sin Lu sin ff, +cos 24 


Après simplification : 
= () 
” 


(12.213) 
ro rô$ r © rô$ 


L'expression de l'opérateur "divergence en coordonnées polaires" est alors: 


Pour déterminer l'expression de l'opérateur divergence en coordonnées cylindriques rappelons les 
relations: 


E,=—=———#"2,cosfte ang 
Fr Fr 
L &.*&8 . ” (12.215) 
8, = —2=-—8,sinpte, cos Ÿ 
sin # 
8, =E, 


Soit à présent f :R° —IR* une fonction vectorielle. Nous avons : 


J=fe, +8, +fe, = fe, + fées + fe, (12.216) 


Connaissant l'expression de &,,8,,8. en fonction de &,,8,,8., à partir de l'expression ci-dessus nous en 
ES EDS x p?fs 


déduisons : 
J=cos#. jf, -sng fs 
FA = sin #. jf, +cos fs (12.217) 
Jr = À 

ëf, 


La divergence de f est définie par Vof= 3 +— +=, Nous avons : 
x 


Le premier terme vaut (application du gradient en coordonnées cylindriques): 
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+ G) Ge) 
Vifioe ms IT 2,1%, 6, 
&r r 0$ &z 
Ge) 6) 
= #, 8, 08, +1 #. &$ 08, + Y, 8, 08, (12.219) 
êr r 0$ & 
= Ÿ, cos g-1% sin 
êr r 0$ 
de la même façon nous obtenons (nous pouvons détailler sur demande) : 
. UE L 
VAS )o, = 08, dr 
œ a (12.220) 
= 7 sin f+- 7 cos # 
& $ 
et : 
+ O2 Lo. u à Of 
7 = 8, 08, +8,08 +8,08 = (12.221) 
(Ze) £ w 8, 9e r 3 ÿ *z pu 


En additionnant les trois termes et en exprimant les dérivées partielles des fonctions f,.f,,/, en 


fonction des dérivées partielles des fonctions f, 7, à l'aide des relations : 


J,=cos# f -sn# fs 
f,=sing f,+cosg.fs (12.222) 


Jr = Îs 
Nous obtenons : 
sn 10, 4 1%, CA 
Vof= Le ot À sin #+ + 36° Pre 


= cos? 7 — cos sin 7 - un 4- sin #f, +cos a —cos#f, — sin à (12.223) 


ÿ, ÿ, 


2 rh cos pt + l cos p[cs gf, +sin grip Ÿf$ + cos 24 AA 


2 
+sin 
? 4 
Après simplification : 


vol, ,1%,8 _1002),19% ,@ 
Or r O$ © r ei 5/4 


L'expression de l'opérateur "divergence en coordonnées cylindriques" est alors: 


ÿ-[124 18 8) 52 
r &œ roÿ & 
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Pour obtenir l'expression de la divergence en coordonnées sphériques, rappelons les relations: 


8, = sin Ocos de, + sin #sin de, + cos 6, 


t 


LT 


= 8, sinf+e, cos# (12.226) 
88 = 


—8, cos Ocosÿ— 8, cos dsin #2, sin # 


Soit à présent f :R° —IR* une fonction vectorielle. Nous avons : 


J= LE TS, + SE = L6, + Joe + Jg (2227) 


Connaissant l'expression de &,,8,,8, en fonction de &,,8,,8,, à partir de l'expression ci-dessus nous en 
F8 € 


déduisons : 


J, = sin@cos#. jf, +cos8cosÿ. f,-sind. jf, 
J, = sin &sin jf, +cos&sin #. jf, +cos.fg (12.228) 
J. =tcos8.f, -sand.f, 


#, 


La divergence de f est définie par Ÿ o f = , + rs . Nous avons : 
Er 
Vof = V(f)oë, +V(f,)oë,+V()oë (12229) 


Le premier terme vaut (application du gradient en coordonnées sphériques): 


V(Z)o& -(£ 17e, © +) 8, 
+ 


êr r 08 rsin£ 0$ 
à 
08, + | A —— 86 98 8 
r sin 9 0$ 


sin Ÿ CA 
rsin 8 0$ 


1 #; 


— sin cos + —— "cos Pcos os — 


de la même façon nous obtenons (nous pouvons détailler sur demande) : 


… 2) 8 a 
V(J,)oz non du D + ——— _. . (12.231) 


or r 08 r sin 8 ag 


et : 


En additionnant les trois termes et en exprimant les dérivées partielles des fonctions f,.f,./, en 


fonction des dérivées partielles des fonctions f, f4,.f, à l'aide des relations : 
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J, = sin&gcos$. jf, +cos8cos ÿ. fs -sind jf, 
J, = sin Osin #-f, +cos@sin #- jf, +cosÿ. fg (12.233) 
J. =cos8.f -san8.fs 


nous obtenons (nous pouvons développer les détails intermédiaires sur demande) : 


à 
For l Ps , cos +1%e.,%, 2 


Lé 
—— _ rt 
ring 0$ ring  r08  & sa Pr 
——,——— PAT A 
_ 1 4(fsné) 1 ô(r°f) 
crsné 6 ++ 


Ainsi, l'expression de la divergence en coordonnées sphériques devient: 


2 
Vof= Î H. 1 2% sine), 1 2(r#) (12.235) 
rang 0$ rang 08 F2 


et donc l'opérateur de "divergence en coordonnées sphériques" est alors: 


- [18647 1 Afing 1 à _ 
V=l—— — a. |" (12736) 
r? & ‘rain 089 ‘rsin9 4$ 


Nous avons donc finalement vu toutes les expressions de la divergence d'un champ vectoriel dans les 
systèmes cartésiens, polaires, cylindriques et sphériques. 


9.4. ROTATIONNELS D'UN CHAMP DE VECTEURS 


Le rotationnel d'un champ de vecteurs peut être vu (c'est une simplification!) comme le champ de 


vecteurs dont les lignes de champs sont perpendiculaires à celles dont nous avons calculé le rotationnel 
comme le montre l'exemple particulier ci-dessous: 


Figure: 12.11 - Exemple de rotationnel d'un champ de vecteurs 


Le rotationnel transforme ainsi un champ de vecteurs en un autre champ de vecteurs. Plus difficile à se 
représenter précisément que le gradient et la divergence, il exprime intuitivement la tendance qu'a un 
champ à tourner autour d'un point (la manière dont il est tordu). 


Exemples: 
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E1. Dans une tornade, le vent tourne autour de l'oeil du cyclone et le champ vectoriel vitesse du vent a 
un rotationnel non nul autour de l'oeil. 


E2. Le rotationnel du champ des vitesses d'un disque qui tourne à vitesse constante est constant, dirigé 
selon l'axe de rotation et orienté de telle sorte que la rotation ait lieu, par rapport à lui, dans le sens 
direct. 


Un champ de vecteurs est dit "irrotationnel" lorsque le rotationnel de ce champ est identiquement nul 
en tous les points de l'espace. Dans le cas contraire, nous disons qu'il est "tourbillonnaire". 


Dans le cas usuel où dx représente un élément de longueur, l'unité du rotationnel est alors l'unité du 
champ considéré divisée par une unité de longueur. Par exemple, en mécanique des fluides: l'unité du 
rotationnel d'un champ de vitesse est le radian par unité de temps, comme une vitesse angulaire! 


La divergence donne certaines indications sur le comportement d'un vecteur ou d'un champ de 
vecteurs: comment il se dirige par rapport à la normale et comment il traverse les surfaces, mais c'est 
insuffisant. Prenons un champ qui aurait la forme d'un cylindre et un autre champ qui aurait la forme 
d'une hélice de même diamètre que le cylindre. S'ils se dirigent dans la même direction leur divergence 
sera identique alors que les mouvements sont bien différents. Il faut donc que nous déterminions la 
manière dont le champ est courbé quand il traverse une surface: ceci va être déterminé par la 
circulation (comme le travail d'une force par exemple) du vecteur le long d'une courbe fermée, obtenue 
avec la somme des produits scalaires f +4 sur le contour: 


$f car 


en fait Ça revient au même de regarder comment est tordu le vecteur par rapport à la normale à la 
surface ce qui nous amène à définir le "rotationnel" ou "vecteur tourbillon" en écrivant: 


$ sdr = [roc (f) dS 


ÿ 


qui établit donc une relation entre l'intégrale curviligne et l'intégrale de surface (on transforme donc une 
intégrale curviligne sur un parcours fermé en une intégrale de surface délimitée par ledit parcours). 


En d'autres termes, le rotationnel se calcule en utilisant le fait que la circulation autour d'un circuit 
élémentaire fermé d'un champ de vecteurs est égal au flux de son rotationnel à travers la surface 
élémentaire immédiate engendrée par ce circuit. 


Ceci est le "théorème de Stokes" (qui est plus rigoureusement démontrable avec un formalisme 
mathématique assez lourd) qui est donc en fait une définition de l'opérateur rotationnel dont nous allons 
chercher l'expression mathématique explicite: 


Soit f un champ vectoriel défini dans un espace donné. Nous voulons donc calculer la circulation du 


f autour d'un contour fermé C: 
$ FodF 


Nous choisissons comme contour C le contour d'un rectangle infinitésimal de côté {(4x,dy) plongé dans 


æ° et parallèle au plan xOy (remarquez que nous parcourons le contour de façon a toujours avoir la 
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surface à notre gauche): 


fs {x + dx, y,z) 


F, (2,92) 


Figure: 12.12 - Contour d'intégration 


Pour les deux côtés horizontaux, la contribution à la circulation est: 
JG, y,z)dx- f,(x,y+dy,z)dx (12.240) 


Ce qui nous autorise à écrire: 


fi G,2) 7 À, Ge} + dy,2) dxdy = as (12.241) 
dy dy 
De même, pour les faces verticales: 
x+dx,y,z)— f,(x,y,Zz à 
HA +92) JS, Gy:2) Y-2)7 J, GY,2) dxdy = D gs (12.242) 
dx ôx 
Ainsi, nous avons la circulation selon z: 
: Ge) 
(for) = LOC A dS, (12.243) 
z 6x y 
Ce qui s'écrit aussi sous la forme générale traditionnelle suivante: 
# _æ, | 
LES 7 (E- ea ds. (12.244) 


et constitue le non moins fameux "théorème de Green" ou appelé encore "théorème de Green- 
Riemann" que nous retrouverons dans le chapitre d'Analyse Complexe. 


Et que nous écrirons dans le cas qui nous intéresse: 


(E- da, = Jr?) dS, (12.245) 


Par permutation circulaire nous obtenons alors: 
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nm (A |. (#, 4. (4%, 
an(s (2-2) (Se > 


É (12.246) 


Soit sous forme vectorielle condensée: 


ÉARA 

Ÿ & 
ra(7)= [| cn 

LA 

ox © 


Ce qui permet de mieux comprendre la notation, ou la définition non intuitive du rotationnel dans 
beaucoup d'ouvrages et qui est: 


roi (#) =Ÿxf (12.248) 
soit le produit vectoriel de l'opérateur gradient avec le champ vectoriel. 


Donc nous avons finalement démontré le théorème de Stokes qui donne bien: 


car = J(® x fus (12.249) 


5 


et en même temps le rotationnel en coordonnées cartésiennes. 


Cherchons maintenant à déterminer l'expression du rotationnel en coordonnées cylindriques ((le 
rotationnel en coordonnées polaires n'étant pas définissable). 


En réutilisant la même technique que pour le rotationnel en coordonnées cartésiennes, nous écrivons la 
circulation de ÿ le long d'un contour correspondant à un petit morceau de cylindre orthogonal à (Oz) : 
RBBE 


Figure: 12.13 - Représentation du morceau de cylindre 


Nous avons alors en fixant z (attention le 47 n'a rien à voir avec le r du rayon du cylindre. la notation 
peut être confuse j'en suis désolé!): 
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fo 
(12.250) 


(Fed) 
(7 pp = "4 C.6+dd2)dr 
(Fe) 


RE = = (r, #,z)rd ÿ 
la circulation totale donne donc après regroupement des termes : 


FodF = f,(r,d2)dr + ir + dr, d,2)(r+dr)d@- f,(r,6+d#,2)dr - fi(r.6.z)rd 
=r|[f, (r + dr, #,z) — fy(r,8,2) |dé+ fi(r + dr, d,z)a dar —[f, (r,®+ d#,z) — fr, #,z)|ar 


(12.251) 


Nous ne pouvons pas à cette étape directement comparer avec le rotationnel car il nous est difficile de 
faire apparaître la différentielle de la surface si nous regardons les différentielles qui apparaissent 
actuellement dans la circulation. Le mieux est alors de tout diviser par rd gr : 


Es 


for 
rd far 
_ HONTE TPE _1A(r,.#+d82)- f,(r, #2) Levsaée . 
7 r d $ r 
- (#1 1%) 104%) 1& 
(ethicen-#)l 7 06 


Donc: 


Maintenant nous déterminons le rotationnel en fixant ®. Le problème revient à avoir donc un rectangle 
dans l'espace que nous parcourons pour déterminer la circulation. Or, nous savons déjà ce qu'est le 
résultat du rotationnel pour un rectangle en coordonnées cartésiennes: 


-_E_# 


(7,2% 


(12.254) 

à la différence que dans les coordonnées cylindriques il faut substituer z par ®, x par z, y par r, .f, par 
J, et finalement f, par f (ce choix s'impose toujours simplement parce que la circulation se fait de 
telle manière que la surface soit toujours à notre gauche) . Ce qui nous donne: 


7 2% _% 


rot(f), . (12.255) 


Il ne nous reste plus qu'à trouver la composante du rotationnel en r (soit quand r est fixé). Le calcul est 
alors plus délicat puisqu'il s'agit de parcourir (positivement toujours!) une surface courbée par la 
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variation de l'angle 2. 


Nous avons alors en fixant r: 


( F) pp = HP Drd6 
(Fe df Fe = f,(r,4+ d$,2)dr _. 
( }2p =- fi(r,f,z+&)rd 
(F4)? 


pr = A 2)de 
1 
la circulation totale donne donc après regroupement des termes : 


Fodf = f(r,#+46,2)d2- f(r,d2)dz-rfy(r, dz+d2)dp+rfs(r,f2)a0 
=[f(r,6+40,2)- Jr. 6.2)]de-r] fi(r.d.z +de) - st, 62)|a6 
Nous ne pouvons pas à cette étape directement comparer avec le rotationnel car il nous est difficile de 


faire apparaître la différentielle de la surface si nous regardons les différentielles qui apparaissent 
actuellement dans la circulation. Le mieux est alors tout diviser par rd gaz : 


ru 1 At ptdfz) f,(r, 8.2) JoCr,d,z+d7)— fr. 8,27) 1%, 


TR Ré Des 
rd 4 Fr d$ dz rÔ$ 
(12.258) 
Donc finalement: 
rot(F) 12% _% (12.259) 
* rO$ 


Et finalement le rotationnel en coordonnées cylindriques dans sa globalité est donné par: 


1% _% 
r 08 @& 
r(7)=| ES Àoxo 
10%) _1æ 
r © r 0$ 


Le lecteur pourrait aisément vérifier que ce résultat est simplement le gradient en coordonnées 
cylindriques appliqué au champ vectoriel f. 


Pour s'en persuader, montrons maintenant directement l'expression du rotationnel en coordonnées 
sphériques en montrant ceci via le produit vectoriel du gradient en coordonnées sphériques avec le 


champ vectoriel . 


D'abord rappelons que nous avons obtenu pour le gradient en coordonnées sphériques: 
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+ 9 19 1 38 
V=|l—,——, — | (12261) 
or r 08 ran8 0 


Donc il vient: 


Le 
M LÉ 
Var=l 27. |K (12.262) 
f NT Je 
1 4 ÿ 
rsin ÿ 0$ 


ce que nous pouvons aussi écrire en décomposant à l'aide des vecteurs de base: 


2. & 
ox-fs 2 É 


Æ X( F8 + foes + fe 
&r r 08 42) (4 r + feëe % s) 
(222 2h de 4 à 


r r 88 r sin 8 0$ & Or 08 ran8 ag 


3 - 
. + fe + jf a) (12.263) 


6 EX 
ës {Le de. Ye d, 


© 
a 


&. 8 a) 86, de, 
+2 _ & ALLER L &, +R HSE + 5] 


LE +, +8, + 
r sin 9 : à $ # 


Of of 0 


A l'aide des dérivées partielles que nous avions démontrées lors de notre introduction plus haut du 
système de coordonnées sphériques il vient : 


> a 
Vxf= [&e TE) 


(Le harhissarnteye) (12.264) 


ë P : Por 2 _— R _——— 
x gp 4e x 4% + f sin 08, + fe cos 06, + — 8, sin 9+58,cos 4 
r sin 8 É ” 84 : 86 stf ste ÿ fi (&, 8 )| 


Les produits vectoriels avec les vecteurs colinéaires s'annulent. Il reste donc: 


(12.265) 


cs (S: Ye _ 


—é,+— 
rang | o$ 


Comme le produit vectoriel de deux vecteurs de base donne le vecteur orthogonal correspondant 
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(positivement ou négativement) nous avons alors: 


—_ Te 


rsin9 6$ * ran80$ * r * ring 


(he 


En regroupant les termes il vient: 


(ia dent) (#1 x à) 


r 06 rsin6 06 rsin 8 æ rsin 8 8$ F 


4 Ye 1®, Je 
| = -—< 
 r08 r 


(12.267) 


Soit en simplifiant: 


- + & (47. a ës (# . _à LÉ æ) 
Vxf= 7 | fingr)-*22|+4 ZT — sin 0 — +—|— —— | (12.268) 
f (2e #) 2) ran8| 86 En 62) dira En CODE 


Soit finalement: 


L —(sinef,)- L de 
r sin 9 08 r sin 9 0 
_—— 1 &æ 14 
Vxf= —--— (12.269 
f rsin 8 8$ ra t%) D 


14 &$ à 
COS 


9.5. LAPLACIENS D'UN CHAMP SCALAIRE 


Le laplacien d'un champ scalaire #(x,,x,,x,) est le champ scalaire qui mesure la différence entre la 


valeur de la fonction en un point et sa moyenne autour de ce point. En d'autres termes, la dérivée 
partielle deuxième mesure les variations de la pente au point étudié dans un entourage immédiat et 
selon une dimension à la fois. Si la dérivée partielle deuxième est nulle selon x, alors la pente est 
constante dans un entourage immédiat et selon cette dimension, cela implique que la valeur de la 
fonction au point étudié est la moyenne de son entourage (selon une dimension). 


Cet opérateur s'obtient à partir de la divergence du gradient et nous la notons (écriture tensorielle): 


x 2 
A f =V2f = div(grad(f}) = Vo(V:#) = De (12.270) 
i=l i 


Le laplacien est nul, ou assez petit, lorsque la fonction varie sans à-coup. Les fonctions vérifiant 
l'équation de Laplace À $ = 0 sont appelées "fonctions harmoniques". 


Donc l'opérateur "laplacien en coordonnées cartésiennes" est: 
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s  & 
ris) (12.271) 


Le laplacien d'un champ scalaire et dans d'autres systèmes de coordonnées est un peu plus long à 
développer. Il existe plusieurs méthodes et parmi celles existantes j'ai choisi celles dont le type de 
raisonnement et les outils utilisés semblaient pertinents. Il est intéressant d'aborder différentes stratégies 
mais bien sûr il existe des méthodes plus simples que celle présentée ci-dessous. 


Soit le laplacien en coordonnées cartésiennes dans 7? d'un champ scalaire f : 


Pour déterminer cette expression en coordonnées polaires, nous allons utiliser la différentielle totale et 
la règle de chaîne en coordonnées polaires: 


= dr + Tap= # _ RE PR (12.273) 
êr 0$ dx  &r dx 0$ dx 


donc pour une dérivée seconde: 
d'f _ d | df àr AL dé | _ # dr # d°r AA d°$ 
dé dxl& F4 Er] dx - 2. êr dx? SE ‘ag de 


SJar, dy 86)à,#dr, [of dr | é168l, gs 
8r° êx ‘308 & dx ôrdx (Gr 0x d@ 8x|dx 86 dx 


or, nous avons pour les coordonnées polaires: 


r = re + et #= tan (2 (12.275) 


d'où: 
dr X_LX df_ -y __y 
ax fx? + y r a x +y ri 
y Pr rx , d'6 af. 2x 
dr dx rl: _ÿN Pers 
is 3 = 3 + ä dx 
x Fr r Fr 
(12.276) 
d'où: 
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et compte tenu que les dérivées partielles secondes sont continues, alors les dérivées croisées sont 
égales selon le théorème de Schwarz (cf. chapitre de Calcul Différentiel Et Intégral): 


el 
N 
SI 
e 


Sf _Ÿf 
8r0$ dr 


d'os 20), 2% 
dé à” 5 | érôg >] AE 1 |: a(T) is 


De façon similaire, nous aurons: 


2. - UE 2æ|, (12.280) 
dy° . FI r° L 


d'où l'expression du laplacien en coordonnées polaires en sommant les deux dernières expressions: 


+= 
N 
N 
SI 
© 


Donc: 


(12.281) 


y-Ês IN, 1 Ès 
&? Or r0f 


Donc l'opérateur "laplacien en coordonnées polaires" est finalement donné par: 


2 
+ 1 
DE La à) 


12.282) 
æ? rôr r°8f | 


Pour trouver l'expression du laplacien en coordonnées sphériques, nous allons utiliser l'intuition du 
physicien et les notions de similitude. 


Nous allons tout d'abord nous aider de la figure ci-dessus pour savoir de quoi l'on parle: 
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Figure: 12.14 - Représentation du système de coordonnées sphériques 


Rappelons que les relations entre coordonnées cartésiennes et sphériques sont données par les relations: 


—- LT + 7 +2 
tan g=y{x 


Z 


3 + y? +z 


cos 8 = 
2 


Nous allons considérer maintenant les similitudes suivantes: 
Coordonnées cylindriques: x = £cos # et y = sin # 
Coordonnées sphériques: z = rcos 8 et 6 =rsng 
Construisons un tableau de correspondance: 


Cyli: 2 
T 
Fr 


L'objectif est de jouer avec cette correspondance avec d'abord le laplacien en coordonnées cylindriques 
où l'on a soustrait des deux côtés de l'égalité le terme 4?  / &?. Ainsi: 


2 2 2 2 
29,95. CP, Tor ss 
8x %? do pp p 8ÿ 

utilisons le tableau de correspondance et nous obtenons: 

2 2 2 2 
CLOS LOS LIT LES 50 


8z? do 8r? ràr r? 46 


Le deuxième terme de l'égalité de cette dernière relation est l'équivalent sphérique du terme #1 du 
laplacien en coordonnées cylindriques: 
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PS OS, ES ES 8S 18,18 
& 


+ — —— | 
es | 


#1 


1# 


Maintenant examinons le terme: ——— 
e de 


Identiquement lorsque nous avons déterminé la relation: 


À por Tage L-Y de, Ÿ 49 


df =—do+—d$—= 2.288) 
fe de s FF id dx 0,90 dx 4$ dx 
nous obtenons: 
du = LD PE? PE din ae Le dB: Le 2 (12.289) 
EFe) a$ dy 8e dy ag dy 
avec: 
I Ÿ “e d$ _ x _— (12.290) 
dy 2 + y e dy pe + y? 6° 2.2 
ce qui nous permet d'écrire: 
df = AA + xd (12.291) 


2 
dy pde pdf 
si nous jouons encore avec le tableau de correspondance, nous avons: 


d o# ,z4 


12.292 
de rôr r°48 | 


nous divisons cette relation des deux côtés par & et ainsi nous obtenons: 


1df 1®#  z d@ 1% cot9 
+ 2293) 
edp rôr por?88 r& r? 88 


Nous avons donc ci-dessus l'équivalent sphérique du terme #2 du laplacien en coordonnées 
cylindriques: 
2 2 $ 2 æ 2 
df,09$,9/ df,0f,14, Lo 


ax? 2 2 e? 2 er F1 af (12.294) 
(| 


Le troisième et dernier terme est très simple à déterminer. Nous remplaçons & par » sin 8 afin 
d'obtenir: 


gs ni 
ag r? sin 18a# 


Î (12.295) 
PE 2.2 
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En rassemblant tous les termes obtenus précédemment, nous obtenons enfin la forme étendue du 
laplacien en coordonnées sphériques si utilisé en physique: 


vf = LE PSI 1. 1 coté, 1 &f 


(12.296) 
o rèr n°08 rêr r 46 rein 6 CE7A 
Nous pouvons raccourcir cette expression et factorisant les termes: 
ss. © 1# 1 t8 1.  & 
V2 f = _. 2 + ——— LP s + LA += (2297) 
8r r8Ë or? 86 rsin 298$ 


Si nous condensons encore un peu, nous obtenons l'expression finale de l'opérateur "laplacien en 
coordonnées sphériques" appelé aussi "laplacien sphérique": 


18/28 1 à 8 1 & 
p-r2(r2) - AE ere (12.298) 
r< & Or} r“ sin 908 08} r“sin CET 


9.6. LAPLACIENS D'UN CHAMP VECTORIEL 


Le laplacien d'un champ vectoriel Fi (x, y,z) est le champ vectoriel défini par (notation tensorielle): 


3 of 
2=1 dx? 
3 + 
: 8 f. 
Af = D —2 (12.299) 
=1 2 
3 4 
d fa 
+ 


2 
= 0x; 


dont les composantes sont les laplaciens des composantes. 
Ainsi, en coordonnées cartésiennes: 
2 2 2 
af . df . d"f 
2 2 2 
ax dy dz 
a? a? a? 
h Ph, Ph 


f = (12.300) 
ul 8x? dy? 7° 
A A 
8x dy? 7° 


Le laplacien d'un champ de vecteurs, appelé fréquemment "laplacien vectoriel", en d'autres systèmes 
de coordonnées est assez simple à obtenir à partir de la connaissance du laplacien d'un champ scalaire 


dans ces mêmes coordonnées. Ainsi, en coordonnées polaires, nous avons pour le laplacien d'un champ 
vectoriel la relation suivante: 
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ua, lé, 1 du 
46° o% eo af 


=—2+—— | (55301) 


et en coordonnées cylindriques: 


du, 1 du, 1] du, du, 
DRE NP Pole à 
40 pêo paf àz7 
dus lu, 1 1 dus AA 
30 pe ef ë7 
du, 2 du, SL 1 du, ” Fu, 


ad pp paf 87 


(12.302) 


et finalement en coordonnées sphériques: 


du, 491%, 1 1 M Pt 1 du 
8? rôr r°48 r? 49 r'sin 9 4# 
d'u, + oi 1” #2 + cotg ous, 1 Puy 
âr° r dr r° a r? 489 r'sin?9 4# 
du, 1 dus, L 4° dus, cot # Ou, = du, 


&r° r ôr 88 r 88 r° sin? 8 4P 


(12.303) 


9.7. IDENTITÉS 


Les opérateurs différentiels scalaires et vectoriels ont des identités remarquables très simples que nous 
retrouverons très souvent en physique. 


Voyons d'abord les relations qui n'ont aucun sens (au cas où vous tomberiez dessus sans faire exprès...): 
rot(div(f)) ou ŸxX(V of) (12.304) 


Le rotationnel d'une divergence n'existe pas puisque l'opérateur rotationnel s'applique à un champ 
vectoriel alors que la divergence est un scalaire. 


rot(A' f) ou VX(A: f) (12.305) 


Le rotationnel d'un laplacien scalaire n'existe pas puisque l'opérateur rotationnel s'applique à un champ 
vectoriel alors que par construction, le laplacien est un scalaire. 


Voyons maintenant quelques propriétés remarquables sans démonstrations (cependant si vous en avez 
besoin car vous n'y arrivez pas seul, n'hésitez pas à nous contacter, nous compléterons): 


I1. Par construction le laplacien scalaire est la divergence du gradient du champ: 
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div(grad(f)) = Vo Ÿ(f)= A f (12.306) 
12. Le rotationnel du gradient est nul: 
ro grad(f}]=Vx(Vf)=0 (12.307) 
Donc si le rotationnel d'une variable vectorielle est nul, la variable peut être exprimée comme le 
gradient d'un potentiel scalaire! C'est une propriété très importante en électromagnétisme et en 


mécanique des fluides! 


Démonstration: 


# 22-22 
al |®\æ) &l(S 
+ à + | afæ\ à (&) + 
VXIVF|I=VXxI—|=|—|—|-—| — = Ô = 
(W) dy AA 8x | & AUS 
2] |2(#)-2{# 
êz êx y Lx 
OIC.Q.FD. 
13. La divergence du rotationnel d'un champ vectoriel est toujours nulle: 
div(rot (7) =0ouVo(Ÿxf)=0 (12.309) 
Démonstration: 
4, A 4, = 8,/2 
Vo(Vxf}=Vo|]a, [xl 7, [[=Vol8,.f -8,% 
8, LA Of 0h 
4, 0,73 d,fa (12.310) 
= 4, 2 4, 4, #3; = d, CM a d,f3) +4, (8.f 0) + d, (8,% = 8,f) 
4, d,72 -ô,Â 
OIC.Q.FD. 


14. Le rotationnel du rotationnel d'un champ vectoriel est égal au gradient de la divergence de ce champ 
moins son laplacien vectoriel: 


rat(rot(f)) = grad(div(f)) - Af ou Vx(ÿx f)=V(Vof))-Af (12311) 


Démonstration: 
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vf JE dy -8f2) (2) (hf 
Ÿ x =Vx|8,.f -8,7, |=|8,|x| 8,.f -8,# 
8,8-8,ñ) (a) (a%-8,f 
, (8,4 - Tor 8,f) DE 
= sea 8,/1)-8,(8,f -8,f) 
(A ñ-8,f)-8,(8,f- 8h) 


Il est ensuite facile de vérifier que cette dernière égalité est égale à: 
8, (8,4 +8, +8.) 
V(Vof)-Af = V(a,f +0, +8,.%)-Af =|a,(8,.f +8, +8,%)|-4 
8, (8h +9,% + 8,4) 


a? de a? 
8, (8,% +8,% +8,2)|-[%%+74,9% 


&x° re &° 
d,|d,1 #0, #0,0) Ph Ph 
8x? dy? 87? 
sr o 
8, (8, TO, f1+8#) )-T Shen (12.313) 
dy & 


CRC PRE 
on 8  & 


| 3, (8,f +8, +8.8)- 8x 8  &° 
dE de D 
a (utra,s 00,5) ÊE-ÈE ÈS 
8 8 
2e(2,4 + 8h) + . 
Re 4, (8,2 -0,2)-0,(8,1 2,2) 
J'TE ATCRA ES "4 | 4, (8,8 -22)-0,(8,2 -09,4) 
8,(8,f +8, * 23 Le Le 2e 8,(8,% -8,/,)-8,(8,% -8,f) 
y 


OC.Q.FD. 


15. La multiplication de l'opérateur nabla par le produit scalaire de deux vecteurs est égale à... (voir 
ci-dessous), qui donne une relation très utile en mécanique des fluides: 


V'(roÿ)=2x(Vxÿ)+5x(Vxx)+{ÿoV).#+{r0V). 5 (12314) 


16. Le produit scalaire du rotationnel d'un vecteur est la différence des opérateurs commutés tel que: 


Page: 967/4839 


[v3.0 - 2013] 


fo(Vxÿ)=ÿo(Vxx)-Vo(xxÿ) (12.315) 


Nous réutiliserons cette dernière relation lors de notre étude en électromagnétisme de la pression de 
radiation (entre autres). 


9.8. RÉSUMÉ 


Dans le cadre de ce site Internet, nous faisons usage des différentes notations présentées et résumées 
dans le tableau ci-dessous. Leur usage permet dans le cadre de différentes théories d'éviter des 
confusions avec d'autres être mathématiques. C'est embêtant certes mais il faudra faire avec. 


 ÉTREMATHEMATIQUE | NOTATIONS 
Gradient d'un champ scalaire VC) V'f Ÿf grad(f) 
Gradient d'un champ vectoriel VF) 

Divergence d'un champ de vecteurs Vof 

Rotationnel d'un champ de vecteurs Ÿ x f r où ) 

Laplacien d'un champ scalaire ON AO DT 
Laplacien d'un champ vectoriel f 


Tableau: 12.1 - Résumé des opérateurs différentiels vectoriels 


Et pour les pragmatiques voici un résumé des explications des opérateurs les plus importants en 
physique: 


- Le gradient signifie "la pente" (exemple: le champ électrique est la pente du potentiel électrostatique). 


Les différentes expressions de l'opérateur gradient (mises sous la forme de l'opérateur nabla) en 
coordonnées cartésiennes, polaires, cylindriques et sphériques sont les suivantes: 


ÿ=-12,2,9! (46 
x dy dz 


Ÿ = LR (12.317) 
ür r 0$ 


[2,10 8) so 
ag’ à 


= 4 14 1 à 

V=l— ——,——— | (12319) 
ôr r 08 ran8 d$ 

- La divergence caractérise un flux de quelque chose qui vient de quelque part, d'une source, ou qui y 

va. Si la divergence n'est pas nulle, c'est qu'il y a concentration autour d'un point, donc la densité 

augmente (ou diminue, c'est selon le signe). Ça peut être la densité de charges électriques ou bien la 

masse volumique. D'où le fameux théorème qui dit que le flux (ce qui passe dans une surface) est égal à 
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l'intégrale de la divergence (ce qui reste). 


Les différentes expressions de l'opérateur divergence (mises sous la forme de l'opérateur nabla) en 
coordonnées cartésiennes, polaires, cylindriques et sphériques sont les suivantes: 


r &œ roÿ 
va LA AR (12.322) 
r œ rOoÿ 


… [1 8(r? 1 (ing 1 à 
V=l——— — mu | (17325) 
r? & ‘rang 089 ‘rsin9 0$ 


- Le rotationnel caractérise l'existence d'un tourbillon (très utilisé en mécanique des fluides). S'il y a un 
tourbillon, on peut suivre une ligne de courant sur une courbe fermée sans qu'elle change de sens: la 
circulation ne sera pas nulle (elle vaut l'intégrale du rotationnel). 


Les différentes expressions du rotationnel en coordonnées cartésiennes, cylindriques et sphériques sont 
les suivantes: 


LARRLA 
Y  & 
ret(F}= _—— (12.324) 
LOC 
0x 
1% _%Y 
rêg & 
+ à 
ro (F) L _ . (12.325) 
10(%) _1æ 
Fr © r 0$ 
— (sin 9/,)- L 
r sin 9 08 rain 8 0$ 
1 ®# 194 
Fxf= 0 (12.326) 
18,,, &ê, 
a) 3e 
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- Le laplacien d'un champ scalaire est le champ scalaire qui mesure la différence entre la valeur de la 
fonction en un point et sa moyenne autour de ce point. En d'autres termes, la dérivée partielle deuxième 
mesure les variations de la pente au point étudiée dans un entourage immédiat et selon une dimension à 
la fois. Si la dérivée partielle deuxième est nulle selon une direction, alors la pente est constante dans un 
entourage immédiat et selon cette dimension, cela implique que la valeur de la fonction au point étudié 


est la moyenne de son entourage (selon une dimension). 


Les différentes expressions du laplacien (mises sous la forme de l'opérateur nabla) en coordonnées 


cartésiennes, polaires et sphériques sont les suivantes: 
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Notes personnelles: 
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13. ALGÈBRE LINÉAIRE 


L y a plusieurs manières d'aborder l'algèbre linéaire. D'abord une manière pragmatique (nous 


commencerons par celle-ci car notre expérience nous a montré que c'est celle qui semblait le mieux 
marcher chez les étudiants) et une manière plus formelle que nous présenterons aussi après la première. 


Ainsi, rappelons que nous avions étudié dans le chapitre de calcul algébrique comment déterminer 
l'intersection (si elle existe) de l'équation de deux droites (nous pouvons étendre le problème bien 
évidemment à plus de deux droites) dans 1p? données par: 

nn =axth et y, =axtb, (131) 


où 4,4 ER. 


En cherchant donc la valeur de x pour laquelle: 


HN 7 J2 (32) 
Ainsi nous pouvions écrire: 
à —b, 
dx tb, =Gxth—x=—— (133) 
a 


Cependant, il existe une autre manière de présenter le problème comme nous l'avons vu en méthodes 
numériques (section d'informatique théorique). Effectivement, nous pouvons écrire le problème sous la 
forme d'un bloc d'équations: 


H = 4x + 
nes (13.4) 
Ya *@x+b 
et comme nous cherchons y, = y, = y, nous avons: 
Y-4x= 
TA (13.5) 
Y 7 3x b, 


Cette écriture s'appelle comme nous l'avons présenté dans le chapitre de Méthodes Numériques 
(section d'Informatique Théorique) un "système linéaire" que nous pouvons résoudre en soustrayant ou 
en additionnant les lignes entre elles (l'ensemble des solutions étant toujours égal), ce qui nous donne: 


Y-&x=à 
PP LI = |'(-D (36) 
—ax+a,x= à —-b, 


et nous voyons que nous retombons sur la solution: 
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il y donc deux manière de présenter un problème d'intersection de droites: 
1. Sous forme d'équation 
2. Sous forme de système 


Nous allons nous intéresser dans une partie ce chapitre à la deuxième méthode qui va nous permettre à 
l'aide des outils vus dans le chapitre de calcul vectoriel de résoudre les intersections non plus d'une ou 
plusieurs droites mais d'une ou plusieurs droites et de plans, hyperplans dans respectivement 
R°,R°...,R". 


Il y a cependant une condition à remplir: comme nous l'avons vu dans l'exemple précédent, nous ne 
pourrions pas résoudre un système d'équations à deux inconnues si nous n'avons qu'une seule équation. 
C'est la raison pour laquelle il faut et il suffit pour un système d'équations à n inconnues d'avoir au 
moins n équations. Ainsi, nous parlons de: "systèmes de n équations à n inconnues" et comme nous le 
verrons plus loin, ceci implique trivialement d'avoir une matrice carrée (le concept de "matrice" sera 
défini un peu plus loin). Nous démontrerons aussi que pour qu'un tel système ait des solutions non 
toutes nulles, il faut que nous ayons un déterminant de la matrice qui soit non nul (le concept de 
"déterminant" sera défini plus loin) et donc que la matrice soit inversible. 


1. SYSTÈMES LINÉAIRES 


Définition: Nous appelons donc "système linéaire", ou simplement "système", toute famille d'équations 
de la forme: 


dA + 9% te + xs © à 


an + 2222 + +, © bi 


où chaque ligne représente l'équation d'une droite, plan ou hyperplan (cf. chapitre de Géométrie 
Analytique) et 4, les "coefficients du système", à, les "coefficients du second membre" et les x, les 
"inconnues du système". 


Si les coefficients du second membre sont tous nuls, nous disons alors que le système est un "système 
homogène" et alors celui-ci admet au moins la solution triviale où les x, sont tous nuls. 


Nous appelons "système homogène associé au système", le système d'équations que nous obtenons en 
substituant des zéros aux coefficients du second membre. 


Rappelons les élément suivants: 
- L'équation d'une droite (cf. chapitre d'Analyse Fonctionnelle) est donnée par: 
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en posant x = X,y = X. 


- L'équation d'un plan (cf. chapitre de Géométrie Analytique) est donnée par: 
A1X + 2% + 3X3 =D (13.10) 
en posant x = x%,Y = X3,Z = 7%. 


- L'équation d'un hyperplan est très facilement (si vous ne voyez pas comment faites le nous savoir 
nous le préciserons) généralisable à partir de la démonstration de celle du plan et nous obtenons ainsi: 


A +@4x% +..+4,2x, =“b (13.11) 
en posant x = %,)Y = %,2Z = 2%, 


Nous écrivons souvent un système linéaire sous la forme condensée suivante: 


# 
dax; “à, i=12..,"m (13.12) 


J=1 


Nous appelons "solution du système" tout n-uplet (x?,x9,...,x?) tel que: 


Résoudre un système signifie trouver l'ensemble des solutions de ce système. Deux systèmes à 

n inconnues sont dits "systèmes équivalents" si toute solution de l'un est solution de l'autre, autrement 
dit, s'ils admettent le même ensemble de solutions. Nous disons parfois que les équations d'un système 
sont des "équations compatibles" ou "équations incompatibles", suivant que ce système admet au moins 
une solution ou n'en admet aucune. 


Nous pouvons également donner bien sûr une interprétation géométrique à ces systèmes. Supposons 
que les premiers membres des équations du système soient non nuls. Alors, nous savons que chacune de 
ces équations représente un hyperplan d'un espace affine (voir le chapitre de calcul vectoriel) de 
dimension n. Par conséquent, l'ensemble des solutions du système, regardé comme ensemble de 
n-uplets de coordonnées, représente une intersection finie d'hyperplans. 


Exemple: 
Le système d'équations suivant: 


4 — 3x; = -3 
2% —3X2—%3 = 2 (13.14) 


A +23 -5% 1 


noté plus conventionellement dans les petites classes sous la forme: 
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x — 3z = 5 
2x-5y-z=-2 (13.15) 
x+2y-5z=1l 


Aurait comme solutions les points représentant l'intersection des trois plans définis par les trois 
équations. Mais comme nous pouvons le voir visuellement avec Maple à l'aide des commandes 
suivantes: 


>with(plots); 
>implicitplot3d({x-3*z=-3,2%x-5*y-7=-2,x+2*y-5*7=1},x=-3..3,y=-3..3,7--3..3); 


Figure: 13.1 - Représentation d'un système de 3 équations à 3 inconnues avec Maple 


ce système n'a aucune solution. Ce qui peut soit se vérifier à la main, soit avec Maple en écrivant: 


>solve({x-3*z=-3,2*x-5*ÿ-7=-2,x+2*y-D*7=1},{x,y,z}); 


Remarque: Pour la méthode de résolution "classique" de ces systèmes, nous renvoyons le lecteur au 
chapitre traitant des méthodes numériques dans la section d'informatique. 


C'était donc la manière pragmatique de voir les choses... passons maintenant à la seconde façon un peu 
plus … mathématique (mais qui reste très simple): 
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2. TRANSFORMATIONS LINÉAIRES 


Définition: Une "transformation linéaire" ou "application linéaire" A est une application d'un espace 
vectoriel E vers un espace vectoriel F telle que avec K étant IR ou €: 


Vi ReE AG+R)=AG)+AGR) 
13.16) 
VieEaekK  A(aï)=aA(x) 


plus fréquemment donné sous la forme (car l'application linéaire est souvent assimilée à une matrice): 


VA DEE AA +2)= A +46 


(13.17) 
Vre£Æaek Aax=aAx 


ceci constitue, pour rappel, un endomorphisme (cf. chapitre de Théorie Des Ensembles). 


La première propriété spécifie que la transformée d'une somme de vecteurs doit être égale à la somme 
des transformées, pour qu'elle soit linéaire. La deuxième propriété précise que la transformée d'un 
vecteur auquel nous avons appliqué un facteur d'échelle (homothétie) doit aussi être égale à ce facteur 
appliqué sur la transformée du vecteur original. Si l'une ou l'autre de ces deux propriétés n'est pas 
respectée, la transformation n'est alors pas linéaire. 


Nous allons maintenant montrer que toute transformation linéaire peut être représentée par une 
matrice: 


Soient (%,,%,,...,V, | les vecteurs de base pour E et (%,#,,....,#,) ceux de F. Avec ces bases, nous 
pouvons représenter n'importe quels vecteurs *€ Æ,ÿ € À avec les combinaisons linéaires suivantes 
(cf. chapitre de Calcul Vectoriel): 
# # 
Amd x, PS y (1318) 
3 IT 
Soit la transformation linéaire A qui applique E sur F (4:ÆE —> F ). Donc A(X)= ÿ que nous pouvons 


réécrire de la façon suivante: 


# Mt 
A 2 = y (1319) 
J 


il 


mais puisque À est un opérateur linéaire par définition, nous pouvons aussi écrire: 


En considérant maintenant que les vecteurs Af5,) sont des éléments de F, nous pouvons les réécrire en 


tant qu'une combinaison linéaire de ses vecteurs de base: 


Af,) = da (13.21) 


il 
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Ainsi, nous obtenons: 


# # Lu Li 
DaA()- x dat = dé ci20 
J=l J=l il il 


En inversant l'ordre des sommations, nous pouvons écrire: 


Lu x # 
D'AD ax; =D (1323) 
il 


EI jl 


et en réarrangeant cette dernière relation, nous produisons le résultat: 


à ax, -» = 0 (1324) 


il Fel 


Finalement, en se rappelant que les vecteurs de base % doivent être indépendants, nous pouvons 
conclure que leurs coefficients doivent forcément être nuls, donc: 


# 
Sax, =} (13.25) 


J=l 
Ce qui correspond au produit de "matrice": 
un dm x || A Ï 
E a TRIER ES 2 (13,26) 
Al 2 ge Xx Yy 
que nous pouvons noter: 
AX=ÿ (13.27) 


Autrement dit, toute transformation linéaire peut être décrite par une matrice A qu'il s'agit de multiplier 
avec le vecteur que nous voulons transformer, pour obtenir le vecteur résultant de la transformation. 


3. MATRICES 


Nous appelons donc "matrice" à m lignes et n colonnes, ou "matrice de type mn" (le premier terme 
correspond toujours aux lignes et le second aux colonnes, pour s'en souvenir il existe un bon moyen 
mnémotechnique: le président LinColn - abréviation de Ligne et Colonne...), tout tableau de nombres: 


1 Œ; ie 
a a ds... à 
21 2 2 2» _ 
’ (13.28) 
1 3 LTÉE jy 
An  Aw3 Dés de 


Nous désignons souvent une matrice de type #:*»# plus brièvement par: 
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(Gÿhéiem (13.29) 
1£j£x 


ou simplement par (a;). 


Le nombre 4;; est appelé "terme ou coefficient d'indices i, j". L'indice i étant appelé "indice de ligne” 
et l'indice j "indice de colonne". 


Nous notons 4f,,, | £\ l'ensemble des matrices #7 * x dont les coefficients prennent leurs valeurs dans 


K (pouvant être IR ou € par exemple). 


Lorsque #7 = #, nous disons que (4; ) est une "matrice carrée" d'ordre n. Dans ce cas, les termes 


… 11 . 11 
A1»... dy SONt appelées "termes diagonaux". 


Nous appelons également une matrice à une seule ligne "matrice-ligne" et une matrice à une seule 
colonne "matrice-colonne”. Il est clair qu'une matrice colonne n'est rien d'autre qu'un "vecteur- 
colonne". Par la suite, les lignes d'une matrice seront assimilées à des matrices-lignes et les colonnes à 
des matrices-colonnes. 


L'intérêt de la notion de matrice va apparaître tout au long des textes qui vont suivre mais la raison 
d'être immédiate de cette notion est simplement de permettre à certaines familles finies de nombres 
d'être conçues sous la forme d'un tableau rectangulaire. 


Nous assignerons aux matrices des symboles propres, à savoir les lettres latines majuscules: A,B.... et 
aux matrices-colonnes des symboles à savoir les lettres minuscules vectorielles 4,à ....; nous les 


appellerons d'ailleurs indifféremment matrices-colonnes ou vecteurs-colonnes. 


Nous appelons "matrice nulle", et nous la notons O, toute matrice dont chaque terme est nul. Les 
matrices-colonnes nulles sont également désignées par le symbole vectoriel: Ü. 


Nous appelons "matrice unité d'ordre n" ou "matrice identité d'ordre n", et nous notons ,, ou 
simplement 1, la matrice carrée d'ordre n : 


1 0 … 0 

0 1 … 0[ 
0 (13.30) 

| 


Nous verrons plus loin que la matrice nulle joue le rôle d'élément neutre de l'addition matricielle et la 
matrice unité d'élément neutre de la multiplication matricielle. 


Attention! Lorsque nous travaillons avec les matrices à coefficients complexes il faut toujours utiliser le 
terme "matrice identité" plutôt que "matrice unitaire" car dans le domaine des nombres complexes la 
matrice unitaire est un autre objet mathématique qu'il convient de ne pas confondre! 


Nous allons maintenant revenir brièvement sur la définition de "rang d'une famille finie" que nous 
avons vue dans le chapitre de Calcul Vectoriel. 
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Rappel: Nous appelons "rang" d'une famille de vecteurs la dimension du sous-espace vectoriel de E 
qu'elle engendre. 


Ainsi, soit (4,,4,,...,4,) les colonnes d'une matrice À, nous appelons "rang de A", et nous notons 
rg(4), le rang de la famille (4, ,4,,...,4,). 


Dans un langage un peu plus familier (...) le rang d'une matrice est donné par le nombre de matrices- 


colonnes qui ne peuvent s'exprimer par la combinaison et la multiplication par un scalaire d'autres 
matrices-colonnes de la même matrice. 


Remarque: S'il y a des difficultés à déterminer le rang d'une matrice il existe une technique 
"d'échelonnage" des matrices que nous allons voir plus tard qui permet d'effectuer ce travail très 
rapidement. 


Définition: Nous appelons "matrice associée au système": 


dn% +22 te tu xy © à 


l'objet mathématique défini par: 


1 4 dj; x 

du je. | 
(13.32) 

G;1 d;2 y... jy 

Cul 2 APTE Eux 


c'est-à-dire la matrice A dont les termes sont les coefficients du système. Nous appelons "matrice du 
second membre du système linéaire", ou simplement "second membre du système", la matrice-colonne 
à = (b,) dont les termes sont les coefficients du second membre de ce système. Nous appelons 


également "matrice augmentée associée au système" la matrice obtenue de A en ajoutant 3 comme (n + 
1)-ème colonne. 


Si nous considérons maintenant un système de matrice associée A et de second membre 3 . Désignons 
toujours par (4,,4,,...,4,) les colonnes de A. Le système s'écrit alors de manière équivalente sous la 


forme d'une équation vectorielle linéaire: 
Ad + Æd +...+2,4, =b (13.33) 


Maintenant rappelons un théorème que nous avons vu en calcul vectoriel: pour que le rang d'une 
famille de vecteurs (%,%,,...,%,) soit égal au rang de la famille augmentée (%,,%,,...,2%,,ÿ), il faut et il 


suffit que le vecteur ÿ soit combinaison linéaire des vecteurs %,x,,...,X,. 


Il s'ensuit que notre système linéaire sous forme vectorielle admet au moins une solution (x},x9,...,x%) 
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si le rang de la famille (4,,4,,...,&,) est égal au rang de la famille augmentée (4,4, ...,4, .b) et cette 
solution est unique si et seulement si le rang de la famille (4, ,4,,...,4,) est n. 


Ainsi, pour qu'un système linéaire de matrice associée A et de second membre ; admette au moins une 
solution, il faut et il suffit que le rang de A soit égal au rang de la matrice augmentée (4 | à) . Si cette 


condition est remplie, le système admet une seule solution si et seulement si le rang de A est égal au 
nombre d'inconnues autrement dit, les colonnes de À sont linéairement indépendantes. 


Nous disons qu'une matrice est "échelonnée" si ses lignes satisfont aux deux conditions suivantes: 


C1. Toute ligne nulle n'est suivie que de lignes nulles 


C2. L'indice de colonne du premier terme non nul de toute ligne non nulle est supérieur à l'indice de 
colonne du premier terme non nul de la ligne qui la précède. 


Une matrice échelonnée non nulle est donc de la forme: 


4; d, 
0 es … ant 
0 O0 kæ a sé 
0 0 O0 o 


OÙ À he < J, et G,,%,,..,4; Sont des termes non nuls. Bien entendu, les lignes nulles 


terminales peuvent manquer. 


Remarque: Nous supposerons relativement évident que les matrices nulles et les matrices unités 
sont échelonnées. 


Les colonnes d'indice ;,,./,,...,.j, d'une matrice échelonnée sont clairement linéairement 
indépendantes. Envisagées comme des vecteurs-colonnes de 1m”, elles forment donc une base de cet 
espace vectoriel. En considérant les autres colonnes également comme des vecteurs-colonnes de mp”, 
nous en déduisons qu'elles sont nécessairement combinaison linéaire de celles d'indice j,,.j,,...,.j, et 
donc que le rang de la matrice échelonnée est r. 


Nous noterons que r est aussi le nombre de lignes non nulles de la matrice échelonnée et également le 
rang de la famille des lignes de cette matrice, puisque les lignes non nulles sont dès lors manifestement 
indépendantes. 


Nous pouvons dès lors nous autoriser un certain nombre d'opérations élémentaires (supplémentaires) 
sur les lignes des matrices qui nous seront fort utiles et ce, sans changer son rang: 


P1. Nous pouvons permuter les lignes. 


Remarque: La matrice est juste une représentation graphique esthétique d'un système linéaire. 
Ainsi, permuter deux lignes ne change aucunement le système. 
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P2. Multiplier une ligne par un scalaire non nul 


Remarque: Cela ne changeant en rien l'indépendance linéaire des vecteurs-lignes. 


P3. Additionner à une ligne originelle, un multiple d'une autre 


Remarque: La ligne originelle disparaîtra au profit de la nouvelle qui est indépendante de toutes les 
(anciennes) autres. Le système reste ainsi linéairement indépendant. 


Toute matrice peut être transformée en matrice échelonnée par une suite finie d'opérations de type P1, 
P2, P3. C'est cette technique que nous utilisons dans le chapitre traitant des algorithmes pour résoudre 
les systèmes linéaires. 


Il est donc évident que les opérations élémentaires sur les lignes d'une matrice ne modifient pas le rang 
de la famille des lignes de cette matrice. Or, nous avons observé que le rang de la famille des lignes 
d'une matrice échelonnée est égal au rang de la famille des colonnes, c'est-à-dire au rang de cette 
matrice. Nous en concluons que le rang de n'importe quelle matrice de type ##* # est également le rang 
de la famille des lignes de cette matrice. 


Comme corollaire de cette conclusion, il apparaît que: 
rg(AÀ) £ min(r2,#) 


Lors de la résolution de systèmes linéaires de m équations à n inconnues il apparaît, comme nous 
l'avons déjà fait remarquer tout au début de ce chapitre, qu'il doit y avoir au moins un nombre égal 
d'équations que d'inconnues ou plus rigoureusement: le nombre d'inconnues doit être inférieur ou égal 
au nombre d'équations tel que: 


# = rg(A|b) < 


3.1. OPÉRATIONS SUR LES MATRICES 


Rappelons que nous avons vu lors de notre étude du calcul vectoriel que les opérations de 
multiplication d'un vecteur par un scalaire, d'addition ou soustraction de vecteurs entre eux et 
l'opération de produit scalaire formait dans le sens ensembliste du terme un "espace vectoriel" (voir le 
chapitre de théorie des ensembles) possédant ainsi aussi une "structure algébrique vectorielle". Ceci 
sous la condition que les vecteurs aient bien sûr les mêmes dimensions (ce constat n'étant pas valable si 
au lieu du produit scalaire nous prenions le produit vectoriel). 


Au même titre que les vecteurs, nous pouvons multiplier une matrice par un scalaire et additionner 
celles-ci entre elles (tant qu'elles ont les mêmes dimensions...) mais en plus, nous pouvons aussi 
multiplier deux matrices entre elles sous certaines conditions que nous définirons ci-après. Cela fera 
également de l'ensemble des matrices dans le sens ensembliste du terme, un espace vectoriel sur le 
corps K et possédant ainsi aussi une "structure algébrique vectorielle". 


Ainsi, un vecteur pourra aussi être vu comme une matrice particulière de dimension # x # = mx1 et 
opérer dans l'espace vectoriel des matrices. En gros..., le calcul vectoriel n'est qu'un cas particulier de 


l'algèbre linéaire. 
Page: 984/4839 


[v3.0 - 2013] 


Définitions: 


D1. Soient 4,8 € 4, (R 1. Nous appelons "somme de À et B" la matrice Ce A, (IR \ dont les 
coefficients sont: 


Cÿ = aÿ tb, LÉ MISES (1327 


D2. Soient 4€ 4, (IR \ une matrice et 4 < R un scalaire. Nous appelons "produit de À par 4" la 


matrice C'e M, (IR | dont les coefficients sont: 
Cs = A; 1£i<m,l<j<An (13.38) 


De ses deux définitions nous pouvons donc effectivement conclure que l'espace/ensemble des matrices 
est bien un espace vectoriel et possède ainsi une structure algébrique vectorielle. 


D3. Soient E, F, G trois espaces vectoriels de bases respectives £,.F,9 et f € L(E, F),g e L(F,G) 
deux applications linéaires (voir théorie des ensembles aussi pour un rappel). 


Notons À la matrice de f relativement aux bases €,F et B la matrice de g relativement aux bases F,9. 
Alors la matrice C de ge f (voir la définition d'une fonction composée dans le chapitre d'analyse 
fonctionnelle) relativement aux bases £,£ est égale au produit de B par À noté BA. 


f E Eof 40 
E>FrSG tra (0% 


ESFrSc%ga (340) 


Donc soient Be W,,(Ri et 4e M, (R\, nous appelons "produit matriciel" ou "multiplication 


matricielle" de B par A et nous notons BA, la matrice Ce ,, (IR \ dont les coefficients sont: 


Cu D ban 1<i<p,l£k&£<m| (13.41) 


Il est important de remarquer que contrairement à l'addition, À et B peuvent avoir des dimensions 
différentes. Toutefois! le nombre de lignes de À doit être égal au nombre de colonnes de B, comme 
l'indique l'indice n des deux matrices. Donc dans le produit BA, si B est une matrice #1 x #, A doit être 
une matrice *# Xp, quel que soit p. 


En notant par des lettres latines majuscules les matrices et par les lettres grecques minuscules les 
scalaires, le lecteur vérifiera aisément (nous pouvons rajouter les démonstrations sur demande) les 
relations: 


ABC I=eADTAC 
(A+B)C = AC+ BC 


(AA1B = AlA4B1 (13.42) 
(ABIiC = ABC) 
AB # BA 
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Il est surtout important de se rappeler de la dernière ligne comme quoi la multiplication matricielle n'est 
pas commutative. 


Remarque: L'ensemble 4, (R) des matrices carrées d'ordre n à coefficients dans IR muni de la 


somme et la multiplication usuelles des matrices forme un anneau (voir chapitre de théorie des 
ensembles). C'est vrai plus généralement si les coefficients des matrices sont pris dans un anneau 
quelconque: par exemple l'ensemble Af,, (Z) des matrices à coefficients entiers est un anneau. 


3.2. TYPE DE MATRICES 


Afin de simplifier les notations et la longueur des calculs nous allons introduire ici les matrices types 
que le lecteur pourra rencontrer tout au long de sa lecture du site (et pas que dans la partie de 
mathématiques pures!). 


Définitions: 


D1. Soit À une matrice carrée (c'est-à-dire 4e 4f,,, (R 1). La matrice À est dite "matrice inversible" ou 


"matrice régulière" si et seulement si 4-1 est telle que: 


AA =1, =1 (1349) 


où: 
ALL PET 5 
US ES 
= (13.44) 
Q 0 l 


si tel n'est pas le cas, nous disons que A est une "matrice singulière". 


Cette définition est fondamentale, elle a des conséquences extrêmement importantes dans toute 
l'algèbre linéaire et aussi dans la physique (résolution de système linéaires, déterminant, vecteurs et 
valeurs propres, etc.) il convient donc de s'en souvenir. 


D2. Soit: 
1 3 x 
a a a 
1e #1 (13.45) 
y] u2 gs 


une matrice de 4f,, (IR\. Nous appelons "matrice transposée" de À, la matrice notée 47 (le Ten 
exposant est selon les ouvrages en majuscule ou en minuscule), de 4f,,(IR\ définie par (nous 


transposons les lignes en colonnes et les colonnes en lignes): 
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Gun a ul 

3 Ma - y | 
A = Pl (13.46) 

Da CS de 


Voici quelques propriétés intéressantes (nous seront par ailleurs utiles plus tard lors d'un théorème 
fameux!) de la transposée: 


(4 F = À 
(44+8) = 44 +87,4eR 
(AB) = B'AT 
(4 ï = (A7 Fe da 
et aussi une propriété importante de la matrice transposée (la vérification se fait aussi par l'exemple): 
AP of = PoAF (1348) 


La matrice transposée est très importante en physique et en mathématique dans le cadre de la théorie 
des groupes et symétries! Il convient donc aussi de se souvenir de sa définition. 


D3. Soit: 
1 A3 x 
a a so 
A= | 7 #1 (13.49) 
y Aya Type 


une matrice de 4f,,(€\1. Nous appelons "matrice adjointe" de À, la matrice, de Àf,,(€\ définie par: 


dy dy . (CNT 
A = ll (13:50) 
x Au Eux 


qui est donc la complexe conjuguée de la matrice transposée ou si vous préférez... la transposée de la 
matrice conjuguée A (dans le cas de coefficient réels. on se passera de la conjuguer!). Pour simplifier 
les écritures nous la notons simplement 4 (écriture fréquente en physique quantique et algèbre 
ensembliste). 


Remarque: Relation triviale (qui sera souvent utilisée en physique quantique des champs): 


(48)! = BAT (1351) 
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DA. Par définition, une matrice est dite "matrice hermitique" ou "matrice hermitienne" ou "matrice 
self-adjointe" ou encore "matrice autoadjointe".… si elle est égale à son adjointe (matrice transposée 
conjuguée) tel que: 


A= Ai (13:52) 


DS. Soit À une matrice carrée de 4, (IR \, la "trace" de À, notée #\ Ai est définie par: 


Lu 
tr(A)= Sa) (13.53) 


il 


Quelques relations utiles y relatives (dont nous pouvons rajouter les démonstrations détaillées sur 
demande): 


triAA+Bi= tr AittriBi 
tr(AB\=triB4Ai,vAe M, (Ri,vVBeM, (R) 


D6. Une matrice À est dite "matrice nilpotente" si en la multipliant successivement par elle-même elle 
peut donner zéro. En clair, s'il existe un entier x tel que: 


Remarque: Pour se souvenir de ce mot, nous le décomposons en "nil" pour nulle et "potent” pour 
potentiel. Ainsi, quelque chose de nilpotent est donc quelque chose qui est potentiellement nul. 


D7. Une matrice À est dite "matrice orthogonale" si ses éléments sont réels et si elle obéit à: 


ce qui se traduit par (où ä, est le symbole de Kronecker): 
AA=1- [&] (13.57) 


Les vecteurs colonnes de la matrice sont donc normés à l'unité et orthogonaux entre eux (ou de même 
avec ses lignes!). Ainsi une matrice orthogonale représente une base orthonormée! 


Remarques: 
R1. C'est typiquement le cas de la matrice de la base canonique, ou de toute matrice diagonalisable. 


R2. Si au lieu de prendre simplement une matrice avec des coefficients réels, nous prenons une 
matrice à coefficients complexes avec sa transposée complexe (matrice adjointe). Alors, nous 
disons que A est une "matrice unitaire" si elle satisfait à la relation ci-dessus! 


Nous reviendrons plus tard, après avoir présenté les concepts de vecteurs et valeurs propres, sur un cas 
particulier et très important de matrices orthogonales (appelées "matrices de translations"). 


Page: 988/4839 


[v3.0 - 2013] 


Signalons encore une autre propriété importante en géométrie, physique et statistiques des matrices 
orthogonales. 


Soit f(x) = A*+8, où A est une matrice orthogonale et 3 £ mg”. Alors f (respectivement A) est une 
isométrie. C'est-à-dire que: 


LO-foI-1r-5] vx ÿeR* (3:59) 
Démonstration: 


LO-SHf-F-/H) (7-7 6))-(4- 4) (4 #) 


= A(x-ÿy)oA(x-ÿ)= (aa (&-5) ) (13.59) 


et donc nous avons bien: 
@-fOI= 17-51 «3:60 


Donc en d'autres termes: Les matrices orthogonales sont des applications linéaires qui conservent la 
norme (les distances). 


OIC.Q.F.D. 


D8. Soit 4e M, (IR | une matrice carrée. La matrice A est dite "matrice symétrique" si et seulement si: 


TE = — 
A AS à; al (13.61) 


Nous retrouverons cette définition en calcul tensoriel. 


DS. Soit 4e M, (IR | une matrice carrée. La matrice A est dite "matrice anti-symétrique" si et 


seulement si: 


ce qui impose que: 
Diet el (13:63) 
Nous retrouverons cette définition dans le chapitre de Calcul Tensoriel. 


D10. Soit 4e M, (IR | une matrice carrée. La matrice A est dite "matrice triangulaire supérieure" si et 


seulement si: 
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wi.je(l.:.#) 0 ia; = 0) 


dj dj3 … Lis 
0 à a (13.64) 
A= 7: Co A=M 
(e] 0 &; 
0 O0 0 a 


D11. Soit Soit 4e 4, (IR | une matrice carrée. La matrice A est dite "matrice triangulaire inférieure" si 


et seulement si: 


Vi,je {ln .(i< j= a, =0) 
Gi ( ( (] 


0 0 (13.65) 
de dy Ga n=m 
. 3 DÙ 
y A2 ve Tux 


D12. Soit De 4, (IR, une matrice carrée. La matrice D est dite "matrice diagonale" si et seulement 
si: 


Vi,je{l..,mw),(ir j=d,=0) (1366) 
La notation habituelle d'une matrice diagonale D étant: 


D = diag{d,,d,,...,d,) 


d\=du.d) =dp.….d, =d 


D13. Soient E un espace vectoriel, de dimension n et deux bases &,B' de E: 


B(a,8,,...e,),8"(8",8 :,..,8,) (13.68) 


Nous appelons "matrice de passage" de la base # à la base 8, et nous noterons P la matrice de 
W,, | Æ1 dont les colonnes sont formées des composantes des vecteurs de # sur la base # (voir plus 


loin traitement détaillé des changements de base pour plus d'infos). 


Nous considérons le vecteur X1x,,x,,...,x,1 de E qui s'écrit dans les bases B14,,8,,...,8,1 et 


B'i8,8",,.,8",1 suivant les relations: 


D 7 =S xe,B8": x = ++; 8, (13.69) 
il il 
Soit: 
x X' 
5 _| #2 _. X° 
À = 6 (13.70) 
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le vecteur de x* formé des composantes de x dans la base # et respectivement le vecteur formé des 
composantes de * dans la base #'. Alors: 


X'=PIAY (41371 


relation pour laquelle la démonstration détaillée sera donnée plus loin lors de notre étude des 
changements de base. Nous avons également: 


X = PX" (13.72) 


Remarques: 


R1. Si lorsqu'un vecteur est donné et que sa base n'est pas spécifiée, c'est qu'il s'agit dès lors 
implicitement de la base canonique: 


L000 
(8,8,8)=10 1 O0! (13.73) 
DM 
qui laisse invariant la multiplication par un vecteur quelconque et lorsque la base utilisée est notée 
(8, | et n'est pas spécifiée, c'est qu'il s'agit également de la base canonique. 
R2. Si un vecteur est donné par rapport à la base canonique, ces composantes sont dites 
"covariantes", dans le cas contraire, où si elles sont exprimées après suite dans une autre base non 


canonique, alors nous disons que les composantes sont "contravariantes" (pour plus de précisions 
sur le sujet voir le chapitre de calcul tensoriel). 


3.3. DÉTERMINANTS 


Nous allons nous intéresser aux déterminants dans le point de vue du physicien (celui de mathématicien 
étant assez rébarbatif.….). En physique (que ce soit en mécanique classique ou physique quantique des 
champs), en chimie ou en ingénierie, nous aurons fréquemment des systèmes linéaires à résoudre. Or, 
nous avons vu maintenant qu'un système linéaire: 


dnA + 2% et Guy © à 


duA + 2% +... +@,x, “à à 
a + dy2%2 +. + Aux Xy =: b, 
peut être écrit sous la forme: 
Œn n Ex À à 
LE Alle 4x=8 (375 


y] ya iS y Xy b, 
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et nous savons que les seuls systèmes linéaires résolubles sont ceux qui ont autant d'équations que 
d'inconnues. Ainsi, la matrice A doit être une matrice carrée f,.. 


Si une solution existe, il existe alors une matrice-colonne (ou "vecteur") X telque 4: X = B ce qui 
implique: 


X=A7.8B 


Qu'impose cette relation ? Eh bien c'est relativement simple mais à la fois très très important: pour 
qu'un système linéaire ait une solution, il faut que la matrice À soit inversible ! Quel rapport avec le 
déterminant alors ? C'est simple: les mathématiciens ont cherché comment s'écrivaient les inverses des 
matrices de systèmes linéaires dont ils savaient qu'il y avait une solution et ils sont arrivés après 
tâtonnements successifs à déterminer une sorte de formule qui permette de vérifier si la matrice est 
inversible ou non. Une fois cette formule trouvée, ils ont formalisé (comme ils savent si bien le faire…..), 
avec une très bonne rigueur, le concept entourant cette formule qu'ils ont appelé "déterminant". Ils y 
sont tellement bien arrivés d'ailleurs qu'on oublie parfois qu'ils ont procédé ainsi... 


Remarque: Si une matrice d'un système linéaire n'est pas inversible, cela a pour conséquence qu'il 
existe soit aucune solution, soit une infinité de solutions (comme à l'habitude quoi...) 


Nous allons ci-dessous d'abord nous intéresser à la manière de construire le déterminant en définissant 
un type d'application particulière. Ensuite, après avoir vu un exemple simple et interprétable du calcul 
d'un déterminant, nous nous attacherons à déterminer la formule de celui-ci dans le cas général. Enfin, 
une fois ceci fait, nous verrons quelle est la relation qui lie l'inverse d'une matrice et le déterminant. 


Dans ce qui suit tous les espaces vectoriels considérés sont de dimension finie et sur le corps € des 


nombres complexes (ceux qui le préfèrent pourront prendre IR comme corps de base, de fait nous 


pourrions prendre un corps quelconque). 


D'abord nous allons faire un petit peu de mathématique (un peu rébarbative) avant de passer à du 
concret. 


Fx..xy 
RS CU 
n fois 
canonique de ç*. (©) est l'ensemble des matrices carrées # x # à coefficients dans €. 


Soit V un espace vectoriel, nous écrirons j/* au lieu de . (8,,..,8, | désignera la base 


Définitions: 


D1. Une "application multilinéaire" sur un espace V est par définition une application g:}"* € qui 


est linéaire en chacune de ces composantes. C'est-à-dire: 


PA ,..., 4, AU + #° Vite D) 


Es Es 


ce Ride Te An) + 4° PA ver Ej ter pee 2e) 


pour tout À,4E€ £ et %,,#,ve F où les % sont des vecteurs. 
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Remarque: Une application multilinéaire non nulle n'est pas une application linéaire de l'espace 77” 


dans €. Sauf si » = 1. Effectivement, cela se vérifie de par la définition de l'application linéaire 


versus celle de l'application multilinéaire: 


APR, Be k) # QAR, 1%. ÂX,) 
EUR Rue Re) + ER Bus 2) # O2H, 26... 2) 


D2. Une "application multilinéaire alternée" sur V est par définition une application multilinéaire qui 
vérifie la condition suivante: 


x. nr À j4 > À j#25 el An. *", À 41 À À rar .. a (13.79) 
pour tout ÿ = 1...#,%x, € W. Ainsi la permutation de deux vecteurs qui se suivent change le signe de @. 


Ainsi, si @ est une application multilinéaire, alors & est alternée si et seulement si x, € W, j = 1... 


nous avons: 
PAR +. Rs À js À ÿ#25.s Any) © O (13.80) 


Démonstration: & étant définie comme alternée, nous avons donc: 


En 


AR... X X js À j425.. An) = ie ou 
> x... je XX j42r 6 si 5%; je X 42e. An) =0 
ee 29% ,...,2X;, 7; NE #25. le 


(13.81) 
> ax... js À; » À j4+25. A) =0 
OIC.Q.FD. 


et voilà ce qui nous intéresse: 


D3. Un "déterminant" est par définition (par imposition) une application multilinéaire alternée 
e Lo Lo Zee 
DE X..XE, € vérifiant de plus: 


nfois 


D(a,.,8,)=1 (13.82) 


Remarque: Les colonnes d'une matrice carrée forment n vecteurs et nous voyons donc qu'un 
déterminant D sur ç* induit une application 5 de M,(€)— € (où 4f,(©) est l'espace des 


matrices carrées # x # à coefficients dans €) définie par (M) = D(ña,..,,) où Pi est la i-ème 


colonne de M. Par la suite, nous ferons l'abus d'écriture qui consiste à confondre D et 5. 


Etudions le cas # = 2. Si D est un déterminant, pour tout vecteur: 
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=A'a t{'e,ÿ=a'a + Be (13.83) 
nous avons: 
D(A'a +u'e,a'e + É'e) (13.84) 
Comme D est multilinéaire, nous avons: 


DQA'a+u'e, aa +8'e)=AD(a,a'e + 8'e,) + uD(e,,a'a + B'e,) 

= Al aD(a,a) + 8D(a,8,))1 + HiaD(e,,a) + 8D(e,,8,)1 (13.85) 

= À" a D@G,a)+ 4: 8: D(G,2) + u'aD(e,a) + u 8: D(:,8) 
et comme elle est surtout multilinéaire alternée, nous avons donc: 

D(A'â + y &.a à + B'é)=A 8 DG.&)- 4 a D@A.&) = A B-u'æ (1386 
En fait, nous venons de montrer que si un déterminant existe, il est unique et de la forme indiquée 


ci-dessus, il faudrait encore vérifier que l'application ainsi définie satisfait les propriétés d'un 
déterminant, mais ce dernier point est immédiat. 


Ainsi, si Àf = 1 est une matrice nous avons donc: 
432 


D(M) — 1 2 nn 3 (13.87) 
Nous retrouvons donc la forme du déterminant tel que nous en avons fait mention en calcul vectoriel. 


Donnons une interprétation géométrique du déterminant. Soit ÿ,,ÿ, deux vecteurs de mp=. 


EMA 


V2 


Figure: 13.2 - Interprétation géométrique du déterminant 


Le vecteur est obtenu en projetant sur ÿ, et nous avons donc: 


en “ 
. Bf & et ff -Ff -IHP - RÉ -Ÿ 2) Gp pif - À PI 5 


M BÉ 


L'aire du parallélogramme ci-dessus est donc: 
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" _ ” ” (Y, 0 | De L 2 202 
sh -Rr pr ASE (KR -Be%)) 360) 
2 


Sin = Aa + 8, et v, = aa + 68, alors: 


S2 = (22 + y? (a? + &)-(4&+ u8Ÿ À +0: -2Aaus =(A8- ua (13.90) 


À & | 
det (13.91) 


Ainsi le déterminant représente au signe près l'aire du parallélogramme défini par les vecteurs ÿ ,ÿ;, 


et donc: 


S=l18- ual=[D(5,% = 


lorsque ceux-ci sont linéairement indépendants. Nous pouvons généraliser ce résultat à une dimension n 
quelconque, en particulier, pour » = 3, le déterminant de trois vecteurs linéairement indépendants 
représente le volume du parallélépipède défini par ces derniers. 


Le cas plus général de l'expression du déterminant est un peu plus délicat à établir. Il faut pour cela que 
nous définissions une application bijective particulière mais simple que nous avions déjà rencontrée 
dans le chapitre Statistique. 


Définition: Soit Æ, ={1,2,..,#},x € N° nous appelons "permutation" de Æ, toute application bijective 
de À, dans Æ,: 


g:{1,2,3..,2}) —{12,..,n} (13.92) 


Soit &, l'ensemble des permutations (applications bijectives) possibles de {1,2,3...,x}. &, contient bien 


évidemment... (voir la combinatoire dans le chapitre de Probabilités) n! éléments. La donnée d'un 
élément & de &, est définie par les données successives de: 


al) (a(l)e &,) 
a(2) (c2)eR, -{ at) 


(13.93) 


g(x) (a(r)e Æ, - {al}, a(2)..., ox - 1);) 


Etant donnée une suite d'éléments ordonnée (croissants) d'éléments {1,2,...»},#e N°, nous appelons 


"inversion", toute permutation d'éléments dans la suite ordonnée (donc la suite ne sera plus ordonnée 
du tout...). Nous notons {a} le nombre d'inversions. 


Nous disons que la permutation & est paire (impaire) si /(@) est pair (impair). Nous appelons 


"signature" de &, le nombre noté £(@) défini par gi ri =(-1 Ai À c'est-à-dire: 


(13.94) 


+1 si la permutation © est paire 
ELETII= ; : | : 
—1 si la permutation © estimpaire 
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Nous avons maintenant les outils en place nécessaires à définir de manière générale la formule du 
déterminant: 


Définition: Soit: 


A=l{a EM u(K) (13.95) 


ÿ lei em 


Nous appelons "déterminant de A" d'une matrice carrée de dimension n, et nous notons det(A), le 
scalaire K défini par (nous verrons un exemple plus loin): 


det(4) = 2 FT ef) 20(2)" Sas(n)| (13.96) 


appelé parfois "formule de Leibniz" ou encore "formule de Laplace". Cette relation a été obtenue par 
tâtonnements successifs et par récurrence pour de plus grandes dimensions. 


Exemples: 


E1. Soit A={&; | 


ë li jen € W;1Æ1, considérons les 21= 2 permutations des seconds indices (des entiers 


1,2) pris dans leur ensemble: 
12 21 (1397) 


Nous calculons les signatures de æ. Voici le schéma de cette règle (rappel: nous disons donc. qu'il y a 
"inversion", si dans une permutation, un entier supérieur précède un entier inférieur): 


De(2 12 21 
20e ae | tira) 
Nombre 
ï | 0 1 
d'inversions 
Permutation Paire Impaire 
Eli=i-1 te) +1 -1 
Tableau: 13.1 - Inversions et permutations d'un déterminant d'ordre 2 


Donc nous avons: 


det 1 4] : : 
€ = > ElTidonion — And» dd) 
1 y TE re DE (13.98) 


1 
œ{1}=1 æfl}=2 
etai : ue eo Y-1 co 
Ce qui correspond bien à ce que nous avions vu initialement. 


E2. Soit À = {a 


A lies yes © Wx31Æ 1, considérons les 31= 6 permutations des seconds indices (des entiers 


1,2,3) pris dans leur ensemble: 


PSM RSI RS SED (13.99) 
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Nous calculons les signatures de æ. Voici le schéma de cette règle (rappel: nous disons donc. qu'il y a 


"inversion", si dans une permutation, un entier supérieur précède un entier inférieur): 


g(l)...a(2)..o(3) | 123 132 213 231 312 321 
ue 0 1 1 ; 2 3 
d'inversions 
Permutation Paire | Impaire | Impaire | Paire Paire | Impaire 
etai=(-1 | +1 n œ| +1 +1 i 
Tableau: 13.2 - Inversions et permutations d'un déterminant d'ordre 3 


Donc nous avons: 


1 np 3 

&g | > ET onto) 
TES 

1 2 Az 


— dndpz — Andy — Apdndz + dpdpgdn * Apdnds — Avdpds 


det a 
1 (13.100) 


Remarque: Certaines personnes apprennent par coeur une méthode nommée "règle de Sarrus" pour 
calculer les déterminants d'ordre trois comme le précédent. Nous lui préférerons sur ce site la 
formulation générale du déterminant applicable à tous les ordres. 


Voyons quelques propriétés et corollaires de cette formulation du déterminant: 


P1. Soit 4f,(Æ) une matrice carrée d'ordre n, nous ne changeons pas la valeur du déterminant de 4#, 
en: 


1. Effectuant une opération élémentaire sur les colonnes de Àf, 
2. Effectuant une opération élémentaire sur les lignes de Àf, 


Démonstration: Si À, = |&; 3 alors 4f, est composée de n vecteurs colonnes: 


dj; 
ne 

v, =| Ÿ] «3101 
Ex 


Effectuer une opération élémentaire sur les colonnes de Àf, revient à additionner Av, ,i € {1,...,#} à une 
des colonnes v, de Àf,. Soit 4, ‘ la matrice obtenue en additionnant 4v à la j-ème colonne de 4f,, 
nous avons: 


fes d'une 
det if, Imdetlus MMA. mn) (13.102) 
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Par multilinéarité (finalement la démonstration n'est vraiment pas bien dure): 


det( Af"\= detÜvsv. vs. lPAdethi nav) (13103) 


et comme le déterminant est alterné: 


AGUV. RL) 0— did = dev ù | = det(4f,) (13.104) 


Pour ce qui est des opérations élémentaires sur les lignes il suffit de considérer la transposée (c'est à 
pleurer tellement c'est simple mais il fallait y penser). 


OIC.Q.F.D. 


P2. Soit 4f,(#) une matrice carrée d'ordre net soit À e Æ: 


det(4M4,) = 4" det(Af,)| (13.105) 


Démonstration: Comme précédemment, il suffit de remarquer que si ,,...,v, sont les vecteurs 


colonnes constituant la matrice 4f, alors Av,,…., Av, sont ceux qui constituent À4f, et: 
det(4f,) = det(Av,,.…., Av,) (13.106) 
L'application étant n-linéaire, nous aboutissons à l'égalité: 
det(444,) = 4" det(,,..,v,) (13.107) 
OC.Q.FD. 
P3. Soit Af,(#) une matrice carrée d'ordre n. Nous changeons le signe du déterminant de Àf, si: 


1. Nous permutons deux de ses colonnes 
2. Nous permutons deux de ses lignes 


Démonstration: Àf, est constituée des n vecteurs »,,.…..,v,. Le déterminant de Àf, est égal au 
déterminant de ces n. Permuter deux colonnes de Àf, revient à permuter les deux vecteurs 


correspondant. Supposons que les vecteurs permutés soit le i-ème et le j-ème, l'application déterminant 
étant alternée, nous avons: 


detÜn,..,M...,v;..") = = deti,..V,Me Vu) (13.108) 
Pour ce qui est des lignes, il suffit de considérer la transposée de Àf, . 
OIC.Q.FD. 


P4. Soit 4,B € f,(C) alors: 
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det(A' 8) = det(A)' det(8)| (13.109) 


La démonstration peut se faire de deux manières, la première est assez indigeste et abstraite nous la 
laisserons aux mathématiciens (...) même si elle a l'avantage d'être générale, la seconde plus simple, 
consiste à vérifier cette assertion pour différentes matrices carrées. 


Démonstration: 


Act de Se der 1 ER and *éobn An * Go» 
33 bu apôn *dobn  Anbo + Gb 


ibn + Gr vu db | 7 land + Apbo land + Ab | 
æ Hô *anbndpbn + dpbndnbo * Ex 

4 Hu Anny  Gobpdndi — 420 

= dnbndn bn — Andnbn  dbpdnn + Anby dy 


= dndpbnb — Andnbnbn — Godnbpbn + Apdnb y 


deti AidetiB1= und, DEN RD, 
= ddpbnbn — And  Godn1be * Andy bn 


(13.110) 


Les calculs donnent donc des résultats qui sont bien identiques. Nous pouvons vérifier ainsi pour des 
matrices carrées de dimensions supérieures. 


OIC.Q.FD. 
P5. Une matrice carrée 4e f, (©) est inversible si et seulement si det(A) #0. 
Démonstration: 
Si À est inversible, nous avons: 
det(A: AT) = det(D) = 1 = det(A): det( A1) = det(A) # 0] (13.111) 
OIC.Q.FD. 


Il s'agit de la propriété la plus importante des matrices dans le cadre de la physique théorique car si A 
est un système linéaire, le calcul de son déterminant permet de savoir si celui-ci a des solutions uniques. 
Dans le cas contraire, comme nous en avons déjà fait mention, soit le système n'a aucune solution, soit 
une infinité ! 


Il faut considérer aussi un cas particulier important. Soit le système suivant: 
AB=0=B=0 (13.112) 


où 4e W,(K) #0 et Be M, (K) à déterminer. Il est clair..., que A soit inversible ou non, la solution 
triviale est 8 = 0. Cependant..., imaginons un cas de physique théorique où nous avons 4.8 = 0 mais 
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pour lequel nous savons que AE 4f,(&) # O et pour lequel nous imposons BE Af,(&) # 0. Dans ce 


cas, il nous faut éliminer la solution triviale 8 = 0. De plus, calculer l'inverse (s'il existe) de la matrice A 
ne nous ramènera à rien de concret mis à part à 8 = { ce qui bien évidemment ne nous satisfait pas. La 
seule solution est alors de se débrouiller pour que les coefficients 4; de la matrice À soient tels que son 


déterminant soit nul et donc la matrice non inversible! L'intérêt ? Eh, bien d'avoir une infinité de 
solutions possibles (de B donc !) qui satisfont 4.8 = 0. Nous aurons besoin de cette méthodologie en 
mécanique quantique ondulatoire, lorsque nous déterminerons l'existence des antiparticules par 
l'intermédiaire de l'équation de Dirac linéarisée. Il faudra donc s'en rappeler. 


P6. Deux matrices "conjuguées" (attention, pas dans le sens complexe du terme) ont le même 
déterminant. 


Démonstration: 


Soit 4€ M, (OC), et Pe M,(€C) une matrice de passage d'une base à une autre (voir plus loin le 
traitement des changements de bases), nous avons alors: 


det(8) = det( Pl: 4: P) = det(P 1): det( A): det(P) = det(4) 
—g— 
=det(P) 1 


(13.113) 


OIC.Q.FD. 
P7. Pour toute matrice 4e À, (©) : 
det(Ai= det(4) (13.114) 
Démonstration: 


det| Ai= > ET)" & og) +" Anar) (13.115) 


TES 
te] 


Or (trivial... simple multiplication de tous les coefficients): 


Hate eut) PA ee (13.116) 


Puisque (trivial) eo?) = go) et que x,yeC:x' y = x'y (cf. chapitre sur les Nombres), nous 


pouvons alors écrire: 


ee | _ aa——_—_— 
det|A)= Ÿ e(a) CERTES 2 eo) a ao ne À sun 
TES, T ss, 


OIC.Q.FD. 
P8. Pour toute matrice Ae À#, (R) : 


det(4) = det(A) (13.118) 
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Démonstration: 


Ben... c'est la même chose que pour la propriété précédente mais sans les valeurs conjuguées... De fait, 
nous montrons de la même manière, la même propriété pour 4e M, (€). 


OIC.Q.F.D. 


P9. Soit une matrice À = (a,,)€ M, (©), nous noterons À; la matrice obtenue à partir de A en effaçant 
la i-ème ligne et la j-ème colonne (notation très importante à ne pas oublier pour la suite!!!). 4; 
appartient donc à A, (©) . Alors pour tout i = 1.x: 


det( 4) De a" det(4,)| (1319) 
j< 


où le terme: 
(-1Ÿ7 det| A;) (13.120) 
est appelé le "cofacteur". 


Démonstration: 


Définissons pour cela l'application: 
ñn 
p: M{(C)—C, 4 := > (Da, det(4) (13121) 
37 


Il est facile de voir que & est multilinéaire (il suffit de considérer (—1}** -&ÿ comme une simple 


constante et ensuite par extension de la définition du déterminant. trop facile...). 


Montrons cependant qu'elle est alternée (dans ce cas, c'est un déterminant qui a toutes les propriétés 
d'un déterminant): 


Soit 4;,4,4 deux vecteurs colonne de A qui se suivent. Supposons que 4; = 434, il faut montrer que 
dans ce cas gX A) = 0 (qui découle de la définition d'une application alternée). 


Nous avons premièrement (c'est obligatoire de par la définition) si nous n'effaçons aucune des colonnes 
j étant k ou k + 1: 


det(4,) =0siij“k&,k£+1 (13.122) 
et nous avons bien évidemment si nous enlevons respectivement la colonne k et la colonne k+1: 
det(43) = det(Agan) car Aix = Agua (13.123) 


Donc: 
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AA) = (1) an det(dn) + CE appen  det(yun)= 0 (13.124 


C'est donc OK. Elle est alternée et multilinéaire, il s'agit donc bien d'un déterminant. 


Nous venons donc de montrer que # est un déterminant et par unicité nous avons g%A) = det(A) pour 
tout 4e H,(C). 


OIC.Q.FD. 

Voyons un exemple de cette méthode en calculant le déterminant de: 
1 
A=]2 


Développons selon la deuxième ligne ( = 2). Nous obtenons: 


1 2 3 
ñ 3 

det(4)=|2 1 0-9 6-0 :a:det(4,) = D (-D7% a: det(4,) 
LL 1 LE 


(13.126) 
Ds 1 3 
= (-1°: 2: det +é-Dttdet|. |+(-1°: 0: det 
INT LT au) 
=D (Di+3)+i-3=-7%-09. 


Développons selon la première colonne en guise de vérification (on ne sait jamais...): 


= det î k — 2'det : . + det ce 
ne = =] ÿ 1 OÙ (13.127) 
= ri 


=j-2 (%+7-3--%-9 


Le calcul déterminé ci-dessus est donc exponentiel car si par exemple nous devons calculer le 
déterminant d'une matrice d'ordre 10 alors le déterminant sera développé en une somme de 10 termes, 
dont chacun contient le déterminant d'une matrice d'ordre 9, qui est un cofacteur de la matrice de 
départ. Si nous développons n'importe lequel de ces déterminants, nous obtenons une somme de 9 
déterminants dont chacun contient le déterminant d'une matrice d'ordre 8. A ce stade, il y a donc 90 
déterminants de matrices d'odre 8 à calculer. Le processus pourrait se poursuivre jusqu'à ce qu'il ne 
reste que des déterminants d'ordre 2. Et alors là nous devinons que le nombre de matrices d'ordre 2 est 
très conséquent! 


Définition: Soit m, n deux entiers positifs quelconques et À une matrice # x# à coefficients dans €. 
Pour tout entier & £min(##2,#) un "mineur d'ordre k" de A est un déterminant du type: 
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ph ik 
dti; lave iSn és <iSmetlS << <æ (13.128) 


on ut En je 


Dans le cas particulier d'une matrice carrée d'ordre x >1 la définition est plus simple: Le mineur À; 
de l'élément &;; est le déterminant de la matrice d'ordre n - 1 obtenue en supprimant la ligne i et la 


colonne j. Ainsi, pour calculer le mineur d'un élément, nous supprimons la ligne et la colonne 
auxquelles l'élément appartient, puis nous calculons le déterminant de la matrice carrée restante. 


Pour finir nous terminons en donnant une formule qui relie les coefficients de l'inverse d'une matrice 
ñ# x # avec ses mineurs d'ordre #—1. 


3.3.1. DÉRIVÉE D'UN DÉTERMINANT 
Voyons maintenant un résultat qui nous sera fort utile en relativité générale. 


Soit une matrice carrée # x # avec g;; : IR — R des fonctions dérivables. Posons g := det(G) G =(8;;). 
Nous voulons calculer 4, g. Soit g, le i-ème vecteur colonne de la matrice G. Utilisons la formule: 


Éd ee DE Eu Écos (13.129) 


TES 
n 


Sachant que la dérivée de goay1'…" Satmn est (dérivée de n produits): 


dec dRx(2),2 
TE Ex22 Ecinin + Boy Ç a Ex33 ‘ Eatrin F... 
a (13.130) 
Ei(nin 
+ So ‘ -" Satan ‘ dé 
nous avons donc: 
dg dec dE c(232 
SE > #(o) De SG Ectrn DCCEZTU D 8003 Bot 
TES, Tes, 


: (13.131) 
Ex(n},n 
SAP E > EO)' Soth1  -" Eotnn1 ‘ à 

Tes, £ 


Si nous regardons la première somme ci-dessus, nous remarquons que: 


Era 
ns E(a) 2 Bat22:-" Batnhn = t(Ri ;S2,.,En) (13.132) 
DES, dé 


où g, est la dérivée du vecteur g,. De même pour les sommes suivantes. Ainsi, 


dg 


pr = det(gy,82,., 8x) T det(g,82 ,83,...,8n) Ra det(g.22,..., 8) (13.133) 
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Développons encore. Considérons le terme det(gr, A ci-dessus. Si nous le développons par 


rapport à la première colonne, nous obtenons: 
4 Ç 1+i d8; | 
det(gr' ,82,....8n) = D (-D ra det(G,;) (13.134) 
_ 


De même, en développant le j-ème terme de la somme ci-dessus par rapport à la j-ème colonne nous 
avons: 


4 L + dg, : 
det(gi.…..,8; El ne SD L _… k det(G ;) (13.135) 
il 


Si nous posons: 
= (-1)*7-det(G,,) (13.136) 
nous obtenons: 
dg n nn Ag; ; 
———. s'— (13.137) 
at 2.2.4 æ 


ce qui en notation tensorielle (cf. chapitre de Calcul Tensoriel) s'écrit: 


dg de; 7 
GE Lo. Été (13.138) 
SR 


Nous avons aussi: 


= 1 (D det(G,) A Ne: (13.139) 


À det(G) det(G) g 


où à; est le coefficient se trouvant à la j-ème ligne, i-ème colonne de la matrice 1. Si nous notons 


g* le coefficient i, j de la matrice &!\ alors: 


gŸ =b; et gŸ A à (13.140) 
E 


L'expression de la dérivée devient finalement: 


qui s'écrit en notation tensorielle: 
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Ce résultat, finalement assez simple, nous sera utile dans le chapitre de Calcul Tensoriel, pour 
construire les outils nécessaires à l'étude de la relativité générale et à la détermination de l'équation 
d'Einstein des champs. Il convient donc de s'en rappeler. 


3.3.2. INVERSE D'UNE MATRICE 


Terminons notre étude des déterminants avec la cerise sur le gâteau en donnant une relation très 
importante dans de nombreux domaines de l'ingénierie, de la physique et de la mathématique qui relie 
les coefficients de l'inverse d'une matrice # x # avec ses mineurs d'ordre # —-1 (nous allons utiliser cette 
relation plus loin). 


Soit Ae 4,(€C) une matrice inversible. Notons À =(a;) et 4 '= (à,). Alors: 


h.. = 1 
Ÿ  det(A) 


(1%: det(A,,)| (13.143) 


Démonstration: 


Notons 4; le k-ème vecteur colonne de la matrice A. Sachant que 4. 41 = 4, nous avons (trivial): 


ñn 
e;= D bay (13.14) 
&T 


Calculons det(a.…..,4@5-1,8;,4541,...,4,). D'une part en développant par rapport à la k-ème colonne nous 
trouvons (puisque qu'un seul des coefficients de 2; est non nul et que l'unique non nul est égal à 


l'unité): 
det(a,.…as 1e; dur. d)= (1) -det(An) (13.145) 
D'autre part (propriétés du déterminant): 
Lt} 
det(a 1,8; > x+] “id = det(æ os D bye Hi de) 
IA 


(13.146) 


ñn 

= x” : det(a,,.…,a;- >, di+ 0) ee bz det (4) 
= —,— 
1 Osi1#k 


Ainsi: 
(-1)/*#. det(43)= db det(A) (13.147) 
c'est-à-dire: 


1 
b = 
# det(A) 


(D: det(A,) (13.148) 


OIC.Q.F.D. 
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Pour une application pratique simple, détaillée et importante dans l'industrie (car sinon dans l'ensemble 
du site nous inversons que très rarement de petites matrices), le lecteur pourra se reporter au chapitre 
de Méthodes Numériques dans la partie qui concerne la régression linéaire multiple. 


4. CHANGEMENTS DE BASES 


Supposons que nous passions d'une base £ = (&,,8,,...,8,) d'un espace j* à une autre base 
F=(f.h...7,) de ce même espace. 


Décomposons les j; dans la base €: 
= Pué * Pré + Puién 
fn = Puà + Pnêa ++ Puis 
Ji = Paë * Pré Pa2Ëx (13.149) 
a  Pyé] + Pon82 +. + Purly 


Définition: Nous appelons "matrice de transition" ou "matrice de passage", la matrice (l'application 
linéaire) qui permet de passer de £ —: # donnée par: 


ARE 
Maintenant, considérons le vecteur donné par » = K8,. Alors nous nous proposons de démontrer que 


les composantes »,,y,,...,y, de Ÿ dans la base # sont données par: 


A # 
FLE SX=PY (13151) 
à Ya 
# nl 
A &SF=P!X (13152) 
Ya À 


Remarque: La matrice P est inversible, car ses colonnes sont linéairement indépendantes (ce sont 
les vecteurs jf, décomposés dans la base £ et les f, sont linéairement indépendants car ils forment 
une base). 


ou: 
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Démonstration: 


Prenons pour simplifier le cas #7 = 2 (la démonstration étant assez facilement généralisable...) avec 
éhe)etÆ=(r, Li. 


Nous avons alors: 


À = Pa + Pre 


Ja = Puû * P82 


(13.153) 
Nous avons donc ÿ = 8, et nous cherchons à exprimer ÿ dans la base # tel que » = D Nous 
allons chercher l'application linéaire qui relie ces deux relations telles que: 
xi& = pif (13.154) 
Soit écrit de manière explicite: 
P=nÂ +h => (Pnà + Paë +9, (Pnà + Pr) 


= Paie + Paré + Po * PoVies © (Pa * Pod 8 + Pad t PaYale (13.155) 


CURE 
d'où: 


X = + 
( Pi T Pod (13.156) 


X3 Pa * Pa 
c'est-à-dire: 
A | ?nu Pu 
X3 Pa Pa 


Donc P est bien la matrice qui permet d'exprimer les composantes d'un vecteur d'une base en celles 
d'une autre base. 


7 (13.157) 
Ya 


OC.Q.FD. 


Considérons maintenant une application g : F* — F* linéaire. Soit A sa matrice dans la base £ , et B sa 
matrice dans la base # . Alors nous avons: 


B= PAP] (13.158) 


Démonstration: 
Reprenons: 
D=xa =pif (13.159) 


et posons: 


Page: 1007/4839 


[v3.0 - 2013] 


g(Fi=x"& =»#f (13.160) 
nous avons donc une fonction qui nous amène à écrire: 

X'= AX ÿY'=8Bÿ (13.161) 
D'autre part, nous avons (ce que nous avons démontré tout à l'heure): 

X=Æÿ ZX'=Py (13.162) 
Dès lors: 

ÿ'=Px'= P(AX)=P"(A(Pÿ\)= (PT AP)ÿ= Bÿ (13.163) 
d'où: 
B= PAP (13.164) 


et comme nous l'avons vu dans notre étude du déterminant, les déterminants de À, B sont égaux et donc 
invariants. 


OIC.Q.F.D. 


5. VALEURS ET VECTEURS PROPRES 


Définition: Une "valeur propre" est par définition (nous retrouverons cette définition dans 
l'introduction à l'algèbre quantique dans le cadre du chapitre de Physique Quantique Ondulatoire) une 
valeur 4 appartenant à un corps K tel que soit une matrice carrée 4e f,,1 K\ nous avons: 


1YeM,(K) ZX #0Oet AŸ =AX (13.165) 
et réciproquement qu'un vecteur Xe MtÆ\ est un "vecteur propre" si et seulement si: 
ZX #0,14eK,AË = AË (13.166) 


L'avantage majeur de ces concepts sera la possibilité d'étudier une application linéaire, ou tout autre 
objet lié à une représentation matricielle, dans une représentation simple grâce à un changement de 
base sur laquelle la restriction de A est une simple homothétie. 


En d'autres termes: lorsqu'une transformation (application d'une matrice) agit sur un vecteur, elle 
modifie la direction de ce vecteur excepté pour certaines matrices particulières qui ont des valeurs 
propres! 


Ainsi, l'ensemble des valeurs propres d'une matrice 4e 4,1 Æ\ est appelé "spectre de A" et satisfait 


au système homogène: 
(4A-A1,)Z=0 («3167 


ou (peu importe cela revient au même!): 
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(21,-A4)X=0 (13168) 


où À, (aussi notée 1) est une matrice diagonale unitaire (et donc aussi carrée) de dimension n . Ce 
système nous le savons (démontré plus haut) admet des solutions non triviales, donc X 4 0 ou 
(A1, - À) # Ô, si et seulement si (nous verrons de nombreux exemples en physique): 


Gi, — À du . Aie 
a ln — À a 
det(A-A,i=| *? LE 2% [20 (13.169) 
y] ya nee yen — À 


Le déterminant det( A-— 47,1 est donc un polynôme en 4 de degré n et peut donc avoir aux maximum 


n solutions/valeurs propres comme nous l'avons démontré lors de notre étude des polynômes (cf. 
chapitre de Calcul Algébrique) et est appelé "polynôme caractéristique" de À et l'équation 
det( 4- 47, | = 0 "équation caractéristique de A" ou "équations aux valeurs propres”. 


Pour la petite parenthèse, il est sympathique de remarquer que nous avons toujours dans le 
développement du det( A- 47,1 la trace de la matrice tr(A) et le déterminant det(A) qui apparaissent. 


Voyons deux exemples de cela: 


&t(4-a2)-00 74 0 |_ 3 À 
et(4— 42) = . 2.374 -Gutan)A+(antz anm2) (13170) 
A 2 (2 de À) 
et: 
A1 À 2 43 
3] = 3 
3 2 —. 
= A + (a +a22 + @33) À — (andss + 422033 +142 — God — Godn —ayMs)A (13.171) 
#4) 
+223 — d1d323 — dada +425 + M3%21432 — A 3431422) 


det( À) 


Si nous regardons (AZ, - À) comme une application linéaire f, puisque ce sont les solutions non 


triviales qui nous intéressent, nous pouvons alors dire que les valeurs propres sont les éléments 4 tels 
que: 


Ker(f) = Ker(Ai, — }# {0} (13.172) 


et que le Kernel constitue l'espace propre de A de la valeur propre 4 dont les éléments non nuls sont 
les vecteurs propres! 


En mathématiques, le concept de vecteur propre est une notion algébrique qui s'applique donc à une 
application linéaire d'un espace dans lui-même. Il correspond à l'étude des axes privilégiés, selon 
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lesquels l'application se comporte comme une dilatation, multipliant les vecteurs par une même 
constante. Ce rapport de dilatation/homothétie est donc la valeur propre, les vecteurs auxquels il 
s'applique vecteurs propres, réunis en un "espace propre”. 


Une autre manière de voir la chose: 


- Un vecteur est dit "vecteur propre" par une application linéaire s'il est non nul et si l'application ne fait 
que modifier sa taille sans changer sa direction. 


- Une "valeur propre" associée à un "vecteur propre" est le facteur de modification de taille, c'est à dire 
le nombre par lequel il faut multiplier le vecteur pour obtenir son image. Ce facteur peut être négatif 
(renversement du sens du vecteur) ou nul (vecteur transformé en un vecteur de longueur nulle). 


- Un "espace propre" associé à une "valeur propre" est l'ensemble des vecteurs propres qui ont une 
même valeur propre et le vecteur nul. Ils subissent tous la multiplication par le même facteur. 


Remarque: En UE nous étudions les fréquences propres et les modes propres des systèmes 


oscillants (cf. chap écal e). En analyse fonctionnelle, une fonction propre 
est un vecteur propre pour un ns édite. c'est-à-dire une application linéaire agissant sur un 
espace de fonctions cf. elle). En géométrie ou en LE nous parlons 


de directions DHODIES pour rendre compte de la courbure des surfaces ( 
). En théorie des graphes, une valeur propre est simplement une valeur propre de 
la matrice d'adjacence du graphe (: rie D ). 


5.1. MATRICES DE ROTATION 


Maintenant que nous avons vu ce qu'était une valeur et un vecteur propre, revenons sur un type 
particulier de matrices orthogonales cu nous seront particulièrement utiles dans notre cuis des 
quaternions (cf. mbres), des groupes et Din ( 

) et de la physique des Péticulés ( ?h: rrtic ires). 


Nous notons, selon ce qui a été vu dans le chapitre d'Algèbre Ensembliste, O(n) l'ensemble des matrices 
#x# à coefficients dans IR orthogonales, c'est-à-dire vérifiant: 


AA=1 
que nous notons aussi pour rappel: 
AA=1 


Les colonnes et les lignes d'une matrice orthogonale forment des bases orthonormées de mg* pour le 
produit scalaire habituel. 


Le déterminant d'une matrice orthogonale vaut +1, en effet 47 4 = 7 entraîne: 
det { A7) det (4) = det{ 47 4) = det (7) =1 


Nous notons SO(n) l'ensemble des matrices orthogonales de déterminant 1. Montrons en trois points 
que si ÀA€ SO(3,R) alors À est la matrice d'une rotation par rapport à un axe passant par l'origine. 
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1. Toute valeur propre d'une matrice de rotation A (réelle ou complexe) est de module 1. En d'autres 
termes, la rotation conserve la norme: 


En effet, si 4 est une valeur propre de vecteur propre ÿ, nous avons: 
Af HAT -JARf -(ariar) (al ar) (212) cv 
ou en notant le produit scalaire avec la notation habituelle du site: 
APIRT -JARf atout - Red are Role cu 
donc |A] =1. 


2. Il existe une droite dans l'espace qui sert d'axe de rotation et tout vecteur sur cette droite ne subit 
aucune rotation: 


Notons ÿ un vecteur propre normé de valeur propre 1 (c.à.d un vecteur tel que 4ÿ = ÿ ). Comme le 
lecteur l'aura peut-être compris (lire jusqu'au bout!), la droite engendrée par ÿ que l'on notera (Z } 


constitue notre axe de rotation. 


En effet, tout vecteur sur (? } est envoyé sur lui-même par À. Dans ce cas l'espace orthogonal noté 


sl : . . : Si R : 
( F4 } qui est de dimension deux est le plan perpendiculaire à l'axe de rotation. 


3. Tout vecteur perpendiculaire à l'axe de rotation reste, après une rotation, perpendiculaire à cet axe. 


En d'autres termes, ( #e ÿ est invariant par À 

En effet, si we (7) alors, y = 47 4w = A7 w et pour tout ÿe (2Ÿ 
Aÿ oÿ= ÿo AT = ÿoÿ=0 (13.178) 

c'est-à-dire 4ÿe ( +4 ÿ . Donc ( na je est invariant par À. 


: _— < en L 2 
En fin de compte, la restriction de À à l'espace ( dE } est une rotation. 


Exemple: 


Soit #* (voir le chapitre sur les nombres où la rotation par les complexes est démontré) une valeur 
propre (dont le module est de 1 comme nous l'avons vu lors de notre étude des nombres complexes) de 


ë a Pen 
A restreinte à (? } . 
Notons % =# +iÿ un vecteur propre avec ÿ,ÿe IR? de sorte que: 


A =288%.;ÿ (13.179) 
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avec (comme nous l'avons déjà montré dans notre étude des nombres complexes): 


cosæ -sinæ 
A= (13.180) 


sin&æ cos æ 
où nous savons de par notre étude des nombres complexes, que les vecteurs ä#,Y forment une base 


2 | z sl 
orthogonale (pas nécessairement normée!) de ( Z) ë 


Remarque: Il est par ailleurs aisé de vérifier que cette matrice est orthogonale (si ce n'est pas le cas 
contactez-nous et ce sera détaillé!). 


5.2, THÉORÈME SPECTRAL 


Voyons maintenant un théorème très important relativement aux valeurs et vecteurs propres qui se 
nomme le "théorème spectral" qui nous sera très utile à nouveau en physique et en statistiques. 


Pour résumer, les mathématiciens disent dans leur langage que le théorème spectral permet d'affirmer la 
diagonalisabilité d'endomorphismes (de matrices) et justifie également la décomposition en valeurs 
propres. 


Pour simplifier la démonstration, nous ne traitons ici que les matrices réelles en évitant un maximum le 
langage des mathématiciens. 


Nous noterons dans un premier temps Àf, (IR) l'ensemble des matrices #*Xx à coefficients réels. Nous 
confondrons la matrice Àf € f, (IR) avec l'application linéaire induite sur l'espace vectoriel Jg* par 


vH Mo (FeR*). 


Rappel: Nous avons vu lors de l'étude des changements de base que si (e.. L est une base de p* et 
e 


ee 
MW e,(R) alors la matrice de l'application linéaire M dans la base (5...) st S-lgs où S est la 


matrice formée par les vecteurs colonnes &,,...,8, . 

D'abord, nous vérifions simplement que si A est une matrice symétrique alors: 
(Añ)oÿ=%o A vV=goAÿ (13181) 

Nous nous proposons maintenant d'étudier les propriétés suivantes d'une matrice M symétrique: 

P1. Toutes les valeurs propres de M sont réelles. 

Démonstration: 


Soit: 


N} 
Il 
m 
(e) 
ge 
co 
D 


Page: 1012/4839 


[v3.0 - 2013] 


un vecteur propre a priori complexe de valeur propre 4 e €. Notons: 


Z 


(13.183) 


NIE 
Il 


Z} 
le vecteur conjugué de 7. Nous avons alors: 
- =T 4e 12 - 
Z'M=7 4z= A] (3189 


D'autre part vu que jf = jf nous avons: 


Etant donné que 7 4: à nous avons 3 — 3 et par suite, 4e. 
OIC.Q.FD. 


P2. Deux espaces propres de M relatifs à des valeurs propres différentes sont orthogonaux (en d'autres 
termes, les vecteurs propres sont indépendants). 


Démonstration: 


Soit À,{{ deux valeurs propres distinctes de vecteurs propres correspondants #,Ÿ . Nous avons (ne pas 
oublier que M est symétrique!): 


A(G 05)=(Ai)o 


Il 
as, 
È 
Les 
[a] 
<E 
Il 
&} 
[a] 


(Av)= a o{uv)= u{aov) (13.186) 
ainsi: 
(A (mov)=0 (13187) 
ce qui entraîne: 
{ov)}=0 (13.188) 
OC.Q.F.D. 


Avant d'aller plus loin, il nous faut aussi démontrer que si € M,(R) est une matrice symétrique et V 
un sousespace vectoriel de jg* invariant par M (c'est-à-dire qui vérifie pour tout ÿ e F: Mÿe F) alors 
nous avons les propriétés suivantes: 


P1. L'orthogonal de V noté j7+ (obtenu par la méthode de Grahm-Schmidt vue dans le chapitre de 
calcul vectoriel) est aussi invariant par M. 
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Démonstration: 


Soit ÿef ete jt alors: 


(A4) ov = so[as) =0 (13.189) 


er 
ce qui montre que M$ e +. 


OIC.Q.F.D. 


P2. Si (m,...,.w.) est une base orthonormale de j7+ alors la matrice de la restriction de M à j7+ dans la 


base {w,,...,w,) est aussi symétrique. 
Démonstration: 


Notons À= (4) 4e la matrice de la restriction de M à + dans la base (#,,...,w,). Nous avons par 


définition pour tout j = 1..* (puisque le vecteur résultant d'une application linéaire comme M peut 
s'exprimer dans sa base): 


& 
Mw; = La" (13.190) 


il 


Or: 
k & 
(465,)° 5, = Dan ]es. = >a;(" o,)=a (13.191) 


car & ow, = 0 sii <z# dans la base orthonormale. 
(] L1 


D'un autre coté: 
k k 
(465, ) 015, = 5, (MA, )= 55, D +) =Ya(ño#)=a, (13192) 


Donc 4,,;,=4;, Ce qui montre que 4= 4. 


OIC.Q.F.D. 


Nous allons à présent pouvoir montrer que toute matrice symétrique Àf e , (MR) est diagonalisable. 
C'est-à-dire qu'il existe une matrice inversible S telle que $-l445 soit diagonale. 


Remarque: En fait nous verrons, pour être plus précis, qu'il existe S orthogonale telle que $-l4#5 
soit diagonale. 


Rappel: S orthogonale signifie que S$7 = 7 (où I est la matrice identité) ce qui équivaut à dire que les 
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colonnes de S forment une base orthonormale de Ip*. 


Donc allons-y et pour cela considérons f € M, (IR) une matrice symétrique. Alors nous souhaitons 
démontrer qu'il existe une matrice S orthogonale telle que $-l4#5 soit diagonale (en d'autres termes, il 
existe une base où M est diagonalisable). 


Démonstration: 


Nous prouvons l'affirmation par récurrence sur n. Si # = 1 il n'y a rien à montrer. Supposons que 
l'affirmation soit vérifiée pour x; <x et prouvons là pour£ = #+1. Soit donc M e M,, (TR) une matrice 
symétrique et 4 une valeur propre de M. 


Nous vérifions facilement que l'espace propre # = Ker(A7,,, — M) est invariant par M (il suffit de 
prendre n'importe quelle application numérique) et que par la démonstration vue plus haut que x est 
aussi invariant par M. De plus, nous savons (cf. chapitre de calcul vectoriel), que p**} se décompose 
en somme directe]p**} =}; @+. 


Si dim) =0,mæ*1-7 et il suffit de prendre une base orthonormale de W pour diagonaliser M. En 
effet si (mu) est une telle base, la matrice S' formée par les vecteurs colonnes w, (j =1..#+1) 


est orthogonale et vérifie: 
S'MS=S"AS= AL, (13.193) 
SMS est bien diagonale. 


Supposons donc dim(f+) > 0 et soit (ä,,..,%,,) avec »+ < » une base orthonormale de +. Notons A 
la matrice de la restriction de M à jf + dans la base (é 0) . À est aussi symétrique (selon la 


démonstration d'une des propriétés précédentes). 


Par hypothèse de récurrence il existe une matrice X € M, (R) orthogonale telle que Z-14x# soit 


diagonale. 


Notons par {#,,...,w,,,,,) une base orthonormale de W et G la matrice formée par les vecteurs 


colonnes #,,...,w 


md - AÏOTS, nous pouvons écrire que: 


em] Alim ( 
GTMG = 0 A (13.194) 


et G est aussi orthogonale par construction. 


Considérons la matrice par blocs (matrice composée de matrices) suivante: 


EE ) . _ 
£= on. EM AR) (413.195) 


et posons S = G.Z.Il est évident que S est orthogonale car G et L le sont. Effectivement, si &.G7 = 7 
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et 7.77 = j alors (ne pas oublier que la multiplication matricielle est associative): 


(cz)(oy =(c)(ro")-= (17 )o" = cc" = Go" =1 (1316 
De plus S vérifie : 


SMS = EL (GT MG) e 


= PRES 0 k À Lusi-n 0 is Ô L LIRE 0 (13.197) 
“| 0 XA o Al o all 0 ax 


Et alors: 


est bien diagonale. 


OIC.Q.F.D. 


Pour finir voici donc le "théorème spectral" (cas réel): Sif ef, (MR) une matrice symétrique alors il 
existe une base orthonormale formée de vecteurs propres de M. 


Démonstration: 


Nous avons donc vu dans les paragraphes précédents qu'il existe S orthogonale telle que $-1y#5 soit 
diagonale. Notons &,...,&, les colonnes de S. {5,,...,c, ) est une base orthonormale de mR* car S est 
orthogonale. Notant #, le i-ème vecteur de la base canonique de xR* et À le i-ème coefficient diagonal 
de $-lyfs nous avons sans supposer directement que À est une valeur propre pour l'instant: 


Âë, = (SMS), = STME, (13.199) 


en multipliant par S des deux côtés de l'égalité nous avons: 
et donc: 


ce qui montre que £,,...,ë, sont des vecteurs propres et Æ les valeurs propres. 


OIC.Q.F.D. 
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Notes personnelles: 
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14. CALCUL TENSORIEL 


L. calcul vectoriel classique est une technique simple et efficace qui s'adapte parfaitement à l'étude des 


propriétés mécaniques et physiques de la matière dans l'espace euclidien à trois dimensions. Cependant, 
dans de nombreux domaines de la physique, il apparaît des grandeurs expérimentales qui ne peuvent plus 
être facilement représentées par de simples vecteurs-colonnes d'espaces vectoriels euclidiens. C'est le cas 
par exemple en mécanique des milieux continus, fluides ou solides, en électromagnétisme, relativité 
générale, etc. 


Ainsi, dès la fin du 19ème siècle, l'analyse des forces qui s'exercent à l'intérieur d'un milieu continu a 
conduit à mettre en évidence des grandeurs physique caractérisées par neuf nombres représentant les 
forces de pression ou de tension internes (cf. chapitre de Mécanique Des Milieux Continus). La 
représentation de ces grandeurs nécessita l'introduction d'un nouvel être mathématique qui fut appelé 
"tenseur", par référence à son origine physique. Par la suite, à partir de 1900, ce furent R. Ricci et T. Levi- 
Civita qui développèrent le calcul tensoriel puis l'étude des tenseurs permit un approfondissement de la 
théorie des espaces vectoriels et contribua au développement de la géométrie différentielle (voir chapitre 
du même nom). 


Le calcul tensoriel, appelé aussi parfois "géométrie différentielle absolue" a également pour avantage de 
se libérer de tous les systèmes de coordonnées et les résultats des développements mathématiques sont 
ainsi invariants (énorme allégement des calculs). Il n'y a plus alors à se préoccuper dans quel référentiel il 
convient de travailler et cela, est très intéressant en relativité générale. 


Nous conseillons par ailleurs vivement au lecteur de bien maîtriser les bases du calcul vectoriel et de 
l'algèbre linéaire comme elles ont été présentées auparavant. Au besoin, nous avons choisi lors de la 
rédaction de ce chapitre de revenir sur certains points vus dans le chapitre de Calcul Vectoriel 
(composantes covariantes, contravariantes,.…). 


Par ailleurs, si le lecteur a déjà parcouru l'étude des contraintes dans les solides (cf. chapitre de Mécanique 
Des Milieux Continus) ou du tenseur de Faraday (cf. chapitre d'Électrodynamique) ou du tenseur 
d'énergie-impulsion (cf. chapitre de Relativité Générale) ceci constituera un avantage pratique certain 
avant de parcourir ce qui va suivre. Par ailleurs, la rédaction des objets susmentionnés a été faite de telle 
manière que la notion de tenseur y soit introduite si possible (...) intuitivement. 


Nous ne ferons que très peu d'exemples pratiques dans cette section. Effectivement les exemples concrets, 
vous l'aurez compris, viendront lorsque nous étudierons la mécanique des milieux continus, la relativité 
générale, la physique quantique des champs, l'électrodynamique, etc. 


Un conseil peut-être: pensez matriciel, écrivez tensoriel! (vous comprendrez mieux ce petit adage une fois 
après avoir parcouru tout ce chapitre). 


1. TENSEUR 


Définition (simpliste): Les "tenseurs" sont des objets mathématiques généralisant les notions de vecteurs 
et de matrices. Ils ont été introduits, en physique, pour représenter l'état de contrainte et de déformation 
d'un volume soumis à des forces, d'où leur nom (tensions). 
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La définition rigoureuse nécessite (je pense personnellement) d'avoir d'abord lu le présent chapitre dans 
son intégralité. Mais sachez qu'au fait un tenseur est grosso modo comme un déterminant. (cf. chapitre 
d'Algebre Linéaire). Eh oui! C'est simplement une application multilinéaire sur un espace de dimension 
donnée (correspondant au nombre de colonnes de la matrice/tenseurs) qui donne finalement un scalaire 

(d'un corps donné). 


Par exemple, nous avons démontré dans le chapitre de Mécanique Des Milieux Continus que les forces 
normales et tangentielles dans un fluide étaient données par la relation: 


W, Go Ty le 
N,l=ltT y Ty [1 (40 
te # 


ce qui se notait sous la forme traditionnelle condensée suivante (où nous ne distinguons plus ce qui est 
tangentiel de ce qui est normal donc il y a une perte de clarté): 


N, = G;n; (142) 


Nous faisons ainsi apparaître une grandeur mathématique &;; ayant 9 composantes, alors qu'un vecteur 
dans le même espace R° en possède 3. 


Cette notion est aussi beaucoup utilisée dans le chapitre de Relativité Générale où nous avons démontré 
que le tenseur d'énergie-impulsion dans un cas particulièrement simple est donné par: 


on a pvc? pyev jpyev  py°?ev 

ré T1 (] T1 1 712 T1 3 ov? cv x y y” ov? y” vw y y£ 
_ = (14.3) 

TE D re py?ev pv y” pv?v vw ov “ 


TO TA OT TS | |oyicv oyvv pyvv pyvy 
et satisfait à la relation non moins importante de conservation: 
UE | 
Val” =0 (144) 


Ou sinon, toujours dans le chapitre de Relativité Générale, nous avons démontré que le tenseur de la 
métrique de Schwarzschild est: 


1/ Afr) 0 0 0 
0 —1/Bfr) O0 0 
g® = 2 (14.5) 
0 0 ir 0 
0 0 O0  —1/{r? sin? 8) 


et donne donc l'équation de la métrique (cf. chapitre de Calcul Différentiel)}: 


ds? = Zywdx” dx" (146) 
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Signalons également que dans le chapitre de Relativité Restreinte nous avons démontré que le tenseur de 


transformation de Lorentz est donné par: 
x 
xl 
21 (47) 
x 
x? 


x° Y_ -Y8 
a || 
x? (] ( 
13 0 0 


qui sous forme condensée donne la transformation de composantes suivantes: 


OS mm © © 
mm © © © 


x'* = 1fx" (148) 


En ce qui concerne la transformation du champ électromagnétique nous avons également démontré que le 
tenseur de Faraday est donné par: 


0 -EÆ -E, -E, 
pm l4 © 8 8, . 
E, B, O0 -B 
E, -B, B, 0 


et permet donc de passer d'un référentiel à un autre à l'aide de la relation: 
F#=ÆLEF# (1410 


Mais ce sont des tenseurs très simples qui peuvent être représentés sous formes de matrices. Il faut 
également savoir que ce n'est pas parce qu'une lecture d'une variable avec des indices semble indiquer que 
nous avons affaire à un tenseur que cela en est forcément un. Par exemple, la relation fameuse (très 
utilisée dans le chapitre de Relativité Générale): 


L. 
Ty = ETuy= TE" (08 + d;gu deg) (1411) 


pourrait faire croire que le premier membre tout à gauche est un tenseur mais au fait il n'est est rien. ce 
n'est qu'un symbole... d'où son nom: symbole de Christoffel (et non pas: tenseur de Christoffel). 


L'intérêt des tenseurs en physique est que leurs caractéristiques sont indépendantes des coordonnées 
choisies. Ainsi, une relation entre tenseur dans une base sera vraie quelle que soit la base utilisée par la 
suite. C'est une caractéristique fondamentale pour la Relativité Générale! 


2. NOTATION INDICIELLE 


Nous utilisons par la suite des symboles mathématiques: coordonnées, composantes de vecteurs et 
tenseurs, éléments de matrice, etc., dont le nombre, dans chaque catégorie, est grand ou indéterminé. Pour 
distinguer les divers symboles d'une catégorie nous employons des indices. Par exemple, au lieu des 
variables traditionnelles x, y, z nous utiliserons éventuellement les grandeurs x,,x;, x; (comme nous 
l'avons déjà fait en algèbre linéaire). Cette notation devient indispensable lorsque nous avons des variables 
en nombre indéterminé. 
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Ainsi, si nous avons n variables, nous les noterons: %,2%3,%3,..,2, 


Nous utilisons également des indices supérieurs, selon les besoins; par exemple, x},x°,x°. Afin d'éviter 
: ;1 à . ne LS — 12 
toute confusion avec l'écriture des puissances, la quantité x° à la puissance p sera écrite (x) . Lorsque le 


contexte écarte tout risque d'ambiguïté, l'utilisation des parenthèses n'est cependant pas fondamentalement 
nécessaire. 


En calcul tensoriel il existe une convention de sommation qui consiste à utiliser le fait que l'indice répété, 
ici l'indice i, va devenir lui-même l'indication de la sommation. Nous écrivons alors, avec cette 
convention: 


x 
DRE CRE Ne PS 
dry =x" y =xXyY +x y +..+x" y" (14.12) 
il 
ce qui permet de condenser relativement bien les écritures. 


Ainsi, pour représenter le système linéaire: 
dnA *4p2% ta5% “b) 
AA 4% *Ag% “Da (1413) 
da tan ap D; 
nous écrirons (remarquez bien comment s'écrivent les composantes de la matrice associée!): 
GX; = (14.14) 
en spécifiant que c'est pour # = 3. 


Nous voyons sur cet exemple, combien la convention de sommation permet une écriture condensée et 
donc puissante. 


La convention de sommation s'étend à tous les symboles mathématiques comportant des indices répétés. 
Ainsi la décomposition d'un vecteur * sur une base (2,,2,,2,) s'écrit pour # = 3 dès lors: 


1= 


f=xa+xé, +x 


8 = X& (14.15) 


En résumé, toute expression qui comporte un indice deux fois répété représente une somme sur toutes les 
valeurs possibles de l'indice répété. 


Remarque: Nous nommons, pour des raisons évidentes que nous détaillerons plus loin, x° la 
"composante contravariante" du vecteur x. 
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2.1. SOMMATION SUR PLUSIEURS INDICES 


La convention de sommation (due à Einstein) s'étend au cas où figurent, en règle générale, plusieurs 
indices répétés en positions supérieure et inférieure dits "indices muets" dans un même monôme (souvent 
les physiciens omettent la règle de les mettre en position opposées comme ce sera aussi le cas souvent sur 


ce site!). Soit par exem le, la quantité Ax y ; celle-ci représente la somme suivante pour i et j prenant les 
valeurs de 1 à 2: 


Aix y? = Axy + Axy + AR y + A x y° (14.16) 


Ainsi, nous voyons facilement qu'une expression avec deux indices de sommation qui prennent 
respectivement les valeurs 1,2,..,# comportera x? termes; #° s'il y a trois indices, de sommation etc. 


Il faut faire cependant attention aux substitutions avec ce genre de notation car si nous supposons que 
nous avons la relation: 


i i 
A=a;x y; avec x = y” (14.17) 


alors pour obtenir l'expression de À uniquement en fonction des variables y”, nous ne pouvons pas écrire: 


_ ÿ > 
ÂA= AyCyY ÿ; (14.18) 


car cela ne revient pas à la même expression après développement puisque les indices muets sont 
systématiquement sommés de manières identiques et rigides (nous laissons au lecteur le soin de faire ce 
petit exercice de style). En d'autres termes, un même indice muet ne peut pas être répété plus de 2 fois. 


2.2. SYMBOLE DE KRONECKER 


Ce symbole introduit par le mathématicien Kronecker, est le suivant (souvent utilisé en physique en 
général dans de nombreux domaines): 


. . flsai=) 
ô; = -4-{ . . (14.19) 
Osii“ j 


Ce symbole est appelé "symbole de Kronecker". Il permet avantageusement d'écrire, par exemple, le 
produit scalaire de deux vecteurs &, et 2;, de norme unité et orthogonaux entre eux, sous la forme: 


8,98; = O, (14.20) 


Lors d'une sommation portant sur deux indices muets, le symbole de Kronecker annule tous les termes où 
les indices ont des valeurs différentes. Par exemple: 


HV; = PiYs (1421) 


Nous retrouverons ce symbole dans de nombreux exemples de physique théorique (physique quantique 
ondulatoire, physique quantique des champs, relativité générale, mécanique des fluides, etc.). 


Précisons qu'il existe une version généralisée du symoble de Kronecker: 
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(14.22) 


Nous avons aussi par exemple: 


& à 6, 

HAE Em 4 se, (14.23) 
k k 
En 4 


2.3. SYMBOLE D'ANTISYMÉTRIE 


Un autre symbole fort utile est le "symbole d'antisymétrie" ou appelé aussi "tenseur d'antisymétrie" que 
nous retrouverons en Electrodynamique, en Relativité Générale et en Physique Quantique Relativiste. 


Dans le cas où i, j, k prennent l'une des valeurs {1,2,3} le symbole d'antisymétrie #* aura les valeurs 
définies suivantes: 


- £% =0, si deux quelconques des indices ou plus ont une valeur identique. 


- =], si les indices sont dans l'ordre 1, 2, 3 ou proviennent d'un nombre pair de permutations des 
indices par rapport à l'ordre initial des indices. 


- = _], si les indices sont dans un ordre qui provient d'un nombre impair de permutations par rapport à 
l'ordre initial des indices. 


Remarque: Pour se rappeler si nous avons une permutation paire (respectivement impaire) d'indices, il 
suffit (dans le cas particulier de 3 indices) d'observer si nous retrouvons la séquence dans la suite 
123123 (respectivement 321321). Enfin, rappelons selon ce qui a été vu dans le chapitre de 
Probabilité, avec n indices il y a aura donc n! permutations possibles. 


En utilisant ce symbole, un déterminant d'ordre deux (cf. chapitre d'Algebre Linéaire) s'écrit alors sous la 
forme avantageuse: 


det [«*] ” caa; (14.24) 


et le produit vectoriel (et ça c'est très pratique en relativité générale et en électrodynamique): 


AXB = &34;B%| (1425) 


où bien sûr, j et k sont sommés et où l'indice muet i est le numéro de la ligne du vecteur résultant (en cas 
de demande nous ferons les développements). En particulier, le rotationnel d'un champ vectoriel est alors: 
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æ + 44 
VXA=Eg = End; (14.26) 
J 
Comme exemple, calculons en notation indicielle le double produit vectoriel 4x Éx € : 


AX EXC = EE Aux = On ôn — On 0j AB Cs = 8140; -C;l 4,8, | 
(14.27) 


où à nouveau, l'indice muet i est le numéro de la ligne du vecteur résultant. Voyons la démonstration 
détaillée de ces égalités (la démonstration des égalités ci-dessous n'a pas besoin de respecter l'ordre des 


égalités de la relation précédente). 
Démonstration: 


Nous avons indirectement démontré dans le chapitre de Calcul Vectoriel l'identité suivante: 


AxBxC=B.(AoC)-C.(ÀcB) (14.28) 


Remarque: Cette dernière relation est parfois appelée la "règle de Grassmann", ou plus couramment 
"double produit vectoriel" et il est important de noter que sans les parenthèses le résultat n'est pas 


unique. 
Pour démontrer la relation: 
AXBXC = Ep Em A;BnCn (429) 
au changement d'indices près montrons d'abord que: 


(BxC) = BC, (1430) 


L 
ce qui nous donne: 
BC: - BC x ;Cr 


À C = B; C Es jk B; Ce 


Ne faisons le développement que pour la première ligne (c'est déjà suffisamment long...): 


Bla — BC = a yB,Cr = Eu 0x + Sox B2Cr + Ga BCE 
= En A0 + E12À C2 + En3ÀC3 + 821220 + 22 B202 + AmbCs +230 (14.32) 
+6328302 + 6332303 = Anb0 + 85830, = 18,0, —-18,0, = BC - BC 

C'est ce qu'il fallait montrer. 


Maintenant montrons que pour la l-ième ligne nous avons bien: 
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(4x(8x 0) ] = A, (Ex BC, | (14.33) 


en s'aidant d'un résultat obtenu dans le chapitre de Calcul Vectoriel (produit vectoriel de trois vecteurs 
différents) nous avons le premier terme (la première ligne du vecteur résultant du calcul): 


(4 (40 -80),-4 (80-82 Ch), = En 4 (ee BCa ] 

= Ent A (B2C3 — 832), + Gn24 (8301 — C5), + us4, (C2 — BC), 

= &n4 (03-80) + &n4 (803 - 80h + 6514 (8203 — 8302) 

+124 (80 - 203), + 424 (80 - A0), + 524 (80 - 803), (439 
+äs4 (BC - 8,0) +6234 (BC — BC), +554 (BC - BC ), 

= 4234 (402-280), +424 (80-2803), 

= 14 (BC, -BC } 14 (BC - BC), = A (BC 8,0) 4 (8301 - BC) 


Il est alors immédiat que (pour i valant 1): 
AxBxC = (4x BxC), = B, (4,C,)-c; (4,2,) _ 
= B (AC +40 +403) -C (AB + 482 +483) 
= BAC + 8402 + B4C3 - CA — Cid -Ci4Bg (455) 
= ABC - AB0 - ABC +480 = 
= 4 (C2 -BQ)-4 (8301 -AC3) 
Montrons maintenant que pour i valant 1 nous avons aussi: 


AxBxC=(AxBxC) =(4, On — Éd, mn) 4;8 C 


im ji J M An 


(14.36) 
A4 (BC - BC )- 4 (8301 - AC) 


Effectivement: 


(A BxË) = (au5, - Ad) 48 Ce 
= (4,6 - É10yn ) A;Bn C1 + (An 0;2 — A2 03m ) AB C2 + (Am O3 — 36 jm) À; BC 
= (And — Ad) AB + (mn — À 1% ) À BC + (Bi Às1 — À Dam ) A3 Be C1 
(m2 = A2 4m) À EC 2 +(BmO22 — 20m) LE C2 + (Sim 232 — B12 8m ) BC 2 
(m3 — À3 0m) À BC 3 + (m3 — À3 Dm) LBnC3 + (00 — Às mn) BBC Gain 
= (An — mn) ABC — nhBn 01 — Ba nl 1 + Gin B C2 + À 3 BC 
RO CC OO LS CPR UE 
= A4 0 - 2480 - DB - 1480 - 4BC - 85480 
+140 + 2480 + 3480 +1 440 +824820 + 834803 
= 48,0 - 4850 +480 + 4803 = 4 (A0 - 2201) -4 (830 - AC) 
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[ C.Q.F.D. 
Comme deuxième exemple, montrons comment la divergence d'un rotationnel s'annule: 


Vo(VxA)=08,(e,0,4)1=E€.80,4 (1138) 
Comme de par le théorème de Schwarz 4,4; est symétrique (donc intervtir les indices n'a aucun impact) 
dans les indices et que &, est antisymétrique (par définition) dans les mêmes indices, la somme sur i et j 


doit nécessairement s'annuler. Par exemple, la contribution à la somme du terme à = 1, j = 2 est l'opposée 
de celle dei =2,j=1. 


Remarques: 


LOL] 


R1. Le symbole d'antisymétrie est très souvent appelé "tenseur de Levi-Civita" dans la littérature. Au 
fait, bien que ce soit bien un tenseur dans la forme de ses notations, il s'agit plus d'un outil 
mathématique qu'un "être" mathématique d'où la préférence de certains physiciens de le nommer 
"symbole" plutôt que "tenseur". Mais c'est à vous de voir. 


R2. Par abus d'écriture nous n'écrivons pas le vecteur de base mais en toute rigueur, et pour éviter de 


l'oublier, rappelons qu'afin d'équilibrer les membres de l'égalité et dans le souci de préciser que les 
vecteurs sont exprimés dans la même base, nous devrions écrire: 


AxB = 6, se A; Pre; ÿ x A= Ed; Age (14.39) 


Voyons maintenant des applications concrètes de cette notation indicielle en reprenant l'exemple du 
changement de base que nous avons déjà vu en calcul vectoriel: 


Soient deux bases (&,8,,...,8,) et (8,8",,...,8",) d'un espace vectoriel euclidien Æ,. Chaque vecteur 
d'une base peut être décomposé sur l'autre base sous la forme d'une application linéaire (matrice de 


changement de base - voir chapitre d'Algèbre Linéaire): 
DR 1 _ dis _. 
où nous utilisons bien évidemment la convention de sommation pour ë#,# = 1,2,...,#. 


Rappelons que la matrice de changement de base (ou "matrice transformation") doit avoir autant de 
colonnes que le vecteur de base a de lignes (dimensions). Petit exemple à trois dimensions: 


ZX da 3 Hd + Adp + Hp 
X° nn A3] 2 | | Aa + Hop Ÿ Xsdy | (1441) 
x da 3 Ads + Hd GS 


et il est évident qu'il est bien plus sympathique d'écrire cela sous la forme: 


k | 
x =A'Xx (1442) 
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où donc sur À, nous avons le k qui représente la colonne de la matrice et i la ligne. 


Un vecteur quelconque * de Æ, peut être décomposé (nous l'avons déjà vu dans le chapitre de Calcul 


Vectoriel) sur chaque base de Æ, sous la forme: 
= 2x8 =x"28", (1443) 


Si nous cherchons les relations entre les composantes x* et x'* il suffit de reprendre les relations de 
changement de base démontrées dans le chapitre d'Algèbre Linéaire et nous avons alors: 


mi is lib k + k = 
X=xe=xA%8,=x" 8,=x" A& (144) 
De suite par l'unicité de la décomposition d'un vecteur sur une base, nous pouvons égaler les coefficients 
des vecteurs de base et nous obtenons (il faut prendre garde à réarranger à nouveau l'ordre des termes car 
la multiplication matricielle n'est, en règle générale, pas commutative comme nous le savons déjà): 
x = AŸxtet x = Alx* (1445) 
Il vient également la relation triviale (cf. chapitre d'Algébre Linéaire): 


A% 4 = 6 (1446) 


Effectivement faisons un exemple explicite simple avec une matrice de dimension 2: 


1 1 1 1 L L 
D ee es & 11 42 El À tn 
1 0 1 0 1 1 : 
an Allan 42 Anita 2an 4242 +4 24» 0 1 
Une autre manière élégante de montrer en toute généralité la relation antéprécédente est de se rappeler du 
résultat démontré dans le chapitre d'Algèbre Linéaire: 


X= x'& = rATSE _ "8. = x" AE (14.48) 

et en utilisant: 

| _ ii 

e', = À4ë, (14.49) 
Il vient alors: 
GE & 42 — ne 
8, = À; e = A; Aie; (1450) 
Les vecteurs de base étant linéairement indépendants, cette dernière relation implique que lorsque : # j: 

& gi à 

A A =0 (1451) 

et lorsque : = j: 


AŸ A =1 (1452) 


Page: 1030/4839 


[v3.0 - 2013] 


Ainsi il vient: 


AŸA=6& (1453) 


Quant au produit scalaire, les résultats obtenus avec la notation indicielle sont forts intéressants et 
extrêmement puissants. Nous avons déjà défini le produit scalaire dans le chapitre de Calcul Vectoriel 
mais voyons comment nous manipulons ce dernier avec la notation indicielle: 


Considérons un espace vectoriel euclidien Æ, rapporté à une base quelconque (&, ). Les vecteurs s'écrivent 
sur cette base (nous le savons déjà): 


X=x8&,ÿ=y'e; (1454 


Le produit scalaire relativement à ses propriétés et à la notation indicielle s'écrit alors: 


op = (x'&)o(y"e,) = #y/(G 08,) = g#y/| (1455) 


Relation fondamentale pour la physique de pointe (relativité générale et théorie des cordes) qui fait 
apparaître le "tenseur métrique covariant": 


By = & °8;| (14:56) 


et pour satisfaire la propriété de commutativité du produit scalaire (cf. chapitre de Calcul Vectoriel) nous 
devons évidemment avoir l'égalité: 


&ÿ “Ex (1457) 
La relation antéprécédent s'écrit aussi parfois sous la forme: 


&1i 2 404 4°& 
[g]= Sa &2 |=|e04 808 --.| (1458) 
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Remarque: Lorsque les vecteurs de base (&, ) forment un espace vectoriel orthogonal (pas 
nécessairement orthonormé) alors les quantités: 


Eÿ "408; (1459) 
sont nulles si à “ À. Le produit scalaire de deux vecteurs *et ÿ se réduit alors à: 
Foÿ= gnx ) + enr) ++ SX Ÿ" (14.60) 
Nous avons alors dans ce cas particulier: 
Sy = (08) (1461) 


et donc lorsque les vecteurs de base forment un espace vectoriel orthonormal il est clair que £; est 
alors égal au symbole de Kronecker seul tel que: 


foÿ= [re ÿf L &r y (14.62) 


3. MÉTRIQUE ET SIGNATURE 


Comme nous l'avons vu en calcul vectoriel, le produit scalaire d'un vecteur * peut permettre de définir la 
notion de norme d'un vecteur (et le concept de distance). 


Rappelons que nous avons par définition la norme d'un vecteur qui est donnée par (cf. chapitre de Calcul 
Vectoriel): 


où les nombres £; définissent en quelque sorte une "mesure" des vecteurs; nous disons alors dans le 
langage du calcul tensoriel qu'ils constituent la "métrique" de l'espace vectoriel choisi. 


Dans l'espace de la géométrie classique, la norme est un nombre qui est toujours strictement positif et qui 
ne devient nul que si le vecteur mesuré est égal à zéro. Par contre, l'expression précédente de la norme 


d'un vecteur, peut être éventuellement négative pour des nombres g:,,81:,...,£. quelconques (espaces 
complexes par exemple). Nous pouvons donc distinguer deux genres d'espaces vectoriels pré-euclidiens 


(espace euclidien dans lequel nous avons défini le produit scalaire) selon que la norme est positive ou non. 
Cependant lorsqu'en physique théorique nous souhaitons faire l'analogisme avec une structure d'espace 
vectoriel il faut que la condition: 

g=det{(g;]<0 (1464) 


soit satisfaite (8; peut être écrit comme une matrice, rien ne nous l'empêche). 


Explications: Nous savons que le produit scalaire doit satisfaire à la propriété de commutativité telle que: 
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xoÿ= gx} =yox= gx} (14.65) 
D'autre part, si pour tout y’ non nul nous avons: 
gx y” =0 (14.66) 


cela implique x = Ô (c'est une des propriétés de la norme que nous avons vue dans le chapitre de Calcul 
Vectoriel). Nous pouvons alors écrire: 


Nous nous retrouvons ici simplement avec un système de n équations à n inconnues (ne devant admettre 
par hypothèse que la solution x° = 0), il faut et il suffit pour cela que le déterminant du système, noté g, 
du système soit différent de zéro (cf. chapitre d'Algébre Linaire). Nous devons donc avoir: 


g=det(g;]*0 (1468) 


C'est une des conditions pour qu'une expression assimilable à une norme sous une écriture tensorielle 
forme dans le cadre d'une théorie physique un espace vectoriel des états du système !! 


Remarques: 


R1. Le nombre de signes + et - se trouvant dans l'expression du produit scalaire constitue une 
caractéristique d'un espace vectoriel donné £,, ; elle est appelée la "signature de l'espace vectoriel" Æ,. 


R2. Une application pratique des calculs de la métrique est proposée dans le chapitre de Relativité 
Générale. 


A partir des coefficients du tenseur métrique covariant £8; définissant la métrique de l'espace Æ, , nous 
pouvons introduire les coefficients du "tenseur métrique contravariant" gŸ définissant la métrique d'un 


"espace dual" Æ par la relation: 


(14.69) 


En d'autres termes, le tenseur métrique deux fois covariant est son propre inverse par son équivalent deux 
fois contravariant. Nous le démontrerons explicitement plus loin en montrant lors de notre étude du 
déterminant de Gram que les composantes contravariantes et covariantes d'un espace euclidien sont égales 
et que les deux espaces ont le même nombre de dimensions. 


Un cas particulier qui satisfait la relation ci-dessus est le tenseur métrique de Minkowski (cf. chapitres de 
Relativité Restreinte et Générale) où nous avons: 
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1 0 0 0 
Gt 0 D 

7 vo = 7 = y 0! (470 
Q 0 0 -1 


Remarque: L'espace Æ, est aussi appelé "espace primal". 


L'espace dual est sous-tendu par n vecteurs de base 3* construite à partir des vecteurs &, tel que: 


Il est dès lors facile de voir que le produit scalaire des vecteurs * définit la métrique gŸ de l'espace dual: 
g'ost=(eta)o(e"a)= ee (a oa)= e* (een) = ea = eŸ (ar 
tandis que les vecteurs #* (contravariants) et #; (covariants) sont bien orthogonaux: 
d'oë,=(g"a os, =g" (a os)= gg, = 6 (73 


Nous pouvons exprimer aussi un vecteur dans la base duale par l'écriture suivante en remarquant bien 
évidemment que la position des indices muets est inversée: 


= mé +087 +28 = 2x8 (1474) 


Remarque: Les composantes x; sont nommées, pour des raisons que nous verrons plus loin, les 
composantes covariantes. 


Ainsi nous avons finalement la possibilité de passer aussi les vecteurs d'une base à l'autre: 


où ce qu'il est important de retenir est que pour rendre contravariante une composante covariante, nous 
montons son indice: 


et inversement, pour la rendre covariante: 


Ainsi, toujours dans le cas de l'exemple de la métrique de Minkowski, si nous considérons le 
quadrivecteur contravariant: 
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xË =| D x i= | x à] (14.78) 
Nous avons alors: 


X 


pe = ox =(%,%)=(2%,-x)=(2xp,-X) (1479) 


4. DÉTERMINANT DE GRAM 


Voyons une autre approche pour obtenir les vecteurs de base de l'espace dual qui peut permettre par 
ailleurs de mieux appréhender le concept et qui nous permettra d'obtenir un résultat intéressant que nous 
utiliserons lors de certains calculs de la relativité générale (principalement son étude selon le formalisme 
lagrangien). 


Nous avons donc pour = j=1: 
5 og =1 (14.80) 


Ce produit scalaire peut être vu comme une condition de normalisation pour les deux bases et les deux 


produits scalaires 3? 08 = 0,8 o4 =0 comme des conditions d'orthogonalisation. Ainsi, comme & est 


2 +3 


perpendiculaire à 2,8” nous pouvons écrire: 


… 


8, =c" (e7 x&°) (14.81) 
Où -* est une constante de proportionnalité. Maintenant jouons un peu avec la relation précédente: 
J 
Sog=c"a {exe )=1 (148) 


Dès lors, nous obtenons: 


te 1 1 


Re 2 — ul 29 à 14.83 
a o(e2xé°) ESS (14.83) 


où nous voyons apparaître le produit mixte tel que nous l'avions défini dans le chapitre de Calcul 
Vectoriel. 


Ainsi, nous obtenons très facilement: 


. _ 2x8 
#l [2,4] Z 7 (14.84) 
eg eg 


» » 


ou de manière plus générale (sans démonstration car peut-être trop évident) nous avons donc pour les 
vecteurs covariants: 
gi x&* 


“i F2] 22 5] (14.85) 
8 ,€ ,€ 
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et de même pour les vecteurs contravariants (sans démonstration car peut-être trop évident?): 


8; X LA 


EE 


g (14.86) 


Remarques: 


R1. Le lecteur aura remarqué que les relations ci-dessus ne sont valables que pour un espace à trois 
dimensions. 


R2. La notation des deux relations précédentes est mathématiquement un peu abusive car en réalité ce 
n'est pas une égalité entre deux vecteurs mais une application d'un espace vectoriel dans l'autre! 


R3. Comme en physique, on considère très fréquemment des bases cartésiennes, cylindriques et 
sphériques orthonormées et que le dénominateur des deux relations précédentes est toujours égal à 
l'unité dans ces bases alors les vecteurs de bases contravariants s'identifient aux vecteurs de base 
covariants (et réciproquement). 


Revenons maintenant sur quelque chose qui va nous sembler bien ancien... Dans le chapitre de Calcul 
Vectoriel, nous avons défini et étudié ce qu'étaient le produit vectoriel et le produit mixte. Nous allons 
voir maintenant une autre manière de représenter ceux-ci et Voir que cette représentation permet d'obtenir 
un résultat pour le moins pertinent! 


Nous avons vu dans le chapitre de Calcul Vectoriel que le produit vectoriel était donné par: 
2Xÿ= (0% -2)2)à + - n73)8 +(%72 —-2M)83 (1487) 


Or, ce que nous n'avions pas vu et que nous pouvons constater maintenant de manière triviale c'est que 
cette expression n'est que le déterminant des matrices suivantes: 


2 € € 8, X& 8; X&, & X83 
xxÿ=detlx x x;|=det| x 72 73 (14.88) 
À 2 »3 il Ÿ2 Ÿ3 


Mais comme nous faisons du calcul tensoriel, il nous faut maintenant proprement distinguer composantes 
covariantes et contravariantes. Nous allons donc réécrire cela correctement avec les composantes 
contravariantes: 


4 & & 
*xÿ=detlx" x? x | (1489) 


y » » 


De même, le produit mixte peut être écrit à l'aide de cette relation et notation: 
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ë Ce 83 
CE CNE + 1 2 
[X,ÿ,Z]= Xo(ÿxZ)=Xodet|y »y° y 
À À» 
: (14.90) 
Re 
3—+ 2 
(rà +x 83 +x ä) det|y  »y° y 
Er 


Or, en regardant l'expression du déterminant nous voyons assez facilement, sans même avoir à faire les 
développements que: 


[F,5,7]= à o(& xé:) det| y! y? y? | (1491 


Effectivement (nous calculons le déterminant en faisant usage de la démonstration du déterminant à trois 
composantes vue dans le chapitre d'Algèbre Linéaire): 


xd r p 
F,5,2|=#o{ÿxz)=ào(àxé) det|y y? y» 
z! z° z 


= à o(2, x& 3) (ry22 - 2 y972  xyl2 + 22° 7! + x ylz PAR 


( 
x| 0 (2»72 — À y°z? — É y2 + x y°z! + r y\z? _ ry2) 
1 


0 
l 
0 
Ô (F2 - 7722 - Pyl2 + x y° 7! + ylz? -ry2) 


(14.92) 


Il 
D me 
Le) 


1 
0 |: (2 y?75 — xl 7? _ x ylz 3 4x2 7 +7 ylz? -Py2) 
() 
3 


ra - x y? — x ylz À x 7 4x ylz -ryz) 
= | x 7 -xy2)- (2»2- Frs (F2 - y?z\) 
= (2 (2 YA )+ (2 -y 2}+6(y2 - y2)) 
1 2-3 3_2 1 1 1 
x YZ -YZ x Y Z 
=|x lol pz plz |[=|x ol y xl 27 ||=#o(5xz) 
x wz? — y2z! x y 7° 
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La relation antéprécédente est fréquemment notée: 


1 2 3 

ZX ZX X 
[2,5,21= 4e det|yt »2 »?| (495) 

z) z° z 


avec: 
Ve =äc(xa)=[à.8.8] (499 


appelé "volume euclidien" (effectivement rappelons que le produit mixte est un volume!) 


Remarque: Rappelons encore une fois que si les vecteurs de base sont orthonormés, qu'ils soient 
exprimés en coordonnées cartésiennes, cylindriques ou sphériques alors: 


Je =äo(&x&)=1 (495) 


Par ailleurs, nous avons aussi la relation non moins importante: 
27 43 . 
2x 8 axe }& X83) 


g=a0(e x )=| lots x) = ——— (196) 
Ve 1 ( 2 3) [a,22,6] ( 2 3) [a,22,8] 


En utilisant la relation vue dans le chapitre de Calcul Vectoriel: 


(xs )o(axs)=(803,)(#08)-(203){# 08) (07 


Or, nous avons vu plus haut que 5° o3 5 = 5; donc: 


(208,)(# 8)-(8 08)(# 08)=11-00 (405 


et finalement: 
de 1 
les 22 F] (14.99) 
2 ,8 ,€8 


Ceci ayant été fait revenons à la relation du produit vectoriel: 


à 2 & 2*X8 &Xa 4X*Xe 
XX y= x'8, x yŸ8, =det|x x? x|=det| x x? re (14.100) 
1 2 3 1 2 3 
Y YO +? Y 4 4 


et exprimons les composantes du déterminant dans leur base duale (en coordonnées contravariantes) 


Page: 1038/4839 


[v3.0 - 2013] 


32 x8 F xs! 3 x 2 
LL 2 2 23 4 à à see 
à à à e ,e ,e e ,8 ,e e ,e ,e 
XX ÿ= det| x x |= det x x° x 
1 2 3 1 F) 3 
Ÿ  Y  Y » 4 Ÿ 4 
(14.101) 
à & à ë & à 
l LL + 3 JO + = 
= EE X ZX X = ,/g det ZX ZX ZX 
ë & | 
; > 2 3 1 2 3 
» y YO» y 


Bien évidemment, si le produit vectoriel est exprimé en composantes covariantes alors nous avons: 


En XE; 8x8 a X&, 
1 22 33 + + > = = = = = =] 
8° à& [a.e.8] [ae] [a.2,a)] 
xxÿ=xe xy,8 =det|x x 2x,|= det % ZX) x 
À 2 }# Y2 Ya 
(14.102) 
1 A 1 A 
det|x x ml=—detlx x x 


[22.4] £ 
À Ja }3 À Y2 »3 


Maintenant appliquons le produit mixte: 


… 


2) 82 83 

[F,5,2]= ré o(p'é, x2Ÿ, )= 4 godethy y? »?| (4103 
l 2 4 
Z £ £ 


en connaissant l'expression du déterminant d'une matrice carrée 3x3 (cf. chapitre d'Algebre Linéaire) il 


vient immédiatement: 


ii 1 2 3 
8] 2 2 2 3 x ZX X 
[x, 5,2] : F8, Je o det y y »|= fe det y y? y»| (4104) 
2 2 » À 2 7 
Inversement, il vient immédiatement: 
D 
= = = el 7 k 1 
X,y,Z|=2x;e 0 (>, X Z,e ) L Era M Y2 Y3l (14105) 
. A Z2 Z 


Or, nous avons vu que dans le chapitre de Calcul Vectoriel que x, = * °8,. Il vient alors: 
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°à 08 983 
, ER ei (14.106) 
X0€ X08 X083 
= —— det jo ÿoë VAT 
[ä.2.8] A 
Z04 ZO08 Z08: 
et donc: 
Foë Foë, foë, 
[x,,2][à,2.8]- det ÿoë joe poë (14.107) 
Zoa Zoe Zoë, 


Cette dernière relation étant souvent appelée "déterminant de Gram”. Un cas particulier très intéressant 
nous donne: 


- A°4 40e 08 &1 #2 #3 
[e,82,8 | = det 8) °4 8) 08) 8) 083 = det En1 E22 En (14.108) 
8394 6398 4968 En Ex £E% 


écrit autrement: 


(Je) rs det(g,) (14.109) 


Ainsi, le volume euclidien est donné par ce que nous appellerons le "déterminant fonctionnel" du système 
(expression que nous retrouverons en relativité générale et théorie des cordes): 


Je = feet (gs) (14.110) 


Si nous notons autrement le déterminant: 


Ve = el (14.111) 


5. COMPOSANTES CONTRAVARIANTES ET COVARIANTES 


Jusqu'à maintenant nous avons écrit les indices muets arbitrairement en exposant ou en indice selon notre 
bon vouloir. Cependant, cela n'est pas toujours autorisé et parfois le fait qu'un indice muet soit en 
exposant ou en indice a une signification bien particulière. Ceci constitue souvent la difficulté lors de 
l'étude de certains théorèmes, car si nous n'étudions pas ceux-là depuis le début, nous ne savons pas 
vraiment comment interpréter la position des indices muets. Il faut donc être extrêmement prudent à ce 
niveau. 


Pour un espace vectoriel euclidien Æ, rapporté à une base quelconque (&, }, le produit scalaire d'un 


vecteur * = x'&, par un vecteur 2; de sa base s'écrit: 
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x 08, = (x8,)08, = x (& 08.) = r'&; = ZX; (14112) 


Donc: 


i 
— . 4,113 
X; = X8ÿ| (14.113) 


Cette relation est de première importance en physique théorique et en calcul tensoriel. Il est important de 
s'en souvenir lorsque nous étudierons la contraction des indices plus tard (vous pouvez observer dans la 
relation précédente que nous avons "abaissé" dans le membre de gauche l'indice des composantes du 
membre droit de l'égalité). 


Ces produits scalaires notés x;, s'appellent les "composantes covariantes", dans la base (&,), du vecteur 
x. Ces composantes sont donc définies par: 


Remarque: Cela constitue donc une projection d'un vecteur sur un des vecteurs de sa propre base. 


Elles seront notées au moyen d'indices inférieurs !!! Nous verrons par la suite que ces composantes 
s'introduisent naturellement pour certains vecteurs de la physique, par exemple le vecteur gradient. 
D'autre part, la notion de composante covariante est essentielle pour les tenseurs. 


Remarque: Les vecteurs de base ont toujours les indices notés en bas car ils sont leurs propres 
composantes covariantes (ils se projettent sur eux-mêmes par produit scalaire). 


Inversement, les "composantes contravariantes" (autrement dit les composantes non projetées) peuvent 
être calculées en résolvant, par rapport aux n inconnues x*, le système de n équations de: 


mE Le 
X; = X &ÿ| (14.115) 


Les relations précédentes montrent que les composantes covariantes x; sont liées aux composantes 
x° classiques et que les composantes contravariantes sont donc des nombres x° tels que: 


X=x8& (14.116) 


Elles seront indiquées au moyen d'indices supérieurs !! L'étude des changements de base permettra de 
justifier encore plus l'appellation des différentes composantes. 


Dans une base orthonormée canonique (cas très particulier), les composantes covariantes et 
contravariantes sont identiques comme nous le savons déjà suite à l'étude du déterminant de Gram. 
Effectivement: 


x, =Fo08,=(x8)08, = x (G08)=#8 27 (14117) 
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Remarque: Nous voyons ci-dessus, que l'écriture incessante d'indices muets en exposants ou en indice 
peut parfois amener à certaines confusions et à des maux de tête sérieux... 


6. OPÉRATIONS DANS LES BASES 


L'intérêt du physicien pour le calcul tensoriel, est le passage de paramètres d'une base à une autre pour des 
raisons données (souvent dans le but soit de simplifier l'étude de problèmes ou simplement parce que les 
états étudiés dépendent - ou peuvent dépendre - de la géométrie de l'espace dont il est question). Il 
convient donc d'introduire les principaux outils qui y sont relatifs. Nous en profiterons aussi pour 
présenter des développements que nous aurions pu déjà aborder dans le chapitre de Calcul Vectoriel. 


6.1. MÉTHODE D'ORTHOGONALISATION DE SCHMIDT 


La "méthode d'orthogonalisation de Schmidt" (dite également de "Gram-Schmidt") permet le calcul 
effectif d'une base orthogonale pour tout espace vectoriel pré-euclidien Æ, (nous aurions pu présenter 


cette méthode dans le chapitre de Calcul Vectoriel mais il nous semblait plus intéressant de la présenter 
dans le cadre général et esthétique du calcul tensoriel). 


Pour cela, considérons un ensemble de n vecteurs linéairement indépendants (%,%,,...,%,) de Æ, et 
supposons que nous ayons pour chaque vecteur le produit scalaire (la norme): 


X0% #0 (14.118) 


Cherchons n vecteurs &, orthogonaux entre eux. Partons pour cela de &, = % et cherchons &, orthogonal à 


8, sous la forme: 
€ = Ag +Xa (14.119) 
Le coefficient À se calcule en écrivant la relation d'orthogonalité: 
8,08, = XO(AX +X) = 0 (14.120) 
Nous en déduisons sans trop de peine: 


40% _ _A0% 


== sd 
| 


Am 


(14.121) 
Le paramètre À étant déterminé, nous obtenons le vecteur #, qui est orthogonal à &, et non nul puisque le 
système (&, X,....,X%,) est linéairement indépendant. 
Le vecteur &, est cherché sous la forme: 
, = He, tie + X (14.122) 


Les deux relations d'orthogonalité: &, 98, = 0 et &, 08, = 0 , permettent le calcul des coefficients {4 et 
4. Nous obtenons: 
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& 0x: 80X. 
4 =-1 3, jp = 3 
EX 


12 > 
ä| 


ce qui détermine le vecteur &,, orthogonal à &, et &,, et non nul puisque le système (&,2,,%3 ,...,%,) est 


(14.123) 


indépendant. En continuant le même type de calcul, nous obtenons de proche en proche un système de 
vecteurs (&,8,,...,8,) orthogonaux entre eux et dont aucun n'est nul. 


Dans le cas où certains vecteurs seraient tels que X; °% = 0 (leur norme est nulle), nous remplaçons x; par 


— 


3,'= 3%; + À'X,, en choisissant un vecteur X; de telle sorte que nous obtenions # 'e% "#0. 


Nous en déduisons donc que tout espace vectoriel pré-euclidien admet des bases orthogonales! 


Ce système de calcul des bases est de première importance. Il permet par exemple d'étudier des systèmes 
physiques à partir d'un référentiel pré-euclidien dont les propriétés changent dans le temps. Ce qui est par 
exemple typique de la relativité générale. 


6.2. CHANGEMENTS DE BASES 


Soient deux bases (&,8,,...,8.) et (8,8 ",,..,8",) d'un espace vectoriel Æ,. Chaque vecteur d'une base 
172 # l 2 # x 
peut être décomposé sur l'autre base sous la forme suivante (nous l'avons déjà démontré): 


3, = AŸS', et 8, = A& (14124) 
Un vecteur * de Æ, peut être décomposé sur chaque base sous la forme: 
& =x"8", (14125) 
et nous avons aussi déjà démontré que: 
di = AixŸ et x* = AÛ x (14126) 
Nous remarquons que les relations de transformation des composantes contravariantes d'un vecteur sont le 
contraire de celles des vecteurs de base, les grandeurs A et A" s'échangeant, d'où l'origine de l'appellation 


"contra"-"variantes" de ces composantes! 


Soient x; et x', les composantes covariantes du vecteur * respectivement sur les bases (&,) et (&',). 
Remplaçons les vecteurs de base, exprimés par les relations: 


= KR — … i + _ 
8, = AŸe',ete', = A& (14.127) 
dans l'expression de définition des composantes covariantes, il vient: 
— KE rs ke _—: _ 1k 1 à 6 
A = Xog = Xo(A)8 ,)=A;(X08,)=AÀ%x% (14128) 


d'où la relation entre les composantes covariantes dans chaque base: 


x = AŸx', (14.129) 
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Nous obtenons de même: 


ZX = 4x; (14.130) 


Nous remarquons que les composantes covariantes se transforment comme les vecteurs de bases, d'où 
l'appellation de ces composantes. 


6.3. BASES RÉCIPROQUES 


Revenons maintenant sur le concept d'espace dual mais tel qu'il est vu dans le cadre du calcul vectoriel. 
Cette deuxième approche peut peut-être aider certains à mieux comprendre le concept vu précédemment 
mais par contre masque la raison profonde de l'origine dénominsations de "covariant" et "contravariant". 
Pourtant c'est la présentation la plus courante dans la littérature... 


Soit une base quelconque (&,) d'un espace vectoriel euclidien Æ,. Par définition, n vecteurs 3* qui 
vérifient les relations suivantes: 


sont appelés les "vecteurs réciproques" des vecteurs &, . Ils seront notés avec des indices supérieurs. Par 


définition, chaque vecteur réciproque 3* se doit donc d'être orthogonal à tous les vecteurs &,, sauf pour 
& =i. 


Montrons d'abord que les vecteurs réciproques 3* d'une base donnée (&,) sont linéairement indépendants. 
Pour cela, il faut montrer qu'une combinaison linéaire 4,#* donne un vecteur nul, si et seulement si 
chaque coefficient À est nul. 


Soit * = x'&, un vecteur quelconque de Æ,. Multiplions scalairement par * la combinaison linéaire 


précédente 48°, on obtient: 
(As )or = (A8 )o(ra) = Ar" 08) = 4x 6, = 4x = 0 (14122) 


Cette dernière égalité devant être vérifiée quels que soient les x°, il est nécessaire que chaque À soit nul 


et ainsi les vecteurs 3* sont donc linéairement indépendants (fallait déjà avoir l'idée de procéder ainsi 
n'est-ce pas?). 


Le système de n vecteurs réciproques forme donc une base appelée la "base réciproque" (qui n'est autre 
que la base duale) de l'espace vectoriel Æ,. 


Exemple: 


Soient trois vecteurs &,, 8,8; formant une base (non nécessairement orthonormée!) d'un espace vectoriel 
euclidien. Nous décidons de noter: 
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où, rappelons-le, le symbole * représente le produit vectoriel (au cas où il y aurait un petit oubli...) et 
l'ensemble est le produit mixte vu dans le chapitre de Calcul Vectoriel et qui représente donc un volume 
orienté. 


Les vecteurs suivants: 


———,@ = ———| (14134) 


vérifient la relation &, 63° = &, et constituent le système réciproque des vecteurs &, &,,&,. En 
cristallographie, ces vecteurs constituent ce que nous appelons "l'espace de Fourier associé". 


Remarque: Nous reconnaissons ici les relations que nous avions déjà obtenues lors de notre étude du 
déterminant de Gram. 


Maintenant, considérons donc un vecteur sur la base d'origine &,,8,,8, que nous noterons donc (comme 
déjà vu plus haut): 


avec donc par définition les composatnes contravariantes du vecteur qui apparaissent comme nous l'avons 
défini plus haut (et donc nous avons en même temps expliqué l'origine du nom). Nous avons vu aussi plus 
haut que chaque composante contravariant sera aussi (naturellement et par extension) donnée par: 

: 


x =Xo8 (14136) 


De façon similaire, nous avons donc les composantes covariantes qui apparaissent: 


Dans cette approche, nous définissons alors le tenseur métrique contravariant et respectivement covariant 
par: 


EL og] = gi = gi 


Il vient alors par exemple pour les composantes contravariantes (dans le cas particulier de l'espace à trois 
dimensions), sachant que la démarche est la même pour les composantes covariantes: 


xl =xos = {mel +287 +207 |o8! = m [al 0! |4+2, (82 08! |+2 (27 05! | 


| | . : (14.139) 
= 48" +087 +23) = 2,8} 
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Et donc nous retrouvons la relation de transformation entre composantes covariantes et contravariantes 
déjà vue plus haut à la différence que cela semble plus sortir du chapeau pas définition successives et que 
cela cache donc l'origine de la dénomination de ces mêmes composantes. Mais peut-être que certaines 
lecteurs préférence cette approche. 


7. TENSEURS EUCLIDIENS 


La généralisation de la notion de vecteur nous a conduits à l'étude des espaces vectoriels à # dimensions. 
Les tenseurs sont également des vecteurs de dimension quelconque mais qui possèdent des propriétés 
supplémentaires par rapport aux vecteurs. 


Pour le physicien théoricien, le calcul tensoriel s'intéresse en premier lieu à la manière dont les 
composantes des tenseurs se transforment lors d'un changement de base des espaces vectoriels dont ils 
sont issus. Nous commencerons donc à étudier ces propriétés vis-à-vis des changements de base (car c'est 
le cas le plus intéressant). 


Un tenseur est, en pratique, souvent uniquement défini et utilisé sous forme de ses composantes. Ces 
dernières peuvent être exprimées sous forme covariante ou contravariante comme pour tout vecteur. Mais 
un nouveau type de composantes va apparaître pour les tenseurs, ce sont les "composantes mixtes". Ces 
trois types de composantes constituent des décompositions des tenseurs euclidiens sur des bases 
différentes. 


7.1. TENSEUR FONDAMENTAL 


Au cours de la théorie vue précédemment, nous avons utilisé les quantités g;, définies à partir du produit 
scalaire des vecteurs de base (&,) d'un espace vectoriel pré-euclidien Æ, à n dimensions, par: 


&ÿ = 408; (14.140) 


Ces »? quantités constituent les composantes covariantes d'un tenseur appelé le "tenseur fondamental" ou 
"tenseur métrique”. 


Etudions comment varient les quantités £; lorsque nous effectuons un changement de base: 


Soit (2',) une autre base liée à la précédente par les relations connues: 


Substituant la relation &, = 4' Ÿ£', dans l'expression de 8ÿ, il vient (nous changeons les indices comme il 


se doit lors d'une substitution): 
_ 1 k— 1 l—: — 1k 1 ls, y: LL 1 A 149 
85 =(A'iex)o(A" gr) =(4"; A" ;)'(e@x0e;) (14.142) 
Dans la nouvelle base (2'.), les produits scalaires des vecteurs de base sont donc des quantités telles que: 


1 +1 
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Nous avons donc finalement pour l'expression des composantes covariantes £; lors d'un changement de 


base: 
ik qi |, 
85 = (A'i A'j)g'ul (14.144) 


Identiquement nous avons: 


gy' = (A A)gul (4145) 


De manière générale, une suite de x? quantités ; qui se transforment, lors d'un changement de base de 
Æ,,, selon les deux relations précédentes, à savoir: 


db; = (4 4"; M'u et êu'= (44) (14.146) 


constituent, par définition, les "composantes covariantes d'un tenseur d'ordre deux" (à deux indices) sur 
E 


Nous pouvons ainsi manipuler des quantités exprimant les propriétés intrinsèques des bases comme des 
tenseurs normaux |! 


7.2. PRODUIT TENSORIEL DE DEUX VECTEURS 


Considérons un espace vectoriel euclidien Æ, de base (4) et soient deux vecteurs de £,,: 


i = J 


X=x8 et ÿY=y'e; (14147) 


Formons les produits deux à deux des composantes contravariantes x° et y”, soit: 
uŸ =xiy] (14.148) 


Nous obtenons ainsi #»? quantités, si les deux vecteurs ont le même nombre de composantes, qui 


constituent également les composantes contravariantes d'un tenseur d'ordre deux appelé le "produit 
tensoriel" du vecteur * par le vecteur ÿ . 


Par exemple pour * de dimension 2 et Ÿ de dimension 3 nous avons: 


ZA} 
XY2 

: ñ = 

Fi Je V2 |= és (14.149) 
X2Y] 
2,2 


423 


Nous pouvons bien évidemment construire des produits tensoriels d'ordre trois (donc avec #° termes) tels 
qu'avec le tenseur trois fois contravariant suivant: 
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ne = xyfz* (14.150) 
etc. 


Etudions les propriétés de changement de base de ces composantes. Utilisons pour cela les relations de 
changement de base des composantes contravariantes d'un vecteur, à savoir: 


= Aix "et x*=A%Ÿx (14151) 


Remplaçons dans la relation #Ÿ = x'y* les composantes x' et y* par leur expression de changement de 
base, il vient: 


ui = xp = (4x")(4 y") = AA (xt y) = (AA (14152) 


Les quantités 4“ sont les nouvelles composantes: 


La formule de transformation des #°? quantités 4Ÿ lors d'un changement de base de Æ, est donc 
finalement (très similaire au tenseur métrique): 


Une telle relation de changement de base caractérise les composantes contravariantes d'un tenseur d'ordre 


deux. Inversement, nous obtenons: 
Ki 14 È ÿ 
u" = A A'uŸ] (14155) 


Les #°? quantités #” constituent donc les "composantes contravariantes d'un tenseur d'ordre deux". 


Nous pouvons former de même les produits deux à deux des composantes covariantes x; et y; des 
vecteurs * et ÿ soit: 


Uÿ = XY; (14156) 


Les formules de changement de base des composantes covariantes des vecteurs sont données par les 
relations suivantes que nous avons déjà démontrées précédemment: 


x = AŸx'et x', = Æx (14.157) 
Substituant la première relation dans le produit 4; = x%y;, il vient: 
1k 1 il 1! k iè 1 L k& il ! 
lg (À; x)(A y) = À; AXEL Vi) = (4; À’; ju g (4.158) 


C'est la relation de changement de base des composantes covariantes d'un tenseur d'ordre deux. On vérifie 
que l'on a: 


(14.159) 
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Identiquement nous avons bien évidemment: 44 = x',.y', puisque 4 = Xÿ;. 


Les x? quantités 4;; constituent donc les "composantes covariantes d'un tenseur d'ordre deux". 


Formons à présent #? quantités en multipliant deux à deux les composantes covariantes du vecteur * par 
les composantes contravariantes de ÿ , nous obtenons: 


= u 


Effectuons un changement de base dans cette dernière relation en tenant compte des expressions 
x, = AŸx', et x = 4x", on obtient: 


nu) = xp) = (4Ÿ x) 4 y") = A A4 (x y") = (A A4 (14161) 


Cette relation de changement de base caractérise les "composantes mixtes" d'un tenseur d'ordre deux. 
Inversement, on peut vérifier que l'on a: 


CR PE 
u', = 4 A';u}| (14162) 


Ces composantes mixtes constituent également des composantes du produit tensoriel de * par ÿ , selon 
une certaine base. 


De manière générale, une suite de x? quantités 4? qui se transforment, lors d'un changement de base de 
Æ,, selon les relations établies juste précédemment constituent donc, par définition, les "composantes 
mixtes d'un tenseur d'ordre deux". 


7.9. ESPACES TENSORIELS 


2 


Au cours de l'étude précédente, nous avons utilisé des systèmes de #* nombres, crées à partir d'un espace 


vectoriel Æ,. Lorsque ces nombres vérifient certaines relations de changement de base, nous avons appelé 
ces grandeurs, par définition, les "composantes d'un tenseur". 


Nous avons vu que toute combinaison linéaire de ces composantes constitue les composantes d'autres 
tenseurs. Nous pouvons donc additionner entre elles les composantes des tenseurs ainsi que les multiplier 
par des scalaires, pour obtenir d'autres composantes de tenseurs. Ces propriétés d'addition et de 
multiplication font que nous allons pouvoir utiliser ces grandeurs tensorielles comme composantes de 
vecteurs. 


D'un point de vue pratique, nous pourrions nous contenter de définir les tenseurs à partir des relations de 
transformation de leurs composantes lors d'un changement de base. C'est ce qui est souvent fait en 
physique. Cependant, la définition des tenseurs sous forme de vecteurs conduit à une meilleure 
compréhension de leurs propriétés et les rattache à la théorie générale des vecteurs. 


Pour préciser comment nous définissons un tenseur sur une base, étudions le cas particulier d'un produit 
tensoriel de deux vecteurs constitués par des triplets de nombres. Considérons l'espace vectoriel euclidien 
Æ, dont les vecteurs sont des triplets de nombre de la forme: X = (x,,x,,2x,). La base orthonormée 


canonique de Æ, est formée de trois vecteurs: 
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8, = (ô, dx, D) (14.163) 
avec à = 1,2,3 (jolie façon d'écrire la chose n'est-il pas.…). 


Des vecteurs de Æ, permettent de former les neuf quantités x'y»* que nous avons appelées les 
"composantes du produit tensoriel" des vecteurs * et ÿ. 


Si nous effectuons tous les produits tensoriels possibles entre vecteurs de Æ, , nous obtenons des suites de 
neuf nombres qui peuvent servir à définir le vecteur suivant: 


Ü=(xly xp ,xly x y?) (14.164) 


Remarque: Nous voyons de suite avec la relation précédente que le produit tensoriel n'est dès lors pas 
commutatif. 


Nous nous retrouvons alors avec des éléments d'un espace vectoriel Æ, à neuf dimensions, ayant pour 
éléments tous les multiplets formés de neuf nombres. 
Ces vecteurs peuvent être décomposés, par exemple, sur une base canonique orthonormée: 

Sn = (On, pos D) (14.165) 


avec & =1,2,..,9, 
Si nous renumérotons les quantités x'y* selon la place qu'elles occupent dans l'expression de {?, soit: 
x'y =uÿ =u* (14.166) 
avec # = 1,2,..,9 et à, j =1,2,3 les vecteurs {} s'écrivent alors: 
Ü'=u"8, (14.167) 
et constituent un exemple de tenseur d'ordre deux (évidemment on peut généraliser la démarche). 


En quoi ces tenseurs {} diffèrent-ils des vecteurs ordinaires ? Ils sont certes identiques à certains vecteurs 
de Æ, mais ils ont été formés à partir des vecteurs de * et ÿ de Æ,. Pour rappeler ce fait, nous les notons: 


he 


Ü =x@ÿ]| (14168) 
et ils sont appelés "produits tensoriels d'ordre deux" des vecteurs * et ÿ . Le symbole @ est donc défini 


de la manière dont nous avons formé les quantités x‘y* = #Ÿ et l'ordre dans lequel nous les avons classées 
pour former le vecteur f}. 


Pour rappeler la dépendance entre une quantité x'y* = #Ÿ et le vecteur de base &, auquel il est affecté, 


renumérotons ces vecteurs en mettant à la place de l'indice k les deux indices i et j, relatifs aux 
composantes, soit: 
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8, =; (14169) 
Ce dernier peut très bien être noté sous la forme: 


(14.170) 


Les vecteurs &#; 2; constituent donc une base de Æ, qui est appelée la "base associée". 


Nous rappelons également que le produit tensoriel est non-commutatif (il est vraiment important de s'en 
rappeler)! Autrement dit: 


X@y#ÿY@X (14171) 


Les relations précédentes nous permettent finalement d'écrire le produit tensoriel des vecteurs * et ÿ sous 
la forme: 


FOÿ=x y 3, =(x8)@ 0e) =x y G @ë,)| (14172) 


L'espace vectoriel Æ, est doté d'une structure plus précise que celle de simple espace vectoriel de 
dimension neuf lorsque nous définissons les produits tensoriels #; @2; comme constituant la base de Æ,. 


Nous disons que Æ, est doté d'une "structure de produit tensoriel" ce qui nous amène à noter cet espace 


£, @Æ, ou encore Æ*). 


En tant qu'élément d'un espace Æ, @Æ, , un tenseur {} est un vecteur de la forme générale: 


Ü =u(s, @e;)| (14.173) 


Etudions ses propriétés vis-à-vis d'un changement de base de Æ, tel que: 
3, = AŸS',eta', = A& (14174) 


Lors d'un tel changement, la base (& @2;) associée à &, devient une autre base (8',@2") associée à 4, 
à savoir: 


3,881 = (48) @(48,) = (AA) @3, (14175) 
Par suite, le produit tensoriel {} a pour composantes dans la nouvelle base: 
Du" (98) =u (44), @e, = (A Au (AA, DE, (14176) 
Soit donc: 
(#8) @(y'e,) = x y (&, @e;) (14177) 
Nous avons les propriétés suivantes pour le produit tensoriel: 


P1. Distributivité, à gauche et à droite, par rapport à l'addition des vecteurs: 
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(14.178) 


La démonstration de ces propriétés découle simplement de la définition du produit tensoriel. Nous avons 
par exemple: 


(#+9) @7 = (18 +y'84)@z'e ,=(x +y')4 @z'e ,=(x +y')2"8, ©, 
= x'z"8 Oë,+y'2 8 6 ,=-1@7+ÿ@Z | 


P2. Associativité avec la multiplication par une grandeur scalaire: 
(Ar) @ y = x@(A4ÿ = AX@Y) (14180) 
Nous avons en effet: 
(A) @ÿ = (Axa) @y'e, = Ar y GE) = AX@Y) (14181) 


P3. Lorsque nous choisissons une base dans chacun des espaces vectoriels (&) pour Æ,, (£) pour À, , les 


*#'#m éléments de G,, que nous notons &, @ f forment également une base de G,, . 


Démonstration: 
Déjà faite dans l'exemple particulier que nous avons utilisé au début. 
OC.Q.F D. 


Remarque: En pratique, nous avons souvent à utiliser des tenseurs formés à partir de vecteurs 
appartenant à des espaces vectoriels identiques Æ, . 


Nous pouvons bien évidemment généraliser le produit tensoriel à un nombre quelconque de vecteurs. De 
proche en proche, compte tenu de la propriété P1, nous pouvons considérer ? vecteurs 


%; 225. X, appartenant chacun à des espaces vectoriels différents Eu, £,3,..., £,,. Si nous avons: 
RE | 
RH = X 6, = X @p,…. (14.182) 
nous pouvons former le produit tensoriel: 
r OX ©..Ox, = 21x07. (8 Oo, ©... Oe,) (14.183 
avec à = {1,4} = (Lu), =(L.,,). 


Nous construisons ainsi des produits tensoriels d'ordre p appartenant à l'espace vectoriel 
En OE,, @..OEÆ,,, espace qui est muni d'une structure de produit tensoriel. Les éléments de cet espace 
constituent par définition des tenseurs d'ordre p. 
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Afin d'unifier la classification, les espaces vectoriels élémentaires, qui ne peuvent être munis d'une 
structure de produit tensoriel, peuvent être considérés comme ayant pour éléments des tenseurs d'ordre un. 
En général, nous appelons ces éléments des "vecteurs", réservant le nom de "tenseurs" à des éléments 
d'espaces tensoriels d'ordre égal ou supérieur à deux! 


Remarque: Il est commode d'appeler "tenseurs d'ordre zéro" les grandeurs scalaires. Il est également 
rare de rencontrer des tenseurs d'ordre supérieur à 2. 


Il est assez évident et nous n'en ferons pas la démonstration (excepté s'il y a une demande) que nous 
pouvons redéfinir absolument tous les concepts (base, décomposition sur une base, base réciproque, 
produit scalaire, produit tensoriel) que nous avons vus jusqu'à maintenant en considérant les tenseurs 
d'ordre un comme des vecteurs (il faudrait donc que nous réécrivions tout ce qui est déjà écrit ci-dessus... 
ce qui est inutile). 


Il est aussi tout à fait possible de réitérer toutes ces définitions pour des tenseurs d'ordre supérieurs et ainsi 
généraliser le concept d'espace tensoriel pour toutes les dimensions. 


De ces considérations, nous pouvons énoncer le "critère de tensorialité": 


Pour que les éléments d'une suite de #” quantités, rapportées à une base d'un espace vectoriel Æ!7}, 
puissent être considérés comme les composantes d'un tenseur, il faut et il suffit que ces quantités soit liées 
entre elles, dans deux bases différentes de E? par les relations de transformation des composantes. 


Exemple: 


Un vecteur peut se représenter dans une base quelconque par une suite de n composantes. Cependant, nous 
ne pouvons pas conclure que n'importe quelle suite de n chiffres constitue un vecteur. En effet, lorsque 
nous nous plaçons dans une autre base de l'espace, les composantes doivent changer également, pour 
représenter le même objet: nous disons alors que le vecteur est un objet intrinsèque (dont l'existence ne 
dépend pas du choix du repère). Il reste alors à savoir qu'un vecteur est un tenseur d'ordre 1. 


7.4. COMBINAISONS LINÉAIRES DE TENSEURS 


Nous pouvons former d'autres tenseurs en combinant entre elles les composantes de différents produits 
tensoriels définis à l'aide des vecteurs d'un même espace vectoriel. Considérons par exemple les 
composantes contravariantes des produits tensoriels des vecteurs X,ÿ et W,Z : 


vŸ = wiz/ 
Formons les quantités suivantes: 
= ut + Avi 
Les #*? quantités # vérifient également les formules générales de changement de base. Nous avons en 


effet, en substituant les relations de transformation des composantes contravariantes d'un produit tensoriel 
dans l'expression précédente: 


D = À Au + 14 A)v% = A4 ® 
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Les #°? quantités £Ÿ, vérifiant la relation de changement de base, constituent donc également des 
composantes contravariantes d'un tenseur d'ordre deux. 


7.5. CONTRACTION DES INDICES 


Considérons le produit tensoriel mixte de deux vecteurs * et Ÿ de composantes respectives 
contravariantes x et covariantes y,. Les composantes mixtes du produit tensoriel # de ces deux 
vecteurs, sont: 


rs 
V; x Ÿ; 
Effectuons l'addition des différentes composantes du tenseur Ÿ telles que à = À, soit: 
si 
v=xy; 


Nous obtenons ainsi l'expression du produit scalaire des vecteurs * et ÿ ; la quantité v est un scalaire ou 
tenseur d'ordre zéro. Une telle addition sur des indices de variance différente constitue, par définition, 
l'opération de "contraction des indices" du tenseur f. Cette opération a permis de passer d'un tenseur 
d'ordre deux à un tenseur d'ordre zéro; le tenseur } a été amputé d'une covariance et d'une 
contravariance. 


Prenons également l'exemple d'un tenseur {} dont les composantes mixtes sont une fois covariante et 
deux fois contravariantes #Ÿ (attention... il ne s'agit pas d'une matrice tridimensionnelle mais simplement 
de l'indication que les composantes de ce tenseur s'expriment à partir de trois autres variables). 
Considérons certaines de ses composantes telles que À = #, à savoir les quantités u} et effectuons 
l'addition de ces dernières. Nous obtenons alors: 
D ke ÿ 

v'=u, tu) +. +u, = jui 
Ces nouvelles quantités y? forment les composantes d'un tenseur f d'ordre un (donc un vecteur!) 
et constituent ce que nous appelons alors les "composantes contractées" du tenseur {? et satisfont bien 
évidemment aux relations de changement de base (sur demande nous pouvons faire la démonstration mais 


sachez qu'elle est similaire à celle que nous avions faite pour les vecteurs). Nous sommes ainsi passé d'un 
tenseur d'ordre trois à un tenseur d'ordre un. 


Si nous partons d'un tenseur de composantes contravariantes ou covariantes, nous pouvons abaisser/élever 
un ou plusieurs des indices par multiplication (le cas échéant répétée) par gÿ ou gŸ (métrique diagonale 


unitaire et à signature positive: de type canonique) afin d'obtenir des composantes mixtes sur lesquelles 
nous pourrons ensuite effectuer des opérations de contraction. 


Considérons un tenseur euclidien © de composantes contravariantes , #31». 


Si nous voulons effectuer une contraction sur ce tenseur, il nous faudra d'abord le transformer en un 
tenseur mixte. Cette transformation se fera à l'aide d'un tenseur fondamental. 


Écrivons { en composantes mixtes en abaissant à la position covariante l'indice à, par exemple (cela 
revient donc à exprimer cette composante contravariante en composante covariante). Alors: 
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hi. bi in 


ip _ 
u} É A (14.190) 


Nous voyons bien que dans le cas présent pour descendre un indice contravariant dans un tenseur au 
moyen d'un tenseur fondamental, il faut d'abord aller rechercher dans les indices covariants du tenseur 
fondamental celui qui se retrouve en contravariant dans le tenseur d'origine et le remplacer à sa position 
(mais cette fois en covariance) par l'autre indice du tenseur fondamental (il en est de même lorsque l'on 
souhaite monter un indice dans le cas où l'on souhaiterait opérer une contraction sur un tenseur covariant). 


Effectivement, rappelons que nous avons démontré que: 


: i 
X; = gÿX (14.191) 


Maintenant que nous avons obtenu un tenseur à composantes mixtes, nous pouvons très bien en plus 
contracter les indices. Choisissons par exemple l'indice ä, et effectuons la contraction avec l'indice ;;, 


posons à, = À, = Æ (nous ne nous intéressons plus alors qu'à certains termes particuliers), il vient alors en 
écrivant toute la démarche depuis le début: 


hote =#25 = 0 = (14.192) 


Eh %# 


Nous obtenons donc après abaissement de l'indice et contraction, un tenseur d'ordre ? — 2. 
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Remarques: 


R1. La deuxième égalité de l'expression précédente est une notation abusive que l'on retrouve dans 
certains ouvrages (car rigoureusement il faudrait faire le calcul en deux étapes). 


R2. Par suite de la symétrie des quantités £; (produit scalaire est commutatif) ce dernier tenseur est 
identique à celui que nous obtiendrions en abaïissant à la position covariante l'indice à, puis en 


effectuant la contraction avec l'indice à. 
Voyons cela : 


La symétrie &ÿ = &x prend ici la forme : 


(cela peut paraître déroutant mais rappelons-nous que le chiffre d'une composante i indique la place de 
cette composante) 


Donc il vient : 


iii... À hi..À 
guTr ' Ut * (14.194) 


et en posant # = j) = &: 


à de hr (14.195) 


De manière générale, la contraction d'un tenseur permet donc de former un tenseur d'ordre 2 — 2 à partir 
d'un tenseur d'ordre p. Nous pouvons naturellement répéter l'opération de contraction. Ainsi, un tenseur 
pair, 2p, deviendra un scalaire après p contractions et un tenseur d'ordre impair, 22 + 1, deviendra un 
vecteur. 


Nous pouvons étendre après cette définition de la contraction des indices, le critère de tensorialité. Nous 
avons vu jusqu'à maintenant, deux manières de reconnaître le caractère tensoriel d'une suite de quantités: 


- la première consiste à démontrer que ces quantités sont formées par le produit tensoriel de composantes 
de vecteurs ou par une somme de produits tensoriels; 


- la deuxième consiste à étudier la manière dont ces quantités se transforment lors d'un changement de 
base et à vérifier la conformité des relations de transformation; 
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- la troisième et nouvelle amène à poser que pour qu'un ensemble de #**? quantités, comportant p indices 
supérieurs et q indices inférieurs soit tensoriel, il faut et il suffit que leur produit complètement contracté 
par les composantes contravariantes de p vecteurs quelconques et les composantes covariantes de 

q vecteurs quelconques, soit une quantité (la norme au fait...) qui demeure invariante par changement de 
base. 


8. TENSEURS PARTICULIERS 


Nous pouvons être confrontés en physique théorique à des tenseurs qui ont des propriétés intéressantes. 
Afin d'éviter de faire un travail redondant au cas par cas, nous allons énumérer et démontrer les différentes 
propriétés existantes et parler de leurs possibles implications. 


8.1. TENSEUR SYMÉTRIQUE 


Considérons un tenseur {} d'ordre deux de composantes contravariantes 4Ÿ. Supposons que, suivant une 
base (£, }, toutes ces composantes satisfassent aux relations: 


uŸ =u# (14.196) 


Sur une autre base (2 5) , liée à la précédente par les relations de transformation connues, les nouvelles 


composantes de %'* vérifient la relation: 
De È ÿ dl 
nt = AS Au = AY AiuŸ (14197) 


Nous voyons que la propriété uŸ =" est donc une caractéristique intrinsèque du tenseur £?, 
indépendante de la base ! Nous disons alors que le tenseur est un "tenseur symétrique" (nous reviendrons 
sur cette notion un peu plus loin). 


La propriété de symétrie se vérifie également pour les composantes covariantes d'un tenseur symétrique 
puisque nous avons: 


- ? — v— 
Un — EsEgl Eyes “Ug (14.198) 
Réciproquement, la symétrie des composantes covariantes entraîne celle des composantes contravariantes. 


Pour des tenseurs d'ordre plus élevé, la symétrie peut être partielle, portant sur deux indices covariants ou 
deux indices contravariants. Ainsi, un tenseur d'ordre quatre, de composantes mixtes ui peut être 
également symétrique en iet j, par exemple, soit: 


LL 


FT 
lj 


=uÿ (14.199) 


Nous vérifions, de même que ci-dessus, qu'une telle propriété est intrinsèque. 


Un tenseur est dit "tenseur complètement symétrique" si toute transposition de deux indices de même 
variance, change la composante correspondante en elle-même. Par exemple, pour un tenseur d'ordre trois 


4%*, complètement symétrique, nous avons les composantes suivantes qui sont égales entre elles: 
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Des exemples de tenseurs compléments symétriques sont le tenseur des contraintes &;; que nous verrons 


lors de notre étude des équations de Navier-Stokes en mécanique des fluides et les tenseurs des 
transformations relativistes de Lorentz que nous verrons en mécanique relativiste. Ces tenseurs sont alors 
dits aussi "tenseurs totalement invariants" (sous-entendu par changement de base). 


Nous pouvons également (curiosité intéressante) obtenir une représentation géométrique des valeurs des 
composantes d'un tenseur symétrique d'ordre deux. Pour cela, considérons dans l'espace géométrique 
ordinaire des coordonnées x, l'équation suivante: 


. 
ax x =1 (14201) 


où, rappelons-le, x*xŸ peut être vu comme un produit tensoriel avec ÿ,.j = 1,2,3 et où les 4;; sont des 
coefficients réels donnés. Supposons que ces coefficients soient tels que: 


L'équation précédente s'écrit alors: 


2 2 


2 _ 
Aux TX Taux + 242% + 242 X2%3 + 242%3% = l (14.203) 


Nous retrouvons ici l'équation d'une surface de second degré ou quadrique similaire à celle du plan que 
nous avons vue en géométrie plane. Nous savons par extension à la troisième dimension que ces surfaces 


sont des ellipsoïdes ou hyperboloïdes, selon les valeurs des quantités &;;. 


Étudions comment se transforment les quantités &;; lorsque nous effectuons un changement de 
coordonnées tel que: 


x%= AYxlet x = Aix" (14204) 
L'équation de la quadrique s'écrit dans ce nouveau système de coordonnées: 
ay A Aix" x" =a x" x" =1 (14.205) 
d'où l'expression des coefficients dans le nouveau système d'axes: 
ne AA a (14.206) 


Les coefficients &;; se transforment donc comme les composantes covariantes d'un tenseur d'ordre deux. 


Réciproquement, si les quantités &;; sont les composantes d'un tenseur symétrique, ces composantes 
définissent les coefficients d'une quadrique. Il existe donc une certaine équivalence entre un tenseur 
symétrique et les coefficients d'une quadrique. Nous dirons que l'équation de la quadrique est la 
"quadrique représentative" du tenseur symétrique. 


Nous savons de par notre étude des quadriques en géométrie plane (en étendant cela au cas 
tridimensionnel) que nous pouvons toujours trouver un système de coordonnées par rapport auquel 
l'équation d'une quadrique prend une forme plus simple: 


Dix +b,22 +bx$ =1 (14.207) 
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Dans ce cas, les vecteurs de base sont portés par les axes principaux de la quadrique. Dans ce système de 


coordonnées, les composantes du tenseur &;; se réduisent à: 


du À; 2 “2 , Ag =D (14.208) 


et 4ÿ = 0 pour les autres composantes. Les quantités à, sont appelées les "composantes principales" du 


tenseur &;;. 


Si les quantités à,,,,b, sont positives, la surface est un ellipsoïde, si deux quantités sont strictement 


positives et la troisième strictement négative, nous avons un hyperboloïde à une nappe, si deux quantités 
sont strictement négatives et la troisième positive, nous avons un hyperboloïde à deux nappes (pour plus 
d'information voir le chapitre de Géométrie Analytique). 


La comparaison de l'expression de la quadrique obtenue précédemment avec l'équation classique: 


2 2 
x ZX Z: 
_ +2 ++ =] (14.209) 
a b° € 


où à,b,c sont les demi-axes d'un ellipsoïde montre que nous avons: 


8.2. TENSEUR ANTISYMÉTRIQUE 
Lorsque les composantes contravariantes 4Ÿ d'un tenseur d'ordre deux, vérifient les relations: 
ui = À (14211) 


nous disons que le tenseur est un "tenseur antisymétrique" (il en va de même si les composantes sont 
covariantes). C'est une propriété intrinsèque du tenseur qui se démontre comme pour les tenseurs 
symétriques, au signe "-" près. Un tenseur contravariant d'ordre deux, vérifiant donc la relation suivante 
sera dit "tenseur symétrique" (nous l'avons déjà mentionné un paquet de fois dans les paragraphes 
précédents): 


uŸ =ud (14.212) 
Et il en va de même si les composantes sont covariantes. 


Un tenseur antisymétrique doit bien évidemment satisfaire au fait que ces composantes diagonales soient 
nulles telles que: 


=" =, =u%m() (14.213) 


Si les composantes contravariantes d'un tenseur sont antisymétriques, ses composantes covariantes le sont 
également. 


Un tenseur par exemple covariant d'ordre trois Ti sera dit symétrique en i et k si pour toutes les valeurs 


que peuvent prendre les indices, nous avons: 
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Ti = Tigi (14214) 


Ou encore le tenseur covariant Ti; sera dit antisymétrique en i et 1 si pour toutes les valeurs que peuvent 


prendre les indices, nous avons: 
Tiji = — Hi (14.215) 


A . n Aide . 
Un tenseur 4?" sera partiellement antisymétrique si nous avons par exemple: 


LL 


ik 
U; 


=} (14.216) 
Il sera complètement antisymétrique si toute transposition d'indice de même variance change la 
composante correspondante en son opposée. 


Tout tenseur 4Ÿ peut être mis sous la forme d'une somme d'un tenseur symétrique et d'un tenseur 
antisymétrique. Nous avons en effet: 


ui “( ru }+ (ui -u#)| (14217) 


Le premier terme de la somme ci-dessus est un tenseur symétrique et le second, un tenseur antisymétrique. 


Considérons maintenant deux vecteurs * = x'& et y = y” 2, d'un espace vectoriel Æ,. Formons les 
quantités antisymétriques suivantes (nous y trouvons deux produits tensoriels): 


uŸ = x y -x/y (14218) 
où nous voyons immédiatement que les composantes 4Ÿ sont celles d'un tenseur antisymétrique {}. 
La décomposition du vecteur © dans la base &, @2; s'écrit: 
D =(xxÿ)= (x y -r y) @e;,=x@ÿ-ÿ@7x (14219) 


Le tenseur ** ÿ (noté ainsi en analogie avec le produit vectoriel pour # = 3) est appelé le "produit 
extérieur" des vecteurs * et ÿ. Nous disons encore que ce tenseur est un "bivecteur". 


Le produit extérieur est donc un tenseur antisymétrique qui vérifie les propriétés suivantes: 


P1. Anticommutativité: **ÿ = -ÿ XX, il en résulte: 
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P3. Associativité pour la multiplication par un scalaire: 


axXÿ=XXaÿ=ŒXX}ÿ) (14222) 
P4. Les produits extérieurs: 
8, Xe, =8 ©, -8; ©, (14223) 
constituent une base de l'ensemble des bivecteurs. 


Démonstration: 


Un tenseur antisymétrique £ d'ordre deux, élément de Æ*, peut s'écrire sous la forme: 
Ÿ (14.224) 


Échangeant, dans la dernière somme de la relation ci-dessus, le nom des indices et en tenant compte que 
uŸ = À, nous obtenons: 


Ü = Su (& Dé, -6, ®ë, 


ik 
Les éléments: 
8, @e,-e, @& (14.226) 


J J 


sont linéairement indépendants puisque les vecteurs 2; 2; le sont également. Ces éléments constituent 
donc une base sur laquelle les tenseurs antisymétriques peuvent être décomposés. 


OIC.Q.F.D. 


Le nombre de vecteurs 2; @2; 8; @&; distinguables est égal au nombre de combinaisons de vecteurs pris 
deux à deux et distinguables parmi n tel que: 


ci = ——- < #? (14227) 


Effectivement parmi les #»? composantes, n composantes sont nulles et les #{# — 1) autres composantes 
ont des valeurs opposées deux à deux. Nous pouvons donc considérer que la moitié de ces dernières suffit 
à caractériser le tenseur. 


Dans le cadre du produit tensoriel extérieur où nous avons: 
uŸ = x y —-x/y (14.228) 


le nombre de composantes distinguables est également de #(# —1)/2 et elles sont appelées "composantes 
strictes". 
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Nous remarquons que pour # = 3, le nombre de composantes strictes du produit extérieur de deux 
vecteurs est aussi égal à trois. Ceci permet de former avec les composantes du bivecteur, les composantes 
d'un produit vectoriel Z. 


Ainsi, un produit vectoriel n'existe donc que pour un sous-espace de bivecteurs dont le nombre de 
dimensions est égal à 3 et dont les pré-images sont des tenseurs antisymétriques. 


Si toutes ces conditions sont satisfaites, nous disons que le vecteur Z constitue le "tenseur adjoint" du 
tenseur {}. 


8.3. TENSEUR FONDAMENTAL 


Nous avons vu au début de notre étude du calcul tensoriel la définition des composantes covariantes 
£ÿ du tenseur fondamental, à savoir: 


Sy = 08; (14.229) 


Ces quantités interviennent, nous le savons, dans l'expression du produit scalaire de deux vecteurs X et 
ÿ , de composantes contravariantes x* et y, donné par la relation: 


xoÿy= #82 (14.230) 


Utilisons le critère général de tensorialité pour mettre en évidence le caractère tensoriel des 8; . 
L'expression précédente est un produit complètement contracté des quantités £ÿ avec les composantes 
contravariantes x‘y° d'un tenseur arbitraire. Comme le produit scalaire est une quantité invariante (en 


l'occurrence un scalaire) par rapport aux changements de base, il en résulte que les #? quantités gÿ sont 
les composantes covariantes d'un tenseur. 


Ce tenseur est de plus symétrique par suite de la propriété de symétrie du produit scalaire des vecteurs de 
base telle que: 


Sy “Ex (14231) 


Nous avons de même pour les composantes contravariantes du tenseur fondamental: 


Si nous notons g; les composantes mixtes du tenseur fondamental à lui-même: 
i _ ik _ 
£;"£ &p (14233) 
avec évidemment dans la base canonique: 


à _ si oo. 
g; =; (14.234) 
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9. COORDONNÉES CURVILIGNES 


Les notions classiques de système de coordonnées peuvent être généralisées à des espaces ponctuels (voir 
le chapitre traitant des Principes) à n dimensions. Nous appelons "système de coordonnées" dans 

£, (espace ponctuel à n dimensions donc), tout mode de définition d'un point M dans le système 
considéré. 

Pour un système donné de coordonnées (cartésiennes, sphériques, cylindriques, polaires.) nous appelons 
"ligne de coordonnées" le "lieu" des points M lorsqu'une seule coordonnée varie, les autres étant égales à 
des constantes. 


Etudions tout d'abord la généralisation d'un système de coordonnées relatives à un repère fixe (nous 
conseillons vivement au lecteur d'avoir lu au préalable la partie traitant des systèmes de coordonnées dans 
le chapitre de Calcul Vectoriel et la partie traitant du formalisme lagrangien dans le chapitre Principes). 


Considérons un espace ponctuel &, et un repère (&, ) de cet espace. Soit x° les coordonnées rectilignes 
d'un point M de €, par rapport à ce repère. Un système de coordonnées quelconque 4%, # =1,2,..,#, est 


obtenu en se donnant n fonctions arbitraires f? des paramètres z*, telles que: 
x = f'(ulu?,..u*) (14.235) 
Nous supposerons par la suite que ces n fonctions satisfont aux trois propriétés suivantes: 
P1. Elles sont de classe supérieure ou égale à €? (dérivables au moins deux fois pour les besoins de la 


physique). Cette hypothèse implique, en tout point où elle est satisfaite, que nous avons la permutabilité 
des dérivations (par rapport aux deux dérivations): 


Ouf = 8pf" (14.236) 


P2. Ces fonctions sont telles que nous pouvons résoudre le système des n équations de changement de 
système de coordonnées par rapport aux variables 4% et les exprimer en fonction des x*, soit: 


u* = L'ORLN) (14.237) 
toujours avec # = 1,2,..,#. 


P3. Lorsque les variables 4* varient dans un domaine À, les variables x? varient dans un domaine A". Le 
jacobien des fonctions x° = f'{u,u?....u*), défini par: 


1 2 x 

0,x 4x … x 

1 2 x 

; d:x dx … d,x 
D(8,x'}= |? . : (14.238) 

1 2 x 

8,x O,X 8,x 


sera supposé différent de zéro dans le domaine À (ainsi que le jacobien D(@u* ) des fonctions 
u* = g“(x),x°,...,x*)) et est l'inverse du jacobien de * = g“{x},x°...,x*}. Si les jacobiens existent, ils 


sont non nuls comme conséquence en premier lieu de la deuxième propriété ci-dessus et implicitement de 
la première. 
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Si nous fixons (# — 1) paramètres 4 en faisant varier un seul paramètre, 4° par exemple, nous obtenons 


les coordonnées Xi) d'un ensemble de points M de &, qui constituent une "ligne de coordonnées". 


En général, les lignes de coordonnées ne sont pas des droites mais des courbes; ces coordonnées * sont 
appelées pour cette raison des "coordonnées curvilignes". En un point M de Ë&, se croisent d'ailleurs 
n lignes de coordonnées. 


Nous démontrons en mécanique analytique, lors de l'étude des espaces ponctuels, que les dérivées et les 
différentielles d'un vecteur Gf de €, sont indépendantes du point O d'un repère donné. Si €, est 
rapporté à un système de coordonnées curvilignes 4%, nous écrivons: 


. _40M 
LE Au“ 


= 4,M| (14.239) 


Exemple: 


Un exemple de coordonnées curvilignes :,*, où chaque ;,* est une fonction uniforme des coordonnées 
rectilignes x* ,lesz;* étant de plus des fonctions continues au point courant M, est celui des coordonnées 
sphériques où nous avons (cf. chapitre de Calcul Vectoriel): 


a) = ru? = Bu = (14.240) 


Rappelons aussi que lors de notre étude du système de coordonnées sphériques en calcul vectoriel nous 
avions obtenu: 


dM =e,dr+esrd8+eçrsinSd# (14241) 
Ainsi, nous voyons bien cette dépendance sous l'expression des relations suivantes: 


2% OM. eM 


: 3e a 


Dans un espace non-euclidien, nous ne pouvons définir une base valable sur tout l'espace. Ainsi, nous 
construisons une base en chaque point séparément et pour cela, nous utilisons bien les coordonnées 


curvilignes telles qu'en chaque point M, les vecteurs de base &; sont tangents à la ligne de coordonnées 


(14.242) 


1 ET 


correspondante ;,* via la relation donnée plus haut: 


_ 480M . — 
ge — : 


2 


Soient maintenant #!,4°....u" les coordonnées curvilignes du point M par rapport à un repère cartésien 


#7. Dans ce repère, nous avons bien évidemment: 


OM = x (14244) 
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où les coordonnées cartésiennes sont des fonctions x° = x (un? Ne 


Le vecteur &, a donc pour expression: 
+ = 20 j\ 0 Eu 
LS = 4, (#8 )=(a,x)4 (14.245) 


A partir des composantes 4,x° du vecteur &,, nous pouvons former un déterminant D(3 EX ) qui est 


précisément le jacobien des fonctions x° que nous avions défini précédemment. Puisque ce déterminant 
est différent de zéro (du moins imposé tel quel), il en résulte que les n vecteurs &, sont linéairement 
indépendants. 


Ces n vecteurs, définis par la relation: 
8, = 0,4 (14.246) 


sont appelés la "base naturelle" au point M de l'espace vectoriel Æ,. Ils sont colinéaires aux tangentes des 
n lignes coordonnées qui se coupent au point M où ils sont définis. 


Nous n'insisterons pas sur le fait évident qu'à tout système de coordonnées curvilignes est associé un 
repère naturel dont la base est exprimée par ses mêmes coordonnées (cf. chapitre de Calcul Vectoriel). 


Exemple: 


En coordonnées sphériques, les vecteurs de la base naturelle sont ceux que nous avons obtenus lors de 
notre étude du système de coordonnées sphériques dans le chapitre de Calcul Vectoriel et qui sont 
orthogonaux mais non orthonormés. 


Associons au point M de &, un repère formé par le point M et par les vecteurs de la base naturelle. Ce 
repère est appelé le "repère naturel" en M du système de coordonnées 4. Il sera noté: 


(Wf,8) ou (A, a,M) (14.247) 
La différentielle du vecteur OW s'exprime alors sous la forme: 
di =0,Mau =&.du" (14248) 


Les quantités 44° constituent les composantes contravariantes du vecteur 4X/ dans le repère naturel 
(M,8,) du système de coordonnées y“. 


Considérons maintenant deux systèmes quelconques de coordonnées curvilignes ss? et x", liées entre 
elles par les relations: 


m=ut(ulut nu") nu =u “(ul u?,..u*) (14.249) 
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% au *) sont supposées plusieurs fois continument dérivables par rapport 


12 


où les fonctions n° = sé {u" 1 
aux x “ et de même pour les fonctions 4° = # u (ue! 1° ……,#*}) par rapport aux coordonnées 4°. Lorsque 


nous passons d'un système de coordonnées à un autre, nous disons que nous effectuons un "changement 
de coordonnées curvilignes". 


Nous avons vu en relativité générale que le carré de la distance 4° entre deux points M et M' infiniment 
proches est donné par la relation: 


: — 
ds = g,dx dx (14.250) 


où les 4x° sont les composantes du vecteur 4Xf = A4", rapportées à un repère fixe d'un espace ponctuel 
£&,. Lorsque cet espace est rapporté à un système de coordonnées curvilignes 4°, nous avons vu que la 
relation: 


dif = 8, Mau* =&,du* (14251) 


montre que le vecteur 4f a pour composantes contravariantes les quantités 44° par rapport au repère 
naturel (,8,). Le carré de la distance 45? s'écrit alors dans le repère naturel: 


ds? = g;du'du” (14.252) 


où les quantités gÿ = & °2; sont les composantes du tenseur fondamental ou du tenseur métrique définies 
à l'aide d'une base naturelle. L'expression précédente s'appelle "l'élément linéaire de l'espace ponctuel" €, 
ou encore la "métrique" de cet espace. 


Les vecteurs &, du repère naturel varient en général d'un point un autre. C'est le cas, par exemple, des 


coordonnées sphériques dont les quantités 8; (nous le démontrerons de suite après) sont variables !! 


Une courbe l de €, peut être définie par la donnée des coordonnées curvilignes æ*{æ) du lieu des points 
W(&) en fonction d'un paramètre &. La distance élémentaire ds sur cette courbe T s'écrit alors: 


| Au Au? 5 


ds = d& (14.253) 


SETET 


9.1. REPÈRE NATUREL EN COORDONNÉES SPHÉRIQUES 


Déterminons la base naturelle de l'espace vectoriel Æ, associé à l'espace ponctuel &, de la géométrie 
ordinaire, en coordonnées sphériques. Ecrivons l'expression des vecteurs £jf dans un repère cartésien 


fixe & qui est par définition (voir le chapitre de Calcul Vectoriel pour plus de détails): 
OM = x'a = rain Ocos ge) +rsin sin dE, + rcos8ë (14.254) 


Les vecteurs de la base naturelle étant donnés par: 
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es 


à =0,M = 8,M 
8, = 4,M 48, =-8,M=8,M (14255) 
8, = 8,4 =0,M 


Nous avons ainsi: 
à = AM = sin Ocos da) +sinOsingé +cos 8 (11.256) 
La dérivée de Gf par rapport à 8 donne le vecteur &; : 
8, = d,M = rcos cos dŸ +rcos Osin dé -rsin 8 (14257) 
is 1 2 3 (4.257) 
La dérivée par rapport à ® donne le vecteur &, : 
8, = M = -rsin Jsin fe) +rsinOcos 2 (14258 
3" 1 2 (14.258) 


Ces trois vecteurs sont orthogonaux entre eux ainsi que nous le vérifions aisément en effectuant les 


produits scalaires 8; °2;. Lorsqu'il en est ainsi, nous disons que les coordonnées sont des "coordonnées 
curvilignes orthogonales" (cf. chapitre de Géométrie Différentielle). 


Nous retrouvons donc bien le même résultat que dans le chapitre de Calcul Vectoriel. 


Ces vecteurs ne sont cependant pas tous normés, puisque nous avons: 
+ SH  - 2 … 


gu=aoa-l gp-èo8 =r gn =8 08, =r/sin 8 (14259) 


Le repère naturel, en coordonnées sphériques, est donc formé par des vecteurs variables en direction et en 
module en chaque point de M. Les quantités £g; constituent un exemple de tenseur métrique attaché à 


chacun des points M de l'espace &. 


L'élément linéaire du plan est donné par (les détails des calculs peuvent être trouvés dans le chapitre de 


Relativité Générale): 
ds? = dr? +r°4& +r° sin’ 84#° (14.260) 


9.2. REPÈRE NATUREL EN COORDONNÉES POLAIRES 


Déterminons la base naturelle de l'espace vectoriel Æ, associé à l'espace ponctuel &, de la géométrie 
ordinaire, en coordonnées polaires. Ecrivons l'expression des vecteurs Gf dans un repère fixe cartésien 


&° qui est par définition (voir le chapitre de Calcul Vectoriel pour plus de détails): 
OM = x'& = rCcos fe +rsin > (14.261) 


Les vecteurs de la base naturelle étant donnés par: 
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8, =4,M = L 


Nous avons: 
à = AM =cos dé) +sin gi (14263) 
La dérivée de Of par rapport à # donne le vecteur &, : 


+ 7  4=Ÿ 0 
e) = OM =-rsin dé, +rcosde, (14264) 


Ces deux vecteurs sont orthogonaux entre eux ainsi que nous le vérifions aisément en effectuant les 


produits scalaires 8; °2;. Nous retrouvons donc bien le même résultat que dans le chapitre de Calcul 


Vectoriel. 


Nous avons: 


gun =cos sin f guy = gp =Ù0 go =r? (14265) 


L'élément linéaire du plan est alors donné par (cf. chapitre de Relativité Générale): 


\ds? = dr? +r?a ff] (14.266) 


9.3. REPÈRE NATUREL EN COORDONNÉES CYLINDRIQUES 


Déterminons la base naturelle de l'espace vectoriel Æ, associé à l'espace ponctuel &, de la géométrie 


ordinaire, en coordonnées cylindriques. Écrivons l'expression des vecteurs ©}{ dans un repère fixe 


cartésien &) qui est par définition (voir le chapitre de Calcul Vectoriel pour plus de détails): 


AN = 7150 = 0 me Ù à 2Ù 7. 
OM = xe =rcosgæ, +trsaing®, +z& (14.267) 


Les vecteurs de la base naturelle étant donnés par: 


à = M =8,M 
dx = OM = 182 = OM = Op (14.268) 
ë, = M =, 


Nous avons: 
8, = d,f = cos ue + sin Æ, (14.269) 


La dérivée de Gÿf par rapport à # donne le vecteur &; : 


ES 


3, = 8, M =-rsingé +rcosgé (14.270) 


et enfin: 
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es 


_ =ÿ _— 
€, = 0,M =, (14271) 


Ces trois vecteurs sont orthogonaux entre eux ainsi qu'on le vérifie aisément en effectuant les produits 
scalaires 2; °2;. Nous retrouvons donc encore une fois le même résultat que dans le chapitre de Calcul 
Vectoriel. 


Nous avons: 
=] = 52 =| 
Eu — 8e 7 83 = 1 (14272) 


L'élément linéaire du plan est alors donné par (cf. chapitre de Relativité Restreinte): 


ds? = dr? +rdqg + dz?| (14.273) 
10. SYMBOLES DE CHRISTOFFEL 


L'étude des champs de tenseurs constitue, pour le physicien, l'essentiel de l'analyse tensorielle. Le tenseur 
générique {} de ce champ est une fonction du point M et nous le notons: 


Ü(M) (14274) 


Si le tenseur {} est une fonction seulement de M, le champ considéré est appelé un "champ fixe". Si 
{} est, en outre, une fonction d'un ou plusieurs paramètres & autres que les coordonnées de M, nous 
disons alors que ce champ est variable et nous le notons: 


Ü(M,@) (14.275) 


Les différentes opérations algébriques sur les tenseurs Ü'(W#) associés à un même point M ne soulèvent 
pas de difficulté particulière. La dérivée de Ê'(M) par rapport à un paramètre & conduit à utiliser les 
résultats classiques relatifs à la dérivation des vecteurs. 


Cependant, une difficulté apparaît lorsque nous cherchons à calculer la dérivée d'un tenseur £(4f) par 
rapport aux coordonnées curvilignes. En effet, les composantes du tenseur sont définies en chaque point 
M par rapport à un repère naturel qui varie d'un point à un autre. 


Par suite, le calcul de la variation élémentaire, appelée "transport élémentaire": 
O(M')-Ü(M) (14.276) 


lorsque nous passons d'un point M à un point infiniment voisin M" ne peut se faire que si nous avons 
recours à une même base. Pour pouvoir comparer l'un à l'autre les tenseurs L(M') et (M), nous 


sommes amenés à étudier comment varie un repère naturel, pour un système de coordonnées donné, 
lorsque nous passons d'un point M au point infiniment voisin M'. 


Pour un système de coordonnées curvilignes 4° donné d'un espace ponctuel €, un problème fondamental 
de l'analyse tensorielle consiste donc à déterminer, par rapport au repère naturel (f,8,) au point M, le 
repère naturel (Wf',8',) au point infiniment voisin M'. Nous disons alors que nous recherchons une 
"connexion affine". 
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D'une part, le point M' sera parfaitement défini par rapport à M si nous déterminons le vecteur 4Xf tel que 
MM ‘= àM . Pour des coordonnées curvilignes 4°, la décomposition d'un vecteur élémentaire 4Af est 
donnée par la relation que nous avons démontrée précédemment: 


dMf = 8, Mau" =&,du* (14277) 
les quantités 44% étant les composantes contravariantes du vecteur 4Xf sur la base naturelle (3) . 


D'autre part, les vecteurs &, vont pouvoir être déterminés en calculant les variations élémentaires 4£, des 


vecteurs &,, par rapport au repère naturel (Af,8, ), lorsque nous passons de M en M'; nous avons alors: 
| a À n"7 
de, =, +de, (14.278) 


Le calcul des vecteurs 4, reste alors le problème essentiel à résoudre. Nous allons tout d'abord étudier un 
exemple de ce type de calcul en coordonnées sphériques. 


Pour cela, reprenons l'expression des vecteurs &, de la base naturelle en coordonnées sphériques, soit: 


8,” 8. = sin Ocos dt +sin Psin #j + cos Cr 
8, = 8, M = rcos cos +rcosOsin#i-rsinét (14279) 
3, = d,M = -r sin Ssin @ +r sin Ocos 


Les vecteurs de base : , ;,& du repère fixe cartésien étant constants en module et en direction, la 
différentielle du vecteur &, s'écrit: 


dé, = (cos Bcos di + cos Psin dj - sin 8k)d8 +(-sinPsind+sinBcos#j)d# (14280) 


Nous remarquons que les termes entre parenthèses représentent respectivement les vecteurs &, /r et 
8,/r, d'où: 


- [48]. [d#]_ 
de, = (SE) + (]e (14.281) 
r r 


Nous calculons de même, en différentiant les vecteurs &, : 


de, = 

dr cos 8 cos  +drcos sin #j - drsin Cr 

-rsin Sd cos À -r sin sin #j -rcos 848% 

-r cos dsin fi +rcosOcos Éd}; 

= (cos cos  +cos Jsin dj - sin &k)dr +(-r sin cos  -rsin Psin#j -rcos 8k)d8 
+{- rcos dsin # +rcos cos #j)d 


= “ps _ re, d8 +(-rcos 8sin fi +rcos dcos Éj)d# 
Fr 


(14.282) 


Page: 1070/4839 


[v3.0 - 2013] 


Avec: 


nous avons: 


cos 4 


sin 


2,cot8 =. =-rcosOsind +rcosOcosj (11284) 
3 3 8 J 


Donc finalement: 
dé, =2dr-réd8+é,cot6d$ (14285) 
Fr 


Et: 


de, =-drsin Osin @ +drsin Ocos#}i 
-r cos 848 sin # +rcos ÉdOcos (14.286) 
-rsin 8cos dd -r sin Psin dd} 


Après quelques opérations algébriques élémentaires et très pertinentes (...), nous arrivons à: 


- = | Es u 
de = (-r sin? Ode, +[-sin 8 cos dh)e, + T + cot 648 € (14.287) 
3 1 2 - 3 


Les différentielles 4&, sont ainsi décomposées sur la base naturelle (&,). Si nous notons &*, les 


composantes contravariantes du vecteur 8, , celui-ci s'écrit: 


Les composantes &* du vecteur 4&, sont des formes différentielles (combinaisons linéaires de 


différentielles). Nous avons, par exemple: 


œ? _ æ oo (14.289) 
LA | 8 


u'=r u?=9 1u°= g (14.290) 
Les différentielles des coordonnées sont alors notées: 
du\=dr du?=48 du =d# (14291) 


et les composantes & s'écrivent alors de manière générale: 


a =Tdu*| (14.292) 
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où les quantités r4 sont des fonctions de r,#,# qui vont être explicitement obtenues en identifiant 


chaque composante &. Par exemple, la composante & s'écrit avec la notation de la relation précédente: 


a = ie du +Ddu? +Tidu (14.293) 
La 


Identifiant les coefficients des différentielles, il vient: 


l 
ré, - D =cot8 Ti, =0 (14294) 


En procédant de même avec les neuf composantes &, nous obtenons les vingt-sept (...) termes T4 dont 
les calculs détaillés pour les 27 sont donnés beaucoup plus bas dans le texte. Pour un système de 
coordonnées curvilignes quelconques, ces quantités ré sont appelées les "symboles de Christoffel de 
deuxième espèce" ou encore "fonctions euclidiennes de connexion affine". 


Ainsi, pour un espace ponctuel €, et un système de coordonnées curvilignes ;,? quelconque, la 
différentielle 48, = &ë, des vecteurs #, de la base naturelle s'écrit sur cette base: 


dé, = af, =Tdulæ,| (14295) 


Nous venons de voir, sur l'exemple des coordonnées sphériques, qu'un calcul direct permet, par 
identification, d'obtenir explicitement les quantités l#,. Nous allons voir que nous pouvons également 


obtenir l'expression de ces quantités en fonction des composantes g;. 


Le calcul des quantités l; en fonction des g;; va nous amener à introduire d'autres symboles de 


Christoffel. Pour cela, écrivons les composantes covariantes, notées ®;;, des différentielles 48, , soit: 


&. 


jy =8;04d8, (14.296) 


Les composantes covariantes sont également des combinaisons linéaires des différentielles ,,* que nous 


pouvons écrire sous la forme: 


£ 
@; = lyxdu (14297) 


Les quantités l’;; sont appelées les "symboles de Christoffel de première espèce". 


Nous voyons très bien en parcourant à nouveau les définitions des symboles de Christoffel que: 


1. Pour ce qui est des symboles de 2ème espèce, ils sont symétriques par rapport à leurs indices inférieurs : 


IX =IŸ (44296) 


J 1 


2. Pour ce qui est des symboles de 1ère espèce : symétriques par rapport à leurs indices extrêmes 
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Da = Pyx (4299) 
Effectivement (suite à la demande d'un lecteur), puisque nous avons: 
dé, = 5, = T'duia, (14.300) 


Il vient alors: 


qi — k* ji (14.301) 
et en permutant les indices: 

ni à = D. 2302 

7 xl (14302) 


L'identification terme à terme du développement sur un cas concret des deux dernières relations donnera 


(forcément) l'égalité: 
=" (14.303) 


que nous voulions prouver. 


Puisque les composantes covariantes sont liées aux composantes contravariantes par les relations 
(contraction des indices): 


D; = gx@ i= gylud" (14304) 
nous obtenons l'expression liant les symboles de Christoffel de chaque espèce: 
Ty = gl (14305) 
Inversement: 


T£ = gÂTs (14.306) 


Remarque: Diverses notations sont utilisées pour représenter les symboles de Christoffel. Les plus 
usuelles sont les suivantes: 


- Symboles de première espèce: 
Tu =[&,/1 (414307) 
- Symboles de deuxième espèce: 


TE =[k&/j] (14.308) 
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Considérons maintenant un espace ponctuel £, et soit un élément linéaire 45? donné de cet espace: 


ds? = gydu'du? (14.309) 
Partant de: 
Lÿ “408; (14.310) 
nous obtenons par différenciation: 


deg; =ecde,+é;:od8 (14311) 


; 
_— | : nr . _ 1 
En y injectant l'expression des différentielles 4; = &;8, cela nous donne: 
deg; =(e, 08,)@ +(e 08.) = md +g. (14312 
Eÿ 1 IN 4/5 Er; * Eds (14.512) 


où le terme Ga représente la composante contravariante du vecteur 4; . On peut rendre cette composante 
covariante en la prémultipliant par le tenseur métrique £;; de manière à former &;; quantité que l’on 
pourra à son tour exprimer au moyen des symboles de Christoffel comme suit: 


Î Î LR 
= gu@; = Syl du (14313) 


substituant la relation l'y = g A dans l'expression précédente (les indices utilisés dans cette relation ne 


sont pas ceux de l'expression en cause, mais à proprement parler cela revient au même), nous obtenons 
alors: 


æ, =Tdu* (14314) 


La différentielle dg;; s'écrit alors: 


D'autre part, la différentielle de la fonction £; s'écrit également: 


de. 
dg; = PAL = 4,gydu" (14.316) 


d'où en identifiant les coefficients des différentielles 44* dans ces deux dernières expressions (beaucoup 
plus bas dans le présent chapitre, il y a un exemple détaillé de toutes les relations qui vont suivre avec 
plusieurs systèmes de coordonnées): 


Le + D gi = dk Li (14.317) 


Relation que le lecteur pourra (s'il doute) vérifier avec les exemples pratiques détaillés qui se trouvent 
bien plus bas. 
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Comme nous avons: 


Day = Pyx (4318) 


où il est fortement recommandé au lecteur de se rappeler pour la suite que la permutation des indices 
respectant cette dernière relation ne fonctionne, en général, que sur les indices extrêmes. 


Nous pouvons donc écrire l'avant-dernière relation: 
Lure + Puy = d:gy (14319) 


puis en effectuant une permutation circulaire sur les indices (donc il ne s'agit pas d'une permutation des 
indices extrêmaux!), nous obtenons: 


D gi u Lg — d,8 x 
(14.320) 
Dix + D je : À ;& x 


En effectuant la somme: 


Lu + Di © Ggÿ 
Tnt en (4320 


et en retranchant: 
Pix + lé + lé + D = dLeÿ + Dex 


D + Le = d ;£x (14.322) 


Lx F y bé Lg F D E D _ Pix : dL8ÿ + dx = dx 
En simplifiant il vient: 


l'y + l = 0,8 + dx _ À Sr 


(14.323) 
2 = dry + Gen — 0; 


d'où: 


Lg E (d8; # Ex s 8 ;8x) (14.324) 


Di 


C'est l'expression des symboles de Christoffel de première espèce en fonction des dérivées partielles des 
composantes 8; du tenseur fondamental. 


Nous obtenons ceux de deuxième espèce à partir de la relation (par définition) suivante souvent appelée 
"théorème fondamental de la géométrie riemannienne": 


1” 
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Les deux dernières expressions encadrées ci-dessus permettent le calcul effectif des symboles de 


Christoffel pour une métrique donnée (d'où un énorme gain en calculs). Lorsque les quantités £; sont 


données a priori, nous pouvons ainsi étudier les propriétés de l'espace ponctuel défini par la donnée de 
cette métrique, ce qui est le cas des espaces de Riemann que nous verrons plus loin. 


Exemple: 
Proposons-nous de calculer les Fé correspondant au système de coordonnées polaires (ce sera déjà 


suffisamment long...) dans le plan que nous noterons cette fois-ci (contrairement au chapitre de Calcul 
Vectoriel) en notation indicielle: 


2 2 
1_ #1 2 
ni = pl cos{»?) y =4{r) +(7) 
2 (14.326) 
RER 
un sin { y ) y = arctan E 
Nous allons calculer les symboles de Christoffel à partir de notre dernière relation: 


—— ir. 
Ty = Tu; SE (d;&u + 88 — deg) (14327) 


Occupons-nous de déterminer les composantes de la métrique. Au fait, elles sont les mêmes que celles que 
nous avions calculées pour les coordonnées cylindriques plus haut à la différence normalement évidente 
que g33 n'existe pas. Dès lors, nous avons: 


1Ÿ —— 
gun =l D2=8a=0 g2= (> (14,328) 


Calculons alors les g#*. Dans cet exemple c'est assez trivial, il suffit d'appliquer la relation démontrée au 
début de ce chapitre: 


gag® = 4 (14329) 


Nous avons alors immédiatement: 


12 (14.330) 
Po") 


Maintenant développons l'écriture de symboles de Christoffel pour ces coordonnées: 
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ri, = PET Sen — 1-12 
11=77E eu D D 

= 1 fan, Æn Æ} de 
2 CE D D à 

ré = es [2er +2 Æ 1=12 

2 Læ æ 

5e [d 2 2) Lef[de + a 
2  æ ) 2 d  & 
_lu AT + Æn _ ga L 

Ta = 5e (+ æ a) 12 


1 (au + Eu _ a) e(de + 2 
D  & ) 2 D 


2 
l og AL 
T2 = : g (2. li 72 - 


1 Œn , Æi2 _ Æ2 2 , E 
| 14 12 a) e[è 12 22 
CET 2 
_1 2m 1 1 11 
2 F 2 (> Ÿ y 
d'où en raison des propriétés de symétrie 
D = =0 
1 (14.332) 
TA 7 Th ” pi 


De même: 


æ)- 
d° 
_ gun 2 =0 
Y° 
(14.331) 


-%)-0 
° 


2 
æ 
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1 à ) 
T!, = #| Eu | se %> | 1=12 


2 1? à 
Li ga + 2 _ 22 sin en , 2 _ 2 
2 La 7 æ) 2 (a & 
1 1 
_ nÆn_ lie, 
2 æ 2 
(14.333) 
ré -pet(9e Me) 1=12 
2 La à 
: UE + 982 _ æ|e(e + En | = 
2 La? à? &) 2 7 ® 
_ 1 22 2 
=. + = 0 
En résumé: 
Ti =0 Tia = 0 Ta =0 To = 
1 1 (14.334) 
Th =0 27 = T2 =0 
Ÿ Ÿ 
11. THÉORÈME DE RICCI 


Avant de lire ce qui va suivre... je tiens à rappeler au lecteur que la rédaction de ce chapitre n'est 
pas terminée! Ainsi, il me faut encore illustrer les notions abstraites qui vont suivre par des 
exemples pratiques concrets! 


Ceci étant dit, nous avons donc vu dans le chapitre de Relativité Générale que les géodésiques sont les 
distances les plus courtes entre deux points dans n'importe quel type d'espace. Ce qui va nous intéresser 
maintenant, c'est d'étudier les variations d'un vecteur au cours d'un tel déplacement. Rappelons d'abord 
que l'équation des géodésiques pour un système de coordonnées curvilignes quelconque y° de l'espace 


ponctuel 6, (cf. chapitre des Principes) est donnée par (cf. chapitre de Relativité Générale): 


d'y end do 
ds’ ÿ ds ds 


(14.335) 


Considérons maintenant un vecteur Ÿ de £, de composantes covariantes % et formons le produit scalaire 
des vecteurs Ÿ et # = dy / ds (ce dernier vecteur, noté directement ici de manière abusive avec les 


indices, donne les composantes tangentes à la géodésique sur laquelle circule le premier vecteur), nous 
avons alors la quantité suivante: 


Lors d'un déplacement le long de la géodésique, d'un point M à un point infiniment voisin M, le scalaire 
subit la variation: 
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dy dy dy 
1e = dn Ÿ+na[ D (14.337) 
et comme: 
dy 
ë ds] dy dl d'y (14.338) 
=———d|—|=——ûds 
ds d°s ds d°s 
d'où: 
dy dy* d°?y 
d Ê ne = 7 + FLr ds (14.339) 


Remplaçons dans cette dernière expression, d'une part la différentielle de dv, par sa différentielle totale 
exacte: 


y : ds , ; dy 
dv, = Et dy = 9 ,v, — dy} = 8,v, “à 
Le ; OUR pô FE 


et d'autre part, la dérivée seconde 4° y / ds? par son expression tirée de l'équation des géodésiques. Nous 
P à P P q 8 q 


obtenons: 
dé |. dd did dv? d* 
‘ Ê #) nd a de (OM Vds Ga) 


qui peut encore s'écrire: 
| : dy* dy* 
divori= {dv -vls dr D = Dr, 2 (1434) 
ds ds 
où nous avons posé: 
Dv, =(8,v, -wTi)dT (14343) 


qui sont par définition les différentielles absolues des composantes covariantes du vecteur ÿ . Nous 
définissons également la "dérivée covariante" (appelée également "connexion") par la relation: 


Vu = dm -vTS| (434) 
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Remarque: Dans les ouvrages anciens ou américains ceci est souvent noté sous la forme (que nous 
n'utiliserons aucunement sur ce site): 


Vess © Ve =uTs (14.345) 


faisant donc usage du ";" pour noter la dérivée covariante et de la "," pour différentielle partielle. 


Puisque la dérivée du produit de deux fonctions est la somme des dérivées partielles, nous avons alors 
aussi: 


LAUTA = LATE +EVr =r, (at, TS )+4 . 1,14) 
=ret rte +é0n bre = rt thon él —éplles (220) 
= (Gn)-r Ts er 


Si nous posons #7, = V ;", alors nous avons (résultat que nous utiliserons après avoir démontré le 


théorème de Ricci pour déterminer plus loin le tenseur d'Einstein nécessaire dans le chapitre de Relativité 
Générale): 


V: (V M }= 4, (V M, | — (VV, DR TA” x (14.347) 


En coordonnées curvilignes, pour que la différentielle d'un vecteur soit un vecteur, il faut que les deux 
vecteurs dont nous prenons la différence se trouvent en un même point de l'espace. En d'autres termes, il 
faut transporter, d'une manière ou d'une autre, l'un des deux vecteurs infiniment voisins au point où se 
trouve le second et , seulement après faire la différence des deux vecteurs qui se trouvent maintenant en un 
seul et même point de l'espace. L'opération de transport parallèle doit être définie de telle sorte qu'en 
coordonnées cartésiennes (pour le petit exemple), la différence des composantes coïncide avec la 
différence ordinaire dv, . 
Ainsi, nous avons bien en coordonnées cartésiennes: 
- Ti = 
Dv, = (dv Ty dy} = dv, (14.348) 


puisque dans ce système: T4 =0. 


Ainsi, en coordonnées curvilignes la différence des composantes des deux vecteurs après le transport de 
l'un d'entre eux au point où se trouve l'autre est notée äv, telle que nous ayons: 


Dv, =(8,v, vTY \dp* = dv, - ôv, (14.349) 
Ceci nous amène à: 
Gv, = vd (14350) 


Mais aussi à écrire le principe de moindre action (principe variationnel) sous la forme tensorielle: 
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Considérons maintenant un tenseur d'ordre deux, produit de deux tenseurs d'ordre un tel que (nous l'avons 
vu lors de notre étude des compositions de tenseurs): 


Dv, = dv, — ôv, = 0 (14351) 


(AB) = 64, = A6, + B,6A = ABT dy" + BAT kdy" = 


(14.352) 
(AB + RATÉ lt = 64, = (AT + BTE | 


Donc: 
ôv. 
= = 13 k 


d'où (nous sortons les deux dernières égalités juste pour l'esthétique!): 
dv = val % + vai (14.354) 


Ce qui nous amène à pouvoir écrire la métrique sous sa forme variationnelle appelée "identité de Ricci": 


0y8ÿ = gala + SaTu (14.355) 


Mais nous avons aussi puisque £ÿ = & °8;: 


… 


D ” sh M se ie Et = 
de; “8,048. + d8,08. 8,0@;8, +8,08. = @;(8 08 |+@ (808.1 (14356) 


ë 

d'où l'identité: 
dy = Saut gx (14357) 
Avec les deux relations: 
de, = etes + aïe, et Ses “eh + gl u dt (14356) 
et la différentielle absolue (qui se généralise simplement pour un tenseur d'ordre deux): 
Dg; = de; — gÿ (14.359) 
Nous avons: 
Dg; = CE + CR = gl id" - gaTxd" (14.360) 
Or, rappelons que nous avons par définition: 
œf =Tid" et ff =Tid" (14361) 

Donc finalement: 


Dg; = 0 (14362) 
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La différentielle absolue sur une géodésique dans l'approximation d'un transport infinitésimal du tenseur 
fondamental est donc (comme nous pouvions nous y attendre) nulle. C'est le "théorème de Ricci”. 
Certains physiciens théoriciens disent dès lors que "la dérivée covariante tue la métrique" dans le sens où 
la métrique ne change pas sur un différentiel d'espace. 


Finalement, nous voyons aussi que pour un tenseur d'ordre deux (la métrique en particulier) nous avons: 
De, = day - 6e = day - al id" -gTad" (14.363) 
Nous pouvons donc écrire la différentielle absolue qui dans ce cas particulier est nulle: 
De; = | CAE “ET _ sil \dy* =0 (14.364) 
et donc: 


Vigy = digy Bal j — Sul = 0] (14.365) 


Remarque: Il faudra se rappeler lors de la définition du tenseur d'Einstein que: 

. . k k A 
et qu'il s'agit d'une autre manière d'exprimer qu'une variation infinitésimale sur une géodésique selon 
le principe de moindre action tue la métrique. Nous allons donc travailler à partir de maintenant 


(comme avant déjà) avec des équations différentielles non nécessairement linéaires qu'il faudra 
intégrer pour trouver le comportement de la matière dans un espace donné. 


Déterminons maintenant une expression qui nous sera très utile en relativité générale lorsque nous 
déterminerons l'équation d'Einstein des champs (une autre manière d'exprimer que la dérivée covariante 
de la métrique est nulle): 


Effectuons la multiplication contractée de: 
_ 2 k — 
Vagÿ : d,8ÿ nl > — Eli =0 (14.367) 


par gŸ, il vient alors en utilisant la relation a er = ë (que nous avions démontrée beaucoup plus haut) 
que: 


gag - Seul n - S'anlu = 08 — Ole — À Ti = 0 (14.368) 
d'où la relation: 
g'aig Ta Ti =0 (14369) 
Les quantités A et li, représentant les mêmes sommes, nous avons alors: 


g'd,gy = 21% (14370) 
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Considérons maintenant g le déterminant des quantités &;. La dérivation du déterminant nous donne: 


.. à £ 
de 8e 0; — One; — mi (14.371) 


Démonstration: 


Soit une variable quelconque que nous choisissons ici être le temps t uniquement pour simplifier les 
notations des calculs qui vont suivre. Lorsque la partie principale du développement sera achevée, le 


résultat peut être adapté à toute autre variable. Nous noterons pour la suite £; les éléments de la j-ème 


colonne de 8;. 
Pour les développements qui vont suivre, nous définissons les notations: 
g=det(gi.g:. .8,) é=d,g &,=d,g; é;=d,g; (14372) 
La règle de dérivation d'un déterminant fonctionnel est (cf. chapitre d'Algèbre Linéaire): 
É=det(g,,8,-£,)tdet(g,. ge, )+---det(g,,g,-"£,)] (14373) 


En considérant le premier déterminant, en faisant appel aux mineurs pour le développement de sa 
première colonne: 


Œn£n (14.374) 
Pour le terme j, il vient: 
By (14.375) 
Soit: 
= @eÿ ou ge (14.376) 
Or, nous avons démontré bien plus haut que le tenseur métrique est son propre inverse. Donc 
gŸ=g;" (4377) 


Ce qui nous permet d'écrire: 


et donc: 
Lg =££ÿe” (14.379) 
Ce qui s'écrit également (suite aux conventions définies au début de la démonstration): 


d,g =gdgÿgŸ (14.380) 
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où le lecteur doit donc prendre garde à ne pas mal lire en pensant typiquement que la dérivée dans le 


terme de droite dérive tout... alors qu'il ne dérive que &8ÿ. 


Nous pouvons adopter cependant une autre variable. Soit h cette autre variable: 


d,g “ge ogg (14.381) 


Soit en réarrangeant: 


(14.382) 


C'est ce que nous voulions (devions) démontrer. 
OIC.Q.F.D. 
Maintenant en combinant: 
I‘ = 1 ÿa 207 
h = 5€ hey (14383) 
démontré plus haut et le résultat que nous venons de démontrer: 
d4 1 
0,8; = le } 0,Z (14384) 
il vient: 
| : 1 71 -l 1 
I, = -2g"0,g,; =-g | —(g.) dg|=—0,g (14385) 
ih hEÿ 2 ll " hk 2g h 
Nous avons donc: 
: a | 
g'd,8ÿ = AE LT (14386) 
E 


Montrons qu'il est possible de dériver cette dernière relation de l'égalité importante suivante: 


Ti —- Sel (14307) 


NE gfas) ane uno 


Cette relation ne veut pas dire grand-chose tant que nous n'en ferons pas un usage plus explicite lors de 
notre étude de la relativité générale (cf. chapitre de Relativité Générale). 


Effectivement: 
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Soit maintenant à déterminer la dérivée covariante seconde du tenseur métrique. Rappelons-nous avant 
d'aller plus loin (car c'est important) que nous avions obtenu: 


Vis = dry = real (14.389) 
12. TENSEUR DE RIEMANN-CHRISTOFFEL 


Rappelons que nous avons démontré plus haut que: 
V. (VV j = 4, [l V M 1 (Vv, A _ (V,v, 1 (14.390) 


Cette relation exprime sauf erreur de la part du rédacteur de ces lignes... la dérivée covariante d'un 
tenseur d'ordre deux - tel que la métrique - sur un chemin géodésique dans deux directions parallèles (la 
dérivée covariante seconde permettant de créer la "perpendiculaire géodésique" entre les deux 
géodésiques infiniment proches de la dérivée covariante première). Nous appelons un tel déplacement: un 
"transport parallèle". 


En y substituant: 


Vu = Ti" (14391) 


Nous avons alors: 


- =, | =Ti _ | ri 
VLlVmis= dia -Tani-(8;v, - Ti iTi (8,4 - Tv iTx 
Î Î 14 rr 14 r ri (2 
= Ov Pin Patdmi- T0 v, + Pin = Pad, + Palm 


Permutons maintenant les indices j et k dans l'expression précédente pour avoir une différentielle par 
rapport à un autre chemin: 


Vif) Time) er Time +FiT" Gén 


En admettant que les composantes vérifient les propriétés classiques dÿv; = 4 ;V;, nous obtenons par 
soustraction des deux expressions précédentes: 


Va (vu } = Ov — (ar } = ad dv, + Div -T8,% + alu 

V,(Vav)= 9 - (8,r4) TR Ov —I dev, + TE Div DEV, + TA 

F(Vin)-V,(Vin)=(dn-auv)+(8,78- 27h )n+(Tia,-Tiain (142% 
—, — 


=Û 
HT -0%0, )ve+ (DD TETE) + (TE Dale +(Tas TE )v 


et puisque nous avons démontré que: 
l'x=lf (14.395) 


Nous avons donc: 
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V(V)-V,(Vin)= (8,7 Ti) + (748, - 756, jm +(T58, 138, )v, 


HT TETE Ju (TE Th av + (Dale Ti) (14.396) 
© nn 


Il reste alors: 


Vi(Vu)-V,(Vin)= (0,7 -87%, vu +(TL9,-750, | +(T58, -158,}v, . 
(14.397 
HT, TETE lv 


Comme le transport parallèle se fait sur des chemins de géodésiques infiniment proches, nous prenons la 
limite: 


0;m,0v,0v,,0,v, 0 (14398) 


ce qui sous-tend surtout le fait que le champ de vitesse est quasi égal en deux points parallèles infiniment 
proches. 


Il reste alors: 


Ve (Vu)-v, (Vav,)= (8,r4 - ar +T, TX - AR }" (14.399) 


Cette relation exprime le fait que, comme la gravité, la courbure de l'espace-temps cause une accélération 
mutuelle entre les géodésiques. De plus, il est facile de constater, que l'accélération mutuelle entre les 
géodésiques est nulle si les tenseurs de Riemann-Christoffel sont nuls (typiquement en coordonnées 
cartésiennes, in extenso cela signifie pour un espace-temps plat). C'est exactement ce que nous attendons 
de la gravité: si nous n'observons aucune accélération, la courbure (nous allons de suite définir ce que 
c'est) est nulle et si la courbure est nulle, nous n'observons aucune accélération. Morale de l'histoire: la 
gravité est courbure et la courbure est gravité!! 


Nous voyons que la quantité entre parenthèses est un tenseur d'ordre quatre que nous noterons sur ce site 
(car il y a plusieurs traditions dans la manière de le noter...): 


Rx = CR - À, T; Fe T'}, Tr; FL (14.400) 


et qui résume à lui seul le transport parallèle et le fait que gravité et géométrie de l'espace sont liées 
ensemble. 


Le Li 


Le tenseur À x est appelé "tenseur de Riemann-Christoffel" ou "tenseur de l'espace Riemannien". La 
courbure d'un espace Riemannien peut aussi être caractérisée à l'aide de ce tenseur. 


Si nous multiplions le tenseur R; »; Par £&x, nous avons alors les données covariantes de ce tenseur telles 
que: 
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et soient les relations suivantes que nous avions démontrées: 


enln = gals = (14402) 


Dès lors, il vient: 


giR 5 — gx8,T4 EL gaô,T$ + ETUIS L A he 
= gaô Ti - gad,l+ +DiT,- Ti 


7° 15 5 


(14.403) 
y 


et remplaçons les quantités gaû, Ts par 4,1£ De = Ti â,g  - Nous obtenons alors: 


gaR 5 — 14, gels 1 Tiô, 8x 17! d, gaT 7 T8, FF TT y É TT y 


m=d,(caTi) 8, (gars) (Tite Then) (Tél y -Tid,en} h 
(14.404 
=8,(galTh)-8,(guxlh)+ (Tél Tige) (TE u -Téd,8y) 


=d,(s,Ti)-4, (gti) (Ta- des) gs) 
Nous avions aussi démontré que: 


dre 7 l'y ! L'éÿ ni lé a” L y (14.405) 


D'où: 
CA RE CP ON A 2 D D PS rt PPT) 
et comme: 
k kE 
Sal is _ Dis Bal LS (14.407) 
Nous avons: 


Sn ns * OT dsl al + lil gs (14.408) 
et nous avions aussi démontré que: 
1 
D = Se +Sx 8 ;8x) 
d'où: 
l; 
4,7 Hi 2 de ” 0,8; — d,;&s | (14.409) 


et en les reportant dans l'avant-dernière relation, nous obtenons: 
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1 1 
Rp n SaR » =: 5 CT +û F 0 Bis 173! CRT-Æ +4 É 0er | 


l 
Dre Lé Pre ni dE + À Sir E À; Sis # ds Ey 1 lil LA For, 
F 


(14.410) 


Nous avons donc finalement pour l'expression covariante du tenseur de Riemann-Christoffel: 


il 
ks =: 2 CT + dE 0, Bis — d8y le Pre + 11; (14.411) 


Il convient de remarquer que le tenseur de Riemann-Christoffel est donc antisymétrique: 


Enfin, la permutation en bloc des indices ij et rs nous donne, par suite de la symétrie des g; et en 


invertissant leur ordre de dérivation: 


Effectuons maintenant une permutation circulaire sur les indices j, r, s dans l'expression (obtenu donc juste 
un peu plus haut): 


1 
Rin  Slon85 * 05e 7 Dei OnBy |" PiT y +Tolg (4414) 


il vient: 
l 
ki, y s 2 0 85 ” À Sr = Sy a d8s Lo TT ae + TT 
1 (14.415) 
Ro y : 5! ds Eÿ : d&s E À Sy S des Gr . A D 


et nous avons alors (c'est très simple à contrôler avec en sommant les trois lignes ci-dessus): 


Rs +R + Riy =0| (14.416) 


L'identité précédente est appelée "première identité de Bianchi". Nous avons donc aussi (nous changeons 
les notations des indices afin d'être plus conforme aux écritures habituelles en relativité générale): 


4,R. +4.R.. +4 R = 0) (14417) 


A7 af jav v° Au A G6, VA 


et par extension: 


V, Rp y + V Ra + V Roy : 0 (14.418) 


Rappelons qu'implicitement, cette relation (appelée "deuxième identité de Bianchi") exprime toujours 
simplement (si l'on peut dire...) le fait que gravité et géométrie de l'espace sont liées ensemble. 
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13. TENSEUR DE RICCI 


Avant de voir les conséquences de l'identité de Bianchi, nous avons besoin de définir le "tenseur de 
Ricci": 


Reg = Rg (14419) 


qui est donc simplement la contraction des premier et troisième indices du tenseur de Riemann-Christoffel 
que nous avions donné plus haut: 


È _ È rrè _rrri : 


en d'autres termes c'est juste une notation plus condensée. et puis les lettres pour les indices supérieurs 
ou inférieurs ainsi que la présence de la virgule sont au libre choix de celui qui écrit (en fonction de 
l'humeur et surtout si le contexte permet d'éviter tout confusion). 


Par exemple avec le tenseur de Riemann-Christoffel que nous venons de donner le tenseur de Ricci 
pourrait en fonction de l'humeur s'écrire des deux manières suivantes (nous gardons les indices avec les 
lettres latines): 


D'autres contractions d'autres indices pourraient aussi être possibles mais parce que Res est 


antisymétrique sur &, £ et #V alors la contraction sur ces indices reviennent à avoir +À,... 


De manière similaire, nous définissons le "scalaire de Ricci" (aussi parfois appelé "scalaire de Riemann") 
par la relation: 


R= EUR = Le Lu (14.422) 


qui possède les propriétés suivantes: 

- Si l'espace est plat, le scalaire de Ricci est nul 

- Si l'espace est courbé comme une sphère, le scalaire de Ricci est positif 

- Si l'espace est courbé comme une selle de cheval, le scalaire de Ricci est négatif 


Soit explicitement (en changeant de notation pour les indices afin de bien insister sur le fait que cela n'a 
aucun impact!): 
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R= RU Re, = |0,T$ - 0,14, +Tÿl%e -Liyl 4) 


l 1 
GR Ge | Ô;eÿ +0;gi — à Eÿ ) su 9; (Le Ô; 8 pe 4 9x8 T GEL ) 
a. Lu | (14.423) 
ss LT 5€ GES +0; 81 — Ag] 28 | 9 Sr +08 — À Eye | 


l 4. | 
(2e 0j Bye + Bi _ Of Sie JE (9; Sr +8,8; = 8 jr ) 


Nous aurons des exemples pratiques concrets dans le chapitre de Relativité Générale pour les deux 
premiers cas mais regardons des exemples simplifiées pour les deux premiers (nous ne démontrerons par 
contre pas la réciproque). 

Exemples: 


E1. Commençons par la métrique de l'espace plat pour commencer (sans la composante temporelle). Nous 
avons (cf. chapitre de Relativité Générale): 


1 0 0 
gi =[0 1 O0! (14424) 
0 0 1 


En reprenant la définition du scalaire de Ricci sous forme explicite: 
l ya 7 
2, 5£ (8ÿ +0,81 - de | -ô; 5€ (8 8j à +9 8 — feu l 
=, 0 0 le (à 8 8 | 
8e [+58 leg Foie || SE (ous +08 TH Epo | (as) 


1 x 1 
(25 (Or pe + O8 — À Bip 1E4 10; Sir +0,8j — ÔE jr ) 


Il est immédiat que R est nul puisque les dérivées partielles seront toutes nulles. Donc un espace plat a un 
scalaire de Ricci nul. 


E2. Regardons maintenant avec la métrique du plan exprimée en coordonnées sphériques (sans la 
composante temporelle). Nous avons (cf. chapitre de Relativité Générale): 


1 O0 0 
gi =|0 r ( (14.426) 
0 O r?sin?8 


et: 
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gi = (] 1/r2 (s] (14.427) 
O0 O0  l/r?sin?8 


avec: 
ds? = dr? +r24 87 +r? sin? ga # (14.428) 


Nous savons que pour calculer le scalaire de Ricci (ou: courbure de Ricci), il nous faut donc calculer la 
contraction du tenseur de Riemann-Christoffel (soit: le tenseur de Ricci) qui lui-même dépend des 
symboles de Christoffel de deuxième espèce qui eux-mêmes dépendent des symboles de Christoffel de 
première espèce (argh!). 


Nous allons donc commencer par le plus bas niveau, c'est-à-dire par déterminer tous les symboles de 
Christoffel de première espèce donnés pour rappel par: 


dl 
Ty = z(@8 +8gx À ;86) (14.429) 


Nous avons donc 3°, soit 27 symboles de Christoffel de première espèce possibles! Même si certains 
symboles sont égaux (nous l'avons démontré!), nous allons quand même tout calculer. 


Commençons dans la joie et la bonne humeur..: 
l . 

Li11 = 5! à au + A1 Ai) = AE = 0 
l 1 

L12 = 5. À 821 + dau A2 = 5 °2811 = 0 


1 1 
L13 = 5018 +631 - Agisi= 3381 = 0 


1 1 

la = 5! à 2 + Ag - Daii= 7281 = Û 
1 1 

l33 = 5! à 822 + ga - da = 482 =r 


1 
l33 = 3 21832 + 03831 - dm31=0 


1 1 

li31 = 5! à 213 +1 - Gi = 6381 = 0 
1 

l32 = 5! à 823 + gy — mg2i= 0 


1 1 : 
133 = 521833 + 63831 — 813 DETEE = rein? 8 
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1 1 
11 =, 0281 +4g2-dAgii= 3 281 = Ô 


1 1 
312 = (02821 +682 - A ga = 82 =-—r 


1 
l13 = 5! den + m2 - Ag3i= 0 


1 1 
Pi = (02812 +482 - de1i= 5 482 =r 
1 1 
l'332 = 5! 03832 + 02822 —d38231= 52 g22 = 0 (14.430) 


1 1 
L33 = 5! 03832 + 3822 — m3 3 03822 = 0 


1 
La = 2! 813 + A g32 — Ben = 0 
1 1 
332 (0282 +6 gg - Gen =, en = 0 


1 1 
l33 = 2 2833 +832 - eni= 5 02833 = r? sin Pcos 8 


1 1 

L311 = 5! ai +3 - À: =, 0381 = Ô 
1 

l312 = ni gun + D e3 - Ag = 0 


1 1 . 
313 = 3 93831 +3 -Ag33l= T3 21833 = -r sin? 8 


1 
331 = 5! 82 +33 — d2g311= 0 
1 1 
322 = 5! 822 + 02833 — 32 1= 3 382 = Û 


1 1 
l'23 = 5\3E +087 — dg3 Dane Li = 7? sin Bcos 8 


331 = : Gg3 + À ga — Ogg = à ga =rsin? 8 

332 = = 823 + O3 — Deni= songs = r? sin Pcos 8 

L'333 = =: O3833 + 3833 ses | = = ess = 0 

Calculons maintenant tous les symboles de Christoffel de deuxième espèce dans les détails: 


 _ LL. À 
Th = guy sé (dL8; + d;8u — 8) (14431) 
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Encore une fois, comme le tenseur métrique est diagonal, cela va nous simplifier les calculs! 


Nous avons alors: 


2 22 1 1 
Ines Has 
Fr | a 

r? sin? 8 Fr 


Th — To =li-ri=-r 


2 2 1 1 
Fu=e mis r-— 
Fr F 
1 . cos 8 1 
Le ge D me — .phaindoosge = 2 votf 14.432 
3 8 33 rè cine D sin 4 tan 9 Fe 2) 


Fe =gT =1(-rsin? 8 |=-rsin? 8 


REA “el Liz sin #cos 8 |=-sin # cos 8 


rè 
33 . 2 1 
Ti =£ l331 = = rain g=-— 
r sin 8 Fr 
1 | 8 1 
Ta = gT3n = pe sin 8 cos 8 = — = — =cot 8 
r? sin? 8 sing tang 


Calculons maintenant les 9 composantes du tenseur de Ricci dans les détails selon: 


Rs = Rous = les — 08Tau +lasl 4 Toul Gr (14.433) 


Nous avons alors (nous les calculons tous, même si nous savons que par la suite ceux qui n'ont pas 
&= Æ seront inutiles de par la métrique diagonale): 


Ai = Ra = Th - AT +TNTÉ Th = ah, - TI LTÉ 
= AT + Ah + At (Tilt +DaTh + Dsl | 

= {0 +813 (TIR +Tisl, | 

= {2 TT +ATTs -[TiaT hi + TT +TfoD ts | + Ta D | 

= AT +A0ts 1 [TT 1 +TTaT te | 

= {2 TT) +AITs [TT Po + (Dial hi + Dal Va + Tale || 


= | +413 || +3 = -(à 2+2, :)- pri) 


Fr Fr rr 
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R = Ron = 0ul 12 — O2 + Dal 4 — Tiyl 8 

= (T2 — & T1 + 20e — D 2 | + 8202 — T2 + 2T Er — Mal | 

+{ T2 — ds + TT — ar |= (8203 +203, {3% | 

= |-821f3 (DD 4 + fol 82 + Dial as | Dal | 

= (020 f3 + (PTS 1-31, = | 80e + TPS) T3 1 + TP Do + al 33 | 
= | 227 fs + (TT 8 | —(Tfal 33 || = 8203 +212 Val 93 


PTE 
r Fr r 


Ry3 = Ra = 0,17 - TT, TBE lue, 

= (Dis — T1 +0 — Lil ar | 4 fa — fa + MaD 9 — Dal $ | 

+{ OT Ts — Ts + aTS, — DaDS = |-8Tf +Tf3I$, —T{2T$, | 

= | 8302 +(Ti3 T1 +32 +31 23 | DoT$ | 

= {8312 +(Tfal ds 1 Do | (802 +0 T2 81 +22 + ol || 


=(-ar8)=-2, 0 
Fr 
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Roi = Réa = do — Alu lle —Loulhr 
= (Ah Dh +Dlh Pl +004 - AT +8 -hIÉ | 


+ T1 — AT + TT —DislŸe | 

= OT +8 = DhaDt VH-AT + DT = T'éslfe | 

= (827 À + + DT 02 + DAT = Do |A TS +1 S -TaŸ, | 
= (2274 TIR 14 AT S3 +TTS, —TosT | 

= (87 (TT +20 + Dale ll Ts + TT sl | (14.434) 
= (027% +183 + TT -Tislh | 

= 7 + + (Dali + DAT 32 +D1l ds |, | 

= 7 + - 0 + (TT 82 |-TS3T 4 | 

= 7 +|- Ts + TT S2 — (Dos + T0) + Dal ts || 

= 7 + - Ts + TT S2 — (TSsT ts lle 00781 — GTS + DAT TT 


2e Aid 60 
r F r 
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Ra = Ron = 0h TE + TT Toul É 

= (TS — 8231 + The — LTD +102 82 — 821 22 + TT Ds — TETE | 
HT — 83133 +PoT$, - Dal | 

= (52 -Th1T9r |+ (8273 + THIS, 331, | 

= (T2 (Doi + DAT Do TT 9s || + {0273 + TT, -Thl3, | 
= (Da — Lilo +82 3 + TT, —Thal 3, | 

= (TS — T1 92 +850 3 + (Do + TÉ2T2 + Dal | $, | 
= (T2 T1 | +820 +4 —ThsT 3 | 

= (T2 T1 +820 3 +1 — (Dal 1 + DT D + TS || 
= (A TS2 1192 1+ 8203 +4 TT | 

= T2 — Lil 92 — 6033 +4 — 123123 

= à, (-r) = En) — dgcot 8 += — cot? 8 


=-1+1-[{-1-cot7 8) —1-cot? 9=0 


R3 = Ra = 8,153 — CAE + ée — Doul 3, 

= (ADSs — 6091 + Dsl = Doilar 1H Ts — 0508 +TE3T 2, —Th2l 4 | 
HT 3 — das + Dal = Loslé = (Phil TT $, - ol, | 

= (TD TT +83 + TT, —ThoT$, | 

= (TES, Th = DT +187 + DT 8 | Th2I$, 


2 | 9 2 2 
= TETE =D + DT + DT 83 | = 0 
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Ra = Ra = dla — Alu TT Ge pl ir 


= AD = An +Daile —L81Dir 1H TS — AT E2 + Lil dr — Laalf | 

+ TS — AT + DAT Sr —TE30 fe | 

= (Th Th 14830 +ThTS, - Tilt, | 

= T1 + TE Do DAT = ho É HT 81 + TT —TSsT | 

= (DIT, +8 T 81 + THIS, —TisTf, | 

= (T2 f + +DoD fs +030 1 + TT $, -TEsTŸ, | 

= (TS + Th Dis = (OT 81 + (T1 81 + 32 + DAT | TT, | 
= D Lslte = Th — (Dash + Tale + Dal fe | 


l 


Ro = Ré = Ouh — TE + Tale — Diul 

= AT — da + DD — Lalar | 020 82 — 20 32 + Dial Sr —LaaT 37 | 
+| T2 — 82033 + DIS — Thsl, | 

= (TT 14183082 + THIS -Té3TS, | 

= (TD + il + T1 03 | +072 +20 Sr T9 | 

= (312 + DT — Lis |= 672 + DD + T0 32 + DS21 33 | TSI, 
= ED Thsl, = OT — (aa 21 +L43l 92 + Laal 23 | 


= 8213 = dçcot8 = 0 
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Ra3 = Ré 2 = 0153 — CES +1 331% 151, 


= (AT 33 — T1 +TSaDr Tail èr 1H (820 S3 — GTS +302 2%, | 
+ 3 TËs — 073 +T331$, —T43T5, | 

= (Ts Thil + (020% +TE3T 5, -TT$, | 

= (TS —(Th1D1 + TS + 051033 || + TS + TT - THÉ, | 

= (As -PS1l4s | + (0003 + 3319, Lil, | 

= (83 - Thil |+ (020% + (Dh 41 + TT 22 + Dal 33 | THIS, | 

= (A TSs - Thil |+ (020% + T3 TH % | 

= (AS —Dl8s | + 021% + DD 1 —(T320 81 +0 2 +0 213 || 

= (AT —Thil3s +020 %3 + Dsl T0 | 

= ô, | —r sin? ei-7 —r sin? 91+99i-sin8cos 8 +|-rsin? ei cot#i—sin 9 cos di 
= — sin? 9+sin? 8 dpi sin Pcos Bi sin? + cot Fsin Fcos E 


. | cos à . 
= -(- sin? 9+cos? 8\-sin? + ——— sin cos d 


sin 
= (sin? 8— cos? 8|- sin? 8+cos? 8= 0 


Calculons maintenant le scalaire de Ricci: 
R= gERg (14.435) 
Nous avons alors: 


R= SR ge Rite Rte Rss 


1 1 
M ES ren (14.436) 
= 1.0+—.0+——7 0-0 

Fr r” sin” 8 


Le scalaire de Ricci est donc nul aussi. Ce résultat peut surprendre, mais en réalité il est logique puisque 
nous n'avons fait que de calculer la courbure scalaire d'un espace plat exprimé en coordonnées sphériques. 


E3. Imposons-nous maintenant la métrique diagonale de surface de la 2-sphère 52 (sans la composante 
temporelle). Nous avons alors conformément à ce que nous avons vu dans le chapitre de Géométrie 
Différentielle: 
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r? (8) 
Ex = (14.437) 
: (8) r2 sin? 8 


et: 


ÿ _li/r 0 
g” = … (14.438) 
(8) lir° sin° 8 


Soit (cf. chapitre de Géométrie Différentielle): 
ds? =r248? +r? sin? 84# (14.439) 
où r est une constante! 


Nous allons donc commencer par le plus bas niveau, c'est-à-dire par déterminer tous les symboles de 
Christoffel de première espèce donnés pour rappel par: 


1 
Lu = Se +8gx — À;86) (14.440) 


Nous avons donc 23, soit 8 symboles de Christoffel de première espèce possibles! Même si certains 
symboles sont égaux (nous l'avons démontré!), nous allons quand même tout calculer. 


1 
CETTE ET To "el =0 


1 
(À 821 + dei — A2 != 5 9281 = 0 


1 1 
Li21 = = À 2 + AS - Da1)= sai = 0 
(14.441) 


1 1 = 
22 = 5! À 822 + Gen —- D e2 = 5482 =r" sindcos 8 


1 
(den + A2 - AS) = 3 281 = 0 


La | 

bi 

— 

Lt 

Il 
Die le 


1 3. 
Ps = <a + 6282 — À g22 =; âen = -r" sin 8cos 8 


1 1 
lan = 5 (0280 + 48m - en = à 822 = r? sin Bcos 8 


l 


1 
332 =: 0287 +082 - gi= 5 22822 = 0 


Calculons maintenant tous les symboles de Christoffel de deuxième espèce dans les détails: 


.  . | 
lu = LTuy= JE. (dLgy + d;8u — dB) (14.442) 
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Encore une fois, comme le tenseur métrique est diagonal, cela va nous simplifier les calculs! 


Nous avons alors: 


1 
ré = gli = —— 7" sin #cos 8 = cot8 
r sin 8 


_ ii = L f 3: _— 
Th = Ta = I-r" sandcos#i=-sindcos8 (14443) 


1 . 
IR A = li = — 7" sin cos 9 = cot 9 
r“ sin 9 


Calculons maintenant les 4 composantes du tenseur de Ricci dans les détails selon: 


Ris = Rous = CA Day) “Onlaitiosle Toul Gr (14.444) 


Nous avons alors (nous les calculons tous, même si nous savons que par la suite ceux qui n'ont pas 
&= & seront inutiles de par la métrique diagonale): 


Ri = Rfa = Oulfi - Alta + DL  —Diyltr 

= (T1 — T1 +Tfilhe —LhiDtr 1H I — TT) + TNT 2, Tale | 
= (8274 — AT + —Dalh l=|-802 -IT2T, | 

= (à -DiaT A — Do f2 = |-8 T2 - TT | 


=|-(-1- cot°? 8||- cot? 9=1 


Ra = Ro = 07h - 80h + Dole Dial 
= (T2 — 80h +D2lh —Dilh, +1 01 — I +20 213, | 
= (4h Dh +Dlh - il =20}, =D +1) = Û 


Rai = Ra = 8,1 - are, + Paie Doyle 

= (AT - Da + Toile Date | +020 1 — AT So + TT S, TT | 

= (AT — AT + Pl Dali | (14.445) 
= (TA D = Da TD il} | 


=, =D + = 0 
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= = r 
Ra2 = Ki E 8uT #2 L 87, +191 > 15,1%, 


= (Th — db + Dh — Doi be | 4 02082 — 020 32 +Th2T 8e — al 3 | 


= (AT D2 — 82021 + The - Thor | 

= (T2 + Dar = DoiD or = T2 + Dao t1 +202 Dal Al | 
= (AT TT |= (sin? 8 cos? 8\- cot 8. (sin Fcos 8! 

= sin? 8— cos? 8+ cot Psin cos 8 = sin? F— cos? F+cos FcosB= sin? O 


Calculons maintenant le scalaire de Ricci: 
R= gERg (14.446) 


Nous avons alors: 


1 


——— Àn 
r? sin? 9 


1 
R= Reg = 8 Rite Ro = Rit 
Fr 


(14.447) 
2 


= + sin? 8= += À 
r RS ES 


r? sin? 8 
Nous constatons que: 


1. Le scalaire de Ricci est une constante. Cela signifie que l'hypersurface possède une courbure constante 
en tous points de la surface (nous savons que la sphère par symétrie possède une courbure constante en 
tous points). Elle possède donc une forme de symétrie, vis-à-vis de sa courbure. Nous avons alors affaire à 
une "variété maximalement symétrique". 


2. Ce scalaire est positif ce qui décrit un espace bombé (boule, sphère) 


Remarque: Attention à ne pas confondre la valeur de la courbure de Ricci, et celle de la courbure de 
Gauss. 


14. TENSEUR D'EINSTEIN 


Appliquons une contraction à l'identité de Bianchi: 


À +V À +V À 


au | - , 
aug AU ef av ve Au a as.va | 0 (14448) 


Rappelons que V,g.. = 0 et de même par extension que V,g** = 0. Donc finalement ceci nous amène à 
écrire de par la propriété des dérivées (produit en somme): 


V,gYR VER an * Var" Ragya = O (14.449) 


a jav af, VA 


et donc à obtenir: 


VRE +V RE, +V RE, =0 (14.450) 


AE jav Y° £.Au HAT Ê VA 
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En utilisant la propriété d'antisymétrie du tenseur de Riemann-Christoffel, nous écrivons: 


Va Re  VoRg a Vu © Va Ro  VrRe a + VuRgya = Ô (14.451) 


Ce qui revient finalement à écrire de par la définition du tenseur de Ricci: 
Va Roy  VyRga + V Ré = 0 (14452) 
Cette dernière relation étant appelée "identité de Bianchi contractée". 


Contractons cette relation encore une fois: 


UV Re Vrai le VAR V REV RE = VRT-VRI-V RE 


HAT EVA 


(14.453) 
=V,R-V,R -V,R* = 0 


Ce qui revient identiquement à écrire en utilisant les propriétés de la sommation d'Einstein (qui permet 
librement de changer les indices): 


V,R-V REV RÉ =V,R-2V RS =0 (14454) 
Ce qui équivaut à: 


V RIT Va R=0Q (14.455) 


Comme V,R = g;V,À, nous avons: 


1 
(8-5 ]-c (14.456) 


En montant l'indice À par multiplication avec g**, nous obtenons "l'identité d'Einstein": 
vie" Lrelsc Ga 
. 5 4 =0 (414457) 


Le "tenseur d'Einstein" (tenseur d'ordre deux et contravariant dans le cas présent) qui est donc une 
constante dans un espace Riemannien donné est dès lors défini par: 


G“* = RER (14.458) 


et exprime de la façon la plus courte qui soit, le transport parallèle. 


Identiquement, nous pouvons obtenir la forme covariante: 


1 
Gp" Run = Sur] (4459) 


2 
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Le tenseur est donc construit pour une métrique uniquement Riemannienne (ce qui fait cependant quand 
même pas mal d'espaces possibles...), et est automatiquement non divergent: 


V Gr = 0 (14460) 


A HY 


Nous retrouverons ce tenseur naturellement dans le chapitre de Relativité Générale lorsqu'en faisant usage 
du principe variationnel nous décomposerons l'action en deux termes: 


1. l'action de la masse dans le champ gravitationnel 
2. l'action du champ gravitationnel en l'absence de masse 


En exprimant le tout dans un espace Riemannien nous obtiendrons alors la non moins fameuse équation 
d'Einstein des champs (sans plus d'explications dans ce chapitre): 


l 87G 
RL T3 ÀBy =— 7 Lu (14.461) 
Les 


les détails étant donnés dans le chapitre de Relativité Générale. 


Remarque: Comme nous le voyons, nous pouvons très bien rajouter un terme constant à l'expression 
du tenseur d'Einstein, sans que cela ne change la nullité de sa divergence. Ce fait, utilisé en 
astrophysique, permet de construire des modèles d'Univers particuliers que nous traitons dans le 
chapitre d'Astrophysique. 

Exemple: 


Calculons le tenseur d'ordre 2 covariant d'Einstein: 
G,,=Rk,- L À 62 
= 5 Env (14.462) 
basé sur la métrique diagonale de surface de la 2-sphère 52 (sans la composante temporelle): 


r? Ô 
Env = (14.463) 
0 r?sin? 8 


Comme la métrique est diagonale, nous avons bien démontré plus haut par l'exemple que: 
À = ki =Û (14.464) 
et comme dans le cas présent, nous avons aussi: 


D2=281 =0 (14.465) 
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Il vient que: 


Donc nous n'avons qu'à nous concentrer sur deux composantes: 


Gi =RA1 EE LS LT 
2 2 2 2 pr? 
(14.467) 


1 2 .2 13.23,2 
CG = Ryg — ga —= sin 9-7 sin 7—=0 
2 r? 2 r? 


ce qui vérifie bien ce que nous avons dit plus haut. 
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Notes personnelles: 
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15. CALCUL SPINORIEL 


C omme nous le verrons en premier en physique quantique relativiste, les spineurs jouent un rôle 


majeur dans la théorique quantique et en conséquence dans toute la physique contemporaine (théorique 
quantique des champs, modèle standard, théorie des cordes,.…). 


Ce fut à partir de 1927 que les physiciens Pauli, puis Dirac introduisirent les spineurs pour la 
représentation des fonctions d'onde (cf. chapitre de Physique Quantique Relativiste). Cependant, sous leur 
forme mathématique, les spineurs avaient été découverts par Élie Cartan dès 1913 lors de ses recherches 
sur les représentations des groupes en faisant suite à la théorie générale des espaces de Clifford (introduits 
par le mathématicien W.K. Clifford en 1876). Il montra, comme nous le verrons, que les spineurs 
fournissent au fait une représentation linéaire du groupe des rotations d'un espace à un nombre quelconque 
de dimensions. Ainsi, les spineurs sont donc étroitement liés à la géométrie mais leur présentation est 
souvent faite de manière abstraite sans signification géométrique intuitive. Ainsi, nous allons nous 
efforcer (comme toujours sur ce site) dans ce chapitre d'introduire de la manière la plus simple et intuitive 
possible les théories des spineurs. 


Le formalisme spinoriel n'intéresse pas seulement la physique quantique et ses travaux, entre autres, de 
Roger Penrose ont montré que la théorie spinorielle était une approche extrêmement féconde de la théorie 
de la relativité générale. Bien que le plus couramment utilisé pour le traitement de la relativité générale 
soit le calcul tensoriel, Penrose a montré que dans le cas spécifique de l'espace à quatre dimensions et la 
métrique de Lorentz, le formalisme des spineurs à deux composantes est plus approprié. 


La théorie des spineurs ou "géométrie spinorielle" est extrêmement vaste mais ce site ayant plus pour 
objectif de s'adresser aux physiciens, nous nous limiterons aux spineurs utiles en physique quantique ainsi 
que leurs propriétés y relatives. 


Remarque: Nous conseillons vivement au lecteur d'avoir lu au préalable le sous-chapitre sur les 
quaternions (cf. chapitre Nombres), le sous-chapitre sur les rotations dans l'espace (cf. chapitre 
Géométrie Euclidienne) et enfin, si possible pour avoir un exemple pratique physique, le chapitre de 
physique quantique relativiste. 


1. SPINEUR UNITAIRE 


Nous allons donner ici une première définition (ou exemple) particulière simplifiée des spineurs. Aïnsi, 
nous allons montrer qu'il est possible à partir d'un tel outil de représenter un vecteur d'un espace Æ, à trois 
composantes à l'aide d'un spineur à deux composantes. La méthode est extrêmement simple et celui qui a 


déjà lu la partie du chapitre de Physique Quantique Ondulatoire traitant de l'équation de Dirac ainsi que le 
chapitre d'Informatique Quantique y verra une analogie assez grandiose. 
Considérons pour commencer la sphère suivante d'équation (cf. chapitre de Géométrique Analytique) 


x + y +z?=1 (45.1) 


Et considérons le schéma suivant: 
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Figure: 15.1 - Sphère unitaire 


Considérons-y les coordonnées (x, y, z) d'un point P de la sphère centrée en O et de rayon unité et notons 
Net S les points d'intersection de l'axe Oz avec la sphère. 


Le point S aura par convention pour coordonnées: 
(x=Gyelzs-tl) (52) 


Nous obtenons une projection dite "projection stéréographique" P" du point P en traçant la droite SP qui 
traverse un plan équatorial xOy complexe € au point P' de coordonnées (x', y, z'). 


Les triangles semblables SP'O et SPQ (avec Q étant la projection orthogonale sur l'axe Oz du point P) 
nous donnent les relations suivantes en appliquant simplement le théorème de Thalès: 


SP Ux JO 1 _x'+iy" _x'"-iy 


Remarque: Les deux dernières relations s'obtiennent par application du théorème de Thalès (cf. 
chapitre de Géométrie) dans le plan équatorial complexe. 


Posons maintenant: 
E=x'+iy ËÆ=x'-iy" (154) 


Il vient, compte tenu de la relation précédente que: 


en prenant le module au carré (voir l'étude des nombres complexes dans le chapitres des Nombres): 


1 . 1 _h+of._ & 
+2f (1+z) [x +ivf x rip 


(15.6) 


et comme de l'équation de la sphère il découle: 
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nous avons finalement: 


x? + y? =1-7?- (1+z)(l-2) (15.7) 


1. _. 8 … £ 


M+zŸ P+y (+2-2) (9 


Mettons maintenant le nombre complexe # sous la forme & = #/4# où #4 sont deux nombres 
complexes auxquels nous pouvons toujours imposer de vérifier la condition d'unitarité (rien ne nous 
l'interdit mais en physique cela nous arrange bien): 


Remarque: Les nombres complexes suivants satisfont donc la relation précédente: 


y= cos ,g= sin” (15.10) 


Rappelons avant de continuer que nous avons démontré lors de notre étude des nombres complexes que: 
E= LR # se (15.11) 
# WI} 


Dès lors il vient en injectant ces deux dernières relations dans l'équation déterminée plus haut: 


s$ 
1 _#y — (+2) = = 
(1+zŸ ads 7 Pan — FO 2) 6 + z) (15.12) 


= pu au = D + 2h = 2/06 + ui = 
d'où finalement la coordonnée verticale du point P: 
z=wwy-df (15.13) 
Comme nous avons: 


x+iy = Æ(l+z),x-iy = É(l+z) (15.14) 


alors: 
1 = i = 
x Le autel "3! £—-é)(1+z) (4515) 
tenant compte des derniers développements nous avons finalement: 


x = wh+u,y =ilwh-Wbi (15.16) 
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Ainsi, à tout point P situé sur la sphère de rayon unité, nous pouvons faire correspondre un couple de 
nombre complexes vérifiant la relation d'unitarité imposée. 


Soit sous forme complète et explicite nous avons finalement: 


x LE + cos æsin ae (F7) + cos & sin cet") 
OP =| y |=| iQ - gi) |= | itcos sin ae _ cos sin ae) 
2) (gw-df cos? œ—sin? 8 


cos & sin & Ci PR 7 } 


icos æsin a(et#n = Lu 


cos? &- sin? pal 


cos sin æ(cos(8— Y)+isin(8- y)+cos(-(8-7)) +isin(—-(8- »)) 
= |icosæsin æ(cos(8— Y)+isin(8- y) -cos(-(8- y))-isin(-(8- n)) 
cos? &- sin? 8 (15.17) 
cos sin æ(2 cos(S— y)+i sin($— y) —-i sin (8- y)) 
| ifcos œsin a(i sin( 8 y) +i sin (8— r)) 
cos &- sin? & 
2cos æsin &cos(5— y) sin(2a) cos( 8 y) sin(2@) cos(8— y) 
—(2 cos & sin æsin(6— y}) | =|—-sin(2@) sin( 6 — y) |=|-sin(2æ)sin( 8 — y) 
| cos? sin? & cos? sin? a] cos(2@) 

ain(24) cos(y— ) 


sin(24æ) sin(y — 6) 
cos(24) 


Cette dernière relation nous indique donc que 2& est l'angle entre Oz et OP (puisque l'hypoténuse de 
l'angle du vecteur à une norme unitaire) et donc par déduction Y-— £ représente l'angle entre Ox et le plan 
(Oz,OP): 
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Figure: 15.2 - Représentation de la rotation 


Le couple de nombres complexes de la relation antéprécédente constitue par définition un "spineur 
unitaire". Ainsi, comme nous l'avons vu, un spineur unitaire peut se mettre sous la forme: 


= cos ,g= sin” (15.18) 
de même un spineur quelconque peut se mettre sous la forme un peu plus générale: 
y = pcos æœŸ,$= psin de” (15.19) 


Le spin ainsi mesuré l'est essentiellement à partir d'un axe orienté OZ comme nous venons de le voir avec 
la figure précédente. 


La projection stéréographique conduit donc à représenter certains vecteurs de l'espace euclidien Æ, avec 
des éléments d'un espace vectoriel complexe de dimension deux qui est l'espace des spineurs. 


Remarque: Cette représentation n'est pas unique car les arguments de nombres complexes ne sont 
(sous forme trigonométrique) déterminés qu'à une constante près. 


Le lecteur qui aura déjà étudié un peu la physique quantique ondulatoire (voir chapitre du même nom) 
aura certainement remarqué l'étrange similarité non innocente de la condition et des relations: 


pE + ff =1 
— .{ = —\ (45.20) 
x = + y =ilwé-wh| 


par rapport à la condition de normalisation de de Broglie (l'intégrale sur tout l'espace de la somme des 
produits des fonctions d'ondes complexes conjuguées est égaleà l'unité) et des développements 
déterminant l'équation de continuité en physique quantique ondulatoire. 
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Voyons maintenant pour les besoins ultérieurs, que nous pouvons trouver deux nouveaux vecteurs ÿ ,ÿ; 


de l'espace euclidien Æ,, associés à un spineur unitaire (#,#) déterminé sur la sphère unité. Ces vecteurs 
seront cherchés orthogonaux entre eux et de norme unité, chacun étant orthogonal au vecteur QF. 


Notons ÿ, = OP et (x%,»,,2).i€ {1,2,3}, les composantes respectives des vecteurs %,%,,, sont bien sûr 
liés par le produit vectoriel: 


D =UXY (15.21) 
d'où tenant compte de l'expression des composantes GP en fonction de celles du spineur associé, ainsi 
que du fait 4 + #$ = 1, nous obtenons: 

3 7 Mi22 7 VaA4 L'up +wpi = (y + pi up + y 

Da = 2 2an © L'ÉUf —phi = élu + Pi (Wb -WPi (15.22) 

23 = 092 nn l'ip déi= y di yrur- dpi 


Ecrivant l'orthogonalité des vecteurs entre eux nous obtenons bien évidemment six équations 
supplémentaires. Cependant l'orientation des vecteurs ÿ,,Y, n'étant pas fixée, il existe une certaine 
indétermination sur les valeurs de leurs composantes. Choisissons des valeurs telles que: 


x ir UP, y, +iy, il + Ÿ|,2 +iz, = 2h (1523) 


Prenant les quantités complexes conjuguées des relations précédentes, nous obtenons par addition les 
composantes de ÿ; : 


1 1 : . 2 _ 
us 4 + -#-6 |.» 1” -F+F-# la -iup+wpl (1524) 
Par soustraction, nous obtenons de même les composantes du vecteur v;,: 


x 2 +P+8-$ |,» = + +8 +8 1,2 =ilwf-Whl (525 


Nous vérifions aisément que ces valeurs redonnent bien les relations du produit vectoriel. A tout spineur 
unitaire (#,#) nous pouvons donc associer trois vecteurs »,,v,,Y,. Nous pouvons vérifier directement que 
les vecteurs ainsi calculés sont bien orthogonaux entre eux et de norme unité. 


1.1. PROPRIÉTÉS GÉOMÉTRIQUES 


Nous allons étudier les transformations des vecteurs de Æ, associés à un spineur afin d'en déduire les 
propriétés correspondantes de transformation du spineur. Les rotations dans l'espace pouvant toujours 
s'exprimer sous forme du produit de deux symétries planes (faire dans la tête l'expérience imaginaire), 
nous commençons par l'étude de ces dernières. 
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1.1.1. SYMÉTRIES PLANES 


Considérons dans un premier temps la symétrie plane d'un vecteur: 


Lors d'une symétrie par rapport à un plan P, un vecteur quelconque Gif se transforme en un vecteur 
OM". Déterminons une matrice S qui représente cette symétrie par rapport à ce plan. Soit {4 un vecteur 
unitaire normal au plan P et soit H le pied de la perpendiculaire abaissée d'un point M de l'espace sur le 
plan P. 


Figure: 15.3 - Symétrie par rapport à un plan 


Soit M' le point symétrique de M par rapport à P, nous avons: 


——" 


OM'=OM + MM\=OM +2MH = OM -20A| OM oOÀ\ (1526) 


Soient 4,,4,,4 les composantes cartésiennes de ©4 et (x,y,z),(x',y°,z1 les composantes respectives 


des vecteurs OM, OM", la relation précédente nous donne les relations linéaires: 


x'=x-2a (ax +a,y+az) 
>'=py-2a(axtæyt+az) (15.27) 
z'=z-2a,(a,x + a,y + az) 


La matrice S qui fait passer du vecteur X(x,y,z) au vecteur XZ'{x,y,z) a donc pour expression: 


1= 2a? —2dd; 24 
S=|-224a 1- 2a; — 24343 | (15.28) 
—2a,a 24,4, 1l- 24° 


Gardons en mémoire ce résultat et considérons à présent deux vecteurs | Aie, |, orthogonaux entre eux 
et unitaires, définissant comme nous l'avons vu un spineur unitaire (#7, #). Une symétrie par rapport à un 
plan P transforme les vecteurs À,,X*, en vecteurs À", 7", auxquels sont associés le spineur {w,#"i1. 
Nous allons maintenant montrer que la transformation suivante du spineur (4, #) en spineur 
(g#'i=(x,ys,z3) est: 
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#1 [ & a-ial[w =41|* (15.29) 
PT] [ati -& ][$ 4 | 


et transforme précisément les vecteurs À,,4, en vecteurs À ",,4",, ces vecteurs se déduisant 
respectivement - comme nous allons le montrer - les uns des autres par une simple symétrie plane et que la 
matrice À représente bien la transformation cherchée. 


La relation précédente nous donne donc: 


y'= a+ (a —-ia;)# 


| | (15.30) 
g'=(a tia,)#-a,# 


En tout nous avons: 
zx'+ixt _ y gè 
5 sat (a ia 
A =ig,#" p'tit =ilwt+g"] # sw+( 1 2)$ 
g'= (a +ia,)# -a# 
z'tiz,=-2#'#" 


(15.31) 


Nous en déduisons: 
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X'3= wi g?= (a+ — id) 1 —({@ +i@ y a36\ 

= (Sy + 2asyrl a —ia\Ÿ+ {a —- ia ; #|-lle +ia ? y 214 +ias \yen + ad | 
= ay? + 2asyfl a — ia) \#+laf — 2idz - & if] 

|| + 2aia) — \y? —2{4 +i@ \yad+ ag | 

= a +2a ap Dia ash+a # -2aia,f -a8 

“y — 2aiauf +aiuf +2 a+ aa - ai à 

= [-a+a5+e8 ](y2-47)-2a ai (y? +47 |-2@a; (—-2y#) 

Y'a=il w+ge)= l asÿ+{a —ia, 16 +{(a +ia \w- 6 | 

= 15% Las le —ias \É+ {a —ias \ Ê |+{ (a +ias y? 2ia +ia \vat+f ] Fee 
=ilasy + Laye —ias \f+laf - aies -a5 |\Ÿ | 

Hi | (af + 2œia, — a5 |y? -2(a +ie \wat+aif | 

= ia? y? + Ziani a È + 2aauif +iai +2aa# ia f 

Hal - Da — ia? — Dajasyf + 2aasutf + iai 

= —2a;4 (u?-#?\-2a3a;(-2u1+[ af —a2 + 5 |i{y° +#° | 

zh =-2g'#' =-2lasg+ia -ia fille +inmiw-afl 

=-2(a,#+af-ia;di(au+iay- af) 

= —2asa (y - 6° |- 2a;ai | y? + 6° |+ [af + ai - af ](-2y) 


. . 2 
Par suite du fait que JA] = a +ai +a? =1, nous obtenons: 


% = [' = 2a ] 3% — 2}; — 2ad3Z; 
»3 = -2a ax, + [1 = 2a; | »: — 24;43Z3 (15.33) 
z, = -2a,a,x, - 2a,a,y, + [1 — 245 ]: 
Nous retombons donc bien sur la matrice de symétrie: 
1-24 aa, -2aa, 
S=|-244a 1- 2a; —243@3 | (15.34) 


— 24,4 — 24,4, 1-24 


Ainsi, la matrice que nous retrouverons dans le chapitre de Physique Quantique Relativiste: 


(15.35) 
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A engendre donc la transformation d'un spineur (4, £) en un spineur {#',#"\ telle que les vecteurs 


associées | À#,,#, | se déduisent respectivement de | #",,#", | par une symétrie plane. 


1.1.2. ROTATIONS 


Comme nous l'avons vu dans le chapitre de géométrie euclidienne, il est possible faire une rotation d'un 
vecteur dans le plan ou dans l'espace à l'aide de matrices. De même, par extension, il est évident que la 
multiplication de deux rotations est une rotation (c'est de l'algèbre linéaire élémentaire - du moins nous le 
considérons tel quel). 


Considérons dès lors, deux plans P, Q dont l'intersection engendre une droite (ligne) L et notons 
Aa ,a,,a;) et B(b,,b,,b.) des vecteurs unitaires portés par les normales respectives à ces deux plans 
sécantes en L: 


7 Es 


Et 


À : 
CIEÈNS 


Figure: 15.4 - Intersection imagée de deux plans 
Notons 8/2 l'angle des vecteurs À, entre eux (la raison de cette notation provient de notre étude des 


quaternions (cf. chapitre Nombres). Soit Z le vecteur unitaire porté par la droite L résultant de 
l'intersection des plans P, Q et tel que: 


D ai 8 
AB - Lan[?] (15.36) 


Explications: 4,5 sont unitaires mais pas nécessairement perpendiculaires et nous devons quand même 


nous assurer que Z soit un vecteur unitaire (sa norme soit égale à l'unité donc). Dès lors, la relation ci- 
dessus nous assure que: 


Asa4S | -VsofS | = AIBT- 2 +2 +8 1 san 


Le produit vectoriel précédent nous donne pour les composantes de Z : 
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L sin (5) = a,b, - ab, 
. [8 
£, sin 5 |" Gb Gb (15.38) 
. [8 
Lsin|S]-ab, -a,ù 
D'autre part, le produit scalaire s'écrit: 


AD Le BIble-($) - cos[?] us. 


Remarque: Nous allons nous servir des ces deux plans comme plans de symétrie pour nos rotations 


Comme nous l'avons fait remarquer précédemment, une rotation dans Æ, peut toujours se faire avec au 


plus deux symétries planes. Ainsi, une rotation peut se noter par l'application (multiplication) de deux 
matrices de symétrie selon les résultats obtenus plus haut: 


RIZ —|= (15.40) 
2 à . . —@& 


Développant le produit de ces deux matrices et tenant compte de relations découlant du produit vectoriel 
et scalaire nous obtenons: 


La_rErseT ee()l 
Eh aa?) co(dsa(2] 


Ainsi, nous pouvons écrire la transformation d'un spineur (#,#) et un spineur {#',#"\ à l'aide d'une 
matrice de la forme: 


La LA 


dont les paramètres sont appelés "paramètres de Cayley-Klein". 


- 8 
La matrice [25 peut être écrite sous une autre forme si nous faisons un développement limité pour 


des rotations infiniment petites 4/2 = £&/2 (eh voilà la physique qui revient....). Ainsi, les 
développements de Maclaurin (cf. chapitre Suites Et Séries) nous donnent: 


€ 1{E5YŸ . [E s 1{eŸ 
cosl—|=1-—| |) +. sinl—|=—-—|—|] +... (15.43) 
2 212 2 2 612 
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En utilisant seuls les termes du premier ordre, la matrice de rotations s'écrit finalement: 


—i LR ii, + n 
a[2i] L Mer Le TT 1° 2-2: _ De +) (15.44) 
2 (Hh+L)S 1+:2 Sr L) ils 


Cette matrice constitue le développement limité de la matrice de rotations au voisinage de la matrice 
identité, cette dernière correspondant évidemment à la rotation nulle. Nous notons cette dernière 
également sous la forme: 


a[ ot EE) (545) 


où la matrice &, est la matrice unité d'ordre deux et 7{£) s'appelle la "matrice infinitésimale de 
rotation", Maintenant, si nous posons À, = 1,2, = £, = 0 dans 7(£) nous obtenons: 


Q 1 
xD - 109 1] de ïl | cs 


Comment interpréter ce résultat ? Eh bien c'est assez simple, choisir Z =1,£, = Z, = 0, nous donne un 
vecteur j, colinéaire à l'axe Ox de Æ,. Dès lors, nous pouvons très bien nous imaginer les plans générant 
l'axe Ox qui porte £. Comme £#/2 (in extenso 8/2 ) est généré par les vecteurs 4,2 perpendiculaires à £ 
et donc à Ox, alors l'angle £/2 (ou sa variation) représente une variation de la direction des plans 
normaux à À, 2 qui par symétrie servent à construire la rotation (rappelons que 4, ne sont pas 


nécessairement orthogonaux entre eux). Donc par extension, avoir Z =1,£2, = £, = 0 ne permet plus que 
de faire des rotations (symétries) autour de Ox. 


De même, une rotation autour de l'axe Oy correspond à Z, = 1,2, = Z, = 0, ce qui donne: 
D = go = Te Ga 
F4 * 5 5 (15.47) 


et de même avec Z, = 1,2, = Z, = 0 nous avons enfin: 


neno=ilr 9cift 01 
TL) = y(Oz) los 2 (15.48) 
(Di=ros-1|" ‘| 
(4 AS LP 2 


ñ = _1[0 + __ài[0 —i 
#D)=-2@)-S 1 5 >l; 0 


Les trois matrices: 


1 © 
D 
ms 
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nanon=ili 01. ilt 0 
HO [lo + 
) 


(15.49 


sont donc les matrices de rotation dans l'espace des "spineurs à deux composantes". Les physiciens et 
mathématiciens disent que ces matrices constituent une représentation irréductible de dimension deux du 
groupe "SU(2)" ou encore appelé "groupe spécial des rotations spatiales SU(2)" (cf. chapitre d'Algèbre 
Ensembliste). 


Les matrices infinitésimales précédentes font donc apparaître de manière habile les matrices suivantes: 


HET 


Ces matrices sont appelées "matrices de Pauli" et nous les retrouverons dans le chapitre de Physique 
Quantique Ondulatoire et dans le cadre de l'étude de l'équation de Dirac et de la détermination de ses 
solutions explicites (utilisant les spineurs) dans le chapitre de Physique Quantique Relativiste. 


En utilisant ces matrices de Pauli, la matrice de rotations infinitésimales peut finalement s'écrire: 


a[ = (us +2,00 +61 (4551 


EL 


Définissons un vecteur & , appelé "vecteur de Pauli", ayant pour composantes les matrices de Pauli: 


TG, D,) (15.52) 


L'expression Z& + 2,9, + 9, peut alors s'écrire sous forme d'une sorte de produit scalaire qui 
représente une somme de matrices (la flèche au-dessus du sigma est parfois omise si aucune confusion 


n'est possible): 
Éoë= Lo +20 + Lo (15.53) 


Le développement limité s'écrit alors: 


La matrice de rotations: 


La PES) ces) 
ES) aai(?) cfdeaa(e] 


peut à l'aide des matrices de Pauli s'écrire sous la forme remarquable: 


1 
U 
CG 


Page: 1121/4839 


[v3.0 - 2013] 


” 9 + 
a[r?] = cs 7]a “ian(2]E oT (15.56) 


forme que nous utiliserons dans le chapitre d'Informatique Quantique pour exprimer les matrices R de 
manière explicite ainsi que dans le chapitre d'Algèbre Ensembliste. 


Ce qui s'écrit parfois: 
+ 8 +, 
R(L,8) = cos—{-isn—Zoë8 (15.57) 
2 2 
Ce qui peut s'écrire aussi: 


+ ÿ 8 8 8 8 
[12] = cs[7]a = Gisn( Ses — Li sn[]es = Lisin(Ÿ]e; (15.58) 


qui a donc la forme d'un quaternion de rotation d'angle 8 et d'axe Z. D'où la raison d'avoir depuis le 


début choisi la notation de £/2. 


Il est clair, pour que l'analogie avec les quaternions soit plus forte, que les matrices 2 X2 de Pauli forment 
un ensemble de quatre matrices linéairement indépendantes ! Tel que la base canonique pour les 
quaternions ! 


Si nous notons É(L,2,,4,) = Ê(x,y,z) alors le "produit spinoriel" est défini finalement par: 


=. à X —iy 
Le +20 + Lo = 2x0 +yo, +2 tee | | (15.59) 


Cette matrice constitue comme nous en avons déjà fait mention, au développement limité de la matrice de 
rotation au voisinage de la matrice identité, les composantes de Ÿ étant associées à un spineur dont la 
rotation se fait par la double symétrie définie par deux plans dont l'intersection est définie par le vecteur 
ï: 


Nous pouvons par ailleurs remarquer la conséquence intéressante qu'une rotation de 360° ne restore pas 
l'objet dans sa position initiale. 


Effectivement: 
R(E£,0 
R(L,27)=cos(m){-isin({m£e&=-1 (15.60) 
R(L 4x) = cos(22)/-isin(2m)Le&= 1 


}= cos(0)/-isin(0)£o& =1 


Il faut donc une rotation de 720° pour faire un tour complet! Cela correspond au spin de 2. Il faut faire 
deux tours pour retrouver que l'objet réapparaisse de manière équivalente. Nous disons alors que la 
représentation des rotations est "bivaluée". 
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1.1.3. PROPRIÉTÉS DES MATRICES DE PAULI 


Le lecteur vérifiera aisément (si ce n'est pas le cas il pourra toujours nous contacter pour que nous en 
rédigions les détails) les propriétés suivantes des matrices de Pauli dont certaines seront utilisées dans le 


chapitre de physique quantique relativiste: 
P1. Unitarité: 

=== (1561) 
P2. Anticommutativité: 

GO; = 9; (15.62) 

pour i # j et à, .j = 1,2,3 
Les deux dernières propriétés nous donnent: 

GO; +0, = 20, (15.63) 
avec ài,.j = 1, 2,3 
P3. Cyclicité: 

AG ii Do iU Gi (15.64) 

P4. Commutation: 


Go, 0 = ÀO, 
GG Go = 2 (15:65) 


DA GO 2 


P5. Produit vectoriel: 


Soit le carré des composantes de & en notant abusivement par "1" la matrice unitaire (nous changeons les 


indices afin de vous habituer aux autres notations courantes): 
0 1][0 1 1 0 
Le D : =] 
1 Of[1 O| 10 1 
O 5110 -; 1 0 j 
g,9,= = = 5.66 
oo œil ti 7" 
1 O1 0 1 0 
T,T,= = =] 
Las 


Ce qui conduit à écrire que (norme du vecteur de Pauli au carré): 
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1 O0 
g'=a+oto; 313 (15.67) 


Considérons maintenant les produits suivants: 


MURIENES 
M, Al af Le TE 1-f . 


T,T, "ro 


HOME 
URI 
HR DIRRRE 


eo, 
Toutes ces relations peuvent se résumer sous la forme: 


GO; = dl+ié; 0%] (15.69) 


où pour rappel (cf. chapitre de Calcul Tensoriel) le symbole de Kronecker est défini par: 


5 lai 
; 15.70 
FlOsiizÿ Ce 


et le tenseur d'antisymétrie par: 


+1 pour une permutation paire de 1,2,3 ou aucune permutation 
Ex = —] pour une permutation impaire de 1,2,3 
0 s1 deux indices ou plus sont les mêmes 


Nous avons aussi: 


ÉD A0, 
Ty O5 OO y "207 (15.71 


TrO,; CO; = 20, 


Nous retrouvons donc ici les composantes du produit vectoriel: 
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EXT =2T (15.72) 


Maintenant voyons une identité spinorielle qui nous sera utile dans le chapitre de Physique Quantique 


Relativiste: 
(&c2)(&r5) 
= (a +, +04 )(oh + mb, +) 


4 (Put À b, Dire, 
a, +ia, —4 b, +ib, —b, 


tr 


J 


a,b, +(b,+ib, j(a, -ia,) a, (b,-ib,)-8, (a, -ia,) 
(a, Hia,)-a,(b,+ib,) (8, -i8, j(a, +ia,)+aë, 

a,b, +b,a, +b,a, +i(b,a, -b,a, | ab, —ia,b, ba, +bia, 
ba, +bia, —a,b, —iab, a,b, +b,a, +b,a, +i(b,a, -b,a,) 


k 
| 
NN +a,b, +a,b, 0 | 
ls 


a,b, +a,b, +a,b, 


a, ba, ) ab, —b,a, +i (Ba, _ 2b,) 
-4,b, +i( (è,a — 4, b , i(b,a, -b,a,) 
_(zoê)4 bad) Œb =b4, +i(8,a, - a, ab,) 
b,a, —a,b, +i (ba, ee ab,) i (8,4, —b,a, ) 
Or nous avons aussi: 
Aybz — Ad, 
ido(äxb}=ido| a,b, —-a,b, 
a,b, —4,b, 
: a,b, —4,b, (ab, —a,b,)-i(ab, — ab, ) (15.74) 
(a,ë, -a,b,) +i (ab, -a,b,) (ab, —ab;) 
i(b,a, ba) ab, —b,a, +i(Ba, — 4, D » 
[ba, ab, H(ba, -b,a,) i(a,b,-a,b,) 


Donc finalement: 


(a)(b)=(a0b)1+iao(axb)| (575) 
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P6. Nous noterons que ces matrices sont aussi hermitiennes (rappelons qu'une matrice hermitienne est une 
matrice transposée suivie de sa conjuguée complexe selon ce que nous avons vu dans le chapitre 
d'Algèbre Linéaire) tel que: 


ol Lt  - 
T, = O,=0, OT, = (15.76) 


Il s'agit donc dans le langage de la physique quantique, d'opérateurs hermitiques! 


Voyons maintenant quels sont les vecteurs et valeurs propres des matrices de Pauli car ce résultat est très 
utile en physique quantique ainsi qu'en informatique quantique! 


Rappelons que lorsqu'une transformation (application d'une matrice) agit sur un vecteur, elle modifie la 
direction de ce vecteur excepté pour certaines matrices particulières qui ont des valeurs propres. Dans ce 
cas, la direction est conservée mais pas leur longueur. Cette propriété est exploitée en mécanique 
quantique. 


Déterminons dans un premier temps, les vecteurs et valeurs propres (cf. chapitre d'Algebre Linéaire) 
associées à T, en utilisant la méthode la plus courante: 


L'équation aux valeurs propres (cf. chapitre d'Algeèbre Linéaire) s'écrit donc: 


0-4 1 
se, -A1,) | .. JL (15.77) 


Ce qui nous donne comme équation caractéristique: 
det(o, -A7,)=42-1=0 (15.78) 


d'où les valeurs propres À =+1. Ce qui nous permet de déterminer les vecteurs propres comme suit: 


LL O-00) «> 


Donc pour À =1: 


Ce qui impose que Ÿ = ZX. Le vecteur propre est donc: 
x 1 

| | }vs (15.81) 
yY=x l 


Conclusion: La direction propre du vecteur est conservée mais pas sa longueur car elle dépend de la valeur 
de x. 


quelle que soit la valeur de x. 


Pour À =-1: 
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D-00 


Ce qui impose que Ÿ = —X et donc que le vecteur propre est: 


| : | k | 
= X ,Vx (15.83) 


Les vecteurs propres précédents écrits avec le formalisme de Dirac (cf. chapitre de Physique Quantique 


Ondulatoire) donnent pour À = 1: 
b>=xl |- (15.84) 
1 x 


avec une norme de (1 puisque nous normalisons à l'unité): 


(vv)=r+x=228 =1 > PR (15.85) 


ÿ2 
Remarque: Dans le formalisme de Dirac, {v| est le Bra et |v} est le Ket. 


Ceci n'étant valable que pour des composantes qui sont des nombres réels. Le vecteur propre normé a donc 
pour expression: 


et pour À =-1: 


Ÿ 
nr 
Il 
4 
PRE 
x 
— 
LEE 
Il 
RE 
1 # 
+ 
Le, 
"re" 
— 
si 
[ee] 
> 


et: 


{vlv}=x2+(-x) = 22 21 ST (15.88) 


et le vecteur propre normé a donc pour expression: 


[v}= =.) 15.89) 
ASUS 


Déterminons maintenant, les vecteurs et valeurs propres associées à , en procédant de même: 


Nous avons donc pour les valeurs propres: 
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s(o,-A1.)=| 


= “ei 


20 Æ-(-ii)=0 = A=t1 (15. 
, ae (ii) (15.90) 


Les vecteurs propres se déterminant comme suit: 


LEO) 0 
(HA) » mt mo 


. [=|. [ex |,Ÿx (5.93) 
y =iz ix i 


eb}=æ1.-1["] =x2[1+(-i )]-22 =1= rs (15.94) 


et donc pour À = 1: 
Le vecteur propre est dès lors: 
La norme associée: 


Le vecteur propre normé a donc pour expression: 


+1f1 
[v}= x +) (15.95) 


BG} Q) = ve 
| =— = — ŸY—=-X—=—I1X (15.96) 
ix y —Y î 
beat Ca)" 0 
El Ie LE 9 
Y = x —ix a 
1 


{vlv}=xf1, (= }retr +5) [2221 xt (1598) 


2 
k | 
| (5.99) 
—! 


Pour 4 =-1: 


la norme associée: 


Le vecteur normé a donc pour expression: 
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Déterminons maintenant, les vecteurs et valeurs propres associées à &, en procédant de même. 


Nous avons alors: 

1 À (il 
0 —-1-4 
Æ-1=-0 —= A-+1 


se, A1) = = (-2)-1-2)=-(8-0-0 


(15.100) 


Les vecteurs propres sont alors pour À =1: 


ED 


ce qui nous pose légèrement problème pour dire quoi que ce soit. la seule possibilité est de choisir 
y = 0 et ainsi: 


et la norme associée: 
{vlv}=x +02 ==] —= x=+1 (15103) 


Le vecteur propre normé a alors pour expression: 


[v}=+ f) (15.104) 


et pour À =-— 1 nous aurons le même choix à faire en posant cette fois-ci x =0 donc: 


#0) 0 


v}=07+{->) = y2=1 = y=+1l (15106) 


d'où la norme associée: 


Le vecteur propre normé a donc finalement pour expression: 


0 
[v}= 4 | (15.107) 


Donc les vecteurs propres normés de &, se trouvent sur les directions des axes de coordonnées 
cartésiennes. C'est pour cette raison particulière que les vecteurs propres de &, sont notés en informatique 
quantique: 
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(Jp) co 


et il faut savoir que l'on note alors aussi: 


o, = H4}=+#) «5109 
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Notes personnelles: 
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??. THÉORIE DES NOEUDS (chapitre non validé) 


Rx Descartes avait imaginé un système du monde, où l'Univers était animé par des tourbillons. À la 


fin du siècle dernier, Tait et Kelvin ont ressuscité cette théorie, et interprété les liaisons chimiques en 
imaginant des molécules nouées qui s'enlaceraient. 


Les développements ultérieurs de la physique et de la chimie ont amené une autre théorie de la liaison 
chimique, fondée sur le partage d'électrons entre les atomes (cf. chapitre de Chimie Quantique). Mais le 
sujet des noeuds était lancé! Dans certains domaines, les noeuds seront. le noeud du sujet. 


Remarques: 


R1. La dénomination "théorie des noeuds" qui c'est imposée dans la communauté scientifique est assez 
malheureuse. Certains mathématiciens (francophones) ont choisi à juste raison d'utiliser plutôt la 
dénomination "théorie des tresses et entrelacs" qui est plus correcte et générale (puisqu'un entrelac est 
un noeud à plusieurs composantes). 


R2. Une grande partie des textes et figures ci-dessous est une reproduction, avec accord, des supports 
du Professeur Michael Eisermann de l'Université de Stuttgart (http://www.igt.uni-stuttgart.de/eiserm) 


La théorie mathématique des noeuds a été lancée par les travaux de Little et Kirkman, qui cherchaient 
donc à donner un fondement aux idées physiques de Tait et Kelvin. Les premières classifications des 
noeuds utilisaient une image filiforme des noeuds, sans épaisseur, et une projection plane, comme l'ombre 
portée sur un écran. Un des caractères immédiatement perceptibles concerne les croisements où nous 
distinguons le brin au-dessus et le brin au-dessous. Les cannages, ou les tressages de bandes, reposent ainsi 
sur la considération des croisements, et le nombre de tels croisements sera le premier élément de 
classification. 


1. REPRÉSENTATION DES TRESSES 


Voici un exemple de tresse (ensemble de brins) et la chaîne correspondante (une chaîne est une tresse que 
l'on a refermée): 


Figure: ??.1 - Tresse et chaîne (diagramme de noeud) correspondante 


Concentrons-nous sur la tresse à gauche de la figure ci-dessus pour commencer et demandons-nous quelle 
serait la meilleure manière de présenter les choses afin de pouvoir comparer des tresses? Faisons une 


première tentative avec la représentation suivante d'une tresse particulière: 
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Z 


SE 
a 


Figure: ??.2 - Présentation particulière d'une tresse 


Comme les brins d'une tresse sont flexibles et peuvent bouger, nous remarquons de suite que cette 
représentation a un problème: toutes les tresses sont égales. Effectivement: 


SRE RE 


Figure: ??.3 - Exemple de problème de la représentation choisie 


Le bon modèle, consiste alors peut-être à fixer les extrémités des deux côtés: 


Z 


7, 


Figure: ??.4 - Autre choix de représentation 


Bien évidemment, avec ce modèle les brins du milieu peuvent encore bouger comme ci-dessous et la 
tresse reste invariante: 


XX ET 


Figure: ??.5 - Premier exemple de tresse invariante 


ou encore comme ici: 
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PSS ESC 


Figure: ??.6 - Deuxième exemple de tresse invariante 


Nous pouvons également translater les croisements et la tresse reste toujours invariante: 


SEE 


Figure: ??.7 - Translation de croisement et préservation triviale de l'invariance 


La longueur n'est par ailleurs pas une variables dans ce modèle: 


??.8 - Invariance par la longueur 


1:1.: GROUPE DE TRESSES 


Si nous définissons la multiplication de deux tresses comme étant l'opération qui consiste schématiquement 


Figure: ??.9 - Exemple de multiplication de deux tresses 


Nous pouvons nous poser la question si cette opération constitue un groupe du type commutatif? 
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Rappelons avant cela que nous avons défini la structure de groupe dans le chapitre de Théorie des 
ensembles de la manière suivante: Nous désignons un ensemble par le terme "groupe", si les composants le 
constituant satisfont aux trois conditions de ce que nous nommons la "loi interne de groupe", définie 
ci-dessous: 


* est associative 
(CG, *) est un groupe si & {Il existe dans G un élément neutre pour * 


Tout élément de G possède un symétrique pour * 


Si de plus, la loi interne *x est également commutative, nous disons alors que le groupe est un "groupe 
abélien" ou simplement "groupe commutatif". 


Commençons par le premier contrôle. Est-ce que cette représentation est associative ?: 


©) © -25 & 4020 
œ (© ©S)-€ 26-4020 


Figure: ??.10 - Contrôle de l'associativité des tresses (par la multiplication) 


La réponse est donc OUI quel que soit le nombre de brins! 


Est-ce que cette représentation est commutative ?: 


SAS NE 


Figure: ??.11 - Contrôle de la commutativité des tresses (par la multiplication) 
La réponse est donc NON au-delà de 2 brins (car avec 2 brins elle est commutative)! 


Admet-elle un élément neutre?: 


PSE - _ 
= - 


A A 


Figure: ??.12 - Contrôle de l'existence d'un élément neutre des tresses (par la multiplication) 


La réponse est donc OUI quel que soit le nombre de brins! 
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Existe-il des éléments inverses (symétriques)?: 


1 


Figure: ??.13 - Contrôle de l'existence d'éléments symétriques pour les tresses (par la multiplication) 
La réponse est donc OUI quel que soit le nombre de brins! 
Donc les tresses à n brins forme un groupe non commutatif noté (& ) où le B stylisé représente le mot 
"braids" (tresses: en anglais) ! 


Observons quelque chose d'intéressant en ce qui concerne les tresses à deux brins. Si nous indexons leurs 
vrilles par des nombres entiers relatifs comme ci-dessous (imaginez la tresse du milieu dont vous faites 
tourner les extrémités, cela donne toutes les autres vrilles de gauche et de droite): 


Figure: ??.14 - Indexation des vrilles de tresses 


avec la convention de vrille v positive et vrille v négative: 


v( NX) =+1 v A = —] 


Figure: ??.15 - Convention d'indexation 


Attention au piège! (essayez de le trouver... ce n'est pas toujours facile au premier coup d'oeil): 


Figure: ??.16 - Exemple de piège d'indexation 


Effectivement, le croisement de droite la deuxième tresse ci-dessus n'est justement pas... un croisement! 
Nous disons alors que le nombre de croisement n'est pas un invariant. C'est pour cette raison que ce qui 
compte est la "vrille" car elle ne change pas sous les mouvements de la tresse et non pas simplement un 
croisement!!! 
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UV ’ : —= 1 


” / LE / 


Figure: ??.17 - Différence entre vrille et croisement 


Nous remarquons que nous avons alors en ce qui concerne la multiplication des tresses (cf. chapitre de 
Théorie des Ensembles) et leur indexation sous forme du nombre de vrilles les propriétés suivantes: 


J(A-Bj= f(A)+ (8) VABeB, 
F4) = Îz (22.1) 
: -] 
J(41)=(@4)" vae, 
Donc le groupe multiplicatifs des tresses à 2 brins est une homorphisme de groupe avec la loi d'addition du 
groupe des entiers relatifs. De plus, nous voyons trivialement que l'application f est bijective. Nous avons 


dés lors un isomorphisme de groupes! Au delà de 3 brins, nous avons vu que le groupe n'était plus 
commutatif! 


2. REPRÉSENTATION DES NOEUDS 


Revenons à la première figure présentée plus haut: 


Figure: ??.18 - Tresse et chaîne (diagramme de noeud) correspondante 


Une première difficulté apparaît alors pour l'image de droite (qui est un "diagramme de noeud"): un noeud 
(chaîne avec un seul brin) est un objet géométrique à trois dimensions, et nous utilisons une représentation 
plane obtenue en projetant le noeud sur un plan. Ceci pourrait donc compliquer les choses. nous verrons! 


Remarque: Tout noeud ou toute chaîne peut donc être obtenue à partir d'une tresse. 
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Il existe alors de nombreux points de vue possibles, et diverses apparences d'un même noeud. Deux 
noeuds de projections différentes sont-ils distincts (non isotopes) ? Dans la première table publiée (celle de 
Tait et Little) le nombre minimal de croisements est utilisé comme principe de classification (jusqu'à dix 
croisements) et il fallut presque un siècle pour détecter une duplication: deux noeuds identiques avaient 
été pris pour différents. 


En pratique un noeud ressemble plutôt à ceci: 


Figure: ??.19 - Exemple d'un noeud dans la vie réelle 


Mais les mathématiciens ont pris l'habitude de connecter les deux extrémités de la corde pour obtenir ceci: 


Figure: ??.20 - Représentation par un matheux 


donc un noeud est toujours une boucle qui se referme sur elle-même. En d'autres termes, un noeud ouvert 
est toujours équivalent à un noeud fermé: 


sk 
CO) La (& 


Figure: ??.21 - Equivalence entre un noeud ouvert et un noeud fermé 


Un noeud fermé peut paraître différent suivant l'angle sous lequel on le regarde. Ainsi, les deux noeuds 
ci-dessous sont deux représentations du même type de noeud appelé le "noeud de trèfle". 
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Figure: ??.22 - 2 perspectives différentes du noeud de tr 


Nous pouvons également nous poser la question si le noeud de trèfle à gauche et son miroir à droite son 
égaux?! 


Figure: ??.23 - Re miroir du noeud de trèfle 


Figure: ??.24 - Même situation mais en fermant le noeud 


Plus difficile, Perko a montré que ces deux noeuds de la paire dite "paire de Perko", sont en fait le même 
noeud: 


Figure: ??.25 - Exemple d'une paire de Perko 


Il n'est donc pas évident de savoir lorsque deux objets physiques représentent fondamentalement le même 
noeud. Mais, c'est cela qui intéresse les mathématiciens. Plus précisément, ils aimeraient classifier les 
noeuds, c'est-à-dire déterminer tous les types de noeuds qui sont fondamentalement différents et pas 
simplement en apparence (c'est la même idée qu'en topologie ou les mathématiciens ont réussie à 
démontrer que tout volume se réduisait à trois volumes primaires). 
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2.1. GROUPE DE NOEUDS 


Au même titre que nous l'avons fait pour les tresses, regardons si les noeuds forment un groupe? 


Donc nous définissons la multiplication de deux noeuds comme étant l'opération qui consiste 
schématiquement à faire: 


6 -PSS+-69-PSS 


Figure: ??.26 - Rappel de la définition de la multiplication de deux noeuds 
Nous pouvons nous poser la question si cette opération constitue un groupe du type commutatif? 


Commençons par le premier contrôle. Est-ce que cette représentation est associative ?: 
Figure: ??.27 - Vérification de la commutativité de noeuds (par la multiplication) 


La réponse est donc OUI quel que soit le nombre de noeuds! 


Admet-elle un élément neutre?: 


HE HR 
HR - He 


Figure: ??.28 - Vérification de l'existence d'un élément neutre pour les noeuds (par la multiplication) 
La réponse est donc OUI quel que soit le nombre de brins! 


Est-elle commutative?: 
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ea 
Sa: RS-63r 


Figure: ??.29 - Vérifice 1 commutativité de noeuds (par la multiplication) 


» 


Donc contrairement aux tresses OUT! 


Existe-il des éléments inverses (symétriques)?! 


HE - — 


gure: PP. - Vérification de l'existence d'un élément neutre pou les noet (par la multiplic ation) 
et ça c'est une des grandes questions! 


Avec le temps et les efforts des mathématiciens, trois points de vue mathématiques essentiels pour l'étude 
des noeuds se sont dégagés afin de résoudre différents problèmes: 


1. Topologique, où le noeud est conçu comme la réunion d'un nombre fini de courbes fermées, à 
déformations près. 


2. Algébrique, où l'on dénombre des croisements par exemple, et où l'on associe les groupes aux noeuds. 


3. Géométrique, où l'on tient compte de la forme du noeud, en mesurant longueurs ou angles. En 
particulier, l'idée du nombre de rotations apparaît sous la forme de vrillage et de nombre d'entrelacements, 
et ces notions sont fondamentales pour l'étude des ADN en biologie moléculaire. 


L'articulation entre ces points de vue est délicate. Il y a des évidences difficiles à prouver rigoureusement 
— qu'on songe au théorème de Jordan qui affirme qu'une courbe fermée plane, sans croisement, délimite un 
intérieur et un extérieur ! Il a fallu presque deux siècles pour définir correctement la notion de courbe, et il 
y a des noeuds sauvages à écarter avant toute classification. Il faut du soin pour définir correctement les 
déformations des noeuds, que le mathématicien appelle "isotopies". 


L'idée mathématique la plus efficace pour l'étude des noeuds est celle de "noeud invariant". Un invariant 
d'un noeud est une caractéristique (nombre entier, nombre réel, polynôme, groupe...) qui reste inchangée 
lors d'une déformation. Si nous disposons d'un invariant, nous pouvons affirmer que deux noeuds sont 
vraiment différents quand l'invariant ne prend pas la même valeur pour les deux noeuds. Mais si deux 
noeuds ont le même invariant, nous ne pouvons affirmer qu'ils sont du même type (déformable l'un en 
l'autre). Un exemple typique de deux noeuds ayant le même invariant et pour lesquels il n'est pas trivial de 
dire s'ils sont isotopes est le trèfle de droite et celui de gauche lorsque l'invariant choisi est le nombre de 
croisements C(D). Il faudrait pour cela disposer d'un système complet d'invariants. 
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Le mathématicien russe V. Vassiliev a introduit en 1990 une classe nouvelle d'invariants. Il reste à les 
rendre explicitement calculables et à prouver qu'ils forment un système complet, comme on le pense 
généralement. 


Henri Poincaré a introduit vers 1900 la notion de groupe fondamental d'un espace, qui décrit les 
possibilités de parcours avec retour au point de départ. Appliqué à l'espace extérieur à un noeud, cela 
fournit le "groupe du noeud" et le "polynôme d'Alexander" qui lui est lié (voir plus loin dans la partie 
formalisation mathématique). 


La même construction appliquée à ce qu'on appelle l'espace de configuration donne une définition efficace 
des groupes de tresses. Ces groupes ont été introduits, sous une forme intuitive, vers 1920, par le 
mathématicien viennois Emil Artin, un des pères de l'algèbre moderne. Dès 1937, le mathématicien russe 
Markov relie les noeuds et les tresses, et donne une méthode théorique pour définir, au moyen des tresses, 
des invariants des noeuds. 


Il y a 15 ans, les groupes de tresses étaient une curiosité et leur complexité était rebutante. Puis, 
brusquement, ils sont devenus un thème central de la recherche scientifique. Donnons une idée de la 
diversité des points de vue qui mènent aux groupes de tresses: 


1. En géométrie, le mathématicien russe Vladimir Arnold a classifié sous le nom de "catastrophes" des 
singularités de configurations géométriques, qui amènent aux espaces de configuration. 


2. En algèbre, plus précisément dans la théorie des groupes, deux avatars des groupes de tresses (les 
groupes de Coxeter et les algèbres de Hecke) jouent un rôle central. 


3. En mécanique statistique, l'étude des modèles exactement résolubles se fait grâce à l'emploi des 
relations de Yang-Baxter et des groupes quantiques ; le lien avec les groupes de tresses est profond. 


4. La physique à deux dimensions a pris récemment beaucoup d'importance, et on en attend un modèle de 
la supraconductivité à haute température. La classification usuelle des particules en fermions et bosons se 
complique à deux dimensions. La notion nouvelle est celle d'anyon, dont le modèle mathématique est lié 
aux groupes de tresses. 


5. La théorie quantique des champs est le modèle mathématique des particules élémentaires. Edward 
Witten a fait le pont entre cette théorie et les groupes de tresses, via le polynôme de Jones. 


La théorie des noeuds constitue ainsi une interface très active entre physique et mathématiques. Les 
noeuds et les tresses fournissent aujourd'hui un outil de modélisation efficace de la physique des 
polymères aux cristaux liquides, en passant par la biologie moléculaire. Dans la direction opposée, les 
idées importées de la physique ont déclenché une révolution en mathématiques: d'un sujet un peu marginal 
il y a encore 15 ans, la théorie des noeuds est devenue aujourd'hui l'un des grands chantiers 
mathématiques. 


Page: 1145/4839 


[v3.0 - 2013] 


3. NOEUDS DE TAIT 


L'objectif principal de la théorie des noeuds est de classifier tous les noeuds et trouve son origine dans la 


physique au début du 19% siècle comme nous en avons déjà fait mention. Pourquoi ? 


Rappelons qu'à cette époque, les atomes étaient un mystère: pourquoi ceux-ci semblaient-ils 
indestructibles et pourtant existant en tellement de variétés et capables de se combiner pour donner 
d'innombrables autres composants ? 


A cette époque, les plus belles équations de la physique (qui sont souvent de bons candidats pour 
expliquer des choses que nous ne comprenons pas...) étaient les équations de Maxwell, il était alors naturel 
(ou tentant) pour les physiciens d'essayer d'expliquer la mécanique atomique en terme 
d'électromagnétisme, même si nous savons aujourd'hui que cette voie était destinée à l'échec. Plus tard au 
milieu du 19ème, les ondes électromagnétiques étaient largement conceptualisées comme des vibrations 
d'un milieu appelé à l'époque "éther luminophore". Le référentiel de cet éther était alors défini (ou du 
moins supposé) comme étant un référentiel absolu. Mais seulement... plus tard, les expérimentateurs 
Michelson et Morley, montrèrent que le mouvement relatif de notre planète dans cet éther était 
indétectable (et même pire. ils mesurèrent la constance absolue de la vitesse de lumière!). Leurs 
expériences amenèrent par ailleurs Einstein et Poincaré a développer leur fameuse théorie de la relativité 
restreinte (Cf.« ). 


Il était alors à l'époque très gênant de travailler avec le concept suivant: il y a avait des ondes sans rien qui 
ondulaient ! Ceci du au fait, qu'à l'époque, les physiciens avaient fortement tendance à comprendre 
l'électrodynamique avec des analogies mécaniques. Maxwell, par exemple, a passé pas mal de temps à 
conceptualiser les champs électriques et magnétiques en terme de "tubes fins, de section variable, 
transportant un fluide incompressible". Une raison pour cela était la forme des équations de Maxwell dans 
le vide (voir le chapitre d'électrodynamique): 


he es 


VoË=0 VxE-=0 


ce qui est, il est vrai, similaire à la mécanique des fluides (voir chapitre du même nom) où nous avons pour 
un fluide incompressible sans viscosité et sans tourbillons: 


Voÿ=0 Vxÿ=0 
Plus généralement, dans le cas où la rotationnel xÿ est non nul, Helmoltz montra en 1858 que les lignes 
de champ du vortex — définies par les lignes de x - se déplacent dans la direction de ÿ comme si elles 


avaient une existence propre (alors là c'est la brèche ouverte bien évidemment...!). Ces lignes ne pouvaient 
avoir de fin mais pouvaient former des boucles. 


En 1867 le mathématicien P. G. Tait (assistant de Hamilton et un champion des quaternions) trouva une 
méthode ingénieuse pour démontrer cet effet en coupant un trou circulaire dans une boîte, en remplissant 
celle-ci avec de la fumée, et en expulsant ensuite la fumée par compression de l'air dans la boîte formant 
ainsi des cercles de fumée. Il montra par ailleurs ceci à son ami Kelvin qui nota l'analogie avec 
l'électromagnétisme et proposa une théorie dans laquelle les atomes étaient des vortex (noeuds) dans 
l'éther ! Il émit l'hypothèse que les différentes types d'atomes correspondaient a différents types de vortex 
noués (oui c'est un peu tiré par les cheveux mais bon...) ! 


Tait essaya par la suite de classifier (voir tableau plus bas) les lignes nouées en accord avec: 
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1. Le nombre d'entrelacements quand celles-ci sont projetées sur un plan 


2. En ne représentant que les "noeuds premiers" 


Définition: Un noeud peut être compliqué parce qu'il est la succession de noeuds simples: 


Figure: ??.31 - Exemple d'une succession de noeuds sur un noeud ouvert 


Ces noeuds simples (à un brin) peuvent être séparés en coupant la corde: 


Figure: ??.32 - Séparation du noeud 


Un noeud premier est donc un noeud qui ne peut être séparé en noeuds plus simples: couper la corde 
dénoue le noeud. 


Classifier les noeuds c'est donc chercher à déterminer les briques élémentaires: tous les noeuds premiers. 
La liste que Taïit obtint dans un premier temps fut les noeuds suivants (dans l'espoir d'obtenir le tableau 
périodique des éléments version "éther"…) et si nous vous conseillons au besoin de vous munir d'une 
ficelle pour vous assurer qu'ils sont bien premiers (des fois cela est difficile mentalement): 
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Figure: ??.33 - Classification des noeuds de Taïit 


Remarque: 
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R1. Ce tableau est très important nous y ferons très souvent référence lors d'exemples applicatifs en 


utilisant la nomenclature qui y est proposée. 


R2. Les valeurs correspondantes dans le tableau ci-dessus, appelées "mesures de complexité du 
noeud", sont notées (D? en toute généralité où c(D) est le nombre de croisements, c(B) le 


nombre de brins, et Id le numéro d'identifiant du noeud dans la classe c(D). 
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La beauté de cette théorie des "atomes vortex" résidait dans le fait qu'il était en accord avec l'aspect 
continu du monde merveilleux des fluides, ou aux équations de Maxwell par extension, pour discrétiser les 
différentes types d'atomes. Une difficulté cependant avec cette théorie était la remarquable stabilité des 
atomes. En 1905 Kelvin admit qu'après de nombreuses années d'échecs à tenter de prouver que le 
mouvement des cercles de Helmholtz était stable, que la conclusion était que ces cercles étaient 
essentiellement instables et devaient donc se dissiper. Curieusement c'est cette stabilité extrême des 
atomes qui fut une des pièces du puzzle pour construire la physique quantique corpusculaire. 


De plus, avec la théorie de la relativité, le concept d'éther cher à Maxwell et ses contemporains, en 
particulier en ce qui concerne la théorie des noeuds, devint synonyme d'un concept inutile et avec en plus 
la théorique quantique la théorie des atomes vortex fut complètement oubliée. La théorie des noeuds 
ressurgit à cause de quelques conjectures que Tait ne fut pas capable de démontrer (nous y reviendrons) 
qui le furent seulement dans les années 1980 dans un tournant hasardeux de la physique théorique. 


Ce que les physiciens abandonnèrent intrigua et continue d'intriguer les mathématiciens. La question de 
base restant la même: comment pouvons nous dire que deux noeuds sont "isotopes" (nous définirons plus 
loin de quoi il s'agit). Cette question est intimement reliées aux fameuses conjectures de Tait. Pour 
attaquer ces conjectures et les questions basiques de ressemblance des noeuds, les topologistes ont 
développé les noeuds invariants. Un exemple d'un noeud invariant connu et ayant eu beaucoup de succès 
sont les polynômes d'Alexander découverts par J. W. Alexander en 1927 (voir plus loin). Aïnsi, si les 
polynômes de deux noeuds sont différents, ceux-ci ne sont alors pas isotopes. Malheureusement, il existe 
quelques noeuds ayant des polynômes d'Alexander équivalents et qui sont pourtant non isotopes... 


La théorie mathématique des noeuds se développe alors pendant une cinquantaine d'années et était un peu 
tombée en désuétude lors du coup de tonnerre de la découverte par Jones en 1984 d'un nouvel invariant 
des noeuds (le polynôme de Jones). La découverte de Jones est assez exemplaire du point de vue 
scientifique et peut donner lieu à méditation sur l'organisation actuelle de la science. Jones n'était pas du 
tout un spécialiste des noeuds. Il s'intéressait à la classification des facteurs dans les algèbres de Von 
Neumann (analyse fonctionnelle). Il a obtenu des algèbres de matrices dont les relations de commutation 
(équations de Yang-Baxter) étaient proches des relations du groupe de tresses. Des tresses aux noeuds, il 
n'y a qu'un pas qu'il a franchi avec l'aide de Joan Birman qui est une spécialiste des noeuds. 


Nous assistons ensuite à une explosion de découvertes: version purement combinatoire, nouveaux 
polynôme, etc. En 1989, Witten montre que le polynôme de Jones peut être obtenu à partir de la théorie 
quantique des champs au moyen d'une intégrale de Feynman, donnant ainsi la première définition 
n'utilisant pas les projections planes du noeud. D'une certaine façon la théorie de Jones-Witten est une 
extension non commutative du travail de Gauss. Le groupe de Lie ( ) qui 
intervient en magnétisme est U(1), alors que l'invariant de Witten est une intégrale de Feynman sur un 
espace de SU(2)-connections. 


4. FORMALISATION MATHÉMATIQUE 


Un noeud est modélisé mathématiquement par une application injective, différentiable et dont la dérivée 
ne s'annule pas, du cercle dans l'espace orienté de dimension 3 (noeud trivial). 


Les deux problèmes centraux de la théorie des noeuds est de pouvoir décider de façon calculable si le 
noeud est trivial (peut se défaire sans couper la ficelle...) ou non (ce problème n'est pas résolu) et si deux 
noeuds sont vraiment équivalents. 
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Le premier type de problème peut être bien représenté quant au fait de déterminer si le noeud suivant est 
noué ou non... ?: 


Figure: ??.34 - Noeud noué? 


La réponse est non comme le montre la figure ci-dessous (lire de gauche à droite et de haut en bas): 
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2 


Figure: ??.35 - Eh ben non... 


Le but pour le deuxième problème est d'associer aux noeuds des objets mathématiques calculables 
(polynômes, nombres) appelés "invariants du noeud" et qui sont insensibles à une déformation du noeud. 
Si l'invariant n'est pas égal à celui du noeud trivial qui est: 


0) 


CO 


Figure: ??.36 - Noeud trivial 
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nous sommes sûr que le noeud n'est pas trivial. Et par exemple, le noeud non trivial le plus simple est le 
noeud de trèfle: 


31 


& 


Le problème est donc de trouver des invariants assez fins. Nous en décrirons deux: 
1. Le nombre d'entrelacement (de 2 noeuds) du à Gauss et qui intervient en électromagnétisme 


2. Le polynôme de Jones (introduit dans les années 1985 par Vaughan Jones médaille Fields 1990), qui est 
assez subtil pour distinguer par exemple le noeud de trèfle droite du gauche. 


Nous décrirons aussi une classe générale d'invariants: les invariants de type fini ou de Vassiliev. Ces 
invariants définis de façon assez peu constructive sont peut-être des invariants complets, mais nous ne le 
savons pas à ce jour. Nous décrirons le nombre d'entrelacement de 2 noeuds comme un invariant 
combinatoire calculable à partir d'un diagramme des noeuds. Nous écrirons ensuite la formule intégrale 
classique liée au magnétisme (Gauss) pour le calculer. Nous ferons alors un petit détour par la géométrie 
différentielle globale des courbes de l'espace tridimensionnel pour montrer la formule de White qui relie 3 
invariants géométriques associés à un ruban. Nous décrirons ensuite les nouveaux invariants polynomiaux 
d'un point de vue combinatoire. Le point de vue intégrales de Feynman sera évoqué. 


Vassiliev a introduit une famille générale d'invariants qui contient la plupart des invariants connus et dont 
nous pouvons dire qu'ils sont de type fini. Nous en décrirons le principe. 


Remarque: Nous avons délibérément choisi de ne pas énumérer un certain nombre de définitions (aussi 
nombreuses qu'en théorie des graphes) que le lecteur pourra trouver facilement dans littérature ou sur 
Internet. Nous nous permettons de le omettre dans le sens qu'elles ne nous seront pas utiles dans 
l'application de la théorie des noeuds en physique quantique des champs (et que mis à part pour ceux 
qui aiment faire de petits dessins elles sont inutiles). 


Définitions: 


D1. Un noeud peut-être défini (car il existe plusieurs définitions possibles et certaines ont de petits aléas 
assez embêtants.) par l'image du cercle noté $? par une application continue (la ficelle étant supposée 
telle quelle), injective (ceci évitant que la ficelle rentre dans elle-même): 


f:S' = 
autrement dit, c'est une courbe sans point double, tracée dans l'espace euclidien de dimension trois. 


Un noeud est donc représenté par une application injective f € C* ([0.1] R°) (imposer des noeuds de 


classe €? permet d'éviter d'avoir des courbes trop... sauvages) vérifiant que f (0) = f{1) (noeud fermé). 


L'image de f est parfois appelée "support du noeud f": c'est la réalisation "physique" du noeud dans 
l'espace. 
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Remarque: L'ensemble des noeuds sera par la suite noté par la lettre N 


D2. Nous disons qu'un noeud est un "noeud trivial" si l'application f qui le définit se prolonge en une 
application du disque 7? —: JR continue et toujours injective: un noeud trivial est donc un noeud qui bord 
un disque plongé de =. 


D3. Deux noeuds }%,,7, sont équivalents s'il existe une application continue: 
F:[L2]-N (25 
telle que F(1) =», et F(2) = y, . Reste donc à trouver F qui est une courbe dans l'espace des courbes. 


Pour résumer grossièrement.., un noeud est une ficelle dont nous avons soudé les deux extrémités. 


D3. Le c(K) d'un noeud K est le nombre entier naturel représentant le nombre minimum de croisements 
pour tout diagramme d'un type de noeud (c'est une mesure naturelle de complexité). 


® Exemple: 


Le noeud 0, à un c(&K) =c(0,)= 0 nul. Il n'existerait pas de noeuds avec un c(K) est à un ou à l'unité. 


Une preuve consiste à énumérer tous les diagrammes possibles avec un ou deux croisement et de voir que 
ceux sont au fait sont des noeuds équivalents de type 0, ou des entrelacs. Le trèfle (noeud 3) a un 


c(K)=c(3,) =3. 


D4. L'image miroir Æ d'un noeud K est obtenue par réflexion sur un plan dans R3. Le noeud K peut-être 
construit par inversion des croisements du diagramme du noeud: 


XX 


Figure: ??.38 - Image miroir par inversion de croisements 


Nous pouvons facilement nous en convaincre en prenant une réflexion en pliant la page de lecture ou 
encore mieux... en s'équipant du matériel adéquat et d'un miroir (...). 


Exemple: 


Avec le noeud 3 ("trèfle gauche" et "trèfle droite"): 
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OO 


Nous remarquons par ailleurs que dans la table de Taït, les noeuds miroirs distincts ne sont pas 
représentés! 


D5. Deux noeuds sont dits "noeuds isotopes" si nous pouvons passer de l'un à l'autre par des manipulations 
continues (le trèfle gauche et le trèfle droit ne sont par exemple pas isotopes!) et il s'agit du problème 
numéro 1 de la théorie des noeuds: détecter les noeuds isotopes. 


D6 Deux noeuds sont dits "noeuds équivalents" s'ils sont isotopes ou si l'un est isotope à l'image de l'autre 
dans un miroir. D'après ce qui précède, chaque noeud est donc forcément équivalent à sa propre image- 
miroir mais seuls les noeuds réflexifs sont isotopes à leur image dans un miroir. Le noeud en huit 4, est un 


bon exemple de ce genre de noeuds, qui sont par ailleurs assez rares: 


D'É 


D7. Un "entrelac" est une sous-variété ( ) mé ) compacte ( 
ie), de classe € et de dimension 1. 


D8. Le "nombre de composantes connexes" est noté £(Æ). Si c(Æ = 1 nous disons que E est un noeud. 


La plupart du temps les entrelacs seront orientés (( rh ), et nous 
identifierons les entrelacs isotopes. Nous représentons donc les entrelacs dans le plan en les projetant et en 
spécifiant le type de points de croisement. 


Exemple: 


Entrelacs à trois composantes connexes (à gauche) et noeud de trèfle (à droite). 
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< 


Figure: ??.41 - Entrelacs à trois composantes connexes 


Les isotopies permettent de démêler les entrelacs. 


Définition: Une "isotopie" est une opération qui laisse un noeud invariant. En d'autres termes, c'est un 
mouvement du noeud qui ne le déforme/change pas. 


Elles donnent dans le plan trois types de mouvements particuliers appelés "mouvements de Reidemeister": 


Type 1 ND — XKTD — | 
” 
L* 


Type II 


Type III g à 


4 4 


Figure: ??.42 - Représentation des mouvements de Reidemeister 


Il s'agit donc bien de trois opérations simples permettant de changer une partie d'un noeud sans changer la 
nature du noeud lui-même. 


Donc deux diagrammes représentent les mêmes noeuds, si nous pouvons passez de l'un à l'autre par une 
suite finie de mouvements de Reidemeister. Ainsi, avec l'exemple ci-dessous, nous montrons que le noeud 
initial, est équivalent au noeud trivial: 
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E € 


Type II Type II 


ODE 


Figure: ??.43 - Exemple simpliste d'application des mouvements de Reidemeister 


En biologie les brins d'ARN et ADN ainsi que les filaments d'acides aminés s'enroulent selon des formes 
tridimensionnelles complexes (ce sont des tresses fermées: un cas plus général des noeuds). Or, souvent, 
au travers des microscopes, nous ne voyons qu'une projection bidimensionnelle. Les invariants permettent 
de remonter à des informations tridimensionnelles à partir des vues 2D que nous avons: 


D'autre part, les biologistes ont observé des molécules d'ADN nouées et ont constaté que la nature 
topologique de la molécule d'ADN, c'est-à-dire le type de noeud formé par la molécule, influe sur son 
fonctionnement dans les cellules en conditionnant certaines de ses propriétés chimiques. Les virus 
attaquent les cellules pour en changer les longues molécules d'ADN en les nouant de différentes façons. 
En effet, par le biais d'enzymes appelées les topoisamérases, les virus coupent et recollent différemment 
les brins de la molécule d'ADN de telle sorte qu'elles prennent la forme d'un noeud qui peut être très 
complexe. Il s'avère que le type de noeud obtenu est en quelque sorte la carte de visite du virus. Pour 
lutter efficacement contre les virus, il est impératif de reconnaître leur signature par leur action sur l'ADN. 
Par conséquent pour identifier les différents virus il faut pouvoir reconnaître les différents types de noeuds 
et c'est en cela que la théorie des noeuds peut aider le biologiste. 
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Remarque: L'identification du type de noeud en biologie moléculaire a été transformée par des centres 
de recherche en des jeux en ligne dont le but est de mettre la population à contribution de manière 
ludique pour trouver une solution au problème. Cela semble bien marcher puisqu'en fin 2011, des 
joueurs auraient fait une découverte pertinente concernant l'analyse de protéines. 


Il existe également un théorème comme quoi deux entrelacs sont isotopes si et seulement si nous pouvons 
passer de l'un à l'autre par une suite finie de mouvements de Reidemeister. 


Démonstration: À faire avec un lacet... 


OIC.Q.FD. 


D8. Trois entrelacs Æ,,Æ_,Æ; sont dits "entrelacs associés" (ou entrelacs en association") s'ils ne 
diffèrent qu'en un point de croisement et qu'en ce point ils sont dans une des configurations suivantes: 


EN 
# N 


E+ E- Eo 


Figure: ??.45 - Exemples d'entrelacs associés 


Nous notons £ l'ensemble des classes d'entrelacs et nous nous intéressons désormais à des fonctions 
P:E£E — A où À sera un anneau commutatif (le lecteur n'oubliera pas que nous avons vu que les 
coefficients de polynômes sont des éléments d'un anneau). 


Remarque: Il faut aussi se rappeler qu'un noeud est une courbe et que toute courbe peut être 
représentée par un polynôme d'où l'idée! 
D9. P est dit "invariant par association" (par association des entrelacs...) si: 


P(O)=1 (226) 


et s'il existe 4, ,4_,4a, € À inversibles (!) tel que pour tout triplet d'entrelacs associées (£,, É, £,) nous 


ayons: 


a, 


P(E,)+a_P(E )+aP(&)=0 (27) 
Nous pouvons déjà démontrer de façon assez élémentaire que si un tel polynôme existe, alors il est 
uniquement déterminé par les coefficients de la relation précédente. Nous résumons cela dans le théorème 


suivant: Si P est invariant par association, alors il est uniquement déterminé par les coefficients 4, ,4_,a,. 


Démonstration: 


Remarquons d'abord que: 


Page: 1157/4839 


[v3.0 - 2013] 


rl 
vreN P(O") [2e (22.8) 


ä 


où <> désigne le noeud composé de r cercle démêlés. En effet, la relation P(O) =] et la propriété 


d'invariance de P appliquée aux entrelacs suivants: 


Figure: ??.46 - Exemple de notation des démêlés 
donne: 
a, P(O)+a_P(O)+ aÿP(®) =0 (22.9) 


Nous obtenons alors: 


OIC.Q.FD. 


En d'autres termes, la fonction P peut s'exprimer uniquement par ses coefficients !!! Donc nous pourrions 
maintenant essayer de voir si un noeud plein d'entrelacs peut être toujours se ramener à des P(O) de 


manière récursive. 


Remarque: Il fallait y penser cependant... 


4.1. REPRÉSENTATION PLANAIRE 


Nous supposons que le noeud est dans l'espace euclidien de dimension trois orienté. Nous nous intéressons 
aux projections de ce noeud sur le plan z = 0. Il est claire intuitivement que nous pouvons supposer que 
noeud n'a aucune tangente verticale et que les points de croisement sont seulement doubles et 
transversaux. Une telle projection sera appelée "bonne projection". 
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Nous indiquons ensuite à chaque point de croisement quel est le brin qui passe au-dessus de l'autre. Un tel 
dessin représente un noeud de façon non ambiguë: nous disons que nous avons un "diagramme de noeud". 
Bien sûr, deux noeuds équivalents ont des bonnes projections qui donnes des diagrammes de noeuds 
différents en général (c'est là que réside une des difficultés aussi) Il est donc important de pouvoir lire 
l'équivalence de deux noeuds directement sur leurs diagrammes. Un diagramme du noeud du trèfle droit 3 


Figure: ??.47 - Représentation d'un diagramme de noeud 


Remarque: Le noeud de trèfle est le noeud ayant le nombre minimal de croisements, à savoir 3 ; ilen 
existe en fait deux, énantiomorphes (images l'un de l'autre par réflexion). Il s'agit au fait d'un simple 
noeud dont on a soudé les extrémités. Le noeud de trèfle est enfin le bord d'un ruban de Môbius à 3 
demi-torsions ainsi que le noeud torique d'ordre (3,2) (3 enroulements autour du tore, sur deux tours), 
ainsi que celui d'ordre (2,3). 


Comme un dessin n'est pas forcément facile à transmettre, ni à mettre dans un ordinateur, nous pouvons 
aussi donner un codage du diagramme du noeud par une matrice à coefficients entiers à trois lignes et dont 
les nombre de colonnes est égal au nombre de points doubles. 


Nous numérotons les 2n points de croisement sur la courbe fermée (cercle) dans l'ordre où ils arrivent. 
Nous remarquons que les paries sont toutes formées d'un nombre pair et d'un nombre impair. Nous 
fabriquons alors les deux premières lignes de la matrice en mettant dans chaque colonne les deux numéros 
donnant la même projection: les impaires sur la première ligne, les pairs sur la seconde. Nous ajoutons 
alors à chaque colonne, un +1 qui indique l'orientation des 2 brins (orienté) (+1 si celui de dessous 
traverse de droite à gauche quand nous parcourons celui de dessus, -1 sinon). Par exemple, la matrice 
associée au noeud de trèfle de la figure précédente est: 
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Notes personnelles: 
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L'analyse est formulation rigoureuse du calcul différentiel et intégral. (Wikipedia) 


16. ANALYSE FONCTIONNELLE 


Le. fonctionnelle est la branche des mathématiques et plus particulièrement de l'analyse qui 


est en rapport avec l'étude des espaces de fonctions. Elle prend ses racines historiques dans l'étude des 
transformations telles que la transformation de Fourier et dans l'étude des équations différentielles et 
des intégrales. À ce titre elle englobe tellement de domaines qu'il est difficile de justifier qu'elle fasse 
l'objet d'un chapitre car il s'agit plutôt d'un domaine d'études. Par ailleurs, c'est à cause de cette 
difficulté de cerner exactement le domaine qu'elle touche que le lecteur trouvera le théorème 
fondamental de l'analyse dans le chapitre de Calcul Différentiel Et Intégral plutôt qu'ici. 


Pourquoi ceci dit utilisons-nous le terme "analyse" dans le cas particulier des fonctions. La raison tient 
historiquement à l'étude des divers phénomènes de la nature et la résolution de divers problèmes 
techniques et par conséquent de mathématiques, qui nous amènent souvent à considérer la variation 
d'une grandeur en corrélation avec la variation d'une autre ou de plusieurs autres grandeurs. Pour 
étudier ces variations, de nombreux outils sont à la disposition de tout à chacun: 


- L'ingénieur a par exemple fréquemment recours à la représentation graphique (système d'axes 
cartésien, polaire, logarithmique.. concepts sur lesquels nous reviendrons plus en détail) pour 
déterminer la relation (ou "loi") mathématique qui lie les différentes grandeurs entre elles. Certes, ce 
genre de méthode est (parfois...) esthétique mais les étudiants savent bien combien il est parfois pénible 
en laboratoire de devoir porter des points sur une feuille de papier ou à l'ordinateur. C'est 
malheureusement une étape nécessaire (mais dont il faudrait éviter de faire une utilisation abusive) 
pour comprendre comment nos prédécesseurs travaillaient et ont obtenu les résultats qui nous aident 
aujourd'hui dans nos avancées en physique théorique. 


- Le mathématicien et le physicien théoricien ont habituellement horreur d'avoir recours aux méthodes 
papier-crayon-gribouillage. Quoi qu'il en soit, le rôle du mathématicien ou du physicien est de 
développer de nouvelles théories à l'aide d'axiomes ou de principes mathématiques ce qui ne devrait 
nécessiter aucunement le recours à la représentation graphique et à l'accès aux mesures expérimentales 
qui y sont souvent rattachées. 


Remarque: Avant de commencer la lecture de ce qui va suivre, il peut être utile de rappeler au 
lecteur que la définition du concept de "fonction" (et les propriétés élémentaires y relatives) est 
donné dans le chapitre de Théorie Des Ensembles. 


1. REPRÉSENTATIONS 


Nous allons voir dans ce qui va suivre, dans un premier temps, comment représenter différentes 
grandeurs liées de façon tabulaire et graphique (eh oui! il faut bien car cela aide à comprendre) et 
ensuite comment analyser mathématiquement les propriétés de ces représentations uniquement à l'aide 
d'outils mathématiques abstraits. 


Définition: Une fonction est dite "fonction univalente", si le nombre de ses arguments (paramètres ou 
variables) est égal à un. Dans le cas d'une fonction à deux arguments, nous parlons de "fonction 


bivalente", etc. 
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1.1. REPRÉSENTATION TABULAIRE 


Parmi les modes de représentation visuelle des fonctions, la plus intuitive et la plus ancienne est celle 
où nous disposons dans la colonne ou la ligne d'un tableau de façon ordonnée les valeurs de la variable 
indépendante x,,x,,...,x, et les valeurs correspondantes, dites "variables transformées" de la fonction 


M:Y2,..,Y, dans une autre colonne ou ligne alignée. 


Telles sont par exemple, les tables des fonctions trigonométriques, les tables logarithmiques, etc. et au 
cours de l'étude expérimentale de certains phénomènes des tables qui expriment la dépendance 
fonctionnelle existant entre des grandeurs physiques mesurées telles que les relevés de la température 
de l'air enregistrés dans une station météorologique durant une journée. 


Bien évidemment, ce concept est généralisable à toute fonction multivalente quel que soit son ensemble 
de définition. 


Cependant, cette méthode est laborieuse et ne permet pas de voir directement le comportement de la 
fonction et donc une analyse visuelle simple et intéressante de ses propriétés. Elle a pour avantage 
quand même de ne pas nécessiter d'outils spéciaux ou de connaissances mathématiques poussées. 


1.2. REPRÉSENTATIONS GRAPHIQUES 


Les nombres naturels, relatifs, réels ou purement complexes (cf. chapitre sur les Nombres) peuvent tous 
être représentés le plus simplement du monde par des points sur un axe numérique (ligne droite) infini. 


Pour ce faire, nous choisissons sur cet axe: 
1. Un point O appelé "origine" 
2. Un sens positif, que nous indiquons par une flèche horizontale 


3. Une unité de mesure (représentée habituellement par un petit trait vertical: la "graduation") 


Tel que: 
—C0 Ô +C0 
Figure: 16.1 - Exemple type de représentation d'un axe infini orienté avec origine 


Le plus souvent nous disposons (par tradition) l'axe horizontalement et choisissons la direction de 
gauche à droite. 


Remarque: Le point (lettre) O, représente très fréquemment le nombre zéro en mathématiques mais 
nous pourrions très bien choisir de mettre l'origine ailleurs. Par exemple, en physique le point O est 
souvent positionné à l'emplacement du barycentre d'un système. 


Il est évident que le fait que les ensembles de nombres dont nous avons parlé sont ordonnés implique 
que tout nombre est représenté par un seul point de l'axe numérique. Ainsi, à deux nombres réels 
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distincts correspondent deux points différents de l'axe numérique. 


Ainsi, il existe une correspondance biunivoque entre tous les nombres et tous les points de l'axe 
numérique (dans le cas des nombres réels ou complexes, il correspond non pas un nombre à chaque 
graduation mais un nombre à chaque point de l'axe). Ainsi, à chaque nombre correspond un point ou 
une graduation unique et inversement à chaque point ou graduation correspond un seul nombre dont il 
est l'image. 


1.2.1. REPRÉSENTATIONS PLANES 


Il existe outre les représentations unidimensionnelles d'autres de dimensions supérieures (ouf!) qui nous 
permettent de tracer non plus que des simples points sur une droite unidimensionnelle mais des 
fonctions d'une variable. Voyons de quoi il s'agit: 


Nous pouvons à chaque valeur d'une variable x reportée sur un axe horizontal, appelé "axe des 
abscisses" ou "axe des x", faire correspondre une valeur y au travers d'une fonction f: 


y=f(@) (6.1) 


reportée sur un axe vertical, appelé "axe des ordonnées" ou "axe des y" qui passe par le croisement 
défini par l'origine O tel que (exemple arbitraire): 


y 
( | GO DER CRE CEE Ya) 
II 05 I - 
| | L 
| E \ 
| | 
| | [ 
+ = 4e = — + PNR CRETE GE SRE ES < 
« z 4 10 
| 
I | 
| 
| | 0 ce 
ui IV. 


Figure: 16.2 - Exemple type d'une représentation plane avec axes orthogonaux, origine et quadrants 


L'ensemble des points du plan noté sous les variantes XOY, XY ou encore xOy, Oxy, xy, dont les 
abscisses représentent par tradition les valeurs de la variable indépendante et les ordonnées les valeurs 
correspondantes de la fonction, est appelé "graphique plan" de cette fonction. S'il n'y a pas de 
confusion possible, nous dirons simplement "graphique". 


Dans le cas d'une représentation par un système de coordonnées rectangulaires (cartésien, polaire ou 
logarithmique) comme la figure ci-dessus, nous pouvons observer que l'ensemble du plan des 
coordonnées est séparé en quatre surfaces que nous avons pour habitude d'appeler "quadrants". 
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Remarque: Lorsque nous souhaitons mettre en évidence un point particulier de la fonction 
représentée, nous y dessinons un petit rond tel que présenté ci-dessus. 


Un autre cas classique de représentation graphique plane connu par un grand nombre d'étudiants est le 
tracé des polynômes (cf. chapitre de Calcul Algébrique) à coefficients réels. 


Effectivement, pour résoudre les équations polynômiales du second degré (cf. chapitre de Calcul 
Algébrique), il est fréquent dans les petites classes que le professeur demande en plus à ses élèves de 
donner une expression algébrique des racines de: 


> = f(? =ar +bx+c=0 (162) 


données par, rappelons-le: 


_ —È +4? - 4ac (16.3) 


* 
2 
’ 24 


une résolution graphique où les deux racines (dans le cas où il y en a deux distinctes réelles) sont 
données par l'intersection de la parabole avec l'axe des abscisses (bien évidemment, si l'équation n'a pas 
de solutions, il n'y a pas d'intersections.….): 


Figure: 16.3 - Représentation des racines sur un graphe planaire 


La représentation graphique étant généralisable aux équations polynomiales du 3ème, 4ème et 5ème 
degré (nous démontrerons bien plus loin, à l'aide de la théorie de Galois qu'il n'est pas possible d'obtenir 
une expression algébrique générale des racines d'une équation polynomiale du 5ème degré et 
supérieur). 


De même, les graphiques sont un outil qualitatif puissant dans le domaine des statistiques (cf. chapitre 
de Statistiques) comme point de départ de l'analyse de données (histogrammes, fromages, boîtes à 
moustaches, radars, nuages de points.…). Les hypothèses et idées qui sont générées par l'analyse 
graphique peuvent être investiguées avec des outils statistiques avancés. 


Voici par exemple un graphique (histogramme) pris du chapitre de Génie Industriel très courant dans le 
domaine des statistiques et de la gestion de projets dans l'industrie mondiale: 


[v3.0 - 2013] 


L 


Voix du client 
{étendue) 


Voix du processus 
{six sigma) 


Limite de tolélance 
450% 


3 


! 
-40%  -20%; 3 150% 680% 100% 


Variation des délaisicoûts en % de la planification initiale 


100%  -60%  -60% 


= 


Figure: 16.4 - Exemple d'histogramme typique dans les entreprises d'ingénierie (Six Sigma) 


Les histogrammes permettent d'observer les distributions et de décider de manière qualitative si elle 
s'ajuste à un modèle théorique particulier. 


Les graphiques peuvent permettre également d'observer les changements au cours du temps de (séries 
temporelles, cartes de contrôle): 


Moyenne Mobile 
courte (MMC=5 


N Moyenne Mobile 


longue (MML=100). 


Figure: 16.5 ; Exemple de série temporelle avec des moyennes mobiles dans la négoce financière 
et encore à bien d'autres choses. que nous verrons tout au long des pages de ce site Internet. 
1.2.2. REPRÉSENTATIONS 3D 


Bien évidemment, dans le cas d'une fonction trivalente (tridimensionnelle), c'est-à-dire dont un 
paramètre dépend de deux autres, le principe reste le même à la différence que le nombre de quadrants 
double. 
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Cette méthode de représentation et d'analyse d'une fonction trivalente était longue à mettre en place il y 
a une dizaine d'années mais avec l'aide des ordinateurs en ce 21ème siècle ce problème (de temps) est 
assez bien résolu... 


Ce type de représentation est suffisamment important en physique appliquée pour que nous nous y 
arrêtions un instant en faisant des exemples typiques sur plusieurs pages, des commandes les plus 
importantes avec Maple (même s'il existe de nombreux ouvrages sur le sujet c'est trop important pour 
que nous omettions ces exemples). 


Ce que nous allons représenter, les mathématiciens puristes le noteraient formellement d'abord de la 
manière suivante (c'est bien d'avoir vu au moins une fois cette notation car vous pourriez la rencontrer 
dans d'autres ouvrages): 


f:RxR—R 


12x 
IRIS (069 
(l+x° +y°| 


(x,yie[-10,+10]x[-5,#] 
et voyons ce que cela donne donc avec Maple: 


> restart; 
> with(plots): 


Nous prenons une fonction 3D quelconque: 
> = (x, y)->12*x/(1+x/2+y/2); 

Nous définissons le domaine d'analyse: 

> xrange:=-10..10;yrange:=-5..5; 

et nous faisons un plot simple: 


> plotäd(f,xrange,yrange); 
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Figure: 16.6 - Exemple de représentation filiaire d'une fonction 
Améliorons un peu l'aspect: 
> plot3d(f,xrange,yrange, style=patchnogrid, grid=[80,501], shading=ZHUE, axes-FRAME, tickmarks= 


[3,3,3], labels=[ x", y , f(x,y) |, labelfont-[TIMES,BOLD, 121, title=" Graphique rempli’, titlefont= 
[TIMES,BOLD,12], scaling=unconstrained, orientation=[-107,68]); 


fG;y) 0 


0 
5 10 x 


Figure: 16.7 - Représentation coloriée (gradients) d'une fonction 
Traçons les courbes de niveau (cf. chapitre de Géométrie différentielle): 


> plot3d(f,xrange,yrange,style-patchcontour); 
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Figure: 16.8 - Représentation des courbes de niveau (isoclines) d'une fonction 
Ce n'est pas très beau donc améliorons cela: 


> plot3d(f,xrange,yrange,style-patchcontour,contours-[seq(-7+k/4,k=0..60)],grid= 
[80,50],shading= ZHUE,axes-FRAME, tickmarks=[3,3,3], scaling=unconstrained,orientation= 
[-107,68]); 


5 410 
Figure: 16.9 - Représentation des gradients et isoclines d'une fonction 


Avec une petite rotation pour voir du dessus: 
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> plot3d(f,xrange,yrange, style=patchcontour, contours=[seq(-7+k/4,k=0..60)], grid=[80,501, 
shading=ZHUE, axes-FRAME, tickmarks=[3,3,3], scaling=unconstrained, orientation=[-90,0]); 


-10 (a 10 


Le] 


Figure: 16.10 - Représentation planaire des isoclines et des gradients 


Et en coupe: 


> plot(f(x,2),x=xrange); 
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Figure: 16.11 - Représentation en coupe d'une fonction 


Ou avec des coupes multiples: 


>display([seq(plot(f(x,y),x=xrange),y=yrange) |); 


Page: 1174/4839 


[v3.0 - 2013] 


-6 
Figure: 16.12 - Représentation de coupes multiples d'une fonction 


Le lecteur pourra aussi animer le précédent graphique avec la commande suivante: 


> display([seq(display([plot(f(x,k/5),x=xrange), 
textplot([6,5,cat( y=",convert(evalf(k/5,2),string))],font- 
[TIMES,BOLD,16])1),k=-25..25)],insequence=true, title=" Animation ,titlefont-[TIMES,BOLD, 18]); 


voilà pour un exemple typiquement simple des manipulations standard d'un ingénieur dans l'entreprise 
utilisant des graphiques. 


1.2.3. REPRÉSENTATIONS VECTORIELLES 


Il est aussi fréquemment fait usage des représentations graphiques dans le cadre de la géométrie 
analytique pour simplifier les analyses ou faire des démonstrations de théorèmes connus sous forme 
visuelle (il faut cependant ne pas en abuser!). 


Ainsi, nous pouvons introduire par exemple le concept de norme (cf. chapitre de Calcul Vectoriel) de 
manière simpliste en représentant graphiquement la distance entre deux points et en appliquant le 
théorème de Pythagore (cf. chapitre de Géométrie Euclidienne) qui sera supposé connu. 


Ainsi, représentons trois points #,Æ,Æ sur un graphique plan dans lequel a été défini un repère tel que 
présenté dans le graphique ci-dessous: 
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Figure: 16.13 - Mise en situation de 3 points dans un plan 


Si x, “x, et », # y, (comme sur la figure ci-dessus), les points Æ,£2,2 sont les sommets d'un triangle 
rectangle. Par application du théorème de Pythagore (cf. chapitre de Géométrie Euclidienne): 


[4(R,B)F =[d(8,B)F +[d(8,B)F (65) 
Sur la figure, nous voyons que: 


d(B,8)=-|2-xlet d(8,B)=lm -»%| (66) 


Puisque | xf = x? Yxe IR, nous pouvons écrire: 


d(B,B) = 40 2) +O3-n) (67 


Si x = », = 0, nous nous retrouvons avec une relation appelée "norme", "module" ou encore 


"distance" que nous avions déjà définie dans le cadre de notre étude de l'analyse vectorielle (cf. 
chapitre de Calcul Vectoriel). 


Bien évidemment, si nous considérons deux points Æ(x,»,),Æ(x;,3,), nous pouvons déterminer si un 
troisième point 2(zx,,7,) est sur la médiatrice (cf. chapitre de Géométrie Euclidienne) des deux 
premiers et qu'il suffit pour cela que bien évidemment (par définition même de la médiatrice): 


d(B,B)=d(P,8) (16) 


Comme (x,»),(x;,y,) Sont connus, nous pouvons facilement exprimer une "expression analytique" 


de la médiatrice du type: 
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(% -x) + -y,) = (x -x) + (32 - 3) 


2 2 2 2 
(x - x) +(m =») “ (x -%) +0» =») 
H-2natR+tN-DRIN = 0-22n+ # 1-2 
2)3}3 7 2M}3 = % — 232%; + yi - +2x%% — . (16.9) 
Y3202 = 1) = 2 - 2)2 + Œ S * +y =) 
GG). 5 (G en tn pi] 
(a 7H) Ê 203 — M) 
y; = ax; tb = f(x) 


Je 


où a, b sont des constantes et où tout point qui satisfait cette relation, qui est en l'occurrence l'équation 
d'une droite, se trouve sur la médiatrice. 


Par ailleurs, il est aisé de visualiser que le point milieu du segment de droite est donné par: 
XA TZ + 
M = A ii #3, (16.10) 
, 2 
Donc nous voyons qu'avec une simple représentation graphique, nous pouvons obtenir des résultats qui 


sont parfois (...) plus évidents pour les étudiants. 


Profitons de cet exemple pour définir quelques concepts sur lesquels nous reviendrons et faire quelques 
rappels. 


Définition: Toute fonction de la forme d'un polynôme (cf. chapitre de Calcul Algébrique) de degré 1 à 
coefficients réels constants: 


f()=y=ax+b (16.11) 


est l'expression analytique de ce que nous appelons une "droite" de "pente" a et "d'ordonnée à l'origine" 
b (quand x =0). 


Bien évidemment, si: 
f{x)=y=b (16.12) 


la droite est horizontale si nous la représentons graphiquement puisque y est constant pour tout x et 
vaut alors b. Inversement, si: 


fO)=x=a (16.13) 
la droite est une verticale. 
1.2.4. PROPRIÉTÉS DES REPRÉSENTATIONS GRAPHIQUES 


Selon le type de graphique que nous visualisons (en particulier les graphiques plans) il est possible 
d'extraire certaines propriétés de base. Voyons les plus importantes à connaître pour les graphiques 


plans d'une fonction à une variable: 
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y = f(x) (6.14) 


P1. Le graphique d'une fonction est symétrique par rapport à l'axe des ordonnées si le changement de 
xen-x ne modifie pas la valeur de l'équation tel que: 


Ÿ 


Figure: 16.14 - Exemple de symétrie par l'axe des ordonnées d'une fonction 


P2. Le graphique d'une fonction est symétrique par rapport à l'axe des abscisses si le changement de 
yen -y ne modifie pas la valeur de l'équation tel que: 


Y 
: (x, Y) 


1 (x, y) 


Figure: 16.15 - Exemple de symétrie par l'axe des abscisses d'une fonction 


P3. Le graphique d'une fonction est symétrique par rapport à l'origine si le changement simultané de 
yen-yet de x en -x ne modifie pas la valeur de l'équation tel que: 
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Figure: 16.16 - Exemple de symétrie par l'origine d'une fonction 


P4. Soit une fonction y = f(x), si nous ajoutons une constante -* > (Q à cette fonction tel que nous 
écrivions: 


y = f{x)+c* (16.15) 


alors le graphique de f est déplacé (ou "translaté") verticalement vers le haut d'une distance -* tel que 
présenté sur la figure suivante: 


ee 


v= f@)+c" 


Figure: 16.17 - Exemple d'une translation verticale positive d'une fonction 


Et inversement si -* > Q mais que: 


y=f(2-c* (16.16) 


alors le graphique est bien évidemment translaté verticalement vers le bas: 
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4 


Figure: 16.18 - Exemple d'une translation verticale négative d'une fonction 


Nous pouvons aussi envisager des translations horizontales de graphiques. Précisément, si -* > 0, alors 
y = f(x) est translaté horizontalement vers la droite si nous écrivons: 


y = f{x-c"*) (16.17) 


ce qui graphiquement est représenté par: 


Le 


Figure: 16.19 - Exemple de translation horizontale négative d'une fonction 


et inversement, translaté horizontalement vers la gauche, si nous écrivons: 
y= Fix +c*) (16.18) 


comme le montre le graphique ci-dessous: 
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ÿ 


>= fac") = f(x) 


Figure: 16.20 - Exemple de translation horizontale positive d'une fonction 


Pour étirer ou comprimer verticalement un graphique, il suffit de multiplier la fonction y = f(x) par 
une constante -* » 1 et respectivement ( 4 £# € 1 tel que: 


y=c*f(x) (16.19) 


ce que nous pouvons représenter graphique par: 


Figure: 16.21 - Exemple d'aplatissement vertical d'une fonction 


et: 


Figure: 16.22 - Exemple d'étirement vertical d'une fonction 
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Pour étirer ou comprimer horizontalement un graphique, il suffit de même, de multiplier la fonction 
y = f(x) par une constante -* > 1 et respectivement (9 < £#“ < 1 ou tel que: 


y = f(c*x) (16.20) 


ce que nous pouvons représenter sous forme graphique: 


Y 


és Si Ci | 


Figure: 16.23 - Exemple d'étirement horizontal d'une fonction 


et: 


Figure: 16.24 - Exemple d'aplatissement horizontal d'une fonction 


Remarque: Translater, étirer, comprimer un graphique ou lui faire subir une symétrie, c'est le 
transformer. Le graphique résultant de ces transformations est appelé le "transformé" du graphique 
de départ. 


Définitions: Nous disons qu'une fonction f est: 


- Une "fonction croissante" ou "fonction croissante au sens large" sur I si pour tout couple (x,,x,), 


d'éléments de I tels que x, £x;,, nous avons f (x }< f (x,)}. Ce que nous notons de manière 


condensée: 
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(V(r)e Paxsy)= f GS FO) (16.21) 


- Une "fonction décroissante" ou "fonction décroissante au sens large" sur 1 si pour tout couple (x ,%) 
, d'éléments de I tels que x <x,, nous avons f(x} f (x). Ce que nous notons de manière 


condensée: 


(V(r)e Pnarsy)= f@2 F0) (16.22) 


Remarque: Une "fonction est monotone" ou "fonction monotone au sens large" sur I si elle est 
croissante ou décroissante. 


-Une "fonction strictement croissante" sur I si pour tout couple (x ,%) , d'éléments de I tels que 


# <2%, nous avons f (x) < f (x,)}. Ce que nous notons de manière condensée: 


(V(xy)e Pnx <y) = f(x) <f(y) (1623) 


- Une "fonction strictement décroissante" sur I si pour tout couple (x ,X2 ) , d'éléments de I tels que 


* <2, nous avons f {x} > f (x, ). Ce que nous notons de manière condensée: 
(V(xy)e ÊnAx <y) = f(x)> FO) (1624) 


Remarque: Nous disons qu'une "fonction est strictement monotone" sur J si elle est strictement 
croissante sur 1 ou strictement décroissante sur I. 


1.3. REPRÉSENTATIONS ANALYTIQUES 


Le mode de représentation analytique est de loin le plus utilisé et consiste à représenter toute fonction 
en une "expression analytique" qui est la notation mathématique symbolique et abstraite de l'ensemble 
des opérations mathématiques connues que l'on doit appliquer dans un certain ordre à des nombres et 
des lettres exprimant des grandeurs constantes ou variables que nous cherchons à analyser. 


Remarquons que par ensemble des opérations mathématiques connues, nous envisageons non 
seulement les opérations mathématiques vues dans la section arithmétique (addition, soustraction, 
extraction de la racine, etc.) mais également toutes les opérations qui seront définies au fur et à mesure 
dans le présent site internet. 


Si la dépendance fonctionnelle y = f(x) est telle que f est une expression analytique, nous disons alors 


que la "fonction y de x" est "donnée analytiquement". Voici quelques exemples d'expressions 
analytiques simples: 


* xri ” 
=x-2,py=—,y=,/f-32 (6.25) 
ÿ 21 7 


Lorsque nous avons déterminé l'équation de la médiatrice, nous avons obtenu une expression 
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analytique de la droite visuelle qui la caractérise sous la forme d'une fonction du type: 


LfG)=y=ax+b] (1626) 


LEA 


qui rappelons-le, est donc l'expression analytique l'équation d'une droite, appelée également "équation 
linéaire" ou "fonction affine", sur un plan dont deux points Æ(x,»),Æ(x,,7,) sont connus, la pente 


est donnée par le rapport de l'accroissement vertical sur l'accroissement horizontal tel que: 


XL} 


Une application sympathique et triviale consiste à démontrer analytiquement que deux droites non 
verticales sont parallèles si et seulement si elles ont la même pente. Ainsi, soit deux droites données par 
les équations: 


“axth Ya =axtb, (16.28) 


Les droites se coupent en un point (x, y) si et seulement si les valeurs de y sont égales pour un certain x, 
c'est-à-dire: 


axtàh =a,x+b, 
(16.29) 
— (à -4)x =, à 


La dernière équation peut être résolue par rapport à x si et seulement si 4, -a4, * 0. Nous avons donc 
montré que les droites y,,y, se coupent si et seulement si 4, # 4,. Donc, elles ne se coupent pas (elles 


sont parallèles) si et seulement si 4, = &,. 


De façon assez simple en appliquant le théorème de Pythagore, il n'est pas compliqué de déterminer 
que l'équation d'un cercle de centre C(h, k) a pour équation (nous avons pour habitude en 
mathématiques de ne pas expliciter y pour l'équation du cercle ainsi, l'équation de ce dernier est 
visuellement beaucoup plus esthétique et parlante) 


r = af + GA) (620) 


Dans ces exemples les fonctions sont exprimées analytiquement par une seule formule (égalité entre 
deux expressions analytiques) qui définit dans un même temps le "domaine naturel de définition" des 
fonctions. 


Définition: Le "domaine naturel de définition" d'une fonction donnée par une expression analytique est 
l'ensemble des valeurs x pour lesquelles l'expression du membre de droite a une valeur bien déterminée. 


Par exemple, la fonction: 


_xtl 


x 


Y (16.31) 


est définie pour toutes les valeurs de x, excepté la valeur x = 1 où nous avons une singularité (division 
par Zéro). 
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Remarque: Il existe une infinité de fonctions et nous ne pouvons toutes les exposer ici, cependant 
nous en rencontrerons plus d'un millier sur l'ensemble du site et cela devrait amplement suffire à se 
faire une idée de leur étude. 


2. FONCTIONS 
Définitions: 


D1. Nous disons que y est une fonction de x et nous écrirons y = f(x), y = gx), etc., si à chaque 
valeur de la variable x appartenant à un certain domaine de définition (ensemble) D, correspond une 
valeur de la variable y dans un autre domaine de définition (ensemble) E. Ce que nous notons: 


u  . 
DE jf:DSE (16.32) 
La variable x est appelée "variable indépendante" ou "variable d'entrée" et y "variable dépendante". 


La dépendance entre les variables x et y s'appelle une "dépendance fonctionnelle". La lettre f, qui entre 
dans la notation symbolique de la dépendance fonctionnelle, indique qu'il faut appliquer certaines 
opérations à x pour obtenir la valeur correspondante y. 


Nous écrivons parfois: 
Y=y(x) (16.33) 
au lieu de: 
y = f(x) (16.34) 
Dans ce dernier cas la lettre y exprime en même temps la valeur de la fonction et le symbole des 


opérations appliquées à x. 


Remarque: Comme nous l'avons vu lors de notre étude du chapitre de Théorie Des Ensembles, une 
application (ou fonction) peut-être injective, bijective ou surjective. Il convient donc que le lecteur 
pour qui ces notions ne sont pas connues aille en priorité lire ces définitions. 


D2. L'ensemble des valeurs x pour lesquelles la valeur de la fonction y est donnée par la fonction f(x) 
est appelé "domaine d'existence" de la fonction (ou domaine de définition de la fonction). 


D3. La fonction y = f(x) est dite "fonction croissante" si à une plus grande valeur de la variable 
indépendante correspond une plus grande valeur de la fonction (de l'image). Nous définissons de 
manière analogue mais inverse la "fonction décroissante". 


D4. Une "fonction constante" est une fonction pour laquelle à toute valeur de la variable indépendante 
correspond toujours une même image constante. 


D5. La fonction y = f(x) est dite "fonction périodique" s'il existe un nombre constant -* tel que la 
valeur de la fonction ne change pas quand nous ajoutons (ou que nous retranchons) le nombre -* à la 
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p=f{xte")= f(x) (16.35) 


Ce qui correspond à une translation selon x. La plus petite constante satisfaisant à cette condition est 
appelée "période" de la fonction. Elle est fréquemment notée T en physique. 


D6. En calcul différentiel et intégral, l'expression: 


JG Th) f(x) 
À 


(16.36) 
avec # # 0 est d'un intérêt particulier. Nous l'appelons un "quotient d'accroissement" (nous reviendrons 
beaucoup plus en détail sur ce sujet lors de notre étude du calcul différentiel et intégral). 


D7. Nous utilisons certaines propriétés des fonctions pour faciliter leur représentation graphique et leur 
analyse. En particulier, une fonction f(x) est dite "fonction paire" si: 


fG@)=f(C-2) (6.37) 

pour tout x dans son domaine de définition. Une fonction est dite "fonction impaire" si: 
fC2x)=-f(x) (16.38) 

pour tout x dans son domaine de définition. 


Ainsi, pour résumer une fonction paire est une fonction qui ne dépend pas du signe de la variable et une 
fonction impaire change de signe quand nous changeons le signe de la variable (la spirale de Cornus 
dans le chapitre de Génie Civil est un bon exemple pratique de fonction impaire). Ce concept nous sera 
très utile pour simplifier certaines expressions très utiles en physique (comme les transformées de 
Fourier des fonctions paires ou impaires par exemple ou encore le calcul de certaines intégrales!). 


Montrons maintenant que toute fonction f(x) est la somme d'une fonction paire g(x) et d'une fonction 


impaire h(x). 


Remarque: Ce type de théorème qui consiste à relier un concept général par un cas particulier et 
son opposé se retrouve souvent en mathématiques. Nous retrouverons de tels exemples en calcul 
tensoriel avec les tenseurs symétriques et antisymétriques (cf. chapitre de Calcul Tensoriel) ou 
encore en physique quantique avec les opérateurs hermitiques et antihermitiques (cf. chapitre de 
Physique Quantique Ondulatoire). 


Démonstration: 
Posons: 

(x) = gx) + (x) (16.39) 
alors: 


JÉ-x) = gx) -h(x) (16.40) 


Page: 1186/4839 


[v3.0 - 2013] 


Si nous sommons, nous avons dès lors: 


(16.41) 


gt = LOYER 


et en soustrayant: 


(16.42) 


ht) = L® SCD 


Il existe donc bien une décomposition paire et impaire de toute fonction. 


OIC.Q.F.D. 


Enfin, il est important de remarquer que: 

- Le produit de deux fonctions paires est une fonction paire 

- Le produit deux fonctions impaires est une fonction paire 

- Le produit d'une fonction paire et impaire est une fonction impaire 


Voyons la brève démonstration pour la dernère propriété car nous en aurons besoin dans la section de 
Géométrie. 


Soient g une fonction paire et h une fonction impaire telles que: 


g(-x)= g(x) 
h-x) = -h(x) 


(16.43) 


Dès lors: 


gx) = Cr) = 8-42) = -g(x)4CX) = 902) (16.44) 


D8. De façon générale, si f(x) et g(x) sont des fonctions quelconques, nous utilisons la terminologie et 
les notations données dans le tableau suivant: 


Terminologie Valeur de la fonction 
Somme jf +g (f + g)(x) = f(x) + gx) 
Différence f -g (f — g)(x) = f(x) - gx) 
Produit f:g | (Y'en = fe) 
Quotient Î (£) (x) = AG] 
g £ g(x) 


Tableau: 16.1 - Terminologie concernant les fonctions 


Les domaines de définition de f +g, f -g, f ' g sont l'intersection 1 des domaines de définition de 
f() et de g(x), c'est-à-dire les nombres qui sont communs aux deux domaines de définition. Le domaine 


Page: 1187/4839 


[v3.0 - 2013] 


de définition de f : g”!est quant à lui le sous-ensemble de I comprenant tous les x de I tels que 
g(x) #0. 


D9. Soit y une fonction f de u et u une fonction g de la variable x, alors y dépend de x et nous avons ce 
que nous appelle une "fonction composée" et que nous notons: 


y = f(g(@x)) ou (fog)(x) (16.45) 


Pour la dernière notation, il faut lire "f rond g" et ne pas confondre le "rond" avec la notation du 
produit scalaire que nous verrons lors de notre étude du calcul vectoriel (Cf. chapitre de Calcul 
Vectoriel). 


Le domaine de définition de la fonction composée est soit identique au domaine tout entier de 
définition de la fonction # = g{x), soit à la partie de ce domaine dans laquelle les valeurs de u sont 
telles que les valeurs correspondantes f(u) appartiennent au domaine de définition de cette fonction. 


Le principe de fonction composée peut être appliqué non seulement une fois, mais un nombre arbitraire 
de fois. 


Si x ne dépend pas d'une autre variable (ou qu'elle n'est pas elle-même une fonction composée), nous 
disons alors que g{x) est une "fonction élémentaire". 


Les principales fonctions élémentaires sont des fonctions dont l'expression est l'une des suivantes: 


1. La "fonction puissance": 
f{x)= 2" (6.46) 


où m est un nombre positif différent de 1 (sinon il s'agit d'une fonction linéaire). 


Figure: 16.25 - Différents tracés d'une fonction puissance simple 


2. La "fonction exponentielle": 
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y=a" (16.47) 


où a est un nombre positif différent de 1. 
3. La "fonction logarithmique": 
y =log,(x) (16.48) 


où la base du logarithme est un nombre positif a différent de l'unité (cette fonction sera définie 
rigoureusement un peu plus loin). 


Remarque: Les fonctions exponentielles et logarithmiques sont appelées parfois des "fonctions 
transcendantes". 


4, Les “fonctions trigonométriques" (cf. chapitre de Trigonométrie): 
y = sin(x), y = cos(x),y = tan(x),y = cot(x), y = sec(x),y = cosec(x)… (16.49) 
5. Les "fonctions polynomiales": 
y=ar +a. x" +.+ax +a (16.50) 


OÙ 4,&,...,4, SOnt des nombres constants appelés coefficients et n est un entier positif que nous 


appelons "degré du polynôme" (cf. chapitre de Calcul Algébrique). Il est évident que cette fonction est 
définie pour toutes les valeurs de x, c'est-à-dire qu'elle est définie dans un intervalle infini. 


6. Les "fractions rationnelles" qui sont des divisions de polynômes (cf. chapitre de Calcul Algébrique): 


#-l 
Lx tx +..+a, 


a  —  — (16.51) 
GA FOX th 


F 


Remarque: Deux fractions rationnelles sont égales, si l'une s'obtient de l'autre en multipliant le 
numérateur et le dénominateur par un même polynôme. 


7. Les "fonctions algébriques" sont définies par le fait que la fonction y = f(x) est le résultat 
d'opérations d'addition, de soustraction, de multiplication, de division, de variables élevées à une 
puissance rationnelle non entière. 


Remarque: Il existe cependant un très grand nombre de fonctions que nous rencontrerons dans les 
différents chapitres du site. Citons par exemple les "fonctions de Bessel" (cf. chapitre des Suites Et 
Séries), les "fonctions lipschitziennes" (cf. chapitre de Topologie), les "fonctions de Dirac" (cf. 
chapitre de Calcul Différentiel Et Intégral), les "fonctions de répartition et de distribution" (cf. 
chapitre de Statistiques), la "fonction gamma d'Euler" (cf. chapitre de Calcul Différentiel Et 
Intégral), etc. 


8. Une application f : [æ,b] —IR est dite "fonction en escalier" si et seulement si, il existe une 
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de [a, b] tel que aÿ =a et a, = b et (4... À,) € R* tels que: 


subdivision (&, },4,2, 


Vie{0,..,n-1},Vre la,aul & f(x) = 4 


Prix [cent.] 


0 100 200 300 400 500 600 FOû s0û 


Durée [sec.] 


Figure: 16.26 - Exemple d'une fonction en escalier courante 


2.1. LIMITE ET CONTINUITÉ DES FONCTIONS 


Nous allons considérer maintenant des variables ordonnées d'un type spécial, que nous définissons par 
la relation "la variable tend vers une limite". Dans la suite de ce cours, la notion de limite d'une variable 
va jouer un rôle fondamental, étant intimement liée aux notions de base de l'analyse mathématique, la 
dérivée, l'intégrale, etc. 


Définition: Le nombre a est appelé la "limite" de la grandeur variable x, si, pour tout nombre 
arbitrairement petit # > Q avons: 


lx-al<e (16.52) 
Si le nombre a est la limite de la variable x, nous disons que "x tend vers la limite a". 


Nous pouvons définir également la notion de limite en partant de considérations géométriques (cela 
peut aider à mieux comprendre. quoique pas toujours...): 


Le nombre constant a est la limite de la variable x, si pour tout voisinage donné, aussi petit qu'il soit, de 
centre a et de rayon £, nous pouvons trouver une valeur x telle que tous les points correspondant aux 
valeurs suivantes de la variable appartiennent à ce voisinage (notions que nous avons défini 
précédemment). Géométriquement nous représentons cela ainsi: 
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ee DE —— 
ü x a 


Figure: 16.27 - Notion géométrique de limite 


Remarque: Il devrait être trivial que la limite d'une grandeur constante est égale à cette constante, 
puisque l'inégalité [x-c|=|-<|= 0 < # est toujours satisfaite pour £ arbitraire. 


Il découle également de la définition de la limite qu'une grandeur variable ne peut pas avoir n'importe 
comment deux limites. En effet, si: 


imx=aetlimx=b (1653) 
+2 x à d 

avec a < b, x doit satisfaire simultanément aux deux inégalités suivantes: 
x-al<eet|x-2l<e (4654 


pour & arbitrairement choisi. Mais si nous faisons une représentation géométrique identique à la 
précédente, nous voyons assez aisément que cela est impossible si: 


Il ne faut également pas s'imaginer que chaque variable doit nécessairement avoir une limite. 


Définition: La variable x tend vers l'infini, si pour chaque nombre positif donné M, nous indiquons une 
valeur de x à partir de laquelle toutes les valeurs conséquentes de la variable (valeurs de la variable 
appartenant dans le voisinage défini à partir de valeur indiquée précédemment) x vérifient l'inégalité 


x] > M. 


Nous pouvons vérifier ce genre de cas dans les suites arithmétiques, géométriques, ou harmoniques où 
chaque terme de la progression est une valeur que prend la variable x. 


La variable x "tend vers plus l'infini", ou x — + si pour Af > 0 arbitraire, à partir d'une certaine 
valeur, toutes les valeurs conséquentes de la variable vérifient l'inégalité }f < x. C'est typiquement le 
genre de considération que nous avons pour des progressions divergentes vers l'infini où à partir d'un 
certain terme de valeur égale à M tous les termes suivants sont supérieurs à M. 


La variable x "tend vers moins l'infini" ou x — -« si pour Af > 0 arbitraire, à partir d'une certaine 
valeur, toutes les valeurs suivantes de la variable vérifient l'inégalité x < -M . 


Définition: Soit y = f(x) une fonction définie dans un voisinage du point a ou en certains points de ce 
voisinage. La fonction y = f(x) tend vers la limite b {y — bi lorsque x tendant vers a (x — a), si 
pour chaque nombre positif &, aussi petit qu'il soit, nous pouvons indiquer un nombre positif 5 tel que 
tous les x différents de a et vérifiant l'inégalité [x = al < à satisfont également: 


Page: 1191/4839 


[v3.0 - 2013] 


FH -8l<e (6.56) 


L'inégalité [x - al < & permet d'exprimer le côté (ou le sens) depuis lequel nous venons avec notre x. 


Car sur le système d'axe représentant des valeurs ordonnées, nous pouvons, pour une valeur donnée, 
venir de sa gauche ou de sa droite pour se rapprocher d'elle (imaginez-vous au besoin, un bus qui peut 
venir depuis un côté ou un autre de la route tant que la distance qui le sépare à l'arrêt qui nous intéresse 
est inférieure à 5 ). 


Si b est la limite de la fonction f(x) quand x — &, nous écrivons alors sur ce site en tous les cas: 
lim f(x) =b (16.57) 
x 2 


Pour définir le côté depuis lequel nous venons en appliquant la limite, nous utilisons une notation 
particulière (rappelons que cela permet de connaître de quel côté de la route vient notre bus). 


Ainsi, si f(x) tend vers la limite à, quand x tend vers un nombre a en ne prenant que des valeurs plus 
petites que a, nous écrirons alors: 


lim f(x) — à (16.58) 
*—+0 _ 


(remarquez le petit -en indice) et nous appellerons À, la "limite à gauche" de la fonction f(x) au point a 


(car rappelez-vous que l'axe des ordonnées va de -æ à +, donc les petites valeurs par rapport à une 
valeur donnée, se trouvent à gauche). Si x prend des valeurs plus grandes que a, nous écrirons alors: 


lim f(x) = à (16.59) 


+24 


(remarquez le petit + en indice) et nous appellerons à, la "limite à droite" de la fonction au point a. 


Définition: La fonction f(x) tend vers la limite b quand x — « si pour chaque nombre positif £ aussi 
petit qu'il soit nous pouvons indiquer un nombre positif N tel que pour toutes les valeurs de x vérifiant 
l'inégalité [x] > W, l'inégalité | f(x) -b] < & est satisfaite. 


Exemple: 


Montrons que (nous supposons le résultat connu pour l'instant): 


Il faut démontrer que, quel que soit &, l'inégalité 


l — à 
1+—- < & sera satisfaite dès que |x| > W, où N'est 
x 


défini par le choix de £. L'inégalité précédente est évidemment équivalente à |-|< #, qui est satisfaite 


X 


si nous avons X: 
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Nous admettons que l'exemple et la méthode sont discutables, mais nous verrons plus tard les outils 
mathématiques adéquats pour arriver rigoureusement, sans magouilles et hypothèses de départ, au 
résultat obtenu précédemment. 


La signification des symboles x — +æ et x — -«, rend évidente celle des expressions: 
f() tend vers b quand x — + 
et: 
f() tend vers b quand x — -« 
que nous notons symboliquement par: 
lim f(x) =8 et lim f(x) = (16.62) 


Nous avons étudié les cas où la fonction f(x) tend vers une certaine limite b quand x — 4 ou x — «. 
Considérons maintenant le cas où la fonction y = f{x) tend vers l'infini quand la variable x varie d'une 
certaine manière. 


Définition: La fonction f(x) tend vers l'infini quand x — & , autrement dit f(x) est infiniment grande 
quand x — à, si pour chaque nombre positif M, aussi grand qu'il soit, nous pouvons trouver un nombre 
& > 0 tel que pour toutes les valeurs de x différentes de a et vérifiant la condition [x ” al < à, l'inégalité 


| F4 (»| > M est satisfaite. 

Si f(X) tend vers l'infini quand x — 4, nous écrivons: 
lim f(x)=© (16.63) 
x 2 


Si f(x) tend vers l'infini quand x — & , en ne prenant que des valeurs positives ou que des valeurs 
négatives, nous écrivons respectivement: 


lim f(x) = +o et lim f(x) = (16.64) 
x 2 *— 2 
Si la fonction f(x) tend vers l'infini quand x — « on écrit: 
lim fx) =+® (16.65) 
F0 
et en particulier, nous pouvons avoir: 
lim fx) =+0 lim f(x) =+© lim f(x) = -©, him fx) = -© (16,66) 
X—++0 +0 +0 +0 


Il peut arriver que la fonction f(x) ne tende ni vers une limite finie, ni vers l'infini quand x — 4 (par 
exemple fx) = sin(x) ), la fonction est alors bornée (cf. chapitre de Théorie des Ensembles). 


Page: 1193/4839 


[v3.0 - 2013] 


? 


Maintenant que nous avons grosso modo eu un aperçu du concept de limite, nous allons donner une 
définition extrêmement importante qui est un des piliers de beaucoup de domaines de la mathématique 
et de la physique. 


Définition: Soit f une fonction définie sur 7 € IR. Soit x, € Z, nous disons que nous avons une 


"fonction continue" en x si et seulement si: 
lim f(x)= f(x) acer 
4 Xÿ 


c'est-à-dire si (il faut pouvoir arriver à y lire le fait qu'on s'approche de manière infiniment petite d'une 
limite ce qui permet d'assurer la continuité) que TE > 0, > Ô tel que x e 7 alors: 


k-x|<a= fa - fs € (668) 


Remarque: f est "continue à droite" (resp. à gauche) si nous rajoutons la condition x z x4 (resp. 
x xp). 

Nous avons les corollaires triviaux suivants: 

C1. f est continue en x, si et seulement si f est continue à droite et à gauche en x 


C2. f est continue sur I si et seulement si f est continue en tout point de 1. 


2.2: ASYMPTOTES 


Le terme d'asymptote est utilisé en mathématiques pour préciser des propriétés éventuelles d'une 
branche infinie de courbe à accroissement tendant vers l'infinitésimal. 


L'étude du comportement asymptotique est particulièrement développée dans les études de fonctions. 
Dans le domaine scientifique, il arrive fréquemment d'étudier des fonctions dépendant du temps 
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(évolution de populations, réaction chimique ou nucléaire, graphique de température, oscillation d'un 
amortisseur). Un des objectifs du chercheur est alors de connaître l'état à la fin de l'expérience, c'est- 
à-dire lorsqu'un grand intervalle de temps s'est écoulé. L'objectif n'est alors pas de connaître les 
variations intermédiaires, mais de déterminer le comportement stable, à l'infini du phénomène mesuré. 
Le chercheur étudie donc le comportement asymptotique de sa fonction avec les outils que les 
mathématiques lui offrent. 


Définitions: 


D1. Lorsque la limite d'une fonction f(x) tend vers une constante -* quand x — +, alors la 
représentation graphique de cette fonction nous amène à dessiner une droite horizontale que nous 
appelons "asymptote horizontale" et dont l'équation est: 


A(x) = c* (16.69) 


D2. Lorsque la limite d'une fonction f(x) tend vers + quand x — 4, , alors la représentation 


graphique de cette fonction nous amène à dessiner une droite verticale que nous appelons "asymptote 
verticale" et dont l'équation est: 


A(y) = 44 (16.70) 
Exemple: 


La courbe représentative de la fonction f(x)=1/(x-1) admet la droite d'équation x = 1 comme asymptote 
verticale et y = 0 comme asymptote horizontale: 


20 


y10 


-10 


-20 


Figure: 16.28 - Représentation graphique plane d'une asymptote verticale et horizontale 
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D3. La droite d'équation y = 4x + est une "asymptote oblique" à la courbe de la fonction f(x) si: 


lin JG (ax+b)=0 (16.71) 


les valeurs de a et de b peuvent se retrouver facilement à l'aide des relations suivantes : 


à = ln 

xd x (16.72) 
b= li _ 

— os 


Remarque: Attention une courbe peut admettre deux asymptotes obliques distinctes en +co et en - 
co 


Pour rechercher une asymptote oblique éventuelle, il faut déjà être sûr que la fonction f admet une 
limite infinie en +co ou en -c ensuite nous cherchons la limite en +co ou en -c de f{x)/x. 


Trois cas sont à considérer : 


C1. La courbe représentative de f a pour direction asymptotique la droite d'équation Y = 4x: 
| x | 
lim === (16.73) 


Exemple: 


La fonction f(x) = x +1/ x possède entre autres une asymptote d'équation Y = X : 


20 
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Figure: 16.29 - Représentation graphique plane d'une asymptote oblique 


C2. La courbe représentative de f admet une branche infinie (cette branche infinie n'admet pas 
d'asymptote) et l'axe des abscisses en est la direction asymptotique (fonction racine carrée par exemple) 


lim f® _, 


xt x 


(16.74) 


Exemple: 


Les fonctions f(x} = x (en rouge) ou In(x) (en vert) ont une limite f(x}/x nulle et possèdent donc 


toutes deux une "branche parabolique" de direction Ox. 


Figure: 16.30 - Exemples de branches paraboliques pour deux fonctions 


C3. La courbe représentative de f admet une branche infinie (cette branche infinie n'admet pas 
d'asymptote) et l'axe des ordonnées en est la direction asymptotique. (nous parlons aussi de "branche 
parabolique" voire de "fonction carrée") 


x 
lirn 2 =#00 (16.75) 


Exemple: 


La fonction f(x) = zx? a une limite f(x}/x infinie et possède donc une "branche parabolique" de 


direction Oy. 
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20 


Figure: 16.31 - Exemple de parabole 


3. LOGARITHMES 


Nous avons longuement hésité à mettre la définition des logarithmes dans le chapitre traitant du calcul 
algébrique. Après un moment de réflexion, nous avons décidé qu'il valait mieux la mettre ici car pour 
bien la comprendre, il faut avoir connaissance des concepts de limite, domaine de définition et fonction 
exponentielle. Nous espérons que notre choix vous conviendra au mieux. 


Soit la fonction exponentielle (bijective) de base quelconque a, où 4 € R! {1 notée: 
f{x)=a" (16.76) 


pour laquelle il correspond à chaque nombre réel x, exactement un nombre positif 4" (l'ensemble 
image de la fonction est dans IR ) tel que les règles de calcul des puissances soient applicables (cf. 
chapitre de Calcul Algébrique). 


Nous savons que pour une telle fonction, que si 4 > 1, alors f(x) est croissante et positive dans IR, et si 
0 € & < 1, alors f(x) est décroissante et positive dans IR. 
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Remarques: 


R1. Si 4 > 1, lorsque x décroît vers des valeurs négatives, le graphique de f(x) tend vers l'axe des x. 
Ainsi, l'axe des x est une asymptote horizontale. Lorsque x croît par valeurs positives, le graphique 
monte rapidement. Ce type de variation est caractéristique de la "loi de croissance exponentielle" et 
f(@) est quelques fois appelée "fonction de croissance". Si Q < & < 1, lorsque x croît, le graphique 
tend asymptotiquement vers l'axe des x. Ce type de variation est connu sous le nom de 
"décroissance exponentielle". 


R2. En étudiant ,;*, nous excluons le cas 4 < Qet 4 =1. Notons que si 4 < O, alors 4* n'est pas un 
nombre réel pour de nombreuses valeurs de x (nous rappelons que l'ensemble image est contraint à 
FR). Sia=0, 4° = 0° n'est pas défini. Enfin, si 4 =1, alors 4* = 1 pour tout x et le graphique de 
f() est une droite horizontale. 


Puisque la fonction exponentielle f(x) est bijective alors il existe une fonction réciproque f”l{x) et 
appelée "fonction logarithme" de base a notée: 


FO) =log (>) (16.77) 
Et donc: 
x = log, (y) (16.78) 
si et seulement si y = &*. 


En considérant log, (x) comme un exposant, nous avons les propriétés suivantes: 


Propriétés Justification 
log, 1=0 a =1 
log, a =1 a =a 
log, a =x a = a 
ei) 2 + ei = 2x 


Tableau: 16.2 - Propriétés du logarithme en base a 
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Remarques: 


R1. Le mot "logarithme" signifie "nombre du logos", "logos" signifiant "raison" ou "rapport". 


R2. Les fonctions logarithme et exponentielle sont définies par leur base (le nombre a). Lorsqu'on 
utilise une base de puissance de 10 (10, 100, 1000...) nous parlons alors de "système vulgaire" car 
ils ont pour logarithme des nombres entiers successifs. 


R3. La partie entière du logarithme s'appelle la "caractéristique". 


Il existe deux types de logarithmes que nous retrouvons presque exclusivement en mathématiques et en 
physique : le logarithme en base dix et le logarithme en base e (ce dernier étant fréquemment appelé 
"logarithme naturel" ou plus exactement pour des raisons historiques justifiées "logarithme népérien"). 


D'abord celui en base 10: 
f(x) =logpo(x) (16.79) 
abusivement noté: 
f(x) =log(x) (16.80) 
et celui en base (eulérienne) e: 
f(x) =log,(x) (16.81) 
historiquement noté: 
f(x) =in(x) (16.82) 
le "n" signifiant "népérien". 


Remarque: Historiquement, c'est à John Napier (1550-1617) dont le nom latinisé est "Neper"” que 
l'on doit l'étude des logarithmes et le nom aux "logarithmes népériens". 


En français pour la fonction logarithmique en base 10 il faut pour calculer: 
f(x) =log(x) (16.83) 
se poser la question suivante: à quelle puissance # « IR devons-nous élever 10 pour obtenir x ? 
Formellement, cela consiste à résoudre l'équation: 
10* =x (16.84) 


ou autrement écrit: 
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10=%/x (16.85) 
avec x étant connu et donc en base 10: 
log(x) = x (16.86) 
Pour la fonction logarithmique en base eulérienne e (ou dite "base népérienne") il faut pour calculer: 
f(x) =Iin(x) (16.87) 


se poser aussi la question suivante: à quelle puissance # e IR devons nous élever le nombre e pour 
obtenir x ? 


Formellement, cela consiste à résoudre l'équation: 
ge" =x (16.88) 
ou autrement écrit: 
e=#x (16.89) 
avec x étant connu et donc: 
In(x) =A (16.90) 
Techniquement, nous disons alors que la fonction exponentielle (voir plus bas les détails): 
f{x)=e" (16.91) 


est la bijection réciproque de la fonction In(x). 


Figure: 16.32 - Représentation graphique plane de la bijection entre le logarithme népérien et l'exponentielle 


Mais quel est donc ce nombre "eulérien" appelé également "nombre d'Euler" ? Pourquoi le 
retrouve-t-on si souvent en physique et en mathématiques? D'abord déterminons l'origine de sa valeur: 
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Pour cela, il nous faut déterminer la limite (dont l'origine historique semblerait être l'étude de problèmes 
financiers par Euler) de: 


| 3 
21 + x =(1+x)r = (2) (16.92) 
æ 
avec æe N et quand æ — ©. 


Remarque: Le deuxième terme de l'égalité est donc typiquement le type d'expression que nous 
retrouvons dans les intérêts composés en finance (cf. chapitre d'Economie) ou dans tout autre type 
d'accroissement à facteur égal. Et ce qui nous intéresse dans le cas présent c'est quand ce type 
d'accroissement tend vers l'infini. 


L'intérêt que nous avons à poser le problème ainsi c'est que si nous faisons tendre & — « la fonction 
écrite précédemment tend vers e et cette fonction a pour propriété particulière de pouvoir se calculer 
plus ou moins facilement pour des raisons historiques à l'aide du binôme de Newton. 


Donc d'après le développement du binôme de Newton (cf. chapitre de Calcul Algébrique) nous 
pouvons écrire: 


1l æ Le 31 ee al e* 
(16.93) 


(si) _1,41,a@-1) 1) 1 1 ,aa-Da-2 71, L a@- D. (æ-(@-t)) 1 


Ce développement, est similaire au développement de Taylor de certaines fonctions pour des cas 
particuliers de valeurs de développement (d'où la raison pour laquelle nous retrouvons ce nombre 
eulérien dans beaucoup d'endroits que nous découvrirons au fur et à mesure). 


En effectuant certaines transformations algébriques évidentes, nous trouvons: 
x 
Pau 2h = il) ee 
æ 2! æ} 3! æ æ æ! æ æ æ 
(16.94) 


Nous voyons de cette dernière égalité que la fonction ‘ + à) est croissante quand & croît. En effet, 
& 


quand nous passons de la valeur & à la valeur 4 +1 chaque terme de cette somme augmente: 


Li . gr ES , @tC. (16.95) 
2 æ 21 æ+l 


Montrons que la grandeur variable ( + 


E 


| est bornée. En remarquant que: 


1 [1- see (16.96) 
æ 
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Nous obtenons donc par analogie avec l'expression étendue en binôme de Newton déterminée plus 


haut, la relation d'ordre suivante: 
[+2] étés ee +2 0 
21 3 a! 


D'autre part: 
Fed > 041 à (16.08) 


LÉ  £ — — 
2241 al 2*1 


Nous pouvons donc écrire l'inégalité: 


n+i] Hitett. + (16.99) 


Les termes soulignés constituent une progression géométrique de raison g = 1/2 (cf. chapitre de Suites 
et Séries) et dont le premier terme est 1. Par suite en utilisant les résultant obtenus dans le chapitre de 


Suites et Séries, nous pouvons écrire: 


l = (142)° ais 
| <1+ D An ner În <3 (16.100) 


a TES 


Par conséquent, nous avons: 
1 & 
2 <|1+—1 <3 (16.101) 
æ 


1+— 


Nous avons donc prouvé que la fonction | L | est bornée. 
æ 


La limite: 


e= lim [ n (16.102) 
a+ +0 [#4 


tend donc vers cette valeur bornée qui est le nombre e dont la valeur est 


e=2.7182818284.. (16.103) 


Remarque: Comme nous l'avons démontré dans le chapitre traitant des Nombres, ce nombre est 


irrationnel. 
Nous pouvons alors définir la "fonction exponentielle naturelle" (réciproque de la fonction logarithme 


népérien) par: 
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f{x)=e" (16.104) 
ou également parfois notée: 
F2) = exp(x) (16.105) 
Le nombre e et la fonction qui permet de le déterminer sont très utiles. Nous les retrouvons dans tous 
les domaines de la mathématique et de la physique et donc dans la quasi-totalité des chapitres de ce 
site. 
Les logarithmes ont plusieurs propriétés. Les voici (nous nous référons à une base X donnée): 
log y CAT A) = log, (A) = log, (AT) +log, CZ") =m+x (16.106) 
Si nous posons X* =; et #* =} nous avons donc: 
log-(a'b) =log,(a)+log,(b) (16.107) 
Si nous avons le cas particulier 4 = à alors: 
log, (a' a) =log,(a) +log,(a) = 2'log;(a) (16.108) 


Cherchons à exprimer: 
logy D (16.109) 


sous une forme différente. Posons £ = af & 4 =£:& ce qui nous amène au développement: 


log y (a) = log, (£' b) = log , (#6) + log, (à) 
a (16.110) 
— log , (6) = logy(a) -log,(b) = log, (Ex) 


1 
Cherchons à exprimer maintenant Îo x* | avec x e N * sous une forme différente. Posons: 
8x 


txt xmg" (STI 
ce qui nous amène à: 


1 
logy (x) =logy (#) = n' log, (6) = log, (6) = log,(x*) = “ox (x) (16.112) 


Il y a une relation assez utilisée en physique relativement aux changements de bases logarithmiques. La 
première relation est triviale et découle des propriétés algébriques des logarithmes: 


a" = e"Ne) = jprlæente) = prbæle) (16.113) 


La seconde relation: 
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108, (é) = —— = ——— (16.114) 


est un peu moins triviale et nécessite peut-être une démonstration (nous en aurons besoin lors de notre 
étude des fractions continues dans le chapitre de Théorie des nombres). 


Démonstration: 

Nous avons d'abord les équations équivalentes (de la première relation ci-dessus): 
w=log,(s) et a" =n (16.115) 

et nous procédons comme suit: 


à 
log,(a”) =log,@) (16.116) 
wlog, (a) = log, (u) 


Ce qui nous amène finalement à: 


l 
ae (16.117) 
log, (a) 


OIC.Q.F.D. 
4. PRODUIT SCALAIRE FONCTIONNEL 


Le produit scalaire fonctionnel (analogie très forte avec le produit scalaire vectoriel vu dans le chapitre 
de calcul vectoriel) peut paraître inutile lorsqu'il est étudié pour la première fois hors d'un contexte 
appliqué mais il connaît au fait de nombreuses applications pratiques. Nous en ferons par exemple 
directement usage dans le chapitre de physique quantique ondulatoire et de chimie quantique ou encore 
dans le cadre plus important encore des polynômes trigonométriques via les séries et transformées de 
Fourier (cf. chapitre sur les Suites Et Séries) que nous retrouvons partout dans la physique 
contemporaine. 


Cependant, si le lecteur n'a pas encore parcouru le chapitre de calcul vectoriel et la partie y traitant du 
produit scalaire vectoriel, nous ne saurions que trop recommander sa lecture sans quoi ce qui va suivre 
risque d'être un peu incompréhensible. 


Nous nous plaçons dans l'espace €i[a&,],IR \ des fonctions continues de l'intervalle [a,b] dans IR muni 


du produit scalaire défini par (nous retrouvons la notation spécifique du produit scalaire dans sa version 
fonctionnelle comme nous en avions fait mention lors de notre définition du produit scalaire vectoriel): 


b 
{fle}= [7 -gG)dx| (16.118) 


Une famille de polynômes orthogonale, comme nous pouvons en faire l'analogie avec le produit scalaire 
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vu dans le chapitre de Calcul Vectoriel, est donc une famille { 2,,...,p,,...1 de polynômes tels que: 


(P,|P:)= Osij#& (16.119) 
Nous rappelons qu'une famille orthogonale est libre (cf. chapitre de Calcul Vectoriel), 


Le développement suivant va nous rappeler le procédé de Gram-Schmidt (cf. chapitre de Calcul 
Tensoriel) pour construire une famille orthogonale: 


Soit {2%5...,?,....) une famille de polynômes linéairement indépendants définis sur [a,b] et V l'espace 
vectoriel engendré par cette famille. La famille { y,,...,y,,...\ définie par récurrence de la manière 
suivante: 


S 


on 2 2» z pour#21 (16.120) 


D F 


et Ya = 29 est orthogonale et engendre V. 


Démonstration: 


Montrons par récurrence sur n que {»,,..,y,.,…| est une famille orthogonale qui engendre le même 
espace que {2%,...,p,,..1. L'assertion est vérifiée pour # = 0. Supposons l'assertion vérifiée pour # > 0 


, pour 0 ££ < » nous avons: 


1 
Y; )0: Pre) b,f 
(16.121) 


ñn 
Ou (Ve) À Pan © D Pr 


j © 


pb = (Paule) DCE 
b: 


= {punlve)- {Paule} Orly) = {pu [7e Pau lye) = 0 


be F 


(Yo:....,,..) est donc orthogonale. Pour finir, l'égalité: 


ñ 


Vat — Pat dr, # 
J 


Lu « 
ARE (16.122) 
Pl 
montre que { ÿ5,.., Vus | €t (Po, Pa engendrent le même espace. i{ y,...,»,,, | est donc bien une 
famille orthogonale qui engendre V. 
OIC.Q.F.D. 
® Exemple: 


Considérons l'exemple très important en physique moderne qui est l'ensemble À, des fonctions 
continues 2x7 -périodiques qui forme un espace vectoriel (cf. chapitre de Calcul Vectoriel), 
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Nous définissons donc le produit scalaire de deux fonctions de cet ensemble par: 


# 27 
WeeR, (fle)= [red -froetdax (612 
(sl 


ae 


Le but de cette étude est de construire une base de Æ,, sur laquelle nous pouvons décomposer toute 
fonction 2x7 -périodique. 


L'idée la plus simple est alors de se servir des fonctions trigonométriques sinus et cosinus: 


cos(x),cos(2x),cos(3x}),...,cos(#x) _—_. 
sin(x),sin(2x),sin(3x),.….,sin(#x) Ho 


Les relations ci-dessous montrent que les bases choisies ci-dessus sont orthogonales et forment donc 
une famille libre, de plus c'est une famille génératrice de l'espace vectoriel À, car comme nous le 


démontrerons lors de notre étude des séries de Fourier (cf. chapitre sur les Suites Et Séries), nous avons 
les valeurs suivantes: 


27 

[ cos(Ax) cos(mex)dx = à,77 

(El 

27 

J'sinGen sintem)ax = 6,7 (16.125) 
(El 

27 

[ cos) sin(max)dx = 0 

(El 


où À, est le symbole de Kronecker (cf. chapitre de Calcul Tensoriel). 
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Remarque: Si le lecteur se rappelle que pour une variable aléatoire X définie sur tout IR, son 
espérance se calculait comme étant (cf. chapitre de Statistiques): 


+ 
E(X)= | xf(odx (16.126) 


—© 


Donc nous pouvons assimiler: 


1 
E(g(a)= | gG)f(ax (16.127) 


—(0 


Ho 
Î Fax =1 (16.128) 


—© 


à l'espérance de la fonction g(x)! Analogie parfois forte intéressante dans la pratique! 
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Notes personnelles: 
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17. ANALYSE COMPLEXE 


À sn de commencer ce chapitre portant sur l'étude du calcul différentiel et intégral dans le cas 


généralisé de l'ensemble des nombres complexes, je tiens à signaler que je me suis beaucoup inspiré du 
PDF de E. Haïrer (avec son autorisation) au niveau des illustrations. Le présent texte contient également 
de nombreuses phrases et développements repris, homogénéisés et simplifiés (au risque d'en faire grimper 
certains aux rideaux...) conformément aux notations et objectifs pédagogiques du reste de ce site Internet. 


Le sujet de l'analyse complexe est donc l'étude des fonctions € —€ et de leur différentiabilité (qui est 
différente de celle dans 2). Les "fonctions holomorphes" (c'est-à-dire différentiables dans un sous- 
ensemble de €) possèdent nous le verrons des propriétés surprenantes, élégantes qui peuvent être 
réutilisées dans le cas des fonctions de JR et qui ont des applications importantes en physique. 


Avant de commencer expliquons l'intérêt de ce domaine de manière simplifiée! 


Nous avons étudié dans la section d'Algèbre une partie du calcul différentiel et intégral avec quelques 
théorèmes utiles et importants pour la physique et l'ingénierie. Cependant, en restant dans IR ou [R? la 
liste des théorèmes s'épuise en quelque sorte et on finit par ne plus trouver grand-chose de pertinent dans 
la pratique qui permette de simplifier le calcul d'intégrales que l'on retrouve souvent dans l'industrie. 
Alors, quand on sait que R © € (donc l'ensemble des complexes généralise celui des réels) et que l'on 
peut construire aussi une correspondance R? —> € comme nous allons le voir, de nouveaux théorèmes 
apparaissent avec des résultats très intéressants que l'on peut exploiter pour les intégrales dans R ou *!! 
C'est cette raison qui fait que l'ingénieur a besoin de connaître l'analyse complexe! 


Après l'étude de ce domaine particulier de la mathématique, il est fréquent de dire que le plus court 
chemin entre deux vérités du domaine réel passe souvent par le domaine complexe. 


1. APPLICATIONS LINÉAIRES 


Une bonne introduction à l'analyse complexe et à sa représentation consiste à étudier dans un premier 
temps (à titre pédagogique principalement) le cas particulier des applications linéaires complexes. Voyons 
cela: 


Soient Ÿ © €, un ensemble et F € € un autre ensemble. Une fonction qui associe à chaque z € L} un 
we: 


w=f(z)=fG+i)eF (171 
est une "fonction complexe": 


J'U=T 72) 
Ce qui est important c'est de comprendre et remarquer que nous pouvons identifier: 


z=x+iy (x y) € R? (17.3) 


et: 
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w= f(z)=ui(x,y)+iv(x,y) — (u,v)e R?| (17.4) 


Nous arrivons alors à deux fonctions de deux variables réelles x, y: 


(x.y), VC. Y) (175) 

qui sont les coordonnées du point w. 

Définition: Une application est dite €-linéaire si par exemple une fonction du type: 
w= f(z)=€.2z (176) 

où c est un nombre complexe fixé et z un nombre complexe quelconque, satisfait: 


Jen +ezs)=cf(a)+ef(z2) (177) 


Nous avons vu et démontré dans le chapitre Nombres lors de notre étude des nombres complexes, que la 
multiplication de deux nombres complexes pouvait être équivalente à une rotation orthogonale suivie 
d'une homothétie et que cette même multiplication pouvait être représentée sous forme matricielle! Or la 
transcription sous forme matricielle implique comme nous l'avons vu dans le chapitre d'Algèbre Linéaire 
automatiquement la linéarité! 


Donc lecteur pourra facilement vérifier qu'une matrice de rotation/homothétie est un exemple d'une 
application €-linéaire (sur demande nous pouvons détailler) que nous écrirons dorénavant: 


u a —blfx cosæ —-sinælfx 
= =8.| . (17.8) 
y b a |Ly sinæ cosæ |Ly 


Ce qui se représente typiquement de la manière suivante (on y observe bien une rotation et une 
homothétie qui conservent les angles et les proportions): 


Figure: 17.1 - Exemple d'application d'une fonction complexe plane 
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C'est le fait que les proportions et que les angles soient conservés qui fait d'une fonction complexe qu'elle 
est € -linéaire. Dans le cas contraire, nous dirions que la fonction est IR -linéaire. 


Donc une matrice 2 x2 représente une application €-linéaire seulement si elle est de la forme: 


A= a —b : 
=|, | &9 


Voyons des exemples de fonctions €-linéaires assez remarquables. 
Exemples: 
ET. 

J\z) = z? (17.10) 


En coordonnées réelles cela donne: 


2 2 
2 =x - 
u+iv=(x+iy) = 72 — y? +25 = Ni (17.11) 
v= 2 


Ainsi, regardons ce que fait cette fonction avec les points du plan complexe qui sont confondus avec les 
lignes verticales de ce même plan (ce qui vient alors à poser x =&). Nous avons alors: 


ü = a - y v=24y (17.12) 


et en éliminant y, nous trouvons l'équation d'une parabole ou plutôt d'une famille de paraboles (pour 
plusieurs valeurs de a) qui sont ouvertes à gauche du plan complexe image: 


Si nous faisons la même analyse pour les points du plan complexe qui sont confondus avec lignes 
horizontales de ce même plan, nous trouvons également, en posant y = à , une famille de paraboles (pour 
plusieurs valeurs de b) qui sont ouvertes à droite du plan complexe image. 


Voici une représentation du plan complexe image sur lequel nous avons dessiné une tête de chat: 
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Figure: 17.2 - Représentation complexe de l'image de la fonction exemple 


et si nous regardons le plan complexe pré-image correspondant, nous avons alors deux têtes de chats qui 
apparaissent: 


LU CTP TETE 
LITTTTITITEN 
At E 


l 
n 


Figure: 17.3 - Représentation des pré-images de la fonction exemple 


L'apparition de ces deux têtes de chats vient du fait que cette fonction possède 2 pré-images possibles 
pour chaque point image (c'est donc une fonction surjective). 


E2. Une autre fonction intéressante est la "transformation de Cayley" utilisée dans certains domaines de la 
physique et définie par: 


Fizi= _ (17.14) 
z—i 
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ayant comme domaine de définition: €/{1}. 
On remarquera qu'il s'agit d'une fonction involutive puisque: 


z+1,, z+l+-Ù 


Zz+l) 3-1 z-1 2+lFa- 1) 2 
= = = — XL — > © = —=7 (1715 
JU@) (=) 241, 2H-G-D 2H) 2 7 7 
En 21 


et comme nous avons démontré dans le chapitre de Théorie De La Démonstration que toute fonction 
involutive est à la fois injective et surjective, alors la transformation de Cayley est une fonction bijective. 


Cette fonction transforme l'axe des imaginaires iy en cercle unité (et inversement puisqu'elle est 
involutive). Voyons cela: 


CO OT ip+l mp1 p-ip-ip-1 y?-%y-1 
FOSTER. DE D. 
pl iy-1 —iy-1 y<-iy+iy+1 1+y 


. ; (17.16) 
= -i D 2 utiv 
1+y 1+ y 
où: 
2 
— ] 
Pa ve z (A7.17 
1+y 
satisfont: 
> (2-1) +(—2y) (> -2»° +1)+(4y2) , 
u +v = = = (17.18) 
+») 1+2y° +y* 
Soit: 


u?+w =1 (17.19) 
Il s'agit donc bien de l'équation d'un cercle. 


E3. Comme autre exemple de fonction, prenons la "transformation de Joukovski" définie par: 
l l 
HOEE (+2) (17.20) 
2 Z 


Si le domaine de définition donné est construit en coordonnées polaires regardons comment un cercle ou 
une ellipse se transforme: 
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Figure: 17.4 - Transformation en coordonnées polaires d'une ellipse avec la fonction exemple 


Alors le plan image sera: 


Figure: 17.5 - Résultat de la transformation en coordonnées polaires 


Elle transforme donc respectivement les cercles centrés en 0 et les rayons passant par 0 en une famille 
d'ellipses et d'hyperboles cofocales. Pour démontrer ce fait, nous utilisons donc les coordonnées polaires 
complexes (formule d'Euler) vues dans le chapitre sur les Nombres: 


sr (cos @+isin #) (17.21) 


et: 
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77 1 _j 1 (cos gi sin #) = cos @—isin # 


E r(cos @+isin #) Mi (cos @+isin #) (cos @—isin #) cos? + sin? $ (17.22) 


=r (cosg—isin #) 


Nous avons alors: 


1 1 1 
f(z)= s( (cos p+i sin #\ + (cos g—isin 9) = É +7 Je g+i - Zi $ (17.23) 


d'où: 


: r , 1 : . rl. 6 
=|—+— |co = |—-— |sin Ta 
AE td > % Fee 


u? v? se AY fe 1Y r? r | l r? r Î 1 

7 ane 2'#) 2%) (at 2% ta] (4 2% 42 
cos @ sin? r r r  4r r àr (17.26) 
a | rl 1 1 


=2——+2—— = +=] 
2 2r 2 2r 2 2 


qui est l'équation d'une hyperbole (cf. chapitre de Géométrie Analytique). 


Cette fonction trouve son utilité dans le cas où si nous plaçons astucieusement un cercle (passant par le 
point z = 1 comme dans le cas de la première figure) le plan représenté en coordonnées polaires avec un 
trait discontinu pourrait ressembler à une aile d'avion. Ce qui permettait à une époque (mais la technique 
est obsolète aujourd'hui) en aérodynamique de transposer l'étude d'un champ de vecteurs du profil d'une 
aile d'avion à l'étude du profil d'un cercle et de faire par la suite la transformation de Joukovski. 


Effectivement, voyons une partie de cela avec Maple 4.00b: 
> assume(x,real, y,real); 
> z:=x+I*y; 


> F:=1/2*(z+1/2); 


> u:=Re(F); 
> u:=evalc(u); 


> v:=Im(F); 
> v:=evalc(v); 
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> with(plots):with(plottools): 

> pl:=disk([0,0],1,color-black): 

> p2:=implicitplot({seq(v=b/8,b=-10..10)},x=-4..4,y=-2..2,color=black): 
> display([p2,p1],scaling-constrained); 


Nous obtenons alors...: 


<< TT 


—— 7 TT ———— 


Figure: 17.6 - Exemple d'application importante de la fonction exemple 


E4. Faisons un dernier exemple avec la fonction 1/z encore avec Maple 4.00b. Si vous y saisissez les 
commandes suivantes (suffisamment explicites de par leur nom pour comprendre ce qu'elles font): 


> assume(x,real, y,real); 
> z:=x+I*y; 
> F:=1/7; 


> u:=Re(F); 
> u:=evalc(u); 


> v:=Im(F); 
> v:=evalc(v); 


> with(plots): 

> pl:=implicitplot({seq(u=a,a=-5..5)},x=-1..1,y=-1..1,numpoints=1000): 

> p2:=implicitplot({seq(v=b,b=-5..5)},x=-1..1,y=-1..1,numpoints=1000,color=green): 
> display([p1,p2],scaling-constrained); 


Nous obtenons!: 
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Figure: 17.7 - Autre exemple d'application importante avec une fonction complexe 


voilà pour ceux qui souhaiteraient faire eux-mêmes des figures de fonctions complexes! 
2. FONCTIONS HOLOMORPHES 


La définition de la dérivation par rapport à une variable complexe est naturellement formellement 
identique à la dérivation par rapport à une variable réelle. 


Nous avons alors, si la fonction est dérivable en za: 
UC) — +#)- + h) — 
da . F(z)- f(z) im Fo +#)— f (zo) ae J{zo +) — f(zo) A 

1 Z—Z) k>0 (2 +4) -Z h-0 À 

et nous disons (abusivement dans le cadre de ce site) que la fonction est "holomorphe" (alors que dans 

R on dit "dérivable") ou "analytique" dans son domaine de définition ou dans un sous-ensemble de celui- 

ci si elle y est dérivable en chaque point. 
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Remarque: 


R1. Une fonction complexe se dérive comme une fonction réelle, il suffit de poser z comme étant x... à 
condition que ce que nous allons voir dans ce qui va suivre soit respecté! 


R2. Au fait si la fonction est holomorphe dans un sous-ensemble du plan complexe, nous verrons un 
peu plus loin lors de notre étude de la convergence des séries de puissances qu'il s'agit toujours d'un 
sous-ensemble ouvert. 


D'une manière équivalente, nous disons que la fonction f est €-différentiable en z, si la limite suivante 
existe dans €: 


im J(zo +#)— f (Z) 


= f'(Zo) (17.28) 
bin — 1 0) 


Présentons maintenant un théorème central pour l'analyse complexe appelé "théorème de Cauchy- 
Riemann"! 


Si la fonction: 
J(z)= f(x, y)= f(x +iy)=u(x,y)+iv(x, y) (17.29) 


est C-différentiable, en Z5 = Xp +iÿp, alors nous avons: 


qui est un peu l'équivalent du théorème de Schwarz dans IR vu dans le chapitre de Calcul Différentiel Et 
Intégral. Ces deux dernières relations sont appelées "conditions de Cauchy". Donc ce sont les deux 
conditions que doivent vérifier une fonction complexe pour être dérivable en z4. Ainsi, il est possible 
d'utiliser ces deux relations pour étudier les points où la fonction n'est pas analytique. 


Si ces conditions sont justes (ce que nous allons de suite démontrer), alors nous en déduisons que u et v 
doivent être toutes deux des fonctions harmoniques de x et y. 


Démonstration: 
Puisque: 


br S@)- F Go) 
DA ——— 


£—2, D — Zp 


= J (zo) (17.31) 


En choisissant: 


avec xEe KR, nous obtenons: 
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Fo +2, Yo) — (0, Yo) 


+ = 
ELZA ZotX-2Z ECZA x 


et quand x tend vers une petite valeur dx, nous avons (cf. chapitre de Calcul Différentiel Et Intégral): 


ro + dx, Yo) — (x0,Y0) = # (za) : O(u(x0.Y0) +iV(x.Y0)) 


‘(zn) = lim 
Fo) 0 dx êx ôx 


(17.34) 
= umo) +i-Z vo, 90) 

x 29 > Yo x 0> Yo 

et en choisissant: 
Z=Zp+iÿ (17.35) 
avec Y € R, nous obtenons: 
: Xn, Yo +éy)— f(xn, . Xn, Ya +éy) -— ; 
Go) = lim 2 G0r20 +97 Fo) _ , Goo + FT) 
ÉETA Z+Ÿ-2Z 25, 4 


et quand y tend vers une petite valeur dy nous avons (cf. chapitre de Calcul Différentiel Et Intégral): 


f'G }= lim F(X0-Y0 +idy) — f(0:Y0) 1 # Go) _ _; # Go) 
0 RE RE SR = = —j 


idy i y dy 
= —i —— = —j (Autre) +i Ge ») (17.37) 
8 6] 
- 0-20) EL 2 “V0-70) 


Nous avons donc maintenant: 


Go Yo) +i VX Y0) 


” à (17.38) 
| ===", )o)-i4(x, 0) 
ns. © dy 
Or nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral le théorème de Schwarz 
suivant: 
Ps LPS 
xd dyôx 


(17.39) 


Dès lors: 
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æ 8fa . 0 
LE D 

2 ds ; (17.40) 
= ag C26)-1 Late 0) 


Soit: 


ET jte À LA ie Yo) | (7.41) 
æ Var 0 Yo x 0 YO ëxl & 0> Yo æ 0>#0 nr 


Ce qui peut s'écrire: 


2{4 (2) 2{(4 à 
2 (ut Yo) +3 rai ») us Evo) ras ») =0 (4742) 


Une solution triviale est d'avoir: 


6) . à 
3" Co-90) +i= Go, Yo) = 0 
(17.43) 


à à 
D 020) ie 4 Go. 70) = 0 


Soit la possibilité d'écrire: 


6) . À 6] . à 
2" 0720) 770090) = 2 V Go 70) 712 #00) (17.44) 


En identifiant parties réelles et imaginaires, nous terminons la démonstration! 
OIC.Q.F D. 


Donc pour que f soit dérivable au sens complexe (holomorphe) en un point, il suffit qu'elle y soit 
différentiable comme fonction de deux variables réelles (R -différentiable en (x ,70) ) et que ses dérivées 
premières partielles en ce point vérifient les équations de Cauchy-Riemann. 


Par contre, pour qu'elle soit €-différentiable, il faut que les équations de Cauchy-Riemann soient valables 
en tous les points du plan complexe (on parle alors parfois de "fonctions entières") et non pas seulement 
dans un sous-domaine de celui-ci! Dans le cas contraire, elle contient donc des "singularités" et nous 
parlons alors de "fonction méromorphe" (qui est donc une fonction holomorphe sauf sur les points de 
singularités). 


Remarque: Géométriquement, nous montrerons plus tard qu'une fonction holomorphe a une 
interprétation possible dans le sens qu'elle est une transformation conforme (conserve les angles). 


Signalons donc que si f{z) est € -différentiable alors elle peut être développée en série de Taylor aussi (cf. 
chapitre de Suites et Séries): 
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7 + TE 


———"(z- 29)" (1745) 


F@)= La 


Remarquons une chose importante aussi. Si nous réécrivons: 


Me 
x y üx dy 


sous la forme suivante: 
(17.47) 


Nous disons alors que la fonction f est irrotationnelle (cf. chapitre de Calcul Vectoriel) puisque la 
première relation peut être vue comme: 


. = rot(F} =0 (17.48) 


ce qui est une analogie non anodine! Enfin, la deuxième relation: 


8v 


— = 17.49 
æ 


permet également de dire par analogie (mais cela s'arrête à une simple analogie!) que la fonction f est non 
divergente (cf. chapitre de Calcul Vectoriel) ce qui est bon moyen mnémotechnique de s'en souvenir. 


Mettons également autre chose en évidence. Si nous reprenons les deux équations de Cauchy-Riemann: 


Ou _ dv 
6x y 
(17.50) 
Ou : Et 
dy êx 
et que nous les dérivons encore une fois ainsi 
du dv 
2? y | 
(17.51 
Su av 
&° x 
et que nous sommons ces deux relations, nous avons alors 
u du 
a = > 
2 Frs (17.52) 
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Il en est de même avec v. Nous avons alors: 


Pu du Pv &v 
—= —+—=0 (1753) 


PRET a & 


Et nous connaissons très bien cette forme d'équations (équation de Maxwell-Poisson dans le chapitre 
d'Électrodynamique et de Newton-Poisson dans celui d'Astronomie.). Il s'agit d'une équation d'onde 
appelée aussi "équation de Laplace" (rien à voir avec celle vue lors de notre étude de l'hydrostatique!) et 
donnée par le laplacien scalaire (cf. chapitre de Calcul Vectoriel): 


Fu  d dv & 
Âge + = Ave 


a x? 


O| (17.54) 


Il est alors de tradition de dire que u est harmonique et nous pouvons arriver bien évidemment au même 
résultat avec v! Bon évidemment... nous le savions, puisque nous avons déjà étudié dans le chapitre sur les 
Nombres que les parties réelles et imaginaires d'un nombre complexe pouvaient être mises sous forme 
trigonométrique. 


Grâce à cette découverte, Riemann a ouvert l'application des fonctions holomorphes à de nombreux 
problèmes de la physique, puisque ces dernières équations sont satisfaites par le potentiel gravitationnel 
(équation de Newton-Poisson dans le chapitre d'Astronomie), par les champs électriques et magnétiques 
(équation de Maxwell-Poisson dans le chapitre d'Électrodynamique), par la chaleur en équilibre (par 
encore d'exemples sur le site) et par les mouvements sans rotationnel de certains fluides (pas encore 
d'exemples non plus sur le site). 


Exemple: 


Le potentiel d'un dipôle peut être décrit par la fonction holomorphe: 
LE =—+— 0755) 
Z E— 


La figure ci-dessous: 
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Figure: 17.8 - Représentation plane d'une fonction holomorphe bien connue... 


montre les courbes de niveau des fonctions harmoniques u(x, y) et v(x, y) données comme parties réelle et 
complexe de la fonction f{(z) de cet exemple. 


2.1. ORTHOGONALITÉ DES ISO-COURBES RÉELLES ET IMAGINAIRES 

Nous allons maintenant démontrer une propriété sympathique que les fonctions qui satisfont les 
conditions de Cauchy (donc les fonctions analytiques!) ont. Effectivement, rappelez-vous que nous avons 
vu plus haut la fonction: 


f@)=2? (756) 


qui donnait donc le diagramme suivant: 
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Figure: 17.9 - Rappel de la représentation plane des images d'une fonction complexe vue plus haut 


Eh bien les fonctions satisfaisant les conditions de Cauchy ont la propriété géométrique simple suivante: 
les lignes dont la partie réelle de la fonction est constante R{#{z)) = c* et les lignes dont la partie 


imaginaire est constante J{#{z)) =c* sont orthogonales les unes aux autres (pensez à la forme 
trigonométrique des nombres complexes cela aide à mieux visualiser!). 


En d'autres termes, les fonctions complexes analytiques sont des fonctions de transformation d'un 
domaine du plan dans un plan où les angles sont conservés. Nous disons alors que la fonction est une 
"transformation conforme". 


Pour la démonstration rappelons que nous avons démontré dans le chapitre de Calcul Vectoriel que le 


gradient d'une fonction f de IR? est donné par: 


et dans le cadre de notre étude des isoclines dans le chapitre de Géométrie Différentielle que le vecteur 
tangent aux isoclines de la fonction f sera toujours parallèle au vecteur du plan: 


et que ces deux derniers vecteurs sont perpendiculaires tels que: 
V(P)of =0 (17.59) 


Assimilons maintenant le vecteur (parallèle) tangent £, aux isoclines réelles: 


RF(Z) = u(x y}= cc" (17.60) 
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avec: 


et le vecteur normal aux isoclines imaginaires: 


JS (2) = vx. y) =c" (17.62) 


avec le gradient de v de composantes: 


= dv êv ; 
o-[è2) (17.63) 


En utilisant les conditions de Cauchy démontrées plus haut, nous avons pour cette dernière relation: 


w-[2.2)-(-22 (17.64) 
x à d & 


En comparant: 


: Ou Où + Ou Ou 
ê, | ; æ | et V(v) | à) (17.65) 


nous voyons donc que £, et Ÿ{v) sont parallèles (colinéaires). Et puisque £, est colinéaire aux isoclines 
réelles et que Ÿ(v} est perpendiculaire aux isoclines imaginaires, nous avons terminé notre 
démonstration. 


Le lecteur pourra prendre comme exemple la fonction: 
3 
f(z)=7" (17.66) 
détaillée mathématiquement et schématiquement plus haut! Mais pour changer un peu, prenons un 


exemple qui nous accompagnera tout au long du reste de ce chapitre et qui est la fonction holomorphe 
suivante: 


FfU)= 


1: 7 (17.67) 
Z 
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>assume(x,real,y,real); 
> 2:=1/(1+(x+ y)" 2); 
> F:=1/7; 

> u:=Re(F); 

> u:=evalc(u); 

> v:=Im(F); 

> v:=evalc(v); 

> with(plots): 


> pl:=implicitplot({seq(u=a,a=-5..5)},x=-5..5,y=-5..5,numpoints=1000): 


> p2:=implicitplot({seq(v=b,b=-5..5)},x=-5..5,y=-5..5,numpoints-1000,color=green): 


> display([p1,p2]); 


Figure: 17.10 - Représentation plane d'une fonction holomorphe importante 


3. LOGARITHME COMPLEXE 


Nous devons trouver pour toutes les fonctions construites dans IR leur équivalent dans € tout en sachant 


que si nous réduisons le cas de € à IR nous devons retomber sur nos pattes! 


Pour cela, commençons par la fonction la plus classique et scolaire qui est donc le logarithme. 


De la même manière que nous avions construit le logarithme comme étant par définition (!) la fonction 
réciproque de l'exponentielle naturelle £* dans le chapitre d'Analyse Fonctionnelle, nous partons d'abord 


de: 


où z est donc un nombre complexe et nous allons définir le logarithme complexe qui doit se réduire au 


logarithme naturel si z n'a pas de partie imaginaire! 


Donc par définition le logarithme complexe sera: 
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w=e" &z= log(w)| (17.69) 


et sur l'ensemble de ce site, le logarithme complexe sera différencié du logarithme réel par un L 
majuscule! 


Écrivons z et w sous la forme d'Euler vue dans le chapitre sur les Nombres: 


fav) _ 


w= x+iy = r(cos 9 +i sin 9) = [wl -8 lwl(cos(arg(w)) +i sin(arg(w))) 


(17.70) 
Z=u+iv 


Nous avons alors: 
w=Ee = r(cos 8 +i sin 9) = = te) = gt (cos v+isin v) (7.71 
Par correspondance, nous trouvons immédiatement: 
r=fm|=e uit) et v=ag(w)=8+27& (1772) 
avec & e &. Il vient alors: 
z=ut+iv=in(r)+i(89+27k)= Log(w) (17.73) 


Donc: 


z= Log(w) =in(r)+i(8+27k)| (1774) 


ou autrement écrit: 


Log(w)= In [wl +i arg{w)| (17.75) 


Donc si w n'a pas de partie imaginaire, nous retombons bien sur nos pattes puisque arg(w) devient nul. 


Une grosse différence est mise en avant donc entre le logarithme des nombres complexes et réels: ces 
premiers peuvent prendre plusieurs valeurs à cause de l'argument. 


Nous vérifions bien par ailleurs maintenant que: 


gloetw) 2 hiiltae(e) 2 iv ia) 2 | 2e) D (1776) 


4. INTÉGRATION DE FONCTIONS COMPLEXES 


Nous venons de voir précédemment comment vérifier si une fonction complexe f{z) était dérivable (elle 
doit au moins respecter les équations de Cauchy-Riemann) en tout point. 


Maintenant voyons le cas contraire qui est. l'intégration! 


Nous avons bien évidemment en reprenant les notations vues dans le chapitre de Calcul Différentiel Et 
Intégral: 
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F(z)= M6 (17.77) 
soit sous forme explicite: 


F(z)= [ fx +iy)d (x +iy) = Ju +iv}(dx +idy) 
: [ [tsar wap) | il (vx +udy | (17.78) 
= [uax-[vy +ifux +i[udy 


Bon cette expression établie, donnons une petite explication quant à sa lecture: 
1. Nous savons que u et v dépendent tous les deux dans le cas général de x et y. 


2. Nous savons que u et v représentent (voir exemples au début du chapitre) des courbes fermées ou 
ouvertes ainsi que des droites lorsque x (ou respectivement y) est fixé et que l'autre variable associée, elle 
varie! 


Donc chacun des termes comportant une intégrale dans l'expression écrite ci-dessus est une intégrale 
curviligne sur une famille de courbes ouvertes ou fermées (dont un cas particulier est des droites...)! 


Cette intégrale peut être évaluée en utilisant le théorème de Green dans le plan (cf. chapitre de Calcul 
Vectoriel) si nous considérons le cas particulier d'un chemin curviligne fermé tel que: 


F(2)= (uax-vay)+iŸ(vax+udy) (17.79) 
Abordons d'abord la partie réelle: 


Nous avions effectivement démontré (il est très fortement conseillé de relire ce théorème de Green) dans 
le chapitre de Calcul Vectoriel que: 


Barr ga) [[e-% as L-2 (17.80) 
ÿ ÿ 


Ce qui s'écrit dans notre situation: 


f. _ | = 1 AC) _ 0@) — 
Diudx+(-vdy I = > Je 


e[ Ou 
|| —+— |aéxdy (1781) 
s\% © 


Or, si la fonction est holomorphe et satisfait donc aux équations de Cauchy-Riemann nous avons 
immédiatement: 


ne dxdy = 0 
x © 


——,_—— 
aÛ 


dax + (—v)dy) =- [ 


#5 


(17.82) 


Ainsi notre intégrale se réduit dans le cas particulier d'un chemin fermé à: 
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F(z)= iQ (vx +udy) (17.83) 


Et... réutilisons le théorème de Green: 
Gi dv 
b(vax +udy) = [ É = z dxdy (17.84) 
$ 6x y 


Or, si la fonction est holomorphe (donc pour rappel dérivable en tout point du plan complexe ou d'un 
sous-ensemble ouvert de celui-ci) et satisfait donc aux équations de Cauchy-Riemann nous avons 
immédiatement: 


et nous obtenons ainsi le "théorème de Cauchy", ou "théorème de Cauchy-Goursat" dans sa version 
généralisée aux fonctions non continues, qui dit que si une fonction est holomorphe (satisfaisant donc les 
équations de Cauchy-Riemann) et intégrée sur un contour fermé alors: 


IPod = fu +ivar = 0] 7060 


Comme corollaire (sans démonstration), toute fonction qui satisfait à la relation précédente est 
holomorphe (dans tout le plan complexe ou un sous-ensemble ouvert de celui-ci). 


Ce résultat permet dans certains domaines comme la physique quantique des champs (on pense au 
potentiel de Yukawa qui n'est pas traité pour l'instant sur ce site) de calculer des intégrales définies réelles 
compliquées en utilisant la propriété ci-dessus. L'idée étant lors du choix du contour fermé de l'intégrale 
curviligne de s'arranger à faire apparaître l'intégrale définie réelle recherchée comme étant une partie 
seulement du chemin (en la généralisant au cas complexe) et de par l'égalité avec zéro en déduire sa valeur 
grâce aux autres parties de l'intégrale du chemin choisi (parties qui sont évidemment simples à calculer). 


En d'autres termes, il s'agit de la calculer par différence. Toute la difficulté résidant dans la pratique à 
trouver la fonction f{z) et le contour fermé permettant de faire apparaître la fonction f{x) de l'intégrale 
définie recherchée... 


À l'aide de ce résultat, faisons un exemple scolaire important qui nous sera utile par la suite (mais qui n'a 
aucun rapport avec le cas du calcul d'une intégrale définie réelle). 


Calculons: 


d 
$— (17.87) 
Z 


Pour cela, nous allons utiliser la simplification qui consiste à se rappeler (cf. chapitre Nombres) que: 


Donc: 
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dz=rie®48 (17.89) 


Nous pouvons alors écrire l'intégrale curviligne comme: 
dz prie®d8 . 
b—-[ 5 -ifas (17.90) 
z r id 


Or comme sur un chemin fermé dérivable en tout point (donc sans sommets) l'angle à parcourir pour faire 
un tour complet ira nécessairement de 0 à 2x. Il vient alors: 


‘es T4 =27i (1791) 
0 


Avant de continuer remarquons un fait intéressant et important: Une intégrale (on ne parle pas de la 
primitive mais de l'intégrale!) d'une fonction du type 1/x dans IR ne serait pas calculable. Or si nous 
généralisons le concept à €, nous voyons que nous contournons.. (le jeu de mots...) la singularité via une 
intégrale curviligne qui entoure la singularité. Et... et. dans notre calcul précédent z pourrait tout à fait 
n'avoir que la valeur réelle et pas l'imaginaire. Donc l'intégrale de 1/x devient alors calculable et a un 
résultat dans les complexes ce qui est remarquable! 


Certains mathématiciens interprètent cela en figurant que 1/X est une projection plane d'un espace 
tridimensionnel dont l'axe imaginaire est perpendiculaire au plan 2. D'où le fait que 1/x soit intégrable 
dans €... mais bon c'est une interprétation. 


Enfin, indiquons que 1/z est holomorphe sur tout le plan complexe excepté en 0 (la dérivée étant la même 
que pour 1/x). Elle n'est donc pas €-différentiable! 


Ceci étant fait, faisons un cas important et similaire avec l'intégrale curviligne suivante: 


dz 
$ (17.92) 


Z — Zÿ 


où Zÿ est un nombre complexe constant. Posons: 
Lo pin AE Li _ noi? nn 
Z—Zp = PE mn me — dz = pie” d@ (17.93) 
g 


Nous pouvons alors écrire si nous faisons qu'un seul tour dans le sens inverse des aiguilles (sens 
antihorlogique ou trigonométrique) d'une montre: 


= . ae =ifap- 2#i (1794) 
0 


qui n'est valable à nouveau que si notre chemin d'intégration évite Z sinon quoi il y a une singularité. 
Cette dernière intégrale est donc une petite généralisation simpliste de la précédente. 


Maintenant montrons le théorème important qui nous intéresse au fait depuis le début de ce chapitre en 
utilisant les nombreux résultats démontrés jusqu'ici! 
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Nous savons que si une fonction f{(z) satisfait aux équations de Cauchy-Riemann, alors si nous évitons 
soigneusement la valeur z; (comme dans les calculs précédents), l'expression: 


F(z)- fo) 


(17.95) 


est aussi dérivable en tout point excepté en z (donc l'expression n'y est plus holomorphe) qui est appelé 
une "singularité" 


Effectivement, prendre une fonction holomorphe f{(z) satisfaisant Cauchy-Riemann et en soustraire une 
constante ( f{z)) ne change en rien le fait que l'expression (en l'occurrence le numérateur dans dans 


relation précédente) restera holomorphe. Enfin, multiplier celle-ci par une fraction (dénominateur de la 
relation précédente) qui est elle aussi holomorphe donne une fonction holomorphe. Mais des singularités 
peuvent alors apparaître, nous parlons alors de "fonctions méromorphes" (il s'agit du rapport de deux 
fonctions holomorphes). 


Remarque: Une fonction méromorphe est une fonction holomorphe dans tout le plan complexe, sauf 
éventuellement sur un ensemble de points isolés dont chacun est un pôle pour la fonction. (Voir plus 
loin pour la notion de pôle) 


Dès lors, si nous en prenons l'intégrale curviligne sur un chemin fermé évitant de passer par Z, le 
théorème de Cauchy nous donne immédiatement (voir la démonstration plus haut): 


pl LED 0 (ro) 


Z —Zh 


Or, ceci s'écrit aussi après réarrangement des termes: 


$/@ de = f (en —— à _——. 
Z —Zÿ Z—Z) 


Soit: 


1 go, 


1 & 272 (17.98) 


Or, nous avons démontré plus haut que: 


dz . 
$ = 27 (17.99) 
£— Zg 


EL 


Il vient alors le résultat appelé "théorème intégral de Cauchy", ou plus rarement "formule de Cauchy", 
(dont il existe une forme généralisée que nous démonterons plus bas): 


 (Z) = tes (17.100) 


ae T2 
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Au fait, dans la pratique toute la subtilité est de pouvoir ramener une fonction g(z) holomorphe (qui 
satisfait donc les équations de Cauchy-Riemann) en la manipulant à une forme du type: 


JG) 
Z 


2) 


g(z) = 


(17.101) 


quand c'est possible. alors le calcul de son intégrale curviligne (de chemin fermé) devient extrêmement 
simple puisqu'elle sera égale à: 


27%f(Zo) (17.102) 


de par le théorème intégral de Cauchy! 


Remarques: 


R1. Nous savons donc calculer la valeur d'une intégrale curviligne d'une expression non holomorphe 
mais dont le numérateur lui l'est. 


R2. Attention! Le signe de la valeur d'une intégrale curviligne va dépendre du sens dans lequel on 
parcourt son chemin d'intégration. Si le sens est direct (c'est-à-dire "antihorlogique" ou encore 
"trigonométrique") son signe sera positif; si au contraire le sens est horlogique son signe sera négatif. 
Vous vous dites sans doute que cette précision est sans intérêt vu que cette valeur est généralement 
nulle. Certes, mais nous verrons plus loin l'importance de cette spécification lorsqu'il sera question du 
calcul des résidus. 


Il y a une relation équivalente pour la dérivée f'{z5) à celle donnée par le théorème intégral de Cauchy. 
Voyons cela: 


vs ue Jo +h) - fo) 
Fe k 


. (a +) _ f Go) 
hr hr 


ni LL p—1® 3-1 470 z| 
k30 4 L27i  z—(z0 +4) 2" Z-Z 


S J(z) lire A HOES ‘0 (17.103) 
jar on Zo — al pr den (EL OE - | 


LD) im À (/ (Go +) — (0) 


Z—Zg — Z —Zÿ 


 L fo G-2)_ gs Ode + 

k027h |" z-z-h(z-2z) Z—Zn (Z—-Zp —) 

Lim 1 PIE 2)- C2 0 1 god 
k0 27h (Z — Zn — #)(z —-20) k30 27h Ÿ (Z— 25 — k)(z —Zo) 


Donc: 
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1 cz 
JF Zo) = her (17.104) 
en continuant ainsi, nous avons: 
M. 2 $ JG) 
d (Zn) — D mi RE 
(17.105) 
ms 6 p SO 
Go)= 27 ÿ (2-2) 


Bref, nous remarquons donc que: 


(D €Z 0)= 


(17.106) 


d'f SEE - f——- J() 


> z)* 


qui n'est autre que le "théorème intégral de Cauchy généralisé". 


Ce résultat est très puissant car il montre que les fonctions holomorphes sont infiniment dérivables (à 
cause du dénominateur), soit analytiques, et il est beaucoup plus difficile de trouver un théorème 
équivalent avec des conditions aussi simples pour les fonctions réelles. 


Si nous revenons maintenant à notre développement de Taylor d'une fonction complexe: 


f@)= 2e 


ñ 
—Zo) (17107) 


humm... et que voyons-nous ici? Eh bien cecil!: 


Sing Jo 
TOR a) y e—20)" 
_IO _ (17.108) 
D nd 2)" = De(e-20) 


Il en découle la relation suivante appelée "série de Laurent à puissances positives" (il en existe une 
version plus généralisée que nous allons démontrer plus loin): 


+0 
J@)= 5 c(z-2)"| (17.109) 
r=Ù 


qui donne donc l'expression formelle d'une fonction complexe sous forme de série infinie de puissances 
entières à proximité d'un point Zÿ du plan complexe avec donc: 


PROS HOMO) 
a om 


{z- z KT Al 


(17.110) 
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En se rappelant que 4" #{z \/ 47" s'écrit de manière équivalente Q , Nous constatons que 
PP q 0 q 0 q 


l'ensemble des deux relations précédentes nous redonne le développement en série de Taylor que nous 
avions obtenu en analyse réelle (cf. chapitre de Suites et Séries) et qui était: 


_l TR) 


(17.111) 


F@)= L 


Ainsi, les séries de Taylor ne sont qu'un cas particulier des séries de Laurent. 


Ceci est assez remarquable comme résultat car cela montre aussi que nous pouvons utiliser l'intégrale 
curviligne sur le plan complexe pour calculer les coefficients £, de la série de Laurent au lieu de calculer 
les dérivées d'ordre n de la fonction f si ces dernières s'avéreraient trop compliquées à déterminer. Ou 
inversement... calculer une simple dérivation au lieu de calculer une intégrale curviligne casse-tête 
(typiquement le cas en physique) en utilisant le fait que: 


ue F() 


(z- z AT xl 


Le seul point malheureux étant que cette dernière relation n'est calculable que si nous arrivons à mettre la 
fonction dans l'intégrale curviligne sous la forme: 


J(z) 
(17.113) 
(z . 2 
où n est un entier positif ou nul. Ceci est franchement loin d'être aisé dans la grande majorité des cas! 
L'idée serait alors de trouver un chemin général pour l'intégrale curviligne, valable pour toute fonction f{(z) 
tel que ce dénominateur (qui contient en plus une singularité en Z,) disparaisse. Ce serait l'idéal... mais il 


nous faut une piste. et celle-ci va venir de l'étude de la convergence des séries de puissances complexes. 
Voyons de quoi il s'agit avec une approche qualitative! 


4.1. CONVERGENCE D'UNE SÉRIE 


Nous avons vu dans le chapitre de Suites et Séries que nombre de fonctions réelles pouvaient être 
exprimées en série de Maclaurin (cas particulier des séries de Taylor en x = Ô ) sous la forme: 


co 
f(x)= 74e (17.114) 
k=0 


Nous y avions également montré, uniquement par l'exemple, que ce développement en série de puissances 
infinie n'était valable pour certaines fonctions réelles que dans un certain domaine de définition appelé 
"rayon de convergence". 


Même si ce rayon de convergence peut être déterminé plus ou moins facilement au cas par cas, il y a 
certains exemples déroutants qui ne pouvaient pas au début du 19ème siècle être compris sans l'analyse 
complexe. 
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Voyons un exemple simple pour comprendre de quel type de problème il s'agit. Considérons pour cela les 
deux fonctions: 


et A#(x)= 


(x) = 
S + 1+x° 


(17.115) 


et avant de continuer notre exemple, rappelons que nous avons démontré dans le chapitre de Suites et 
Séries la relation: 


UG —Ünh 1=g 


S, = Up + +üo +.u, = =üp—— (17.116) 


relative à une série géométrique, c'est-à-dire une série dont les termes sont du type: 
_ # 
Men (7117) 


Il vient dès lors immédiatement si # — © et 4 €]-1,+i : 


co 
Se = 49 + +ü2 +... +uo = Du ——— 
#=0 1-g -4 Î-g 


2 
Il 
Es 
oO 
Il 
Es 
o 
Il 
F2 
NI 
ns 
= 
(ee) 
Nez 


Si #y = 1, nous avons: 


D'ux=) upg =) g =— (17.19) 

0  K=0 0 1-4 
Donc si nous changeons la notation, nous avons: 

co 
= 92" (17.20) 
Il vient alors immédiatement: 
go=Z(PY = Tr et h()= DR Y = Dr (17121) 
x n= n=0 n=— 

Donc les deux fonctions g(x) et h(x) précédentes sont définies pour un développement en série infinie de 
puissances uniquement dans un rayon de convergence x €]-1,+1[. 
Nous obtiendrions donc le même résultat en faisant un développement en série de Maclaurin! 
Nous voyons trivialement qu'il y a pour g(x) deux singularités qui sont x = {-1,+1} par contre, 
basiquement nous n'en voyons pas trivialement pour h(x) si nous raisonnons uniquement dans IR donc il 
peut être difficile pour cette dernière fonction de comprendre l'origine du rayon de convergence. 


Effectivement, si nous traçons ces deux fonctions dans IR avec Maple 4.00b nous obtenons 
respectivement: 
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Figure: 17.11 - Représentation dans Maple 4.00b des fonctions g et h 


d'où le problème de savoir pourquoi il y a quand même implicitement un rayon de convergence 
x €]-1+1[ pour h(x)??? 


Une manière encore plus flagrante de mettre en évidence le problème, c'est de montrer l'approche de ces 
deux fonctions par un développement en série de Maclaurin avec dix termes: 


Pour g(x) nous avons: 


with(plots): 

> xplot:= plot(1/(1-x12),x=-5..5,thickness-2,color-red): 
> tays:= plots[display](xplot): 

> for i from 1 by 2 to 10 do 

> tpl:= convert(taylor(1/(1-x12), x=0,i),polynom): 

> tays:= tays,plots[display]([xplot,plot(tpl,x=-5..5,y=-2..2, 
> color=black,title-convert(tpl,string))]) od: 

> plots[display]([tays],view=[-5..5,-2..21); 


2 


Figure: 17.12 - Représentation plane de la fonction g pour visualiser le problème 
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où nous voyons bien que la série de Maclaurin (ou l'expression en série de puissances) ne converge pas en 
dehors de x €]-1,+1[ ce qui peut être intuitif à cause des deux singularités. 


Pour h(x) nous avons par contre: 


>with(plots): 

> xplot:= plot(1/(1+x12),x=-5..5,thickness-2,color=red): 
> tays:= plots[display](xplot): 

> for i from 1 by 2 to 10 do 

> tpl:= convert(taylor(1/(1+x12), x=0,i),polynom): 

> tays:= tays,plots[display]([xplot,plot(tpl,x=-5..5,y=-2..2, 
> color=black,title-convert(tpl,string))]) od: 

> plots[display]([tays],view=[-5..5,-2..21); 


-2 
Figure: 17.13 - Etonnamment, ici la série de Maclaurin ne converge pas 
Le) Le) 


où nous voyons bien que la série de Maclaurin (ou l'expression en série de puissances) ne converge pas 
non plus en dehors de x €]-1,+1[ ce qui était déstabilisant et contre-intuitif au début de l'histoire de 
l'analyse réelle. 


Aujourd'hui même un élève du secondaire sait qu'il est possible de raisonner aussi dans € et que R CC. 
Donc l'analyse réelle n'est qu'un cas particulier et restreint de l'analyse complexe. 


La singularité pour h(x) dans € vient du fait que celle-ci s'écrit : 


(17.122) 


1 
he) == - 


+Zz 
et qu'il y a donc deux singularités pour Z = {-i,H} ce que nous voyons bien si nous représentons: 


1 
1+z° 


(17.123) 


ho) | 
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avec Maple 4.00b (heureusement que nous avons maintenant l'équivalent d'un microscope dans la 
mathématique avec Maple….): 


>plot3d(abs(1/(1+(re+[*im}\2)),re=-3..3,im=-3..3,view=[-2..2,-2..2,-2..2],orientation-[-130,70] 
,contours=50,style-PATCHCONTOUR,axes=frame,grid=[100,100],numpoints-10000); 


Figure: 17.14 - Représentation complexe de la fonction h pour mettre en évidence la raison de la divergence 


où nous discernons les deux singularités sur l'axe imaginaire et la fonction h(x) sur l'axe réel (entre les 
deux pics). Donc lorsque nous développons une fonction en série, nous concluons que son rayon de 
convergence est défini par tout le plan complexe et non par l'axe traditionnel de l'analyse réelle. 


Il est ainsi plus naturel de comprendre pourquoi nous parlions dans le chapitre de Suites Et Séries de 
"rayon" car vu du dessus, nous avons dans le plan complexe: 
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———— KR rayon/disque de convergence 
sur le plan complexe 


Figure: 17.15 - Représentation des différents rayons de convergence 


d'où le fait que nous parlons tantôt de disque de convergence (ouvert) et tantôt de rayon de convergence 
(ouvert). Par ailleurs, nous remarquons sur le graphique que le domaine de convergence est connexe (tout 
couple de points du domaine de convergence peut être relié par une droite qui est dans le domaine de 
convergence). 


Remarque: Rappelons qu'un sous-ensemble, intervalle ou disque "ouvert" signifie que nous n'en 
prenons pas les bords. 


Nous comprenons alors mieux pourquoi la série de Taylor ne convergeait pas trivialement pour (x): elle 
doit converger sur tout le disque de convergence du plan complexe et pas seulement converger sur l'axe 
réel! 


De tout ceci, nous déduisons que notre série de Laurent à puissances positives démontrée plus haut: 
+0 
J@)= 5 c,(z-2) (17.124) 
r=Ù 


ne converge pas forcément, sans surprise….., sur tout le plan complexe (au même titre que les séries de 
Taylor sur la droite réelle puisqu'il s'agit de l'équivalent!) mais parfois uniquement dans un sous-domaine 
(connexe?) ouvert de ce plan autour de Z4 (qui dans l'exemple particulier pris ici valait donc: 0). 


Avec notre fonction h(x) exprimée en utilisant un développement de Maclaurin sur 5 termes, nous voyons 
immédiatement avec Maple 4.00b que sur les bords du carré inscrit au disque de convergence, la série ne 
converge plus et nous y devinons le début des deux singularités: 
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>plot3d(abs(1-(re+[*im)\2+(re+1*im}\4-(re+[*im)}\6+(re+[*im)\8),re=-0.7..0.7,im=-0.7..0.7,view= 


[-1.5..1.5,-1.5..1.5,0..1.5],orientation=[-130,70],contours-50,style-PATCHCONTOUR,axes=frame,grid= 
[100,100],numpoints=10000); 


Figure: 17.16 - Zoom sur la représentation complexe afin de comprendre la raison de la divergence 
un peu en dehors du disque de convergence, nous avons évidemment un peu n'importe quoi: 
>plot3d(abs(1-(re+[*im}\2+(re+1*im}\4-(re+[*im)\6+(re+[*im)\8),re=-3..3,im=-3..3,view= 


[-1.5..1.5,-1.5..1.5,0..1.5],orientation=[-130,70],contours-50,style-PATCHCONTOUR,axes=frame,grid= 
[100,100],numpoints=10000); 
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-1.5 


-15 
Figure: 17.17 - Cela diverge.….. (stalactites???) 


Il y a quand même quelque chose d'intéressant à essayer. puisque nous sommes maintenant sur un plan, 
et non plus sur une droite, il nous est possible de faire le développement de Taylor autour d'une 
singularité Z, en déformant le disque convexe en une couronne simplement connexe telle que présentée 
ci-dessous (la couronne étant aussi la géométrie simplement connexe la plus simple découlant de la 
déformation d'un disque): 
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Figure: 17.18 - Représentation de la déformation d'un disque en une couronne 


L'intérêt de ceci est de pouvoir déformer le domaine de convergence sur tout le plan complexe en évitant 
(contournant) toutes les singularités. Ainsi, contrairement aux séries de Taylor qui ne sont valables que 
sur un intervalle de l'axe des abscisses, nous aurions un nouveau type de série décrivant une fonction 
absolument partout, c'est-à-dire avant ET après (donc autour...) les singularités! 


Donc évidemment nous allons imposer que dans la couronne déformée ci-dessus la fonction soit toujours 
holomorphe et analytique (comme dans le disque convexe initial). Avant de déterminer ce sur quoi nous 
allons tomber (série de Laurent généralisée), il nous faut d'abord faire une étude de la décomposition d'une 
intégrale en chemins: 


5. DÉCOMPOSITIONS EN CHEMINS 


Les intégrales curvilignes comme celles données précédemment peuvent aussi être écrites sous une autre 
forme assez classique et souvent utilisée dans la pratique. 


Voyons cela. D'abord, nous venons de démontrer dans le cas particulier d'une fonction holomorphe que: 
MOT =0 (17.125) 


mais un chemin fermé peut être vu comme un chemin ayant un aller et un retour: 


Page: 1246/4839 


[v3.0 - 2013] 


Figure: 17.19 - Représentation d'un chemin fermé avec son aller-retour 
Nous avons alors: 
[roë-[roë-0e [rade [fo (716 
ñ # # # 


Et maintenant vient ce qui nous intéresse. pour cela concentrons-nous sur une des intégrales curvilignes 
du type: 


[fe (17.127) 
Fr 


Nous savons (1ère forme d'expression) que tout nombre complexe z du type: 

Z=X+HiY (17.128) 
peut être (2ème type d'expression) écrit sous la forme: 

ZÜx,y) = x+iy = r(cos 8 +i sin 8) = re® = z{r,6@) (17.129) 
et pour intégrer sur un chemin, rien ne nous empêche d'en choisir un où r serait fixe (le module) et 
8 variable (nous n'aurions pas pu faire cela avec la première forme d'expression car en ne faisant varier 
que la partie imaginaire ou réelle, nous ne pouvons pas obtenir de courbe alors que cela est possible avec 
la forme d'Euler d'un nombre complexe)! 
Nous avons alors: 
= roiô 2 

z(8)=re" (17.130) 

Nous pouvons dès lors écrire: 


MO 2IHCO) ORAN 
F F 


et comme: 


AOË = = de =7 (848 (17132) 
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d'où: 


HO ÆAIMHCOAO" CAES) 
F F 


ce que nous retrouvons souvent sous la forme suivante dans la littérature: 


[H07231F140)2071Rtren 
F F 


Cette relation va nous être maintenant utile à démontrer un résultat nécessaire pour notre étude de la 
couronne. 


5.1. CHEMIN INVERSE 


Si C est une courbe allant d'un point P à un point Q, nous notons alors € la même courbe mais 
parcourue de Q à P. 


Paramétrisons € : 
Si C(t) est la courbe définie sur [a, b] nous définissons €" {£) la courbe définie sur [a, b] par: 
C@=C(a+tb-f) (417.135) 
En effet, nous avons alors bien avec cette paramétrisation: 
CT(a)=C(a+b-a)=C(b) et C'(b)=C(a+b-b)=C(a) (17.136) 


et lorsque t croit de a à b, a + b - t décroît de b à a. €” n'est donc que C mais parcourue dans le sens 
inverse. 


Nous avons alors en utilisant la dernière démonstration: 
[rec ac = [rc oo) co =[r(Cta+b-0) Ca+b-9@ (713 
€” b b 


Posons: 
u=a+b—ft (17.138) 
d'où: 
du =—dt (17.139) 


Nous avons alors: 
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a à 
[Cac = [Ca +b-2) Ca+b-9at = [ (CG) C'uX-du) 
C7 à a 


(17.140) 


= -[ f(C(&)). C'u)du = -[ (CIC 
Ce EC 


Donc si € et C sont les chemins d'une même fonction mais parcourus dans le sens inverse, nous avons 
en reprenant notre notation conventionnelle (attention dans le deuxième terme il est implicite que la 
paramétrisation est différente du premier!): 


[free =-[ 2 (17.141) 
y r 


[fc + [r@& = 0! G714) 
y Y 


Raison pour laquelle nous disons souvent que le signe de la valeur d'une intégrale curviligne va dépendre 
du sens dans lequel on parcourt son chemin d'intégration. Si le sens est direct (c'est-à-dire 
"antihorlogique" ou encore "trigonométrique") son signe sera positif; si au contraire le sens est horlogique 
son signe sera négatif (cf. chapitre de Calcul Différentiel Et Intégral). 


Soit: 


6. SÉRIES DE LAURENT 


Cette dernière relation obtenue, nous pouvons revenir à notre déformation du disque de convergence en 
une couronne. Nous rappelons que l'idée étant initialement d'avoir l'expression analytique d'une fonction 
sous forme d'une série de puissances infinie dans un domaine restreint autour d'un point singulier et tout 
ceci. afin de pouvoir calculer pour les physiciens des intégrales curvilignes complexes en passant par une 
méthode utilisant les propriétés des séries complexes! 


Commençons donc par le point (2), qui nous mênera plus facilement au point (1), en faisant un Zoom sur 
notre couronne: 


Figure: 17.20 - Zoom sur la couronne du début 


Page: 1249/4839 


[v3.0 - 2013] 


Nous avons donc si la fonction f est analytique et holomorphe dans la couronne de rayon extérieur R et 
rayon intérieur r, l'intégrale curviligne suivante dans toute la couronne: 


1 z 
F(z) = — ge ) dz' (17.143) 
27" z'-z 
où nous notons z le point où nous souhaitons connaître la fonction et z' la variable dont dépend f. Ce 
changement de notation se justifiera par la suite pour une raison purement pratique. 


La couronne peut donc être décomposée en 4 chemins: 


Jon LE fOaut fOant Ouest j 0 


= (17.144) 
27 _C, 272 


Si les deux segments €, et -C, sont infiniment proches, ils correspondent alors à un même chemin 
parcouru une fois dans un sens positif et une fois dans le sens négatif. Or, nous avons démontré plus haut 
que: 


[sex - lie —. 


Il en découle donc que: 


ft). fe), 
[& Me) de (17.146) 
Ce qui nous amène à écrire: 
LE à LE 1 JG), 1 pe). 
fG re a es 2 | nn J ne 
10 1 2 fe). is 
Lee se cf fé 10440 


où nous avons mis un "+" entre les deux derniers termes, car comme nous allons le voir de suite, le critère 
de convergence associé à la notation traditionnelle condensée de ce domaine d'étude, fait émerger 
automatiquement le signe "-". 


Pour les deux intégrales À ,.f, nous savons que la fraction peut s'écrire sous la forme d'une série 
géométrique déjà vue plus haut. Effectivement: 
1 1 1 1 
z'-z ('-Z%)+(2 7). Z'-Z) 1-2770 (7.148) 
Z'-Z 


en assimilant: 


Page: 1250/4839 


[v3.0 - 2013] 


Z —2Z 
X = Ÿ 


1e. (17.149) 
7 #0 


où comme nous l'avons vu, la convergence impose que: 
lz—20| < |z -2l (17.150) 
afin que x soit en valeur absolue inférieur à 1. 


Nous voyons alors apparaître la série géométrique infinie: 


2 n 
l Il Z—2Z Z—Z9 Z—Z 
— = LH À ++ | + | G7i5n 
Z—Z Z—Z Z —Zy Z —Zÿ Z —Zg 


Soit: 


++ ———— +... (17152) 


Pour revenir à: 
si= 1 (ÉD 
IIS: (17.153) 
27 © z'-Z 
FR 
nous avons en tout point z à l'intérieur du cercle de rayon R dont le bord est décrit par la variable z' et de 
centre Zy la convergence qui est assurée car: 
2-20] <lz'-20l 47154) 
Nous pouvons alors écrire: 


2 
Z —Zy ,E=20) 


1 Jo | 
AG 27 ] 769 + +..." (47155) 


2-2 (2-20) (2-#)  (z'-20 


Intégrant terme à terme, nous mettons en évidence le développement (déjà connu): 
co 
A()= > cafz 20) (7.156) 
= 


avec la définition des coefficients €,,, où n est un entier positif ou nul: 


17e à 


ler can 
27 nC-2) 


» (17.157) 
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Ce développement peut faire penser au développement de Taylor au sens où seules des puissances 


positives (ou nulles) de (z = Z) apparaissent, mais il n'en est pas un dans le cas de la couronne! En effet, 


€, ne peut pas être écrit cette fois-ci comme: 


_S (2) 
_ | 


€ (17.158) 


n 
puisque, par hypothèse, f{z) est supposée analytique dans la couronne seulement, et peut donc fort bien ne 
pas l'être à l'intérieur du petit cercle de rayon r, en particulier en z4, auquel cas f (ro) (Zn) peut tout 
simplement ne pas exister (répétons que z est strictement contraint à se trouver dans la couronne, soit 

r < {z| < À). Nous verrons plus loin ce qui ce passe quand f{z) est holomorphe dans ce disque et que, 


notamment, Z4 n'est pas un point singulier. 


Il nous faut encore traiter 7. Nous faisons alors le même type de développement que pour f , avec la 
différence que maintenant: 


z-z0>L'-2] (47159) 


lorsque z' parcourt le petit cercle de rayon r. Pour faire apparaître une série géométrique, il faut écrire cette 
fois-ci: 


D 1 l = 1 l 
Fe Fu (Z-Z)-('-2) Z-Z0 _Z 20 (17.160) 
Z —Zÿ 
d'où: 
1 1 1 1 | La) 2) 
z'-2z z'-z z'-z 
=- a ei 2) +. | 
2-Z  Z-Z%j_Z72% Z—Z) Z—Z) Z 2 Z—Z) (7.161) 
Z —Zÿ 
Soit: 
[l 1 2 1 
1 1 2-4 _(Z-2) (z-2) 
ee RC ET EEE LE (7.162) 
277 27% (z-x) (2-2) (2-2) 


Intégrant terme à terme, nous mettons en évidence le développement (nouveau): 
co 
Ji(2)= 7 cxfz-20)* (417.63) 
ml 
avec: 


1 ' —n-1l ' 
Cy = 2m 1/62) az (17.164) 
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En changeant n en -n dans la sommation pour jf; , nous avons pour la somme f (z)+ f (2): 


+0 
J@)= 7 cafz-2zo) (47.65) 
n=-© 
avec pour l'instant deux &,, distincts: 
1 J(z1 1 DE NA 
n>0 — Sn [ nH dZ" et Cne0 = O7 [re )(z-2) AZ (17.166) 
Ye (z = Z) x 


Nous allons voir maintenant que des deux relations peuvent être réunies en une seule! 


Si nous observons bien ces deux dernières relations, nous constatons qu'elles ne dépendent nullement de z 
(!) et c'est bien normal puisque les &,, sont les coefficients du développement en série de f{z) et ceux-ci 
sont les mêmes en n'importe quel point du domaine de définition de la fonction où celle-ci est analytique! 


Donc les deux contours (cercles) peuvent être fusionnés en un seul cercle tant que celui-ci est situé dans la 
couronne et a pour centre Zp: 


c _ _F@) y m0 El.) 


ñ . ns] (17.167) 
274 Ye (2 Z0 ÿ 


Par ailleurs, le lecteur attentif aura remarqué que ce contour n'a même pas besoin d'être un cercle 
finalement. Il peut être quelconque tant qu'il est fermé et qu'il se trouve dans un domaine analytique! 


Ainsi, on obtient les deux relations: 


+o 


JU@)= > &(z-2) 


n=—<(0 


NI 


(I 


7.168) 


e, = = [ PE 34 (a = 0,#1,+2,...) 


Les deux relations précédentes définissent la "série de Laurent" généralisée. Elle est remarquable et se 
distingue d'une série de Taylor au sens où elle contient toutes les puissances entières positives et 


négatives et les coefficients €, ne sont pas a priori exprimables avec les dérivées de f. 


La série de puissances # > Ô est appelée "partie régulière", celle des puissances négatives porte le nom de 
"partie principale". 


La série des puissances négatives converge uniformément partout à l'extérieur de Y, , celle des puissances 
positives à l'intérieur de y}. Au total le développement de Laurent converge uniformément dans le 
domaine commun, qui est la couronne et donc aussi sur le chemin unique #. 


Montrons maintenant un point que nous avions mentionné plus haut. Si le cercle ne contient pas de 
singularité, alors tous les coefficients: 
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1 nl ,, 
CneD = UGC — 20) ” d (17.169) 
à 


sont nuls. Notons d'abord que —-#-—1 est un nombre entier positif ou nul que nous noterons p tel que: 
1 ' 1 PF 1 
Cne0 — pen [fe )(z — 20) dz' pEN (17170) 
 d 


Nous avons alors l'intégrant suivant dans un chemin fermé: 


f@(z-2) (17.171) 


Or, si nous enlevons la singularité cela impose que f(zZ°} est holomorphe (et de toute façon c'est imposé 
par tous les développements initiaux sur les séries de Laurent). 


(z - z) est un polynôme à puissance positive et non nulle et comme nous le savons, tout polynôme 


satisfaisant ces conditions est dérivable au moins une fois sans faire apparaître de singularité. Ainsi ce 
terme est aussi holomorphe. 


En admettant que le produit de deux fonctions holomorphes est une fonction holomorphe et que le contour 
Fest fermé, nous avons alors en utilisant le résultat suivant démontré plus haut (pour une fonction 
holomorphe): 


bf()d=0 (7172) 


la conséquence immédiate suivante: 
' 1 P 1 1 1 ra 1 
[f)(z-2) d'=0 6,0 = [CC 20) dr'=0 (7172 
r r 


s'il n'y a pas de singularité dans le petit cercle de la couronne. Nous retrouvons alors dans ce cas un 
développement avec les seules puissances positives, les £,-1 étant cette fois équivalents à: 


(17.174) 


n 


SV (z) 
| 


conformément au théorème intégral de Cauchy généralisé démontré plus haut. À contrario, nous voyons 
bien que c'est la partie principale (quand elle existe) qui contient l'information sur le fait que f n'est pas a 
priori holomorphe dans le petit disque. L'existence de puissances négatives montre que f n'est visiblement 


pas bornée en Zp. 


La classification des singularités d'une fonction se fondera précisément sur la considération des 
caractéristiques de la partie principale du développement de Laurent centré sur un point singulier de cette 
fonction. 


Exemple: 
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Voyons donc à quoi ressemble la série de Laurent de notre fonction: 


(17.175) 


UD FT 


sur un domaine simplement connexe qui serait la couronne entourant la singularité i par exemple (nous 
aurions pu choisir la deuxième singularité -i maïs il fallait bien en prendre une...). Ce qui équivaut donc à 
chercher le développement en série de puissances de z-i. 


Nous allons procéder de la manière suivante: 


1 l 
J'{z)= 1. = Gien (17.176) 
Nous allons utiliser pour la suite: 
z+i 2i+(z-i) 71-25) (17.177) 


La deuxième fraction peut être exprimée en série géométrique si comme nous l'avons déjà vu: 


<1 (17.178) 


î 

—(z —i 

Et ) 
Il vient alors: 


l 


. : 2 ; 3 
ur EE CA) ES) 
——(z —i 
2 


Multiplions les deux membres de cette égalité par -i/2 et divisons les ensuite par z -i (le deuxième terme 
du dénominateur de la fraction initiale) pour obtenir pour le terme de gauche: 


Di 1 ii à 1 1 1 1 
1lg-n22i 2-iG-iz-i D+G-Dz-i 242472 

2 (17.180) 
_ 
_z2+#1 


et pour le terme de droite, nous avons: 


its) ( e-n-(i) (z-iÿ —.… (17.181) 


Nous avons alors au final pour notre série géométrique: 


1 HN NN, > . 
nn à _ à (sil - (#4) —.… (17.182) 
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Nous voyons donc sur cette série de Laurent autour de i de la fonction holomorphe f{(z) dans la couronne, 


apparaître les coefficients: 
.\2 . 3 
ee :) c --{}) (7183) 
_—] 2° Û 2 , l 2 » \ 


et nous avons avec Maple 4.00b: 


>plot3d(abs(-1/2*1/((re+l*im)-1)-(1/2}\2-(1/2)\3*(re-P*im)-(1/2)\4*(re-P*im)1\2-(1/2)\5*(re-[*im)\3) 
,re=-1.5..1.5,im=-1.5..1.5,view=[-2..2,-2..2,-1..2],orientation-[-130, 70] 
,contours=50,style-PATCHCONTOUR,axes=frame,grid=[100,100],numpoints-10000); 


-1 
Figure: 17.21 - Représentation de la série de Laurent 


où nous voyons que la série de Laurent nous permet d'exprimer f{z) dans un voisinage proche de la 
singularité i en prenant 5 termes. 


Idem si nous faisons la somme des deux séries de Laurent pour les deux singularités avec 7 termes: 


>plot3d(abs(-[/2*1/((re+l*im)-D-(1/2)\2-(1/2)\3*(re-P“im)-(1/2)\4*(re-L*“im)\2-(12}\5*(re-[“im}\3 -(1/2)\6* 
(re-P*im)\4-(12)\7*(re-Lim)\5+1/2*1/((re+*im)+1)+(1/2)\2+ 
(12)\3*(re+L*im)+(1/2}\4*(re+1*im)\2+(1/2}\5*(re+1*im}\3+(1/2)\6*(re+1*im}\4 
+(1/2)\7*(re+T*im)5),re=-1.5..1.5, im=-1.5..1.5, view=[-2..2,-2..2,-1..2],orientation=[130,70], 
contours=50, style=-PATCHCONTOUR, axes=frame,grid=[100,100],numpoints=10000); 
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4 
Figure: 17.22 - Somme des deux séries de Laurent pour les deux singularités 


et nous voyons que très vite en dehors des deux singularités tout diverge puisque les séries ne convergent 
que dans une couronne où la fonction y est holomorphe. Mais cela donne déjà une bonne idée visuelle des 
choses. 


7. SINGULARITÉS 


Nous avons donc vu juste précédemment qu'il était possible de calculer l'intégrale curviligne d'une 
fonction, sous condition d'analycité, sur le contour d'une singularité. Notre objectif va maintenant être 
d'améliorer cette approche. 


Nous avons déjà mentionné et mis en évidence dans nos démonstrations que l'intégrant dans le "théorème 
intégral de Cauchy" était de la forme: 


FC) 


Z —Zÿ 


(17.184) 


où f(z) est bien définie en zg. 
Le point z = z4 est bien évidemment une singularité de g(z) et celle-ci n'y est donc pas définie. 
Comme nous l'avons vu lors de notre démonstration des séries de Laurent, g(z) peut être exprimée sous 


forme d'une série de Laurent positive dans un disque de convergence (ou ce qui revient au même: en série 
de Laurent dans une couronne non centrée sur une singularité.) sous la forme: 
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et= À lrerlrese-2)4l fee +. 
Z —Zÿ Il 2l 17.1 
(17.185) 
= LE + fn) +2 ane — 20) + 
Z Zg ! 


Avant de continuer, il est d'usage en mathématiques de définir un petit vocabulaire conventionnel en ce 
qui concerne cette fois-ci les éventuelles singularités de f{z)! 


Rappelons au préalable que nous savons, et nous avons démontré, que toutes les informations sur les 
singularités de f{z) sont contenues dans la partie principale de la série de Laurent (les puissances 
négatives) définie sur la couronne entourant Z5: 


co 
2% C-n(Z 20)” (17.86) 
=| 


La classification ci-après porte sur les "singularités isolées", c'est-à-dire un point singulier où f{z) est 
analytique partout dans le voisinage de z, excepté en za. Cette classification, qui nous le verrons 


permettra de distinguer 3 types de points singuliers, nous sera utile lors du développement de la théorie 
des résidus plus loin. 


Définitions: 
D1. Lorsque la limite de la fonction | F4 (2) existe en Zn, nous disons que la singularité est un "point 
singulier éliminable" ou une "singularité apparente". 


Par exemple: 


È sin(z) 


Jf{z) (17.187) 
ne semble pas être définie en z = z3 = 0 mais nous avons un numérateur ayant une série de Laurent sans 
puissances négatives (donc une simple série de Taylor). Il vient alors en faisant la série de Maclaurin 
donc la série de Taylor en z = z3 = 0 en d'autres termes...): 
0 


: 1 3 2 
DÉCRET (17.188) 
Z Z 31 


Nous voyons que f{z) n'a finalement aucun terme en puissance négative et donc que nous avons éliminé la 
singularité (ou qu'elle n'en contient au fait pas... ce qui est facilement vérifiable avec Maple 4.00b). 


Donc une autre manière équivalente de définir une singularité éliminable, est de dire que le 
développement de Laurent de la fonction ne contient aucun terme en puissance négative. 


D2. Lorsqu'en Z, la limite de | f (2) n'existe pas, nous parlons de "singularité essentielle". 


Par exemple, Z = Ô est une singularité essentielle pour la fonction: 
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1 
fé@)=ez (7189) 


En effet, si z tend vers zéro en venant de l'axe réel positif, la fonction diverge, plus précisément, elle tend 
vers +0. Si z vient du côté R_, la fonction tend vers zéro comme le montre bien le tracé Maple 4.00b 
suivant: 


>plot3d(abs(exp(1/(re+1*im))),re=-5..5,im=-5..5,view=[-3..3,-3..3,-0.5..3],orientation-[-130,70] 
,contours=50,style-PATCHCONTOUR,axes=frame,grid=[100,100],numpoints-10000); 


Effectivement: 


1 n 
Ë ® z* (17.190) 


r=0 al x=0 Al 


Donc une autre manière équivalente de définir une singularité essentielle, est de dire qu'il y a un nombre 
infini de termes à puissances négatives dans la partie principale de la série de Laurent. 


D3. Lorsqu'en Zy la limite de | dE (z)| est +0, nous parlons de "pôle". 


Il s'agit de la dernière catégorie dans laquelle nous pouvons ranger une fonction qui n'est classable ni dans 
la première, ni dans la deuxième définition précédente. 


Donc une autre manière équivalente de définir un "pôle", est de dire qu'il y a un nombre fini de termes à 
puissances négatives dans la partie principale de la série de Laurent. Si ce nombre de termes est k, alors 
nous parlons de "pôle d'ordre k". 
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Remarques: 


R1. Nous disons parfois qu'une "singularité essentielle" est un pôle d'ordre infini. 


R2. Un pôle d'ordre 1 est appelé un "pôle simple". Un pôle d'ordre 2 est un "pôle double". 


Si nous reprenons notre exemple: 


1 
FiEl= (17.191 
1+2? 10 


Nous avons démontré plus haut que la série de Laurent de cette fonction en z5 =i était: 


1 sd ) , : —. 
aa -(e-o(ÿ'e-- ce 


Cette a donc un pôle d'ordre 1 en Z3 =# (et in extenso, nous devinons qu'elle en a un aussi en Zg = -i ). 
8. THÉORÈME DES RÉSIDUS 
Partons d'une fonction f{z) dont le pôle est d'ordre inférieur ou égal à k. 
Rendons-là analytique: 
#z)=(&-zŸ f(z) (719) 


(c'est-à-dire que nous avons pris une fonction f(z) que nous avons rendue analytique après élimination de 
ses pôles supposés en un nombre fini - ordre - inférieur ou égal à ken z). Cette fonction #{z) a alors un 


développement en série de Laurent dans un disque centré sur Zp . 


Comme nous l'avons vu plus haut, nous pouvons alors en utilisant la relation ci-dessous: 


#° (20) = d° ee - ET PE a de un 
écrire: 
; &-] 
ÉD (2) = ( =— pr & . 
0 


En utilisant f(z) sous l'intégrale, il vient: 


D o)= DT EdE (7100 
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Il faut bien analyser cette relation et comprendre qu'elle relie l'intégrale d'une fonction ayant des 
singularités avec la valeur en un point d'une fonction analytique n'ayant plus de singularités! 


Cette dernière relation peut se réécrire en réarrangeant les termes: 


free = 4 Go) 7197 


Et en exprimant g{*) {Z) en utilisant (autorisé car cette dernière fonction est analytique) le fait que: 


d*é(z 
D 5) = TE (17.198) 
Nous avons: 
_2ri d* é(zo) 
dz = ———— (17.19) 
$C) nn 


Soit en explicitant à nouveau #(z) : 


2%. F ue 


pro 


[e-2) 70] 


(17.200) 


IE =£ 


Cette dernière relation n'est pour rappel valable que pour UNE singularité isolée z4 (au cas où vous auriez 
oublié les concepts introduits lors de notre présentation des singularités) et où k vaut au minimum 1! 


Les mathématiciens définissent alors: 


d*1 


Res[f():z0]= 1 ——|G 2-29) *f@)] (17.201) 


nr 
Sn = Did 


comme étant le résidu de la fonction f(z) au point z = z4 étant une singularité isolée et ayant un pôle 
d'ordre k. Ou respectivement: 


Res[ (2):z0]= fr (17.202) 


où l'intégrale curviligne est donc centrée en z4. 


Remarquons que le terme à droite de l'égalité dans la relation précédente correspond au coefficient £_, de 
la série de Laurent. Effectivement: 


| ED 


j de 2 L neo 


1 
Œ'=— dz' (17.203 
ml (17.203) 


D'où: 
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Res| f(z):z0l = €C_j| (17.204) 


Remarque: Il vient donc qu'en une singularité isolée éliminable, le résidu est nul puisque comme nous 
l'avons vu plus haut, l'intégrale curviligne entourant un domaine sans singularité est nulle! 


Bref, la relation: 
PF (2)ar = 2mRes[f(z)za]=2%c) (17205) 


est très intéressante pour le physicien... car il y a donc une manière élégante lui permettant de calculer 
l'intégrale curviligne d'une fonction f(z) non analytique ayant une unique singularité isolée et ce juste en 
connaissant l'ordre de ses pôles! 


Par exemple si une fonction f(z) n'a qu'un pôle d'ordre 1, il vient alors: 


2m dr L 
HOT anale _7) Je]. = 27 lim [z-2)/@)] (417.206) 


et nous remplaçons donc Zy par la valeur voulue dans la parenthèse (z—2z4) et ensuite nous calculons la 
limite du terme entre crochets! 


Maintenant pour aller plus loin, rappelons que le contour de l'intégrale curviligne: 
bF()d 7207) 


et le chemin curviligne Ÿ de l'intégrale: 


CLS 


(17.208) 
(z 1 FN sh 


1 
__ 
x 


sont au fait confondus (identiques) et les coefficients c,, ne dépendent pas de z! La seule contrainte du 
chemin est qu'il soit fermé et dans un domaine analytique centré sur un point. 


Donc si nous avons plusieurs singularités isolées, entourées par des chemins curvilignes reliés tels que 
présenté ci-dessous sur le plan complexe d'une fonction ayant un pôle d'ordre 3 (donc trois singularités 
Zo:Z,22n0n éliminables): 
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Figure: 17.24 - Singularités multiples isolées entourées par des chemins curvilignes 


nous n'avons alors toujours qu'un seul chemin curviligne fermé mais dont les différentes singularités 
isolées sont reliées par des traverses où comme nous le savons, les chemins qui s'opposent, s'annulent! Et 
rappelons que les coefficients c,, sont les mêmes partout sur tout le chemin puisque celui-ci est dans un 
domaine analytique. 


Nous avons alors la version généralisée du théorème des résidus pour une fonction f ayant n singularités 
isolées: 


hf (za = 2m Res[ (z):z;] 
2=l 


| ÿha (17.209) 
RE LL PE 
Res[f@)]e din | -20 (| 


avec cette approche rigoureuse digne des ingénieurs. qui notent cette dernière relation parfois: 
b ft) =2#9 0" (17.210) 


où rest donc un résidu. C'est un résultat important dans le domaine de résolution d'équations 
différentielles associées à certaines transformées de Laplace inverses (cf. chapitre d'Analyse). Ce résultat 
intermédiaire nous permettra d'en obtenir un autre un peu plus loin dont l'importance est majeure pour le 
chapitre de Physique Quantique Corpusculaire. 


Exemple: 
Reprenons notre fonction: 


l 


Jz)= 
1+z 


7 (7211) 
Nous savons qu'elle a un pôle d'ordre 1 en z, =? et un pôle d'ordre 1 z4 = -3. Donc si nous prenons cette 


fois la série de Laurent dans un chemin qui entoure les deux singularités (et non plus qu'une seule) nous 
avons alors une fonction avec un pôle d'ordre 2. 
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Il vient alors pour ce cas particulier: 


bf(a = 2m TS Res[/(2):2,] (17.212) 
= 


avec donc n valant 2. 


Nous avons alors: 


ki 
Res[ SG); ]=Res[7():i]= lim L le -aN 7) | 


ss, en 
_. 1 dd . Ai 1 : 
ET | 2 a ue mn rl D 


. | 1 | LÉ. 
=lim| —|=--; 
sx | z +i 2 


et: 


4e 
Res[fG);2]=Res[f(-i]= 1 —|[e- 22) je) 


Ce) D& 


, lim | @+ 1 | «720 
241] = (z +i)(z — 5) 


1 FLE: 
= lim Le 4 
z—i (1-71)! {=D di 


Il 
LE 
LE 
15 
—— 
N 
(| — 
L. 1] 
(ST | 
Il 
ND 
LL] 


Nous pouvons vérifier cela avec Maple 4.00b: 


>readlib(singular): 

> singular(1/(1+712),z); 
> readlib(residue): 

> residue(1/(1+712),z=-D); 
> residue(1/(1+712),z=1); 


et dès lors: 


:z|= 0 d7215) 


143 


Au fait dans le cas présent, le théorème des résidus est nul car la fonction n'a pas de pôles à l'infini ce qui 
se vérifie puisque dans notre exemple: 


lim |f{z)|# oo 
Jim [fC )| (17.216) 


Les physiciens quant à eux diraient que la force ne travaille pas sur le chemin... 
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8.1. PÔLE À L'INFINI 


Nous avons dit juste précédemment que toute fonction qui n'avait pas de pôle à l'infini avait donc la 
somme des résidus de tous ces pôles qui était nulle. Ce résultat est très important en physique et mérite 
d'être approfondi! 


Il est assez facile de reconnaître le nombre de pôles. mais pour reconnaître les pôles à l'infini on risque 
de se faire prendre au piège. 


Considérons l'expression f{z)dz. Si z est au voisinage de l'infini alors 1/z se trouve au voisinage de 0. 
Posons: 


Nous avons alors: 


Donc le résidu à l'infini est tel que: 
Res|f(z);,0]= R[g(#,0] (17.219) 
avec: 


1 1 
g(é) = -7/() (17.220) 


Avec donc: 


x x 
1 à k | 1 à x 1 l _ 
Res[g(0:0]=1im — © 22 { (6-0) g(s) |= tin — 2 | © || 22 
es[g@:0] na Y e(e)] in | Æ F)] sus 


Cette dernière relation nous sera indispensable dans le chapitre de Physique Quantique Corpusculaire 
pour construire le modèle relativiste de l'atome d'hydrogène de Sommerfeld car nous aurons à y calculer 
une intégrale curviligne ayant un pôle. 


Voyons un exemple avec la fonction qui nous accompagne depuis le début de ce chapitre. C'est-à-dire: 


J)= 


(17.222) 
z2 +1 


Il vient alors: 


2 
Ê Ë 


“ii 14 


(17.223) 


Or nous reconnaissons immédiatement la fonction initiale au signe près et qui n'a donc pas de pôle en 0. 


Donc f{z) n'a pas de pôle à l'infini. 


Notes personnelles: 
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18. TOPOLOGIE 


L. topologie (du grec: discours du lieu) est un domaine extrêmement vaste des mathématiques dont 


il est difficile de définir avec exactitude l'objet dont elle fait l'étude tellement les domaines où elle existe 
sont variés (topologie de la droite réelle, topologie des graphes, topologie différentielle, topologie 
complexe, topologie symplectique,.…). 


Ce que nous pouvons dire dans un premier temps, c'est que dans ses fondements la topologie est très 
intimement liée à la théorie des ensembles, à l'étude de convergence des suites et séries, à l'analyse 
fonctionnelle, à l'analyse complexe, au calcul intégral et différentiel, au calcul vectoriel et à la 
géométrie pour ne citer que les cas les plus importants se trouvant sur le présent site web. 


L'origine de la topologie provient des problèmes qu'ont posé les progrès de l'analyse fonctionnelle dans 
l'étude rigoureuse des fonctions continues, de leur dérivabilité, de leurs limites en un point (fini ou non), 
de l'existence d'extremums, etc. dans des espaces de dimensions supérieures (au fait, implicitement la 
topologie a pour objectif de créer des outils qui permettent facilement d'étudier les propriétés des 
fonctions dans toutes les dimensions). Tous ces concepts, demandaient pour le mathématicien une 
définition rigoureuse de l'idée intuitive de proximité, tout particulièrement lors d'opérations sur ces 
fonctions. 


Nous allons essayer de dégager les structures qui permettent de parler de limite et de continuité. 
L'exemple fondamental que nous prendrons est le cas de IR (la droite de IR pour être rigoureux...). 


1. ESPACE TOPOLOGIQUE 


Les espaces topologiques forment le socle conceptuel sur lequel les notions de limite, de continuité ou 
d'équivalence sont définies. 


Le cadre est suffisamment général pour s'appliquer à un grand nombre de situations différentes: 
ensembles finis, discrets, espaces de la géométrie, espaces numériques à n dimensions, espaces 
fonctionnels les plus complexes. Ces concepts apparaissent dans presque toutes les branches des 
mathématiques, ils sont donc centraux dans la vision moderne des mathématiques. 


Si nous pensons à la droite achevée (droite finie), afin d'étudier les concepts susmentionnés, il va falloir 
que nous mesurions (imaginions..) des morceaux de celle-ci à la règle. Or, les mesures prises de 
certains intervalles ou de l'ensemble de la droite doivent pouvoir présenter certaines propriétés 
minimales que nous allons énoncer tout de suite. 


Définition: Soit un ensemble non vide X (la longueur d'une règle de plastique par exemple). Une 
"topologie 7" ou "espace topologique ! x, 7 1" sur X est une famille 7° de parties de X (de longueur 


de notre règle.) appelées "ouverts" V (comme les intervalles ouverts vus dans le chapitre d'Analyse 
Fonctionnelle) telle que les axiomes suivants soient vérifiés: 


A1. L'ensemble vide et X sont considérés comme des ouverts O et appartiennent obligatoirement à la 
famille de la topologie 7° (ces deux ouverts seuls constituent par ailleurs la "topologie grossière" la 
plus minimale satisfaisant à tous les axiomes): 


GeTet XÀET (18.1) 
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En d'autres termes, si nous imaginons notre règle en plastique, la mesure nulle (rigoureusement parlant: 
l'ensemble vide) doit appartenir à topologie définie sur la règle ainsi que la règle elle-même (vue comme 
sous-ensemble). 


A2. Toute intersection finie d'ouverts de 7° est un ouvert de 7: 


* 
F,7,,..v, € T implique f[VeT (182) 


il 


A3. Toute réunion d'ouverts de 7° est un ouvert de 7 : 


ñn 
F,7,,..,P, e T implique BL €eT (18.3) 


2=l 


Remarques: 


R1. Les mathématiciens notent fréquemment par la lettre O la famille des ouverts et F la famille des 
fermés. Convention que nous ne suivrons donc pas ici. 


R2. Les "fermés" d'une topologie sont les complémentaires des ouverts. Par conséquent, la famille 
des fermés contient entre autres X et l'ensemble vide. 


R3. Il n'y a pas de différence entre partie et sous-ensemble d'un ensemble. 


Le couple i x, 7 \ forme un "espace de Hausdorff" ou "espace séparé" si de plus la propriété suivante 
dite "axiome de Hausdorff" est vérifiée: 


A4. vp,ge À avec p “g, CL e F tels que rer er et F, nF, = 
Remarques: 


R1. Un exemple bien connu d'espace topologique est IR muni de l'ensemble F engendré par les 
intervalles ouverts (par la loi d'union), c'est-à-dire les intervalles ]a,bl. 


R2. Nous verrons une application très concrète des espaces de Hausdorff lors de notre étude des 
fractales dans la section d'Informatique Théorique. 


Définition: Si nous notons (X,O) un espace topologique, O désignant les ouverts de X, une "base", au 
sens topologique, de (X,0) est une partie B de O telle que tout ouvert de O soit réunion d'ouverts de B 
(c'est la même idée que les espaces vectoriels au fait mais appliquée à des ensembles. rien de bien 
méchant). 
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2. ESPACE MÉTRIQUE ET DISTANCE 


Définition: Un "espace métrique" noté (X,d) ou encore À, est par définition un ensemble X muni 


d'une application 4 : ZX x X = IR, appelée "distance" ou "métrique", qui satisfait les axiomes suivants: 
A1. Vx # y d{x,y) > 0 (positivité) 

A2. Vx,yeX d{x,y)=0& x= y (axiome de séparation) 

A3. Vx,y,ze À dix,z) < d(x,y)+d({y,z) (inégalité triangulaire) 


A4. Yx,ye À dix,y) = diy,x) (axiome de symétrie) 


Remarques: 


R1. Certains lecteurs verront tout de suite que certaines de ces propriétés ont déjà été vues dans 
d'autres chapitres du site lors de l'étude des distances entre points fonctionnels et lors de l'étude des 
normes (inégalité triangulaire démontrée dans le chapitre de Calcul Vectoriel - la symétrie, la nullité, 
la positivité, la séparation dans le chapitre d'Analyse Fonctionnelle). 


R2. Certains auteurs omettent l'axiome A1 ce qui est rigoureusement juste car découle trivialement 
de A3. 


R3. Un espace métrique sera en général noté (X,d) ou bien encore #,. Nous pouvons également le 
noter simplement X si la distance d ne peut être confondue. 


La "fonction distance" de x, y € Æ est donc notée habituellement dans le sens le plus général qui soit 
en mathématiques: 


d(x,y) (18.4) 


Si nous n'imposons pas l'axiome A2, nous disons que d est une "semi-distance" sur X et si nous 


LEA 


autorisons une semi-distance d à prendre la valeur +« , nous préférons dire que d est un "écart". 
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Remarques: 
R1. Si une distance d vérifie la propriété: 
Vx,y,z€E À dx,z) <max{d(x,y),d(y,z)}} (18.5) 


propriété plus contraignante que l'inégalité triangulaire dans certains espaces, nous disons que d est 
"ultramétrique". 


Un exemple de distance ultramétrique est l'arbre généalogique: 


Olivier 


Maurice 


Fabienne 


Figure: 18.1 - Exemple de distance ultramétrique d'un organigramme 


Nous avons les distances suivantes: 


d(Damiel Stéphane) = 4 
d{Renée Stéphane) = 4 
d(Renée,Fabienne) =8 (18.6) 
d(Damel,Fabienne) = 8 

d (Daniel, Renée) = 6 


Nous remarquons que les distances ne s'additionnent pas, mais que nous avons par contre: 
d(x,z) Smax{d(x,y},d(y,z)} (18.7) 
Ainsi: 


d(Daniel Fabienne) = max {d(Dani el, Renée), (Renée Fabienne)} 


(18.8) 
8 < max { 6, 8) 
R2. Soit (E,d) un espace métrique et soit Æ# - @ une partie de l'ensemble E. L'espace métrique 
(F,8) où & désigne la restriction dr,r de dà FXF CEÆEXE est appelé "sous-espace métrique" 
de (Ed) (il convient de vérifier que la distance d est équivalente à la distance 5 ). Dans ce cas, nous 


disons aussi que F est munie de la distance induite par celle de E. Nous notons simplement d la 
distance induite. 
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Exemples: 


ET. Si nous prenons pour X le plan, ou bien l'espace à trois dimensions de la géométrie euclidienne et 
une unité de longueur, la "distance" au sens usuel du terme est bien une distance au sens des 5 axiomes 
précédemment cités. Dans ces espaces, les trois points À, B, C satisfont comme nous l'avons démontré 
dans le chapitre de Calcul Vectoriel: 


d(A, 8) £ d(A, 0) + d(C,8) d(A,8) 2 l2 (4,0) +de, B)| (18.9) 


avec les autres inégalités obtenues par permutation circulaire de À, B, C. Ces inégalités sont bien 
connues par exemple entre les longueurs des côtés d'un triangle. 


E2. Si nous prenons # =R*, #e N > 1 et que nous dotons fp* d'une structure d'espace vectoriel 
euclidienne (et non pas non-euclidienne) et que nous prenons deux points: 


x=(%,2,.,24) Y=On,)2,..,7,) (18.10) 


dans *, la distance est donnée alors par (nous avons déjà démontré cela dans les chapitres d'Analyse 
Fonctionnelle et de Calcul Vectoriel): 


an) = Je =) + =) ++) 2 SG x) 810 
1] 


Cette distance satisfait aux 5 axiomes de la distance et nous l'appelons la "distance euclidienne". Nous 
pouvons prendre (c'est une propriété intéressante pour la culture générale), que toute relation de la 


forme: 
# 
dx» = 15 (GG) (812) 
il 


est aussi une distance dans pp* (sans démonstration). Dans le cas particulier avec # = 1, nous avons 
bien évidemment: 


dx, y) = [x - y| =max{x-y,y-x} (18.13) 
qui est la distance usuelle sur IR. 


Les mathématiciens font encore plus fort en généralisant encore plus (la démonstration a peu d'intérêt 
pour l'instant) la relation antéprécédente (en prenant en compte la définition même de la distance) sous 


la forme: 
Vpell+®]CR:6,(x,y)= ax (18.14) 
il 


qui est appelée "distance hôldérienne". 
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Remarque: Suite à l'intervention d'un lecteur nous précisons qu'en toute rigueur l'inclusion ci-dessus 
devrait être notée [1,0] c ÎR où jf est la droite achevée (précision également valable pour 


l'inégalité de Minkowski ci-dessous). 


Au même titre pour l'inégalité triangulaire, donnée alors par (cf. chapitre de Calcul Vectoriel}: 


3 3 3 
r,5eR*:|*+5|<f*|+|5| à (x +»)? € fe + dr (18.15) 
il il il 


La généralisation, de par la vérification de l'existence de la distance hüldérienne, nous donne la vraie 
"inégalité de Minkowski": 


# # # 
LYERpE(Le[CR 5 (try) 5 a 5 y (18.16) 
FI FI EI 


E3. Si nous prenons X = €, nous considérerons la distance: 
d(z,z) =|z-z] (18.17 


Ainsi, si z = a +ib = (ab) et z'=a'+ib'={(a"b") nous avons le module qui de la même manière que 
la norme dans fp?, forme une distance: 


d(z,z)=Af{a-a) +(b-b% (1818) 


E4. Considérons aussi Æ # Zi un ensemble arbitraire. Posons: 
8(x,y) =1six “y et d(x,y)=0 si X=}Y (18.19) 


Il est assez facile de vérifier que cette distance vérifie les 5 axiomes et qu'elle est de plus ultramétrique. 
Cette distance est appelée "distance discrète" et le lecteur remarquera que, par analogie, nous avons 
opté d'exprimer cette distance par le symbole de la fonction Dirac % (ce n'est pas innocent !!) plutôt 
que le traditionnel d. 


2.1. DISTANCES ÉQUIVALENTES 


Parfois, deux distances différentes d'et 4 sur un même ensemble E sont assez ressemblantes pour que 
les espaces métriques liés (Æ,4),(Æ, 8) possèdent les mêmes propriétés pour certains objets 
mathématiques définis par d d'une part, et par & d'autre part. Il existe plusieurs notions de 
ressemblances dont voici une première (avant les autres qui nécessitent des outils mathématiques que 
nous n'avons pas encore définis): 


Définition: Soient d et 5 deux distances sur un même ensemble E, d et 4 sont dites "distances 
équivalentes" s'il existe deux constantes réelles & > Ü,C' > 0 telles que 


Vx,yeË:c'd(x,y) < ô(x,y) <C'd(x,y) (18.20) 


soit: 
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ee) ce 


£ (18.21) 
d(x, y) 
avec £& < C'. Nous noterons par ailleurs cette équivalence 4 - &. 


L'intérêt de cette définition est le suivant: si nous avons convergence pour l'une des métriques, alors 
nous aurons la convergence pour l'autre aussi. Plus clairement: 


d(x,,x)—0< 6(x,x)—0 (18.22) 


in extenso: 


à 6 _ 
xxx (629) 


2.2. FONCTIONS LIPSCHITZIENNES 


Relativement aux définitions précédentes, nous pouvons maintenant assigner quelques propriétés 
supplémentaires aux fonctions telles que nous les avions énoncées dans le chapitre de Théorie Des 
Ensembles: 


Soient (FE, d) et (F,8) des espaces métriques, et soit f : £ — F une fonction. Nous définissons les 
propriétés suivantes: 


P1. Nous disons que f est une "isométrie" si (c'est plutôt intuitif.…!): 
V4 yEËE: d/(x)./0)]=d(xy) (18:24) 


Si nous prenons la distance usuelle, la fonction k-lipschitzienne s'écrit alors: 
Vr,x'e Elf -fa<sklr- x] (825) 
ce que nous pouvons écrire également: 


MOD | <k (18.26) 
x 


Ou ce qui revient au même: toutes les cordes tracées entre 2 points quelconques du graphe ont un 
coefficient directeur (dérivée) compris entre -k et k. 


Par exemple, la fonction sin(x) est 1-lipschitzienne (car la dérivée du cosinus est en valeur absolue 
comprise entre O et 1). 


P2. Nous disons que deux espaces métriques sont "isométriques" s'il existe une isométrie surjective de 
l'un sur l'autre (ce qui est assez rassurant en géométrie). 


P3. f est dite "L-lipschitzienne" de constante (ou "de rapport") L s'il existe Z > 0e IR tel que: 
Vx,y EE: f(x), f(y)] < Zd(xy) (18.27) 


Si Z =1, nous disons que f est "contractante" (ou une "contraction"), et si Z < 1, nous disons que f est 
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strictement contractante. 


P4. Toute fonction f lipchitzienne est uniformément continue (voir plus loin le concept "d'uniforme 
continue") si elle vérifie: 


Ved)0,1)0Vrye£z da» <A= fn, f)]£e (1820) 


avec A=£iZ et Z #0 (la réciproque n'est pas vraie: toute fonction uniformément continue n'est pas 
nécessairement continue). En d'autres termes, si nous pouvons rapprocher deux points aussi près que 
nous voulons dans un espace, nous le pouvons aussi dans l'autre (ce qui assure en quelque sorte la 
dérivation). 


Remarques: 
R1. Une isométrie est toujours injective car: 

fG)= fo) Af(r.f1=0=d(u,v) = u=v (18.29) 
mais elle n'est pas en général surjective. 


R2.Si(E,d) et (F,9) sont isométriques, du point de vue de la théorie des espaces métriques ils sont 


indiscernables, puisque toutes leurs propriétés sont les mêmes, mais leurs éléments peuvent être de 
nature très différente (suites dans l'un et fonctions dans l'autre par exemple). 


3. ENSEMBLES OUVERTS ET FERMÉS 


Définition: Considérons un ensemble E muni d'une distance d. Un sous-ensemble U de E est dit "sous- 
ensemble ouvert" si, pour chaque élément de U, il existe une distance r non nulle pour laquelle tous les 
éléments de E dont la distance à cet élément est inférieure ou égale à r, appartiennent à U, ce qui se 
traduit en langage mathématique: 


U ouvert de FE VYreU,3reR'/Vye£:d(xy)£r=yeuU (18.30) 
Remarque: Le symbole / signifie dans ce contexte "satisfait la propriété". 


Cette définition peut sembler complexe mais en fait, sa signification concrète est plus simple qu'il n'y 
paraît. En fait, selon cette définition, un ensemble ouvert dans un espace topologique n'est rien d'autre 
qu'un ensemble de points contigus et sans bords. 


L'absence de bord découle de la condition > # Q. En effet, en raisonnant par l'absurde, si un ensemble 
ouvert U avait un bord, alors pour chaque point situé sur celui-ci (le bord) il serait toujours possible de 
trouver un point n'appartenant pas à U aussi proche que l'on veut de lui. Il s'ensuit que la distance r 
nécessaire devient donc nulle. 


Définitions: 


D1. Un "sous-ensemble fermé" est un "ouvert avec bord". 
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D2. Un "voisinage" d'un point de E est une partie de E contenant un ouvert contenant ce point. 


La définition d'un ensemble ouvert peut être simplifiée en introduisant une notion supplémentaire, celle 
de "boule ouverte”: 


3.1. BOULES 
Soit x un élément de E: 


Définition: Une "boule ouverte de centre x et de rayon r>0" ou "boule métrique de rayon r centrée en 
x" est le sous-ensemble de tous les points de E dont la distance à x est inférieure à r, ce que nous 
écrivons: 


0 B(E)={yeEÆEld(x,y) <r} (18.31) 


Un ensemble ouvert peut également être défini comme un ensemble pour lequel il est possible de définir 
une boule ouverte en chaque point. 


Remarques: 


R1. Les ouverts ainsi définis, forment ce que nous appelons une "topologie induite" par la distance 
d'ou aussi "topologie métrique”. 


R2. Nous appelons une "couverture ouverte" U de E, un ensemble d'ouverts de E dont la réunion 
est E. 


Définition: Une "boule fermée" est similaire à une boule ouverte mais diffère dans le sens que nous y 
incluons les éléments situés à la distance r du centre: 


1B;(8) =(EEld(x,y)<r} (18.32) 


Remarque: Pour 0 < r < r' les inclusions, EF Ci B° € B(x,r') sont des conséquences directes de 


la définition de boule ouverte et fermée. 


% Exemple: 


La distance usuelle dans IR est donnée par 4(x, y) = [x — lt. Les boules y sont de simples intervalles. 


Pour xeRetrelR,, nous avons: 
sn = Jx-—r,x+rl et 18 = [x—r,x+ r] (18.33) 
Définition: Une "sphère" est donnée par: 


S'(E)={(yeE]|d(x,y)=r} (18.34) 
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Remarque: Puisque par définition, » > 0, les boules ouvertes et fermées ne sont pas vides car elles 
contiennent au moins leur centre. Par contre, une sphère peut être vide. 


Exemple: 


Avec R*,€* nous avons vu dans les exemples précédents que nous pouvions définir différentes 


distances. Pour les distinguer, nous les notons: 


d\(x, y) = Sp, — | 
il 


E (18.35) 
d;(x,y) = (y, 7 À; ÿ 


il 


d, = MAX{V; — x, — Yi} 


Alors, dans pp? les boules fermées de centre © et de rayon unité équivalentes aux trois formulations 
précédentes, ont la forme suivante (rappel: 0 < » {1 dans cet exemple): 


+1 +1 +1 


-1 +1 -1 l 


d2 des 
Figure: 18.2 - Exemples de boules fermées de rayon unité 
3.2. PARTIES 


Maintenant que nous avons défini les concepts de boules, nous pouvons enfin définir rigoureusement 
les concepts d'intervalles ouverts et fermés (qui dans un espace à plus d'une dimension sont nommés 
parties") dont nous avons fait si souvent usage dans les chapitres d'Analyse Fonctionnelle et de Calcul 
Intégral Et Différentiel. 


Définition: Soit (X, d) un espace métrique. Nous disons qu'une partie A de X est "bornée" s'il existe une 
boule fermée ,8; (4) telle que AC ,& (X): 


Vrxe A.d(%,2x)£r (18.36) 
Compte tenu de la remarque précédente sur les inclusions des boules, il est clair que nous pouvons 


remplacer l'adjectif "fermée" par "ouverte". De plus l'inégalité triangulaire entraîne que le caractère 
borné de À ne dépend pas du choix de x, (avec un * il suffit de remplacer r par r'=r+d(x, x) ). 
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Définitions: 


D1. Soit X un ensemble et (Y,d) un espace métrique. Si X est un ensemble, nous disons qu'une fonction 
f: À — Fest "bornée" si son image f(X) est bornée (cas de la fonction sinus ou cosinus par exemple). 


D2. Soit (E,d) un espace métrique, et soit À une partie non vide de E. Pour tout 4;  Æ nous notons 
d(u,A) et nous appelons "distance de u à A", le nombre réel positif: 


d(u,A) = inf, 4d(u,a) =inf{d(u,a)|ae A} (18.37) 
Nous prolongeons la notion en posant: 
VueËÆ:du,@)=+4#0 (18.38) 


Si À et B sont deux parties de E nous avons respectivement (c'est peut-être plus compréhensible 
ainsi...): 


d(A,B)=inf{d(x,y),xe A,ye B} (18.39) 


Il faut faire ici attention a bien interpréter 4(4, 8) comme l'infinimum de la distance entre les 
ensembles À et B, car la distance entre les parties ne définit pas toujours une distance sur la partie 


P(R). Effectivement, Si nous prenons 4={0} CR et 8= ee - n} nous avons d (A, 8) = 0 
x 


quand # — +0 tandis que 44 B. 


Remarques: 


R1. Si le lecteur a bien compris la définition du concept de "parties" il remarquera qu'il n'existe pas 
nécessairement toujours un 4e À tel que d{x,A) = d(u,a). En conséquence, nous écrivons 
trivialement: 


Ve )>0,3a=a(s)e À: d(u,A) £d(u,a)< d(u,A)+E (18.40) 
De plus, si un tel & existe, il n'est bien évidemment pas nécessairement unique. 


R2. Il convient peut être de rappeler que cette distance satisfait également les 5 axiomes des 
distances. 


D3. Soit (E, d) un espace métrique, et soit À une partie de E. Nous appelons "adhérence" de A et notons 
adh(A) le sous-ensemble de E défini par: 


adh(A) = {ue Æ]|diu, A) =0} (18.41) 


Par exemple, l'adhérence du sous-ensemble des rationnels Q (la partie A) de IR (l'espace métrique E) 
est un sous-ensemble de IR lui-même puisque tout nombre réel est limite de rationnels. 


En particulier, puisque Yu € À: d{u,@)= + , nous avons adh(@) = fj, et puisque 
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Vue E: d(u,Æ) =0 , nous avons adhk(£)=E. 


Remarques: 
R1. Tout élément de l'ensemble adh(A) est dit "point adhérent" à A 
R2. Nous disons qu'une partie À de E est une "partie fermée" si elle est égale à son adhérence 


R3. Nous disons qu'une partie À de E est une "partie ouverte" si son complémentaire par rapport à 
E; 


CA= AE (18.4) 


est fermé. 


Il s'ensuit que (de par les définitions): 
u e adh(A) & Vr > 0: sB MA=S (18.43) 

À est ouverte & Vue À,3r > 0: PM CA (18.44) 
avec quelques propriétés: 
P1. (triviale) Si Ac E et BcÆ vérifient 4 c 8, nous avons: 

Vue Ë:dlu,B) £d(u,A) (18.45) 
P2. (triviale) Pour tout 4AcE,toutueÆ: 
d(u,A) = d(u,adh(Aÿ) (18.46) 
Dernière propriété qui a pour corollaire (trivial): 
Si pour tout 4 e Æ nous avons d'u, A) = d(u, 8), À,B # ©, nous avons alors: 
adh(A) = adh(B) (18.47) 


3.3. BOULES GÉNÉRALISÉES 


La notion de distance d'un point à un ensemble permet d'étendre les notions de boule et de sphère. 
Définitions: 


D1. Soit 4 # @ et soit un » > 0. Nous appelons "boule ouverte généralisée" de centre A et de rayonr, 
l'ensemble suivant: 


02:={EeÆld(y,A)<r} (1848) 


Respectivement "boule fermée généralisée": 
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#B1=0DEeEld(y,4)<r} (18.49) 
Respectivement "sphère généralisée": 
S,=(yeÆl|d(y, À) =r} (18.50) 


D2. Soit (E, d) un espace métrique et soient À, B deux parties non vides de E. Nous notons g(A,B) et 
appelons "gap" (qui signifie "écartement" ou "espacement" en français) de A à B, le nombre réel 
supérieur ou égal à zéro: 


g(A,8) — inf 0 À g(a, B) _ infger £(è, À) un inf e Age g(a,b) 


| (18.51) 
=infsainf.ep g(a,b) = inf {d(a,b)|(a,b) e AxB)} 


Remarque: L'inégalité triangulaire g(A,8 £ g(A,0 + g(C’,8) n'est pas valide dans le cadre des 
gap. Il suffit pour le démontrer, d'un seul et unique exemple qui contredirait l'inégalité. 


Exemple: 

Dans I prenons À = {0,1},8 = {2,3},C = {1,3} nous avons alors: 
g(A,B8)=12> g(A C)+g(C,B)=0+0=0 (18.52) 

Il y a donc bien contradiction. 


3.4. DIAMÈTRE 


Définition: Soit (E,d) un espace métrique et soit À une partie non vide de E. Nous notons diam(A) et 
nous appelons "diamètre" de A, le nombre réel positif non nul: 


diam(A) = sup{d(a,b) |(e,b) € Ax À) (18.53) 


Toute partie non vide À d'un espace métrique vérifiant diam(A) < + sera aussi dite "bornée". 
Remarque: Nous considérons la partie vide & comme un borné de diamètre A 


Si l'espace métrique (E, d) tout entier est borné, nous disons que la distance d est bornée. Par exemple, 
la distance discrète est bornée, la distance usuelle sur IR ne l'est pas. 


Nous avons aussi les propriétés suivantes (les deux premières sont normalement triviales, la troisième 
découle de la définition du diamètre): 


P1. dam(A) = 0 & À = {a} ou 4=@ 
P2. AC BE — dam(A) £ diam(B 


P3. diam| ,87 |£2r,diam| ,B | < 2r,diam|S | £ 2r 
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Attention concernant cette propriété il faut perdre l'habitude de penser avec la distance euclidienne. Le 
premier piège fréquent est de penser que le deuxième diamètre (celui de la boule ouverte) devrait être 
strictement inférieur mais ce serait oublier que le bord n'a pas d'épaisseur rigoureusement parlant! 


Il y a aussi diam{S?) £ 2r qui pose souvent problème. Pour s'en convaincre il suffit de prendre la 


distance discrète (qui vaut si deux points sont pas confondus O, sinon 1). Ainsi, dans un espace 
métrique où nous prenons $? avec r = 1, nous avons diam{$?) = 1 (c'est un cas intéressant car 


complètement contre-intuitif). 
P4. diam(A LU 8) < diam(A) + g(4,8) + diam(B 
Pour s'en convaincre, dans IR prenons 4 = 8, nous avons alors (infériorité stricte triviale): 
(diam(A LB) = diam(A)) £ diam(4) + g(A, B)+ diam(B) (18.54) 
P5. A est borné si et seulement si + >Ü,KeÆ: AC, 
Définition: Nous appelons "excès de Hausdorff" ou "distance de Hausdorff" de A sur B: 
e(4,B) =sup{d(a, Bj|ae À} (18:55) 
que l'on retrouve aussi souvent noté dans la littérature avec la notation: 
e(4,8) = dy(A,B) (18:56) 
Exemple: 


Prenons 4.1? le cercle unité centré à l'origine et pour B le carré qui lui est circonscrit. Des notions 


de géométrie élémentaire nous amène évidemment à constater que la distance de Hausdorff entre le 
cercle et le carré est donc: 


elA Bi=dg(ABi=#2-1 (1857) 


Remarque: Nous avons en général #8, À) # e( À, Bi et ces quantités peuvent ne pas être finies. 


4. VARIÉTÉS 


Nous introduisons maintenant les "variétés". Ce sont des espaces topologiques qui sont "localement 
comme p*" (notre espace par exemple.….). 


Définitions: 


D1. Une "variété topologique de dimension n" est un espace de Hausdorff M tel que pour tout pe Àf il 
existe un voisinage ouvert {} & M avec p € Ü, un voisinage ouvert 7;'<IR* et un homéomorphisme: 
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D2. Un "homéomorphisme" entre deux espaces est une bijection continue dont l'inverse est également 
continue. 


D3. Les couples (£7,&) sont appelés des "cartes", U étant le "domaine de la carte" et & "l'application 
de coordonnées". Au lieu de "carte" nous disons parfois aussi "système de coordonnées". 


Remarque: Nous noterons par dim M la dimension d'une variété topologique. Ainsi: 


dim" =» (18.59) 


D4. Soit M une variété topologique de dimension n. Une famille A de cartes de M est appelée un "atlas" 
si pour tout xe À, il existe une carte ({}7,gù € À telle que xet/. 


Remarque: Notons que si (Z7,,g),({7,,@,) sont deux cartes de M telles que (ne vérifiant pas 
l'axiome de Hausdorff) L, nm E, # 0, alors l'application de changement de cartes: 


æd': ant) anus) (18.60) 


HR. 


Figure: 18.3 - Exemple de changement de cartes 


est un homéomorphisme. 


4.1. VARIÉTÉS DIFFÉRENTIABLES 


Définitions: 


D1. Une "variété différentiable" est un espace topologique M où les applications @, © a sont des 
fonctions de classe £'®. 


D2. Un "difféomorphisme" est une application f : £è — &2' où £à, $2' sont des domaines ouverts de [* 
et si f est un homéomorphisme et en plus si £à,$2' sont différentiables. 
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Remarque: "différentiable" dans ce contexte signifiera toujours différentiable de classe € 


D3. Soit une variété topologique 3£ = 44* (pour simplifier l'écriture), deux cartes (2 ,g),(©7,,@,) de 
M sont des "cartes compatibles" (plus précisément, compatibles de classe £'° ), si l'une des deux 
propriétés suivantes est vérifiée: 


P1. D, nÜ, # @ et l'application @, eg" de changement de cartes est un difféomorphisme 
P2. U NU, =@ 
Un atlas À de M est différentiable si toutes les cartes de À sont compatibles entre elles. 


D4. Une "variété différentiable" est un couple (M, A) où M est une variété topologique et A un atlas 
différentiable de M. 


Remarque: Étant donné un atlas différentiable, il est parfois nécessaire de le compléter: nous disons 
qu'une carte de M est compatible avec un atlas différentiable si elle est compatible avec chaque 
carte de À. Un atlas de À est un "atlas maximal" si toute carte compatible avec À appartient déjà à 
A. Un atlas maximal est appelé une "structure différentiable". 
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Notes personnelles: 
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MEET 


19. THÉORIE DE LA MESURE (ET DE L'INTÉGRATION) 


L. mesure, au sens topologique, va nous permettre de généraliser la notion élémentaire de mesure d'un 


segment, ou d'une aire (au sens de Riemann, par exemple) et est indissociable de la nouvelle théorie de 
l'intégration que Lebesgue mettra en place de 1901 à 1902 et que nous allons aborder ici afin de construire 
des outils mathématiques beaucoup plus puissant que l'intégrale simple de Riemann (cf chapitre de Calcul 
Différentiel Et Intégral). 


La théorie de la mesure va également nous permettre de définir avec rigueur le concept de mesure (peu 
importe la mesure de quoi) et ainsi de revenir sur des résultats importants de l'étude des probabilités (cf 
chapitre de Probabilités). Effectivement, nous allons voir (nous définirons le vocabulaire qui suit plus 
loin) pourquoi (U, À, P) est un "espace de probabilités" où À est au fait une tribu sur U et P une mesure 
sur l'espace mesurable (U, A). 


Avertissement: Le niveau d'abstraction et de volonté requis pour la lecture et la compréhension de ce 
chapitre est assez élevé. Il faut être à l'aise avec les notions vues en théorie des ensembles ainsi qu'en 
topologie. 


1. ESPACES MESURABLES 


Quand en mathématiques, nous dérivons, intégrons ou comptons, nous effectuons de manière implicite 
une mesure d'un objet ou ensemble d'objets. Rigoureusement, les mathématiciens souhaitent définir 
comment peut être structuré la chose mesurée, comment faire une mesure de celle-ci et les propriétés en 
découlant! 


Définitions: 


D1. Soit E un ensemble, une "tribu" (ou "o-algèbre") sur E est une famille 4 de parties de E vérifiant les 
axiomes suivants: 


Al. Æe A (voir exemples plus bas - E étant considéré comme élément) 


A2. Si À est un élément d'une tribu alors 4e À = 4° e À . Ce qui signifie que A est "stable par passage 


au complémentaire". Cet axiome implique que l'ensemble vide Zi est toujours un élément d'une tribu! 


A3. Pour toute suite (4, d'éléments de À nous avons LA, € À . Nous disons alors que A est "stable 
#1 


par union dénombrable". 


Par exemple, la graduation d'une simple règle de mesure... satisfait ces trois axiomes. 


Remarques: 


R1. Nous écrivons Æ e À car nous considérons avec cette notation E non plus comme un sous- 
ensemble de A mais comme un élément de 4 ! 


R2. Les cas non dénombrables sont typiques de la topologie, de la statistique ou du calcul intégral! 
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D2. Le couple (Æ,.4) est appelé "espace mesurable" et nous disons que les éléments de A sont des 
"ensembles mesurables". 


D3. Si dans le troisième axiome nous imposons que 4 soit stable par union finie (non dénombrable) nous 
imposons alors la notion plus générale "d'algèbre". Aïnsi, une tribu est nécessairement contenue dans une 
algèbre (mais le contraire n'est pas vrai car justement l'axiome est plus fort). 


Remarque: Dans le domaine des probabilités, E est assimilé à l'Univers des événements et 4 à une 
famille d'événements et nous parlons "d'espace probabilisable" ou. "d'espace mesurable". 


Exemples: 


El. Soit £ = {1,2} un ensemble de cardinal 2. Les deux seules tribus 4 qui satisfont les trois axiomes 
sont: 


A =(9,(1},(2},(1,2}} 4 ={S{L2}} (9.1) 


Il n'y a pas d'autres tribus pour l'ensemble E donné que ces deux (la grossière, et la maximale), car il ne 
faut pas oublier que l'union de chacun des éléments de la tribu doit aussi être dans la tribu (axiome A3), 
ainsi que le complémentaire d'un élément (axiome A2). 


Nous voyons par ailleurs de cet exemple que si E est un ensemble (G,Æ) est bien une tribu! 
E2. L'ensemble des parties de E, noté P(Æ) est aussi une tribu (dixit l'exemple 1). 


Une tribu A4 est aussi "stable par union des complémentaires dénombrables". En effet si (4,) est une 
suite d'éléments de À nous avons (trivial en prenant comme référence l'exemple El): 


U4° e À et Lux] € A (192) 


Une tribu est aussi "stable par intersections dénombrables" (trivial en prenant comme référence l'exemple 
El): 


L'} 
(4e À (193) 
il 


ce qui amène à ce qu'une tribu est stable par unions et intersections dénombrables. En particulier, si nous 
prenons deux éléments d'une tribu À,8€ À alors A\B e A. Avec pour rappel (c£ chapitre de Théorie 
Des Ensembles): 


A\B=An£8*| (194) 


Remarque: Nous voyons aisément avec l'exemple El que si (4), est une famille de tribus sur E alors 


| A À est une tribu (la vérification des trois axiomes est immédiate) 
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Bon c'est bien joli de jouer avec des patates et sous-patates… et leurs complémentaires mais passons à la 
suite. 


Définition: Soit E un ensemble et # une famille de sous-ensembles de P(Æ) tel que 8 € P(Æ). Soit S 
la famille de toutes les tribus contenant (entre autres) #. $ n'est évidemment pas vide car P(E)ES. 
Nous notons par définition: 


a(8)= (|A (19.5) 
A€S 
la "tribu engendrée" par #. GB) est donc par définition la plus petite tribu contenant f (et par extension 
la plus petite tribu de E). 


Voici deux exemples qui permettent de vérifier si ce qui précède a été compris et qui permettent de mettre 
en évidence des résultats importants pour la suite. 


Exemples: 


E1. Soit E un ensemble, AC E,A%#Æ et B = {A} alors (lorsque A est vu comme un sous-ensemble de E 
comme le précise l'énoncé et non comme une famille de sous-ensembles!): 


o(B) ={@, Æ, A, A} (196) 
E2. Si À est une tribu sur E alors: 
o(À)= À («97 


E3. Soit Æ = {1,2,3,4} et A ={{1,2},{3}} nous avons dès lors (prenez bien garde car maintenant A est une 
famille de sous-ensemble et non simplement un unique sous-ensemble!) la tribu engendrée suivante: 


a(A) = ((9),(3,(4), (1,2), (3,4,(12,3),(,2,4),(,2,3,4}} (108) 


Plutôt que de déterminer cette tribu en cherchant la plus petite tribu de P(Æ) contenant A (ce qui serait 
laborieux) nous jouons avec les axiomes définissant une tribu pour facilement trouver celle-ci. 


Ainsi, nous trouvons donc bien dans GA) au moins l'ensemble vide obligatoire {3} ainsi que: 
E={12,3,4) (09) 
selon l'axiome Al et: 
A={{L2},(3} (19.10) 
lui-même par définition de (A) et les complémentaires de: 
(G}° = (1,2,4},(1,2}° = (3,4},({L2}U {3} ={4}} (911 


selon l'axiome A2 ainsi que les unions: 


UA, =((,20(3=(123,(120(123={(123..) oi 
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selon l'axiome A3. 


Définition: Soit E un espace topologique (c£ chapitre de Topologie). Nous notons B(F) la tribu 
engendrée par les ouverts de E. B(Æ) est appelée la "tribu borélienne" sur E. Les éléments de 8(Æ) sont 
appelés les "boréliens" de E. 


Remarques: 


R1. La notion de borélien est surtout intéressante car elle est nécessaire à la définition de la "tribu de 
Lebesgue"' et par suite à "la mesure de Lebesgue" qui nous amènera à définir "l'intégrale de 
Lebesgue". 


R2. La tribu B(Æ) étant stable par passage au complémentaire, elle contient aussi tous les fermés! 


R3. Si E est un espace topologique à base dénombrable, B(Æ) est engendré par les ouverts de la base. 


Exemple: 


Si R désigne l'espace des réels muni de la topologie euclidienne (cf chapitre de Topologie), la famille 
des intervalles ouverts à extrémités rationnelles est une "base dénombrable" (étant données les 
extrémités...) de IR et donc engendre BR) . Même remarque pour BR, 4 e N°, avec comme base 
dénombrable la famille des pavés ouverts à extrémités rationnelles. 


Considérons maintenant $ un ensemble dense (cf. chapitre de Topologie) dans IR . Les familles suivantes 
engendrent B{(IR) : 


(]-o,alaes};(]-o,alaeS};(la.+a[aes};(fa,+o[aes} (1913) 
Démonstration: 
Soit (la famille des ouverts): 
F={]-o,ad{aes} (1914) 
Nous avons évidemment: 
atF)c BR) (1915) 
De plus: 
[a,+of À ]-co,[=[a,b[ sia <b (1916) 


Donc les intervalles du type [a,b[ avec a et b dans $ appartiennent aussi à (FF). Done, si nous 
généralisons, avec À $ Y, il existe une suite (&,) d'éléments de $ décroissant vers x et une suite (à, ) 
d'éléments de &# croissant vers y tel que: 


1x, 1° | 


Le) 


n 


labIEoF) on 
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ce qui entraîne au même titre (que Æ e À ) que BR) © at.F). Les autres cas se traitent de manière 
analogue. 


OIC.Q.F.D. 


Soit (£,.4) un espace mesurable et AG Æ (et 4e A ) (où A est donc considéré comme un sous-ensemble 
et non comme un élément !). La famille {AN B|8 € À} est une tribu sur À appelée "tribu trace" de 4 sur 


A, nous la noterons 4 À. De plus, si 4 € À, la tribu trace est formée par les ensembles mesurables 
contenus dans À. 


Démonstration: Nous allons faire une démonstration par l'exemple (...). Nous vérifions les trois points de 
la définition d'une tribu: 


1. A=ENnADAEANA 

2. Soit Be À, A\(4NnB) = A\B = An et donc A\(ANB)e An A 

Exemple: 

Soit Æ = {1,2,3} alors (une tribu parmi d'autres - ne pas oublier la stabilité par union !): 
A=(9,(1},(2},(3,(12},(,3},(2,3,(12,7} (19.18) 

Choisissons À = {1,2}, 8 = {2,3} (il est évident que {An Z|B8€ A} est une tribu sur A). 

Dès lors: 


ANÇAN SE) = (12) — ((L2} n(2,3}) = (L2} — {2} = (1) 
A\B=({12-({2,3}={1) (19.19) 
ANB ={12} n€2,3° = {12} nl} = {1} 


et nous avons bien {1} € À ainsi que 4e An A. 


3. Soit (AnB,) Une suite d'éléments de 4n A (8,€ À) alors: 


Jeana)-4n[Us|ean (19.20) 


—,— 
€A 


La dernière assertion de la proposition sera supposée évidente. 
OC.Q.F.D. 


Soit maintenant E un ensemble, € une famille de parties de E et AS Æ non vide. Nous notons 4A € la 
trace de € sur A et T4(AMC) la tribu engendrée par 4n € sur À. Alors: 


AnotC) = Su(ANC) (9.21) 
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Exemple: 


Soit l'ensemble Æ = {1,2,3,4}, € ={{1,2},(3}, 4= (3,4) alors: 
ANC={(9,(G)) oa(ANnC)= 1 ((0,(3))= (0,(3,(4),63,4} (1922) 
Et vérifions An a(C) = sy(ANC): 
An a(C)= 6,4 na({1,2),(3) 


= (3,4}N(5,(3,(4),(,2),6,4,(12,3,(12,4),(12,3,4}} (1923) 
= (9,(3},(4),6,4)} 


Donc l'égalité est vérifiée. 


Un corollaire trivial de cette égalité est que si nous considérons un espace topologique E et AS £ muni 
de la topologie induite. Alors: 


ANB(EÆ) = B(A) (1924) 


Rappelons (cf. chapitre de Théorie Des Ensembles) que si nous avons E qui est un ensemble, alors pour 
tout 4,5 € Æ nous définissons la différence symétrique AÂB entre À et B par: 


ABB = (A\B)U(B\A) (925) 
Les propriétés triviales sont les suivantes: 
P1. Une algèbre est stable par différence symétrique (4,8 € À nous avons AAB € À) 
P2. AAB = BAA 
P3. AAB° = AAB 
P3. AÂB = (AU B\(ANB) 
Si 8 est une algèbre sur E, alors (B,Â,") est un "anneau de Boole" (ou algèbre de Boole mais attention 
avec le terme "algèbre" qui peut prêter à confusion avec la théorie des ensembles) avec & et E comme 
élément neutre "additif" (À) respectivement "multiplicatif" (1). 
Pour des rappels sur les éléments cités dans le paragraphe précédent, le lecteur pourra se reporter au 
chapitre de Théorie Des Ensembles et le chapitre d'Algèbre De Boole (cf. chapitre de Systèmes Logiques 


Formels) 


Démonstration: À ("addition") est associative car en développant nous obtenons (cela se vérifie en 
faisant un diagramme sagittal au besoin - les "patates"): 


AMBAC) = (AN BNC LAN ES AC) U(A NBA) U(A NE NC) (1926) 


et cette dernière expression est stable par permutation (commutation) de À et C (même méthode de 
vérification). Donc: 
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AA(ÇBAC) = CA(BAA) = (BAA)AC = (AABYAC (1927) 


Nous vérifions que & est bien neutre par rapport à la différence symétrique (la démonstration que E est 
neutre par rapport à l'inclusion est évidente). Il est trivial que: 


AùÂG = GAA = A et que AAA = (19.28) 


(8,49) est donc bien un groupe abélien par rapport à la loi À (différence symétrique). 
OC.Q.F.D. 


Pour finir "M est distributif par rapport à À. En effet: 


AN(BAC) = AN(B\CUC\E) =(ANB\C) U(ANC\E) 
= (AN BANC) U(ANC\ (ANR) = (AN B)AANC) 


(19.29) 

Ce qui fait bien de (B,4,") un anneau (qui de plus est un anneau commutatif). 

1.1. THÉORÈME DE LA CLASSE MONOTONE 

Définition: Soit E un ensemble. Une "classe monotone" sur E est une famille € de parties de E vérifiant: 


Al.ÆFel 


A2. ABEC et Ac B=B\AeC 


A3. Si (4,) est une suite croissante (attention au terme "croissant") d'éléments de € alors L] AeC 
2=l 
(stable par union dénombrable croissant) 


Remarques: 
R1. Une suite croissante d'ensembles c'est: 4 € 4, € 4... 
R2. Les deux premiers points impliquent que & est stable par passage au complémentaire. 


R3. Les axiomes (2) et (3) (plus le (1)) amènent que la classe monotone est stable par intersection 
décroissante. Une manière de vérifier c'est de prendre le complémentaire de chaque élément de la suite 
croissante pour tomber sur la suite décroissante et inversement. 


R4. L'axiome 3 des classes monotones étant un peu plus restrictif (plus "fort") que l'axiome 3 des 
tribus (puisque nous y imposons une suite croissante). Cela implique que toute tribu est une classe 
monotone (toute union dénombrable de la tribu étant dans la tribu ce qui est une condition plus forte 
que la suite croissante) ! 
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De la même manière que pour les tribus, si nous considérons une famille (£); de classes monotones sur 


FT 


E. Alors | |G est une classe monotone (la démonstration se vérifie immédiatement par les trois axiomes 


précédemment cités). 
Exemple: 


Si E est un ensemble, P(Æ) est une classe monotone sur E. Plus généralement, une tribu est une classe 
monotone. 


De manière équivalente aux tribus, considérons un ensemble E et € € P(£). Soit $ la famille de toutes 
les classes monotones contenant €. # n'est pas vide car P(E)ES . Nous notons: 


FT 


MC) = 


(19.30) 
Tes 


la classe monotone engendrée par € . AA(C) est la plus petite classe monotone contenant & (et satisfaisant 
bien évidemment aux axiomes). 


Remarque: Si E est un ensemble et € € P(Æ) alors MC) € atC) , car ETC) est une classe monotone 
(et aussi une tribu) contenant € et donc elle contient aussi AAC) (voir les exemples avec les tribus). 


Le théorème (de la classe monotone) s'énonce ainsi: soit E un ensemble. Si € est une famille de parties de 
E que nous imposons stable par intersections finies alors AA(C) = at€) (nous devons donc prouver que la 
tribu minimale de & est égale à la classe monotone minimale de &£ ). Si nous n'imposons pas que € soit 
stable par intersections finies nous n'aurions pas nécessairement l'égalité. 


Démonstration: 


MC) € aC) comme déjà dit (c'est quasiment trivial). Nous allons montrer dans un premier temps que 
AMA(C) est donc aussi une tribu sur E. Pour ceci il suffit de montrer que AA(C) est (aussi) stable par union 
dénombrable (et non nécessairement par une suite croissante d'éléments!). 


Considérons les familles suivantes pour la démonstration: 
M = {4e MC)ANBE MC) pourtoutBeC} (1931) 
M, {4e MO|ANBE MC) pourtout Be MC)} (19.32) 


Par les définitions précédentes A41€ MAC) mais € étant (imposé) stable par intersections finies entraîne 


€ € M et donc (c'est le même raisonnement que pour les tribus): 
CEMEMEE) (1933) 
AA est une classe monotone en effet Fe M, si 4,4 € Ad et que 4 € 4 (axiome 2) alors: 


VBecC, ANBCANB 
cM(C)  eM(C) 


(19.34) 


Page: 1297/4839 


[v3.0 - 2013] 


et donc (ce qui appuie le fait que les autre éléments (4,) satisfont la relation précédente): 


vBec, (4 n8)\(4 nB)e M(C)= (4\A4)nB e M(C) 


Si (4,) est une suite croissante d'éléments de A4 alors: 


(19.35) 


vVBecC : 
(U4,1N28={J(4, n2)e MC) 
EME) 


car (4,8) est une suite croissante. 


Ainsi A4 est bien une classe monotone et par € € AE MC), nous avons donc: 
M4 = MO) (1936) 


Cette dernière égalité implique € € A# . Comme pour Â4, nous montrons que A4; est une classe 
monotone et donc AA(C) = A4, ce qui veut dire par extension que AA(C) est donc stable par intersections 
finies. 


AMA(C) étant stable par passage au complémentaire ceci entraîne que AA(C) est, nous venons de le 
montrer, stable par unions finies (alors que nous voulons démontrer que c'est stable par union 
dénombrable). 


Soit à présent une suite (4,) d'éléments de AA(C). Nous considérons la suite: 
ñn 
B,=[J4 «937 
il 
(B,) est une suite croissante d'éléments de AAC) , donc: 


œ œ 
L]2,Ee MC) mais | ]J2,=(J4 («1939 


#=l #=l n=l 


Donc: 


L'-) 


A EME) (1939) 


Le, 


LE 


Ainsi AAÂ(C) est stable par union dénombrable et enfin AA(C) est une tribu. Or comme € € MA(E) € ail) 
cela nous amène donc à AA(C) = a(C). 


OC.Q.F.D. 


Nous verrons plus tard quelques applications importantes de ce théorème. 
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Notes personnelles: 
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La géométrie est la discipline mathématique ayant pour objet l'étude rigoureuse des espaces et 
des formes. (Larousse) 


20. TRIGONOMÉTRIE 


L. trigonométrie fait partie intégrante de la science de la géométrie. Cette première ayant pour 


racine "mesure de la terre" la trigonométrie a pour racine "mesure des corps à trois angles (trigones)". 


Remarques: 


R1. Il existe actuellement trois trigonométries connues (définies) couramment utilisées en 
mathématique: la trigonométrie du cercle (assimilée à l'étude des "fonctions circulaires"), la 
trigonométrie hyperbolique et la trigonométrie sphérique. Nous proposons dans le présent texte une 
tentative d'approche relativement rigoureuse de toutes les relations les plus connues dans ces trois 
domaines. 


R2. Nous ne traiterons par contre pas ici des trigonométries quadratique et rhombique qui sont 
utilisées par les électroniciens et qui n'ont peu voire pas d'intérêt en physique théorique. La même 
remarque est valable pour la trigonométrie lemniscatique qui est en relation avec les mathématiques 
pures et en particulier la fonction zêta de Riemann. 


R3. Le lecteur qui chercherait la démonstration des dérivées et intégrales des fonctions 
trigonométriques définies ci-après devra se reporter au chapitre de Calcul Différentiel Et Intégral 
(cf. section d'Algébre) où les dérivées et intégrales des fonctions usuelles que nous pouvons trouver 
dans les formulaires sont toutes démontrées. 


1. RADIAN 


Quand nous parlons de trigonométrie, la première chose qui devrait venir à l'esprit et s'imposer comme 
standard de mesures d'angles plans (voir le chapitre de géométrie plane pour la définition du concept 
d'angle) est la notion de "radians". 


Définition: 1 "radian" (noté [rad]) est l'angle plan décrit par une sécante à un cercle, passant par son 
centre, tel que l'arc de cercle ainsi défini par l'axe horizontal passant par le centre du cercle et la 
sécante soit d'égale longueur au rayon de ce cercle. 


Par exemple, pour un cercle de rayon À = 1 donc de circonférence (ou périmètre P) P=2:7 la 
longueur de l'arc de cercle défini par une sécante ayant un angle de 1 radian par rapport à l'horizontale 
passant par le centre du cercle sera égale à 1. 


Dès lors il vient que l'angle pour "un tour" du cercle sera de: 
27 [rad] (20.1) 


L'exemple précédent se généralise à un cercle de rayon R quelconque car l'angle pour un tour complet 
sera toujours 27 [rad], pour un demi-tour de x [r&d] et pour un quart de x} 2 [rad]. 
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Malheureusement dans les écoles, les professeurs du primaire apprennent encore aux enfants à mesurer 
les angles en degrés. Heureusement la conversion à faire n'est pas trop difficile. (c'est une simple règle 
de trois). 


Soient r la mesure d'un angle en radians, d la mesure du même angle en degrés et g la mesure du même 
angle en grades (vieille unité) nous avons par définition: 


Fr d £ 


2x 360 400 
Les astronomes et les astrophysiciens aiment bien parler en minutes ou secondes d'arc telles que: 
1° = 60' (minutes d'arc) 1'=60" (secondes d'arc) (20.3) 
2. TRIGONOMÉTRIE DU CERCLE 


Soit la figure ci-dessous représentant un cercle quelconque centré à l'origine dans une base directe: 


tan(&) 


5 
! 
1 
L 
1 
1 
' 
! 
' 
1 
1 
! 
! 
l 
' 
! 
1 
' 
! 
! 
! 
! 
U 


\ 


(20.4) 


De par l'application du théorème de Pythagore (cf. chapitre de Géométrie Euclidienne), nous y avons: 
|ow] - R=4/x+3? (20.5) 
avec R étant le rayon du cercle. 


A partir de cette représentation, nous pouvons définir des êtres mathématiques nommés "fonctions 
trigonométriques du cercle" appelées aussi parfois par les anciens (...) "fonctions cyclométriques" telles 
que (pour les plus importantes): 


cos(a) = x/{R arccos(x/ Rj = sec(æ) = cos” (@) 
sin(@) =y/R arcsin(y/R)=@ csc(@)= sin !(a@)| (20.6) 
tan(a) = y{x arctan(y/x) = cot(æ) =x/y 


Il faut faire attention car suivant les auteurs arccos, arcsin et arctant seront notés respectivement cos |, 
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sin !, tan’! (cette dernière écriture pouvant prêter à confusion avec l'inverse la fonction 
trigonométrique correspondante!). 


Remarques: 


R1. Lisez "cosinus" pour "cos", "sinus" pour "sin", "tangente" pour "tan", "cotangente" pour "cot", 
"sécante" pour "sec", "cosécante" pour "CsC" 
; : 


R2. Lorsque le contexte le permet et qu'il ne peut y avoir d'ambiguïité, les parenthèses après le nom 
de la fonction trigonométrique peuvent être omises (c'est souvent le cas en physique). 


R3. Les fonctions arc... sont donc les fonctions réciproques des fonctions trigonométriques 
(fonctions bijectives) correspondantes! 


A partir de ces fonctions, nous pouvons faire des combinaisons et tirer des relations remarquables très 
simples mais dont l'utilité profonde est discutable (et qui sont très très peu utilisées) telles que: 


covers(æ) = 1- sin(æ) 
vers(æ) = 1 - cos(@) 

(20.7 
cexc(æ) = csc(æ) — 1 nn 


exsec(æ) = sec(æ) — 1 


mais vous ne les rencontrerez jamais sur ce site Internet car je ne fais personnellement jamais usage de 
cette notation (c'est plutôt d'usage dans certains ouvrages américains). 


Dont voici un superbe schéma. qui résume le tout: 


| 

45 cot(x) 

cex (x) : 

R + — R. 

covers(æ) 4 
NX 
sax) \ : tant) 
| Sn(c) \ D 
\ 
£ | 

A l'ÆR — . ù 
F— cofa) + vers(x) CE ex sec(«) > 
2 LA 


Propriétés: 


P1. Si nous nous plaçons dans l'étude du cercle dit "cercle trigonométrique", il faut poser pour les 
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définitions ci-dessus À = 1. Ainsi, apparaît plus nettement le sens physique de ces définitions et il en 
découlera un nombre de propriétés et d'applications directement exploitables dans la physique 
théorique et la mathématique pure. 


Effectivement, si À = 1 nous avons trivialement: 
OM = cosæ'i +sinæ'f (20.9) 
et en appliquant le théorème de Pythagore (cf. chapitre de Géométrie Euclidienne): 


[0] =1]1- cos? æ+sin?æ (20.10) 


d'où: 


cos æ+sin?æ=1| (20.11) 


P2.Si & est un réel, et v&e N, les réels & et + 2% sont associés au même point M de par la 
périodicité du cercle trigonométrique. En effet, & et æ+ 2x sont deux mesures du même angle 
orienté. Ainsi: 

cos(æ + 247) = cos(@) 


TVaeR vrteN: (20.12) 
sin(æ + 247) = sin(æ) 


Idem pour toutes les fonctions trigonométriques qui découlent de la définition des fonctions sinus et 
cosinus. 


Remarque: Dans la mesure des "angles orientés", nous disons que deux mesures sont congrues 
modulo 2x [rad] si et seulement si leur différence est un multiple de 2 [rad]. Cela caractérise 


deux mesures d'un même angle. 


Par définition, le sinus et le cosinus de tout nombre réel font partie de l'intervalle [-1,1] . Plus 
précisément, la position de M nous permet d'en savoir plus sur le cosinus et le sinus de &. Ainsi: 
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0 <cos(x) <1 
Ô < sin( x) <1 


— 1 <cos(x) < 0 
0 <sin(x) <1 


— 1 <cos(x) < 0 
—1 < sin (x) < 0 


Il existe également une autre représentation des fonctions trigonométriques du cercle, un peu plus 
technique au sens visuel mais assez importante pour bien comprendre, plus tard, la mécanique 
ondulatoire: 


(20.14) 


Le lecteur devrait à ce point remarquer sans trop de peine les propriétés suivantes (très souvent 
utilisées en physique!): 
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sin(x-.7)=0 VreZ cos(#-7) =(-1)" Vre® 


X x (20.15) 
in (a+) 4) =(-D* VaZ cos(@n+ D) =0Vrez 


et reconnaître facilement que le sinus est une fonction impaire et la fonction cosinus une fonction paire 
(constat qui nous sera souvent utile dans divers développements mathématiques sur les séries 
trigonométriques). 


Nous avons vu au début de ce chapitre, que de par la définition des fonctions trigonométriques nous 
avons: 


sin & 1 COS 
tan Œ=—,cotæ@=——=——— (20.16) 
cos & tanæ sin 
et également: 
cos? æ 
cos @+ sin œ=1— ——+1- — = cot? œ+1=— (20.17) 
sin æ sin æ sain° 


De façon exactement identique nous démontrons que: 


tan? æ+1= 


(20.18) 
COS 


A partir de ces dernières relations nous tirons sans trop de peine que: 


. _tanæ 
sin & = V1 - cos” & = (20.19) 
Vittan a 4 rer cot? æ 


identiquement nous aurons: 


Arte ot 1 
COS & = sin & = ” 
Micra a ste 


par le raisonnement inverse nous tirons tout aussi facilement que: 


sin & 1 - cos? & cos æ V1 sin? & 


tan = — = Net çot = = NT © 021) 


J1-sin? & cos æ 1 - cos? æ sin 


Il vient également sans difficultés en observant le cercle trigonométrique que: 
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sin(—-@) = -sin &, sin(7 -&) = sin 


sin(7r + æ) = - sin &, sin(xr/ 2 + &) = + cos 


cos(—æ) = cos &, cos(zr + &) = -cos & 
cos(zr {2 - &) = sin &, cosf(rx/2+æ)=-sinæ (20.22) 


tan(—-@) = -tan &, tan(7 - &) = -tanæ 
tan(r + @) = tan &, tan(zr/ 2 - 4) = cot æ 
tan(xr/2 + &) = -cotæ 


Voici les schémas qui résument la manière d'analyser quelques-unes de ces propriétés (pour les autres 
relations, la méthode est identique): 


M'icos(-x) ; sin(-x}) 


ro 
| cos(r-x) À 
PCR A Mcos(x) ; sin(x)) 


Introduisons maintenant une dernière relation que nous retrouvons en optique ondulatoire ou encore 
dans le cadre des transformées de Fourier qui est le "sinus cardinal": 


sinc(x) = ace) (20.24) 
x 


représenté par: 
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(20.25) 


C'est surtout sa forme 3D qui est connue car souvent utilisée pour des raisons de marketing faisant 
penser à une goutte d'eau tombant dans un récipient d'eau (avec Maple) et c'est toujours joli à 
regarder.….: 


plot3d(sin(sqrt(x12+y/2))/(sqrt(x12+y12)),x=-20..20,y=-20..20); 


(20.26) 


2.1. RELATIONS REMARQUABLES 


Le dessin ci-dessous va nous permettre d'établir des relations qui permettront de résoudre des équations 
impliquant des fonctions trigonométriques (toutes ces relations sont de première importance en 
physique pour la simplification de la résolution de problèmes). 
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Nous noterons sur le schéma la relation suivante: DE = 45 
Donc: 


sin(æ + 6) = CD+DE _ CD , DE _ CD, CB , DE ,OB 
A OC OC OC CB OC OB _— 


= gin(" cos(æ) + cos( 6) sin(æ) 
En résumé: 

sin(æ + 6) = sin(@)'cos(5) +cos(æ) : sin($) (20.29) 
Ce qui implique trivialement si æ = &: 

sin(2æ) = 2sin(&)cos(&æ) (20.30) 
et: 
sin(æ — 6) = sin(@æ + (— #))= sin(@) ' cos(— 6)+ cos(æ)' sin(— 8) (20.31) 

d'où: 

sin(&æ — 6) = sin(@)' cos( 5) - cos(æ)' sin(#) (20.32) 
Nous avons également: 


sin([æ + 8]+7/2) = cos(æ + 8) = sin(@)' cos( 8 +7/ 2) + cos(@) sin( 8 +7/2) 
= gin(æ)'(-sin #) + cos(æ) cos( 5) Ds 
d'où: 
cos(&æ + #) = cos(&)' cos(#) - an(æ)'sin(É) (20.34) 
Ce qui implique trivialement si & = £: 


cos(2a) = cos (@)-sin?(æ) (20.35) 


Avec la relation déjà démontrée cos? {&) + sin? (æ) = 1 nous obtenons également les relations très 
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importantes: 
cos(2a) = cos? (@)- sin?(a) = 1-2sin?(@) = 2cos (@)-1 (20.36) 
Relations avec lesquelles nous obtenons très facilement les "formules de Carnot": 


_ 17 cos(24&) —. (a) _ 1+cos(24) 


in?(æ , 20.37) 
sin ( ) 2 2 ( 


et: 
cos(&æ — 6) = cos(æ + (—6)) = cos(@)' cos(- 6) -sin(æ)'sin(-#) (20.38) 
d'où: 
cos(&æ — 6) = cos(æ)' cos( 8) + sin(æ)'sin(#) (20.39) 
Nous avons aussi: 


sin(æ+ #) _ sin(@)cos(6) +cos(æ)sin(8) 

cos(æ + 6) _ cos(@æ)cos( 6) — sin(æ) sin( 5) 
sin(æ) cos( 6) F1 cos(eæ) sin( 6) 

_ cos(@)cos(#) cos(æ)cos(#)  tan(æ) +tan(6) 

_ cos(a)cos(#) sin(@)sin(f)  1-tan(æ)tan( 8) 
cos(@)cos(f) cos(æ)cos(6) 


tan(æ + 6) = 


(20.40) 


Ceci, pour en arriver à la relation: 


tan (ec) + tan( 6) 


tan + = ——— (20.41 
a 
qui implique: 
tan(2ay = 22@) ou 
1=tan’(a) 


et évidemment: 


tan(@) +tan(—6) _ tan(a)-tan(s) 


tan(aæ - 6) = tan(æ +(- 5) = 1-tan(@) tan(-#) l+tan(@) tan(f) 


(20.43) 


d'où: 


22. tan(cæ) —- tan( 6) , 
tan(æ — 6) nt (20.44) 


Nous obtenons également de manière triviale à partir des relations précédentes (nous faisons un petit 
mélange et nous secouons...): 
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2tan(æ) _ 1-cos(2@) 


1-cos(24) _ sin(2&) 


tan? (a) =1- et tan(a) = — (20.45) 
tan(2@) 1+cos(24) sin(2®  l+cos(2) 
Nous avons aussi: 
D) m2 at con e cute Ce 10) #2 eteieo OM 046 
cos(cæ) 
avec: 
=tan/(@)+1 (20.47 
cos’ (a) dE 
d'où: 
) 2 tan 5 
into = —22@) à in(o = (20.48) 
SCD Er 


de manière similaire nous obtenons: 


cos(2a) = cos? (@) -sin?(a) = cos? (a) (1 - tan? (a)) (20.49) 


avec: 
=tan?(@)+1 (20.50 
RTE (a) (20.50) 
d'où: 
1 1-tan? 5 
cos(24æ) = ne) & cos(d) = (20.51) 
a le 


Déterminons maintenant les formules trigonométriques complémentaires appelées "formules de 
Simpson" ou "formules d'addition" qui permettent d'exprimer la somme de sinus et/ou de cosinus en 
produit de sinus et/ou cosinus. 


Soient les relations déjà démontrées précédemment: 
(1) cos(æ + 8) = cos(@)' cos( 8) - sin(@): sin( 6) 
(20.52) 
(2) cos(&æ - 8) = cos{@): cos( 5) + sin(æ) : sin( ) 


Posons æ+ $=p et æ-£8=g d'où: 
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Nous obtenons par sommation de (1) et (2): 


+ _ 
cos(p) + cos{g) = 2cos | - ; ci ]ee [2 ; 1) (20.54) 


et par différence: 


+ _ 
cos(p)-—cos(g) = -2sin É ; 7 ]sn (= (20.55) 


De la même manière nous obtenons: 


ptg 


sin(p)+sin(g) = 2sin EE _ 


| (20.56) 


et par différence: 


sin(p})- sin(g) = 2sin (£ = Je (25 (20.57) 
et inversement nous retombons très facilement sur les relations: 
cos(æ)cos(£) = S[eosta+ 8) +cos(æ- #)] 
sin(æ} sin($) = =lcos(a- #) -cos(æ + #)] (20.58) 
sin(@æ) cos( 8) = lsinta+ 8) + sin(a- 8)| 


Toutes ces relations nous seront utiles lors de notre étude de la physique générale et particulièrement 
dans le cas de calcul d'intégrales. 


Remarque: Les relations suivantes démontrées précédemment: 


+ _ i + 
sin p + sing = 2sin PE cos Ê$ tan p+ tan ç = PTE 
: : … PT4 ptg 
- = 2 
sin p — sin g Sn —5— cos — | o 
PYT4. P=4 sin(p — 4) 
+ = _ Œ 
cos p + cosg = 2 cos 5 CS — tan p — tan g DEL 
+ _ 
cos p-cosg = -2sin ET sin LT 


sont souvent appelées "formules de Simpson". 
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2.1.1. THÉORÈME DU COSINUS 


Démontrons encore le théorème du cosinus, utile en géométrie: 


Dans un triangle quelconque, le carré de l'un des trois côtés est égal à la somme des carrés des deux 
autres diminuée du double produit de ces deux côtés par le cosinus de l'angle compris entre eux: 


Démonstration: 
à 0 LT 
- pi=pi4y 
ac =" -» (20.61) 


ac? ={m+n)(n-n) 
dc =b(b-2n) =? -2nb 


mais dans le triangle ABH, rectangle en H, nous avons la relation # fc = cos( 7) d'où: 
ac? =b? - be cos( 7) (20.62) 


Nous obtenons donc une des relations du "théorème du cosinus": 


a =b?+c?-2bccos(7)| (20.63) 


Par permutation circulaire, nous obtenons les deux autres relations connues. 


Remarque: Le théorème du cosinus est parfois appelé "formule d'AI-Kashi"'; par ailleurs si a est 
l'hypoténuse et son angle opposé un angle droit tel que cos( 7) est nul, nous retrouvons donc le 

théorème de Pythagore. Voici pourquoi nous appelons parfois la formule d'AI-Kashi "formule de 
Pythagore généralisée”. 
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2.1.2. THÉORÈME DU SINUS 


Soit le triangle quelconque dont nous traçons deux hauteurs: 


(20.64) 


Dans le triangle ci-dessus nous avons les relations: 


sin(æ) = DB sin(y) = DB (20.65) 
C & 


ce qui nous conduit à l'expression: 
DE =csin(@) =asin(y) (20.66) 
d'où: 


ä [es 


sin(æ) sin(y) 


Par un raisonnement similaire nous avons: 


sin(a) - in(9 = (2068) 
ä 


Ce qui donne: 


a b 
= (20.69) 


sin(æ)  sin(6) 


Le tout combiné nous fournit le "théorème des sinus" dont le plus bel exemple d'application sur ce site 
est certainement la détermination des points de Lagrange L4 et L5 dans le chapitre d'astronomie: 


a b c 
= = (20.70) 


sin(a) sin(f) sin(y) 


Evidemment, il n'y a pas ici toutes les relations trigonométriques (du cercle) existantes comme nous 
l'avons déjà dit, mais au moins les plus importantes qu'il faut savoir retrouver lors de l'étude de systèmes 
physiques. 
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3. TRIGONOMÉTRIE HYPERBOLIQUE 


Nous avons démontré dans le chapitre d'Analyse Fonctionnelle que toute fonction f(x) peut se 
décomposer en une fonction paire et impaire telle que: 


fe- 12 J02 , 9° C2 


(20.71) 


Ainsi, pour la fonction f(x) = 2* , nous obtenons: 


x —* x X 
eg —@ ge +e 
eg = + (20.72) 


2 


Rappelons que lors de notre étude des nombres complexes nous avions démontré que: 


ix x ix à» 
ge te . e Lu. 
cos(x) = ——— sin (x) = (20.73) 


L à 


Nous définissons alors par analogie le sinus et le cosinus hyperbolique (nous démontrerons la 
provenance de ce terme plus loin) par: 


Lt —* * —* 
ge +e . e* —@ : 
cosh(x) = 5 sinh(x) = En (20.74) 


et nous pouvons donc écrire: 

e* =sinh(x) +coshfx) (20.75) 
Relation que nous pouvons à nouveau mettre en analogie avec: 

e* =cos(x)+isin(x) (20.76) 


Chose intéressante, nous pouvons travailler en trigonométrie avec des angles complexes. 
Effectivement, si nous posons x = 4+;b, nous avons alors: 


e%® = sinh(a +ib) +cosh(a+ib) (20.77) 
Or: 
gr = Go = pe = r(cos(b) +isin(b)) (20.78) 
Donc: 
e*(cos(b) +i sin(b)) = sinh(a +ib)+coshfa +5b) (20.79) 
Donc la fonction hyperbolique d'un angle complexe existe et l'image en est un nombre complexe aussi. 
Nous pouvons ainsi voir abusivement la géométrie hyperbolique comme une sorte de généralisation de 


la trigonométrie du cercle aux angles réels et complexes. 


Par opposition à la trigonométrie du cercle, le lecteur remarquera et vérifiera facilement que nous 
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avons: 
cos? (æ) + sin? (a) =1 cosh?(&)-sinh?(æ) =1 (20.80) 
Démonstration: 
hit e+e * 4e eo : Le +e 
2 4 2 À 
2 
lé "+2 Pur Dh eee * +0 2 ge -e ” 
= 1-—+ =1+ =1+ =1+ 
2 4 4 4 2 
= 1+sinh?(x) 


Nous avons donc: 


cosh? (x) — sinh? ae 1 


OIC.Q.F.D. 


Recherchons maintenant les fonctions réciproques des fonctions sinus et cosinus hyperboliques (que 
nous utiliserons parfois en physique ou en mécanique). Pour cela rappelons que: 


% 1 A 
y = cosh(x) = —— (20.81) 


et que la recherche de la fonction réciproque consiste toujours à isoler x. 
Donc: 

2y—e *—e* = 2cosh(x)-e *-e* =0 (20.82) 
c'est-à-dire: 


(e’ Ÿ —2ye*+1=0 (20.83) 


en résolvant ce polynôme du deuxième degré en .* puis en prenant le logarithme nous obtenons: 


2 
sn DEN © Ja 4 _ p3 _] G084 


812 


Or comme ,* +. Q nous devons rejeter la solution avec le signe "-". Il vient alors: 


= y+ [2 —] (20.85) 


d'où: 


Page: 1319/4839 


[v3.0 - 2013] 


r=lù L+ _ 1) (20.86) 


En procédant de même pour: 


x x 
y = sinh(x) = —— (20.87) 


Donc: 
2y+e *—-e*=2sinh(x)+e *—-e=0 (20.88) 
c'est-à-dire: 
() —2ye*-1=0 (20.89) 


en résolvant ce polynôme du deuxième degré en .* puis en prenant le logarithme nous obtenons: 


Li 


2 + fa À 44 
— . = y+ [2 +] (20.90) 


Or comme ,* -. Q nous devons rejeter la solution avec le signe "-". Il vient alors: 


e = y+ f2 +1 (20.91) 


d'où: 


* =in[y+ 4 +1) (20.92) 


Ainsi: 


arccosh(x) = In (x +R -1) 
arcsinh(x) = In (x+ Vr+1) 


(20.93) 


Attention car suivant les auteurs arccosh, arcsinh se notent argcosh, argsinh ou encore cosh'!, sinh°! 
(cette dernière écriture pouvant prêter à confusion avec l'inverse la fonction hyperbolique 
correspondante!). 


Pour étudier une représentation géométrique simple posons maintenant: 
cos(@) = X,sin(@æ) = F,cosh(æ) = Z',sinh(eæ) = F' (20.94) 
avec une restriction à æe IE et donc: 


X=[-111 F =[-11] X'=[L+o], F'=[-œ,+@] (20.95) 
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Donc nous pouvons écrire: 


X1+4+yi=] xX%3-y=1 (20.96) 
Or, comme nous le verrons lors de notre étude des coniques dans le chapitre de Géométrie Analytique: 


1. La première de ces deux relations, constitue pour l'ensemble de définition donné, un cercle de rayon 
unité centré à l'origine. Le lecteur remarquera qu'il est assez curieux pour la trigonométrie du cercle 
d'obtenir un cercle... 


2. La deuxième de ces deux relations, constitue pour l'ensemble de définition donné, une hyperbole 
équilatérale orientée selon l'axe X dont le sommet est S(1,0) et de foyer F2 0). Le lecteur 


remarquera à nouveau qu'il est assez curieux pour la trigonométrie hyperbolique d'obtenir une 
hyperbole.. 


Ces deux dernières constations devraient permettre, nous l'espérons, au lecteur de comprendre l'origine 
du nom de la trigonométrie hyperbolique et de constater que l'étude la trigonométrie hyperbolique sur 
l'hyperbole est l'analogue de l'étude de la trigonométrie du cercle sur le cercle. 


Si nous représentons le cercle trigonométrique et l'hyperbole trigonométrique et rajoutons quelques 
informations complémentaires, voici ce que nous obtenons: 


(20.97) 


Explications: 


Pour tracer à la règle et au compas le point P(x,y) de l'hyperbole, nous nous donnons x, donc le point 
A(x,0). Nous traçons la tangente au cercle (C) qui passe par A(x,0) ce qui nous donne le point de 
tangence T. Nous traçons le cercle (G) de centre A(x,0) et passant par T. Ce cercle coupe l'hyperbole au 
point P(x,y) à la perpendiculaire en A(x,0) à Ox. 
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Nous voyons apparaître sur la figure plusieurs valeurs des fonctions hyperboliques correspondant à 
x = cosh(f},y = sinh(f) mais aussi tanh{f},coth(f} etc. Entre autres, le cercle (G) coupe l'axe Ox en 


deux points dont les abscisses sont £* et #*. 


Si le lecteur veut s'en assurer au moyen de la figure, il pourra contrôler qu'en tout point de l'hyperbole, 
les relations (entre autres): 


u a + + 
ge +e . ge —e 
sinh(f) = 


cosh(f) = cosh?(£) -sinh?(£) = 1 (20.98) 


sont toujours vérifiées. 


Si nous traçons maintenant sur un graphique: 


_— he tanh@ry= #1) | (20.90) 
cosh(x) 


sinh(x) = 


Nous obtenons (ça c'est juste pour avoir vu une fois à quoi ressemblent ces fonctions) avec Maple: 
>plot([sinh(x),cosh(x),tanh(x)],x=-2..2,color-[red,black,blue]); 


e*+e* 


cosh(x) = 


. sinh(x} 
EU cosh(x) 


1 


x 


ge -e* 


sinh(x) = 
(20.100) 


Nous retrouverons la fonction cosh(x) dans le chapitre de Génie Civil par exemple dans le cadre des 
câbles suspendus. Nous retrouverons aussi les fonctions sinh(x) et tanh(x) dans le cadre de l'étude des 
vagues de gravité dans le chapitre de Génie Marin Et Météo. 


3.1. RELATIONS REMARQUABLES 


Soit par définition: 


x + 
ge +e . ge —2e 
sinh(x}) = (20.101) 
2 


cosh(x) = 
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et: 


: X 2x _ | 2x 
sinhfx) _e -e" | : 1 cibtàs 1 _sinh(x) _ +1 
cosh(x) e+e* e*+1 tanh(x) cosh(x) e**-1 


tanh(x) = (20.102) 


A partir de ces définitions et à l'aide des opérations élémentaires d'algèbre nous pouvons déterminer les 
relations remarquables suivantes (c'est beaucoup plus facile que la détermination de relations 
remarquables de la trigonométrie du cercle, donc sauf demande nous donnons ces relations sans 
démonstration): 


cosh(x) + sinh(x) = e* cosh(x) -sinh(x) =e* 
cosh(-x) = cosh(x) sinh(-x) = -sinh(x) (20.103) 
tanh(-x) =-tanh(x) coth{-x) = -coth{x) 
Egalement: 
2 
cosh?(x) = a sinh? (x) = cr (20.104) 
1-tanh°(x) 1-tanh°(x) 
Et nous avons les relations d'addition: 
cosh(a +b)= cosh(a)cosh(b) + sinh{a)sinh(b) 
cosh(a —b) = cosh(a) cosh(à) -sinh(a)sinh() Gide 


sinh(a + b) = sinh{a)cosh{b} + cosh(a) sinh(b) 
sinh(a —b) = sinhfa)cosh(b} - cosh{a)sinh (à) 


Suite à la demande d'un étudiant, démontrons les première et troisième relations ci-dessus: 


Pour la première: 


et +e te +e ee —e 
2 2 2 2 


_ at +92 +e 2% +e2%)+{e2t _ _ 9 2t +e 2% ] (20.106) 


= 2 (2e* + 2677) = (* +e) = cosh(a +b) 


cosh(æ)cosh(à)+ sinh(a)sinh(à) = 


et la troisième: 


a __ a .b — a -a D _ 
sinh(z)cosh(à)+cosh(a)sinh(e) =" Fe ,6 te € 7e 
2 2 2 2 
= (+ He gt Ge +(.°+ PE De di ] (20.107) 
4 
_ 1 at ab _ 1 a+ __ ab _ 
= Al 2e ) = ;( 8 ) = sinh(a +b) 


Signalons encore d'autres relations remarquables: 
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cosh(p} + cosh(g) = 260 [2 = z Je (2-2) 


cosh(p) - cosh(g) = 2sinh E ; 7 | sinh (ee) 
(20.108) 
sinh(p) + sinh(o) = 2 [219 u Je [2-2 =) 


sinh(p) - sinh(g) = 2cosh É | 4 | sinh| ? +) 
et encore: 

tanh(a +b) = RE 
1+tanh(a)tanh(b) 

tanh(a —à) = Et EE 
1-tanh{a) tanh(b) (20.109) 

tanh(p) + tanh() cosh(p) cosh(g) 

tanh(p)-tanh(g) cosh(p}cosh(g) 


4. TRIGONOMÉTRIE SPHÉRIQUE 


L'objectif de la trigonométrie sphérique est de déterminer les relations remarquables existantes entre les 
angles et les côtés de formes projetées (dites également "formes géodésiques" car suivant la courbure 
de l'espace) sur la surface d'une sphère. Pour déterminer ces relations, nous allons nous intéresser au 
cas particulier d'une sphère de rayon unité et des relations entre les côtés d'un triangle (élément de 
surface plane élémentaire) et les différents angles existants. Nous verrons que les résultats sont au fait 
indépendants du rayon de la sphère et de la forme considérée initialement. 


Soit la figure sur laquelle se trouve un triangle géodésique de sommets À, B, C d'angles d'ouverture 
respectifs À $ © et de côtés opposés a, b, c et trois vecteurs ?, jÿ,# unitaires tels que ? L £,j LE et 


que l'extrémité de # soit confondue avec le sommet A: 
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+ 


1 
L 
L 
L 
0] 
' 
l 
' 
! 
! 
t 
1 
U 


(20.110) 


L'angle entre les points B et C, noté & , n'a pas pu être représenté sur le schéma ci-dessus faute de 
place. 


Rappelons que le périmètre d'un cercle de rayon unité sur la sphère de rayon unité vaut bien 
évidemment P = 2x8. Le périmètre du cercle en fonction de l'angle d'ouverture de ce dernier étant 
donné par (relation très très souvent utilisée en physique!!!): 


L=27R —— R&!| (20.111) 
237 


Si le cercle est de rayon & = 1 (comme c'est le cas pour notre sphère), le calcul de la longueur d'arc se 
simplifie et devient: 


L=« (20.112) 


Nous garderons cette contrainte du rayon unité pour la suite afin de simplifier les expressions que nous 
allons obtenir par la suite. 
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Conséquence relativement aux points sur notre sphère; les côtés du triangle sont donnés par: 


a=€@ b=f$ c=7Yy (20113) 
Considérons maintenant le produit scalaire (cf. chapitre de Calcul Vectoriel)}: 


OB °OC = JOB]: IDC ]cos(a) (20.114) 
et comme [x] = Joc| = 1 (rayon unité) nous avons: 


cos(æ) = cos(a) = OBoOC (20.115) 
Si nous décomposons les deux vecteurs 42 et &c' sur les vecteurs tangents unités nous avons: 


OB = cos(y)E +sin(y} 


_ n _ (20.116) 
OC = cos( S)k + sin( 5 j 


Ce qui nous donne: 
cos(a) = [cos(Y)£ + sin(Mi Jo[cos( BE +sin(Æ)5] (20.117) 


ce qui donne (distributivité du produit scalaire): 


cos(a) = cos(y}cos( BE ok + cos(Yisin( BE o j + sin(y) cos( 8 oË + sin(y}sin( 8) of 
(20.118) 


Comme E of =1et foi =Eoj=0, la relation précédente se réduit à: 
cos(a) = cos(y)cos(8) + sin(y)sin( 8 o 7 (20.119) 
et comme: 
Fof=cos(À) (20.120) 
Nous avons: 
cos(a) = cos(yicos(£) + sin(y)sin( 5) cos(À) (20.121) 


relation dite "relation fondamentale" ou "formule des cosinus" que nous pouvons donc (de par le rayon 
unité) tout aussi bien écrire: 


cos(a) = cosfc)cos(b) +sin(c) sin(b) cos( À) (20.122) 


Cette dernière relation est invariante par permutation circulaire des variables 4,e,b, À. Il est aussi 


intéressant de remarquer avant de continuer que si le triangle sphérique est à angle droit en A, la 
relation précédente se simplifie en: 


cos(a) = cos(c)cos() (20.123) 
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et si le triangle est suffisamment petit par rapport au rayon et que nous faisons un développement de 
Taylor proche de 0 au deuxième ordre (cf. chapitre Suites et Séries) pour chacun des termes il vient: 


2 2 2 
4 lil ce 
a 2 2 


soit: 
1- a? vs Es cb? 
(20.125) 
50 


après simplification: 
a =h?+e? (20.126) 
nous retrouvons le théorème de Pythagore (cf. chapitre de Géométrie Euclidienne). Donc: 
cos(a) = cos(c)cos() (20.127) 


est le pendant en géométrie sphérique (géométrie non-euclidienne) du théorème de Pythagore de la 
géométrie plane (géométrie euclidienne). 


Cette paranthèse fermée, revenons en à nos moutons. Les sinus de tous les angles étant positifs 
(puisque inférieurs à #7), nous pouvons écrire: 


_ fcos(æ) - cos()cos(c) | 


sin(À) L Ji - cos’ (À) L sin(b) sin(c) 


sin(a) sin(a) sin(a) 
_ Af= cos (@)N(1— cos? (c)) — cos? (a) - 05? (b)cos?(c) + 2cos(a)cos(h)cos(c) es 
sin(a)sin(b)sin(c) 
L 1-cos? (a) - cos® (b) - cos? (c) + 2cos(a)cos(b)cos(c) 
sin(a)sin(b)sin(c) 


Cette dernière relation est bien évidemment également invariante par permutation circulaire des 
variables 4,b,e, À. Donc nous obtenons une relation remarquable du triangle sphérique, appelée 


"relation des sinus" ou “formule des sinus": 


sin(À) _ sin(Ë) _ sin(C) 
sin(a) sin(b)  sin(c) 


(20.129) 


Comme la trigonométrie sphérique est souvent utilisée pour des repérages terrestres, avec souvent 2 
cercles très particuliers et orthogonaux: l'équateur terrestre et un méridien ou un parallèle quelconque, 
ce cas revêt un intérêt particulier. Le lecteur pourra s'exercer à retrouver les relations ci-dessous. Dans 
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le cas d'un triangle rectangle en A nous avons bien évidemment: 


1 _sin(f) _ sin(C) 


_— (20.130) 
sin(a) sin(b)  sin(c) 


Toutes les relations que nous avons déterminées jusqu'à maintenant nous permettent dans le cas où 
Â=3/2 et R =1 de tirer des relations très intéressantes pour la géophysique: 


sin(b) = sin(a)sin(À) 

sin(e) = sin{a) sin(@) 

cos(a) = cos(b)cos(e) (20.131) 
cos(C} = sin( Ë) cos(c) 

cos( À) = sin(C) cos(b) 


Evidemment, nous n'avons pas présenté ici toutes les relations de trigonométrie sphérique existantes, 
mais au moins les plus importantes qu'il faut savoir retrouver. 


Remarque: Nous définissons "l'excédent" ou "excès sphérique" par le nombre: 


E=A+B+C-x (20.13) 


Pendant que nous y sommes, profitons-en pour calculer un problème classique qui est celui de la 
surface d'un triangle sur une sphère. Soit la figure: 


(20.133) 


Si nous prolongeons les arcs de géodésique AC et AB jusqu'à 4 nous obtenons une tranche de sphère 
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dont la surface £, est proportionnelle à l'angle & ,en A. Si cet angle valait 27, nous aurions toute la 


sphère et la surface vaudrait 4778? . Comme l'angle vaut &, la proportionnalité nous dit que $, vaut: 
æ 
S = —47R? = a2R? (20.134) 
27 


De la même manière, si nous prolongeons les arcs BC et BA jusqu'à Z, et si nous prolongeons les arcs 
CA et CB jusqu'à C;, nous obtenons deux autres tranches dont les surfaces $, et $, valent: 


S, = 82R? S,=y2R* (20.135) 
Supposons maintenant que nous additionnions ces trois surfaces: 
S +55 +8 = 2R7 (a+ 8+y) (20.136) 


nous obtenons alors la moitié de la sphère $,, (regarder la figure pour vous le représenter mentalement) 
plus 2 fois le triangle géodésique de surface S en rose sur la figure (car pris en compte 2 fois en trop). 


Il faut enlever deux fois la surface de ce triangle bleu pour obtenir la surface de la demi-sphère: 
So 2 | 
in 2R*(æ+8+7y)-28 (20.137) 

Donc: 
Ss =4R(a+8+y}-48S (20.138) 

comme $, = 47R°, nous avons: 


. 4R° (a+ 8+7)-5S È 4R (a+ 8+7y)-47R° 
4 


(20.139) 


Après simplification nous en déduisons que la surface S du triangle ABC vaut:: 
S= R°(a+8+y-7)= RE (20.140) 
où & est un angle solide. 


Il est assez simple de généraliser ce concept à d'autres formes du même acabit (en particulier celles 
composées de triangles.….). 


4.1. ANGLE SOLIDE 


En géométrie spatiale, se pose le problème du concept d'angle d'ouverture d'une portion de l'espace (en 
extension à l'angle dit "angle plan"). Nous définissons alors "l'angle solide" £& par la mesure de la 
portion d'espace limitée par une surface conique de sommet O et nous l'exprimons en stéradian, 
obtenue par le rapport: 
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> 
r? 


£è = (20.141) 


S étant l'aire de la calotte découpée par le cône sur une sphère de rayon r. 


(20.142) 


Si & est le demi-angle du cône, nous obtenons pour ce rapport (pour le calcul de la calotte d'une 
surface sphérique voir le chapitre traitant des formes géométriques): 


à =2A(1-cosæ) (20.143) 
D'où l'on conclut que l'angle solide total vaut par définition: 
Sd = 477 (20.144) 


Nous pouvons également calculer "l'angle solide élémentaire" tel que représenté ci-dessous: 


(20.145) 


Soit un angle solide élémentaire 7€ et OM l'axe du cône. Nous posons: 
OM =r (20.146) 


Nous considérons une surface quelconque Y passant par le point M. 4£à découpe sur cette surface une 
portion 4Y. 
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Si nous traçons la sphère S de centre O et de rayon r, cet angle solide découpe sur cette sphère une 
calotte d'aire dS : 


dS =r?':d8 (20.147) 


Soit MN la normale à ZX qui fait un angle 8 avec OM. Nous avons, en assimilant dS et 4X à des 
portions de plan: 


dS = cos 84Z (20.148) 
d'où: 


L d> cos 4 


r? 


d$è (20.149) 


Ce concept d'angle solide nous sera très utile en particulier dans le domaine de la physique théorique 
qui traite du rayonnement thermique (cf. chapitres d'Optique et de Thermodynamique). 


Nous pouvons encore calculer à partir des concepts précédents, l'angle solide élémentaire de révolution 
tel que présenté sur la figure ci-dessous: 


(20.150) 
Il est compris entre deux angles solides de révolution dont les demi-angles au sommet diffèrent de 4. 


d$è= d(27(1-cosæ))=27sanædæ (20.151) 


de = LE (20.152) 


Démonstration: 


Dans le chapitre traitant des Formes Géométriques (cf. section de Géométrie) nous avons démontré les 
différentes manières de calculer la surface d'une sphère. De ces calculs il avait été déduit que la surface 
élémentaire à R constant était: 


dS =r? indé (20.15) 


et puisque: 
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dfi= me (20.154) 
F2 


l'angle solide élémentaire s'écrit alors: 


dii=sn 8484 (20.155) 


Ainsi, l'angle solide délimité par un cône de révolution, d'angle au somment & vaut : 


2% & 
a=f4a- apfsis 848 = gf" -(-co58) = 27{-cos(æ)-(-cos(0})) . 
L 2x(- cos (a) + 1 : 27(1- cos a) 
OIC.QFD. 
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Notes personnelles: 
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GÉOMÉTRIE EUCLIDIENNE 


L ‘objet de la "géométrie euclidienne" (appelée plus communément "géométrie plane") est, en 


principe, l'étude des formes et des propriétés des corps naturels. La géométrie n'est cependant pas 
une science expérimentale, puisque son objet est, non pas d'étudier certains aspects de la nature, mais 
une reproduction nécessairement arbitraire de celle-ci. 


Nous allons dans ce chapitre présenter implicitement, dans un premier temps, les cinq postulats de la 
géométrie euclidienne (dont les quatre premiers sont considérés aujourd'hui comme des axiomes) et 
ensuite développer autour de ceux-ci la géométrie de base que le lecteur aura besoin pour l'étude du 
reste du site. Une fois ceci fait, nous résumerons notre étude en présentant de manière explicite les 
cinq postulats d'Euclide et ensuite les axiomes de Hilbert. 


Remarque: Nous avons tenté de préserver au mieux les notations propres à Euclide en ayant 
toutefois une approche plus moderne de certains concepts et de présenter uniquement ceux qui 
sont utiles à l'ingénieur sur le marché du travail. 


OBJETS DE LA GÉOMÉTRIE EUCLIDIENNE 


Avant d'énoncer les cinq postulats, il nous semble bon de définir quelques concepts intuitifs au 
préalable: 


D1. La notion expérimentale la plus simple est celle de "volume". Nous disons qu'un corps occupe 
un certain volume lorsqu'il occupe dans l'espace à trois dimensions une certaine place (pour des 
espaces à des dimensions supérieures, nous parlons d'hyper-volumes). 


D2. Nous admettrons comme une chose évidente qu'un volume est limité par une "surface"; mais si 
l'existence du volume est physiquement contrôlable et mesurable, la surface est une création de 
l'esprit; c'est quelque chose d'analogue à une baudruche, par exemple, enveloppant un volume 
quelconque, mais d'analogue seulement. C'est un être géométrique à deux dimensions sans épaisseur. 


D3. Lorsqu'une surface est limitée, cette limite est une "ligne". Ici encore, la ligne est une création de 
l'esprit, une ligne n'a pas d'existence expérimentale; c'est quelque chose d'analogue à la figure formée 
par un fil de fer. Etre géométrique encore mais d'une dimension sans hauteur ni largeur. 


D4. Une "droite" est définie comme la ligne de plus court chemin joignant deux points sur une 
surface. 


D5. Quand une ligne est limitée, sa limite est un "point": le point est quelque chose d'analogue à 
l'intersection de deux fils tendus. C'est encore une création de l'esprit, un être géométrique. 


Remarque: Il est d'usage, en géométrie, de représenter un point par une lettre À, B...; une ligne, 
ou une surface par une lettre entre parenthèses (mais cela est rarement respecté car nous 
supposons souvent que le lecteur sait de quoi nous parlons). Nous disons alors, par exemple: la 
ligne (L), la surface (S). 


D6. L'expression le "segment" AB désigne en général une ligne limitée par les points A et B. Nous 
dirons qu'un point M est sur le segment AB, pour traduire le fait suivant: tout segment AB peut être 
séparé d'une infinité de façons en deux morceaux limités par À et M d'une part, par M et B d'autre 
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part - fait inspiré au géomètre par la possibilité de couper expérimentalement un bout de fil de fer en 
deux, et cela d'une infinité de façons (nous y reviendrons lors plus loin) 


Remarque: L'expression: "la ligne (L) est tracée sur une surface (S)" signifie que la surface (S) 
pourrait être divisée en plusieurs morceaux, de manière que la ligne (L) soit la frontière ou une 
partie de frontière d'un de ces morceaux. Cette définition est inspirée du fait qu'il est possible de 


découper une étoffe, par exemple, en suivant avec des ciseaux un trait quelconque tracé sur cette 
étoffe. 


Lorsqu'une ligne (L) est tracée sur une surface (S), tout point M qui est situé sur la ligne (L) est aussi, 
par définition, situé sur la surface (S). Nous disons alors que c'est un "point de cette surface". 


D7. Nous appelons "angle" (ou "angle plan") ou plus rigoureusement "angle rectiligne" la portion de 
plan limitée par deux demi-droites (voir plus loin la définition d'une demi-droite) 


DIMENSIONS 


Nous avons parlé de volume, surface et de ligne auxquelles nous pouvons associer des dimensions. 
Mais qu'est-ce une dimension au fait ? Nous allons tâcher d'essayer de définir au mieux cette 
dernière mais d'abord, il faut savoir qu'il existe en géométrie plusieurs types de dimensions. La plus 
connue et commune est celle que nous appelons la "dimension topologique". 


Par exemple, le point (abstraction mathématique et géométrique) a une dimension topologique de 0, 
la courbe (trait continu d'épaisseur nulle) une dimension de 1, la surface une dimension de 2, un 
volume une dimension de 3 et un hyper-volume une dimension 4 (pour représenter un hyper-volume, 


prenez un volume dessiné sur papier (...) et faites-en une translation et reliez les sommets). Ce sont 
toutes des valeurs entières par définition: 


une ligne 
(droite,courbe...) 


une figure plane 
(quadrilatère, cercle...) 


un solide 
(parallélépipède, sphère...) 


Tableau: 21.1 - Objets, représentations et dimensions types 


Pour calculer la dimension de certains objets, nous allons utiliser la méthode de la géométrie 
métrique plane qui consiste à prendre un étalon de cet objet, c'est-à-dire cet objet lui-même mais en 
plus petit, et à le reporter sur notre objet un certain nombre de fois: 


segment de longueur L 
on reporte l'étalon L fois 
1 


étalon de longueurn 


Figure: 21.1 - Concept d'étalon unidimensionnel 


Soit L la longueur totale du segment. Nous allons prendre un étalon de longueur n que nous allons 
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reporter sur le segment. Cet étalon sera reporté L/n fois. Nous remarquons que: 


:.(4 


Nous pouvons appliquer le même raisonnement à une surface: 


carré de côté Let 
de surface L 


: : LE : 
on reporte le petit carré rm. fois 


petit carré de côté n et 
de surface n 


C1 


Soit 7? la surface totale du carré. Cette fois, nous prenons un autre carré, plus petit, de côté n et de 
surface #?. Nous reportons le petit carré sur le grand 2? {#? fois pour obtenir la surface du grand 
carré. Nous remarquons que: 
2 
# EL 
# LC] 


Au travers de ces deux exemples, nous avons fait apparaître le nombre 1 pour le segment, et le 
nombre 2 pour le carré, l'idée est la même avec un volume mais en utilisant un cube. Ces nombres 
sont la "dimension" de l'objet. 


Ainsi, pour résumer: 


- Les lignes sont de dimension 1, car pour mesurer une longueur avec une division plus fine d'un 
facteur n d'un segment étalon, le nombre de subdivisions sera multiplié par le même facteur. Donc il 
y a une relation de puissance unitaire entre la subdivision et la mesure. 


- Les surfaces sont de dimensions 2, car pour mesurer une surface avec une division plus fine d'un 
facteur n d'un carré étalon, le nombre de subdivisions sera donné par la puissance carrée de n. Donc 
il y a une relation de puissance deux entre la subdivision et la mesure (si on prend des carrés deux 
fois plus petits pour couvrir une surface, il en faudra quatre fois plus). 


- Les volumes sont de dimension 3, car pour mesurer un volume avec une division plus fine d'un 
facteur n d'un cube étalon, le nombre de subdivisions sera donne par la puissance cubique de n. Donc 
il y a une relation de puissance trois entre la subdivision et la mesure (si on prend des cubes deux 
fois plus petits pour remplir un volume, il en faudra 8 fois plus). 


Généralisons: soit N le nombre de fois que nous reportons l'étalon de longueur n sur notre objet de 
longueur L, et soit d la dimension de l'objet, nous avons: 


Dans le cas des fractales (cf. les) les dimensions sont variables et fractionnaires. 
Considérons la courbe de Von Koch (par exemple) après une itération de la suite la définissant: 


Soit L sa taille tel que Z = 1. Pour calculer sa dimension nous prenons l'élément fondamental de la 
courbe (ci-dessous en rouge): 


= . + 


Soit n la taille de cet étalon tel que # = 1/3. Nous voyons très bien que nous pouvons le reporter 4 
fois sur la courbe. Donc: 


In(4) _In(d) . 
. 1 | In(3) 
143 


La dimension de la fractale de Von Koch a donc une valeur fractionnaire et est plus une courbre 
(proche de 1), qu'une surface (qui est de dimension 2). Les choux-fleurs sont par exemple des 
fractales de dimension 2.33... 


d = 1.26... 


Nous pouvons donc calculer la dimension de n'importe quels objets fractals à la condition de 
connaitre leurs mesures. 


Ne nous hasardons pas à aller chercher des objets complexes dans quelques galaxies alors que la 
fractale la plus connue se trouve dans votre assiette (la seconde étant vos poumons...). Eh oui! Le 
chou-fleur est bien une fractale (au même titre que vos poumons)! Vous avez sûrement déjà 
remarqué que quand nous découpons le chou-fleur (chose pas conseillée à tenter pour vos 
poumons...), nous le cassons au lieu de le couper, et ça donne plein de petits choux-fleurs, qui eux 
même peuvent donner d'autres plus petits choux fleurs. Cette particularité d'autosimilarité à 
différentes échelles fait du chou-fleur une fractale. 


Calculons à présent la dimension fractale du chou-fleur. Quand nous cassons le chou-fleur, nous 
obtenons entre 12 et 14 branches qui ressemblent au chou-fleur entier à une dilatation près. Cette 
dilatation est, si nous la calculons, de facteur 3. Donc, selon la formule ci-dessus, la dimension 
fractale du chou-fleur est d'environ: 


d = no & 2.33... 
In(3) 


Donc le chou-fleur est plus une surface qu'un volume. 


Faison un dernier exemple avec la fractale du triangle de Sierpinski (cf. « ): 


L 


4 A À À À À 42 


à À 
À À À 


La 
evrtr 


AA À 8 À À LÀ À À À 8 À À BA À 


D'abord, il est évident que nous avons besoin d'un carré pour le recouvrir complétement. Avec des 
carrés deux fois plus petits, on aura besoin de trois carrés: 


Si nous divisons encore une fois la taille des carrés par deux, il nous faudra 9 carrés pour recouvrir le 
triangle: 


Si nous divisons encore la taille des carrés par deux il nous en faudra 27: 
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Et donc nous remarquons que: 


IG) In) FOR 
3= 2102) 9 42) 27= gi (19) 


et donc: 


Donc la fractale de Sierpinski est plus une surface qu'une courbe. 


Il existe également d'autres dimensions. Prenons pour exemple, les "dimensions d'homothétie" dont 
voici quelques exemples simples (voir plus loin la définition rigoureuse de "l'homothétie"): 


Figure: 21.9 - Représentation des dimensions d'homothétie 


Le segment (tout à gauche), de dimension 1 a par homothétie, vu sa longueur, doublé et nous 
remarquons que: 


d=1,4=2,N=2 =2 (18) 
Le carré (au milieu), de dimension 2 a par homothétie, vu sa surface, doublé et nous remarquons que: 
d=2,H=2,N=2%=4 (219) 


Le cube (tout à droite), de dimension 3 a par homothétie vu son volume doublé et nous remarquons 
que: 
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d=3,H=2,N=2=8 
Le facteur de duplication d'échelle (homothétie) est donc égal à: 
D Dimension To beique 
Comme vous pouvez le voir, il s'agit toujours d'une valeur entière mais d'un autre type de dimension. 
Le concept de dimensions ayant été introduit intéressons-nous maintenant aux postulats d'Euclide qui 
pourront paraître vagues dans un premier temps mais qui seront détaillés au fur et à mesure de notre 
lecture. 


CONSTRUCTIONS D'EUCLIDE 


La construction de la géométrie plane d'Euclide se fonde sur cinq postulats (dont les quatre premiers 
sont considérés aujourd'hui comme des axiomes comme nous en avons déjà fait mention): 


P1. Conduire une droite d'un point quelconque à un point quelconque. 


Sous forme moderne nous dirions que par deux points distincts À et B, il passe une droite et il n'en 
passe qu'une seule. 


Autrement dit: Deux droites (D) et (D') qui ont deux points communs sont confondues, tout point de 
l'une est un point de l'autre et réciproquement. 


Il résulte de ce postulat que deux droites (D) et (D'), ou bien n'ont aucun point commun, ou bien ont 
un seul point commun qui s'appelle "point d'intersection" et sont alors "sécantes" et "distinctes", ou 
bien ont plus d'un point commun et sont alors "confondues". 


P2. Prolonger indéfiniment, selon sa direction, une droite finie. 


Sous forme moderne nous dirions que tout segment AB est prolongeable en une droite passant par A 
et B (compte tenu du premier axiome, elle est unique dans une géométrie euclidienne) 


P3. D'un point quelconque, et avec un intervalle quelconque, décrire une circonférence de cercle. 


Sous forme moderne nous dirions pour tout point À et tout point B distinct de À, nous pouvons 
décrire un cercle de centre A passant par B. 


P4. Tous les angles droits sont égaux entre eux. 


Sous forme moderne nous dirions qu'à chaque angle 493 du plan correspond sa mesure 8, 
effectuée avec une unité choisie une fois pour toutes où # est un nombre positif, inférieur à 2x. 
Réciproquement, soit # un nombre positif quelconque compris entre 0 et 2x7, nous admettrons qu'il 
existe une infinité d'angles 492 égaux entre eux dont la mesure avec l'unité d'angle choisie soit 8. 


P5. Si une droite, tombant sur deux droites, fait les angles intérieurs du même côté plus petits que 
deux droits, ces droites, prolongées à l'infini, se rencontreront du côté où les angles sont plus petits 
que deux droits. 


Sous forme moderne nous dirions que: étant donnés une droite et un point, il existe une unique droite 
passant par ce point et ne coupant pas la droite initiale. 
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La construction d'Euclide permet donc le développement de la notion de mesure de longueur, d'aire, 
de volume, d'angle comme nous allons le voir plus loin. 


Les deux théorèmes fondamentaux de la géométrie euclidienne sont le théorème de Pythagore et 
celui de Thalès comme nous en verrons la démonstration plus loin. Un peu d'analyse permet d'aller 
plus loin avec la trigonométrie que nous avons déjà développée dans le chapitre précédant. 
DROITE ET SEGMENTS 

Dans un premier temps, la figure géométrique la plus simple (mis à part le point...) en géométrie 
euclidienne est la "ligne droite" et celle-ci est directement concernée par deux premiers postulats 
d'Euclide. 


Définitions: 


D1. La "ligne droite" est l'image donnée par un fil tendu d'épaisseur nulle et de longueur infinie. 


Remarque: Nous pouvons également définir la "ligne droite" comme une infinité de points mis à 
côté les uns des autres dans une même direction sur un plan. 


EL 


D2. Nous appelons "demi-droite" la portion de droite limitée à un point O appelé "origine". 


Remarque: L'expression "la demi-droite OA" désigne la demi-droite d'origine O, point nommé le 
"premier", qui contient le point A. 


D3. Nous disons que deux demi-droites OA, OB sont des "demi-droites opposées" lorsqu'elles 
constituent la droite AB toute entière. 


D4. Nous appelons "segment" AB une portion de droite limitée par deux points À et B. Ces points 
sont appelés les "extrémités" du segment. 


GRANDEURS DE MÊME ESPÈCE 


Nous disons que des figures géométriques (sous-entendu des droites) sont des "grandeurs de même 
espèce" lorsqu'il est possible de définir: 


1. Dans quel cas une figure (À) sera dite égale à une figure (B) et, si elles sont inégales, laquelle est 
la plus petite. 


2. Ce que nous devons entendre par somme d'une figure (A) et d'une figure (B). 


Les définitions choisies doivent être telles que si (A) est déclaré plus petit que (B) et (B) plus petit 
que (C), (À) soit déclaré aussi plus petit que (C). 


Il faut, en outre, que la figure appelée "somme de (A) et de (B)" soit égale à celle qui est appelée 
somme de (B) et de (A). 


Enfin, la substitution dans une comparaison, une égalité ou une somme, d'une figure par une figure 
égale ne doit pas modifier le résultat des opérations. 


Pour faire comprendre ce que sont des grandeurs de même espèce, prenons l'exemple des segments 
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de droite: 


- Nous admettrons qu'il est possible de décider de l'égalité de deux segments AB et A'B' lorsque nous 
pouvons les faire coïncider. 


- Nous admettrons aussi qu'il est possible de remplacer le segment A'B' par un segment égal AD et 
porté sur la demi-droite AB. 


- Enfin, nous admettrons qu'il est possible de distinguer entre trois points À, B, C, pris au hasard sur 
une droite, lequel est entre les deux autres. 


Nous convenons alors de dire que le segment A'B' est plus petit que le segment AB, ce qui s'écrit en 
abrégé: 


A'B'< AB 


lorsque le point C, obtenu en portant sur la demi-droite AB un segment AC égal à A'B', tombe entre À 
et B. 


Si le point C était en B, les segments AB et A'B' seraient égaux et nous écririons alors: 
A'B'=-AB 

Nous convenons d'appeler la "somme de deux segments" AB, A'B', le segment AC obtenu en portant 
sur la demi-droite opposée à la demi-droite BA un segment BC égal à A'B'. Nous traduisons cette 
opération en écrivant: 

AC=AB+A'B' 
Considérons toujours des grandeurs de même espèce. Ajouter entre elles plusieurs de ces grandeurs, 
c'est ajouter l'une d'elles à une autre, la somme obtenue à une troisième, etc. Par exemple, ajouter les 
segments AB, BC, CD, c'est ajouter AB et BC ce qui donne AC, ensuite AC et CD ce qui donne AD. 
Nous résumons l'opération en écrivant: 


AD=AB+BC+CD 


Multiplier une grandeur par un nombre entier n, c'est ajouter n grandeurs égales à celle-là. Par 
exemple, si nous avons AB=BC=CD), la relation précédente s'écrirait: 


AD =3 AB=3 BC =3 CD 
Nous allons définir ce que nous appelons "comparer deux grandeurs (A) et (B) de même espèce": 


Choisissons arbitrairement une grandeur (C) de même espèce que (A) et que (B) et plus petite que 
chacune d'elles. Formons une suite de grandeurs telles que: 


(C1) = (C),(C) = 2 (C.06,) = P ‘ (CO 


Nous constatons que la grandeur (A) s'intercale entre deux grandeurs (C,) et (C',1) et que (B) se 


trouve entre deux autres (C,) et (C;4) par construction. 


Nous disons alors par définition que le rapport des grandeurs (A) et (B) est un nombre (A)/(B) positif 
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compris entre: 


(c’, MC) et (Cu) C,) 


Prenons alors, par exemple, deux segments quelconques AB, A'B' mais différents (par exemple 
1.2 [cm] et 3.5 [cml): 


Pour réaliser l'opération précédente, utilisons une règle graduée dont l'unité sera la grandeur C, un 
segment arbitrairement choisi (par exemple de 1 [cm]). 


Nous appliquons le zéro de la règle en À, et B s'intercalera par construction entre deux graduations de 
la règle numérotée p et p+1 à moins que la grandeur C soit égale à AB... (soit avec le choix pris 
comme exemple, B s'intercalera entre la 1ère et la 2ème). 


Pour A'B', nous appliquons le zéro de la règle aussi en A’, et B's'intercalera aussi entre deux 
grandeurs de la règle numérotée q et q+1 à moins que la grandeur C soit égale à A'B'... (soit avec le 
choix pris comme exemple, B's'intercalera entre la 3ème et la 4ème). 


Nous exprimerons le résultat de ces mesures et leur rapport en écrivant: 


Hoi 
g+1l À'B q 


où le terme tout à gauche s'appelle une "mesure par défaut" et celui à l'opposé une "mesure par 
excès". 


Ainsi avec les mesures prises comme exemple nous avons donc: 


_e Le ps <0.342 < 0.6 


SPL 29 3 


Définition: Nous appelons "mesure d'une grandeur" (A) le nombre positif qui mesure le rapport de 
cette grandeur et d'une grandeur (U) arbitrairement choisie et que nous appelons "l'unité", la mesure 
de l'unité étant "1", par définition. 


Nous pouvons démontrer que si a est la mesure de (A), b celle de (B) évaluées toutes deux avec une 
même unité (U), le nombre (A)/(B) est égal au rapport a/b. Ce rapport étant indépendant de l'unité 
choisie. 


Remarque: Nous disons que (B) est une "partie aliquote" de (A) si Le rapport (A)/(B) est un 
nombre entier. 


Nous conviendrons une fois pour toute, qu'en géométrie toutes les grandeurs de même espèce qui 
interviennent dans une figure donnée sont mesurées avec la même unité. 


Soit (A), (B), (C), …, (S) des grandeurs de même espèce et (A), (B'), (C'), …, (S'), des grandeurs de 
même espèce, mais qui ne sont pas nécessairement de même espèce que les précédentes. Nous disons 
que ces grandeurs sont "homologues", si nous pouvons les grouper deux à deux, (A') homologue de 
(A), (B') homologue de (B), …, etc., de manière que les conditions suivantes soient réalisées: 


- Si (A) est égal à (B), (A) est égal à (B'}; 
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- Si (A) est plus petit que (B), (A) est plus petit que (B; 


- Si (S) est la somme de (A) et de (B), (S') est la somme de (A') et de (B). 


Pour calculer le rapport (A)/(B), formons la suite (C1),(C,),...,(C,) et pour calculer le rapport (A'} 


(B'), formons la suite (C3 9,(C, ),...,(C°, , obtenue comme la précédente, mais à partir de la 
grandeur (C') homologue de (C). 


Il est évident que si (A) s'intercale entre (C,) et (C,4), (A) s'intercalera entre (C, ? et (C',u 1); de 


même, si (B) s'intercale entre (C,) et (C,4). Les rapports (A)/(B) et (A'}/(B') seront encadrés par les 
mêmes nombres: 


p+il 
ati og 2% 


Par conséquent: Le rapport de deux grandeurs (A) et (B) est égal au rapport des grandeurs 
homologues (A) et (B'). 


Si, en particulier, les grandeurs (A),(B)... sont mesurées avec une unité (U), et si les grandeurs (A'), 
(B’)... sont mesurées avec une unité (U'), homologue de (U), les rapports égaux: 


(A}y(U) et (A'y/(U”) (21:22) 
ne sont autres que les mesures de (A) et de (A). Par conséquent: 


Les mesures de deux grandeurs homologues (A) et (A') sont égales, à condition que les unités 
choisies pour les mesurer soient des grandeurs homologues. 


Considérons maintenant sur une demi-droite Ox un point M. Soit x la mesure (selon la définition 
précédente) de OM. A chaque point M de la demi-droite correspond un nombre positif x et un seul; 
nous admettrons qu'à un nombre positif x arbitrairement choisi correspond réciproquement un point 
M de la demi-droite et un seul. 


Une conséquence de cette hypothèse est qu'il existe un point, et un seul, C qui divise le segment OM 
en parties égales. Ce point est le point de la demi-droite OM, tel que: 


oC= — (21.23) 


Nous l'appelons "milieu du segment" OM. 


Théorème: Il existe un point M et un seul, situé sur le segment AB tel que la mesure du rapport 
MA/MB soit égal à un nombre positif donné À, 


Remarque: Si À = 1, ce point est le milieu du segment. 


Démontrons cette unicité: Soit M un point quelconque du segment AB; soit x, la mesure de AM, et a 
la mesure de AB: la mesure de MB sera a-x puisque M est placé entre A et B. Nous aurons alors: 
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Or, cette équation admet la seule solution: 


a À 
1+4 


À cette valeur positive et inférieure à a de x correspond un point M et un seul de la demi-droite AB 
tel que MA=x. Ce point M satisfait, et satisfait seul, aux conditions imposées. 


Théorème: Il existe un point M et un seul de la droite AB, situé en dehors du segment AB, tel que le 
rapport MA/MB soit égal à un nombre donné et défini À différent de 1. 


Démontrons aussi cette unicité: 
1. Supposons À > 1. Soit M un point quelconque de la droite AB situé en dehors du segment AB: ou 
bien À est sur le segment MB, ou bien B est sur le segment MA. Si A est sur le segment MB, nous 


avons nécessairement 8 > MA, donc: 


PE crita 
ME 


Le point M ne répond donc pas à la question de l'unicité. 
Si B est sur le segment MA, MA=x, AB=a, MB=x-a. Nous aurons donc: 


MA _ x 
ME x-a 


Pour que ce rapport soit égal à À, il faut, et il suffit que x soit solution de l'équation: 


X 


= À 
+ 0 
Cette équation admet comme seule solution: 
a À 
Fe = 
A=1 


qui donne une valeur de x qui sera toujours positive et supérieure à À. À cette valeur positive et 
supérieure à a de x correspond un point M et un seul de la demi-droite AB. Ce point M satisfait, et 
satisfait seul aux conditions imposées d'unicité. 


2. Supposons maintenant À < 1. Nous chercherons le point M pour lequel (nous avons simplement 
inversé le rapport): 
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est un nombre supérieur à 1. Il y en a un et un seul d'après le point (1). Il satisfait seul aux 
conditions imposées. 


Remarque: Il n'existe aucun point M situé en dehors du segment AB pour lequel MA/MB=1. En 
effet, si À est sur le segment MB, nous avons, quel que soit M, MA Ï MB < 1, et si B est sur le 
segment MA, MA! ME > 1. 


PLAN 


Passons maintenant à l'étude d'un objet géométrique de dimension supérieure à celle de la droite 
qu'est le plan et la surface. 


Considérons une surface finie (S) et deux points À et B de cette surface. Deux cas peuvent se 
présenter: 


1. Il y a des points de la droite AB qui ne sont pas sur la surface (S). Nous dirons dans ce cas: la 
droite AB coupe la surface; les points communs à la droite AB et à la surface (S) sont les points 
d'intersection de la surface (S) et de la droite AB. Parmi ces points communs se trouvent, en 
particulier les points A et B. 


2. Tous les points de la droite AB sont des points de la surface (S). Nous disons alors que la droite AB 
est sur la surface (S). 


Définition: Nous appelons "plan" la surface telle que toute droite AB qui joint deux points 
arbitrairement choisis sur la surface, soit sur la surface. 


Nous admettrons qu'une pareille surface existe et que par trois points ABC, non alignés, il passe un 
plan et un seul. L'étude des plans sera faite ultérieurement: nous nous consacrons actuellement à 


l'étude des figures géométriques tracées dans un plan donné, figures dites "figures planes". Leur 
étude constitue la "géométrie plane”. 


Remarque: Dans la pratique, les figures sont tracées soit sur une feuille de papier, soit sur la 
surface du tableau noir. 


Le plan étant défini, nous pouvons déjà nous intéresser à des opérations de base concernant les 
figures du plan que nous détaillerons plus tard rigoureusement. 


DÉPLACEMENTS ET RETOURNEMENTS 


Soit (F) un dessin effectué sur un tableau plan: effectuons sur un papier transparent, dont le recto est 
appliqué sur le plan du tableau, un calque () du dessin (F). Effectuons, en appliquant ce calque en 
un autre point du tableau, un nouveau dessin (F") identique à (F). 


Deux cas sont à considérer: 


1. Si le recto du papier transparent est demeuré appliqué sur le tableau, le dessin (F") se déduit de (F) 


par une opération appelée "déplacement" ou "translation". 
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2. Si, au contraire, le papier a été retourné, et si c'est le verso qui est appliqué sur le tableau, 
l'opération s'appelle "retournement" ou "symétrie". 


A chaque point À du dessin (F'), l'une quelconque de ces deux opérations fait correspondre un point 
A' du dessin (F"), que nous appelons "l'homologue" de À. Un segment AB de (F) vient en 
coïncidence avec un segment A'B' homologue de (F"); ces deux segments sont par définition égaux et 
cela quels que soient À et B. 


Définition: Nous disons communément que le dessin (F) est "superposable" au dessin (F") et que ces 
dessins représentent des figures égales. 


ANGLES 
Nous avons déjà brièvement défini le concept "d'angle" dans le chapitre précédent traitant de la 
trigonométrie. Nous avons maintenant en plus le quatrième postulat d'Euclide à notre disposition 


concernant ce Concept. 


Nous allons maintenant revenir plus en détails et en voir les concepts sous-jacents qui vont nous 
permettre d'aborder plus loin un objet particulièrement utile qu'est la bissectrice: 


Définitions: 


D1. Nous appelons "angle" (ou "angle plan") ou plus rigoureusement "angle rectiligne" la portion de 
plan limitée par deux demi-droites OA, OB, par exemple. Le point O s'appelle "sommet" de l'angle, 


ALU 


les demi-droites OA, OB, s'appellent les "côtés" de l'angle. 


D2. Nous appelons "angle formé par deux segments AB, AC", l'angle de sommet À dont les côtés 
sont les demi-droites AB, AC. 


D3. Les demi-droites OA, OB divisent le plan en deux régions: elles définissent donc deux angles: 


1. L'un constitué par la région couverte de hachures (voir la figure à l'extrémité gauche ci-dessous) 
s'appelle "angle saillant". 


2. L'autre, constitué par la région couverte de hachures (voir la figure au centre ci-dessous) s'appelle 
"angle rentrant”. 


B _ 2 C 


La notation OA ou 4OP désigne un de ces deux angles: la lettre qui indique le sommet doit être 
(normalement) écrite au milieu (souvent on ne mentionne pas le sommet si le contexte est évidente). 
Lorsqu'aucune précision n'accompagne cette notation, elle représente par définition l'angle saillant!! 


D4. Nous appelons "angles adjacents" deux angles qui ont le sommet et un côté communs et qui sont 
placés de part et d'autre de ce côté commun. Sur la figure ci-dessus à l'extrême droite, les angles 


saillants 408, 2OC', sont adjacents. 


Soit, 4OB et 4'O'E' deux angles d'un même plan. Nous avons admis précédemment qu'il existe un 
déplacement qui amène O' en O et A' en un point À de la demi-droite OA; ce déplacement amène O'B' 
soit en ©Æ;, de manière que les deux angles 408, AO, ne soient pas adjacents, soit en ©, , de 


manière que AOBet ACE, soient adjacents. Dans ce dernier cas, un demi-tour supplémentaire 
autour de OA amènera AB, dans la position AO, . Ce déplacement et ce retournement, s'il y a 


lieu, remplace 4'©'B' par un angle AO, , égal par définition. 


Bi B' 


B2 À 
ion du déplacement de deux angles 
Si OB, est confondu avec OB, il y a des points de l'un des deux angles AO, et 4OB qui sont 
égaux, tout point de l'un étant un point de l'autre: nous dirons, dans ce cas, que les angles 402, 
A'O'8' sont des "angles égaux", ce qui s'exprime par l'égalité: 


AOË = A'O'E' 


Si O8, n'est pas confondu avec OB, il y a des points de l'un des deux angles AOË , par exemple, qui 
ne sont pas des points de AOB. Sur la figure ci-dessus, l'angle 492 est couvert de hachures, l'angle 
AC, également; les points dont nous parlons sont ceux de l'angle BOB, couvert une seule fois de 
hachures. Nous conviendrons de dire que l'angle AOË, et, par conséquent, l'angle égal à 


4'O'8' sont, dans ce cas, plus grands que l'angle 492, ce qui s'exprime par l'inégalité: 
A'O'B'> AOB 


Maintenant que nous sommes en mesure de comparer des angles, étudions comment nous pouvons 
sommer (et donc respectivement soustraire) ceux-ci. 


Etudions d'abord le cas de la somme de deux angles 408, BOC adjacents. Deux cas peuvent se 
présenter suivant que les angles sont saillants ou rentrants: 


1. Soient 408 et 2OC les deux angles à additionner (voir figure ci-dessous à gauche). Par 
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définition, la somme de ces angles est l'angle 495, ce que nous exprimons par l'égalité: 


AOC = AOB + BOC (21:34) 


2. Soit 4028 un angle saillant à additionner à l'angle rentrant Z0C . Si nous couvrons de hachures 


successivement les deux angles (voir figure ci-dessous à droite), l'angle saillant 4QC se trouve 
couvert deux fois: 


NE 


2 


Figure: 21.12 - Somme de deux angles adjacents 


Dans ce cas, la somme des angles 408 (saillant) et 80C (rentrant) est donc égale à 
AOC augmenté de deux "angles plats" (voir plus loin la définition), ce qui s'exprime en écrivant: 


AOB + BOC = AOC +2 angles plats (21.35) 


Remarque: Ceci peut paraître confus à certains mais ceux qui auront déjà parcouru le chapitre de 
Trigonométrie savent que les angles du cercle trigonométriques sont égaux à eux-mêmes modulo 
2x [rad]. 


Étudions maintenant le cas de la somme de deux angles quelconques: 


La somme de deux angles 408, 4'O'£8' est par définition, égale à la somme de l'angle 498 et 
d'un angle 80€ égal à l'angle 4'6'8' et adjacent à l'angle 408. 


C 


A' 


A 


Figure: 21.13 - Somme de deux angles quelconques 


Un pareil angle est obtenu par un déplacement qui amène O' en O et A' en un point OA, suivi ou non 
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d'un retournement autour de OA. 


Étudions comme dernier cas la somme de plus de deux angles: 


La somme de plusieurs angles 408, 4'O'E\, etc., est, par définition, égale à la somme obtenue en 
ajoutant le premier au second, cette somme au troisième, et ainsi de suite. 


Soit 4OZ le premier angle, OC le deuxième angle, KOZ un angle égal au dernier des angles à 


ajouter et adjacent au précédent. Le résultat de l'addition sera 4OZ augmenté d'autant de fois deux 
angles plats que le plan a été recouvert au cours des opérations. On constate aisément que ce résultat 
ne dépend pas de l'ordre des angles à ajouter 402, 4'O'R\, etc. 


D5. Deux angles formés par deux droites coupées par une sécante sont dits "angles alternes-internes' 
Si : 


1. ils sont situés de part et d'autre de la sécante; 
2. ils sont situés entre les deux droites; 
3. ils ne sont pas angles adjacents. 


Dans l'exemple ci-dessous, les droites (X) et (Y) sont coupées respectivement en A et en B par la 
sécante (S). 


Figure: 21.14 - Exemple particulier d'angle alterne-interne 
et les deux angles représentés sont les angles alternes-internes. 
MESURES DES ANGLES 


Nous avons défini l'égalité et la somme de deux ou plusieurs angles. Ces définitions satisfont aux 
conditions de grandeurs de même espèce que nous avons déjà vues précédemment. 


Choisissons donc arbitrairement un angle du plan 338 , qui sera l'unité d'angle pour le plan: la 
mesure du rapport AOË | zeë , effectuée comme il a été expliqué précédemment lors de notre 
discussion sur les grandeurs de même espèce, sera un nombre positif 4, appelé par définition 
"mesure de l'angle 402, avec l'unité choisie 455". 
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Nous désignons par la lettre grecque minuscule "pi" le nombre irrationnel: 


qui est par définition la mesure d'un "angle plat" (nous verrons qu'elle en est l'unité un peu plus loin). 


Remarque: Comme tous les angles du plan sont plus petits que deux angles plats, le nombre 

#8 (qui est la mesure de 492) doit être inférieur à 2x. 
Ayant défini l'angle plat, nous pouvons maintenant définir d'autres types d'angles d'usage courant: 
Définitions: 
D1. Nous appelons "angle droit", tout angle égal à la moitié d'un angle plat. 


D2. Nous disons que deux angles sont des "angles perpendiculaires", notés L, lorsqu'ils sont tous les 
deux droits et adjacents. 


D3. Nous appelons "angle aigu" tout angle inférieur à un angle droit et "angle obtus" tout angle 
supérieur à un angle droit. 


D4. Nous appelons "angle orienté" ou "angle vectoriel", l'angle défini entre deux vecteurs ou droites 
(cf. chapitre de Calcul Vectoriel) de même origine et dont la valeur mesurée dans le sens inverse des 
aiguilles d'une montre sera pris comme positif et négatif s'il est pris dans le sens des aiguilles d'une 
montre. 


L'exemple le plus connu d'ongle orienté est celui du cercle trigonométrique: 


Figure: 21.15 - Angle orienté positif ou nul 
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D5. Nous disons que deux angles sont des "angles supplémentaires" lorsque leur somme vaut deux 
angles droits (soit un angle plat). 


D6. Nous disons que deux angles sont des "angles complémentaires" lorsque leur somme vaut un 
angle droit. 


Considérons maintenant les symboles &, Ë,Y comme les mesures de plusieurs angles 403, 20, 
COD: 


Nous n'insistons pas sur le fait évident que les égalités 402 = OC ou & = # sont équivalentes, 


ainsi que les inégalités 408 € BOC, & < Ë. Ces remarques de bon sens s'imposeront chaque fois 
que des grandeurs de même espèce auront été mesurées, bien entendu avec la même unité. 


En revanche, nous insisterons sur le fait que, d'après la définition même de la somme de plusieurs 
angles, & + Ë#+Y est la mesure de l'angle 402 augmentée d'autant de fois deux angles plats que le 
plan a été recouvert au cours des opérations d'addition. 


at B+y=AOD+2n7xr 
Le nombre entier n qui s'introduit dans ce calcul a une valeur qui pourrait être précisée, mais qui n'a 


pour le géomètre aucune importance, comme nous pourrons le constater ultérieurement. Nous 


décidons donc de ne pas écrire en géométrie le 2A7T inutile (mais sous-entendu). Egalement, nous 
décidons par convention d'écrire: 


AOD = 8 


Ainsi, nous avons & + Ë +Y = 8 cette convention d'écriture signifie que # est la mesure de l'angle 
AOD si nous avons 0 £8 <2x. 


Si 8 est supérieur à 2x, l'égalité signifie que la mesure de l'angle 409 est 8-2kx, k étant un 
nombre entier positif ou nul choisi de manière que nous ayant 0 £ 9 -2&7 < 2x. 
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Remarques: 


R1. Il existe un nombre entier positif k et un seul, tel que nous ayons 0 £ 8 —- 2&xr < 27, c'est-à- 
dire: 


8 8 
car les deux nombres — -1 et — sont positifs et différents de 1. 
27 27 


R2. Dire que & est la mesure de l'angle 4973 suppose que nous ayons Ô £ æ< 2x et entraîne 
l'égalité 409 = æ. Mais écrire 409 = æ n'entraîne pas nécessairement, que &# soit la mesure 
de 402 ; il faut, en outre, que l'on ait 0 £ æ< 2x. 


UNITÉS DE MESURE DES ANGLES 


Nous avons défini l'angle plat comme étant égal à 7 sans spécifier l'unité. C'est ce que nous allons 


maintenant nous appliquer à faire. Il existe (encore) plusieurs unités de mesures d'angle dont voici la 
liste: 


Définitions: 

D1. Nous appelons "degré" la 180ÈM€ partie de l'angle plat. 

Tous les calculs anciens sont effectués en degrés; les sous-multiples du degré sont: la "minute 
sexagésimale", égale au 60% du degré, et la "seconde sexagésimale", égale au 60% de la minute 


sexagésimale. 


La notation 8 = 30° 18° 11" se lit: trente degrés, dix-huit minutes, onze secondes. Ce type de mesure 
est courant encore en astronomie. 


Remarque: Nous utilisons encore aujourd'hui couramment le degré dans les écoles mais sans la 
notation usant des minutes et secondes (pas commode pour la somme des angles). Nous notons 
alors l'angle en degrés avec une notation décimale comme par exemple 8 = 45.34354°. 


D2. Nous appelons "grade" la 2008" partie de l'angle plat. 


Le grade est également une ancienne unité d'angle. Ses sous-multiples sont: la "minute centésimale", 
égale au 100% du grade, et la "seconde centésimale", égale au 100% de la minute centésimale. 


La notation # = 40.1824 gr se lit: quarante grades, dix-huit minutes, vingt-quatre secondes. 
D3. Nous appelons "1 radian" (noté [rad]) l'angle plan décrit par une sécante à un cercle, passant par 


son centre, tel que l'arc de cercle ainsi défini par l'axe horizontal passant par le centre du cercle et la 
sécante soit d'égale longueur au rayon de ce cercle (cf. chapitre de Trigonométrie), 
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Figure: 21.17 - Définition du radian 


Ainsi, en radians, un angle plat est égal à Æ et tous les autres angles sont des multiples réels de cette 
constante. 


BISSECTRICE 

Maintenant que nous savons comparer, additionner et mesurer des angles nous allons pouvoir nous 
pencher sur un concept important en géométrie qu'est celui de "bissectrice" et de quelques propriétés 
y relatives que nous réutiliserons plus loin pour des théorèmes importants. 

Définitions: 

D1. Nous appelons "bissectrice" la droite qui divise un angle en deux parties égales. 

D2. Nous appelons "demi-bissectrice" la demi-droite qui divise un angle en deux parties égales. 


Maintenant voyons quelques propriétés importantes de la bissectrice: 


Deux droites AB et CD qui se coupent forment comme nous le savons déjà intuitivement, quatre 
angles: 


AOC,COB,BOD,DOA (21.40) 


Les angles 40C ,BOD de même que les angles 80€, DOA dont les côtés sont opposés, sont dits 
"angles opposés par le sommet". 


Trivialement, si # est la mesure de l'angle AQC, la mesure de l'angle adjacent C'O8 est x -8; 
celle de l'angle DOZ adjacent au précédent est Æ — (7 — 8) : celle de DOA est 7-8. 


Soit OE la demi-bissectrice de l'angle 40€, OG celle de £'O8, OF celle de 299, OH celle de 


DOA, nous aurons: 


.COG = (21.41) 
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et, par conséquent: 


Nous aurions de même: 
GOF = FOH = HOË =xi2 (2145) 
Nous résumons ainsi tous ces résultats et propriétés de mesure: 
P1. Deux angles opposés par le sommet sont égaux. 
P2. Deux angles opposés par le sommet ont même bissectrice. 
P3. Les bissectrices de deux angles adjacents supplémentaires sont rectangulaires. 


P4. Les bissectrices des angles formés par deux sécantes sont deux droites rectangulaires (à angle 
droit). 


TRIANGLES 

Nous avions étudié jusqu'à présent le concept de dimensions, de point, de segment, de ligne, d'angle 
et de plan ouvert (infini). Cependant un plan peut-être délimité par plusieurs lignes pour obtenir ainsi 
des formes géométriques (planes) dont les plus simples peuvent être considérées comme les 
triangles. 

Définition: Nous appelons "triangle" la figure formée par trois segments AB, BC, CA, les points 


A,B,C n'étant pas alignés. Les segments AB, BC, CA, sont les "côtés" du triangle. Les points A,B,C 
sont les "sommets" du triangle. L'angle saillant £4C, qui contient tous les points du côté BC, 


s'appelle angle À du triangle et BC est alors sont "côté opposé"! 


Remarque: Nous employons la notation À lorsqu'aucune confusion n'est possible; à défaut, nous 
utilisons la notation £4C avec le même sens. 


Il y a six éléments dans un triangle, à savoir: trois angles À, ,C et trois côtés AB, BC, CA. 


Nous désignerons par 4 = BC, à = AC, c = AB les longueurs des côtés mesurées avec la même 
unité; par À, 8 ,C, les mesures des angles. 


La somme des angles d'un triangle plan est toujours égale à 180° (ou 7 radians). La démonstration 
est assez simple. 


Démonstration: 


Sur la figure ci-dessous, ABC est un triangle quelconque, et D la parallèle à (BC) qui passe par A. 
Nous observons: 


1. Les angles bleus ont même mesure car ils sont alternes-internes (les droites (BC) et D étant 


parallèles). 
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Remarque: Pour la démonstration de l'égalité des angles alternes-internes voir plus loin le 
quatrième axiome d'Euclide. 


2. De même, les angles verts ont même mesure car ils sont alternes-internes. 


3. Nous remarquons que la somme des angles bleu + rouge + vert forme un angle plat en A, puisque 
D est une droite. Donc angle bleu + angle rouge + angle vert = 180°. 


4. D'après les égalités d'angles constatées en (1) et (2), nous déduisons que: 


A+ 8 + È =180° 


C 


Figure: 21.18 - Somme des angles d'un triangle plan 


Cette démonstration étant valable quel que soit le triangle tracé dans le plan. 
CIC.Q.F.D. 


TRIANGLES ÉGAUX 

Définitions: Nous disons que deux triangles sont des "triangles égaux" lorsque nous pouvons par un 
déplacement soit par un retournement ou les deux combinés, superposer tous les sommets du premier 
triangle au deuxième. Nous disons alors aussi que les triangles sont des "triangles homologues" ou 
"triangles isométriques". 

De cette définition, il vient que deux triangles sont égaux lorsque soit: 

1. Ils ont un côté égal et deux angles égaux; 

2. Ils ont un angle de même mesure compris entre deux côtés de même longueur. 


Démonstrations: 


Premier cas d'égalité: Deux triangles qui ont un côté égal BC=B'C", compris entre deux angles égaux 
B=8B"C=C", sont égaux. 


En d'autres termes, si 2 triangles ont 2 angles égaux 2 à 2, alors les 3èmes angles le sont aussi. Ceci 
étant dit nous pouvons maintenant prendre comme côté égal celui qui est situé entre 2 angles égaux 


Page: 1359/4839 


[v3.0 - 2013] 


sans perte de généralité. 


Puisque BC=B'C" (voir figure ci-dessous), il existe un déplacement qui amène B' en B et C' en C. Ce 
déplacement amène A' en 4 situé du même côté par rapport à la droite BC, ou en 4 symétrique de 


À par rapport à cette droite. 


Les deux demi-droites BA et BA font par hypothèse, avec BC le même angle $ = $'. Comme elles 
sont par construction d'un même côté de BC, elles sont confondues. Les deux demi-droites CA et 
CA sont confondues pour la même raison et parce que Ê =". À est donc confondu avec À. Les 
deux triangles ABC, A'B'C' sont donc égaux. 


C 


A2 


Figure: 21.19 - Deux triangles ayant côté égal et deux angles égaux 


Deuxième cas d'égalité: Deux triangles qui ont un angle égal À = À” compris entre deux côtés égaux 
AB=A'B", AC=A'C" sont égaux. 


Puisque AB=A'B" (voir figure ci-dessous) il existe un déplacement situé par rapport à AB du même 
côté que le point. S'il l'amenait en €; symétrique de € par rapport à AB, un demi-tour autour de 
AB l'amènerait en C,.Les demi-droites AC’, AC, situées d'un même côté de AB font, par hypothèse 
le même angle avec AB, puisque À = À'. Elles sont donc confondues. L'hypothèse 

AC = AC entraîne alors que € et €’ sont confondus. Les deux triangles ABC, A'B'C' sont donc 
égaux. 
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C C 


Figure: 21.20 - Déplacement montrant l'égalité des 2 triangles 


[IC.Q.F.D. 


TRIANGLES ISOCÈLES 
Définition: Nous disons qu'un triangle ABC est un "triangle isocèle" lorsque deux de ses côtés sont 


AB et AC sont égaux ("iso" signifiant "même"). Le troisième côté BC est alors appelé la "base" de ce 
triangle. 


Remarque: Nous disons qu'un triangle est "scalène" quand il possède 3 côtés inégaux. 


Définition: Nous appelons “"médiatrice" d'un segment BC, la perpendiculaire à la droite BC au point 
H de cette droite, milieu de BC. 


B C 


Figure: 21.21 -Représentation de la médiatrice 
Théorème: Dans un triangle isocèle ABC comme représenté ci-dessus: 
1. Les angles £Ê et © opposés aux côtés égaux sont égaux. 


2. La médiatrice de BC et la bissectrice de l'angle 4 sont confondues (figure ci-dessus). 
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Démonstration: 


Les deux triangles BAH, CAH définis par la bissectrice de À ont un angle égal B4F = CAË par 
construction compris entre deux côtés égaux: AH qui est commun et AB=AC par hypothèse. Comme 
les angles 2ZA4 = CHA sont droits et égaux et que la somme des angles d'un triangle est égale à un 


angle plat, alors les angles 524 et AC sont donc égaux. 


[IC.Q.F.D. 


Théorème: Le lieu géométrique des points M équidistants (à même distance) de deux points B et C 
donnés est la médiatrice (D) du segment BC. 


Remarque: Nous appelons "lieu géométrique" d'un point M, assujetti à des conditions, l'ensemble 
des positions occupées par le point M. 


Démonstration: 


Figure: 21.22 - Représentation du lieu géométrique 


1. Tout point du lieu est sur la droite (D). Autrement dit, l'hypothèse MB=MC entraîne que M est la 
médiatrice de BC. En effet, si MB=MC, le triangle MBC est isocèle et le sommet M est sur la 
médiatrice de BC. 


2. Tout point de (D) est un point du lieu. Ce qui revient à dire que si M est sur la médiatrice de BC, 
nous avons MB-MC. En effet, si M est sur la droite (D) qui rencontre en H, milieu de BC, la droite 


BC, les triangles MHB, MHC sont égaux (deuxième cas d'égalité: BEM = C'HM parce que ces 
angles sont droits, HM commun; HB=HC parce que H est le milieu de BC): les côtés MB, MC sont 


donc égaux et nous avons bien MB=MC. Le point M est un point du lieu. 


[IC.Q.F.D. 


A l'aide de ce théorème nous pouvons en énoncer un second: Par un point A pris hors d'une droite 
BC, nous pouvons mener à cette droite une seule et unique perpendiculaire: 
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Démonstration: 


1. Soit un triangle ABC, faisons subir à ce triangle un demi-tour autour de BC (symétrie horizontale): 
A vient en A’ symétrique de A par définition, par rapport à BC. Puisque les figures ABC, A'BC sont 
égales, AB=A'B et AC=A'C . BC est donc la médiatrice de AA' et les droites BC et AA' sont 
perpendiculaires. AA' est donc bien une perpendiculaire à BC menée par À. 


2. Nous ne pouvons en mener plusieurs: soit AH une perpendiculaire menée de À à BC, elle 
rencontre la droite BC en H qui est différent soit de B, soit de C. Supposons que H soit différente de 


B. AHE, A'HE qui se déduisent l'un de l'autre par retournement, sont égaux, et, comme chacun 


d'eux est droit, l'angle 4474 est plat. La droite AH est confondue avec la droite AA' et est donc bien 
la seule perpendiculaire à BC qui passe par A. 


CIC.Q.F.D. 
Définitions: 
D1. Nous appelons "projection orthogonale" d'un point À sur une droite BC le point H où la 
perpendiculaire menée par À à cette droite la rencontre. Le point H s'appelle aussi "pied" de cette 
perpendiculaire. 
D2. Nous appelons "distance géométrique" du point À à la droite BC la longueur du segment AH. 
Puisque BC est la médiatrice de AA’, H est le milieu de AA'; donc: Un point À et son symétrique A' 
par rapport à une droite (D) sont caractérisés par les deux propriétés suivantes que nous ne 
démontrerons pas car suffisamment intuitives: 
P1. AA' est perpendiculaire à (D). 
P2. Le milieu de AA' est sur (D). 


La droite AB, qui joint le point À à un point de la droite BC, autre que le pied H de la perpendiculaire 
menée de À à cette droite, s'appelle "droite oblique". Le point B s'appelant "pied l'oblique". 


TRIANGLES ÉQUILATERAUX 


Définition: Nous disons qu'un triangle ABC est un "triangle équilatéral" lorsque tous ses côtés sont 
de longueur égales ou que tous ses angles À,8,C" sont égaux. Chacun de ces côtés est donc une 
base. 
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B 


Figure: 21.23 -Exemple de triangle équilatéral 


Remarque: Nous prenons pour habitude d'annoter les côtés égaux par deux traits parallèles 
disposés au milieu des côtés. 


Comme la somme des trois angles de ce triangle doit faire 180° (en degrés) et que les trois angles ont 
même mesure, chacun d'eux mesure donc: 180°/3 soit 60°. 


TRIANGLES RECTANGLES 


Définition: Un "triangle rectangle" est un triangle ABC qui a un angle droit: 


C 


B 


Figure: 21.24 -Exemple de triangle rectangle 


Dire que le triangle est rectangle en A signifie que c'est en À que se trouve l'angle droit. 


Remarque: Dans un triangle rectangle, le côté le plus grand est toujours le côté opposé à l'angle 
droit. Nous l'appelons "l'hypoténuse". Nous démontrons cette propriété avec le théorème de 


Pythagore (voir plus bas). 
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TRIANGLES RECTANGLES-ISOCÈLES 


Définition: Un "triangle rectangle-isocèle" ABC est à la fois rectangle et isocèle, ce qui signifie qu'il 
a à la fois un angle droit et deux côtés de même longueur. 


A 


B 


Figure: 21.25 -Exemple de triangle rectangle-isocèle 


Remarque: Le sommet principal correspond à l'angle droit. En effet, comme BC, l'hypoténuse, 
doit être le côté le plus grand, ce sont les côtés AB et AC qui ont même longueur (plus petite). 


INÉGALITÉS DANS LES TRIANGLES 
Voyons maintenant quelques inégalités (propriétés) intéressantes dans le triangle. 


P1. Montrons d'abord que dans tout triangle, un côté opposé à un angle droit ou obtus (supérieur à 
90° donc...) est supérieur à chacun des deux autres côtés du triangle. 


Démonstration: 


Considérons le triangle ABC ci-dessous dans lequel 4 > 90° et soit Cx le prolongement du côté BC. 


Portons, sur la demi-droite Bx, une longueur 82 = BA pour construire un triangle isocèle dans le 
triangle initial: 


| 
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Le triangle BAD est donc un triangle isocèle de base AD dont l'angle à la base BAD est bien 
évidemment aigu (inférieur à 90°). 


Figure: 21.26 - Construction d'un triangle isocèle 


Donc par construction 847 < BAC. La droite AD est intérieure par construction à l'angle 84€ et 
par suite: 


BC > BD (21.44) 
et comme B2 = BA par construction nous avons donc: 
BC > BA (2145) 


Ce qui termine notre démonstration. Car la démarche est la même pour montrer que BC > CA. 
CIC.Q.F.D. 


P2. Dans tout triangle dont les côtés ont des longueurs strictement croissantes, un côté est toujours 
inférieur à la somme des deux autres. 


Démonstration: 


Supposons que dans le triangle ABC ci-dessous les côtés ÊC'= a,CA= b, AB = c soient tels que 
grb>c: 


a 


Figure: 21.27 - Exemple de triangle avec côtés strictement croissants 


Soit D le point du côté BC tel que BD = BA= c soient les côtés du triangle isocèle construit ABD. 
Nous obtenons: 


DC = BC -BD=a-E€ (21.46) 


Le triangle ABD étant isocèle, l'angle à la base 498 est aigu et son supplément 42€ est obtus. 
Dans le triangle ADC, nous obtenons d'après la propriété P1 précédente que 2C' <C'A, c'est-à-dire: 


@—c<b (21.47) 
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ou: 
a <b+c 


il s'agit de la fameuse "inégalité triangulaire" sous forme géométrique. Nous la retrouverons dans de 
nombreux autres chapitres du site dans des espaces et des concepts mathématiques plus abstraits. 


La propriété est alors immédiate pour les autres côtés b et c par permutation de la méthode: 


a <b+c 
b <a+c 
c<a+b 


CIC.Q.F.D. 


P3. Dans tout triangle un côté quelconque est supérieur à la différence des deux autres. 
Démonstration: 
Supposons que nous ayons & > à > c. En retranchant c aux deux membres de l'inégalité: 
a+c>b 
il vient immédiatement: 
a >b-c 
La propriété est alors immédiate pour les autres côtés b et c par permutation de la méthode: 


a >b—c 
b>a-c 


c-a-b 
En définitive puisque: 
a>b-c eta <b+c 


pour tout triangle à côtés croissants nous avons: 


b-c<a<b+c 


[IC.Q.F.D. 


THÉORÈME DE PYTHAGORE 


Maintenant que nous avons vu ce qu'était le triangle et certaines de ses propriétés ainsi que le 
concept d'angle, nous pouvons démontrer le fameux "théorème de Pythagore" (qui donne donc la 
relation que doivent satisfaire trois nombres qui représentent les côtés d'un triangle rectangle) et faire 
de la trigonométrie du cercle (( e de 
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Il existe plusieurs démonstrations de ce théorème dont en voici une parmi tant d'autres: 


Démonstration: 
Soit un carré (4 angles droit) dans lequel est inscrit un autre carré, nous déterminons la surface du 


carré inscrit à partir des triangles rectangles résultants de l'espace vide entre les deux carrés tel que 
présenté sur la figure ci-dessous: 


ä b 


Figure: 21.28 - Construction pour la démonstration du théorème de Pythagore dans le plan 
La surface du carré blanc est bien sûr: 
(a+b}} = a +2ab+b} (2155) 


Pour avoir la surface du carré gris on peut soustraire au carré blanc la surface des 4 triangles 
rectangles (d'une surface de moitié de celle d'un quadrilatère de même longueur et hauteur), chacun 
de surface: 


ab{2 (21:56) 
La surface du carré gris est donc finalement: 


ab 


a? +2ab+b?-4 a +b? (2157) 


Le résultat obtenu étant équivalent au carré du côté de la surface grise, nous avons au final le résultat 
du fameux "théorème de Pythagore": 


Dans un triangle rectangle, le carré de l'hypoténuse (côté opposé à l'angle droit) est égal à la somme 
des carrés des côtés de l'angle droit. 


EIC.Q.F.D. 


Dans le cas particulier où nous avons trois nombres entiers a, b et c qui satisfont le théorème de 
Pythagore (il existe une infinité de combinaisons de nombres entiers satisfaisant le théorème de 
Pythagore), nous parlons alors de "triplet pythagoricien". 


Remarque: C'est au chinois Tchao Kiung K'ing (2ème siècle) que l'on devrait cette 
démonstration. 


Il est souvent fait mention dans les petites classe de la réciproque du théorème de Pythagore qui nous 
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dit: Dans un triangle, si le carré d'un côté est égal à la somme des carrés des 2 autres côtés, alors ce 
triangle est rectangle et l'hypoténuse sera alors le plus long côté du triangle. 


THÉORÈME DE THALÈS 

Ayant démontré le théorème de Pythagore et maintenant que les concepts de parallèles, segments, 
angles et autres nous sont connus, nous pouvons enfin démontrer le théorème de Thalès dont voici 
une possible démonstration qui nécessite d'abord le développement de deux lemmes: 


L1. Triangles de même surface 


Soit la figure: 


A H B G 


Figure: 21.29 - Construction pour la démonstration du théorème de Thalès 
Nous avons: 


DiiD' 
EH1D (2159 
FG LD 


EFGH est un rectangle car ses côtés sont parallèles deux à deux et il a au moins deux angles droits. 
Donc ses côtés opposés ont même longueur: EH-FG. 


EA est la hauteur relative à AZ dans le triangle EAB et FG est la hauteur relative à AË dans le 
triangle FAB. 


La surface du triangle ne dépend que de la longueur du côté et de la longueur de la hauteur relative à 
ce côté. Pour les deux triangles EAB et FAB, ces longueurs sont égales, donc ils ont la même surface. 


Conclusion: Si deux triangles ont un côté commun et si les troisièmes sommets sont sur une parallèle 
à ce côté commun, alors ils ont la même surface. 


L2. Rapports égaux 


Soit le rapport de proportions ("calcul proportionnel" ou "produit en croix"): 
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L (160 
FL 


GR 


alors: 
ad =bc (21.61) 


Si ad=bc, alors ad+cd=bc+cd (nous ajoutons un même nombre positif ou négatif aux deux 
membres). D'où après factorisation: 


d(atc)=c(b+d) (2162) 
et en appliquant inversement la règle des produits en croix: 


ate 


_ 
+4 à 


(21.63) 


CG 


Exposons maintenant en quoi consiste le théorème de Thalès: 


Soit la figure: 


B 


Figure: 21.30 - Première approche du théorème de Thalès 
Avec: 


ABHCD 
# LOA (2164) 
k, LOB 


Nous avons montré précédemment que si deux triangles ont un côté commun et si les troisièmes 
sommets sont sur une parallèle, alors ils ont la même surface. Donc les triangles ACD et BCD ont la 
même surface. 
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En ajoutant à chacune de ces deux surfaces celle du triangle OCD, nous obtenons que les triangles 


ODA et OCB ont la même surface. 


Nous en déduisons qu'en utilisant à nouveau le rapport en croix: 


5 5 


en Loir oc | Soc Mdr OD . 
= = — 6e = —_—_—_—_—_—_—_—_—_—_—_— = —— 
San pa CA Sos pp. OB 
2 
Conclusion: 
OC OD 
— = —| (21,67) 
OA OB 


Soit maintenant la figure: 


B 


Figure: 21.31 - Deuxième approche du théorème de Thalès 
Les triangles [D et IDB ont la même surface d'après le lemme 1, ainsi que les triangles OJD et OIB 


donc: 
_OJ'JB JI'JB loy.pr _——. 


d'où: 
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et donc: 


OJ'DI = OI BJ (21.69) 


De la même manière dans les triangles OIA et OCJ, nous obtenons: 


OI C1 
—"— (2171) 
OJ AJ 
D'après le lemme 2, comme: 
OI  DI C1 
—=—"—| (2172) 
OJ BJ AJ 


alors: 


O1 Di. C1. DI+CI, DC 
OJ BJ AT BJ+AJ BA 


(21.73) 


En appliquant au triangle OJB, ce que nous avons fait selon la première approche, nous avons aussi: 


SA 


qui constitue le "théorème de Thalès" des rapports. 
PARALLÉLISME 


Définition: Nous appelons "parallèles" deux droites également distantes l'une de l'autre sur toute leur 
longueur. 


Ce concept est directement relié au cinquième postulat d'Euclide et est souvent considéré comme le 
plus important ayant été montré qu'il ne peut être considéré comme un axiome car n'étant pas 
respecté dans les géométries non-euclidiennes (cf. chapitre de Géométries Non-Euclidiennes) 

Les conséquences de ce postulat sont les suivantes dans une géométrie euclidienne: 

1. Si deux droites (AB) et (CD) sont parallèles, toute droite (E'F") qui coupe l'une coupe l'autre. 


Démonstration: 


Soit F Le point commun à la droite (CD) et à la droite (E'F"): si la droite (E'F") ne coupait pas la droite 
(AB), elle lui serait parallèle, et par le point F passeraient deux droites (CD) et (E'F") parallèles à une 
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même troisième (AB), ce qui n'est pas le cas. Donc, la droite (E'F"), coupe la droite (AB). 
[IC.Q.F.D. 


2. Deux droites (AB) et (CD) parallèles à une même troisième (E'F") sont parallèles entre elles. 
Démonstration: 


Si la droite (CD) n'était pas parallèle à la droite (AB), elle la couperait: elle couperait aussi la droite 
(E'F") parallèle à la droite (AB), elle ne serait donc pas parallèle à (E'F"). 


[IC.Q.F.D. 


Théorème: Si deux droites parallèles sont coupées par une sécante: 
1. Les angles alternes-internes sont égaux; 

2. Les angles alternes-externes sont égaux; 

3. Les angles correspondants sont égaux. 

Démonstration: 


Soient deux parallèles AB et CD et la sécante EF: 


1. Par le milieu O de EF menons la perpendiculaire GH à AB, qui est aussi perpendiculaire à CD. Les 
triangles rectangles EOG et FOH ont un angle aigu égal à, GO = FOX et l'hypoténuse égale, 


OF=OE. Ils sont égaux, et les angles DFA et GEO sont égaux. 


2. Les angles alternes-externes Ê'ÆB et F'FC sont égaux, car F'£E est opposé par le sommet à 
l'angle GEO, qui est alterne-interne avec l'angle OFF. 


[IC.Q.F.D. 
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Réciproque: Si deux droites sont coupées par une sécante qui forme avec ces droites: 


- Soit deux angles-alternes internes égaux; 
- Soit deux angles-alternes externes égaux; 
- Soit deux angles correspondants égaux, ces deux droites sont parallèles. 


alors ces deux droites sont parallèles. 


Remarque: Pour démontrer le parallélisme de deux droites, il faut et il suffit que les angles 
alternes-internes, alternes-externes ou correspondants, formés par ces deux droites avec une 
sécante, soient égaux. 


CERCLES 


Définition: Nous appelons "cercle" le lieu géométrique des points M du plan qui sont à une distance 
donnée R, appelée "rayon" de ce cercle, d'un point fixe O, appelé "centre" de ce cercle. 


OM=R 7 
Remarque: Le mot "rayon" désigne soit le segment OM, soit sa mesure R. 


Les cercles sont directement concernés par le troisième postulat d'Euclide que nous avions énoncé 
plus haut. 


Nous appelons "diamètre" d'un cercle toute droite qui passe par le centre O du cercle. Tout diamètre 
rencontre le cercle en deux points A et B, définis par OA=OB=R, que nous appelons "extrémités du 
diamètre". Nous réservons la notation "diamètre AB" pour le diamètre d'extrémités A et B. Nous 
disons que deux points d'un cercle sont "diamétralement opposés" quand ils sont les deux extrémités 
d'un même diamètre. 


Un cercle divise le plan en deux régions: celle qui contient le centre, que nous appelons "région 
intérieure", et celle qui ne le contient pas, que nous appelons "région extérieure". 


Théorème: La condition nécessaire et suffisante pour qu'un point P soit strictement intérieur à un 
cercle (O), de centre (O) et de rayon R, est OP < R&. 


Démonstration: 

1. La condition est nécessaire: Si, par hypothèse, P est à l'intérieur du cercle (O), il est situé soit en 
O, soit entre les extrémités À et B du diamètre délimité par le lieu géométrique des points M. S'il est 
en O, la proposition est évidente, s'il n'est pas en ©, il est entre O et A par exemple, et nous avons 


OP < OA, c'est-à-dire OP < À. 


2. La condition est suffisante: Si, par hypothèse OP < À, P se trouve entre les extrémités À et B des 
lieux géométriques définis par les points M, donc à l'intérieur du cercle (O). 


CIC.Q.F.D. 
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Corollaire: la condition nécessaire et suffisante pour que P soit extérieur au cercle (O) est OP >» À. 


Nous appelons "corde" CD d'un cercle le segment dont les extrémités C et D sont sur ce cercle. 
Théorème: La médiatrice d'une corde CD est un diamètre. 

Démonstration: 

La médiatrice (4) de CD (voir figure ci-dessous), corde du cercle (O) de centre O et derayonR, 


passe par le point O parce que comme nous l'avons démontré lors de notre étude des triangles nous 
avons OC = OD=R. 


Figure: 21.33 - La médiatrice d'une corde 


OIC.Q.F.D. 


Corollaire: La perpendiculaire menée par le centre O d'un cercle à une corde CD passe par le milieu 
H de cette corde. 


Théorème: Par trois points À, B, C non alignés, il passe un cercle et un seul. 
Démonstration (voir figure ci-dessous): 


Tracer la médiatrice (D) de AB et la médiatrice (4) de AC. Si (D) et (4) étaient parallèles, la 
perpendiculaire AB à (D) serait perpendiculaire à (4), donc confondue avec AC. ABC seraient 
alignés. Donc (D) et (4) non parallèles se coupent en un point O: 
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Figure: 21.34 - Triangle inscrit dans un cercle 


1. Il passe un cercle par À, B, C: le point © étant sur (D), médiatrice de AB, OA=OB par définition: le 
point O étant sur (À) , médiatrice de AC, OA=OC. Le cercle (O), de centre O et de rayon OA, passe 
par B (puisque OA=OB) et par C (puisque OA=OC). Il passe donc par À, B, C. 


2. Il ne passe À, B, C qu'un seul cercle: S'il passait par À, B, C un cercle différent du cercle (O) de 
centre O et de rayon OA, son centre O'se trouverait sur la médiatrice de AB et de AC qui sont deux 
cordes de ce cercle; il serait donc confondu avec O. 


[IC.Q.F.D. 


Remarque: La médiatrice de BC, corde du cercle (O), passe par le point ©. Nous pouvons donc 
dire (résultat important) que les trois médiatrices des côtés d'un triangle ABC concourent. 


AXIOMES DE HILBERT 


Euclide a rassemblé toutes les connaissances géométriques de son temps sous la forme de ces cinq 
postulats. Il a laissé son nom à la géométrie euclidienne qui utilise son cinquième postulat, à la 
géométrie non-euclidienne qui ne l'utilise pas, et aux espaces euclidiens. 


Cette base postulée est néanmoins imparfaite, pour démontrer rigoureusement les théorèmes associés 
à cette géométrie, il est nécessaire d'admettre comme vrai des hypothèses supplémentaires implicites. 
David Hilbert construisit une axiomatique correspondante à l'idée que se faisait Euclide de la 
géométrie en ajoutant les hypothèses ad hoc. 


Les axiomes de Hilbert sont eux regroupés en cinq catégories: l'association, l'ordre, la congruence, la 
continuité et les parallèles. 


Trois concepts sont associés à cette axiomatique: 


1. Celui de l'association définit le mot "contient", il correspond aux notions "est élément de" et "est 
inclus dans" de la théorie des ensembles. 
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2. Celui de "l'ordre" correspond à "une relation binaire" entre un couple de points et un point, il 
apparaît dans les expressions "entre" et permet de définir les segments. 


3. La congruence, qui correspond à trois "relations d'équivalence" pour les couples de points, les 
triangles et les angles. 


Remarque: Les points, droites et plans sont considérés comme distincts par défaut. 


Voici donc les "axiomes de Hilbert": 
AXIOMES D'ASSOCATIONS (A) 
A.A1. Soient deux points, il existe une droite passant par ces deux points. 


A.A2. Soient deux points, il n'existe qu'une unique droite passant par ces deux points (in extenso la 
droite décrite en A.A1) est unique. 


AÀ.A3. Une droite contient au moins deux points, et pour une droite donnée, il existe au moins un 
point non contenu dans la droite. 


A.A4,. Soient trois points non contenus dans une droite, il existe un plan contenant ces trois points. 
Tout plan contient au moins un point. 


AÀ.A5. Soient trois points non contenus dans une droite, il n'existe qu'un unique plan contenant ces 
trois points. 


À.A6. Soient deux points contenus dans une droite D et dans un plan À, alors À contient tous les 
points de d. 


A.A7. Si deux plans À et B contiennent tous deux un point C, alors l'intersection de À et B contient 
au moins un autre point. 


À.A8. Il existe au moins quatre points non coplanaires. 


AXIOMES D'ORDRE (O) 


A.O1. Si un point B est entre les points A et C, B est aussi entre les points C et À, et il existe une 
droite contenant les trois points A,B,C. 


A.02. Soient deux points À et C, il existe un point B élément de la droite AC tel que C se situe entre 
A et B. 


A.O3. Soient trois points contenus dans une droite, alors un et un seul se situe entre les deux autres. 
AÀ.04. ("Axiome de Pasch") Soient trois points À, B, C non colinéaires, et soit une droite D contenue 


dans le plan ABC mais ne contenant aucun des points À, B, C: Si D contient un point du segment AB, 
alors D contient aussi soit un point du segment AC soit un point du segment BC. 
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AXIOMES DE CONGRUENCE (G) 


Remarque: Intuitivement "congruent" signifie en géométrie "superposable”. 


A.G1. Soient deux points À, B et un point A élément d'une droite d, il existe deux et deux uniques 
points C et D, tel que A' se situe entre C et D, et AB est congru à A'C et AB est congru à A'D. 


A.G2. La relation de congruence est transitive, c'est-à-dire, si AB est congru à CD et si CD est 
congru à EF, alors AB est congru à EF. 


A.G3. Soit une droite d contenant les segments adjacents [AB] et [BC], et soit une droite d' contenant 
les segments adjacents [A'B'] and [B'C"] . Si [AB] est congru à [A'B'] et [BC] est congru à [B'C'] alors 
[ACT est congru à [A'C"]. 


A.G4. Soit un angle ABC et une demi-droite B'C", il existe deux et seulement deux demi-droites, B'D 
et B'E, tel que l'angle DB'C' est congru à l'angle ABC et l'angle EB'C' est congru à l'angle ABC. 


Corollaire: Tout angle est congru à lui-même. 


AÀ.G5. Soient deux triangles ABC et A'B'C' tels que AB est congru à A'B', AC est congru à A'C", et 
l'angle BAC est congru à l'angle B'A'C", alors le triangle ABC est congru au triangle A'B'C'. 


Remarque: Ces axiomes permettent de comparer les segments, et aussi les angles de définir le 
milieu d'un segment, les droites orthogonales, de parler de triangles équilatéraux, isocèles, etc. 
Ils permettent également de définir rigoureusement les déplacements dont Euclide faisait si 
souvent usage sans les avoir définis. 


AXIOMES DE CONTINUITÉ (C) 


A.C1. ('Axiome d'Archimède") Soient [AB] et [CD] deux segments quelconques. Alors il existe 
toujours une suite finie de points 4,...,4, appartenant à la droite contenant le segment [AB] et tels 


que A< 4 << 4, < 8 < À, qui peuvent satisfaire A4, = AA, =... = 4, ,4, =CD, 


A.C2. ("Axiome de Cantor") Si (4,) et (3,) sont deux suites infinies de points telles que 

Mu, B41c]4,2ÆT et telles que Ÿ]C, 2[, 3 =]4,8[=1C, 27, alors il existe un point X appartenant 
à tous les segments ]4,, 8;[ . En d'autres termes: soit une suite de segments emboîtés dont la 
longueur tend vers 0 alors il y a un point commun à tous les segments. 


Remarque: Ces axiomes permettent d'établir une correspondance entre les points d'une droite et 
l'ensemble des nombres réels. 


AXIOMES DES PARALLÈLES (P) 


A.P1. Soit d'une droite et P un point n'appartenant pas à d. Il passe une et une seule droite d' par 
P qui soit parallèle à d. 


Autre formulation équivalente: 
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A.P1. Soit une droite d, un point P non inclus dans d, alors il existe un plan contenant d et P. Ce plan 
contient une et une unique droite contenant P et ne contenant aucun point de d. 


Nous ne pouvons pas réellement démontrer la non-contradiction logique de l'ensemble de ces 
axiomes. Cependant nous savons deux choses si nous faisons un parallèle avec ce que nous avons 
étudié dans la section d'Arithmétique et d'Algèbre du site (en particulier les chapitres sur la Théorie 
Des Ensembles, l'Analyse Fonctionnelle, les Suites Et Séries): 


1. Si ces axiomes sont contradictoires, alors la théorie des nombres réels est contradictoire. 


2. Si le système d'axiomes obtenu en supprimant l'axiome de Cantor est contradictoire, alors la 
théorie des nombres rationnels est contradictoire. 


Ainsi, la confiance qu'on a dans la solidité de ces axiomes repose sur celle qu'on a dans la théorie des 
nombres réels, qui est très grande. 


BARYCENTRE 


Maintenant que nous avons abordé le minimum de la construction d'Euclide et d'Hilbert de la 
géométrie, nous pouvons passer à un niveau supérieur pour faire de l'analyse de propriétés des 
formes géométriques. Nous commencerons donc par étudier le concept de "barycentre", appelé 
également mais plus rarement "centroïde". 


Remarques: 


R1. La définition du barycentre nécessite certains des outils mathématiques définis dans le 
chapitre de Calcul Vectoriel . La lecture de ce chapitre est donc recommandée si le lecteur 
souhaite comprendre ce qui va suivre. 


R2. Les développements qui vont suivre sont aussi bien utilisés en géométrie qu'en physique! 


Définition: Nous appelons "barycentre" ou "centroïde" des points du plan ou de l'espace affectés 


respectivement des coefficients &,%,,..4%, (où les & sont des réels tels que Da a 0, l'unique 
point G tel que: 


DGA = 0] (177 


lAT 


Le couple noté (4,&) est appelé "point pondéré" ("point massif" en physique quand 
&, > Ü représente une masse). 
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Remarques: 


R1. En mécanique, le "centre d'inertie" d'un corps correspond au barycentre des particules qui 
composent le corps en question. Chaque particule étant pondérée par sa masse propre. C'est donc 
le point par rapport auquel la masse est uniformément répartie. Si la densité est constante, le 
centre d'inertie se confond avec le barycentre. 


R2. Le "centre de gravité" d'un corps correspond au barycentre des particules qui composent le 
corps en question, chaque particule étant pondérée par son poids propre! Très souvent en 
mécanique, la dimension des corps étant faible devant la rotondité de la terre, on considère un 
champ de gravité uniforme. Sous cette hypothèse, le centre de gravité et le centre d'inertie sont 
confondus. 


R3. Lorsque pour tout point massif (4,%) nous avons & = &,; Vi,j € N°, nous parlons alors 
de "isobarycentre”. 


Pour un point O arbitraire, nous avons bien évidemment par simple addition vectorielle: 


YaGx - Ya (04-00) > «04 - Sac =0 (2178) 


il il 


d'où le résultat majeur: 


Nous pouvons très bien également travailler avec les éléments de surface ou de volumes (pour ne 
faire mention que des plus triviaux) pour déterminer le barycentre: 


Dans l'espace muni d'un repère (©, , j, &) en notant (%,3;,Z;) les coordonnées du point pondéré 
(4,&)et (x5,Ve;,Ze) celles de G, nous avons alors: 
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point M: 


Dax - x MG (2183) 


il il 
Démonstration: 
D'&MA -a MA + a, MA, +.….+ a, MA, 
il 
= & (MG +GA)+a, (MG +C4)+.+a, (MG +G4,) 
(a +a +.+ a) MG + a, GA + a CA, +.+ a GA 


Ÿa |FG+ÿ 404 


Puisque par définition du barycentre: 


nous avons alors bien: 


Sant [Sa | nee S aux -[Sa]ne ein 


FI IT 
CIC.Q.F.D. 
P2. Pour v&e IR’, les points pondérés (4,4 ),(4,@&:)....,(4,,@,) et 
(4,k&),(4,,&a,),..,(4,,£&@,) ont même barycentre car (invariance du barycentre): 
# Per a # : ue 

D'aG4 =-0e S (&&)GA =0 (2187 

il il 
La démonstration est évidente (si vous ne voyez pas, contactez-nous). 
P3. Le barycentre G de n points pondérés est invariant quand on remplace p d'entre eux, par leur 


barycentre G', affecté de la condition Ÿ a #0 de leurs coefficients, G est alors le barycentre de: 


il 


Ha 
(are). 4.e) (21.88) 


il 

Démonstration: 

Si G' est le barycentre des points pondérés (4,%),(4,&)...,(4,,&,) alors: 
ÿa MA = Da MG (2189) 
i= re 


Pour le cas particulier où M = G: 


# sr 4 x nn. 
> &G4A - cc (21.90) 

3] 1 
Or G étant le barycentre des n points pondérés (4,%),(4,4,)....,(4,,&,) donc: 


DES nm ra Li] __ ra RE: Li] 2: nr 
Sa G4 pee FD a GA = pa GG'+S GA =0 (2191) 


i-l i=p+l ie p+l 


ra Li] 
Comme d'& LA >. & “0 l'égalité précédente prouve bien que G est le barycentre des points 
il in +l 


pondérés: 


r 
(ae). 4e) (21.92) 


pe 
CIC.Q.F.D. 


P4. Si x =0 , pour tous points M, N: 
# es, x nr | 
S'aMA = @NA =" (2193) 
il il 
Démonstration: 


Pour ff # À} calculons: 
Da MA - Da -aMA+a M4 +.+a MA -a NA - a NE a NA 
= a (MA - NA )+ @ (MA, - NA) +... + a (MA, - NA) = @ MN + a, MN +...+ a MN 


sue re ÿa |rv-5 


(21.94) 
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* 
puisque x = Ü, nous avons alors: 
il 


D'aMA n S'aNA =c* (21.95) 


il il 


CIC.Q.F.D. 


Remarques: Quand un corps a une certaine symétrie, les calculs se simplifient car le barycentre 
doit coïncider avec l'élément de symétrie. Si un corps, comme une sphère, un parallélépipède, 
etc., a un centre de symétrie, le barycentre est confondu avec lui. Si le corps a seulement un axe 
de symétrie, le barycentre est alors sur cet axe. 


TRANSFORMATIONS 


Les transformations dans le plan (et plus) sont habituellement définies rigoureusement à l'aide de la 
théorie des groupes (cf. chapitre d'Algèbre Ensembliste), Maïs dans le cadre de la géométrie 
euclidienne, cette approche ne nous intéressera pas. Nous ferons donc dans ce chapitre uniquement 
une approche très peu formelle (donc plus intuitive) des transformations élémentaires dans le plan 
que sont: la translation, l'homothétie et la rotation. 


Remarque: Par définition, "l'isométrie" est une transformation qui conserve les distances et les 
aires. Comme nous le verrons ci-après, la translation, la rotation et la réflexion sont des 
isométries, l'homothétie n'étant elle pas du tout une isométrie dans le plan. 


TRANSLATION 


Soit une droite dans un plan P sur laquelle deux points À et B définissent un segment de la droite 
noté AB. 


Définition: Une "translation" T ("déplacement" dans une direction donnée comme disait Euclide) de 
ce segment de droite associe à chaque point À et B de nouveaux points A'B' tels que 48 = 4'E*. 
Nous pouvons donc restreindre la notion de translation à un point uniquement tel que nous puissions 


écrire mathématiquement: 


T: PP T(A) = À" (2196) 


Autrement dit, une fonction de transformation de type translation de l'ensemble du plan dans lui- 
même associe à chaque pré-image au plus une seule et unique image. La translation est donc une 
fonction bijective. Nous pouvons donc définir une application de transformation réciproque notée 
T”! telle que (rappel de ce qui a été vu en arithmétique): 


T'(4=A (2197) 
Nous disons par définition qu'un point est "invariant par translation" si et seulement si: 


T(4)= A= A" (2198) 
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Dans un autre type de formalisme, le déplacement du point À au point B selon le vecteur 48 est 
appelé "translation du vecteur" AB (cf. chapitre de Calcul Vectoriel). Elle se traduit 
mathématiquement par la somme des coordonnées du point et de la matrice des coordonnées du 
vecteur. 


Par exemple dans un espace à trois dimensions: 


(x7,2)+(x,y,z) =(x+x,y+y,z+2z) (2199) 


La translation n'étant pas une transformation linéaire (cf. chapitre d'Algebre Linéaire), nous ne 
pouvons nous autoriser à la représenter par la multiplication d'une matrice carrée comme nous le 
verrons pour les autres transformations suivantes. 


Il faut pour cela passer alors par un artifice consistant à utiliser un système appelé les coordonnées 
homogènes (cf. chapitre de Géométrie Projective) où les points du plan sont représentés par un 
vecteur à trois composantes (et respectivement ceux de l'espace par un vecteur à quatre dimensions): 


Xÿ 
x Xp = X-W 
— | y, | avec (21.100) 
> °W 


Dans le cadre de l'étude de la translation nous posons w = 1 car dans ce cas: 


1.x+0.y+7:1 x+T, 


x LD Elfz 
Y'|=10 1 7, ||y[=|0.x+1.y+7,.1|=|y+7, | (21101) 
1 0 0 11 0+0+1.1 1 


Ce système de coordonnées homogènes est applicable à toutes les autres transformations que nous 
verrons par la suite en rajoutant à chaque fois une coordonnée (cf. chapitre de Géométrie Projective), 


Remarque: Une translation envoie une droite sur une droite parallèle (parallèle à l'originale bien 
évidemment!). 


HOMOTHÉTIE 


Soit une forme quelconque dans le plan (point, droite, ovale, polygone,.….), un nombre R, et un point 
C placé à un endroit prédéfini. 


Définition: Une "homothétie" (appelée aussi "changement d'échelle") H de rapport R et de centre C 
est l'application qui à chaque point M de la forme associe au segment Cf un nouveau point 


colinéaire à C'Af mais disposé à une distance supérieure ou inférieure de rapport R par rapport au 
centre Ctel que CM'=RCM 


Nous pouvons restreindre la notion d'homothétie à un segment de droite tel que nous puissions écrire 
mathématiquement: 


H:P— P= H(CM)=R CM =CM' (21.102) 
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Autrement dit, une fonction de transformation de type homothétie de l'ensemble du plan dans lui- 
même associe à chaque pré-image au plus une seule et unique image. L'homothétie est donc une 
fonction bijective. On peut donc définir une application de transformation réciproque notée 4”! telle 
que: 


HR CM) = CM 


Si À #1, alors C est le seul point invariant. Si À = 1, alors tous les points sont invariants et 
l'homothétie est dite de type “"homothétie identité”. Si À = -1, alors nous disons alors que nous 
avons une "symétrie centrale". La symétrie centrale est donc une rotation de 180. 


Dans un autre type de formalisme, une homothétie de centre © et de rapport k, associe au point A un 
point B tel que © = &: OA. Le point B se trouvant sur la droite OA et à une distance QE = £&' OA. 
Le signe de k détermine la position de B par rapport à O: 


2 à é ë 10 
OB =k'OAS& (x',y',z9 = L'(x,y,2) 
Nous nous permettons maintenant de faire un petit passage dans la géométrie spatiale (le saut n'étant 
pas bien grand et nécessitant juste la connaissance du calcul vectoriel et de l'algèbre linéaire): 


Nous pouvons également remplacer le scalaire k par une matrice carrée telle que: 


+ a b clfx ax + by +cz kx 
J'Ü=lé e fl'lrl=fldte+zZ|=lk 
=; g k illz gx + hy +iz & 


Une solution triviale pour obtenir une homothétie est de poser que à =c = 4 = f = g=h#=0 d'où la 
forme matricielle diagonale évidente de k: 


& 0 0 
&=10 & 0 
0 0 & 


Cette matrice est appelée "matrice de transformation par homothétie de centre O (origine du repère) 
et de rapport k" et donc l'homothétie étant une matrice diagonale commute avec toute application 
linéaire. 


Dans ce cas présenté précédemment, l'homothétie conserve les formes dans tous les axes (sa 
géométrie est invariante par transformation) si nous utilisons en effet le même facteur k pour tous les 
axes. Mais nous pourrions également utiliser la matrice suivante: 


D % © 
SO © 


qui elle déformerait l'objet selon un facteur différent pour chaque axe. 


Ou encore faire un cisaillement dans le plan qui déforme la géométrie selon l'axe x, par exemple avec 


pti 


y À 
6 
3 * 
al MG3,4) N(5.2) Er 
. | 
2F À * N'(9.2) 
LÉ 71 jt 1 per 
D. ‘EL 2, 3 2 5 6 7 6 9 I0:IL-EZ LS à 


La transformation inverse de l'homothétie est bien évidemment l'homothétie de centre O et de 
rapport &”} soit sous la forme d'une matrice: 


1/& O0 O0 
&'=| 0 1/x 0 
0 O0 1x 


Lorsque le centre d'homothétie ne coïncide pas avec l'origine du repère choisi (ce qui arrive 
quasiment tout le temps), la procédure de calcul des coordonnées du point image est très simple. Il 
faut: 


1. Réaliser une translation pour faire correspondre le centre de l'homothétie avec l'origine du repère 
et appliquer cette translation à tous les points en jeu. 


2. Réaliser l'homothétie proprement dite comme décrit précédemment (le centre est l'origine du 
repère). 


3. Réaliser la translation inverse pour ramener le centre et l'image à sa place. 
Pour clore, signalons que les opérations successives de translation et d'homothétie ne sont pas 


commutatives dans le cas général. Dans la pratique, on effectue souvent d'aborde l'homothétie et 
ensuite la translation. 
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ROTATION 


Soit une forme quelconque dans le plan (point, droite, ovale, polygone), un nombre # , et un point C 
placé à un endroit prédéfini. 


Définition: Une "rotation" R d'angle & et de centre C est l'application qui à chaque point M de la 
forme associe au segment C'Af un nouveau point mais ayant subi une rotation positive ou 
négative d'angle # et de centre C telle que C'M et C'AM' ont même longueur mais pas même 
direction. 


De cette définition, il ressort que l'axe de rotation d'un objet est le lieu de points de cet objet qui 
restent immobiles. 


Remarque: La rotation est également, de manière plus savante, une application bijective dans le 
plan, nous pouvons donc également définir une application de transformation réciproque notée 


Fa 


Si & “ 0, alors C est le seul point invariant. Si & = 2&x (avec & € Æ), alors tous les points sont 


invariants et la rotation est dite de type "rotation identité". Si nous choisissons un système d'axes 


perpendiculaires adéquat tel que leur intersection se confonde avec C et que # = 7 alors R est dite 
une "rotation de symétrie centrale”. 


Dans un autre type de formalisme, la rotation s'exprime de manière beaucoup plus rigoureuse. Nous 
allons nous aider du dessin d'un cercle de rayon unité (donc dans le plan) pour étudier ce type de 
transformation. Nous allons considérer le premier cas où l'origine du repère et de la translation sont 
confondus: 


Figure: 21.37 - Exemple de rotation dans le plan 
où À' est l'image À par la rotation de centre O et d'angle 8. 
Nous avons dans le plan pour le point A (cf. chapitre de Trigonométrie): 
X=FrCOS®,y =rSsinŒ (21.108) 
et identiquement pour le point A: 


x'=rcos B,y'=rsin 8 (21109) 
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avec Ê=a+8, 


Ce qui nous amène à écrire: 


x x cos(æ + 8 

= => x = x —— 

cosæ cos(æ +6) cos æ 

2 cos(æ +8) _ , cos(æ) cos(#) — sin(æ) sin(8) 

cos Œ cos Œ 

sin(@)sin(é) _ = + ain(#) 
cos Œ rcos œ 
ysin(g 
rcos œ 


x'= xcos(8)- x 


= xcos(#) -rcosæ = xcos 8 — y sin 8 


Identiquement (en se basant sur le fait que les relations trigonométriques élémentaires présentées 
dans le chapitre de Trigonométrie du site sont connues), nous trouvons: 


y'=xsan8+ycos£ 


ce qui nous permet d'écrire la matrice de rotation dans le plan (en s'imaginant que l'axe Z sort de la 


feuille): 

x'] [cos8 -sin8] [x] fxcos& -ysing 

y' sing cosê y xain 8 + ycos 8 
La transformation inverse consiste très simplement en la rotation de centre O (le même 
qu'auparavant) et d'angle -&# soit (nous utilisons à nouveaux les relations trigonométriques évidentes 


des angles opposés): 
cosg sinê 
-ang cos8 


Lorsque nous souhaitons procéder à une rotation autour d'un point quelconque, tout comme pour 
l'homothétie, il convient de réaliser une translation de vecteur 94 (H étant l'origine du repère de 


l'homothétie ) pour faire confondre O et H, puis de réaliser la rotation simple autour de H, et enfin de 
ramener O (confondu alors avec H) à son point de départ. 


Lors de la rotation d'un objet dans l'espace (nous profitons de la lancée. car nous en aurons besoin 
dans plusieurs chapitres relatifs à la physique), la transformation est assez similaire à la précédente. 


Effectivement, lors d'une rotation d'angle #, autour de l'axe Z la coordonnée z ne change pas. Ce qui 
nous amène à écrire la matrice de rotation dans l'espace tridimensionnel par rapport au plan x, y 
comme étant: 


cosé san# O|lfx x xcos $ +ysin # 


x' 
y'I=|-sing cos O||y = Rz(#) y[=|-xsin #+ycos# 
£: 0 ( INR: Z Z 


La philosophie est ensuite toujours la même relativement aux autres axes: 


Rotation autour l'axe X d'angle 8: 


Là 1 0 0 x x x 
y'[=10 cos8 sn8 ||y|=R;(8)|y|=| ycos8+zsin 8 (21.115) 
z 


O0 -an8 cos8 | Lz : —y sin 8 +zcos 8 


Rotation autour de l'axe Y d'angle Ÿ: 


+ cosy 0 -sany|/fx . XCcosÿ—zsin ÿ 
y'I=l 0 1 0 |y|=Æ(r)lrl= Y (21.116) 
à siny Ù cosy s Z xsin Y+zcos y 


Nous avons donc finalement trois matrices de rotation correspondant chacune à un des plans 
(xy,yz,zxz) de l'espace tridimensionnel. 


Ces trois matrices font partie du groupe des matrices d'ordre trois, noté "SO(3)" et appelé par les 
physiciens et mathématiciens "groupe de rotations spatiales SO(3)". Une rotation quelconque peut 
donc être représentée par la matrice produit résultant du produit de ces trois matrices. 


Toute rotation consiste ensuite en une composition de ces trois rotations mais il est important que le 
lecteur se souvienne du chapitre d'Algèbre Linéaire où nous avions vu que la multiplication 
matricielle n'est pas commutative. Ainsi, tourner autour de l'axe X de 90° et ensuite autour de l'axe Z 
de 90° n'est pas équivalent à faire tourner d'abord selon l'axe Z et ensuite selon l'axe X du même 
angle comme le montre l'image ci-dessous: 
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n 
nm 


Figure: 21.38 - Exemple de non commutativité de la matrice de rotation 


Enfin, pour obtenir la matrice qui compose un cas particulier des trois rotations voici par exemple les 
commandes à fournir dans Maple 4.00b: 


>X:=array([[1,0,0],[0,cos(theta),sin(theta)],[0,-sin(theta),cos(theta)]]); 
>Y:=array([[cos(lambda),0,-sin(lambda)],[0,1,0],[sin(lambda),0,cos(lambda)]]); 
>Z:=array([[cos(phi),sin(phi),0],[-sin(phi),cos(phi),0],[0,0,11]); 

>evalm(X&*Y &*Z),; 


Si nous cherchons à réaliser la composition d'une rotation R et d'une homothétie d'échelle H (dans 
cet ordre) la matrice de transformation sera: 


[ATTR] 1117 


Remarques: 


R1. Nous rappelons (cf. chapitre d'Algébre Linéaire) que la multiplication de 2 matrices n'est pas 
commutative. 


R2. La similitude directe de centre C, de rapport R et d'angle & est la composée de l'homothétie 
de centre C et de rapport R et de la rotation de centre C et d'angle &. Nous renvoyons le lecteur 
au chapitre sur les Nombres pour revoir que les nombres complexes permettent formellement 
d'opérer avec les opérations d'addition et de multiplication à des similitudes (directes ou 
rétrogrades). 


R3. Nous pouvons faire des rotations beaucoup plus puissantes et variables à l'aide des nombres 
quaternions (ou "hypercomplexes"). Pour plus d'informations le lecteur se reportera au chapitre 
sur les Nombres. 
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RÉFLEXION 


Définition: La "réflexion", appelée également "symétrie axiale", notée $, (en géométrie), par 
rapport à la droite À est l'application qui associe à chaque point M extérieur à À le point M' telle que 
À soit la médiatrice de MM". Si M appartient à À, alors Af = M”. 
Mathématiquement cela s'écrit: 

S1:P—P>S,(M)=M' (21118) 
Autrement dit, une fonction de transformation de type réflexion de l'ensemble du plan dans lui-même 
associe à chaque pré-image au plus une seule et unique image. La réflexion est donc une fonction 


bijective. Nous pouvons donc définir une application de transformation réciproque notée 5} | telle 
que: 


S'(MM=M (21119) 
Remarque: Tous les points de À sont trivialement invariants par la réflexion dans le plan. 


Sous forme matricielle les réflexions du plan sont extrêmement simples à formaliser en utilisant 
l'algèbre linéaire (voir chapitre du même nom) comme le montrent les exemples ci-dessous: 


- Réflexion par rapport à l'axe des Y: 


- ()-[ 0 
A y' 0 1{\y y (21.120) 
F 
(-x,y) «| >) 


- Réflexion par rapport à l'axe des X: 
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(x,y) 


/ y) 


? 
(21.121) 


- Réflexion par rapport à l'origine: 


(21.122) 
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Notes personnelles: 
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22. GÉOMÉTRIES NON-EUCLIDIENNES 


EE es géométries non-euclidiennes sont toutes les géométries qui satisfont non nécessairement tous 


les axiomes de Hilbert (cf. chapitre de Géométrie Euclidienne) mais sans en contredire aucun 
(contrairement aux anciens axiomes d'Euclide et en particulier celui sur les parallèles). 


Une représentation particulière de ce type de géométrie consiste à définir les points comme étant 
répartis sur la surface d'une sphère (ce sont les intersection des diamètres de la sphère avec la 
surface), et les lignes, pour généraliser le concept de droite, (nous disons maintenant géodésique"), 
comme les intersections de la surface de la sphère avec les plans contenant le centre de la sphère. 
Deux points définissent alors de façon unique une ligne et un point est toujours donné par 
l'intersection de deux lignes. Cependant, dans cette géométrie, si nous nous donnons une ligne AB et 
un point P, il n'existe aucune ligne passant par P et ne coupant pas AB. Ainsi, le cinquième postulat 
d'Euclide n'est pas satisfait car en P nous ne pouvons tracer aucune parallèle à AB. 


Figure: 22.1 - Exemple illustré de la violation du 5ème postulat d'Euclide 


Remarque: Avant d'aborder ce chapitre, nous recommandons vivement au lecteur d'avoir lu et si 
possible compris les chapitres traitant du Calcul Tensoriel, de Trigonométrie et de Géométrie 
Euclidienne car nous allons utiliser grand nombre de résultats, non nécessairement triviaux, que 
nous avons pu y démontrer. 


Dans le chapitre de Géométrie Euclidienne, nous avons étudié un certain nombre de théorèmes 
relatifs aux plans. Insistons maintenant sur le fait que le "plan" et une figure bidimensionnelle dont la 
courbure est nulle et plongée dans un espace à 3 dimensions (donc le plan peut dès lors s'orienter). 
Ceci précisé, il convient peut-être de définir plus rigoureusement ce qu'est le concept intuitif de 
"courbure". 


Définition: Une figure est dite "courbe" s'il existe au moins en un point se situant sur la ou les 
droites, surfaces, volumes, … la délimitant une tangente non confondue au délimiteur et donc 
tangente en un seul point. 


C'est Gauss qui en 1824 avait formulé la possibilité qu'il existe des géométries alternatives à celles 


d'Euclide. Nous distinguons les géométries à "courbure négative", comme celle du russe Nicolaï 
Lobatchevski (1829) et Bolyai (1832) (somme des angles d'un triangle inférieure à 180°, nombre 
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infini de parallèles possibles à une droite par un point), des géométries à "courbure positive" comme 
celle de Riemann (1867) (somme des angles d'un triangle supérieure à 180°, parallèles se rejoignant 
aux pôles). 


Nous allons voir dans ce chapitre différentes géométries non-euclidiennes dont les plus connues sont 
les "géométries Riemanniennes" (à courbure constante) et les "géométries de Lobatchevski" (de type 
hyperbolique donc à courbure non-constante). 


Remarque: La géométrie communément appelée "géométrie de Riemann" est un espace 
sphérique à trois dimensions, espace fini et cependant sans bornes, à courbure régulière, 
alternative au postulat Euclidien des parallèles. 


L'intérêt de l'étude de ces géométries est que nous ne pouvons déterminer si l'Univers dans lequel 
nous vivons est fait d'un type de géométrie plutôt que d'un autre car étant donné notre taille 
(physique), plongés que nous sommes dans quelque géométrie que ce soit à faible courbure, toute 
surface de l'espace nous semble localement euclidienne (deux droites parallèles ne se coupent pas). 
Cependant, la relativité générale, qui fait usage à outrance du calcul tensoriel (généralisation de 
n'importe quelle géométrie) montre qu'il existe des zones de l'espace où la géométrie est très 
fortement courbée et donc localement non-euclidienne et seulement l'étude de ce genre de 
géométries nous permet de tirer des théories expliquant des observations qui ne sont pas exploitables 
uniquement avec l'intuition humaine. 


Avant de nous attaquer de manière formelle et abstraite à certaines géométries non-euclidiennes nous 
allons d'abord faire une introduction pragmatique et particulière de certains concepts qui ne nous 
sont pas totalement étrangers car déjà traités dans d'autres chapitres de manière théorique. Une fois 
cette introduction faite, qui nous sera très utile pédagogiquement parlant, nous aborderons les 
concepts vus plus rigoureusement. 


GÉODÉSIQUE ET EQUATION MÉTRIQUE 


Revenons donc sur les concepts de géodésique et courbure dont nous avons souvent fait mention 
dans le chapitre de Calcul Tensoriel (le fait de ne pas avoir lu ce chapitre ne pose aucun problème 
normalement à la compréhension de ce qui va suivre). 


Considérons la surface bidimensionnelle d'une sphère de rayon R. Étant donnés deux points B et C 
diamétralement opposés, nous cherchons la plus courte distance s mesurée sur la sphère entre B et C. 
La courbe obtenue est comme nous le savons une "géodésique", notion qui généralise donc, pour une 
surface arbitraire, la notion de droite du plan. 
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Remarque: Nous supposerons comme intuitif que la longueur d'une courbe de l'espace 
tridimensionnel euclidien est toujours supérieure ou égale à la longueur de toute projection plane 
de cette courbe. La courbe géodésique est donc nécessairement une courbe plane. 


Le rayon entre l'axe Oz et l'un des points B ou C est trivialement donné par un peu de trigonométrie 
élémentaire: 


r=kRsing (221) 


Et donc la moitié du périmètre du cercle à hauteur de B et C sera donné par: 


Et nous avons démontré dans le chapitre de Trigonométrie que le périmètre d'un cercle en fonction 
de l'angle d'ouverture de ce dernier étant donnée par: 


L=R-& (23) 
Il vient donc automatiquement: 


a =R-(28) (2242) 


Comme #sin 8 > 28 sur l'intervalle [0,#/2] alors 5 24 (il y a égalité en 8=0 et 8= 7/2). Les 


géodésiques de la sphère sont donc les arcs de grands cercles, trajets empruntés par les avions pour 
les vols intercontinentaux, et correspondent aux lignes obtenues entre la surface de la sphère et un 
plan passant par le centre de celle-ci. 


Les propriétés géométriques des figures tracées sur la surface d'une sphère ne sont donc plus celles 
de la géométrie euclidienne. Ainsi, le plus court chemin d'un point B à un point €, sur la surface 
sphérique, est constitué par un arc de grand cercle passant par les points B et C. Les arcs de grand 
cercle jouent le même rôle pour la sphère que les droites dans le plan. Ce sont les "géodésiques" de 
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la sphère. 


Considérons maintenant deux surfaces bidimensionnelles: la surface de la sphère et celle du cylindre. 
Etant donnés deux points B et C, nous traçons la courbe géodésique entre ces points: 


Figure: 22.3 - Représentation plan de la surface latérale d'un cylindre 
Le cylindre peut être découpé parallèlement à son axe et déplié à plat. La géodésique apparaît ainsi 
comme une droite du plan. Nous disons alors que le cylindre est "intrinsèquement plat" (même si sa 
topologie diffère de celle du plan, il faut en particulier ici éviter que la coupure ne traverse la 
géodésique). Ce n'est évidemment intuitivement pas le cas de la surface de la sphère. 


Dans le cas de la surface cylindrique, nous pouvons définir les coordonnées cartésiennes du plan 
B ( Z) et (» 2) permettant d'écrire la longueur s de la courbe (droite) BC sous la forme du 
théorème de Pythagore: 


2 
= (2 »n} +(2 -z) (22.5) 


La métrique du plan est euclidienne et sous forme infinitésimale nous obtenons "l'équation métrique 
euclidienne": 


ds? = dy? +dr? (226) 


Sur le cylindre, le changement de variable y = r# donne: 


=(r&-r4) +(2-a) = 8-4) +(2-2) 027 
Ou sous forme locale: 
ds? =r?d8" +d7° (228) 
La surface du cylindre peut ainsi être représentée par des coordonnées cartésiennes analogues à 


celles du plan, la métrique de la surface du cylindre étant euclidienne sous forme infinitésimale et 
sous forme globale. 


Remarque: La relation précédente correspond à ce que nous avions obtenu dans le chapitre de 
Calcul Tensoriel pour l'équation métrique en coordonnées polaires. 
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Nous pouvons nous intéresser maintenant au problème d'écrire l'analogue du théorème de Pythagore 
pour une surface sphérique. L'impossibilité de découper la sphère et de l'aplatir pour épouser un plan 
suggère des difficultés. 


C'est la raison pour laquelle l'équation de la métrique ne peut s'écrire sous forme générale comme le 
théorème de Pythagore. Effectivement, nous avons vu dans le chapitre de Calcul Tensoriel que celle- 
ci était donnée par: 


ds? = dr? +r248 +r° sin? 84#? (229) 
Cependant, localement (c'est-à-dire dans une région de petite dimension devant le rayon de la 
sphère), les propriétés de la sphère peuvent être décrites par des coordonnées cartésiennes d'un plan 


tangent à sa surface (c'est la propriété essentielle des espaces de Riemann!) tel que l'équation 
métrique soit localement euclidienne: 


ds? = r°d@ + r° sin’ 84f (22.10) 


En posant: 


dé = feed. = RÉPLL (22.11) 
il vient alors: 
ds? = gd +2,çdf =dE+dm? (2212) 
Avec: 
Læ = r? jf = r? sin? 8 (22.13) 
Alors que &#,# sont les "coordonnées de Gauss", #,# sont les "coordonnées de Riemann" du plan 


localement tangent. 


Cette petite présentation ayant été faite, passons à un cadre plus général en nous intéressant aux 
espaces de Riemann. 


ESPACES DE RIEMANN 


Pour mieux comprendre ce qu'est un espace de Riemann, nous allons de suite passer par un petit 
exemple d'une surface à deux dimensions (exemple très classique): 


Considérons une sphère de rayon R, de surface S, située dans l'espace ordinaire à trois dimensions. 
Les coordonnées cartésiennes x, y, z d'un point M de la surface S peuvent s'exprimer, par exemple, en 
fonction des coordonnées sphériques (r,4,#). La sphère est entièrement décrite pour un rayon donné 
et 0L#<2Teæ0<8<x. 


Trois tels paramètres, permettant de déterminer un point sur la surface d'une sphère, sont nous le 
savons (cf. chapitre de Calcul Tensoriel) des coordonnées curvilignes sur la surface ou également 
dites "coordonnées de Gauss" (Gauss étant un des premiers mathématiciens à s'intéresser à l'étude 
des corps plongés dans les espaces non-euclidiens). D'autres paramètres quelconques u, v, w peuvent 


évidemment être choisis comme coordonnées curvilignes sur la surface. 
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L'élément linéaire de la surface ds? , carré de la distance entre deux points infiniment voisins M, M', 
s'écrit en fonction des coordonnées sphériques, comme nous l'avons démontré dans le chapitre de 
Calcul Tensoriel: 


ds? = dr? +r/48 +r° sin? 84#? (22.14) 
Nous obtenons ainsi une expression de l'élément linéaire en fonction des trois seules coordonnées de 


Gauss (r,#,#) . Nous pourrions bien sûr imposer une étude locale (plan tangent) afin que l'élément 
linéaire ne soit plus fonction que de (8,#) comme nous l'avons vu plus haut: 


ds? = r?4d@ +r° sin? 84f (22.15) 


Écrire à l'aide des trois paramètres, la surface de la sphère (considérée comme un espace à deux 
dimensions) constitue un exemple d'espace de Riemann à deux dimensions. 


Dont l'élément linéaire est de la forme générale bien connue (cf. le chapitre de Calcul Tensoriel): 
ds? = gdu'du* (22.16) 
où les du° sont les composantes contravariantes du vecteur dM = MM' par rapport au repère naturel 


(4,8). 


Remarque: L'étude des figures sur des surfaces Riemanniennes fait partie de la géométrie 
différentielle à laquelle nous consacrons un chapitre entier dans cette section. 


Considérons à présent une surface quelconque de coordonnées #},4?. Les coordonnées cartésiennes 
X, y, z de l'espace ordinaire où se trouve plongée cette surface s'écrivent de manière générale avec les 
coordonnées de Gauss: 

x=x(ulu) y=y(ulu?) z=z(ulu?) (2217 
Remarquons par ailleurs que l'équation métrique sous forme tensorielle: 


ds? = gdu'du* (22.18) 


peut s'écrire sous forme développée de la manière suivante (cette relation est démontrée avec une 
approche géométrique dans le chapitre de Géométrie Différentielle): 


ds? = Edu? +2Fdudv+Gdÿ (22.19) 


avec: 


E = (dx) + (83° + (@z)° 
G=(8,x)" +(8,y)*+(8,z)? (22.20) 
F = 4,x8,x + 4, y, y + 4,z8,z 
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Remarques: 


R1. L'expression donnée ci-dessus de l'élément linéaire s'appelle "forme quadratique 
fondamentale" de la surface considérée. Les coefficients E, F, G sont des fonctions des 
coordonnées curvilignes. De manière générale cette surface, considérée comme un espace à deux 
dimensions, constituera un exemple d'espace de Riemann, pour des coordonnées curvilignes 
arbitraires. 


R2. Les différents espaces de Riemann constituent ce que nous appelons sous une forme générale 
(parce qu'il n'y pas que des espaces de type Riemannien à courbure constante) une "variété" 
munie d'une métrique Riemannienne. Une variété peut être définie (non formellement), par 
exemple, par un ensemble de points situés dans un espace préexistant. De manière générale une 
surface donne l'idée d'une variété à deux dimensions. La sphère et le tore sont des variétés à deux 
dimensions sans frontière. Un cylindre de révolution, un paraboloïde hyperbolique, sont des 
variétés à deux dimensions ouvertes, avec frontières à l'infini. Mais nous pouvons aussi envisager 
des variétés abstraites. C'est le cas par exemple d'un espace de configuration. Il s'agit alors d'un 


espace de points à n dimensions représenté par un ensemble 4° (ou noté 4°) de coordonnées 


généralisées (voir l'introduction au formalisme lagrangien dans la section de mécanique 
analytique), ces dernières pouvant avoir des valeurs comprises dans un domaine fini ou non. 


Nous pouvons maintenant mieux définir ce qu'est un espace de Riemann. 


Définition: Un "espace de Riemann”" est une variété à laquelle nous avons attaché une métrique. 
Cela signifie que, dans chaque partie de la variété, représentée analytiquement au moyen d'un 
système de coordonnées 4°, nous nous sommes donné une forme différentielle quadratique: 


ds? = gydu'du* 
qui constitue la métrique de l'espace. 


Les coefficients £ÿ ne sont pas entièrement arbitraires et doivent vérifier, nous l'avons démontré 
dans le chapitre de Calcul Tensoriel, les conditions suivantes: 


C1. Les composantes sont symétriques £ÿ = £;. 


C2. Le déterminant de la matrice [g;;] est différent de zéro. 


C3. La forme différentielle de l'élément linéaire, et par conséquent le concept de distance défini par 
les £ÿ, est invariante vis-à-vis de tout changement de coordonnées. 


C4. Toutes les dérivées partielles d'ordre deux des g; existent et sont continues donc de classe €. 


Un espace de Riemann est donc un espace de points, chacun étant repéré par un système de 

n coordonnées #°, doté d'une métrique quelconque telle que la forme différentielle de l'élément 
linéaire vérifiant les conditions précédentes. Cette métrique est dite dès lors "métrique 
Riemannienne”. 
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Remarques: 


R1. Si la métrique est définie positive, c'est-à-dire si gyv'v' > Q pour tout vecteur Ÿ non nul, 
nous disons que l'espace est "proprement Riemannien". Dans ce cas, le déterminant de la matrice 
[gÿ] est strictement positif et toutes les valeurs propres de la matrice [g;;] sont strictement 
positives. 


R2. Par définition, nous disons qu'une métrique d'un espace est euclidienne lorsque tout tenseur 
fondamental de cet espace peut être ramené, par un changement approprié de coordonnées, à une 


forme telle que (cf. chapitre de Calcul Tensoriel) la base orthonormée canonique: £ÿ = 6;. 


R3. La définition des espaces Riemanniens montre que l'espace euclidien est un cas très 
particulier de ces espaces. Il n'existe donc qu'un seul espace euclidien alors que nous pouvons 
créer une infinité d'espaces Riemanniens. 
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Notes personnelles: 
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23. GÉOMÉTRIE PROJECTIVE 


D. Chasles et jusque dans les années 1930, la géométrie projective était souvent synonyme de 


"géométrie supérieure". Elle s'opposait à la géométrie euclidienne: élémentaire. et analytique. À 
l'époque de Monge, de Carnot, de von Staudt, on parlait aussi de "géométrie de position" ou de 
"situation". Ces géométries étudient les figures au point de vue de leurs positions respectives et des 
propriétés invariantes qui les lient dans une transformation géométrique (rotation, symétrie, 
homothétie,etc.) homographique tout particulièrement. Outre la division harmonique, notion de base, 
elle fait appel au célèbre rapport anharmonique (birapport), à l'inversion, l'involution, la transformation 
par polaires réciproques, la projection stéréographique, la corrélation, l'homologie, la dualité, les 
coniques, etc. (voir plus loin dans ce texte pour les définitions). 


La géométrie projective très abstraite en dehors de quelques généralités et principes de base exposés 
ci-dessous. Elle est donc relativement difficile à appréhender et requiert, avant de s'y plonger, une 
bonne connaissance en géométrie élémentaire voire, dans l'espace, une parfaite maîtrise de l'espace 
tridimensionnel, dans le cycle observation-représentation-interprétation. Ceci nous a amené à introduire 
certains concepts qui n'ont normalement pas leur place ici, mais qui nous le pensons, peuvent aider 
grandement l'intéressé à mieux comprendre cette branche des mathématiques. 


Dans un premier lieu, nous allons étudier les concepts élémentaires de la perspective en s'attardant 
particulièrement sur le concept de présentation "projective" (il existe d'autres méthodes de perspective 
empiriques: cavalière, isométrique, militaire, ...mais ces dernières n'ont pas de sens mathématique ou 
réel même si elles représentent assez convenablement des objets volumiques). Ensuite, nous étudierons 
les représentations mathématiques de quelques objets tridimensionnel dans le cadre d'applications pour 
enfin passer à l'étude de la géométrie projective dure. Enfin, nous étudierons la mathématique utilisé 
dans la représentation informatique des formes géométriques (splines, courbes de bézier, etc...) 


Remarque: La "géométrie descriptive" est une forme artistique rigoureuse de la géométrie 
projective mais non formelle (dans le sens qu'elle ne s'étudie pas mathématiquement). 


1. PERSPECTIVE CONIQUE (CENTRALE) 


Un des problèmes de l'étude des volumes tridimensionnels et de leur représentation est le concept de 
"perspective". Effectivement, l'être humain ne peut voir les 3 dimensions d'un objet, c'est le cerveau qui 
interprète les ombres et reflets d'un objet afin que nous l'interprétions comme ayant un volume (il existe 
des illusions d'optique qui vont dans ce sens...: les trompe l'oeil). 


Nous allons nous intéresser dans les paragraphes qui suivent à la "perspective conique", aussi appelée 
"perspective centrale" ou encore "linéaire". 


Remarque: Dans le domaine de la géométrie projective nous ne parlons pas de "perspective 
conique" mais de "projection conique”. 
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Définition: La "perspective conique" ou "projection perspective" est par construction la représentation 
la plus proche de nos perceptions visuelles, elle permet notamment de voir une sphère comme un 
cercle. 


Remarque: La perspective conique est celle des peintres de la Renaissance. C'est aussi celle qui 
apparaît sur une photo. 


La difficulté de la représentation en perspective est de traduire dans un plan (celui de la feuille de 
papier par exemple ou l'écran d'ordinateur) une construction qui est définie - de manière assez simple, 
d'ailleurs - dans l'espace à l'aide d'outils mathématiques. 


Une projection conique de l'espace usuel à 3 dimensions est donc transformation projective qui envoie 
tous les points de cet espace sur un même plan de cet espace. Elle nécessite la donnée d'un point O 


LL 


(équivalent à la position de l'oeil de l'observateur) et d'un plan de projection appelé "tableau" ou encore 
"Vitre de Dürer” (l'équivalent de la rétine). 


Nous verrons lors des développements théoriques que contrairement aux projections affines (voir le 
sous-chapitre suivant), la projection conique ne conserve pas le barycentre (donc les rapports de 
longueurs sur une droite donnée) mais elle conserve l'alignement et le birapport. 


Lorsque nous parlons de perspective conique, nous utilisons quelques plans et droites particuliers dans 
l'espace tridimensionnel (voir figure plus bas): 


- Le "plan du tableau" ou "vitre de Dürer”, noté T, est le plan sur lequel nous faisons le dessin (plan de 
projection). 


- Le "plan du sol", notéS, est un plan fixé, perpendiculaire au tableau T. 


- Le "point de vue" (ou "centre de projection"), noté O, est un point hors de T'et de S: c'est le point où 
devra se placer l'oeil pour que le dessin sur le tableau T coïncide avec l'image réelle. 


- Le "plan de l'horizon", noté H, est le plan parallèle au plan du sol S passant par le point de vue O. 
- La "ligne d'horizon", notée h, est l'intersection du plan d'horizon H et du tableau T. 

- La "ligne de Terre", notée LT, est l'intersection du plan de sol S et du tableau T. 

- Un plan ou une droite parallèles au plan du solS sont appelés "horizontaux". 

- Un plan ou une droite perpendiculaires au plan du sol S sont appelés "verticaux". 

- Un plan ou une droite parallèles au tableau T sont appelés "frontaux". 

- Un plan ou une droite perpendiculaires à T sont appelés de "bout". 


Voici un schéma qui représente ces différentes notions: 
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Flan vertical 


Plon fronlal 


[=] 
“ 
9. 
+ 
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ñ 
= 
9 


Plan du sol 5 


Figure: 23.1 - Définition des plans et droites de la géométrie projective 


1.1. IMAGES DE POINTS 


Tout objet volumique (ce qui ne peut être déterminé qu'au touché ou au niveau de l'abstraction 
mathématique) composé par un ensemble de points M, est à notre cerveau, l'image d'une projection 
plane m dont le support est une surface dans l'espace se trouvant entre l'objet observé et notre oeil. 


En mathématiques, cette surface appelée donc "tableau" est délimitée dans sa vue centrale par la ligne 
d'horizon (là où se situent les points de fuite) et par un référentiel physique appelé donc la ligne de terre 
(voir schéma ci-dessous): 


Ligne d'horizon 


Y Point de Vue 


X 
Ligne de Terre 


Figure: 23.2 - Exemple visuel de ce qu'est Le "tableau" en géométrie projective 


La hauteur entre la ligne de Terre et le point de vue est appelée la "hauteur d'horizon" et est notée h. 
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L'objectif à partir de ce schéma est de déterminer mathématiquement une représentation d'un objet 
volumique sur une surface (plan dans un cas simple, quelconque sinon) en connaissant l'équation de la 
droite entre le point M et le point V (point de vue) afin d'en déterminer les coordonnées d'intersection 
entre cette droite et le tableau. 


Nous pouvons du schéma ci-dessus tirer les relations suivantes selon les théorèmes de Thalès (cf. 
chapitre de Géométrie Euclidienne) dans les différents triangles: 


avec À > Ü. 


Si nous posons y'= 0, conformément à ce que nous montre le schéma ci-dessus, les coordonnées du 
point m deviennent: 


À À 
x'=x etz'=}+(z-}) (23.2) 
Y + FAN y + FAN 
À partir de ces relations, le problème de la représentation plane d'une forme volumique est 
complètement résolu, puisque nous pouvons toujours projeter un point (ou la distance entre deux 


points) sur un tableau à partir des coordonnées de l'original. 


Le terme À est communément appelé la "longueur focale" du point de vue à l'écran et les spécialistes 
de l'optique le notent habituellement par la lettre f. 


Pour mieux comprendre ce dernier résultat, nous pouvons nous mettre dans le contexte d'une étude 
bidimensionnelle où l'observateur est à la hauteur de la ligne de Terre (h=0) et disposé de façon à 
représenter une personne regardant le tableau (assimilable à un écran télé, ordinateur ou tout autre) 
dans lequel nous posons les axes conventionnels x et y dans le plan de l'écran et Z perpendiculairement 
(ainsi, relativement au premier schéma, Y devient Z et inversement). 


Ainsi, la relation précédente des rapports: 


devient avec ce changement d'axes: 


(23.4) 


et comme h=0 (ce qui est souvent le cas devant des écrans): 


2 +A) 
z+ÂA 


23,5) 
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Remarque: Cette relation est une forme particulière de ce que nous appelons les "transformations 
homographiques". Nous reviendrons plus loin sur celles-ci et démontrerons certaines de leurs 
propriétés. 


Si le tableau est posé sur l'axe du référentiel (le tableau de projection est assimilé à l'écran), nous avons 
alors z'=0 ce qui nous donne: 


A 
y'= A (23.6) 
zt+tA 
et en procédant de même: 
sel. 
x = (23.7) 
ztÂ 


Remarque: Ces deux dernières relations sont celles que nous utilisons pour faire des animations 3D 
programmées dans le logiciel Macromedia Flash 6.0 (par exemple). 


Nous voyons sur les deux dernières relations un terme identique: 


p-_à 
z+ÂA 


ce terme correspond à la "profondeur" de la perspective. 
Dans certains ouvrages, cette profondeur est notée (simple mise en facteur): 
l 


(23.9 
1342 cs 


P = 


Si nous considérons deux points (x,,x, Ou »,,y, ) visibles de la surface d'un volume vu par un 


observateur et leur distance respective Àx ou Ày, ces grandeurs se conservent si les deux points se 
confondent dans le plan du tableau car nous avons alors: 


puisque z = 0,FA. 


Il est intéressant d'étudier quelle doit être la valeur de la focale pour z # 0 afin d'avoir Ax'= /x ou 
Ây'= Ây. Ainsi, si nous prenons la limite: 


lim P = 


io z + 


(23.11) 


en appliquant la règle de l'Hospital (dérivée au numérateur et dénominateur) et en se rappelant que z est 
fixé, alors: 
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4 
fn bee dd - 1; (23.12) 
rer z+A À +4) 0 +1 

d A 


De ce résultat, nous pouvons conclure la chose suivante: 


Pour que toute distance réelle entre deux points non confondus dans le tableau mais se trouvant dans 
un même plan aient une distance de projection égale, il faut que les équations des deux droites qui 
déterminent leur intersection avec le tableau soient parallèles. Ce qui implique, puisque l'observateur 
est un point convergent, qu'il faut éloigner l'observateur à une distance infinie du plan pour conserver 
les grandeurs ainsi projetées sur le tableau: c'est la "projection parallèle orthogonale" aussi parfois 
appelée "projection parallèle orthographique". 


Un très bon exemple pour visualiser ces résultats est de programmer en pseudo-3D sur un ordinateur. 
Exemple: 


Il existe de nombreuses manières de faire de la 3D avec l'informatique. Les plus connues 
techniquement parlant sont avec OpenGL ou DirectX ou du C++ mais ne sont pas très faciles à 
aborder... nous allons donc voir comment faire tourner une pseudo-sphère dans l'espace projectif avec 
Macromedia Flash 6.0 dans le but de montrer comment s'appliquent les différents éléments théoriques 
présentés plus haut mais aussi de montrer que ce ne sont pas les seuls outils disponibles. 


PS: Je regrette d'avoir fait l'exemple avec un logiciel peu accessible à tous. Si j'ai du temps je referai 
l'exemple avec un logiciel comme Microsoft Office PowerPoint. 


Pour cela, ouvrez le logiciel Macromedia Flash 6.0 et enregistrez la nouvelle animation sous le nom 
Cercle.fla: 


ne nimes | hungens | hemtmfs te 
ann _runrumt _| 


Figure: 23.3 - [Interface de Macromedia Flash 6.0 


Avec l'outil Cercle dans la barre de dessin, dessinez un cercle de dimension respectable dans la zone 
d'animation: 
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Figure: 23.4 - Dessin d'un cercle 


Ensuite après avoir sélectionné votre cercle, avec l'outil Remplissage ( choisissez un Dégradé 


Radial: 
ñ 
b Actions 
+ Properties 
| SE Shape $ 


W: [34.0 #: [45.0 
H: [340 Y: [42.0 


Figure: 23.5 - Palette de couleurs pour remplissage du cercle 


| 
RE froo0000 : 


Faites un clic-droit sur le cercle et choisissez l'option Convert to Symbol et saisissez les informations 
telles que présentées ci-dessous: 


STE  * 
Behavior € Movie Clip Registration: Bus Cancel | 


© Button 


r: “ 
DIRE Advanced | Help | 


Figure: 23.6 - Boîte de dialogue de converstion d'objet en symbole 


Renommez le calque où se trouve votre movie clip avec le nom 3d clip: 


Fr 3d clip 


Figure: 23.7 - Renommage du calque d'animation 


Faites un double-clic sur votre cercle pour entrer dans votre Movie Clip. 


Sélectionnez-y à nouveau le cercle, faites un clic-droit dessus et sélectionnez Convert to Symbol: 
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CCE x 
Name: fBasicCircle 
Behavior € Movie Clip Registration: Bas Cancel | 


© Button 


Tr: “ 
es Advanced | Help | 


Figure: 23.8 - Définition des plans et droites de la géométrie projective 


Ensuite, dans les propriétés du cercle saisissez-y le nom Point: 


+ Properties 


LE) [Movie Clip + ] 


Figure: 23.9 - Double conversion en symbole 


Maintenant, dans le Movie Clip nommé Cercle, nous allons insérer trois frames: la première pour 
définir les fonctions mathématiques recalculant les différentes variables, la deuxième qui appelle les 
fonctions, la troisième qui permet de relancer en boucle et indéfiniment la deuxième. 


Afin de faire les choses au propre, nous allons créer un deuxième calque (en renommant celui qui 
contient notre cercle en Cercle) que nous appellerons Code: 


+ Timeline 


Figure: 23.10 - Selon l'usage on fait un calque de code 
Faisons un clic-droit sur la troisième image du calque contenant notre cercle: 


+ Timeline 


TIR PERTE RER RRLERREEX 


10 15 20 25 


Create fMotionduween 


Insert Frame 


REMOYEFTAMEs 


Figure: 23.11 - Préparation d'une animation de base sur 3 images 


et choisissons l'option Insert Frame et pour le calque Code faites presque de même, mais en choisissant 
l'option Insert Key Frame. Vous devriez alors obtenir le visuel suivant: 
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+ Timeline 


Fr Code 
C2 Cercle 


Figure: 23.12 - Résultat à obtenir 


Ensuite en sélectionnant la première image du calque Code activez l'affichage des Actions pour y 


insérer le code suivant: 


Radius = 100; 
degrees = 0; 
Xcenter=0; 
Ycenter=0; 
speed=2; 


function setängle {) { 
ängle = degrees * (Math.PI / 180); 
degrees = degrees + speed: 


function drawPoints {(}) { 
Point. x = Radius * Math.cos(ingle)+Xcenter; 
Point. _y Radius * Math.sin(ingle)+Yÿcenter;: 


Faites de même avec la deuxième image du calque Code, mais en mettant: 


setänglel{): 
drawPoints(); 


et enfin de même avec la troisième image, mais en y mettant: 


gotoëndPlayi(2); 


Nous obtenons alors le résultat suivant: 
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Figure: 23.13 - Animation Flash 6.0 du résultat intermédiaire 


Nous allons maintenant faire intervenir l'axe Z en fixant Y (et en faisant donc bouger 2). Bien 
évidemment, nous ne verrons rien se passer en ce qui concerne Z tant que nous ne définissons pas la 
projection homographique et parce qu'un ordinateur est incapable de montrer basiquement le concept 


de profondeur... Le code s'écrit alors: 


Radius = 100; 

degrees = 0; 

/{coordonnées X,Y,2Z dans le re 
Xcenter=0; 

Ycenter=0; 

£Zcenter=0; 


speed=2!: 


function setängle {) { 


3D imaginé 


Angle = degrees * (Math.PI / 180); 


degrees = degrees + speed: 


function drawPoints {(}) { 


Point. x = Radius * Math.cos(ingle)+Xcenter; 


Point. y = ÿcenter; 


£Zpos = Radius * Math.sin(ingle)+Zcenter: 


Le calcul de Zpos va nous permettre plus loin de calculer la profondeur du mouvement de l'objet selon 
l'axe Z. Et c'est là qu'interviendra la projection homographique. 
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Nous obtenons alors une pseudo-sphère qui tourne autour d'un axe dans un plan perpendiculaire à 
l'écran. Raison pour laquelle nous voyons la pseudo-sphère faire des allers-retours gauche/droite (le 
concept d'éloignement n'est pas encore présent faute de présence d'un facteur profondeur): 


Figure: 23.14 - Animation Flash 6.0 du résultat intermédiaire 


Maintenant nous allons utiliser les relations: 


| 
rl: TT 

ñ (23.13) 
din do Ter 


démontrées plus haut. Si nous cherchons à représenter la profondeur de tout point du tableau de 
projection c'est le rapport de distance entre deux des points de ce tableau qui vont nous intéresser pour 
déterminer le changement d'échelle: 


4G@)-4@) y À .100= p.100 
Î 


Æ Z + 
| x 4 (23.14) 
PTE) LÀ 100 = p.100 


M z+f 
Il faudra donc appliquer ce résultat comme définissant l'échelle du tableau de projection. 


Nous avons alors le code suivant où la profondeur P joue sur la hauteur et la largeur de la surface 
d'animation de l'instance Point de notre pseudo-sphère: 
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Radius = 27 
degrees = 0: 
/{coordonnées X,Y,2Z dans le repère 3D imaginé 
Xcenter=0; 

Ycenter=100; 

Zcenter=0; 

speed=2: 

£=400; 


function setängle {(}j { 
Angle = degrees * (Math.PI / 180); 
degrees = degrees + speed: 


function drawPoints {(}j { 
Point. x = Radius * Math.cos(ingle)+Xcenter; 
Point. y = ÿYcenter; 
Zpos = Radius * Math.sin(Angle)+Zcenter: 
P=f}/ (f+Zposi; 
//{Puisque les échelles des objets sont 
{{en % dans Flash 
_xscale = _yscale= P*100; 
/{on joue avec la transparence de l'objet 
_alpha= P*100; 


Ce qui nous donne: 


Figure: 23.15 - Animation Flash 6.0 du résultat intermédiaire 
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et bien évidemment cela fonctionne quelle que soit l'équation paramétrique de la trajectoire! Nous 
pouvons ensuite copier cette instance d'animation, changer la hauteur, l'angle de départ pour avoir les 4 
sommets d'un cube qui tourne dans l'espace. 


C'est la prochaine étape: 


Effectivement, changeons notre code comme indiqué ci-dessous pour avoir quatre pseudo-sphères 
tournant autour d'un axe Z imaginaire sortant de l'écran (nous utilisons les matrices de rotation 
démontrées dans le chapitre de Géométrie Euclidienne): 


degrees = O0; 
speed=1: 
Xcenter=0; 
Ycenter=0; 


leurs ordonnée respective lans un tableau à 4 dimensions 


y = new Array(-50, -50, 50, 50); 
verticeNum = x.length; 


n duplique les points en les nommant PointO, Pointl,,.., avec une boucle 
for (© = O0; © < verticeNum: C++) { 
duplicateMovieClip ("“Point", "Point" +4 c, c): 
} 
Point. visible = 0: 
de etLAnGit 
function setAngle () { 


Angle = degrees * (Math.PI / 160): 
degrees = degrees + speed; 


funcrion drawPoints () !{ 
for (© = O0: € < verticeNum: C++) {| 
Xpos = x{[c] * Math.cos (Angle) + y[c] * Math.sin(Angle); 
Ypos = - x{c] * Math.sin (Angle) + ylc] * Math.cos{(Angle); 
LL c Le ” [ ere \i1ue Le L 


this("Point" + c}]. x =» Xpos + Xcenter; 
this("Point" + c}. y = Ypos + Ycenter; 


Ce qui nous donne en charme... quatre pseudo-sphères tournant autour d'un centre commun: 
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Figure: 23.16 - Animation Flash 6.0 intermédiaire 


Maintenant, nous inversons Y et Z à nouveau et appliquons la projection homographique: 


degrees = O0: 
speed=1; 
Xcenter=0; 
Ycenter=0; 
Zcenter=0 

£Z » 150: 


/nous avons changé Ÿ en 2 sinon 
x = new Array(-5S0, S0, -50, 50); 
z = nev ÀArray(-50, -50, 50, 50); 
verticeNum = x,.length; 


rien dé nouveau 
for (c = O0; © < verticeNum: c++) 
duplicateMovieClip ("Point", 
} 
Point. visible = 0; 


rien de nouveau 


function setAngle (}) { 


YAngle = degrees * (Math.PI / 180); 


degrees = degrees + speed; 


de particulier 


“Point" + c, 
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function drawPoints () ({ 
for (c = O0; © < verticeNum: c++) ( 


In COurNE autour de Ÿ 
Xpos = x[c] * Math.cos (YAngle) - £[c] * Math.sin (YAngle): 
Zpos = x{c] * Math.sin (YAngle) + z{c) * Math.cos (YAngle):; 


La projection habituelle 
P = £ /(f+Zpos): 
et on redezssine les points 
this["Poinc" + €]. x = Xpos * P + Xcenter: 
this["Point" + c]. y * Ycenter 
on applique l'effet d'échelle a chaque sphère indépendamment 


this("Point" + c]. xscale = chis{"Point" + c]. yscale = P * 100; 


utilise une fonction de Macromedie 


de dessiner les points aur des couch 


les naauio-sanhere er .e rotiteanr 
les pseudo-sphère en 2e croisant = 


this["Point" + c].swapDepths(P * 500): 


Et nous obtenons: 


@o : 0Q 


Figure: 23.17 - Animation Flash 6.0 intermédiaire 


Pour la suite, nous allons générer 8 pseudo-sphère et au lieu de les faire tourner toujours autour du 
même axe, nous allons les faire tourner autour des 3 axes X, Y ou Z en utilisant les variables XAngJle, 
YAngle ou ZAngle et les matrices de rotation autour de chacun de ces axes respectifs: 
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Xdegrees = 0; 
Ydegrees = 0; 
Zdegrees = 0; 
Xcenter = 0; 
Ycenter = 0: 
Zcenter = 0; 
f = 150; 


// Nous générons les 6 pseudo-sphères 


new Array(-50, 50, -S0, 50, -S0, SO, -50, S0); 


y = new ÀArray(-5S0, -S0, S0, S0, -50, -50, 50, SO); 
z = new Array(50, 50, 50, 50, -50, -50, -50, -50): 
verticeNum = x.length: 


‘4 


Dupliquation des pseudo-sphères en Pointi,Pointe2... 


for (© = O0: © < verticeNum: C++) ({ 


LE 4 


duplicateMovieClip ("Point", "Point" + ©, c): 


Nous masquon # le point d'héritage 


Point. _ visible * 0; 


// Nous définissons les angles selon chaque axe 
function setAngle {() ( 


{ / 


Xangle = Xdegrees * (Math.PI / 180); 

Yangle = Ydegrees * (Match.PI / 160): 

Zangle = Zdegrees * (Math.PI / 180); 

//l'angle sera déterminé par la position de la souris 
Xdegrees = this. ymouse; 

Ydegrees = this. xmouse; 

Zdegrees = sqrt(this. xmouse2+this. _ymouse) : 


Nous calculons les points de chaque sphère 


function drawPoints {) «{ 


for (c = O0; © < verticeNum; c++) ({ 


// On tourne les pseudo-sphères autour de l'axe X en utilisant Xangle 
/J €t la matrice de rotation 

Ypos Temp = y{c] * Math.cos (Xangle) + z{c] * Math.sin (Xangle); 
Zpos_ Temp = - y[c] * Math.sin (Xangle) + z[c] * Math.cos (Xangle): 


{7 On tourne les pseudo-sphères autour de l'axe YŸ en utilisant Yangie 
// et la matrice de rotation 

Xpos_ Temp = x{[c] * Match.cos (Yangle) - Zpos Temp * Math.sin (Yangle); 
Zpos = x[c]* Math.sin (Yangle) + Zpos Temp * Math.cos (Yangle); 


// On tourne les pseudo-sphéres autour de l'axe Z en utilisant Xangie 


// ex la matrice de rotation 
Xpos = Xpos_Temp * Math.cos (Zangle) + YPos_Temp * Math.sin (Zangle); 
Ypos = - Xpos_Temp * Math,.sin (Zangle) + Ypos_Termp * Math.cos (Zangle);: 


// Perspective (j'ai rajouté le Zcenter pour étre plus exact! 
P = f/ (£ + Zpos + Zcenter): 


// On dessine 

this("Point" + c]._ x = Xpos * P + Xcenter: 

tchis("Poinc" + c]._ y = Ypos * P + Ycenter: 

this("Point" + C]._ xsCale = this["Point" + c]._ yscale = P * 100: 


// Z-Sorting 
this{"Point" + c].swvapbepths(P * S00); 


Et voici le résultat final: 


Page 


: 1424/4839 


[v3.0 - 2013] 


Figure: 23.18 - Animation Flash 6.0 finale 


Comme le Flash est mort entre temps... un internaute à refait l'exemple ci-dessous avec du WebGL 
dont voici le code: 


<html> 

<head> 
<script type="text/javascript"> 
window.onload = startDemo; 


function Point3D(x,%,z) { 


this.x = x; 
this.y = y; 
this.z = z;: 


this.rotatexX = function(angle) { 
var rad, cosa, sina, y, Z 
rad = angle * Math.PI / 180 
cosa = Math.cos(rad) 
sina = Math.sin(rad) 
y = this.y * cosa - this.z * sina 
z = this.y * sina + this.z * cosa 
return new Point3D(this.x, y, 2) 


this.rotateYÿ = function(angle) { 
var rad, cosa, sina, X, Z 
rad = angle * Math.PI / 180 
cosa = Math.cos(rad}) 
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sina = Math.sin(rad) 

z = this.z * cosa - this.x * sina 
x = this.z * sina + this.x * cosa 
return new Point3D(x,this.y, 2) 


this.rotatezZ - function(angle) { 
var rad, cosa, sina, X, Y 
rad = angle * Math.PI / 180 
cosa = Math.cos(rad) 
sina = Math.sin(rad) 
x this.x * cosa - this.y * sina 
y = this.x * sina + this.y * cosa 
return new Point3D(x, y, this.z) 


this.project = function(viewlWidth, viewHeight, fov, viewDistance) { 
var factor, X, Y 
factor = fov / (viewDistance + this.z) 
x = this.x * factor + viewWidth / 2 
y = this.y * factor + viewHeight / 2 
return new Point3D(x, y, this.z) 


— 


var vertices = [ 
Point3D(-1,1,-1}, 
Point3D(l,l1,-1}, 
Point3D(l,-1,-1), 
Point3D(-l,-1,-1)}, 
Point3D(-1,1,1), 
Point3D(l,1,1), 
Point3D(l,-1,1), 
Point3D(-1,-1,1} 


ist defined above. 


C[0,1,2,3],01,5,6,21,15,4,7,6],14,0,3,7],00,4,5,1],15,2,6,7]1] 


< 
À 
M = 
m à 
q 
Lu 
Lo] 
[ll 


var angle = Ü; 


function startDemo() { 
canvas = document. getElementByld("thecanvas"); 
if( canvas && canvas.getContext ) { 
ctx = canvas.getContext("2d4"); 
setInterval(loop,33): 
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function loop() { 
var t = new àrray(}; 


ctx.fill$tyle = "rgb(255,258,255)"; 
ctx.fillRect(0,0,400,200) ; 


for( var i = Ü; i < vertices.length; i44+ ) { 
var v = vertices[i]: 
var r = v.rotateX(angle).rotateY(angle).rotateZ(angle); 
var p = r.project(400,200,128,3.5); 
t.push(p} 


ctx.strokeStyle = "rgbf0,0,0)" 


for( var i = O0; i < faces.length; i+4+ } { 
var £ = faces[i] 
ctx.beginPath(} 
ctx.moveTo(t{[£[0]1.x,t{[£[011.%) 
ctx.lineTo(t[£[1]].x,t[£[111.%) 
ctx.lineTo(t{[£[211.x,t[£[211.%) 
ctx.lineTo(t{[£[311.x,t[£[511.%) 
ctx.closePath(} 
ctx.stroke(} 


} 
angle += 2 
} 
</script> 
</head> 
<bodz> 


<canvas id="thecanvas" width="400" height="200"> 
Your browser does not support the HTMLS canvas element. 
</canvas> 
</body> 
</htnl> 


Ce qui donne: 
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1.2: IMAGES DE DROITES 


Déterminons à partir des résultats précédents, l'image d'une droite parallèle à la ligne de terre (donc à 
l'axe x) du tableau XY. Dans ce cas, nous avons: 


z=8,y=b (23.15) 


où a et b sont des constantes et pour toute valeur de h. Ce qui nous donne d'après les relations obtenues 
plus haut: 


_ À 
er X 

La a. (23.16) 
p'=h+@-n) à #2+ 48 Lo 


h+a À +a 


Donc toute droite parallèle à la ligne de Terre devient en perspective une droite se trouvant à une 
hauteur y' dans le plan parallèle à XY de notre écran (on pouvait le deviner intuitivement..…). 


Pour toute droite parallèle à l'axe Z de l'écran (donc dans sa "profondeur"), nous avons: 
X=4,y=b (23.17) 


où a et b sont des constantes et pour toute valeur de h. Ce qui nous donne: 


r= a À ' 
Tz 7: = sy =h+@ HT (2318 
y'=h+(b-à) +Zz & & 


Les droites d'équation: 
x! 
J'=h+(b—-h)— (23.19) 
a 
passent toutes par le point P(x'= 0,y'= X) lorsque z +0 qui est le "point de fuite principal" et par 


le point F(x'=a,y'=b) lorsque z — 0 tel que représenté sur la projection ci-dessous faite dans 
Adobe Photoshop (les lignes horizontales ont été rajoutées pour donner l'effet de perspective): 


Figure: 23.19 - Exemple d'un point de fuite unique 
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À partir de la figure ci-dessus, nous pouvons définir le concept "d'angle de fuite" donné par la figure 
ci-dessous: 


Figure: 23.20 - Exemple d'angle de fuite 


Une représentation géométrique autre peut aider à mieux comprendre le résultat. Rappelons donc que 
le point de fuite d'une droite D est le point d'intersection F du plan du tableau T avec la droite parallèle 
à D passant par ©. Deux droites parallèles D et D' ont donc le même point de fuite. Représenté comme 
ci-dessous: 


Figure: 23.21 - Autre représentation des points de fuite 


Si nous notons À le point d'intersection de D avec T, le dessin en perspective de D est la droite 4F, 
intersection de T avec le plan contenant O et D. Puisque deux droites parallèles ont le même point de 
fuite F, elles sont donc représentées par deux droites sécantes en F. 


Pour toute droite quelconque se situant dans le plan XZ de l'écran (donc dans sa profondeur"), nous 
avons: 


z=mxtp etpour y =0 (23.20) 


ce qui nous donne: 


| À B+E., 
X = X—x= X 
A+z à . . (23.21) 
à o nn. A+z ÂÀt+z 


De cette dernière équation, nous déduisons: 


Page: 1429/4839 


[v3.0 - 2013] 


en portant z dans l'expression de x: 


x=|1+ 2x li 2 |xe sa (23.23) 
À à PA 


nous remplaçons x et z dans l'équation de la droite Z = #x + p , et calculs et simplifications faits, nous 
trouvons: 


: ah _—. ph 


Rip A+p 


(23.24) 


Examinons le cas particulier de droites passant par les sommets opposés d'un carrelage, c'est-à-dire 
inclinées à +x7/4 donc avec un coefficient directeur (une pente) de ;# = +1. 


L'image de ces droites est alors donnée par: 


cela signifiant que toute projection de droites de coefficient directeur +1 se situant dans le plan 

XY pour x' constitue des points de fuite secondaires situés sur la ligne d'horizon à une distance égale 
de part et d'autre du point de fuite principal tel que représenté ci-dessous (dans le contexte d'un cours 
sur Adobe Photoshop, nous y avons rajouté un cube dans cette perspective): 


: 
Figure: 23.22 - Exemple de point de fuite secondaire 
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Nous voyons bien dans la figure ci-dessus la symétrie par rapport à l'axe vertical et les deux points de 
fuites qui sont l'origine du carrelage. 


Considérons maintenant des droites parallèles à l'axe Y de l'écran et leur équation de projection si x = & 
et z =: 


La À = 
A+b (23.27) 
À Pre PP 
= + (y —h) —— 
y œ es 


Ces droites images restent donc des droites parallèles à l'axe y. Autrement dit, les droites images restent 
parallèles aux droites "objet" tel que représenté ci-dessous (pour différentes positions du point 
d'observation): 


- . - > = ee + | — _ 7 = : 
Figure: 23.23 - Différentes perspective en fonction des valeurs des constantes 


Prenons pour exemple de ce dernier résultat, des segments de même hauteur H dont le pied est sur le 
plan horizontal: 


y=A  x=a (2328) 
La hauteur du segment image se déduit par: 


A 
t=H'=h+(H-h)— = (2329) 
Ÿ Se 


Considérons maintenant x = &, c'est-à-dire des colonnes verticales de même hauteur H alignées sur la 
droite x = 4. Calculons les coordonnées des sommets images: 


À LT 
Xs 7 a — Di 
A+b A+tb a ee 
À CE RDS 
= H'=h+(H-h) = h+ x 
d c ep: a 
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C'est l'équation d'une droite et remarquons que toutes ces droites joignant les sommets passent par le 
point de coordonnées {x'= 0,y'"= #) qui n'est d'autre que le point de fuite principal P. 


Une représentation géométrique peut à nouveau aider à la compréhension des résultats précédents. Soit 
la figure suivante: 


Figure: 23.24 - Représentation géométrique du cas particulier présenté plus haut 


La ligne de fuite du plan P est la droite d'intersection h' du plan P', parallèle à P et passant par O, avec 
le plan du tableau. Elle contient par conséquent les points de fuite de toutes les droites contenues dans 
P comme nous l'avons déjà démontré. 


Le point de fuite principal du plan P est le projeté orthogonal F" du point O sur la droite h'. C'est le 
point de fuite des droites de P parallèles à 5x, donc orthogonales à h". 


Il résulte de ces définitions que deux plans parallèles ont les mêmes éléments de référence. 


À partir de l'exposé précédent, nous avons une nouvelle méthode pour présenter un objet en rotation 
dans un espace tridimensionnel. Au lieu de faire tourner l'objet autour de différents axes, nous pouvons 
imaginer à l'aide des équations ci-dessus faire tourner l'observateur autour de l'objet (c'est un point de 
vue..….). 


Nous n'avons considéré ici que la perspective projective sur un plan. Au fait, pour travailler sur des 
méthodes de projection quelconques (sphère sur plan, plan sur sphère, sphère sur sphère, n'importe quoi 
sur n'importe quoi) il suffit d'étendre l'analyse que nous avons faite ci-dessus dans un système de 
coordonnées adapté au système étudié (coordonnées polaires, cylindriques, sphérique, ...). C'est 
probablement ainsi que procèdent les logiciels de simulation 3D pour projeter une image sur une 
surface réfléchissante et semi-transparente tel qu'un verre ondulé. 


Remarque: Des résultats que nous avons obtenus ci-dessus, nous pouvons tirer une conclusion 
intéressante et intuitive: Pour que l'observateur d'une photo ou d'un tableau voie l'image telle qu'elle 
était à l'origine, celui-ci doit se placer à des coordonnées déterminées du tableau (de la photo ou du 
tableau). 
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Un logiciel comme Adobe Illustrator propose depuis le début des années 2010 un outil pour créer des 
perpsectives à un point de fuite, à deux points de fuite et à trois points de fuite: 
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O 


9 


Figure: 23.25 - Perspectives à 1, 2 et 3 points de fuite générées par Illustrator 


9 


2. PERSPECTIVES AFFINES 


Même si la meilleure méthode de la représentation en perspective est la méthode la perspective 
conique, nous ne pouvons nous permettre systématiquement de faire de grosses quantités de calcul pour 
représenter un volume. Ainsi, il est possible de définir des techniques de perspectives qui découlent 
d'une approximation des résultats mathématiques obtenus précédemment pour arriver à deux 
techniques (il en existe un plus grand nombre mais ces deux perspectives sont de loin les plus utilisées) 
que l'on retrouve quotidiennement sur de nombreux supports papiers techniques ou artistiques. Ces 
deux techniques sont respectivement la "perspective cavalière" et la "perspective isométrique" qui font 
partie de la famille des "perspectives affines" dites également "projections affines". 


Définition: Une "projection affine" de l'espace usuel à 3 dimensions est une transformation affine qui 
envoie tous les points de cet espace sur un même plan de cet espace. Si le point M(X, y, z) n'est pas sur 
le plan de projection, lui et son image m(x', y’, z') forment une droite dont la direction est constante: 
nous l'appelons "direction de projection". La perspective qui en découle est appelée familièrement 
"perspective parallèle" ou encore "perspective cylindrique". Comme toutes les transformations affines 
de l'espace, une projection affine conserve: 


- Le parallélisme entre les droites 
- Le barycentre, donc toutes les proportions existantes sur une droite donnée 
Seuls les longueurs et les angles situés dans un plan parallèle au plan de projection sont conservés. 


Sans trop nous attarder sur ces deux techniques, nous les présentons brièvement car elles doivent faire 
partie de la culture générale du physicien. 
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2.1. PERSPECTIVE CAVALIÈRE 


Prenons une vue (par exemple la vue de face), et nommons les axes x (horizontale) et y (verticale). 
L'axe z étant l'axe perpendiculaire à la vue. 


Dans la perspective cavalière, nous traçons l'axe z avec un certain angle par rapport à l'axe x (par 
exemple x/6 ou xr/4 ), et l'on y reporte les distances en les multipliant par un coefficient inférieur à 1 
en appliquant les règles trigonométriques de base tel que: 


Figure: 23.26 - Exemple de perspective cavalière 
o 


C'est en mathématiques, par exemple, que la perspective cavalière est fréquemment choisie pour 
représenter sur le tableau des classes d'écoles les figures géométriques tridimensionnelles dans une base 
orthonormée canonique de direction E. 


Si la direction de projection n'est pas orthogonale au plan de projection, alors la perspective cavalière 
transforme une sphère en ellipse. Cette distorsion de la sphère rend la perspective cavalière tout à fait 
impropre à une utilisation en dessin d'art. Cet inconvénient n'est par contre pas rédhibitoire dans une 
utilisation en dessin industriel. 


2.2. PROJECTION ORTHOGONALE 


Si la direction de projection est orthogonale au plan de projection, alors la perspective transforme une 
sphère en cercle. C'est donc un type de perspective utilisable en dessin comme alternative à la 
perspective conique (avec laquelle elle va d'ailleurs coïncider quand l'oeil de l'observateur est placé 
infiniment loin du tableau). 


La projection orthogonale la plus simple à exprimer est évidemment celle qui envoie l'espace sur un 
plan parallèle au tableau (il s'agit de la "projection orthogonale parallèle"), de cote constante égale à a. 
Autrement dit, tel que: 


Mix, y,z) — mx, y,a) (23.31) 


On obtient alors trivialement les coordonnées dans un repère orthonormé 2D propre à ce plan où 
x=x et py=y"': 
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Figure: 23.27 - Projection orthogonale parallèle typique 


Bien que ce soit la méthode la plus utilisée dans le monde industriel, elle a cependant un inconvénient: 
l'effet réel de la profondeur, est entièrement perdu. 


Pour y remédier il existe deux solutions équivalentes (généralisables aux autres perspectives): l'une 
consiste à tourner l'objet par isométrie de l'espace et l'autre à changer le tableau. 


Un cas particulier de la projection orthogonale est la "perspective isométrique". Elle est très utilisée en 
dessin industriel, elle projette orthogonalement les points de l'espace sur le plan isotrope, d'équation: 


xt+y+z=1l (2332) 
La direction de projection est donc la normale à ce plan, de vecteur directeur {1,1,1). 


Le perspective isométrique consiste à placer les axes x, y, zà 2zr/3 (soit 120°) les uns des autres et y 
reporter les distances telles quelles (d'où son nom). 


Figure: 23.28 - Exemple de perspective isométrique 


À titre de comparaison, nous avons représenté selon les deux perspectives présentées précédemment un 
cube avec un cercle inscrit dans le carré de chaque face: 
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kW 


Figure: 23.29 - Perspective cavalière (gauche) et isométrique (droite) 


3. COORDONNÉES HOMOGÈNES 


En mathématiques, les coordonnées homogènes, introduites par August Ferdinand Môbius, rendent les 
calculs possibles dans l'espace projectif comme les coordonnées cartésiennes le font dans l'espace 
euclidien. Les coordonnées homogènes sont largement utilisées en infographie et plus particulièrement 
pour la représentation de scènes en trois dimensions (3D) car elles sont adaptées à la géométrie 
projective et elles permettent de caractériser les transformations de l'espace sous une forme 
algorithmique optimale. La notation sous forme matricielle est plus particulièrement employée dans les 
bibliothèques de programmation graphique 3D telles que OpenGL et Direct3D. 


Nous avons vu lors de notre étude des transformations dans le plan et l'espace (cf. chapitre de 
Géométrie Euclidienne) que parmi la translation, l'homothétie, la rotation ou la réflexion que la 
translation ne pouvait être représentée sous forme matricielle sans passer par une astuce qui a consistait 
à ajouter une dimension supplémentaire factice au vecteur des coordonnées ainsi qu'à la matrice 
associée à la transformation. 


Ainsi, nous avions vu que la translation dans 12 pouvait s'écrire sous forme matricielle: 


à x 10 Zlix x+T, 
1 1 0 0 11 1 


Ainsi, toujours dans 1g*, une homothétie de facteur k qui s'écrivait: 


le AG) © 


devient en coordonnées homogènes: 


z' x S, O0 Olfx S,:x 
y'I=Sly|=[0 S, O»|=|S,.»| (335) 
1 1 0 0 1|\1 1 


Ainsi, toujours dans m?, une rotation d'angle 8 de facteur k qui s'écrivait: 
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ra É cos8 —-sin8 |fx : xcos 8 — ysin 8 _—. 
y' [sing cos8 y _ x sin 9 + ycos 8 Co 


devient: 


x es cos —-sin8g 0 xcos 8 — y sin 8 
J'I=R|y|l=|san8 cosg 0 
1 l 1 


x 
y|=|zxsan8+ycos&g | (23.37) 
(ù (el l 


l 


Ainsi, toujours dans 1°, la réflexion qui s'écrivait selon l'axe X: 


GE 1-0) «+ 


devient: 
x x —1 0 Olfx —X 
y'I=Aly|=|0 1 0f[y|=| y | (23.39 
1 1 0 0 1||l1 1 


Les mathématiciens disent alors que nous nous plaçons dans l'espace projectif p2. 


In extenso, nous pouvons faire de même avec un point P de jp? qui sera alors dans ‘p* représenté par 
un vecteur de 4x1 coordonnées: 


LE ON x 


T = 


(] 
(] 
(23.41) 
(] 


SO SO = © 
= A I 


l 
( 
( 
0 


pour les rotations (voir le chapitre de Géométrie Euclidienne pour la démonstration) avec les angles 
d'Euler: 


1 ( (el O0] cosy O0 siny Ollcosg -sn8 
O0 cos8 -an8 0 ( 1 0 Ollsang cos8 
O0 sn8g cos8 Oll-siny O0 cosy 0 (el (e 
0 O0 0 l 0 0 © 1 0 0 


R=RER, = (23.42) 


OS mm © © 


0 
0 
0 
l 


sans oublier que les matrices de rotations sont non commutatives au-delà de deux dimensions! 
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Et pour les homothéties: 
5 


S = 


OS © 
mm © © © 


0 
() 
0 


Nous avons démontré plus haut que dans le cas de la perspective conique, que nous avions les 


transformations homographiques suivantes: 


à 
X = 
z+À 
| À (23.44) 
s à =? 
z+h 
z'=A 


où x',y',z' sont les projections du point réel X,y,Z sur le tableau avec une distance focale A. 


Ce qui est traditionnellement noté en posant z:=z+àù et f =: 


AR 
F4 
; . (23.45) 
= ; 
E 
nd 


où nous voyons donc que si la distance focale f est infinie, l'objet se confond avec le plan XY ou que si 


l'objet est infiniment loin. 


Posons z/ f =s. Nous avons alors: 


&'=Xx Sx'=x 
ou > oui (23.46) 
Sir = 


s=2l{f Esstf 


Nous utilisons alors la matrice suivante pour la projection conique: 


23.47) 


OS © © 
OS © mm © 
D SD .S © 


1 f 


et ensuite nous normalisons les coordonnées par le rapport z/f. 
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Notes personnelles: 
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24. GÉOMÉTRIE ANALYTIQUE 


L. "géométrie analytique" est la branche de la géométrie qui s'occupe de l'étude des formes 


géométriques et de leurs propriétés en utilisant les outils avancés du calcul algébrique tels que l'analyse 
fonctionnelle, le calcul vectoriel ou l'algèbre linéaire. Sa frontière se situe au niveau des outils utilisés et 
a pour origine les travaux de René Descartes au début du 17ème siècle. La "géométrie vectorielle" est 
donc un sous-famille de la géométrie analytique et nous en ferons aussi bien usage dans le présent 
chapite que dans celui de Géométrie Différentielle. 


Remarque: Lorsque nous faisons usage pour ces mêmes études du calcul différentiel et intégral, 
alors nous faisons de la "géométrie différentielle" (voir chapitre du même nom). 


La géométrie analytique est un très vaste domaine (comme tout le reste) alors. nous n'aborderons ici 
que les éléments absolument indispensables à l'étude de la physique (et en particulier l'astronomie et la 
physique quantique corpusculaire) et de l'ingénierie (génie spatial). Ces éléments sont par ailleurs 
souvent étudiés dans les petites classes et sont (cités dans l'ordre): les coniques, les équations de la 
droite, du plan, de la sphère, etc. leurs intersections, leurs plans tangents et encore bien d'autres. 


1. CONIQUES 


Il nous a été très difficile de choisir s'il fallait mettre l'étude des coniques dans la section d'algèbre ou de 
géométrie. Nous avons finalement décidé de mettre cette étude dans le présent chapitre (donc de 
géométrie.) qui permet de supposer que le lecteur ayant fait une lecture linéaire du site a déjà 
parcouru tous les chapitres présentant les outils mathématiques nécessaires à l'étude des coniques. Nous 
espérons que notre choix s'avérera le meilleur pour le lecteur. 


Remarque: L'étude des coniques nous sera très utile dans le chapitre d'Astronomie (par ailleurs c'est 
à Kepler que l'on doit de nombreux résultants de l'étude des coniques) ainsi que dans le chapitre 
d'Optique Géométrique. Il convient donc de s'y attarder dans les détails. 


1.1. APPROCHE ALGÉBRIQUE 


Soit (©,i,j) un repère orthonormé du plan. Les courbes algébriques les plus simples que l'on trouve 
après les droites dont les équations sont sous forme générale (rappel): 


axt+tby+c=0Q (241) 


sont les courbes du deuxième degré, à savoir par extension: 


ax + By +yxmy+0xtey+e=0 
© | 
terme quadratique 
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avec &, 8,7 non tous nuls. Ces courbes de second degré sont appelées "coniques" (appelées également 
"quadriques" de par la présence d'un terme quadratique). Cette dernière relation peut aussi s'écrire sous 
forme matricielle (écriture très importante dans la pratique des méthodes numériques comme nous le 
verrons dans le chaptire du même nom): 


[x ”| He AP fresrarsrrsc (24.3) 


écriture dont il existe plusieurs variantes. 


Par exemple, la fonction: 
FD) = x +y +2bm-5x-dy+g (244) 


donne pour différentes valeurs de g les tracés suivants: 


Figure: 24.1 - Coniques avec b = 0.5, 1.5 et 1 et plusieurs valeurs de g 


Notre première tâche va consister à obtenir, par translation et rotation du repère dans lequel cette 
relation est exprimée, une équation réduite beaucoup plus simple en éliminant le terme en xy . En effet, 
choisissons un nouveau repère se déduisant de l'ancien par une rotation d'angle 8. Soit x'et y' les 
nouvelles coordonnées des points. Nous avons (cf. chapitre de Géométrique Euclidienne): 


x cosg -san89](x" 
=|. (24.5) 
y ang cos8 || y' 


x =cos(}x'-sin(#)y 


D'où: 


(24.6) 
y =sain(#ix"+ cos 8y' 


L'équation devient: 


æ(cos (8)x'-sin(8)y J 5 (sin (8)x'+cos(8)y | 


+y(cos(8)x'- sin (8) y") sin(8)x'+ cos(8) y") +. =0 oe 


Nous cherchons donc à ce que les termes en x'y' regroupés soient tels que: 
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—2& cos 8 sin 8 +2 Bcos sin 9 + y(cos? 8 -sin? 8) =0 (24.8) 


Puisque (cf. chapitre de Trigonométrie): 
cos? 8- sin? 8 = cos(28) et sin(æ + 8) = sin(B)'cos(a)+cos(B)'sin(@) (24.9) 
par substitution, nous obtenons: 
(8-æ)sin(28)+Yycos(28)=0 (24.10) 
Pour avoir que les termes en x'y' se simplifient, il suffit donc de choisir l'angle de rotation 8 tel que: 


sin(28) _. : 
cos(28) (a- 8) tan(28) (24.11) 


Nous considérerons alors désormais l'équation: 


ax + 8y° +ôx+ey+é=0]| (24.12) 


1. Si nous posons & = 0 et 8 “0. Quitte à diviser par &, nous pouvons nous ramener à une équation 
du type: 


Y+yx+ôy+e=0 (2413) 
où: 


- Si y #0, nous nous retrouvons avec une équation décrivant la figure d'une "parabole" d'axe parallèle 
à OX. 


- Si y = 0, il s'agit d'un cas dégénéré 
2. Si nous posons &æ # 0 et #8 = 0 le cas se traite comme précédemment. 


3. Si æ #0 et 5 “0, nous pouvons supprimer les termes $x et £y de la façon suivante: 


5 2 # 2 
Œlxt+— | + +—| +7 =0 (2414) 
| A sl» 5] 


et par un simple changement de repère via des translations, nous arrivons donc à une équation du type: 
aX?+BY?+y=0 (24.15) 


- Si y = 0, alors la relation précédente se réduit à un point dans mg? si & et $ sont de même signe, et 
à une droite si & et Æsont de signe contraire. 


-Siy#0 posons: 
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a = sen). 8 =sen(s) — re (24.16) 


où sgn(x) signifie: 1 multiplié par le signe de x. 
Et divisons le tout par |y| tel que: 


2 


À 
er EL + sgn( 8) ——— +sgn(y) = 0 (2417) 


PE 


Posons: 


Nous obtenons: 


2 2 
sgn(a) À +sgn(8 =-sgn(y) (24.19) 
a 


Nous avons donc plusieurs situations possibles: 


mA He Pr 
Var 

NE  oe 
+ — — —— = — + — =-| 

a b? 2 b? 

y 2 . # n : (24.20) 
__- 7 


Deux termes ci-dessus sont impossibles dans mg, c'est pourquoi nous les avons barrés (la somme de 
deux nombres positifs ne peut être négative et inversement). 


Il y a plusieurs cas de figures intéressants: 
- Pour: 


2 2 2 2 
RER ES RE ET 
a b a b 
et 4 = =] nous avons un cercle de rayon unité. Le lecteur peut s'amuer à tester cela avec la 
commande Maple 4.00b suivante: 


>with(plots): 
>a:=4;b:=4; 
>implicitplot(x12/a12+y2/b/2 = 1,x=-10..10,y=-10..10); 
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- Pour: 


et va,b € IR * nous avons une ellipse (qui contient donc le cas particulier qu'est le cercle) de demi-axes 
respectivement a et b (pour la représentation graphique voir plus bas ou sinon le chapitre de Formes 
Géométriques). 


Le lecteur peut s'amuer à tester cela avec la commande Maple 4.00b suivante: 


>with(plots): 
>a:=4;b:=8; 
>implicitplot(x12/a12+y2/b/2 = 1,x=-10..10,y=-10..10); 
- Pour: 
RE Vo 
o —— =], + = —-] 
à a b? (24.23 
x Fr x y . 
RE TS 


et va,be R *, nous avons des hyperboles dont l'axe de symétrie est soit parallèle à OX soit à OY (pour 
la représentation graphique voir plus bas). Nous disons que l'hyperbole est "équilatère" lorsque a = b. 


Le lecteur peut s'amuer à tester cela avec la commande Maple 4.00b suivante: 
>with(plots): 


>a:=4;b:=4; 
>implicitplot(x12/a12-y12/bN2 = 1,x=-10..10,y=-10..10); 


Remarque: Pour voir les figures, utilisez la fonction implicitplot( ) dans Maple. 


Le terme "conique" provient du fait que l'une des premières définitions des conques consistait en 
l'intersection d'un cône et d'un plan. 


En effet, soit z? = x? + y* l'équation d'un cône ayant un angle de 7/4 au sommet (voir géométrie 
spatiale) 


cos 8° y + sin 8° z = À l'équation d'un plan de vecteur normal (nous utilisons les cosinus directeurs): 


(0,cos 8, ,cos &,) = #,84 E[0,7/2] (24.24) 


Posons: 
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Explications: nous avons ainsi un vecteur normal dans le plan ZOY et un plan qui n'est jamais en 
intersection avec l'axe OX. Si le cosinus directeur cos &, = 0, nous avons un plan vertical translaté de 


h sur l'axe des Ÿ. Si cos&, = 0, nous avons un plan horizontal translaté de h sur l'axe des Z. 


Soit la matrice de rotation dans l'espace par rapport à l'axe OZ (cf. chapitre de Géométrie Euclidienne): 


x' l 0 (l x 
y'[=|0 cos8 -sn8/||y| (2426) 
7. 


0 sing cos |lz 


avec: 


À x 
y'I=l ycos8-zsin8g| (24.27) 
-ÿ ysin 8+zcos 8 


Nous avons donc pour expression de rotation du plan: 
cos 8(y cos 8 —- zsin 9) + sin (ysin 8 +zcosF) =} (24.28) 
Après simplification: 
yY=hA (24.29) 
Donc après rotation, nous avons un plan vertical translaté de h selon l'axe des Y. 


Identiquement, pour le cône, une rotation correspond selon l'axe des Z (donc il ne se passe pas grand- 
chose): 


(y sin 9+zcos 9)? = x? +(ycos8-zsin 8)? (24.30) 
Après développement et simplification: 
x? — (y? -z}\cos(29) + yz2sin(28) =0 (2431) 
Equation qui donne un cône horizontal si 4 = et un cône vertical si 9 = 7/2. 
Ainsi, nous avons le système général: 


=} 


— (24.32) 
2 — (y? - 27?) cos(28) + yz2 sin(28) = 0 


Nous voyons alors que pour: 


XX À 
- 8e F3 nous obtenons une intersection entre le plan et le cône donnant une ellipse 
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XX 
- ÿ= + nous obtenons une parabole 


- 8e 2] nous obtenons une hyperbole 


Voici à peu près ce que cela donne visuellement parlant..: 


Figure: 24.2 - Différentes intersections entre un cône et un plan 


Nous donnons également à la courbe d'équation xy = 1 le nom d'hyperbole car, par changement de 
variable: 


y=Z+r 
x=XZ-F 


(24.33) 


Ce qui nous ramène à: 
X?-y?=1 (2434) 
ce qui comme nous l'avons vu précédemment, est bien l'équation d'une hyperbole. 
Pour ceux qui ont Maple 4.00b ou ultérieur voici les commandes pour s'amuser à faire une parabole: 


>restart: with(plots): 

>c:=sqrt(x"2+y/2): 

>p:=y+3;: 

> Y:=solve(c=p,y); 

> intsect:=subs(y=Y,c); 

>intsect := (x + (1/6 x-3/2)) 

> P1:=plot3d(c,x=-5..5,y=-5..5,axes-normal,color-red,numpoints=2000, view= 
[-5..5,-5..5,0..5],style=wireframe): 

> P2:=plot3d(p,x=-5..5,y=-5..5,axes-normal,color=yellow,numpoints=2000, view= 
[-5..5,-5..5,0..5],style=patchnogrid): 

> P3:=spacecurve([x, Yintsect],x=-5..5,color=black,thickness-3): 

> display(P1,P2,P3,scaling-constrained, orientation-[-10,75]); 


ce qui donne: 
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Figure: 24,3 - Plot Maple 4.00b de l'obtention d'une parabole par l'intersection d'un cône et d'un plan 
ou pour l'obtention d'une hyperbole: 


>restart: with(plots): 

>c:=sqrt(x2+y/2): 

>p:=4*y+5: 

>V:=solve(c=p, y); 

>intsect:=subs(y=Y1[1],c); 

> P1:=plot3d(c,x=-5..5,y=-5..5,axes-normal,color=red,numpoints=2000, view= 
[-5..5,-5..5,0..5],style=wireframe): 
>P2:=plot3d(p,x=-5..5,y=-5..5,axes-normal,color-yellow,numpoints=2000,view= 
[-5..5,-5..5,0..5],style=patchnogrid): 
>P3:=spacecurve([x,Y[1],intsect],x=-5..5,color-black,thickness-3):P3:=spacecurve([x, Y[1],intsect],x=-5..5,colo! 
>display(P1,P2,P3,scaling-constrained); 


ce qui donne: 
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LÀ Sara 


Figure: 24.4 - Plot Maple 4.00b de l'obtention d'une hyperbole par l'intersection d'un cône et d'un plan 
ou pour l'obtention d'une ellipse: 


>restart: with(plots): 

>c:=sqrt(x2+y/2): 

>p:=y/3+3;: 

>V:=solve(c=p, y); 

>El:=subs(y=Y[1],c); E2:=subs(y=Y[21,c); 
>P1:=plot3d(c,x=-5..5,y=-5..5,axes-normal,color-red,numpoints=2000,view= 
[-5..5,-5..5,0..5],style=wireframe): 
>P2:=plot3d(p,x=-5..5,y=-5..5,axes-normal,color-yellow,numpoints=2000,view= 
[-5..5,-5..5,0..5],style=patchnogrid): 

>P3:=spacecurve({[x, Y[11,E1],[x, Y[21,E21},x=-5..5,color-black,thickness-3,numpoints=-2000): 
>display(P1,P2,P3,scaling=constrained); 


ce qui donne: 
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Figure: 24,5 - Plot Maple 4.00b de l'obtention d'une ellipse par l'intersection d'un cône et d'un plan 
ou enfin pour l'obtention d'une cercle: 


>restart: with(plots): 

>c:=sqrt(x2+y/2): 

>p:=3: 

>V:=solve(c=p, y); 

>circl:=subs(y=Y1[1],c); circ2:=subs(y=Y[2];,c); 
>P1:=plot3d(c,x=-5..5,y=-5..5,axes-normal,color-red,numpoints=2000,view= 
[-5..5,-5..5,0..5],style=wireframe): 
>P2:=plot3d(p,x=-5..5,y=-5..5,axes-normal,color-yellow,numpoints=2000,view= 
[-5..5,-5..5,0..5],style=patchnogrid): 

>P3:=spacecurve({[x, Y[1],circ1],[x, Y[2],circ2]},x=-5..5,color-black,thickness-3,numpoints=2000): 
>display(P1,P2,P3); 


ce qui donne: 
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Figure: 24.6 - Plot Maple 4.00b de l'obtention d'un cercle par l'intersection d'un cône et d'un plan 


Cependant, les coniques ont aussi une définition géométrique: 


1.2. APPROCHE GÉOMÉTRIQUE 
Soit F un point du plan, D une droite ne contenant pas F (mais à une distance non nulle quelconque de 
celui-ci) et e un réel strictement positif. Nous nous intéressons à l'ensemble des points M défini par: 


(Mle-diM,D\=d(M,F) 


e = 1 Parabole 


F s'appelant le "foyer", D la "directrice de la conique" et e "l'excentricité" 
e = 0.5 Elipse 


e = 2 Hyperbole 


e = 0.25 Elhpse 


D 
Figure: 24.7 - Définitions du foyer, de la directrice conique et de l'excentricité 


Nous nous arrangerons par la suite pour avoir toujours F comme origine du repère des coniques, de 
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x=-h (2436) 
avec À > 0 et nous notons donc d(M, D) la distance entre le point M et D. 
Alors: 


e-diM,Di=diM,F) 


Sefx+4l= ff + y 


Se (x+h) = x + y 
& (1-e*)x? + y? - 2e°hx eh? = 0 


Nous nous retrouvons bien avec l'équation d'une conique puisque cette dernière relation est un cas 
particulier de: 


ax? + By +6x+Ey+É=0 (2438) 
Nous pouvons considérer maintenant plusieurs cas particuliers: 
1. Cas où # = 1: 
L'équation: 
(1e? 3x? + y? — 2e hx -eh? = 0 (2439) 


se réduit alors trivialement à: 


y° -h = 2Hx| (24.40) 


Il s'agit d'une parabole d'axe orthogonal à D, dont le sommet & est le milieu du segment FE, où 
K est la projection de F sur D (voir la figure plus bas) 


Si nous récrivons la dernière relation sous la forme: 
k 
p° = 2hx+h = 2h (x+3) (2441) 
et redéfinissons l'origine relativement à & par une translation de h/2, le foyer générateur de la parabole 
sera donc en À = (k/ 2,0) et la dernière équation se réduit alors à: 
y =2hx (24.42) 


où h est appelé "paramètre de la parabole" et relativement à &, le foyer sera donné par les 
coordonnées À = (kf 2,0) et la directrice par l'équation D : x = -}j 2. Comme le montre la figure 
ci-dessous, la distance de la directrice à { est donc imposée par les conditions du modèle: 
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ki2 | kl2 


Figure: 24.8 - Représentation des paramètres des coniques pour la parabole 
2. Cas où # “ 1: 


Il s'agit d'une ellipse. Effectivement ce n'est pas évident à voir mais en réarrangeant les termes de 
l'équation: 


(1e? 3x? + y? — 2e hx -eh?=0 (2443) 


nous avons (ceci indépendamment du fait que 4 < 1 ou non): 


2 


— eh 
2 2,2 3 2 
eh 1 eh 1-2 y 
q= dl Î= ) d 1-2? e?h? e?} 


{-e} 1-2? 


Le dernier terme se retrouvant en effet comme suit après développement: 


4:32 2,2 
LA — _ A =]. à }? (24.45) 


1-7 e? 1-6? 


Posons que: 
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est l'origine de l'ellipse en X (donc les x et y doivent maintenant être pris par rapport à cette nouvelle 
origine!!!). L'équation précédente se simplifie et devient (ceci toujours indépendamment du fait que 
e < 1 ou non): 


2 2 2 
a}? ei & b (24.47) 
{-e y 1-2? 


Donc si g < 1, les dénominateurs sont tous deux positifs et nous retrouvons bien l'équation réduite d'une 
ellipse puisque 4 #b. 


Remarque: Il est à noter que cette définition ne peut inclure le cercle parmi les ellipses sinon quoi il 
y a une singularité car les dénominateurs seraient nuls (l'excentricité étant nulle pour le cercle). 


Pour connaître le demi-grand axe de l'ellipse il suffit de poser y = 0. Aïnsi, il nous reste: 


eh a? (24.48) 
der 
d'où le demi-grand axe valant: 
eh F 
a = + 7 = — (2449) 
l-e e 
de la même manière, nous obtenons le demi-petit axe: 
P 
eh 
b=1+ = (24.50) 
l-e 


en posant p = eh étant le "paramètre de l'ellipse" ou "paramètre focal de l'ellipse", nous obtenons: 


P P 
la | = ll = Nes) (24.51) 


dont la première relation sera très utile dans le chapitre d'Astronomie et de Relativité Générale. 


Il est d'usage de noter la distance du centre & de l'ellipse au point F par la lettre c tel que: 


c=f2F (2452) 
Nous avons donc: 
c 
c=taee=t— (2453) 
a 
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Il existe donc deux foyers à l'ellipse à une distance équivalente mais opposée du centre £. Nous 
définissons dés lors l'excentricité d'une ellipse par le rapport: 


c 
g=— (24.54) 
a 


Le lecteur aura aussi remarqué que nous avons pour x = 0 dans: 
(-e?)xt + y? — 22 hx eh = 0 (2455) 


l'ordonnée qui est donc donnée par le produit eh et que celui-ci peut être exprimé par les paramètres de 
l'ellipse sous la forme (même si cela peut paraître bizarre au nivau des unités c'est implicitement 
correct): 


Nous pouvons alors aussi démontrer une relation que nous retrouvons couramment dans les 
formulaires: 


a =b?+c? (24.57) 


C'est-à-dire: 


eh? eh? s à CE , eh? eh (1-e?y+et}? eh? 
-eÿ 1-2 +e"a Nr Are Ge  (-eÿ (24.58) 


L'égalité est donc démontrée et cela nous amène à pouvoir écrire l'excentricité uniquement à partir des 
paramètres classiques de l'ellipse: 


2 2 
ab (24.59) 


Nous pouvons résumer les résultats obtenus par la figure ci-dessous: 
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Figure: 24.9 - Représentation des paramètres des coniques pour une ellipse 


Nous pouvons aussi déterminer où se trouvent les directrices D de l'ellipse par rapport à la bordure de 
celle-ci en utilisant la définition de l'excentricité lorsque y = 0. Nous avons alors: 


e.diM,D\=d(M,F) 


diM,F : : (24.60) 
= Ne 0 ea _ 17e 
eg g 2 


donc le facteur de a est compris entre 0 et l'infini ce qui signifie que les directrices se trouveront (du 
moins dans le cas ici présent où l'excentricité est positive et strictement plus petite que l'unité) toujours 
à l'extérieur de la bordure de l'ellipse et au plus proche tangentes à la bordure (mais dans tous les cas 
elles se trouverontà l'extérieur de l'ellipse). 


Une représentation paramétrique utile et évidente de l'ellipse est: 


x = acos(f) 
. (24.61) 
y =bsin(f) 


Effectivement si nous considérons l'équation cartésienne de l'ellipse démontrée précédemment: 
EE 


+=] (24.62) 
a + 


et en posant R=X/a et S = F}b alors nous obtenons: 
R?+5S2=1 (24.63) 


Si nous nous souvenons du cercle trigonométrique, cette équation admet les solutions À = cos{f) et 
S = sin(£). Il vient alors: 
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R= _ = cos(£) = À = acos(é) 
a 
(24.64) 
FE | 
S=— =san(é) > À = ban) 
a 


Voilà. 


Cependant, il existe une autre forme d'équation de l'ellipse, bien plus importante, que l'on retrouve aussi 
bien en physique classique, astrophysique et physique quantique corpusculaire. 


Rappelons que: 
e-diM,Di=diM,F) 
— (24.65) 
S e:|x+4|=4fx + y 
En coordonnées polaires, cela donne: 


e-diM Di=diM,F) 


(24.66) 
& e' Ir cos 8 + À| =} 


Donc: 
r =efrcos£ -h) our =-e(rcos@ —-h) (24.67) 


après mise en évidence: 


eh eh 


—— OÙ 7, =—— (24.68) 
l-ecos8 l+ecos 8 


“ES 
Nous obtenons deux équations différentes, mais il s'agit en fait de la même courbe qui décrit le rayon de 
l'ellipse depuis un de ses deux foyers. 
Nous remarquerons en effet que: 
n(9+7)=-7(8) (24.69) 


Etant donné que p = zh est défini comme le paramètre de la conique, l'équation polaire de l'ellipse 
s'écrit: 


p=—? (47) 


l+ecosg 


Remarquons les trois valeurs particulières: 
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8 = . Dr = p=eh: paramètre de l'elipse 


P [1 Le [1 
8=0—7r =——:"péncentre 24.71 
M TT ss 
:"apocentre" 


Le péricentre est plus connu sous le nom de "périgée" en astronomie et de même que l'apocentre qui est 
plus connu sous le nom "d'apogée" (toujours dans le domaine de l'astronomie). 


Dans le cas général, D peut faire un angle quelconque avec l'axe des angles polaires, et l'équation 
générale est alors: 


P 


FA | (2472) 
1+ecos(g -8) 


3. Cas où # > 1: 


Il s'agit d'une hyperbole (même raisonnement que l'ellipse en commençant par considérer n'importe 
quelle valeur que & > 1 ou non): 


. eh 
2, Ÿ 2,2 _ 2 2 
ñ e°h 1-e y — 
1-gle- Fe 0 + =] (24.73) 
| % ” 1-6? e°h° eh? 
{i-e?}° 1-2? 
Nous posons donc à nouveau que: 
2 
F=— “ (24.74) 
1-2? 


est l'origine de l'hyperbole. L'équation précédente se simplifie et devient (donc jusque là, nous nous 
retrouvons avec exactement la même expression que pour l'ellipse): 


x . y? . 
eh? e?h? (24.75) 
{-eÿ 1-6 


Mais comme & > 1 le dénominateur du deuxième terme sera négatif et donc nous nous retrouvons bien 
avec l'équation réduit d'une hyperbole. 


Nous avons pour demi-grand axe et demi-petit axe (raisonnement identique à l'ellipse): 


P 


—— (24,76) 
1 €? 


P 
el= x él- 


et: 


Page: 1462/4839 


[v3.0 - 2013] 


et la figure correspondante: 


Figure: 24.10 - Représentation des paramètres des coniques pour une hyperbole 


où nous avons représenté les deux asymptotes en utilisant une technique simple de passage à la limite: 


2 2 2 2 

x y C 3j. à E 2 b . 
—-—=1S y= fx -b* = [x =+-x=A (2478) 
a à d a° k+40 | 4? a 


Si l'hyperbole est équilatère, il est alors évident que les deux asymptotes sont perpendiculairs puisque 
leur pente est alors respectivement de +1 et de -1. Dans le cas équilatère, nous avons aussi l'excentricité 
qui est immédiatement donnée par: 


Pr. 3,3 
PR RES LA 7 (24.79) 
[#4 [#4 


Nous pouvons aussi déterminer où se trouve les directrices D des hyperboles par rapport à leur bordure 
en utilisant la définition de l'excentricité lorsque y = 0 en procédant exactement de même que pour 


l'ellipse. Nous avons alors: 


e-diM,Di\=diM Fi 


diM.F : _ (480) 
TN D) En A a _ 271 
eg g eg 
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donc le facteur de a est compris entre 0 et tends vers 1 quand e est très grand ce qui signifie que les 
directrices se trouveront (du moins dans le cas ici présent où l'excentricité est positive et strictement 
plus petite que l'unité) soit tangentesà l'hyperbole soit au plus proche de l'axe des ordonnées (mais dans 
tous les cas elles se trouveront donc entre les deux hyperboles). 


2. PARAMÉTRISATIONS 


Pour certaines des formes présentées ci-dessous, il est possible de choisir un autre système de 
coordonnées que les coordonnées cartésiennes tel que par exemple les coordonnées cylindriques ou 
sphériques qui sont dans certains cas beaucoup plus simples à mettre en place. Nous tacherons dans la 
mesure du possible de présenter les plus importantes. 


2.1. ÉQUATION DU PLAN 


Soit un plan P dont nous connaissons un vecteur normal et unitaire #{&,b,c) mais pas l'équation et 
A(X4,Y4:Z4) Un point de P. 


Pour qu'un point M de coordonnées (x, y, z) appartienne au plan P il faut et il suffit que les vecteurs 
a et * soient orthogonaux. Donc soit le point donné par le vecteur 477 étant de coordonnées: 


F2; 


1-2 
AM =|y-y4| (2481) 


Si 4yf est perpendiculaire à # alors le produit scalaire doit être nul tel que: 


X=2; a 
Y-Jalolb|=a(x-x,)+b(y-y,)+c(z-z,)=0 (24.82) 
g2; Ft 

Ce qui s'écrit aussi: 


ax by +ez + (-ax, — by, — cz) = 0 
| 
ä 


(24.83) 


tel que nous obtenions l'équation cartésienne générale du plan: 


ax tby+cz+d=Û0| (24.84) 


Cette équation où (&,à,c) * (0,0, 0) qui vérifie que les coordonnées d'un point f(x, y,z) quelconque 
du plan P appartienne à ce plan est donc appelée "équation cartésienne du plan P". 


Si nous écrivons l'équation avec les cosinus directeurs de # (cf. chapitre de Calcul Vectoriel), nous 
avons dès lors aussi: 


cos(8,)x + cos(@, }y + cos(@,)z +d =0 (24.85) 
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Remarque: Pour obtenir un cube dans l'espace, il suffit d'avoir six plans délimités par des conditions 


telles que x £..,y £...,z £.…. 


Il est relativement aisé de passé au cas par cas de l'équation cartésienne du plan à l'équation 
paramétrique du plan. Nous pouvons (avec les précautions d'usage.) reprendre l'équation: 


ax tby+cz+d=0 (2486) 
et la réécrire sous la forme suivante: 


z= 2 TR ion 


€ 


et dès lors, l'équation paramétrique du plan dans l'espace de dimension 3, s'écrira: 


x x 
Y|= y (24.88) 
: —d-— by-ax 

€ 


Exemple: 
Avec Maple 4.00b: 


>a:=3:b:=-2:c:=1:d:=5: 
>plot3d([x,y,(-d-b*y+a*x)/c],x=-2..2,y=-2..2, orientation=[-87,81],style- PATCH, 
axes=- NORMAL ); 


Figure: 24.11 - Représentation paramétrique d'un plan avec Maple 4.00b 
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2.2. ÉQUATION D'UNE DROITE 


Comme nous l'avons vu en analyse fonctionnelle, une droite dans le plan peut être décrite par la 
fonction: 


y=f(x)=axt+b (2489) 


L'équation cartésienne généralisée de la droite est alors simplement donnée par: 


axt By+y=Û0| (2490) 


Effectivement, en simplifiant nous retrouvons "l'équation cartésienne réduite": 


(24.91) 


“| R 
ET 
l 
= 
Il 
pal 
Eu 
+ 
SG 
ee, 
CG 


ml IR 


Définition: Nous appelons "vecteur directeur" d'une droite D , tout vecteur non nul de même direction 
que la droite. 


Montrons maintenant les deux petits théorèmes sympathiques suivants: 
T1. Si une droite a pour équation y = ax + à alors le vecteur: 
V(1,&) (24.92) 
est directeur de cette droite. 
T2. Si une droite a pour équation 4x +by +e = Ô alors le vecteur: 
V(L-a/b) (24.93) 
est directeur de cette droite. 
Démonstrations: 


DM1. Soient D : 4x+ à et À, B deux points de cette droite pris tels que A{0, à}, B(1,& +b). Comme À, 
B sont deux points de D alors ‘48 est un vecteur directeur de D alors: 


— 1 () die 
AB=B-A- = = =ÿ (24.94) 
at b a 


Un petit corollaire intéressant au passage qui a une application en physique!: 


Si une droite D, a un vecteur directeur valant: 
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, =| 1/| (24.96) 


alors leur produit scalaire (cf. chapitre de Calcul Vectoriel) est nul, ce qui montre que deux droites dont 
la multiplication des pentes (deuxième coordonnée du vecteur directeur) vaut -1 sont perpendiculaires! 


DM2. Soit D: ax +by +e = 0 donc y = -iafbix -ci{&b alors le vecteur v{1, -a /b) est un vecteur 
directeur de D ainsi que tout vecteur v'= &,&e IR. Ainsi, il existe une infinité de manières de définir 


la même droite, puisque la droite est composée d'une infinité de points (qui peuvent tous servir de point 
d'ancrage) et qu'il existe une infinité de multiples du vecteur directeur. 


OIC.Q.F.D. 


Souvent, nous recherchons la distance entre une droite et un point externe à celle-ci. Ainsi, considérons 
la figure suivante: 


Figure: 24.12 - Représentation de la recherche de la distance d'un point à une droite 


avec H la projection orthogonale de A sur la droite d, P un point arbitraire de d'et ; un vecteur 
orthogonal (normal) à d. 


Nous avons (cf. chapitre de Calcul Vectoriel): 


+ 


A on =(PH + HAloï = PH on + HAoñ = HAoñ =|HA||#cos « - +]FA||*| (24.97) 
car æ = 0 ou & = x. Ainsi: 


[PAoñ 


- [F4 


of#] = 6(4,d)of%] (24.98) 


où ä représente la distance (nous ne pouvons noter la distance avec la lettre d comme nous l'avons fait 
au début de ce chapitre, sinon il y aurait confusion avec le d choisi pour représenter la droite dans le 


présent développement). 


[v3.0 - 2013] 


Nous obtenons donc la relation: 


[PA o À 
(2 


Considérons maintenant le point Afx,,»,) et la droite d''ax +by +e =0. 


ô(A,d) = (24.99) 


Choisissons un point PE d : P(0,-c/b} ainsi qu'un vecteur #, normal à 4 : # (] (rappelons que 


v{1,-a/b) est vecteur directeur): 


Ainsi, en appliquant la relation précédente nous avons: 


— Aÿ 0 & 70 a: € 
Aox = | }- € 4 ]- € | = we+(n+5)e (24.100) 
0 T3 b Yo b b 


et donc: 


[xoa + (M +c{b)b| L lex + by, +cl 


Si nous considérons maintenant deux plans non parallèles de l'espace, leur intersection est une droite. 
Soient deux plans d'équations respectives: 


ô(A,d) = (24.101) 


P=axtby+tceztd=0 


(24.102) 
P'=a'xtb'y+tc'ztd'=0 


et D leur droite d'intersection. 


Un point (x, y,z) de l'espace appartient à la droite D si et seulement si le point M satisfait le système 
d'équations: 


ax tbhy+czt+d=0 
(24.103) 
a'xtb'ytc'ztd'=0 


Remarque: Alors que dans le plan une droite est caractérisée par une équation du type 

ax +by +c=0 (cf. chapitre d'Analyse Fonctionnelle), dans l'espace, une seule équation de la forme 
ax + by +ez + d = 0 caractérise un plan. Pour caractériser une droite en dehors des plans des axes, 
il est nécessaire (équation paramétrique mise à part) d'avoir deux équations. 


Il est relativement trivial (mais nous allons quand même le démontrer) que l'équation paramétrique 
d'une droite est un système d'équations du type: 
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x=d'itée 
y=b'£+8 (24.104) 


Z'æC'LTY 


Ainsi, chaque composante croit linéairement par rapport à la même variable à une constante et un 
facteur près. Ceci s'écrit aussi sous forme vectorielle (plus traditionnelle): 


x(£) a 4 
6 |=|b|£+| 81 (24.105) 
z(é) c y 


Le vecteur (&,b,c) est appelé "vecteur directeur". 


Démonstration: Nous avons donc le système d'équations (deux équations à trois inconnues, ainsi une 
inconnue sera indéterminée): 


ax tby+czt+d=0 


(24.106) 
a'xtb'ytc'ztd'=0 


Éliminons une des variables (commençons arbitrairement par z): 


G@-a'a)x+(b-b'a)y+{é-c'az+t(d-d'a=0 
—É 


où æ =cÎc' d'où: 


(a-a'æ@x+(b-b'a)y+(d-d'&=0 

= 

_G'æ-b)  ,(d'a-d) 

(a—- aa) (aa ,-B'a-b){@'ara) ,(d'a-d)|, (d'a-d) 
_@'a-a) , (d'a-d) (a-ca | (b-ab  (b-ab |] (a-a' 
-ab)  (b-ab) 


(24.108) 


à 


donc (c'est un peu bête à écrire mais bon...): 


2) @'a-a) , @'a-ë) (d'a-d) (d'a-d) _ 
(a- aa (b- ab @-ca (b-ab) (a-a (24.109) 
i 


st 
De manière similaire avec y tel $ = à/b" nous avons: 
(a—-a'8B)x+(c-c'S#iz+(d-d'B)=0 


(a'8-ai we 2) (24.110) 


DIE —— x Ts 
(e—c'f) (c—c'f) 


d'où: 
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{c-8c) { -#c) 


(24.111) 


Finalement nous avons: 


ZA "2x 
@'a-a) (d'a-d (a'æ a) @'a-a) 
. = ab" PET TS (b-ab ei -ab ab |£* E-e) -ab" (24.112) 


Ê-d) 
G@'B-a)., @'B-d) Re D 
oo ou e-ge | [6 


Le vecteur directeur et le vecteur d'ordonnée sont donc des constantes. Ce qui nous permet d'écrire de 
manière plus générale: 


x(£) a æ 
Y@|=|b16+| 81 (24113) 
z@)} ce y 


OIC.Q.F.D. 


Remarques: 


R1. L'équation d'une droite est presque ce qu'il y a de plus important en synthèse d'images 3D car à 
partir de ces dernières nous pouvons construire des polygones et assembler ces derniers pour 
construire des formes tridimensionnelles plus complexes. 


R2. Pour savoir si une droite est perpendiculaire à un plan il faut déterminer au moins deux droites 
sécantes dans ce même plan et effectuer le produit vectoriel de leur vecteur directeur et ensuite 
calculer le produit scalaire entre le résultat du produit vectoriel et la première droite dont nous 
cherchons l'orthogonalité. Effectivement, une seule droite du plan ne permet pas de déterminer 
l'orientation de ce dernier; il en faut au moins deux. 
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2.3. ÉQUATION D'UN CÔNE 


Considérons un cône de révolution de sommet O avec un cercle de centre (0,0,h) (où h est un nombre 
réel positif ) et de rayon R : 


Figure: 24.13 - Représentation d'un cône 


Une représentation paramétrique du cercle à la hauteur h est: 


=r-Ccosé 
r-siné£é (24.114) 
= À 


N x 
Il 


où t appartient à l'intervalle [—x,x]. 


Par extension, une représentation paramétrique de ce cône est : 


x(£,#) &-r-cosé 
vGk)|=|k£&-r-sims | (24.115) 
z(X) k.h 

En d'autres termes, le cercle se propage linéaire selon tous les directions. 

Exemple: 

Avec Maple 4.00b: 


>r:=1:h:=4: 
>plot3d([k*r*cos(t),k*r*sin(t),k*h],k=0..10,t-0..2*Pi,orientation-[50,60],style- PATCH, 


axes=- NORMAL ); 
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Figure: 24.14 - Représentation paramétrique d'un cône avec Maple 4.00b 


On peut en déduire une équation cartésienne de ce cône: 
Z@Ÿ 
X(E)+F(GY = k2.r2= (22) r? (24.116) 


en posant &æ= r { k : 
X2+Y2-Zltan?œ=0 (24.117 


c'est l'équation cartésienne d'un cône dans l'espace que nous retrouverons en relativité restreinte lors de 
notre étude des cônes de lumière. 


2.4. ÉQUATION D'UNE SPHÈRE 


Considérons le repère orthonormé (7, ÿ.Æ}, soit S la sphère de centre &(a,b,c) et de rayon r : 


Figure: 24.15 - Représentation d'une sphère 


M (x, y,z) appartient à la sphère S de centre & et de rayon r si et seulement si: 


QM =r (24.118) 
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c'est-à-dire en appliquant Pythagore : 


OM == (ra) +8) +0) (419 


D'où "l'équation cartésienne de la sphère" dans le repère (7, ÿ,£): 


Ga) +=) +@-cÿ = ri] @4120) 


Il existe une autre manière de décrire la sphère en utilisant l'équation paramétrique. Effectivement, 
nous avons vu dans le chapitre de Calcul Vectoriel que le passage des coordonnées cartésiennes aux 
coordonnées sphériques est donné par les coordonnées curvilignes: 


x =rsin cos #, y = rsin sin #,z =rcos£@ (24.121) 


Ainsi, nous avons bien: 


x + y? +27 = 7% sin? 8cos° #+r° sin? sin? #+r° cos? 8 


= rl sin? 8lcos? #+ sin? #| +r°? cos? 89 = r° sin? 9 +r°? cos 9 = r°? {sin +cos* 8) (24.122) 


Donc l'équation paramétrique de la sphère est bien: 

x(8, # r-sin cos # 

JC8,#) |=|r-sin dsin # 

z(8) r-cos 8 
Nous retrouvons donc bien l'équation cartésienne d'une sphère à une constante de translation près. 
Exemple: 


Avec Maple 4.00b une sphère de rayon unité: 


>plot3d([sin(theta)*cos(phi),sin(theta)*sin(phi),cos(theta)],theta=0..Pi,phi=-Pi..Pi, 
scaling=-CONSTRAINED,orientation=[50,60],style-PATCH,axes- NORMAL ); 
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Figure: 24.16 - Représentation paramétrique d'une sphère avec Maple 4.00b 


2.5. ÉQUATION D'UN ELLIPSOÏDE 


Nous avons vu lors de notre étude des coniques que l'équation d'une ellipse dans le plan était donnée 
par: 


" Le =] (24.123) 
b 


avec a, b étant les deux axes de l'ellipse (le petit et le grand). 


Ainsi, sans démonstration rigoureuse, nous pouvons vérifier à la main ou à l'aide des ordinateurs que 
l'équation cartésienne: 


2 2 
cs PORT (24.124) 
2 b? e? 


& 


est un ellipsoïde: 


Figure: 24.17 - Représentation d'un ellipsoïde 
Cependant, il existe une autre manière de décrire l'ellipsoïde en utilisant les coordonnées curvilignes: 


x =a' cos @" cos À, y =b'cos 8" sin À,z =c'sain 8 (24.125) 
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Donc l'équation paramétrique de l'ellipsoïde sera: 


x(8, À) a-cos 8cos À 
y(8,4)|=|b.cos8sin 4 | (24.126) 
z(8) c-sin 


Nous pouvons constater qu'il s'agit simplement de l'équation paramétrique de la sphère mais avec des 
rayons différents suivant les axes du repère choisi. 

Exemple: 

Avec Maple 4.00b: 

>a:=100:b:=2:c:=20: 


>plot3d([a*cos(theta)*cos(lambda),b*cos(theta)*sin(lambda),c*sin(theta)],lambda=0..Pi, 
theta=-Pi..Pi,orientation=[50,60],style-PATCH,axes- NORMAL ); 


Figure: 24.18 - Représentation paramétrique d'un ellipsoïde avec Maple 4.00b 


Nous avons donc: 


x = a? cos? 8: cos? À,y° = b?: cos? 8: sin? À,z°? =c? ‘sin? 8 (24.127) 


d'où: 
F Va z° 2 2 2 2 2 2 2 2 2 
+ +7 "cos &d'cos" A+cos" d'in À+sin 9 = cos" icos” A+ain Ai+sin 89 
a c 
Re . 29 
= cos 8 +ain°49=1 
(24.128) 
Finalement: 
2 2 
LORE EP AE (24.129) 
dé à c 
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2.6. ÉQUATION D'UN CYLINDRE 


Il va sans dire que l'équation paramétrique d'un cylindre de rayon r est donnée par: 


x =rcos@ 
y=rsing (24.130) 


Z=Z 
Soit: 

x(#) r-cos ÿ 

vÉ) =|r.sn Ÿ (24.131) 


Z Z 


Nous voyons bien que les composantes x, y satisfont l'équation cartésienne d'un cercle puisque: 
x +y=r] (24132) 

Exemple: 

Avec Maple 4.00b un cylindre de rayon unité: 


>plot3d([cos(phi),sin(phi),zl,phi=-Pi..Pi,z=0..2,orientation-[50,60],style- PATCH, 
axes=- NORMAL ); 


5227 
nn En 
= 
= ; 


Figure: 24.19 - Représentation paramétrique d'un cylindre avec Maple 4.00b 


Au même titre l'équation paramétrique d'un cylindre à base elliptique est donnée par: 


X=ACOsŸ 
Y=nsing (24133) 


Z TZ 
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qui vérifie aussi l'équation paramétrique d'une ellipse dans le plan: 


2 2 

X 

+2 21) 139 
2 2 

"4 


2.7. SURFACES DE RÉVOLUTION 


De manière plus générale de nombreuses surfaces (dont certaines que nous avons vues précédemment) 
peuvent être décrites par révolution d'une forme primaire de dimension inférieure et ensuite par 
rotation. 


Définition: Une "surface de révolution" est une surface obtenue en faisant tourner une courbe plane 
(par exemple z = f{x)) autour de l'axe OZ. Ainsi, nous passons alors d'un plan de jp? a un repère de 
=, l'axe OX engendre dès lors un plan devenu YOZ. 


Prenons trois exemples classiques (parmi l'infini): 
Exemples: 
ET. Soit la parabole particulière d'équation qui tourne autour de l'axe OZ: 
z=x/2p (24.135) 
avec pour rappel: 
p=e'h 


Nous avons bien évidemment (en coupant le paraboloïde par un plan ce qui donne un cercle de rayon r) 
la relation: 


z=r"{2p (24.136) 


dite "équation cylindrique". Or, nous avons aussi par simple application de Pythagore dans le cercle en 
question: 


r=2+y? (24137) 
d'où: 
x? +y*=2pz (24.138) 
Nous en déduisons "l'équation cartésienne du paraboloïde de révolution": 


(ir) (24.139) 
2\P P 


Nous construisons l'équation paramétrique du paraboloïde exactement de la même manière que le cône, 
mais à la différence que l'évolution selon l'axe OZ ne se fera non pas linéairement par rapport au 
paramétrage k mais au carré de ce dernier. Aïnsi, nous aurons: 
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E cost 
x(é,&) k-r-cost N 
JE,&)|=|£-r.siné |= dE (24.140) 
2 
z@ ] (e2x ; 
&°.h 


Ce qui donnera avec Maple 4.00b: 


>p:=1l:h:=1: 
>plot3d([k*1/(2*p)*cos(t),k*1/(2*p)*sin(t),k12*h],k=0..10,t-0..2*Pi,orientation=[ 50,60] 
,Style=PATCH,axes=- NORMAL ); 


Figure: 24,20 - Représentation paramétrique d'un paraboloïde avec Maple 4.00b 
E2. Soit la droite de pente unité: 
Z=X (24.141) 
que nous faisons tourner autour de Oz. Nous avons: 
z=x+y (24.142) 
ce qui nous donne: 
x? +y-zl=0 (24.143) 


Définition: Toute surface engendrée par une droite est une "surface réglée". 


Prenons l'exemple important (cheminée de centrale nucléaire, engrenages, etc.) qu'est l'hyperboloïde à 
une nappe d'équation: 
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2 2 
F4 2 2) 


(24.144) 


& 
Ce 
QG 


€ 
Pour simplifier l'exemple prenons 4 = = « = 1. Nous avons donc: 
x+y-zi=1— x 77 =1- y (24.145) 


ce qui s'écrit aussi comme le produit de l'équation de deux droites tel que: 


(x 2)(x +2) = (1 y) + y) 
î 
(x-zik(xt+z)=k(-»fl+y)keR 
{ (24.146) 


a, 
D:x-z=Kk(1-y» 
D2:1+y=£k(x +2) 
Ainsi, ces deux droites (de pentes opposées) appartiennent à la nappe et tout point appartenant à une de 


ces deux droites y est contenu. Les figures ci-dessous montrent bien qu'au fait, tout point appartient à 
ces deux droites. 


DRE 
CREME 
POUR 


Fes a 
ù | 
\ 


AN 


Figure: 24.21 - Construction d'une surface de révolution avec des droites 


On pourrait ceci dit très bien décrire par des cercles tels que: 


x +p 2 =1— x +3 = (1424 )=7 (24147) 


où r = f(z). 
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Figure: 24.22 - Construction d'une surface de révolution avec des cercles 
E3.Nous savons que pour générer un cercle dans le plan XOY, une équation paramétrique possible est: 


x=rcos # 


| (24.148) 
y=rsin ÿ 


Pour décaler ce cercle vers la droite (dans la direction des x positifs), nous n'aurons qu'à ajouter une 
constante strictement positive au terme x: 


x=at+rcos 


y=rsin ÿ 


(24.149) 


Dans l'espace, si nous décidons de dessiner un cercle sur la plan XOZ, nous aurons alors: 


x=at+rcos 
(24.150) 


z=rsin@ 
Qu'il est d'usage de noter sous la forme suivante lorsqu'il s'agit de l'étude du tore: 


x=R+rcos $ 
(24.151) 


z=rsin # 


Si nous voulons générer un tore, il faudra faire tourner ce cercle autour de l'axe Z en lui faisant suivre à 
lui-même un cercle suivante le plan XOY. Nous avons alors "l'équation paramétrique du tore de 
révolution": 


x($,8) (R+rcosicos 8 
Jt#,8)|=|(R+rcos#isin 8 (24.152) 
z(# r sin # 
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Ce qui donne avec Maple 4.00b: 


>r:=1:R:=4: 

>plot3d([(R+r*cos(phi))*cos(theta),(R+r*cos(phi))*sin(theta), 1*sin(phi)], 
theta=-Pi..Pi,phi=-Pi..Pi,scaling=-CONSTRAINED,orientation-[50,60], 
style PATCH, ,axes=- NORMAL ); 


Figure: 24.23 - Représentation paramétrique d'un tore avec Maple 4.00b 


Page: 1481/4839 


[v3.0 - 2013] 


Notes personnelles: 
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25. GÉOMÉTRIE DIFFÉRENTIELLE 


Come nous l'avons déjà mentionné dans le chapitre de Géométrie Non-Euclidienne, la géométrie 


différentielle est la branche de la géométrie qui vise à étudier les propriétés locales (au voisinage d'un 
point) et intrinsèques des courbes et des surfaces non-euclidiennes (comme une généralisation des surfaces 
euclidiennes!). 


La géométrie différentielle tient son nom au fait qu'elle est née de la possibilité d'une interprétation 
cinématique que le calcul infinitésimal apporte à l'étude des courbes. Les points que nous aborderons ici 
serviront aussi bien dans l'étude de la mécanique classique que de l'analyse complexe appliquée à de 
nombreux domaines de l'étude des champs. 


Remarque: Avant de nous attaquer à la manière très formelle et abstraite d'aborder la géométrie 
différentielle avec les outils de la topologie (méthode habituelle aux mathématiciens) nous avons 
choisi dans un premier temps de présenter les éléments essentiels de manière simple et agréable tel 
que cela se fait dans les écoles d'ingénieurs. Les puristes nous excuseront donc au cas où en attendant 
mieux. 


1. COURBES PARAMÉTRÉES 


Définition: Nous assimilerons "l'espace physique" à IR° et le supposerons muni d'un repère 
R=(0,7,j,#) et nous noterons B la base (7, j,#) 


Soient un ensemble 7 € IR et une fonction | = f(7) telle que: 


1—=kKR 


” 1 JG)=- M 


Joe, (25.1) 


Remarques: 
R1. Si fest continue, alors T° est une courbe de l'espace appelée "courbe d'un seul tenant". 


R2. Une parabole, une sinusoïde sont des courbes appelées "courbes planes". Une ellipse, un cercle 
sont appelés des "courbes planes fermées". Pour ces exemples, tous les points des courbes considérées 
sont situés dans un même plan. Inversement, une courbe est appelée "courbe gauche" (gauchir — 
dévier, tordre) s'il n'en est pas ainsi. 


Choisissons £, € Z et posons À, = f (4) que nous noterons par abus de langage Wf(£,) nous pouvons 
alors énoncer la définition suivante: le couple (f, 1) où f est une fonction continue est appelé "arc 
paramétré". Test appelée le "support" de (f, D et £, est une "origine" de (f, D. 
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Remarques: 
R1. Abusivement, nous disons aussi que (f, 1) est un "paramétrage" de T. 


R2. Il est facile de définir d'autres arcs paramétrés admettant aussi comme support. Pour ce faire, 1l 
suffit de se donner une fonction ® bijective de I vers J CR et telle que ft) = f(@"(x)). 


Avant de continuer, rappelons qu'en géométrie différentielle, "l'abscisse curviligne" est une sorte de 
variante algébrique de la longueur d'un arc (c'est donc l'analogue, sur une courbe, de l'abscisse sur une 
droite orientée). 
Considérons maintenant l'abscisse curviligne (cf. chapitre de Calcul Tensoriel)}: 
2 if 
ds" = gjdu du* (25.2) 
d lidi d 3) l'absci ili écrit alors: 
nous savons que dans un espace euclidien canonique (dans IR*) l'abscisse curviligne s'écrit alors: 
2 à, 3 
ds” = à,du duŸ (253) 
avec à, j = 1,2,3 et comme nous avons d; = 0,5 “ j, il reste: 
ds? = du'du + du?du? + dudu = (du'}? + (du? +(du°y? (254) 


Dans le système cartésien: 


il vient donc que: 


ds? = dx? + dy? +dz? | (256) 


qui est donc l'élément différentiel linéaire d'un espace euclidien (le plus court chemin ou encore la 
"géodésique" ou encore " l'abscisse curviligne différentielle") que nous avons déjà rencontré à maintes 
reprises dans différents chapitres du site. Ce n'est donc rien de nouveau ni de surprenant! 


Si nous nous restreignons au plan, l'abscisse curviligne différentielle d'une courbe plane s'écrit alors: 


ds? = dx? + dy? (25.7) 


Nous savons déjà comment utiliser cette dernière équation (nous en avons fait usage dans le chapitre de 
Mécanique Analytique). Mais comme un rappel n'est jamais mauvais, faisons des exemples avec une 
droite, une parabole et un demi-cercle (le choix n'est pas innocent...). 


Exemples: 
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El. Considérons l'équation générale d'une droite dans le plan (ce n'est pas une courbe plane pour rappel 
mais une droite plane): 


y=ax+b (258) 
Il vient alors immédiatement: 
dy =adx (259) 


Dès lors: 
ds? = dr? +dy° = dx? + (adx ÿ =|1+4? \dr (25.10) 


E2. Considérons l'équation générale d'une parabole dans le plan: 


Il vient alors immédiatement: 


Dès lors: 
ds? = dx? + dy? = dx? + (2axdxŸ = (1+4a°x° | dé (25.13) 


E3. Considérons le réarrangement de l'équation générale d'un cercle de rayon R dans le plan (cf chapitre 
de Géométrie Analytique): 


(25.14) 
Il vient alors immédiatement: 
2 
b 
dy = — —————.——— 14% 
x2 (25.15) 
& BR b— 
a 
Dès lors: 
2 
2 2 2 2 b? b? 2:32 
ds = dx + dy" = dx" +] xdx | =|1+ x dx Cslo) 


2 3p_ 22 
a? ES Fe) 
a? 
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Remarquons qu'en faisant une approximation de Maclaurin (lorsque x vaut donc zéro, ce qui correspond à 
l'étude du pôle du cercle), nous avons (cf chapitre de Suites Et Séries): 


Suite à la demande d'un lecteur voici les détails du développement du résultat précédent. Rappelons 
d'abord la série de Taylor (cf. chapitre Suites Et Séries): 


JE fi + fac \ÜX— Xp af" (x — % Fa (25.18) 
Si nous posons x = Ü, nous obtenons la série de Maclaurin: 
_ Dpt À Ars à 
JOs f(0)+ OIx+S NY (0)x" +. (25.19) 


Donc il vient en procédant en deux étapes: 
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2 2 2 
1 4 x 1 1 à x 2 
\R-0 fr-0)42€ br x-m)+2 2 Br | (r-x) 
| ä) VI a " 2 dx? 2 
X=X5 X=X9 
b?x 
2 7 2 
= [af la-xe : CRETE | (x-%Ÿ 
2 x 
b a , ou 
X=X9 
_ b?x b?x 
11, 1 14 a 
= RU |R-—Ix-%) + (x—-4%)+-— (x—-%) 
ï ; : 2 dx : . 
B2TR " B|R-— 
X=X9 
2 
2b2xp -? | 
2 
= a[a-#)s % | + = (= )+e = Er (x-%) 
a? 
X=X9 
2b2x9 2h? 
2 à + 
= [a-# ls 0 je (x 0 +3 + = xp.….|[(X—%) 
(4 & 
p2|R- 70 B2| R- 70 
a? a? 
(25.20) 


En prenant x = 0: 
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1 
VE B'R+O-x+— 


(25.21) 


1 b? 
2 2/2 


Il vient alors immédiatement: 


= Vr2r - 


Dès lors: 


2 
| . 2 
&R aŸR 


Nous voyons alors que l'abscisse curviligne du cercle dans le plan devient celle d'une parabole lorsque 


nous faisons un développement en série de Maclaurin de l'équation du cercle au pôle. 


Nous pourrions faire de même avec une hyperbole ou une ellipse et nous retrouver avec la même forme 
d'abscisse curviligne différentielle, généralement notée par tradition: 


ds? = dx? + dy? = (1+42x7 dx? | 0524) 


où k, est appelé "paramètre de la parabole osculatrice". 


Ces exemples étant clos, continuons un peu avec la théorie. Nous pouvons bien évidemment réécrire notre 
abscisse curviligne différentielle en divisant par dt des deux côtés de l'égalité tel que: 


Exemple: 
Voyons une application de l'abscisse curviligne différentielle paramétrée avec une hélice (les exemples 


sont jolis en géométrie différentielle et valent donc la peine d'être vus...) qui est un exemple typique de 
courbe gauche: 


Soient {£,r,#)e R°,£ > O,r > 0,# > O et la fonction: 
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(25.26) 


$ [0,£]— R° 
1 f(=M 


avec f(x, y,z) et les coordonnées paramétriques: 


x =rcos(f) 
y=rsin(é) (2527) 
z=ht 


Nous avons alors avec Maple 4.00b en prenant r et h comme étant égaux à l'unité: 


>spacecurve([cos(t),sin(t),t,t--4*P1..4*Pi,numpoints=1000 |); 


Figure: 25.1 - Représentation paramétrique d'une hélice avec Maple 4.00b 


La fonction f est un arc paramétré dont le support est appelé une "hélice", r en est le rayon et h le pas. En 
prenant #, = Ü comme origine, l'abscisse curviligne de cette hélice (un morceau) est donnée par: 


2 2 2 2 
cd = us + a + æ = 7? sin? (9) +r° cos (6) +h° =r? +4? (2528) 
dt dt dt dt 


Donc: 


et alors: 
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s= Jr? +#?£ (2530) 
2. ISOCLINES 


Voyons maintenant un point très important en mathématiques mais en plus dans l'ingénierie médicale, 
astrophysique, météorologie (parmi encore beaucoup d'autres domaines) que sont les isoclines. 


Avant d'aborder le sujet sous forme mathématique, nous proposons au lecteur d'ouvrir Matlab 5.0.0.473 
(nous avons déjà fait à peu près le même exemple avec Maple 4.00b dans le chapitre d'Analyse 
Fonctionnelle) et d'y écrire: 


EDU» [xx,yy,z]-peaks; 
EDU» figure(1);mesh(xx,yy,z);title('peaks') 


Figure: 25.2 - Tracé initial dans Matlab 5.0.0.473 


ensuite pour des raisons esthétiques, d'écrire: 


EDU» figure(2);surf(xx,yy,z)ititle('surf) 
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Figure: 25.3 - Amélioration du gradient de couleurs dans Matlab 5.0.0.473 


Ensuite nous aimerions que Matlab nous trace quelques courbes de niveau (les points où la valeur de la 
fonction f{(x.y) est constante), appelées par les matheux des "isoclines" ou "courbes d'iso-niveau". Il faut 
alors écrire: 


EDU» figure(3);contour3(xx,yy,z)ititle('contour') 


contour 
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Figure: 17.4 - Affichage des isoclines de la fonction dans Matlab 5.0.0.473 
Nous allons ensuite lui demander de les projeter sur le plan X,Y. 
Ce qui donne: 


EDU» figure(3);contour3(xx,yy,z)ititle('contour') 
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Figure: 25.5 - Projection des isoclines sur un plan dans Matlab 5.0.0.473 


Et ce sont ces courbes qui vont nous intéresser. Nous souhaiterions déterminer les équations dans le plan 
de celles-ci sous forme explicite. Mais avant cela amusons-nous avec Matlab en écrivant encore: 


EDU» figure(4);pcolor(xx,yy,z)ititle('gradient') 


Figure: 25.6 - Représentation plane des isoclines avec gradients colorés dans Matlab 5.0.0.473 
mais nous pouvons faire encore mieux en enlevant la grille avec la commande: 


EDU» shading interp 
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Figure: 25.7 - En retirant la grille... 
Ensuite, sans fermer le graphique ci-dessus créé par Matlab 5.0.0.473 rajoutez maintenant la ligne: 


EDU» hold on 
EDU» contour(xx,yy,z,'k') 


Figure: 25.8 - Association isoclines projetées avec gradients de couleurs 


Considérons pour déterminer l'équation des isoclines la fonction f(x,y) de IR* et que nous imposerons 
R°-différentiable. 


La relation: 


fRy)=c" (0531 
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définit une courbe I” plane appelée "isocline". C'est une courbe telle que, lorsque x varie, y ne varie donc 
pas n'importe comment mais précisément de telle sorte que freste constante. 


Nous avons vu dans le chapitre de Calcul Différentiel Et Intégral que la différentielle de f, pour des 
variations infinitésimales quelconques de x et y, est: 


Maintenant, si nous voulons que quand x varie de dx, la valeur de la fonction f ne change pas, il faut que 
dy ne soit pas n'importe quoi mais tel que la variation df soit nulle. Autrement dit: 


df E gx + Lay = 0 (25.33) 
6) 6, 


X 


le long de I”. Mais cette équation ne sert à rien en tant que telle, mais elle nous fixe le rapport de la 
dérivée de l'isocline dans le plan tel que: 


of 
dy __&x 
rs F2 (25.34) 
dy 


ce qui nous donne la pente de la tangente à I” et donc après par intégration, la fonction recherchée elle- 
même! 


Il va de soi que le vecteur tangent à la courbe I” est donc un vecteur parallèle à celui ayant pour 
composantes (par correspondance avec la relation précédente): 


que nous noterons: 


-(Y _Y) …. 
= —,—_— 5.36) 
dy  üx 
De plus rappelons que le gradient est donné par (cf chapitre de Calcul Vectoriel): 
- d à 
V(f)})= 22) (25.37) 
0x dy 


Nous remarquerons que ces deux derniers vecteurs sont perpendiculaires (résultat qui nous sera utile dans 
le chapitre d'Analyse Complexe). Effectivement: 


(25.38) 


Fe Ÿ( p-[2-2)(Z 2)-224(-2)2-0 


&' 8x) (8x æ] && À 8x/8 


En d'autres termes, le vecteur Ÿ{f}) définit les lignes orthogonales à la courbe '. 
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Exemple: 


Prenons l'équation d'une parabole particulière dans IR* : 


f(z) = Jr +32 (25.39) 


Nous avons donc les isoclines qui sont données par: 
J{z)= Jr + y? =c#* (2540) 
d'où leur équation dans le plan: 
y = 4e" x? (2541) 


Soient des cercles dans le plan dont le rayon est égal à la racine carrée de la constante choisie 
correspondante à la hauteur z de la fonction f! 


Calculons maintenant la pente de la tangente à T”: 


3 s 

— + 
dÿ __x_ NT TV _ x : (25.42) 
dx ÿ Y " _ 2 

dy r +72 


ce qui est conforme à la simple dérivée de: 


dy _d F 2 X 
ER © 65515) 


dx dx te _ x2 
Nous avons aussi: 
”. y X 
Ë = 5 re : : (25.44) 
X°+y X° +y 


Nous voyons qu'en x = 0 ce vecteur est vaut: 
£=(10) (25.45) 
ce qui est bien conforme au vecteur tangent que nous avons au cercle en ce point de l'axe des abscisses. 


3. TRIEDRE DE FRENET 


Le repère de Frenet est un outil d'étude du comportement local des courbes. Plus exactement, il s'agit d'un 
repère local associé à un point décrivant une courbe . Son mode de construction est différent selon que 
l'espace ambiant est de dimension 2 (courbe plane) ou 3 (courbe gauche). 
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Le repère de Frenet, et les formules de Frenet (donnant les dérivées des vecteurs de ce repère), permettent 
de mener de façon systématique des calculs de courbure, de torsion pour les courbes gauches et 
d'introduire des concepts géométriques intéressants associés aux courbes. 


Considérons pour commencer une courbe T avec son abscisse curviligne s(t) et A, = sf) son origine. 
Nous notons par définition: 


7 _dJO _ FC +dt)- FO _ dOM (25.46) 


ds ds ds. 


la tangente à la courbe T de paramètre t au voisinage d'un point M par rapport à un repère posé en O avec 
ds qui se calcule comme nous l'avons montré précédemment. 


Il est intéressant de remarquer que si t s'interprète comme le temps, alors nous avons une vitesse: 


et donc le vecteur T est dirigé dans le sens du mouvement. 


De plus, par construction et définition de l'abscisse curviligne, nous avons toujours: 


FA 0 
RER 
et donc le vecteur tangent 7 au point M est unitaire (et non nul!). 


Maintenant, sans savoir exactement à quoi cela va nous servir pour l'instant, intéressons-nous au vecteur: 


af 
ds 


(25.49) 


Sachant trivialement de ce qui précède que: 
If] =ToT=1 (550) 
Alors, nous avons: 


d(TeT) AT ps roT = FT =0 (25.51) 
ds ds ds ds 


donc déjà . n'est a priori pas unitaire et 7 lui est perpendiculaire (résultat qui va nous servir plusieurs 
5 


fois par la suite donc il faudra s'en souvenir)! 


Posons maintenant: 
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af d? 

DT _- à 

N - D Da (25.52) 
ds 


Étant donné le résultat précédent, À} est le vecteur perpendiculaire, appelé "vecteur de courbure" unitaire, 
à Ÿ en M (nous disons que ce couple de vecteur est "orthonormal direct") et C est par définition la 
"courbure". 


Nous pouvons également aborder la courbure C d'une façon plus géométrique plutôt que par une 
définition tombée du ciel: 


Nous savons à ce point de notre discours qu'en un point A#; d'une courbe (dérivable au moins une fois en 
tout point...), il existe un vecteur tangent non nul qui est F. 


En tout point voisin M (d'abscisse curviligne s), le vecteur tangent peut s'écrire en approximation: 


si la courbe se trouve localement dans un même plan (car nous étudions ici la courbure et non la torsion 
de la courbe)! 


Deux normales en M et M, se coupant donc en un point Q, la figure suivante: 


—æ* 


Fe) 
= Em 


_ 


ee, 


_ 


a 


À= QM 


_ 


M " 


Figure: 25.9 - Décomposition du vecteur tangent de la trajectoire courbe 


montre qu'au premier ordre en ds, le point M peut être considéré localement comme déduit du point M, 


par une rotation de centre Q. 


Le cercle ainsi défini, de rayon: 
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CM =R (25.54) 


est celui qui tangente le mieux la courbe localement au point M. Son rayon se déduit de la figure (deux 


triangles semblables à la limite): 


ar ds 
ds _|läs (25.55) 
R |A 


d'où, puisque 7 est unitaire, la définition et la valeur de la courbure: 


aT 


ds 


C = 


(25.56) 


1 
& 
et voilà! 


Il est possible d'interpréter le concept de courbure comme la vitesse de rotation de la base de Frenet par 
rapport à une direction fixe. 


Le couple de vecteurs (7, À} ) est appelé "repère de Frenet" et ses vecteurs de base les "vecteurs de 
Frenet". 


Le repère de Frenet est un repère mobile puisque les éléments de ce repère changent selon le point 
considéré. En physique, il ne faut pas confondre cette notion avec celle de référentiel: puisque les vecteurs 
de Frenet se déplacent avec le point! 


Remarque: La définition de C telle que ci-dessus est vraie dans le cadre d'un choix d'une courbure 
positive. C'est un point de vue pris en mécanique mais non nécessaire en mathématiques. 


Si C #0, alors comme vu précédemment: 


a? 
ÿ-ds -[1]47 _ Dar (0557 
C C'J ds ds 
où R est appelé le "rayon de courbure". 
Quant à la relation: 
N aT| . 
— =—| (25.58) 
À 5 


elle est appelée "1ère formule de Frenet" et montre que CLR et À} sont colinéaires et donc leur produit 
ds 


vectoriel est nul (résultat utilisé plus loin). 


Ces relations se justifient par l'analogie avec la mécanique. Effectivement, nous avons démontré plus haut 
que: 
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+ d(T.v T PF PF 
a d(Fv). af pdv_ ds dl pdv_ pdf pdv 
& 4 4 dd 4% & 4 


nous retrouvons alors le résultat obtenu dans le chapitre de Mécanique Classique lors de notre étude du 
plan osculateur. 


Pour donner une interprétation géométrique plus exacte de la courbure, nous définissons d'abord par £à le 
centre du "cercle osculateur" (se trouvant dans le plan osculateur) ou "cercle de courbure" de rayon R qui 
tangente le mieux localement [ tel que dans le repère de Frenet: 


G=M+RN (2561) 


Pour préciser géométriquement ce qu'est le cercle osculateur, prenez une courbe, et un point M sur cette 
courbe. Tracez ensuite la normale au point de cette courbe localement plane et prenez un point £à sur la 
normale. Alors, le cercle de centre O passant par le point M est tangent à la courbe. Mais tous les cercles 
tangents à la courbe ne sont pas tangents de la même façon! En effet, si £2 est loin de M, le cercle va se 
situer plutôt à l'extérieur de la courbe (cercle bleu dans la figure ci-dessous). Si £2 est proche de M, le 
cercle va se situer plutôt à l'intérieur de la courbe (cercle rose dans la figure ci-dessous). Le rayon limite 
entre être "à l'intérieur de la courbe" et être "à l'extérieur de la courbe" est par convention le "rayon de 
courbure" que nous avons défini plus haut. Le cercle correspondant à ce rayon est alors le fameux "cercle 
osculateur". 


En vert, le cercle “le mieux tangent à la courbe, 
ou cercle oSculateur! 


Figure: 25.10 - Représentation du cercle osculateur 


Dans le cas particulier où 7 est un vecteur constant: 
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= =0 (2562) 
et donc €’ =0 ce qui implique que R n'est plus défini. Nous disons quelquefois dans ce cas que le rayon 
de courbure de T° est infini (une droite présente alors une courbure nulle en tout point). 
Étudions maintenant le vecteur perpendiculaire au plan osculateur défini par: 
B=TxN (563) 
Nous pouvons déjà dire, étant donné que Ÿ et À} sont unitaires que À l'est aussi (ce qui va nous servir 


plus loin)! 


Démontrons que . est orthogonal à 7: 
s 


où nous avons pris le cas particulier . = Ü (mais de toute manière en généralité . et À} sont 
5 5 


colinéaires comme nous l'avons démontré donc le produit vectoriel entre ces deux vecteurs est toujours 
nul). 


OIC.Q.F.D. 


, dB a 
Démontrons maintenant que -— est colinéaire à À}: 
ds 


De la même manière que nous avons démontré plus haut que . est perpendiculaire à T , nous 
5 
dB … 
démontrons que ps est perpendiculaire à £! 
s 


Nous avons donc: 


pa =0 (25.65) 
ds 


Et étant donné que . est aussi perpendiculaire à ? (démonstration précédente) il est donc colinéaire à 
5 


N. 
OIC.Q.F.D. 


Posons maintenant: 
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2 _# .N| (5.66) 


Cette relation constitue la "2° formule de Frenet" où par définition, Z est le "vecteur binormal" de 


F au point M et T en est la "torsion" et R' le "rayon de torsion". 


Nous pouvons maintenant établir la "3°" formule de Frenet": 


d'où nous tirons: 


adN dB 3 + dT Rx T+ExE (25.68) 


Or de par les propriétés du produit vectoriel: 


Ec 
Ect 
X 
2 
Il 
I 
+} 
© 
Un 
[e)} 
e 


NxT=- 


d'où la 37€ formule de Frenet: 


(25.70) 


Nous appelons "trièdre de Frenet" associé à T° au point M, le repère naturel orthonormal de l'espace 
(M,T,N,B): 


PLATS 
- . 


——“—— 
ET 


FA 
LL 
nn 


25.11 - Représentation du trièdre de Frenet 


Figure: 
où, en mécanique, le vecteur F est colinéaire à la vitesse et l'accélération tangentielle et À} est colinéaire 


à l'accélération normale. 
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Remarque: Le rayon de courbure R est donc dans le plan osculateur (plan formé par le vecteur tangent 
et normal à la courbe) qui est le meilleur plan dans lequel est contenue la courbe. Du coup, le rayon de 
courbure donne en un point (localement) le meilleur ("le plus vrai") rayon de la courbe. La torsion 

nous donne par contre la tendance qu'a la courbe à sortir du plan osculateur (in extenso si la courbe est 


contenue dans un plan, la torsion est nulle). 


Exemple: 


EI. Cherchons le rayon et le centre de courbure en tout M à notre hélice définie plus haut comme exemple 


pratique. Rappelons que sa fonction paramétrique est donnée par: 


x =rcos(f) 
OM = y =rsin(é) | (25.71) 
z = hi 
et que: 
LR CES (25.72) 
dt 
Nous avons dès lors: 
sin(£} 
pr? +}? 
- dOM dOMdt = 
T=——=————T- cos(£) (25.73) 
ds dt ds r2 + 2 
k 
r + 
Au passage, vous remarquerez que nous avons bien: 
IF] =1 (2574) 
Ainsi, la courbure (l'inverse du rayon de courbure) est donnée par: 
F 
= £ 
Tin cos(£) 
dT àT dt m._.- @ |= aT Fr | 
poele roles Die. meer di | => (2575) 
ds dtas | r+# as| + 
(el 


Donc, le rayon de courbure vaut: 
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_r?+}#° 


Fr 


À (25.76) 


Ce qui est conforme à l'intuition puisque, lorsque le pas h de l'hélice est nul, le rayon de courbure vaut r et 
lorsque le pas h tend vers l'infini le rayon de courbure tend vers l'infini aussi et la courbure vers zéro. Cet 
exemple est un cas fameux d'ingénierie appliquée aux cheminées d'évacuation de fumées qui sont 
entourées d'une hélice d'Archimède et dont l'objectif est de faire monter les flux d'air vers le haut (la 
difficulté étant de déterminer le rayon R de la plaque de métal à couper qui suivra le mieux la courbure 
voulue... du moins localement en connaissant le rayon de la cheminée et la hauteur h du pas de la spirale): 


Fe 


r pi 


Figure: 25.12 - Principe de base d'une cheminée industrielle avec spirale 
(source: Frank Morgan, Riemmanian Geometry) 


ou sa version réelle: 
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Figure: 25.13 - Cheminée industrielle d'évacuation avec spirale 


Mais dans ce cas d'ingénierie, la hauteur h doit être obtenue par une rotation complète. Dès lors le rayon 
de courbure s'écrit: 
2 ,[ À À 
ESr) 6m 


Bref pour en revenir à notre exemple et le finir, il vient par la première formule de Frenet le vecteur 
normal suivant: 


— cos(é) 
N=|l-sint) | 0579 
(] 


et dont tous les points (extrémités du vecteur) sont confondus avec l'axe Z de notre hélice quel que soit h! 
La coordonnée de la composante z de ce vecteur est nulle étant donné que la normale est prise par rapport 
à un point M de la courbe déjà à une hauteur h implicite. 


De par la 3ème formule de Frenet avec le vecteur binormal: 
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_ Por 

— cos (£) 

B=TxN = FF os © x 7 
r? + 

. 0-A(-sin(é)) Fr 

= (—-cos(£))-(-rsin(#))0 
(er sin(é) )( — sin(£)) <p cos(£}(—cos(£)] 

k sin(£) 
—h cos(f) 


E 


et le rayon de torsion donné par la relation: 


dB _N _ 
— = — (25.80) 
ds À' 
nous avons donc: 
FAT LE gt 28 (25.81) 
ds dé ds 


Et comme nous avons obtenu les trois relations suivantes: 


cos(é) 
2 2 
—cos(f) L r° +h 
e d k £ l 
M=|-sn(£) | et “ sin(£)| et —= (25.82) 
0 ; r? +? S  \r2+72 
0 
Nous en déduisons le rayon de torsion: 
id 
Ra re. L (25.83) 
k 


E2. Déterminons maintenant le cas important de l'expression explicite du rayon de courbure en 
coordonnées cartésiennes (résultat utilisé dans le chapitre de Génie Civil et utile dans de nombreux autres 
domaines de la physique). Considérons pour cela la figure suivante: 
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Figure: 25.14 - Illustration de l'approche du rayon de courbure en 1D 


Nous avons donc le rayon de courbure qui est donné intuitivement par la relation suivante si nous ne 
faisons pas usage de l'analyse vectorielle: 


Nous avons aussi: 


et comme: 


il vient alors: 


et donc: 


A6=0 Às ds 


(25.84) 


(25.86) 


à 
8 = arctan (à) (25.87) 


x 


d8& à (æ) | 
— = —| arctan | — (25.88) 
dx dx dx 


Nous avons démontré dans le chapitre de Calcul Intégral Et Différentiel la dérivée suivante: 
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d : 

— arctan(x) = (25.89) 

dx 1+x 

Nous avons alors immédiatement par les dérivées composées: 
d'y 

d9 à æ) 1 d æ dx? 
= er rec er re | 
dx dx dx dy dx dy 


rs 2 
1+{ ) 14 | 
dx dx 


Ceci étant fait nous avons aussi besoin de dx/ds. Or, nous avons démontré avec différentes approches dans 


le chapitre de Mécanique Analytique et Formes Géométriques (entre autres) en utilisant simplement 
Pythagore que: 


&_ 1. 
ds _ ds _ 2 (25.91) 
de (à) 
dx 


ds dx ds 2 2 REC 3672 (59) 
dx dx pr 


Il vient donc alors le rayon de courbure du cercle localement osculateur d'une fonction cartésienne dans le 
plan (en prenant la valeur absolue de la dérivée seconde pour éviter d'avoir un rayon négatif...): 


(25.93) 


ê d'y D" 
dx? 
4. NAPPES PARAMÉTRÉES 
Soient D « IF? : 
x(u,v) 
D — 
F4 avec OM =| ytu,v)| (25.94) 
(u,v) — giu,v) = M 


zu, v) 
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Appelons 2 = g(2). Si g est continue, alors Z est une surface de l'espace "surface d'un seul tenant". Par 
définition, dans ce qui suit, le couple (g,2) où g est une fonction supposée continue sera appelé "nappe 
paramétrée", et Z le "support" de la nappe paramétrée. Nous disons encore que (g,2) et (4,v) sont des 
paramétrages de Z. 


Remarquons que pour une surface Z (par exemple un disque), il existe plusieurs nappes paramétrées 
associées (par exemple les coordonnées cartésiennes, polaires, sphériques). 


Soit maintenant } © LE et: 


IR | 
94 C 5) 
É— h(£) = (u,v) 
tels que #(7) € D 
Nous pouvons définir ge: 
IR 
co} (25.96) 
£— (goh)(e) = g(&(E),vE)) 


Si nous supposons h continue, il est clair que g°# est un arc paramétré. Appelons T son support, nous 
avons | CZ et nous disons que l est une "courbe tracée" ou "courbe inscrite" sur Z définie par les 
"coordonnées de Gauss" u et v (déjà rencontrées dans le chapitre sur les Géométries Non-Euclidiennes). 


Remarque: Nous supposerons toujours désormais que D = 7x JF 


Soit ff, eZ, M, = gu,v). Intéressons-nous aux deux courbes tracées sur X définies par les arcs 
paramétrés suivants: 


1 


1 
SEC PRET 


J =R 
V— 81, = So. V) 


(25.97) 


(8-7) avece, 


Eu et 8 Sont les deux fonctions dites "fonctions partielles" de g en (&5,v5). 


Les supports de (8,,,/) et (g,,,{) sont appelés "courbes-coordonnées" de Z en A, relativement au 
paramétrage (g, 2). Nous les notons respectivement l,, et l,. . Nous appelons aussi l,, "ère courbe- 


coordonnée" et "2ème courbe-coordonnée". 


Il est bien sûr évident (cf. chapitre de Calcul Différentiel Et Intégral) que: 
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des __îg _40M 
dv dv dv 


est tangent à l, en M, et que 8OM / du est tangent à l, en W,. 


: 20M 
To ES 
nn, ©: 1 
00M | 
du 


Figure: 25.15 - Représentation d'une nappe paramétrée 


4.1. MÉTRIQUE D'UNE SURFACE 


Soit: 
x(u,v) 
DR = 
avec OM =| y(u,v)| (2599) 
(u,v) — giu,v) = M 
zu, v) 
Notons dg = (dx,dy,dz), autrement dit: 
dx 
dOM =|dy| 05100) 
dz 
Nous avons aussi (cf. chapitre de Calcul Différentiel Et Intégral): 
dx = 7, + LP 
Li dv 
dy = Er + 3 (25.101) 
du v 
dz = LE? ; LES 
du dv 


et nous avons démontré au début de ce chapitre que l'abscisse curviligne dans un espace cartésien (en 
coordonnées de Riemann) était donnée par: 


ds? = dx? + dy? +dz? (25.102) 


Nous avons donc après substitution en coordonnées de Gauss: 
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2 
i dx 2) | 0x, dy , dz dz Fr. 
(2) Qu dv du red du dv 


(25.103) 


&Y,[®Y 


=] 


Ce qui est équivalent à écrire (attention à ne pas y lire qu'on a le carré d'un vecteur mais qu'il s'agit du 
produit scalaire avec lui-même!): 


53 — 12 
ds? = (| du? + 50m o0M (7) dv? (25.104) 
Li du v 
De manière plus traditionnelle avec la notation: 
— 12 
£ - 30M F- 80M _ 12] 
du du 


Nous obtenons une relation appelée la "première forme quadratique fondamentale" (nous ne démontrerons 
pas la deuxième): 


ds? = Edu° + 2Fdudv+Gdÿ (25.106) 


appelée aussi "première forme différentielle de Gauss". Il est intéressant d'écrire cette dernière relation 
sous la forme: 


_ r2 
ds? = À | au + FdvŸ PC (25.107) 
E E 


et nous voyons que pour que 42 soit positif, il faut alors que E ainsi que £G-— F2? soient positifs. 


Comme nous l'avons déjà démontré en calcul tensoriel, cette expression est indépendante de la nappe 
paramétrée (g,2) car l'élément de longueur infiniment petit ds est indépendant du paramétrage de X. 
Cette forme quadratique est donc un invariant qui représente la métrique sur Z . Elle est par ailleurs notée 
sous la forme suivante par tradition: 


ds? = Bndu? +28,pduidv + Syy dv? (25.108) 


4.1.1. RÉGULARITÉ D'UNE SURFACE 


Définition: Un point M appartenant à la surface Y est dit (c'est relativement logique...) "point régulier", 
si et seulement si: 
20M 80M 
Ou êv 


#0 (25.109) 
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Une surface Y est logiquement dite "surface régulière", si et seulement si, tous ses points sont réguliers 
(si le produit vectoriel est nul alors il y a quelque part un "pli" à 90°). 


Remarquons que: 


Ex(u,v) Ox(u,v) 


oO, où 2 ” OV Oz — OZ OV 
PE a] . 2 D) x 2e = || 0,z0,x — 0,x0,z 


&u,v) Bzu,v) Oux0yY — OnYOyX 


= N VO, dE0,7 Ÿ +(0,20,x — 0,,x0,Z l +10,,x0,y — d,,y0,x j 


= (0,,y0yz — 0,20ÿY P + 0,2 0y x — 0,x0yZ À + d,x0yY— 8,y8,x\ 


| (25.110) 


= (8,y78,21 - 28,y8,28,z8,y +18,z8,9 1 
+(8,z8,x 17 — 28,70, x8,x0,2+10,x0,2 17 
+8,20, À — 28,10,»0v8,x + ya x I 

= je suis fatigué de faire de l'algèbre... =EG- F? 


L'angle & entre les deux courbes-coordonnées Lu, et 1, à > en y est donné par la définition du 


produit scalaire: 


cosæ=ÆÀ#=0 (5111) 


80M _20M En 
y 


D'où l'expression: 


20M _20M 20M _20M 


ER Dev 


(25.112) 
ee) 7 EST =) = 


Donc une condition nécessaire et suffisant pour que les courbes-coordonnées Lu, et 1, soient 


perpendiculaires à X en #4 et que F soit nul. Dans ce cas particulier, on dit que les coordonnées 
curvilignes u, v sur la surface sont des coordonnées orthogonales. 


Exemples: 


EI. Considérons le paramétrage du plan cartésien. Nous avons alors: 
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__ 1 
20M 0 
x êx 0 
OM'= v|= (25.113) 
_— fô 
? 0 
d'où: 
E=G=1#=0 (5114) 
Dès lors: 


ds? = dx? + dy? (25.115) 


Nous retrouvons donc la même abscisse curviligne différentielle que celle vue dans le chapitre de Calcul 
Tensoriel et Relativité Générale avec la métrique diagonale de l'espace plat. 


Nous avons aussi: 
EG-F?=1#0 (5116) 


Donc, la surface est régulière. Nous avons également: 


Donc, les deux courbes-coordonnées sont perpendiculaires. 


E2. Considérons le paramétrage du cylindre. Nous avons alors (cf chapitre de Calcul Vectoriel)}: 


_— fcosÿ 
90M , 
—— =| sin # 
rcos # à 0 
OM =|ran$ |— (25.118) 
_— f-ran# 
Z 90M 
F7: =| rcos ÿ 
(el 
d'où: 
E=1G=r?,F=0 (25.119) 
Dès lors: 


ds? = dr? +rd# (25.120) 
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Nous retrouvons donc la même abscisse curviligne différentielle que celle vue dans le chapitre de 
Relativité Générale avec la métrique diagonale du plan en coordonnées polaires. 


Nous avons aussi: 
EG-F?=7r 20 (25121) 


Donc, la surface est régulière tant que r est non nul. Nous avons également: 


Donc, les deux courbes-coordonnées sont perpendiculaires sur le cylindre. 


E3. Considérons le paramétrage la sphère de centre O et de rayon r. Nous avons alors (cf chapitre de 
Calcul Vectoriel): 


_— frcoscosŸ 
20M . 
——— =| rcos dsin Ÿ 
r sin dcos # 08 | 
— | | —r sin 9 
OM =| rsin sin $ | = | (25.123) 
_—— f-rsin8sing 
rcos 8 30M | 
——— =| rain dcos # 
9$ 
0 
d'où: 
E=r = r? sin? 8 F=0 (25.124) 
Dès lors: 


ds? = r°48? +r? sin? 84# (25.125) 


Nous retrouvons donc la même abscisse curviligne différentielle que celle vue dans le chapitre de 
Relativité Générale avec la métrique diagonale du plan en coordonnées sphériques. 


Nous avons aussi: 
EG- F2 =rdsin292#0 (25.126) 


Donc, la surface est régulière tant que r et 8 sont non nuls. Nous avons également: 


cos Œ = h = M ii 
ns la TL (25.127) 
EG r4 sin? 8 2 


Donc, les deux courbes-coordonnées sont perpendiculaires sur la sphère. 


E4. Considérons le paramétrage de l'hyperboloïde. Nous avons alors (cf. chapitre de Géométrie 
Analytique): 
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CE 
FE 
80M sin(u)-é£ 
— | 
a-N1+#2 .cos(u) Me 1+6 
nn 0 
où = lai 2:t |S 
bu 
à : 1 Lo. sin(x) 
£0M = a +62 . cos(u) 
Ou 
b 
d'où: 
fe | 
E =? ,G=4|1+# | + F=0 (25.129) 
1+£ 
Dès lors: 


2 / 

FA l 

ds? En À + &|1+# | +8 ja? (25.130) 
1+#2 


Prenons b comme étant nul. Nous avons alors: 


EG-F7 =a%2 05131) 


Donc, la surface est régulière tant que a est non nul. Nous avons également: 


Donc, les deux courbes-coordonnées sont perpendiculaires sur l'hyperboloïde. 


(25.128) 
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Notes personnelles: 
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26. FORMES GÉOMÉTRIQUES 


No avons déjà défini au début du chapitre de Géométrie Euclidienne les concepts de dimensions 


topologiques, ce qu'étaient un point de dimension nulle et une courbe de dimension unité. Nous ne 
reviendrons pas sur ces dernières et nous intéresserons aux formes de dimensions supérieures. 


Le but du présent chapitre est de répertorier avec démonstrations quelques propriétés mathématiques 
remarquables des formes et corps géométriques connus (surface, volume, centre de masse, moment 
d'inertie). Effectivement, il existe nombre de formulaires les répertoriant sans démonstrations mais peu 
voire pas, d'ouvrages les démontrant toutes (nous n'en avons jamais vu en tout cas...). La liste 
ci-dessous est à ce jour loin d'être exhaustive (puisqu'il existe une infinité de formes géométriques) mais 
elle sera complétée avec le temps. 


Les quelques formes que nous avons souhaité présenter permettent assez facilement de trouver les 
propriétés remarquables d'un très grand nombre de formes non répertoriées sur cette page par 
assemblage ou décomposition. 


Remarques: 


R1. Les relations trigonométriques remarquables dans les formes géométriques ci-dessous ne sont 
pas démontrées dans ce chapitre. Celles-ci se trouvent déjà toutes dans le chapitre traitant 
spécifiquement de la Trigonométrie. 


R2. Nous entendons par "centre de gravité", le "barycentre" tel que vu dans le chapitre de 
Géométrie Euclidienne. 
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1. SURFACES CONNUES 


Il existe plusieurs définitions du concept de surface dont une due à Euclide et une autre moderne due à 
la topologie (voir chapitre du même nom). 


Définitions: 
D1. Une "surface plane" est ce qui a longueur et hauteur. 


D2. Une "surface" est une variété topologique de dimension 2. 


Remarque: Nous nous intéresserons dans un premier temps uniquement aux propriétés (périmètre, 
surface, centre de gravité, etc.) de surfaces plongées dans des géométries euclidiennes. 


1.1, POLYGONES 


Définition: Un "polygone" est une figure plane limitée par des segments de droites consécutifs 
(autrement dit: par une polyligne fermée). 


: 


Figure: 26.1 - Exemple de polygone quelconque 


Par définition, un "quadrilatère”", "pentagone", "hexagone", "heptagone" sont des polygones à 
respectivement quatre, cinq, six, sept... côtés. 


Nous distinguons trois grandes familles (mais elles ne sont pas les seules!) de polygones: les polygones 
croisés, les polygones concaves et les polygones convexes (nous retrouverons ces deux familles dans 
différents chapitres du site). 


Avant d'aller plus loin nous tenons à préciser au lecteur qu'il n'existe de relation mathématique 
permettant de calculer la surface que pour des polygones simples. Même si dans la pratique nous ne 
rencontrons quasiment toujours que des polygones non simples, nous avons considéré comme inutile de 
nous attarder sur la détermination d'une relation qui permettrait de ramener le calcul de la surface d'un 
polygone quelconque à celui de polygones simples. 


Définition: Un polygone est dit "polygone croisé" si deux au moins de ses côtés sont sécants, c'est- 
à-dire si au moins deux de ses côtés se coupent. C'est le cas du pentagone ABCDE ci-dessous: 
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Le 


is 
Figure: 26.2 - Exemple de polygone croisé 


Remarque: "L'enveloppe" d'un polygone est le polygone obtenu en suivant le contour extérieur de 
celui-ci. Par exemple, l'enveloppe du pentagone précédent est un décagone dont les sommets sont 
les cinq sommets du pentagone et les cinq intersections de ses côtés. 


Définition: Un polygone est dit "polygone concave" s'il n'est pas croisé et si une ou plusieurs de ses 
diagonales ne sont pas entièrement à l'intérieur de la surface délimitée par le polygone. 


Par exemple, le pentagone ACDBE ci-dessous est dit concave car les diagonales BC et CE sont 
respectivement à l'extérieur et partiellement à l'extérieur de la surface délimitée par le polygone. 


Figure: 26.3 - Exemple de polygone concave 
Oo JD 


Définition: Un polygone est dit "polygone convexe" s'il n'est pas croisé et si toutes ses diagonales sont 
entièrement à l'intérieur de la surface délimitée par le polygone. Ainsi, l'hexagone MNOPR@QR ci-dessous 
est dit convexe: 
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Figure: 26.4 - Exemple de polygone convexe 


Relativement aux définitions données précédemment où les diagonales étaient mises en évidence, 
voyons s'il y a une relation permettant de connaître leur nombre relativement au nombre d'arêtes du 
polygone. 


Partons pour cela d'un polygone de n côtés (notons qu'il a aussi n sommets): 


PENTAGONE 


5 côtés 
5 sommets 


Figure: 26.5 - Point de départ pour la démonstration 


Nous définissons le total de segments s comme étant égal à la quantité de côtés (arêtes) n plus la 
quantité de diagonales d tel que: 


s=A+d 


Figure: 26.6 - Représentation des diagonales 


Maintenant, prenons le premier point de notre pentagone. Nous voyons que nous pouvons joindre tous 
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les points n, sauf le point considéré (-1) soit la formation de n - 1 segments comme le montre la figure 
ci-dessous: 


Figure: 26.7 - Exemple des segments partant d'un point 


Avec le deuxième point, nous pouvons aussi joindre tous les points n, sauf le point considéré (-1) et le 
premier point déjà vu (-1) soit la formation de n - 2 segments: 


Figure: 26.8 - Démarche avec le 2ème point 


Avec le troisième, nous pouvons aussi joindre tous les points n, sauf le point considéré (-1) et sauf les 
deux points déjà vu (-2) soit la formation de n - 3 segments 


Figure: 26.9 - Démarche avec le troisième point 


Nous continuons avec les autres points: le 4ème qui donne n - 4 segments, le 5ème qui donne n-5 
segments. In extenso, nous voyons donc que le (n - 2)ème point donne donc n - (n - 2) segments, etc. 


Nous avons donc finalement pour: 
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s=1+2+..+(%-2)+(#-D 
LS=@D+(2)+..+2#1 (26.1) 
2s=n+n+..+A+ 


En simplifiant nous trouvons donc: 


Dès lors il vient que: 


a=e-n- "D, 2073 
2 Fi 


1.1.1. RECTANGLE 


(26.4) 


Définition: Le "rectangle" est un cas particulier du quadrilatère (forme à quatre côtés délimitée par des 
segments finis telle que: losange, carré, rectangle, trapèze, etc.) dans le sens où ses côtés L et H 
(notation pour Longueur et Hauteur selon figure ci-dessous) sont égaux deux à deux et à angle droit (en 


d'autres termes, L n'est pas forcément égal à H). 


D'autres définitions possibles consistent à dire qu'un rectangle est un parallélogramme disposant d'un 


angle droit ou un quadrilatère ayant quatre angles droits. 


Remarque: Le rectangle peut être vu comme la composition de deux (ou plus) triangles rectangles 
(voir plus loin la définition). Pour construire un rectangle, il suffirait d'avoir un seul et unique 
triangle rectangle et lui faire subir une double réflexion et une rotation par rapport à un axe bien 


choisi (cf. chapitre de Géométrie Euclidienne). 


Figure: 26.10 - Exemple de rectangle 


De par les axiomes d'Euclide (cf. chapitre de Géométrie Euclidienne), le périmètre d'un rectangle est 


donné par: 
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P=2(L+A) (265) 
Et par définition, sa surface par: 
S=L'AH (26.6) 


et la longueur de sa diagonale par (application du théorème de Pythagore): 


à = JE + H° 


(26.7) 


La position du centre de gravité du rectangle, si nous posons le repère cartésien dans le coin inférieur 
gauche de la forme, est trivialement donnée par: 


G(x,y) =(L12,H/2) (26.8) 


Enfin, indiquons que si nous étions des êtres vivants dans un espace à deux dimensions, le rectangle 
serait ce que nous apercevrions si un parallélépipède traversait notre univers parallèlement à ses faces. 


1.1.2. CARRÉ 


Définition: Le "carré" est un cas particulier du rectangle dans le sens où ses quatre côtés sont égaux 
tels que Z = H. 


Figure: 26.11 - Exemple de carré 


De par les axiomes d'Euclide (cf. chapitre de Géométrie Euclidienne), le périmètre du carré est donné 
par: 


P=4:Z (269) 


Ainsi, il vient pour la surface que: 


et pour sa diagonale: 


d = 2 + H? = JP +2 = 0 = f2.L (611 


La position du centre de gravité du carré, si nous posons le repère cartésien dans le coin inférieur 
gauche de la forme, est trivialement donnée par: 
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G{(x,y) =(Z/2,L/2) (26.12) 


Enfin, indiquons que si nous étions des êtres vivants dans un espace à deux dimensions, le carré serait 
ce que nous apercevrions si un cube traversait notre univers parallèlement à ses faces. 


1.1.3. TRIANGLE 


Définition: Le "triangle quelconque" est un polygone à trois côtés et englobe dans les cas particuliers, 
les triangles: isocèles, équilatéraux et rectangles. 


Figure: 26.12 - Exemple de triangle quelconque avec cercle inscrit 


De par les axiomes d'Euclide (cf. chapitre de Géométrie Euclidienne), le périmètre d'un triangle 
quelconque est donné par: 


P=at+tbh+e (26.13) 


Le triangle quelconque est toujours décomposable en deux triangles rectangles. Aïnsi, celui de la figure 
ci-dessus peut se décomposer en deux triangles rectangles de base respective 4, et 4, (définis par la 


projection orthogonale du sommet opposé au segment a) tels que: 
a 4 t+&ä3 (26.14) 


La surface de chacun de ces deux triangles rectangles est comme nous l'avons déjà implicitement dit 
dans notre étude du rectangle, la moitié de la surface d'un rectangle de même longueur et même 
hauteur. Ainsi: 


S 1 = Sp (26.15) 


Ainsi, la somme de ces surfaces, nous donne la surface du triangle quelconque: 


B'h,G'h Gta, ah 
2 2 2 


ed Pas ® 


Nous pouvons dire à partir de cette dernière relation, que la surface de tout triangle quelconque est 
assimilable à la moitié de la surface d'un rectangle de longueur Z = 4 et hauteur #4 = k. 


Remarque: Quelle que soit la base a, b, c et la hauteur respective #,,k,,k, le raisonnement 
précédent reste bien évidemment totalement juste. 


La détermination du centre de gravité (ou barycentre) G (cf. chapitre de Géométrie Euclidienne) est un 
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peu moins intuitive que dans le cas du rectangle... 


Nous pouvons bien sûr nous servir d'un repère et des outils du calcul vectoriel pour très facilement 
déterminer ce dernier. Nous allons donc démontrer que le centre de gravité d'un triangle quelconque se 
situe à l'intersection de toutes les médianes: 


Démonstration: 


Soit un triangle ABC. Nous appelons A' le milieu du segment BC, B' celui de AC et C' celui de AB: 


B 


A' 


Figure: 26.13 - Point de départ pour la détermination du centre de gravité 
Nous allons démontrer que le seul point G vérifiant (cf. le chapitre de Géométrie Euclidienne): 
GA+GB+GC=0 (26.17) 


est le point de concours des trois médianes du triangle ABC. Cette démonstration s'effectuera en deux 
étapes, en deux propositions. Au terme, nous pourrons conclure par le théorème. 


Propositions: 


P1. Si ABC est un triangle alors il existe un et un seul centre de gravité G tel que 54 + GB + GC = 0 


P2. Les trois médianes d'un triangle sont concourantes. Leur point d'intersection est ce point G. 
Démonstrations: 


DM1. Soit G un point du plan tel que {4 + GE + GC = 0. Nous pouvons alors écrire que: 


GA+CA+4B+GA4+AC-0 6610 
GB GC 


d'où: 
AG = l(Æ + AC) (26.19) 
3 
Cette relation vectorielle garantit que le point G est unique et que nous pouvons même le placer! 
OIC.Q.FD. 


DM2. Pour démontrer que les trois médianes sont concourantes, nous allons prouver que G appartient à 
chacune des trois médianes. 
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Au point P1., nous avons démontré que G vérifie l'égalité: 


——# 


AG = l(Æ + AC) (26.20) 
3 


Comme A'est le milieu du côté BC, nous pouvons alors écrire que: 
AB+AC=2AA4 (621) 
Il vient alors que: 


—_ Le = ii 2 — 
AG = - (AB + AC) --(244) - = 44 


(26.22) 


Les vecteurs 4; et 44° sont donc colinéaires! Donc les points A, G, A' sont alignés. Autrement écrit, 


le point G fait partie de la médiane AA' du triangle ABC. Nous pouvons même dire qu'il se trouve aux 


deux tiers du segment AA’ à partir du sommet A. 


Ce que nous venons de montrer avec la médiane AA' est bien évidemment aussi vrai pour les deux 


autres médianes. Ainsi: 


à 
à] 


al 

Gi 
Il 

HDI WI Win 
Co 
Co 


| 


(26.23) 


| 


el 
C2 
[l 

Q 
Q 


En résumé, le point G fait donc partie des trois médianes AA’, BB' et CC". Ces trois droites sont donc 
concourantes et le point G en est le point d'intersection. Ce résultat nous sera utile plus tard lors de 


notre étude des polyèdres. 


OIC.Q.F.D. 


Enfin, indiquons que si nous étions des êtres vivants dans un espace à deux dimensions, le triangle 
serait ce que nous apercevrions si des formes géométriques composées d'au moins trois faces jointes 


traverseraient notre univers par un des sommets. 


Nous arrêterons là cette analogie avec un espace à deux dimensions généralisable à chaque forme 
géométrique que nous allons présenter par la suite (cercle et sphère, ellipse et ellipsoïde, etc.). L'idée 
était surtout de soumettre la conception que les volumes que nous connaissons dans notre quotidien 
peuvent aussi être vus comme des formes à 4 dimensions traversant notre espace de 3 dimensions. 


1.1.4. TRIANGLE ISOCÈLE 


Définition: Un "triangle isocèle" est un cas particulier du triangle quelconque, dans le sens où il a deux 


côtés égaux (isométriques). 
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Le périmètre d'un tel triangle reste: 
mais comme il a deux côtés égaux tels que par exemple: 


La surface comme nous l'avons démontré dans le cas général reste: 


P=at+tb+e 


Phatb+b=at28 


Figure: 26.14 - Exemple de triangle isocèle 


(26.24) 


S = 27 (26.26) 
2 


(26.25) 


Et le centre de gravité reste, comme nous l'avons démontré dans le cas général, à la position: 


à 
à] 


al 

CG} 
Il 

WIN WI Win 
Ua 
Cu 


| 


| 


el 
I 

QG 
3 


Propriété remarquable d'un triangle isocèle: la médiatrice et la médiane h du troisième côté non égal 


aux deux autres sont confondues (cf. chapitre de Géométrie Euclidienne). 


1.1.5. TRIANGLE ÉQUILATÉRAL 


Définition: Un "triangle équilatéral" est un cas particulier du triangle, dans le sens où il a trois côtés 


égaux: 


Le périmètre d'un tel triangle reste: 


a =b 


Figure: 26.15 - Exemple de triangle équilatéral 
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P=at+tbh+e (26.28) 
mais comme il a trois côtés tel que x =b=6: 
P=3 (26259) 


La surface comme nous l'avons démontré dans le cas général reste: 


Et le centre de gravité reste comme nous l'avons démontré dans le cas général, à la position: 


A6 - 7x 
3 
.. — 
BG=—BB' (26.31) 
3 
ca - 200" 


Propriété remarquable d'un triangle équilatéral: Médiatrices et médianes sont confondues (cf. chapitre 
de Géométrie Euclidienne)! 


1.1.6. TRIANGLE RECTANGLE 


Définition: Un "triangle rectangle" est un cas particulier du triangle, dans le sens que sur un de ses trois 
angles, il y en a un qui est droit. 


Pa 
a 


Figure: 26.16 - Exemple de triangle rectangle 
Le périmètre d'un tel triangle reste: 
P=at+tbt+e (26.3) 


La surface comme nous l'avons démontré dans le cas général reste (surface de la moitié d'un rectangle 
de même base et de même hauteur): 


Et le centre de gravité reste comme nous l'avons démontré dans le cas général, à la position: 
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à 
à] 


al 

CG} 
Il 

WIN WI Win 
Co 
Cu 


| 


(26.34) 


| 


ol 
I 

QG 
“3 


Propriété remarquable d'un triangle rectangle: le triangle rectangle a ceci de particulier, que nous 
pouvons directement lui appliquer le théorème de Pythagore (cf. chapitre de Géométrie Euclidienne), 


1.1.7. TRAPÈZE 


Définition: Un "trapèze", est un quadrilatère (non croisé) ayant deux côtés (au moins) parallèles. 


Figure: 26.17 - Exemple de trapèze 


Lorsque les deux côtés ont même longueur (ou, sont de même longueur), nous obtenons les cas 
particuliers du carré, du rectangle, du losange, du parallélogramme (ici, ordre du plus précis au plus 
général, nous pourrions mettre le losange en n° 2). 


Aussi un usage courant consiste à ne retenir qu'une définition plus restrictive, afin de ne pas prendre en 
compte ces figures particulières. Nous ajoutons dans ce cas que les longueurs des deux côtés parallèles 
ne sont pas égales (cela permet aux élèves des petites classes d'éviter les confusions résultant de 
l'existence de deux noms pour le même objet, par exemple losange et trapèze). 


Remarque: Il existe un cas particulier de trapèze, le "trapèze isocèle", dont les deux côtés non 
parallèles sont de même longueur. (nous pouvons ajouter: Comme ses deux côtés ne sont pas 
parallèles, il ne s'agit pas d'un parallélogramme). 


1.1.8. PARALLÉLOGRAMME 


Définition: Le "parallélogramme" est un cas particulier du quadrilatère (et du losange aussi), où les 
côtés sont parallèles deux à deux: 


Figure: 26.18 - Exemple de parallélogramme 
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Remarque: Tous les parallélogrammes sont donc dans la famille des trapèzes. 


1.1.9. LOSANGE 


Définition: Le "losange" est un cas particulier du parallélogramme dans le sens où ses quatre côtés sont 
égaux. 


Figure: 26.19 - Exemple de losange 
1.1.10. CERCLE 
Il existe plusieurs définitions possibles du cercle. Voyons-en au moins deux. 
Définitions: 
D1. Un "cercle" est un cas particulier d'un polygone avec une infinité de côtés. 


D2. Un "cercle" est une courbe plane dont tous les points sont à égale distance d'un point fixe appelé 
"centre". 


Figure: 26.20 - Exemple de cercle 


Nous démontrons dans la section d'Informatique Théorique (cf. chapitre de Méthodes Numériques), 
que le périmètre d'un cercle de rayon R et donc de diamètre G = 2ÆR est donné par: 


P=27R=(2R)X =@'A (26.35) 
La relation de surface peut être obtenue de deux manières: 


1. Par recherche de la primitive du périmètre P ce qui nous donne: 
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= [Par = 27 [ RdR = JR? (26.36) 


2. La seconde méthode est plus esthétique et fait appel à l'équation paramétrique du cercle, trivialement 
donnée par les projections orthogonales des coordonnées cartésiennes: 
x = Rcos8 


(26.37) 
y=kRang 


Nous savons que l'aire décrite par une fonction f(x) est donnée par: 


è 


- fr Emas - [rar (26.38) 


Il nous suffit alors de substituer dans cette intégrale les variables paramétrées: 
y=kRsang dx=diRcos&) = Rdcos8 = -Rsin Sd (26.39) 
Ainsi: 
à à 


à 
S = [dx = [(Rsin 8): (-Roin dat) = -R? [sin/@d8 (2640) 
2 2 


2 
Les bornes d'intégration étant bien évidemment 8 =[0,-2#] nous avons: 


1: 


S =-R° oi 848 = -2R° fn 8489 = -2R fee 


8-28 [5n@8) _ 8 1h 
4 2 


Léa 


= R2 6j | = Rx 


(l 


Nous avons donc aussi par cette méthode: 


S = ni -a[ | - re (26.42) 


La longueur 1 d'une tranche d'angle d'ouverture & d'un cercle de rayon R est bien évidemment donnée 
par: 
27TR 
=——'a=kÀk« (26.43) 
27 


et la surface $; d'une tranche d'angle d'ouverture & d'un cercle de rayon R de manière identique par: 


Cherchons maintenant à déterminer la surface $, d'une tranche d'un disque : 
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Soit connue la relation de calcul de la surface d'un triangle. Nous avons selon la figure ci-dessous (la 
démonstration tient seulement dans le résultat lui-même): 


R,_a'(R-h) _ A1 _a'(R-#)_ Ri-a'(R-h) 


S'= 
a 2 2 R 2 2 


Figure: 26.21 - Calcul de la surface S, d'une tranche d'un disque 


Remarque: Par définition du cercle, il est évident que le centre de gravité du cercle se confond avec 
le centre de celui-ci. 


JET. ELEIPSE 


Définition: Une "ellipse" est une courbe fermée dont chaque point est tel que la somme de ses 
distances à deux points fixes appelés "foyers" est constante (comme nous l'avons vu dans le chapitre 
d'Algèbre Ensembliste, l'ellipse peut aussi être vue comme une transformation affine du cercle). 


D 


= en ne me mn ed us uen de eu me el ei mn En ae au es ed ae es te 


Figure: 26.22 - Exemple d'ellipse 
Introduisons pour commencer un petit texte relativement au calcul du périmètre de l'ellipse: 
Soit l'équation paramétrique en coordonnées cartésiennes d'une ellipse: 


x = acos 8 
(26.45) 
y =bsin 8 


La distance entre le centre de l'ellipse et son périmètre est alors donnée par le théorème de Pythagore: 
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R(8) = Va? cos? 9+b?sin? 9 (26.46) 
Un élément d'arc est alors donné par: 
R(8)48 = Ja? cos? 9+ sin? 9 48 (2647) 


Le périmètre de l'ellipse est alors donné par l'intégrale: 


2/2 


23 23 
P= 172% = [Var cos" 8+bsin? 8 d8=4 [ a? cos? 9+b?sin? 9 dE (26.48) 


et là ça commence à se corser... Ce genre d'intégrale n'est pas facilement calculable à l'aide des 
primitives connues, intégration par parties, changements de variable ou autre. Il s'agit de ce que nous 
appelons une "intégrale elliptique du second ordre en J" pour 0 <B <a (cf. chapitre de Calcul 


Différentiel Et Intégral): 
2/2 


J{a,b} = [ a? cos? 8+b?sin? 8 48 (26.49) 


De longs développements que nous présenterons dans quelques années dans le chapitre de Calcul 
Différentiel Et Intégral donnent pour le périmètre après un calcul en série limitée: 


Pa rm fète +5?) = 2xafi-e? (26.50) 


La relation de surface de l'ellipse peut être obtenue de manière très similaire à celle du cercle et les 
calculs sont curieusement beaucoup plus simples que ceux du périmètre. Rappelons que l'équation 
paramétrique l'ellipse est: 


x = acos 8 
(26.51) 
y = bain 8 


Nous savons que l'aire décrite par une fonction f(x) est donnée par: 


è à 
S = [Gex = P# (26.52) 
Il nous suffit alors de substituer dans cette intégrale les variables paramétrées: 
y=bsang dx=diacos8)=ad(cos 8) =-asin 48 (26.53) 
Ainsi: 


b b b 
S= [yax = [(bsin 9. (-asin 848) = -abfsin? 88 0659 


a Ce] Le] 


Les bornes d'intégration étant bien évidemment 8 =[0,-2x#] nous avons: 
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—24 —# 7 
. à 1-cos(28) 1 1 . 
S=-ab [ sin” 8489 = -2ab ne —2ab ru . Fan (28) 
(el Û 


= —2ab (2 (—-7) — sin (2. en) = É ‘0 = sin (2 )] (26.55) 


= —Dab 5 (—-7) = ab3T 


Remarque: Il faut faire attention dans ce genre de calculs à l'ordre des bornes d'intégration. 
Effectivement, si nous avions pris les bornes allant de [0,#] (au lieu de [0,—x]) il faut imaginer que 
la fonction intégrée parcoure le périmètre dans le sens négatif de l'axe des abscisses. Donc, 
l'intégrale serait alors forcément négative. 


Nous avons donc aussi par cette méthode: 


S = ab = TD (26.56) 


Remarques: 


R1. Nous supposons comme évident que le centre de gravité de l'ellipse se confond avec le centre 
de celle-ci. 


R2. Nous renvoyons le lecteur à l'étude des coniques (cf. chapitre de Géométrie Analytique) pour le 
calcul de la surface d'une ellipse à partir de son "paramètre d'ellipse" et de son "excentricité” (tout y 
est démontré). 


2. VOLUMES CONNUS 


Il existe plusieurs définitions du concept de volume (surface qui limite un corps). Une définition due à 
Euclide et une autre due au domaine de la topologie (voir le chapitre du même nom). 


Définitions: 
D1. Un "volume" est ce qui a longueur, largeur et hauteur. 
D2. Un "volume" est une variété topologique de dimension 3. 


Les surfaces qui limitent un corps peuvent être planes ou courbes: 
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Figure: 26.23 - Exemples de volumes délimités par une surface 
À gauche, le corps est limité uniquement par des surfaces planes, au milieu par une et une seule unique 


surface courbe, et à droite par une surface courbe et deux surfaces planes. 


Remarque: Nous nous intéresserons dans un premier temps uniquement aux propriétés (surface, 
volume, centre de gravité, moment d'inertie.) de volumes plongés dans des géométries 
euclidiennes. 


2.1. POLYÈDRES 


L'étude des polyèdres (particulièrement les polyèdres platoniciens) est très importante en physique 
(pour la cristallographie par exemple) et en mathématiques car elle permet d'avoir une application 
sympathique des groupes finis (cf. chapitre d'Algèbre Ensembliste). Il convient donc de porter une 
lecture relativement attentive à ce qui va suivre. 


Par ailleurs, l'étude des polyèdres est aussi un moyen très pédagogique et esthétique pour voir la mise 
en oeuvre de plusieurs théorèmes géométriques, de trigonométrie et d'algèbre vectoriel. 


Précisons avant toute chose que les différents polyèdres ne seront délibérément pas présentés sur un 
pied d'égalité. Ainsi, nous nous concentrerons sur certaines propriétés pour certains et pas pour d'autres. 


Définitions: 


D1. Un "polyèdre" est un solide dont la frontière est formée de plans ou de portions de plan. Les 

portions de plan, qui comprennent ainsi entre elles le polyèdre, sont les faces; chaque face, étant limité 
par intersections (les arêtes) avec les faces voisines, est un polygone. Les côtés de ce polygone sont les 
arêtes du polyèdre. Nous appelons "sommet" d'un polyèdre tout sommet d'une quelconque de ses faces. 


Sommets | Faces 
À 
Ce polyèdre possède Ce polyèdre possède Ce polyèdre possède 
six sommets. neuf arêtes. cinq faces. 


Figure: 26.24 - Exemple de polyèdre 
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D2. Un "polygone régulier" est un polygone dont les côtés, et tous les angles sont égaux (cette 
définition nous sera utile pour les polyèdres réguliers). 


2.1.1. PARALLÉLÉPIPÈDE 


Définition: Le "parallélépipède" est un volume à six faces parallèles deux à deux (donc il n'est pas un 
polyèdre régulier!). 


a … L 


: ”, 
Figure: 26.25 - Exemple de parallélépipède 


Son volume est simplement donné par la définition même du volume: 
V=ab.c (26.57) 
Quant à sa surface, il s'agit simplement de la somme des surfaces des rectangles sans rien de particulier. 


Calculons maintenant le moment d'inertie d'une plaque (parallélépipède) d'épaisseur e et de surface 
transversale S dont l'axe de rotation est y: 


Figure: 26.26 - Recherche du moment d'inertie d'une plaque 
Un élément de volume du rectangle (en gris) est donné par: 


dV = Six = dm= pSdx (26.58) 


+212 n 3 2 2 
F = [ram = x 0Sdx = pS = Dar. “pe PE ME (26.59) 


12 12 


et: 


| Es 


212 


et occupons-nous maintenant du moment d'inertie de ce rectangle par rapport à l'axe z (perpendiculaire 
à x et à y donc) et disposons les axes de façon à avoir: 
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Figure: 26.27 - Recherche du moment d'inertie de la plaque selon un autre axe 
Nous avons: 


= fra _- fé + y )dn = (ram + [y'a =J,+J, (6.60) 


où r est donc dans le plan de x et y. 


Avec: 
+812 + 2 3 3 
b b MW 
JF, = (y'am= ( y peady = gym AA) 21 1- 
x © [> dr sé ch Da ; T 
(26.61) 
2 +a/2 : : +a/2 2 pea 2 3 : 3 : 
J = fx dm= | x" Ceadx= pea | x'dy = — () 1) = —4 
je [ ni 2 3 2 2 12 
d'où: 


d, Hi) 0662 
12 


Soit le moment d'inertie d'une plaque rectangulaire: 


J,= (a +b) (663) 
12 


si la plaque est carrée de côté L: 


Nous allons montrer qu'il est dès lors possible de calculer le moment d'inertie du triangle équilatéral et 
rectangle. 


Le moment d'inertie toujours par rapport au même axe, mais pour la moitié du carré, est donné par: 


J,—— (26.65) 
2 6 LE 


Si le centre de gravité est posé sur le tiers de la médiane partant du centre de gravité du carré et que 
nous faisons usage du théorème de Steiner (cf. chapitre de Mécanique Classique), il vient: 
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ME 1 pre 
= + J92M (26.66) 
2 


qui est donc le moment d'inertie d'un triangle équilatéral. 


En procédant exactement de même pour un triangle rectangle de côtés a, b dont l'axe de rotation passe 
par le centre de masse G, il vient: 


7 = Ma +), 


1 : 
2 IBLM (26:67) 
; 24 2 


2.1.2. PYRAMIDE 


Définition: La "pyramide" est un polyèdre qui a pour base un polygone et pour faces latérales des 


triangles réunis en un point appelé "sommet". La pyramide n'est donc pas dans le cas général un 
polyèdre régulier! 


Figure: 26.28 - Exemple de pyramide 


Considérons une surface S(t) de la section de la pyramide avec le plan d'équation z = +, alors le volume 
V cherché est égal à: 


k 
His (26.68) 


Nous parlons d'équation de plan alors qu'il n'y a pas de repères défini pour l'instant. Au fait, dans 
l'intégrale, t varie entre 0 et h. Cela sous-entend que nous prenons un repère centré en H (le pied de la 
hauteur de la pyramide), d'axe de la droite 54 (la hauteur de la pyramide) orientée de O vers H (du 
pied de la hauteur vers le sommet). Les deux autres axes sont choisis quelconques dans le plan de la 
base de la pyramide. 


Il nous faut préciser maintenant ce que vaut S(t) en fonction de t: 


Soit S l'aire de la base de la pyramide. La section de la pyramide par le plan d'équation z = + se déduit 
par l'homothétie de centre O et de rapport t/h. Donc, l'intégrale s'écrit: 


k £? 
F = 1 —d£ (26.69) 
À 
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Le fait d'avoir pris le carré de t/h provient de ce que chaque terme intérieur de S est le produit de deux 
termes (selon le calcul de la surface d'un triangle) chacun de rapport d'homothétie t/h. 


Ainsi, nous avons: 


k 
S'h 
F4 = (26.70) 


2.1.3. PRISME DROIT 


Définition: Le "prisme droit" est un polyèdre dont les bases sont deux polygones égaux à côtés 
parallèles (elles ont la même surface!), les faces latérales étant des parallélogrammes. Donc, le prisme 
droit n'est pas un polyèdre régulier! Les deux faces parallèles et de même forme sont appelées les bases 
du prisme droit. 


Figure: 26.29 - Exemple de prisme droit 


Pour calculer le volume V d'un prisme droit, nous devons tout simplement multiplier l'aire de sa base B 
par sa hauteur h: 


W=B.h (26.71) 


Sa base est un polygone, c'est-à-dire qu'elle peut être un triangle, un quadrilatère, ou un pentagone. Il 
faut donc savoir calculer ces aires pour calculer le volume du prisme droit. 


2.2. POLYÈDRES RÉGULIERS 


Définitions: 
D1. Un "polyèdre régulier" est constitué de faces toutes identiques et régulières. 


D2. Un "polyèdre convexe" est tel que chaque point d'un segment de droite qui joint deux points 
quelconques appartient au polyèdre. 


Les polyèdres réguliers sont au nombre de neufs, dont cinq sont convexes et étaient connus de Platon. 
Nous appelons parfois polyèdres réguliers uniquement les solides de Platon et ce sont ceux-ci qui vont 
nous intéresser ici. 


Démontrons d'abord qu'il n'existe que cinq polyèdres réguliers convexes qui sont donc appelés "les cinq 
solides platoniciens" (les autres colonnes du tableau ci-dessous seront démontrées et expliquées un peu 
plus loin): 
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| Nom(mm) | Image |SJAÏFF-A+S 


Tétraèdre (3,3) 


Hexaëèdre ou cube (4,3) 1216 2 


Octaëdre (3,4) 12) 8 2 


Dodécaëdre (5,3) 3012! 2 


Icosaëèdre (3,5) 3020! 2 


Tableau: 26.1 - Cinq polyèdres réguliers 
Démonstration: 
Soient m le nombre de côtés de chaque face d'un polyèdre régulier, n le nombre d'arêtes qui se 


rencontrent en chaque sommet. Nous avons alors que chaque angle d'une face quelconque est donné 
par: 


28 = 22 À) (26.72) 
2 ma 


Attention, c'est l'angle 2,8 qui définit donc l'angle d'une face et non pas £! 


Ce qui découle de la figure suivante: 
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Figure: 26.30 - Angles entre les arêtes d'un polyèdre régulier 


où nous avons: 
27 . 
&=—— (26.73) 
mi 


et: 


27 _ 
28=H7-a@=7-—=—|2-—| (26.74) 
m 2 mi 
Mais la somme des n angles groupés autour d'un sommet est plus petite que les n angles qui coupent un 
plan en parties égales (nous supposerons cela intuitif par découpage)! Chacun d'eux est donc inférieur 


x 


d: 


—— (26.75) 
# 
donc: 
7 4 
ml = leu (3670) 
2 A # 
d'où: 


1 1 1 L 
—+—5>— (26.77) 
M A À 


Les nombres m et n sont tous deux au moins égaux à 3 (le plus petit polygone étant le triangle). Il en 
résulte que les seuls cas possibles sont: 


(n,n) = (3,3), (84), 4,3,(39,(5,D}) (26.78) 
OIC.Q.FD. 


Notons maintenant F le nombre de faces, À le nombre d'arêtes et S le nombre de sommets. Alors, 
rappelons que nous avons démontré dans le chapitre de Théorie Des Graphes la "formule d'Euler" (ou 
"théorème de Descartes-Euler"”) telle que: 


F-A+S=2 (26.79) 
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et celle-ci est bien évidemment valable aussi pour l'aplatissement d'un polyèdre dans le plan (et donc in 


extenso d'un polyèdre). 


Remarque: La représentation sous forme d'un graphe de l'aplatissement d'un polyèdre est appelée 


"diagramme de Schlegel". 


Figure: 26.31 - Exemples de diagrammes de Schlegel 


Dans le cas des polyèdres réguliers, chaque face possède m arêtes de sorte que »#7. F est l'ensemble des 
arêtes des faces et comme chaque arête rencontre exactement deux faces, nous avons l'égalité (prendre 


un exemple pour s'en convaincre au cas où!): 


m3. F =2. A (26.80) 


et comme n est le nombre des arêtes qui se rencontrent en chaque sommet, et que chaque arête relie 


deux sommets, nous avons également: 
mF=n.S (26.81) 
Soit: 
m F=n.S=2.A (26.82) 


En injectant dans la formule d'Euler, nous avons alors: 


et nous retrouvons l'inégalité du théorème précédent. Reprenons notre calcul: 
mEF mr nm M 
F-A+S=2=F-—+— =F|1-—+— 1) (2684 
À # 2 


d'où nous tirons: 
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s. : F. 4x 
m M 2h mn 4 2m On-mn+2m (26.85) 
2 An  2n 2n 2h 


Nous pouvons maintenant entreprendre la classification des polyèdres réguliers. 
Le tétraèdre (72,2) = (3,3) : 


4n 12 4 4-1 E se (26.86) 


EF = = = 
2n—-mn+2m 6-9+6 2 2 # 


L'octaèdre (##,#) = (3,4) : 


re 16  _g 4-24 y - 24 _ (26.87) 
8—-12+6 2 
L'hexaëdre (;#4,#) = (4,3) ou cube: 
= 12 = -A _p ç = 24 - (26.88) 
6—-12+8 2 
L'icosaèdre (##,#) = (3,5): 
= Eu = 22 ge 0 26 (26.89) 
10-15+6 2 
Le dodécaèdre {#,#) = (5,3): 
12 = 0 _ 2-6 (26.90) 


F=—_2 =]2 4 
6—15+10 2 
ce qui termine notre classification. 
2.2.1. TÉTRAËDRE RÉGULIER 


Nous avons montré que pour le tétraèdre À = 4,2 = 3 et il est relativement aisé de deviner qu'un tel 
polyèdre est formé de 3 triangles équilatéraux identiques comme le montre la figure ci-dessous: 


D 


Figure: 26.32 - Exemple de tétraèdre régulier 
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Pour cela, commençons par étudier le triangle équilatéral suivant: 


Figure: 26.33 - Triangle équilatéral de départ pour le calcul du volume 


Dans ce triangle équilatéral, a est le côté, h la hauteur. Les médiatrices sont h, h', h" des côtés respectifs 
BC, AB, AC. 


h et h' se coupent en un point P (barycentre). Par construction du triangle équilatéral, nous avons 
PC = PB = PA (il suffit d'appliquer Pythagore pour le démontrer). 


Nous avons par ailleurs démontré lors de notre étude du triangle, que le barycentre de celui-ci se situe 
toujours à 2/3 de la hauteur de la médiane. Comme médianes et médiatrices sont confondues dans le 
cas du triangle équilatéral, nous avons alors AP = 2j3.}. 


Maintenant, nous tirons une droite passant par le point P et perpendiculaire au plan dans lequel se 
trouve le triangle. Soit D un point sur cette droite, comme PB = PC = PA = 2j3.} nous aurons bien 
sûr BD = AD = CD (il suffit d'appliquer Pythagore à nouveau!). 


Il ne nous reste donc plus qu'à nous arranger pour que BD =4 et nous aurons le tétraèdre régulier que 
nous voulions. Nous calculons alors: 


BP?+PD?=BD?=4? (26.91) 


et donc: 


donc: 


# = fe (26.93) 
3 
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B À 


C 


Figure: 26.34 - Synthèse de toutes les variables 


La médiatrice de BD passant par M coupe H en un point O, qui n'est rien d'autre que le centre de la 
sphère circonscrite au tétraèdre. En effet, par construction, nous avons @8 = OC = OA et la médiatrice 
nous donne 08 = 09. 


Thalès nous donne également: 


1 1 a 
— = 7 | _ _ 
ll, FD 2 PD 2 2 2 2 (26.94) 


et pour les développements qui suivront nous poserons À = PD,OD =R. 


Calculons maintenant la surface totale. Elle sera nécessairement donnée par la surface d'une seule face 
multipliée par le nombre de faces, et comme nous avons démontré comment calculer la surface d'un 
triangle plus haut il vient immédiatement: 


San (2 base hauteur] =4 a hs4 à 3 à Ÿe = 4° (26.95) 


Pour le volume, c'est tout aussi simple puisque nous avons démontré plus haut quel était celui d'une 
pyramide. Il vient alors immédiatement: 


1 43a° V2 V2 ; 


un Mir He Ve N°, (26.96) 
3 3 4 


2.2.2. HEXAËDRE RÉGULIER (CUBE) 


Le cube est le polyèdre régulier qui nous est le plus familier, il compte 6 faces et sa construction ne 
nécessite probablement pas d'être présentée. 
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Figure: 26.35 - Exemple d'hexaèdre régulier (cube) 


Puisque tous les côtés sont de longueur a, la surface est simplement donnée par la multiplication de la 
surface des 6 faces. Ainsi: 


S=6.a? (26.97) 
et le volume: 
W=a (26.98) 
2.2.3. OCTAËDRE RÉGULIER 


Nous avons montré que pour l'octaèdre F = 8,2 =4 et il est relativement aisé de deviner que l'octaèdre 
régulier est formé (par définition) de 8 triangles équilatéraux identiques. 


Pour construire, et montrer qu'il est possible de construire, un tel polyèdre, nous posons comme 
précédemment que son côté vaut a. 


À D 


B C 


Figure: 26.36 - Exemple d'octaèdre régulier 
Ensuite, nous notons O le point d'intersection des deux diagonales. Nous avons alors: 
AC? = a? +4? = 24? = AC = f2a (699) 


et: 
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AC=—— (26.100) 


Sur la droite perpendiculaire au plan qui contient notre carré, et passant par O, nous ajoutons deux 
sommets E, F à une distance que nous calculons comme suit : 


OA? +08? = AE? =? (26.101) 


d'où nous tirons: 
a* (26.102) 
Donc: 


OE = =OA=-0F (26.103) 


F 


Notre polyèdre est bien formé par huit triangles équilatéraux tous identiques. Chaque sommet compte 
quatre arêtes et quatre faces, ce qui nous permet d'affirmer qu'il est bien régulier et termine ainsi notre 
construction. 


La surface de l'octaèdre régulier est: 


1 1  /3a 


S=n—.a h=8-.a. *=2/3a1 (26.104) 
2 2 2 


avec h étant la hauteur du triangle équilatéral de côté a que nous avons déjà calculée plus haut. Pour le 
volume, c'est encore basé sur celui de la pyramide. Aïnsi: 


F= 2. base hauteur = 2. =.à = —"—.# (26.105) 


Et nous supposerons qu'il est évident pour le lecteur que notre octaèdre est inscrit dans une sphère de 
rayon R dont le centre est le point ©. Pour R, nous avons: 


R=OA=O0E = =. (26.106) 


aJè | 


Montrons déjà maintenant que nous pouvons construire l'icosaèdre régulier à partir de l'octaèdre et que 
ce premier existe et est bien constructible. 


Pour cela, nous allons d'abord considérer un repérage vectoriel des points suivants de l'octaèdre avec 
l'origine O placée au barycentre: 


Page: 1552/4839 


[v3.0 - 2013] 


F 


Figure: 26.37 - Exemple d'octaèdre 


Nous avons alors: 
A= (R,0,0), 2 = (0,R,0),C = (-R,0,0), D = (0,-R,0), Ë = (0,0,R),F =(0,0,—R) (26.107) 


Une fois ceci posé, considérons la figure suivante: 


Fe 


Figure: 26.38 - Recherche de la position du triangle équilatéral 


Sur la figure ci-dessus, A est un point qui part de A et qui arrive en B, et soit B' un point qui part de Cet 
qui arrive en B, et pour finir E' un point qui part de B et arrive en E. Ces trois points partent en même 
temps et avancent à la même vitesse. Si nous suivons ces trois points, qui forment un triangle A'B'E", 
nous sentons bien intuitivement qu'il existe un lieu tel que A'B'E" soit un triangle équilatéral. 


Déterminons ce lieu: 
AB=0B-OA=(-R,R,0) OA'= OA+ AB = R(1- y, j4,0) 


CB=0OB-OC=(R,R0) OB'=OC+uCB=R(u-14,0) (26.108) 
BE=O0EË-OB=(0,-RR) OE'= OP +uBE = R(0,1- 4, 5) 


et donc: 


‘B'= OB'-OA4'=R(24-2,0,0 
- ou, (26.109) 


‘E'=OE'-OA'=R(4-1,1- 24,4) 
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et nous voulons: 


FAI FAI EF cs 
Alors: 
AA = reu-2 = [Fr fr f(u- 1) +020) +42] corn 
Soit: 
4 -Su+4=6?-6+2 (26.112) 
Ce qui se simplifie en: 
pô g-1=0 (26.11) 


et comme Ô = # £1, nous obtenons pour la résolution de ce polynôme du deuxième degré (cf. chapitre 
de Calcul Algébrique) la seule solution acceptable : 


= Et +45) (26.114) 


le lecteur remarquera peut-être qu'il s'agit de l'inverse du nombre d'or. 


Selon la figure ci-dessous, si nous posons ©7'= OÆ + HEA alors nous retrouvons à nouveau la même 


valeur pour ## (soit le lecteur le vérifiera lui-même, soit nous sur demande nous pouvons faire le détail 
des calculs) et idem pour tous les autres points: 


Figure: 26.39 - Construction de l'icosaèdre régulier 


Notre nouveau polyèdre comporte donc une face par face de l'octaèdre et une face par arête de 
l'octaèdre. Nous avons ainsi vingt faces composées de triangles équilatéraux identiques. De plus, cinq 
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arêtes et cinq faces se rencontrent en chaque sommet. Nous obtenons alors un icosaèdre régulier. 


Nous avons pour les coordonnées de chaque sommet (il faut bien observer que les sommets sont 
opposés par paires en une composante sur la figure): 


| 


A'=R(-4,4,0) D'= R(-4,-j4,0) 
B'=R(u-1,4,0) C'=R(- 4-40) 
FR FRS FE60 ol 
F'=R(O04-14) G'=R(0,4-1-4 
= R(4,0,1-4) L'= R(-4,0,1- 4) 
J'=R(4O. u-1 K'=R(-u,0,1-i 


2.2.4, ICOSAËDRE RÉGULIER 


Nous avons vu précédemment comment construire l'icosaèdre régulier. Il existe donc bien. 


Figure: 26.40 - Représentation de l'icosaèdre régulier 


Connaissant les coordonnées des différents sommets, calculons maintenant la surface et le volume de 
l'icosaèdre régulier. 


Le calcul de la surface est simple puisqu'il s'agit de 20 triangles équilatéraux. Nous avons doc: 


A'B\= R(24-2,0,0) (26.116) 


donc: 
FE 2R(H{—-D=a' (26.117) 
Donc: 
S = 20 a .R = 20 ga’ | a'2- G+)) = 20. sa’ 2e - 20 Li (26.118) 
Donc: 
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S=5.43.a? (26.119) 
Le calcul du volume est lui un peu plus subtil... 


L'icosaèdre est construit autour du pentagone et de la section d'or comme nous avons pu nous en 
apercevoir lors de notre étude de l'octaèdre. 


Si jamais le lecteur n'est pas convaincu voici une figure supplémentaire où nous voyons bien que 
chaque arête de l'icosaèdre est une arête d'un pentagone (AFECB, LGHJK, DAJKC, DEGHA, BJILC, 
FELIH...): 


1 
Figure: 26.41 - Pentagones dans l'icosaèdre régulier 


Utilisant la méthode des pyramides, nous avons 20 triangles équilatéraux qui servent de base à une 
pyramide dont la hauteur va jusqu'à l'origine O de l'icosaèdre (ou l'origine confondue de la sphère 
inscrite ou circonscrite). 


Prenons pour exemple la base ABD avec l'intersection des médiatrices se trouvant au point M comme 
représenté ci-dessous. 
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o 


Figure: 26.42 - Représentation d'une des pyramides de l'icosaèdre régulier 


Comme nous le savons, le volume de chaque pyramide est: 


-b.} (26.120) 


La surface b est dans notre situation celle du triangle équilatéral ADB et la hauteur h est le segment 
OM. 


Si nous notons a le côté de triangle, alors la surface est donnée par: 


Pour trouver h, nous savons par construction du point M que les triangles OMA, OMB, OMD sont des 
triangles rectangles. 


Travaillons arbitrairement avec le triangle OMD. D'abord, déterminons la longueur DM. Nous avons 
démontré lors de notre étude des médiatrices de longueur H du triangle équilatéral (cf. chapitre de 
Géométrique Euclidienne) que DM vaut alors: 


Or: 


(26.123) 
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Donc finalement: 


3 3 


—à = —g =—& (26.124) 


D Us 72 


Pour trouver h nous devons trouver la longueur QD => en termes de longueur des arêtes a de 
l'icosaèdre. Pour cela, nous devons reconnaître une des propriétés géométriques élémentaires de 
l'icosaèdre. 


DM = 


LU | 1 


Avant d'aller plus loin, montrons une propriété du pentagone ci-dessous avec ses diagonales d et ses 
cotés c: 


Figure: 26.43 - Parallélogramme dans un pentagone 


BSEA est un parallélogramme. Effectivement, la diagonale BD est parallèle au côté AE (par exemple, 
parce que tous deux sont perpendiculaires à l'axe de symétrie passant par OC). Comme S est sur BD, 
cela prouve que BS et AE sont parallèles. Nous montrons de la même manière que AB et SE sont 
parallèles. 


Nous en déduisons que: 

SD=BD-BS=BD-AE=d-0c (26.125) 
et de même pour CS: 

CS = EC-ES=EC-AB=d-c (26.126) 


Continuons..., nous avons l'égalité 3 4% = sn. Comme de plus CD et BE sont parallèles, les triangles 


SCD et ABE sont semblables. Par conséquent, les rapports de distances entre leurs côtés sont conservés 
(Thalès): 


d'où la relation: 
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€ dc 
= (26.128) 
d € 
Après quelques remaniements: 
d(d-c)-c.ce 
2e — =0S 4? -de-c? =0 
€ € c(d-c) 
, (26.129) 
2%-£-1-0 
€ [es 


et £# étant strictement positif, nous avons déjà vu lors de notre étude de l'octaèdre que l'unique racine 
positive est le nombre d'or: 


_à 1+5 (26.131) 
c 2 


Nous venons donc de montrer qu'une diagonale d'un pentagone est égale au nombre d'or multiplié par la 
longueur d'une arête de ce même pentagone. 


Ainsi, nous avons dans les pentagones AFECB et LGHJK de notre icosaèdre: 
FB=GK ={{.a (26.132) 


Remarquons également le rectangle FBGK dont le barycentre est confondu avec celui de l'icosaèdre. 
Par ailleurs, FK et BG représentent par construction le diamètre de la sphère circonscrite à l'icosaèdre 
et donc OF = OK en est le rayon r que nous allons chercher. 


Nous avons: 
FK? = FR? + BK? = ja? +a? = (42 +1)a? (6133 
Donc: 
FK = ae +1 = 0.r (26.134) 
d'où: 


[2 
re NA +1 06135) 


2 


Maintenant, nous pouvons calculer h : 
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2 2 
? (42 +1) 1 2 (4 #l)-4 , gt à (26.136) 


k=0M =rP-pDM= | ,2- 
4 3 12 12 


Or: 


= {+1 (26.137) 
> X 


puisque le nombre d'or est racine de l'équation ;2 = ;+1. 


Soit: 
2 
(42) = (ui +1) = 2 +2u+1= 2 + 242 —1)#1= 3-1 (26.138) 
Donc finalement: 


4 
h? del (26.139) 


12 12 


et: 


tt ——d= gg (6141) 
4 
Comme il y a 20 pyramides: 
3 5 
F=20 a ==y#a (26.142) 
24 6 


2.2.5. DODÉCAËDRE RÉGULIER 


Faute d'avoir trouvé dans la littérature une manière esthétique et simple de faisabilité de construction 
du dodécaèdre, nous nous en passerons pour l'instant (il est possible de vivre sans...). 


Remarquons simplement que le dodécaèdre est composé de 12 pentagones réguliers et son volume est 
assimilable à celui d'un parallélépipède sur lequel nous avons posé sur chacune des faces une sorte de 
petit toit ce qui au final va donner les pentagones: 


Page: 1560/4839 


[v3.0 - 2013] 


‘En 


TT 
SQ 
Figure: 26.44 - Dodécaèdre régulier 


Pour notre étude du dodécaèdre, nous nous intéresserons uniquement à déterminer sa surface et son 
volume. 


Pour cela, considérons dans un premier temps le pentagone régulier ci-dessous: 


B 


Figure: 26.45 - Pentagone régulier pour la recherche du volume du dodécaëèdre régulier 
Nous allons d'abord devoir déterminer la longueur de h et de b. 


Rappelons d'abord que nous avons lors de notre étude l'icosaèdre déjà démontré que la diagonale d'un 
pentagone est reliée à la longueur de ses côtés par la relation: 


b=a.{{ (26.143) 
où / est donc le nombre d'Or. Il nous reste alors à déterminer h. 


Il est d'abord évident que $= 2#/10 = x/5 = æ/2 et que: 
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c-cos(#) = (26.144) 


Or, deux informations nous manquent ici: l'angle et c. Commençons par déterminer combien vaut le 
cosinus sans utiliser la calculatrice (vous comprendrez pourquoi...). 


Nous avons d'abord selon la relation (cf. chapitre de Trigonométrie) cos{2x)} = 2 cos?( x) - 1: 


cos (42) = 2cos° É 2) —1 (26.145) 
5 5 
COS (r- 2) dc (22) —1]1 (26.146) 
5 5 


Mais cela s'écrit également en utilisant toujours la même relation trigonométrique remarquable: 


2 
cos(r-7) = 2| 2c0s° (2) —1 (26.147) 
5 5 
— cos (2 =Bcos* (2) — Bcos” (2) +1 (26.148) 
5 5 à 


En faisant un changement de variable et en réarrangeant les différents termes: 


Ce qui s'écrit aussi: 


Soit après simplification: 


8X*-8x?2+X+1=0 (26.149) 


Nous avons -1 et 1/2 qui sont deux racines évidentes et nous obtenons donc (cf. chapitre de Calcul 
Algébrique): 


1 
(x) #7) 0 (26.150) 


Nous n'avons plus qu'à résoudre une simple équation du deuxième degré dont la solution est triviale en 
appliquant les méthodes vues dans le chapitre de Calcul Algébrique, et nous obtenons: 


X= 15 (26.151) 
4 


Soit en ne prenant que la seule solution admissible, nous avons alors: 


Fr 1+5 (26.152) 
2 4 


nous retrouvons donc nombre d'Or là aussi! et ceci nous amène directement à écrire que: 
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Il nous reste à déterminer c. Nous avons: 


2 
(ge) +h? = c? = rat + ut = (4-2 )= a? (26.154) 


et comme 4? - j{— 1= 0 nous avons: 


(4- É)2+ 4) = 8+ du 24 — 4e =8+4u- 2 - p(u+1)=8+34- 34 


(26.155) 
= 8+3(u-u°) = 8+3(-1)=5 


et donc: 
1 dE . 
= : DR AR ET D is 
(4— °) 5 3 
d'où: 
2 
seu +1, (26.157) 


5 


Nous avons donc pour le calcul de la surface du pentagone, une surface composée de 12 pentagones 
dont chacun est composé d'un triangle de base a et de hauteur h. 


+1 
S=12.5a h= 308 h=30a pc l5a.dc=l5.a de # 


(26.158) 
2 


= 13H: ni = 3. 42/54 +1 


Pour calculer le volume, nous allons faire usage de l'astuce mentionnée au début. C'est-à-dire de 
découper dans un premier temps le dodécaèdre en un parallélépipède de côté: 


é=s-le 


+5 (26.159) 
2 


puisque le côté du parallélépipède est une diagonale du pentagone de côté s et de 6 petits toits (qui sont 
bien visibles sur la figure du dodécaèdre donnée précédemment). 


Chaque petit toit selon deux vues différentes aura les longueurs suivantes (où nous retrouvons bien 
évidemment pour certaines arêtes celles des pentagones s ou encore les diagonales c de ceux-ci): 
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Ca! 


Figure: 26.46 - Autres éléments de volume du dodécaèdre régulier 


Pour chaque petit toit, nous traitons à part les extrémités en les séparant et en les réunissant. 
Finalement, nous avons deux morceaux à traiter: la partie majeure du toit visible à gauche sur la figure 
ci-dessous et la partie secondaire du toit à droite sur la figure qui n'est autre que la réunion des 


extrémités du toit: 


2x 


Figure: 26.47 - Décomposition 
Il nous faut donc déterminer x et 1 et h puisque c et s nous sont déjà connus. 
D'abord, nous voyons trivialement que: 


c—s 
X=-—— (26.160) 


Du théorème de Pythagore, nous avons alors: 


2 
Park =P + 


(26.161) 


_à 2 
2 (ES) = }? (5) (26.162) 
2 2 


Il vient alors: 
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2 


(26.163) 


_ 2 3 (+), 1445 |_ affaires) a [7 


8 


Donc: 


hk = (26.164) 


- 
2 


Nous pouvons maintenant calculer le volume F, de l'ensemble des 6 petits toits: 


PR =6 Loop s À = 6 les , s,css 
3 2 5 à à 2 2 


AH) LE = 
2 2 


3 D EU À 


(26.165) 


(25 -jnes n8). [A 6] 


4 


4 È. 


| I 


2e 


Donc, le volume total du dodécaèdre est finalement le volume des 6 petits toits sommé au volume du 
parallélépipède central: 


e(8) (28) --(20-[228) (25) 
26) tes Le (++ ] (26.166) 
_ Le as +) [ER 5)|- ee 
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2.3. CORPS DE RÉVOLUTIONS 


Définition: Un "corps de révolution" est un volume que nous obtenons en faisant tourner une courbe 
2D autour d'un axe. 


Il existe donc autant de corps de révolution que de type de courbe fermée ou non que nous pouvons 
faire tourner autour d'un axe. 


Voyons avant d'aller plus loin la méthode générale permettant de déterminer l'aire d'un corps de 
révolution. C'est-à-dire la surface du corps engendrée par la rotation d'une courbe de longueur finie 
autour d'un axe: 


esmmnmmsmmse" 


Figure: 26.48 - Exemple de construction d'un corps de révolution 


Pour cela, nous remarquons que lorsque la courbe est donnée par une équation y = f(x) nous 
remarquons par Pythagore (voir figure ci-dessous) que l'élément de longueur dl vérifie (relation que 
nous avons déjà rencontrée dans d'autres chapitres du site): 


a = dr + = dr +(f'(x)) dr (6167) 


donc : 


a = f+ (FD) ax (5.160) 


Ainsi, l'élément de surface engendré par la rotation de l'élément de longueur dl est donné par: 
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aS = 2x|f (x)|-at = 2x| (0 +(7 (2) dx (26.169) 


L'aire de la surface de révolution engendrée par une fonction f :[4,]—IR continûment différentiable 
est donc donnée par la relation: 


à 


S= 2r[ | (x)| 1+(F 2) dx (26.170) 


2 


2.3:1. CYLINDRE 


Définition: Un "cylindre" est une surface engendrée par une droite qui se déplace parallèlement à une 
direction fixe en rencontrant une courbe plane fixe, dont le plan coupe la direction donnée. 


Figure: 26.49 - Exemple de cylindre 


Le volume d'un cylindre de révolution de rayon x => et de hauteur égale à h se calcule par la méthode 
des disques en sachant que la surface d'un cercle (disque) vaut x}? : 


& 
F = 77 1% = 77° »t = 77h (26.171) 


La surface d'un cylindre étant simplement la somme de la surface des deux disques de base et du 
sommet et de la surface du rectangle plié de hauteur h et de longueur 2x : 


S=2{7#r")+277rh (26.172) 


Calculons maintenant le moment d'inertie d'un cylindre plein par rapport à son axe de symétrie vertical 
(axe de révolution): 
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Figure: 26.50 - Recherche d'un de moments d'inertie du cylindre plein 
Nous avons: 
dm = odV = p2rrhàr (26.173) 
Donc: 


2 k* k? k? 
J, = [rar =fer* 2rrhdr = dd = 27h = o7R°?h su ee (26.174) 


Soit maintenant G le centre de gravité du cylindre, & coïncide avec l'axe de révolution du cylindre. 
Les axes &, et G, jouent des rôles identiques. Les moments d'inertie J;, et J, par rapport à ces axes 


sont donc égaux et s'écrivent: 
Le. fa +z)dm= JT, = (2 +z dm = J (26.175) 
d'où: 
Ce [LES +22 + y? +2 dm =[c +y? +227 )dm (26.176) 
d'où: 
Jo = cf + y? +27 dm = Je + y? dm + [z'am (26.177) 
La première intégrale est en fait le moment d'inertie du cylindre par rapport à l'axe Œ et nous savons 


qu'elle vaut: 


2 
Tu == es (26.178) 


La deuxième intégrale se calcule facilement en découpant le cylindre en tranches d'épaisseur dz 
perpendiculaires à l'axe G.. La masse de la tranche élémentaire est dx = 77° oz soit: 


k;2 
k° 2 


[rar 2 [ xrr° pz° dz = 2m PE MS (26.179) 


Le moment d'inertie d'un cylindre par rapport à un axe perpendiculaire à son axe de révolution s'écrit 
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donc: 


R2 2 
dé == de = d, =] — + — 26.180 
D + 67 4 É ï) Fun? 


Calculons maintenant le moment d'inertie d'un tube ou d'un cylindre creux d'épaisseur non nulle 
(toujours donné dans les formulaires techniques): le moment d'inertie d'un tube par rapport à son axe de 
révolution est un grand classique du traitement du moment d'inertie du cylindre. Ainsi, considérons un 
tube de rayon extérieur 7, et de rayon intérieur >. Comme (cf. chapitre de Mécanique Classique): 


* 
D, =J (26.181) 


il 


Il vient dès lors que le moment d'inertie d'un tube peut être vu comme le moment d'inertie du cylindre 
de rayon égal au rayon externe du tube diminué du moment d'inertie du cylindre de rayon égal au rayon 
interne du tube. Ainsi: 


Mir Mir 
Juve a DE — + + = ler? - o7r} hr? = . r =" | 
(26.182) 
PT 1 _ 2)f 2, 2 pñhire 5) 2,,2,_M 2,2 

go Ve file #4 = (7e Le rat Lin 
et sir? #7 =7, il vient dès lors la relation classique disponible dans nombre de formulaires de 
physique: 

72 
Se MA y (6189 
2 

23,2.CÔNE 


Définition: Un "cône" est une surface engendrée par une droite mobile, passant par un point fixe et 
s'appuyant sur une courbe fixe; solide déterminé par cette surface. 


Le volume d'un cône de révolution de rayon à la base r et de hauteur égale à h se calcule également par 
la méthode des disques. 


La droite passant par les points (7,0) (extrémité de la base du cône) et {0,#) (sommet du cône) est: 


—h 
Y=axtb=—x+}h (26.184) 
Fr 


La rotation de cette droite par rapport à l'axe des y donne le volume du cône: 


à & 2 7 2 2 
15, 131 > _._a21|(. > LE RE LE Te 
F-xfx dar ' 7) dy = 77 at z) | h) = g (0 1) : | (26.185) 
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Figure: 26.51 - Exemple de cône 


Pour calculer la surface latérale d'un cône, nous allons paramétrer la droite qui part du sommet du cône 
de (0,0) à (r, h) ce qui est donc une paramétrisation différente que celle pour le volume (cela permet de 
simplifier un peu les calculs). Nous avons alors: 


ris Lx (26.186) 
k 
et donc: 


À À 2 2h 
; 2 Fr Fr La 
$; = 2af@N+ (x)) dx = Gi 1+ he EL el Xdx 


| 2 | 2 2 | 2 
: F CS | 2h Fr Fr 2 | : F2 2 2 k 
, M L=7> ne = zh 7 k +r =77 air 


Donc, la surface totale du cône (base + surface latérale) est alors: 


| h° | h° 
S=S,+8 = 7° +777 emafre 5 (26.188) 
r r 


Calculons maintenant le moment d'inertie d'un cône par rapport à son axe de révolution: 


Fr 
— x 
L 


(26.187) 


Pour ce calcul, nous allons utiliser la valeur du moment d'inertie du cylindre J,., et considérer le cône 


comme un empilement de cylindres infinitésimaux. 


Donc: 


Fe Ph an) Posn_PH$s, _ HR 

J. = [af =f—_ din = | osrrdhi= fr di = fr dr = 
1 [do [5 te 2 | 2 R 10R : 
(26.189) 


an ETAT 


[ TRAÏ3R _ 3 ),p2 
10 10 
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2.3.3. SPHÈRE 


Définition: La "sphère" est le volume engendré par la rotation d'un disque (ou cercle) de rayon r 
autour de son centre de gravité. 


Figure: 26.52 - Exemple de sphère 


Nous pouvons voir une sphère de rayon R, comme une surface qui est formée par la rotation d'un 
demi-cercle autour de son grand axe. La fonction décrivant un demi-cercle étant: 


y = f(x)= NES — x? (26.190) 


La sphère peut donc être disséquée comme une somme de disques d'épaisseur Ax . Les demi-disques 
étant perpendiculaires à l'axe des abscisses et de largueur Ax à la position x, (voir figure ci-dessous). 


y LA 
ee (xx) 
[| x - X 
Xk 
Âxe 


Figure: 26.53 - Calcul du volume de la sphère par décomposition en disques 
Nous avons ainsi: 
ZX, = &AX (26.191) 
Le volume d'un disque (cylindre) étant donné par (en passant à la limite): 
dW, = 7ridx (26.192) 


et le rayon 7; étant donné par la fonction: 


nf)" JF - x2 (26.193) 


nous avons alors: 
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2 
av, = ni JR -2) dx=n(8 -xjdx (26194) 


En intégrant entre x =[-À, À], nous avons alors le volume de la sphère: 


R 


2 2 3 
= frire -harerf(e -rjar-rfrx à] (26.195) 
28 28 3 


À 


Nous pouvons également prendre les bornes entre x =[Ü,À] cela revenant au même à un facteur 2 
près: 


3 


ÿ=2x| Rr-T 
3 


R° 
= 2x| À — (26.196) 


(1 


Après simplification, nous obtenons pour le volume: 
4 
F = z7E (26.197) 


L'expression de la surface étant donnée par dérivant par rapport à l'élément engendrant la surface, 
nous obtenons ainsi (c'est un peu limite comme raisonnement mais bon...): 


S= 2. 47xR? (26.198) 
dR 


Il existe une autre manière d'aborder ces calculs un peu plus rigoureusement. Effectivement, dans le 
chapitre de Calcul Différentiel Et Intégral nous avons introduit le concept de Jacobien qui permet de 
changer les variables d'intégration en fonction du système de coordonnées sur lequel nous travaillons 
(pour la définition détaillée des termes le lecteur doit se reporter au chapitre de Calcul Différentiel Et 
Intégral): 


[TZ Cxo)axdy = [TT Fe, vw) fdet (JM auavdw 00 
D D 


et nous avons démontré que le jacobien en coordonnées sphériques est : 
[det (7) =r?gin8 (26.200) 


Donc au même titre que dxdydz est un élément différentiel de volume, nous pouvons convertir cet 
élément en coordonnées sphériques et faire in extenso apparaître un élément différentiel de volume de 
la sphère de rayon r. Il suffit ensuite d'intégrer correctement pour avoir le volume de toute la sphère. 


Dès lors, nous avons : 
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R LÉ 27 3 R 
ÿ = [II r? sin Sdrd fd8 = [r?ar] sin 848 | dé= A (-cos8)[ af” 
D 0 0 0 


(26.201) 
= _. (—cos(x) -(-cos(0)))}-27= ÊTES (-(-D -(-D)= 27R 
et pour la surface (pour laquelle le rayon est constant) : 
: 5 2# : . L 
S=R [fair Bd#d8 = R #2 sé dÿ= R?.(-cos 8) . é — 


= R2.(-cos(x) —(—cos(0)}}. 27 = 27R?(-(-1) - (-1)) = 47R? 


Au besoin, on peut trouver l'élément de surface de manière géométrique plutôt que de passer par le 
jacobien car ce dernier n'est pas très pédagogique dans les petites classes. 


Alors en se rappelant que dans le chapitre de Trigonométrie, nous avons démontré que la longueur d'un 
arc de cercle est donnée par: 


d£ =Rd& (26.203) 


Alors, il devient très aisé de compléter la figure suivante: 


Z 


Figure: 26.54 - Représentation d'un élément de surface en coordonnées sphériques 


et nous voyons alors immédiatement que: 
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dS = R'sin8d8d$ (26.204) 


ce qui est quand même plus sympa... 


Calculons maintenant le moment d'inertie d'une boule pleine homogène de masse M et de masse 
volumique &. Pour cela, la boule présentant une symétrie maximale, il est plus commode de calculer 
d'abord le moment d'inertie polaire (cf. chapitre de Mécanique Classique), puis de déterminer le 
moment d'inertie axial à partir de ce premier: 


2 
J, = [rare = fr” pdF = fr” el4xrdr|=470 Ts = Ame RS = PÈRE! = 2 MR (26.205) 


Comme 7... sont égaux par symétrie de la boule, il vient: 
FLICS EN + 8 P y 


(==) =7J = LI = 2MR (26.206) 


2.3.4. TORE 


Définition: Un "tore" est la surface engendrée par la rotation d'un cercle c de rayon r autour d'une 
droite située dans son plan, mais ne passant pas par son centre. 


Soit l'équation d'un demi-cercle de centre (0,c): 
x +(y-c}? = 7? (26.207) 
Afin d'écrire y sous la forme d'une fonction de x, isolons y dans cette équation: 
+b-c=res(ty-czr-r es y-c=tfrt-x es yp=ctÿr-xt (26.208) 
Le cercle est alors constitué des graphes des deux fonctions suivantes: 


- Demi-cercle supérieur: 


A:xkHbc+4r1- 2 (26.209) 


- Demi-cercle inférieur: 


A:xkc-4Hr?- x? (26.210) 


Le volume demandé est la différence entre les volumes engendrés par la rotation des surfaces (surfaces 
définies par l'aire comprise entre la fonction du cercle concerné et l'axe des abscisses compris entre 
X=F,X #7) dans l'espace autour de l'axe des abscisses. 


En appliquant la relation d'intégration des corps de révolution: 
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F=m-7 = r[le +7 fax-x| L-,F - x° lex 
=rf(e+ RTE 
= r[(e: + 2cnr? — x + ri — k)- [2 — 2er -r+r- x x 


(26.211) 
FE 
= #[(e Dour = 2 rl 2 = 7 De = x = A + r bx 
+ 
LA LA 
= r[ Acrfr? — x?dx = 4x] Jr? — xdx 
7 + 
Calculons cette dernière intégrale par la substitution classique x = r sin £ donc: 
dx = (r sin À df = rcostdf (26.212) 
Si x =-r: 
-r=rMismi=-l=5i= 5 (26.213) 
Six =r: 
r=rsiné D sné=læi=s (26.214) 
donc: 
La La 
2 2 
F = 4æ | fr? — r° sin? fr cos tdt | FT - sin? fr cos éd 
= _" 
: | (26.215) 


La La 
3 3 
= dx [ rcos" ér cos édt =A4ner* | cos? {dt 
3 


b2|A 


Linéarisons cette expression en utilisant à nouveau les relations trigonométriques (formule de Carnot): 


3 3 3 
W = 4ær° | À (1+ cos 24 di = 2rcr° Ja + [cos tdi 
-£ Æ =" 


2 cos 2fdt | = 23 — Ë a)+ 1 [sin 2£ 


arr + i (sin TT — sin(— x))) = arr + L (0 _ o)) = 2er°r° 


Donc, le volume d'un tore de "rayon mineur" r et de "rayon majeur" c est donné par: 
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W =2crr? (26.217) 
Adapté à la figure ci-dessous (prise de la littérature): 

VW =2R7r (26.218) 
et la surface (par dérivation de l'élément génération de surface): 


S = aw =ARrz (26.219) 


r 


Le moment d'inertie du tore relativement à son axe de révolution se calcule de la manière suivante: 


Soit le volume du tore (démontré précédemment) noté: 
W =2ab (26.220) 
La densité volumique du tore est donnée par (masse sur volume): 


dm _ M M 


— = ——— > din = ——— à" (26.221) 
dV 277a°b 27 a°b 


En coordonnées cylindriques, nous avons: 
dV = rdrd@dz (26.222) 
d'où: 


Li dE (26.223) 


din = ——— à 
27 a°b 27 a°b 


Le moment d'inertie est alors donné par: 
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23  d+a “eS 7-87 23  d+a 
MW WA 


J = [ram =2 Dr la Pl LU dz rar fe -(r-5ÿ 
è-2 è-2 
ler NS — (rh) dr = fr la? (r- bydr = (26.224) 
cu fr 3 Ja? -(r-b)} ar 


Posons 5 = r- à, dès lors: 


1. Les bornes d'intégration deviennent dès lors -a, +a puisque nous ramenons tous les points 
d'intégration à l'origine en posant 5 = r - h 


2. Trivialement, puisque > = 5 + À nous avons donc gs = à 


Ce qui nous donne: 


è+a 


Jr nie ÉETie dr = a? -s° ds 
2 (26.225) 
= Le [e +357 b +35h° + ba? - 5? ds 


Comme nous avons démontré dans le chapitre de Calcul Différentiel Et Intégrale que l'intégrale avec 
deux bornes symétriques d'une fonction impaire (produit d'une fonction paire et impaire) est nulle, les 
intégrales de: 


sa? - 5245, 35@ Na? -s?ds (26.226) 
sont nulles. 


Nous avons donc à calculer: 


J,= a [6° +b})a? -sds (26.227) 


Posons maintenant s = &'sin(f) et donc ds = acos{t)dt . Il vient donc: 


DM +12 
WT [ (34° sin 28 +b *} Va À sin 2 (fa cos(t)dt (26.228) 


F4 D _5;2 


Or, comme: 


cos? (£) + sin?) = 1 a? cos? (é) + a? sin? (£) = a? = Ja’ - a? sin? (£) = lacos(#)] (26.229) 


Donc: 
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OM +xi2 OM +xi2 
= — [ (3a° sin 2()+b?)facos(#)|a cos(thdt=— | [ (3° sin 2()+b? a? cos 2(£)dt 
FA _ÿy2 ra 712 
+r!2 +72 
7 — | (34? sin? &)+8? cos? our = 24 [ (Ba? sin? (9 cos? (t)+8? cos? ()}at 
-#12 -#12 
4 +212 
— (2° (1- cos (1) cos? (4) +8? cos 2)}at 
-#!2 
+r!2 
0 (3° cos2(#) — 3a? cost (t)+E2 cos? (+) at 
FT _712 


(26.230) 


Soit (cf. chapitre de Calcul Différentiel Et Intégral): 


+212 +2/2 


(l 34? cos? (£)dt = 3a° (l cos? (f)df = : 5 (cos(£} sin(£) +é | RE 

-23/2 -x12 o 

ira ee b + 3/2 7 
I B? cos? ({)dt = b? ( cos? (f)df = (cos(t)sin() 1: INA nus 

2/2 3/2 

+212 + 3/2 1 3 + 2/2 2. 
Î 34? cos* (£)dé = 3a? (l cos‘ ()dé = 3a? (es (£}sin(£) + = cos(£) sin(é) + ae] = — 
51 -5n 4 8 Cp | 


(26.231) 


Donc finalement: 
J = 2W (3 T4? ia 2) _ (ie +5) (26.232) 


2.3.5. ELLIPSOÏDE 
Définitions: 


D1. Un "ellipsoïde" est une surface du second degré de l'espace euclidien à trois dimensions. Il fait donc 
partie des quadriques (cf. chapitre de Géométrie Analytique) 


Figure: 26.55 - Exemple d'ellipsoïde 


D2. Un "ellipsoïde de révolution" est un solide engendré par la révolution d'une ellipse autour de l'un de 
ses axes. 
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Pour calculer le volume délimité par l'ellipsoïde, prenons l'équation que nous avons déterminée lors de 
notre étude des coniques (cf. chapitre de Géométrie Analytique): 


Remarque: Dans le cas où seuls deux paramètres aux dénominateurs sont égaux, l'ellipsoïde peut 
être engendré par la rotation d'une ellipse autour d'un de ses axes. Il s'agit alors de l'ellipsoïde de 
révolution définie juste précédemment et parfois appelé "sphéroïde". 


La section par un plan parallèle au plan Oyz et se trouvant à la distance x de ce dernier, donne l'ellipse: 


ou: 


Le volume de l'ellipsoïde est alors égal à: 


2 


a 2 
W= re | Eh mer à 
LA a 3a° ]L 


Donc: 
4 . 
F=_—xabc (26.239) 
3 
etsia=b=e= =, nous retrouvons l'expression du volume d'une sphère: 


F = 27R (26.240) 
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Remarque: Le calcul du moment d'inertie d'un ellipsoïde est très important en astrophysique 
puisqu'un grand nombre d'étoiles ou de planètes en rotation sur elles-mêmes de par leur déformation 
à l'équateur à cause de la force centrifuge se voient déformées en première approximation en un tel 
volume. 


Pour un ellipsoïde, définissons € comme étant le moment d'inertie le long de l'axe c, À le moment 
d'inertie le long de l'axe a et B le moment d'inertie le long de l'axe b. 


Pour commencer, considérons le moment d'inertie le long de l'axe c que nous assimilerons à l'axe z. Dès 
lors, en coordonnées cartésiennes, nous avons: 


J,=C= fra = fera = pfr'ar = eftr +y?)drdydz (26.241) 


En faisant la substitution suivante, nous sous-entendons que l'intégrale précédente est une normalisation 
d'un ellipsoïde: 


x'= 2 

a 
1e (26.242) 
z'=? 

€ 


ce qui nous donne pour notre intégrale (nous transformons donc ainsi le volume V de l'ellipsoïde en le 
volume V' d'une sphère): 


C'= e[[@r + (&y Ÿ]ebcar d'a (26.243) 


Nous pouvons maintenant passer des coordonnées cartésiennes aux coordonnées sphériques (cf. 
chapitre de Calcul Vectoriel) sans oublier d'utiliser le Jacobien (cf. chapitre de Calcul Différentiel Et 
Intégral) que nous avions démontré comme valant en coordonnées sphériques: 


det(J|= 7 sin 8 (26.244) 


Donc (nous utilisons les primitives usuelles démontrées dans le chapitre de Calcul Différentiel Et 
Intégral): 
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1233 


C'= Ge | DIE cos? sin? 8 +b?r? sin? sin? c) sin 8484 ddr 
1233 

= el [[t cos? # + b? sin? &y* sin® 8484 far 
123 


: aa | pli cos? # +b? sin? gr | cos 8 sin? 8 - - cos ) d ér 
3 3 0 (26.245) 


4 123 


E a? cos 3$+b sin gr" d bar 


LU) 


Le 


= —abco(|ar+b?x r'ar = <aberp a?+b?)fr'ar 
vf 


0 +b? }r di = + moabe (a° +b?) 


en y insérant pour l'ellipsoïde: 


(26.246) 


nous obtenons alors: 
l 2 2 
C=-Mia +b (26.247) 


et par symétrie, nous avons les résultats triviaux suivants: 


La matrice d'inertie (cf. chapitre de Mécanique Classique) est alors: 
lu (8? +c?) 0 0 
=. 
Fe ASE 0 LM (a ei 0 (26.249) 
(13€) 5 oi 


0 0 SM (a +b?) 
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2.3.6. PARABOLOÏDE 


Définition: Un "paraboloïde" est un solide engendré par la révolution d'une parabole autour de son 
foyer: 


Figure: 26.56 - Exemple de paraboloïde 


La méthode de calcul du volume du paraboloïde à base elliptique est exactement la même que celle 
pour la pyramide à la différence que l'équation d'une parabole est du type y = æx? et que nous avons 


aussi % = æa?. Dès lors, nous avons évidemment x =a{y). Le carré de la fonction nous amène à écrire: 


p 
a(y)=a . & a(y) a = x (26.250) 


& & k k 
b 1 
F = [Sox = (7 a(y}'b(yldy = paf | P = a pP# = 3 abh (26.251) 


et idem pour (y). Dès lors: 


2.3.7. TONNEAU À SECTION CIRCULAIRE 


Maintenant regardons pour le plaisir un volume très connu par les viticulteurs (et pas seulement!): 


Figure: 26.57 - Exemple de tonneau à section circulaire 
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Considérons que la courbe latérale du tonneau est une parabole d'équation: 


v= ax?+bx+e (26.252) 


Posons: 


D-d4 E 
(26.253) 


= et Z = 
7 2 


étant donné la manière dont nous avons disposé les axes x, y il est relativement aisé de déterminer les 
coefficients du polynôme. Déterminer le coefficient c est le plus simple: 


c=y(x=0) -£ (26.254) 
Nous avons aussi: 
A b 
y'=0=2ax+b = nur ll = 2aL+b=0—=4a- NT (26.255) 


De même que: 


2 
H H b d D 
-À =a| | +b=+c=-—É+bL+E = 
2 2 2 ZE 2 2, 
(26.256) 
se(-5+1)-2 ses 
2 2 2 L 
Aïnsi, nous avons: 
PRE id PA (26.257) 
Ê FA 2 


Le rayon d'une section horizontale d'ordonnée x est > = Y et sa surface est donc: 
S=r? (26.258) 
ou: 
à 2 
S = (ax +bx +c) (26.259) 
Développons: 
S = (ax +b2 +c? + 2ax? (bx +c) + 2bxc) 
(26.260) 


_ r(a?x* +62 x2 +02 +0abx + 2acx? + 2bcx) 


Le volume de liquide pour une hauteur h sera donc: 
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k 
F = 4] u + Bb x2 +07 + 2abx + Dacx? + 2bex ax 


x x x? 
= x| a? L+e 2x + 2ab + 2ac 2 + 2be 2 
4 3 2 


}° k° 3 k° 

= x] a? —+2a pi +2ac—+2bc—+c°k| (26.261) 
5 3 3 2 

-n| 


5 3 3 2 
40 ab +5 CCE LR CE 
5 3 3 2 


k° 
x| a? À +00} 4(2ac +5? Jr + +c | 


Pour calculer la surface intérieure du tonneau, nous considérons la courbe extérieure donnée par un arc 
de parabole comme représenté ci-dessous: 


f(x) = ax? +bx+e 


A 


—————+ 


Figure: 26.58 - Tranche verticale du tonneau 


Pour calculer l'aire latérale de ce tonneau, nous devons d'abord déterminer l'expression de la parabole 
ci-dessus. 


En regardant la figure, nous obtenons : 


Flüer=e 
f(H)=r-=aH°+bH+c 


2 
FH) = a+ D 4e = R 


(26.262) 


qui est un système de trois équations en les inconnuesa,b,€ . 


Après résolution, nous obtenons : 
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4(r-R 
= 4ETE) 
À 
, - AR-7) (26.263) 
À 
Cc=r 


La surface latérale du tonneau incluant la surface des deux disques aux extrémités est alors donnée 
par : 


Æ Æ 
S = 277 +2x || HO RE SE) dx = 277 +27] (a +bx+e)f1+(2ax+8) dx (26.264) 
0 0 


En faisant le changement de variable :; = 24x+3 nous obtenons : 
Ps 22H4+ 
S = 277 + — [ (u° à +dac) u? +ldu (26.265) 
da à 


Cette dernière intégrale peut être calculée en utilisant les relations suivantes (dont la deuxième a été 
démontrée dans le chapitre de Calcul Différentiel Et Intégral): 


[2° u?+1 du = als +3 +1 -qarc sinh (u) 
[rat +1 du = sue +i+pare sinh(u) 


(26.266) 


où pour rappel: 
are sinh (u) =in (a + Ju? +1) (26.267) 


Nous n'irons pas plus loin, car la formule obtenue serait énorme et sans grand intérêt. 


Voici néanmoins une application numérique. Supposons: 


r = 20cm 
R=30cm (26.268) 
Æ = 60cm 


Nous calculons : 


aæ=—00111 =0.667 c=20 (26.269) 


Donc: 
0667 —0 667 
S = 2513.10 +6.362.10° [ 2 fu? +1 du -8.483.10 [ u?+1du (26.270) 
0667 0667 


la première des intégrales vaut : 
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—0.667 
[ unfu?+1du=-0.222 (26.271) 
0667 
La deuxième vaut : 
0667 
u?+1du=-1427 (26.272) 
0.667 


Et finalement: 


Sz1321[#°] (26.273) 
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Notes personnelles: 
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27. THÉORIE DES GRAPHES 


Le. de la théorie des graphes (ou des "complexes cellulaires") débute peut-être avec les travaux 


d'Euler au 18ème siècle et trouve son origine dans l'étude de certains problèmes, tels que celui des ponts 
de Kônigsberg (les habitants de Künigsberg se demandaient s'il était possible, en partant d'un quartier 
quelconque de la ville, de traverser tous les ponts sans passer deux fois par le même et de revenir à leur 
point de départ), la marche du cavalier sur l'échiquier ou le problème du coloriage de cartes et du plus 
court trajet entre deux points. 


La théorie des graphes s'est alors développée dans diverses disciplines telles que la chimie (isomères), la 
biologie, les sciences sociales (réseaux de transports), gestion de projets (C.P.M.), informatique (topologie 
des réseaux, complexité algorithmique, protocoles de transferts), la physique quantique, etc. Depuis le 
début du 20ème siècle, elle constitue une branche à part entière des mathématiques, grâce aux travaux de 
Künig, Menger, Cayley puis de Berge et d'Erdôs. 


De manière générale, un graphe permet de représenter la structure, les connexions d'un ensemble 
complexe en exprimant les relations entre ses éléments: réseau de communication, réseaux routiers, 
interaction de diverses espèces animales, circuits électriques, … 


Les graphes constituent donc une méthode de pensée qui permet de modéliser une grande variété de 
problèmes en les ramenant à l'étude de sommets et d'arcs. 


Les derniers travaux en théorie des graphes sont souvent effectués par des informaticiens, du fait de 
l'importance que revêt l'aspect algorithmique dans leur domaine (voir le début du chapitre de Méthodes 
Numériques pour un petit exemple). 


Effectivement, il s'agit essentiellement de modéliser des problèmes. Nous exprimons le problème en 
termes de graphes de sorte qu'il relève d'un problème de la théorie des graphes que nous savons le plus 
souvent résoudre car rentrant dans une catégorie de problèmes connus. 


Les solutions de problèmes de graphes peuvent être faciles et efficaces (le temps nécessaire pour les 
traiter informatiquement étant raisonnable car ils dépendent polynomialement du nombre de sommets du 
graphe) ou difficiles (le temps de traitement étant alors exponentiel) auquel cas nous utilisons une 
heuristique, c'est-à-dire un processus de recherche d'une solution (pas forcément la meilleure). 


Si la théorie des graphes connaît un assez grand engouement ces 30 dernières, peut-être est-ce dû au fait 
qu'elle ne nécessite pas dans ses concepts élémentaires de bagage mathématique considérable. 
Effectivement, il suffit d'avoir parcouru les chapitres de Probabilités, de Théorie Des Ensembles et 
d'Algèbre Linéaire ainsi que de Topologie présentés sur le site pour déjà se sentir à l'aise avec les 
différentes définitions. 


Nous allons introduire le vocabulaire de base de la théorie des graphes. Les termes employés sont ceux du 
langage commun de la géométrie euclidienne (et malheureusement ils sont aussi en grand nombre.…..). 


Définitions: 


D1. Un "graphe" (ou "polygraphe") G est un couple = (Æ,Æ) constitué d'un ensemble X non vide et 
fini (les sommets), et d'un ensemble E (les arêtes) de paires d'éléments de X reliés par un segment de droite 
ou autrement dit (...) d'une partie du produit cartésien ZX? (cf. chapitre de Théorie Des Ensembles). 
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Remarque: Un graphe est souvent noté en français G=(S,A) où le S est la première lettre du mot 
"Sommet" et À la première lettre du mot "Arêtes". 


L'ensemble des sommets est noté G(X) et l'ensemble des arêtes G(E). 


Un graphe est dit "graphe planaire" quand nous pouvons le représenter dans un plan sans qu'il y ait 
intersection d'arêtes. 


Maintenant, montrons que si F est le nombre de faces d'un graphe planaire (compte aussi pour une face la 
face extérieure infinie), À son nombre d'arêtes et S son nombre de sommets, nous avons alors: 


F-A+S=2 (27.1) 


qui est la relation connue sous le nom de "formule d'Euler" ou "théorème de Descartes- 
Euler" (démonstration après l'exemple) et qui nous sera utile plusieurs fois sur ce site (dans le présent 
chapitre et lors de notre étude des polyèdres dans le chapitre sur les Formes Géométriques). 


Exemple: 


Un graphe à 2 faces (la face en gris clair est la face extérieure infinie), 4 sommets et 4 arêtes: 


Figure: 27.1 - Graphe à 2 faces, 4 sommets et 4 arêtes 
Démonstration: 


Nous démontrons cette formule en effectuant une récurrence (cf. chapitre de Théorie De La 
Démonstration) sur la différence À -S: 


D'abord, la formule est vraie pour: 
A—-S=-1 (272) 


car, dans ce cas, le graphe est un arbre donc il n'a qu'une seule face (la face extérieure), donc Æ =1. 
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où 


Figure: 27.2 - Arbre avec une arête et 2 sommets 
Donc: 
F-A+S=1-(-D=2 (73) 


Puis, prenons un graphe connexe (voir définition plus loin) contenant au moins un cycle G (la figure ci- 
dessous est un exemple de graphe avec 3 cycles): 


Figure: 27.3 - Graphe avec au moins un cycle 


Si nous retirons une arête e à ce cycle, nous devrions pouvoir alors par récurrence appliquer au graphe 
G—{e} la même formule si elle est juste. Effectivement, le graphe amputé de l'arête aura F faces, S 
sommets et À arêtes et donc la formule: 


F-A+S=2 (274) 
si nous lui remettons l'arête alors nous écrirons: 
(F+1)-(A+1)+S=F-A+S-=2 (275) 


[IC.Q.F.D. 
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D2. Les éléments de X sont donc les "sommets" du graphe G, ceux de E sont les "arêtes" du graphe 
G (effectivement, une arête est composée de deux sommets reliés par un segment de droite, d'où l'allusion 
aux paires d'éléments dans la définition précédente). 


Remarque: Dans un "multigraphe", les deux sommets d'une arête peuvent être identiques (boucle) et 
deux arêtes distinctes peuvent avoir leurs deux extrémités communes. Un multigraphe ne satisfait plus 
alors la définition D1. 


D3. Soit # = {x,y} une arête de G, nous disons que les sommets x, y qui sont les "extrémités" de l'arête de 
G, sont "adjacents" ou "voisins" dans le graphe G, et que l'arête e est "incidente" aux sommets x, y. 


DA4. Si deux arêtes e et e' ont une extrémité en commun, nous dirons qu'elles sont "incidentes", autrement, 


qu'elles sont indépendantes. 


Remarque: Si e est une arête de G, nous noterons G-2 le sous-graphe de G'=(4,EÆ -{e}).SiX'est 
un sous-ensemble de X, nous noterons & - X" le graphe G privé des sommets de X. 


D5. Ce que nous nommons "ordre" du graphe est le nombre de ses sommets. 


Soit G un graphe d'ordre n, l'ensemble E doit être par définition choisi comme sous-ensemble de 
l'ensemble des paires d'éléments de l'ensemble X, donc d'un ensemble de cardinal: 
an —1) 
2 
Il s'agit d'un résultat relativement trivial puisque chacun des sommets est lié à tous les autres sommets 


sauf lui-même (d'où le numérateur) et on divise par deux simplement pour ne pas compter les sommets 
voisins deux fois (et ils le sont tous lorsque nous les parcourons tous). 


En conséquence, il existe (voir le chapitre de Probabilités: arrangements de n éléments non distinguables 
par couples de deux): 


(#1) 


choix possibles pour E et donc autant de graphes admettant X pour ensemble de sommets. Certains de ces 
graphes, sont par le fait que nous considérons leurs sommets comme non distinguables 
"automorphes" (voir la définition de ce terme un peu plus loin dans ce chapitre). 


Le résultat obtenu signifie qu'il existe environ 2 millions de graphes à 7 sommets, et quelques 
4:10" graphes à 27 sommets - chiffre à comparer avec le fait que nous estimons à moins de 10%? le 
nombre d'atomes dans l'Univers (...). 


D6. Le "voisinage" d'un sommet est l'ensemble de ses voisins. 


D7. Nous appelons "degré" d'un sommet s et notons D(s), le nombre de ses voisins, qui est également le 
nombre d'arêtes qui lui sont incidentes (un sommet de degré zéro étant appelé un "sommet isolé"). 


Page: 1594/4839 


[v3.0 - 2013] 


Remarque: Un sommet de degré 1 est appelé "sommet pendant". 


Propriétés (sans démonstration): 
P1. La somme des degrés des sommets est égale au double du nombre d'arêtes. 
P2. Dans un graphe, le nombre de sommets de degré impair est toujours pair. 


P3. Un graphe ayant tous ses sommets de degré pair est d'ordre impair (excepté pour le sommet isolé), 
c'est-à-dire qu'il compte un nombre impair de sommets. 


Remarque: Un "graphe régulier" est un graphe dont tous les sommets ont même degré k. Nous disons 
alors que le graphe est "k-régulier". 


D8. Nous dirons qu'un graphe &'= (Æ",Æ") est un "sous-graphe" ou "sous-graphe induit" d'un graphe 
G=(X,Æ) lorsque X'c X et E'CE. 


D9. Un "sous-graphe recouvrant" d'un graphe & = (Æ,Æ) est un sous-graphe G'= (4,Æ"), c'est-à-dire 
un sous-graphe dont sont sommets tous les sommets de G et dont les arêtes sont dans E". 


D10. Pour un graphe d'ordre n, il existe deux cas extrêmes pour l'ensemble de ses arêtes: soit le graphe n'a 
aucune arête, soit toutes les arêtes possibles pouvant relier les sommets deux à deux sont présentes. Dans 
ce dernier cas le graphe est dit appelé un "graphe complet". 


Exemple: 
Voici quelques graphes complets pour lesquels nous avons bien: 


a(n - 1) 
2 
arêtes. Nous remarquons que les quatre premiers graphes sont planaires (effectivement remarquez 
comment il est possible, par projection d'un sommet dans le plan, de transformer le quatrième K 4 en Ka 
de manière à ce qu'il n'y ait plus d'intersections). Le cinquième graphe K. est non-planaire (nous ne 


pouvons trouver des déplacements évitant les croisements). 
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Figure: 27.4 - Exemples de graphes complets 


Un graphe complet est donc un graphe où chaque sommet est relié à tous les autres. Le graphe complet 
d'ordre nest noté #,. Dans ce graphe chaque sommet est de degré n-1. 


Ainsi, un cas sympathique à traiter est "l'étoile de David": 


XX 


Figure: 27.5 - Étoile de David 


qui n'est évidemment pas un graphe complet par définition que si l'on joint tous les sommets entre eux 
(ainsi nous perdons la géométrie de l'étoile mais obtenons un graphe &; ): 
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Figure: 27.6 - Étoile de David sous forme de graphe complet 


Remarque: Ce résultat est intéressant dans le domaine de la gestion de la communication des projets 
d'entreprise et de la sécurité informatique (cf. chapitre de Cryptographie). Si par exemple vous gérez 
un projet avec 10 intervenants (correspondant à n), il y a donc n(n-1)/2 canaux de communication (e- 
mail ou téléphone) possibles, soit 45 (et dans le domaine de la sécurité il y aurait 45 clés de cryptage à 
système symétrique à générer). D'où l'importance en gestion de projet de définir des règles de 
communication claires (sous forme d'un graphe) si l'on ne veut pas être noyé par les e-mails ou les 
téléphones inutilement (et dans le domaine de la sécurité à mettre en place des systèmes asymétriques) 
. Nous retrouverons aussi ce résultat dans le modèle de la goutte liquide du noyau nucléaire dans le 
chapitre de Physique Nucléaire. 


D11. Un "graphe stable" est sous-graphe sans arête et une "clique" un sous-graphe complet. 


D12. Dans un graphe, il est naturel de vouloir se déplacer de sommet en sommet en suivant les arêtes. Une 
telle marche passant par n sommets est appelée une "chaîne" À ou un "chemin": 


Un chemin ("path" en anglais) est une liste À = Æ# =(x,..,x,) de sommets telle qu'il existe dans le 
graphe une arête entre chaque paire de sommets successifs: 3 =1,..,&-1 (x,,x,,,) € #. La longueur du 
chemin correspond au nombre d'arêtes parcourues: k-1. 


Un chemin est dit "chemin simple" si chaque arête du chemin est empruntée une seule fois. Voici par 
exemple un chemin simple avec 5 sommets: 


42 X4 


x X3 X5 


Figure: 27.7 - Exemple de chemin simple 
Ainsi, nous définissons aussi un "cycle": 


Cm mit. itiule 70) 


Page: 1597/4839 


[v3.0 - 2013] 


comme étant un chemin simple finissant à son point de départ tel que x, = x,,,. Ainsi, s'il existe deux 


chaînes distinctes reliant deux sommets x et y d'un graphe G, alors ce graphe admet un cycle. 
D13. Un "cycle simple" est un cycle dont toutes les arêtes sont différentes. 


D14. Un "graphe orienté" est un graphe dont les arêtes ont une direction et un sens et sont dès lors 
appelées des "arcs" (donc à l'opposé du graphe non orienté). 


Remarques: 


R1. Les termes de "chemin" et de "circuit" s'emploient en propre pour les graphes orientés. Pour les 
graphes non orientés que nous manipulons principalement ici, nous parlons de "chaîne" et de "cycle". 
Cependant, la définition formelle est exactement la même dans les deux cas, seule change la structure 
(graphe orienté ou non) sur laquelle ils sont définis. 


R2. Un graphe non orienté n'est qu'un graphe orienté symétrique. Effectivement, si un arc relie le 
sommet a au sommet b et un autre arc relie le sommet b au sommet a, nous ne traçons alors qu'un trait 
entre a et b que nous appelons... une arête. 


D15. Un chemin p = (x%,..,x,) est dit "chemin élémentaire" si chacun des sommets du parcours est visité 


une seule fois: 3,3 = L..,£ à * j,x; # x;. Un chemin élémentaire est donc un chemin simple et sans 
cycle. 


Propriétés: Dans un graphe G d'ordre n: 


P1. Tout chemin élémentaire est de longueur au plus n-1. Effectivement, un chemin élémentaire visitant 
au plus 1 fois chaque sommet du graphe, sa longueur (nombre d'arêtes) ne peut effectivement excéder n-1. 


P2. Le nombre de chemins élémentaires dans le graphe est fini. Effectivement, le nombre de chemins de 
longueur #(& = 0,..,x# —1) est au plus la combinatoire du choix d'une suite de k+1 sommets distinguables 
parmi n. Il y en a donc ( l ): 


? A! 
# 3 —p)l 


Les chemins élémentaires sont la restriction naturelle que nous recherchons à la notion de chemin. La 
question qui se pose est de savoir si nous perdons quelque chose en ne considérant que les chemins 
élémentaires dans un graphe: peut-on toujours remplacer un chemin du graphe par un chemin 
élémentaire? 


Le "lemme de Künig" répond affirmativement à cette question: de tout chemin, nous pouvons extraire un 
sous-chemin élémentaire. 


L1. S'il existe un chemin entre 2 sommets x et y, alors il existe un chemin élémentaire entre x et y. 


Démonstration: 
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L'idée de la preuve est de choisir un chemin particulier entre x et y et de montrer qu'il est élémentaire. 
Quel chemin choisir? Si un chemin comporte un circuit, ce circuit est un détour sur la route menant de x et 
y. Un bon candidat à être un chemin élémentaire semble donc être un plus court chemin. 


Parmi tous les chemins reliant x à y, choisissons ainsi un chemin: 
P=(%=2X..,X = }) 


comportant le moins d'arêtes. Supposons par l'absurde que p n'est pas élémentaire. Il existe alors dans ce 
chemin un sommet z apparaissant au moins 2 fois le long du chemin p. 


Soient i, j les 2 premiers indices tels que x; = z et x; = 2: 
P — (x — X,..,2; TZ,..,2X; —Z,.., Xe = y) 


Pour obtenir une contradiction, il suffit de supprimer le cycle entre x; = z et x; = Z. Alors, nous avons un 
nouveau chemin: 


pP=@ As io Ajgpoes À = y) 


est un chemin, reliant x à y. Sa longueur est strictement inférieure à celle de p, ce qui contredit notre choix 
initial comme étant un plus court chemin. 


D16. Un graphe est dit "graphe connexe" si et seulement si, il existe au moins un chemin entre chaque 
paire de sommets (le chemin n'étant donc implicitement pas nécessairement direct - pouvant passer par un 
ou plusieurs sommets intermédiaires). S'il existe un chemin entre chaque paire de sommets, nous disons 
que nous avons un "graphe fortement connexe". 


Remarques: Que se passe-t-il si le graphe G n'est pas connexe? Il apparaît alors comme un ensemble 
de graphes connexes mis les uns à côté des autres. Chacun de ces graphes est un sous-graphe 
particulier de G, appelé "composante connexe". Il est souvent utile de se placer sur les composantes 
connexes d'un graphe pour se ramener au cas d'un graphe connexe. 


D17. Un "arbre" ou "arbre couvrant" est un graphe connexe (non orienté), sans cycle simple (acyclique) 
et sans boucles (il s'agit donc d'une forêt connexe). Dans un arbre le nombre d'arêtes est égal au nombre 
de sommets - 1. 


D18. Un "arbre valué" ou "graphe valué" est un arbre (respectivement un graphe) où les arêtes ont des 
valeurs (pondérations) positives. La somme de toutes les valeurs qui sont sur les arêtes parcourues d'un 
arbre est appelé alors le "coût d'un arbre valué" (respectivement "coût d'un graphe valué"). 


Remarque: Les arbres valués sont utilisés dans de très nombreux domaines. Citons les réseaux 
informatiques dans lesquels on cherche à optimiser le nombre d'interconnexions entre machines pour 
éviter les redondances d'envois de paquets de données ou la gestion de projets (voir l'exemple ci- 
dessous). 


Exemple: 


Page: 1599/4839 


[v3.0 - 2013] 


Un excellent exemple pratique de graphe connexe valué et orienté (abrégé sous le terme de "digraphe") 
est celui utilisé en gestion de projets pour le calcul du chemin critique. Il s'agit d'un graphe qui représente 
les dépendances entre n tâches intermédiaires nécessaires pour réaliser un projet, communément appelé 
"diagramme de Gantt" ou en encore "graphe d'ordonnancement". La durée (poids) de chaque tâche est la 
valeur des arcs incidents extérieurement au noeud correspondant. Les arcs représentent les contraintes 
d'enchaînement des tâches. Nous ajoutons toujours un noeud (dans le monde de la gestion de projets on 
parle plutôt de jalon...) initial et un noeud final. Le premier est relié par un arc de valeur nulle à tous les 
noeuds sans prédécesseurs, et tous les noeuds sans successeurs sont reliés au noeud final. Le graphe 
obtenu doit évidemment être acyclique. 


Un "chemin critique" est un chemin de longueur maximale entre les deux jalons. Il peut éventuellement y 
en avoir plusieurs, de même longueur. Toute tâche située sur un chemin critique ne peut être retardée sans 
répercussion sur la durée totale du projet. En d'autres termes, sa "marge totale" est nulle (nous disons 
alors aussi que sa date de fin/début au plus tôt est strictement égale à sa date de fin/début au plus tard). Par 
ailleurs, nous définissons aussi en gestion de projets, la "marge libre" qui indique la durée sur laquelle une 
tâche peut glisser sans bouger la tâche successeur. La marge libre se calcule comme la différence entre la 
date de début au plus tôt d'une tâche sommée de sa durée et la date de début au plus tard de la tâche 
successeur. 


Prenons pour l'exemple un projet qui se compose des tâches suivantes: 


A 
Q 


Ï 


« 
EF 


[| D | 
CR | 


F 
Q|A|Q|OQln|< 
pol 


[= 
- 


Tableau: 27.1 - Ordonnancement de tâches 


Le graphe orienté valué connexe correspondant à ce tableau une fois la définition du chemin critique 
appliqué est le suivant en utilisant les dates de début: 
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| K | 
«A 
LST6 2 
C LE {se \ 
ALT & | 1 
013] 3 518 
4 
0 « Vel | H_| 2 Fin 
3 16 » 7 |10 12112 
Ses l 3 g--— vs 
Début }/ © € 2 A D / 2 (] 
4 > n < 7 
[00 0[4N 12171, a l10! / 
\ 2! }j 2 ] 2 
P J v- »! R 1 
0 216! 2 |418 
L LF 
\ * 4 s [99/3 
{LG | 
[0/0] 4 


Figure: 27.8 - Exemple de représentation d'un planning sous forme de graphe 
Nous voyons dans ce graphe que les tâches { Début, G, L,F,Fin} sont critiques. 


Un excellent outil d'utilisation de tels graphes est MS Project dont le diagramme correspondant à 
l'exemple ci-dessus est: 


© Task Mere Duroticer Fres Slack Total Shock 
AS | Dit | Ours. Odrs Coms] 
al A 3 days 26wrs 5 durs 
dun. Ja Jam 
«| C 3 days Ddws 3dys 
C1 D 2 dys 6 days 6 dwys 
6 | € 2 days 0 durs a ds 
ES f 3 dre Odsrs 0 dwys 
8 | 6 4 days 0 durs 0 dre 
Ta - 2 days 3 durs 3 dus 
10 | J 2 dest Ddwys 4 ns 
LL K 2 days Odeys 3 deys 
12 | L 5 days O days 0 ds 
HT M 4 days 0 des Jdwys 
14 N 3 dys Sdsys 5 durs 
15 ! é 2 dnys 1 dy 4 dvrs 
16 | Fn O dns Odwrs sys 


Figure: 27.9 - Même graphe mais vu dans MS Project 


D19. Une "composante connexe" d'un graphe G est un sous-graphe &'= (4",£) connexe maximal. 


Remarque: Un graphe ne possédant qu'une seule composante connexe est simplement un graphe 
connexe. Un sommet isolé (de degré 0) constitue toujours une composante connexe à lui seul. La 
relation sur les sommets "il existe un chemin entre .." est une relation d'équivalence (réflexive, 
symétrique et transitive). Les composantes connexes d'un graphe correspondent aux classes 
d'équivalences de cette relation. 


Propriété (triviale): Un graphe G d'ordre n connexe comporte au moins n-1 arêtes. 


D20. Un "cycle" est un chemin simple rebouclant sur lui-même. Un graphe dans lequel il n'existe aucun 
cycle possible est dit "acyclique". 


Les graphes acycliques non connexes composés d'arbres constituent une classe intéressante de graphes, 
avec des propriétés remarquables et un nom: les "forêts" (terme très souvent utilisé par les informaticiens 
réseaux). 
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4 
f ° 
f 
a. à" 
| »- | A 
Fe + 
‘. / 
— | 
L2 / | 
# VA 
FA 
L 1 


S 
f ° 
ne ne" É à | TA 
= , \ | À 
, Ps nd 

H f | 

/ CA | 

e_ | | 

C4 


Figure: 27.11 - Exemple d'un arbre (graphe connexe ne contenant pas de cycle) 


Ci-dessous des exemples d'arbres (chaque arbre est connexe mais l'ensemble forme un graphe acyclique et 
non-connexe): 


Figure: 27.12 - Exemple d'une forêt (3 composantes connexes) 


Nous voyons ainsi qu'une forêt est un graphe dont les composantes sont des arbres. Les sommets de degré 
1 sont appelés "feuilles" d'un arbre. 


Propriétés: 


P1. (triviale) Si dans un graphe G tout sommet est de degré supérieur ou égal à 2, alors G possède au 
moins un cycle. 
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Remarque: Cette propriété simple implique qu'un graphe sans cycle possède au moins un sommet de 
degré 0 ou 1. À l'inverse, nous pouvons lier cette fois l'absence de cycle dans un graphe avec le 
nombre d'arêtes. 


P2. (triviale) Un graphe acyclique G à n sommets possède au plus n-1 arêtes. 


D21. Un "cycle eulérien" est un cycle passant une et une seule fois par chaque arête du graphe et revenant 
au point de départ (nous verrons plus loin les propriétés que doit posséder un tel graphe pour qu'un tel 
cycle y existe) 


D22. Un graphe est dit "graphe eulérien" s'il admet un cycle eulérien. 


D23. Un "cycle hamiltonien" est un cycle simple passant par tous les sommets du graphe une et une seule 
fois. Pour avoir un cycle hamiltonien, le graphe doit être connexe et il ne doit pas y avoir de sommet 
pendant. 


D24. Un "graphe hamiltonien" est un graphe qui possède un cycle hamiltonien. 


Il convient d'ouvrir maintenant une parenthèse (pour les paillettes.) sur le problème le plus connu en 
théorie des graphes: les ponts de Kônigsberg. 


Euler (voir page des biographies), aimait à faire une promenade dans sa bonne ville de Kônigsberg. Il 
affectionnait selon la légende tout particulièrement de parcourir les 7 ponts qui enjambent la rivière. L'âge 
venant (les connaissances mathématiques aussi...), il se demanda si sans sacrifier à sa promenade, il 
pouvait en raccourcir la longueur en ne traversant chaque pont qu'une seule fois. Ce problème est sans 
doute l'un des plus anciens en théorie des graphes: celui de l'existence d'une chaîne passant une et une 
seule fois par chaque arête. 


KONINGSHERGA 


Le 2 


n PANTLE GRR D se 
7" _ 


Figure: 27.13 - Carte de la ville de Kônigsberg 


La rivière sépare la ville de Kôünigsberg en quatre parties, a, b, c, d. Chaque pont relie deux de ces parties. 
Nous pouvons alors représenter notre problème par un graphe avec quatre sommets, où chaque arête 
représente l'un des sept ponts de Künigsberg. Sur cet exemple le graphe n'est pas un graphe simple: 
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A — e 
Lei l \ 
(5 1 9 
D Le J A b 
'/4 a _ 
d - 
t d 


La question est donc ici de savoir si le graphe est eulérien ou non? Si pour notre problème le graphe 
obtenu est eulérien, il faut pouvoir exhiber un cycle eulérien, ce qui ne semble pas facile. Mais s'il ne l'est 
pas? Euler a donné une caractérisation très forte des graphes eulériens donnée par l'énoncé suivant: 


Théorème d'Euler: Un graphe est eulérien si et seulement s'il est connexe et tous ses sommets sont de 
degré pair (il y a donc un nombre pair d'arêtes qui arrivent sur chaque sommet dont la moitié d'entre elles 
servant à arriver sur le sommet, l'autre à en repartir) sauf au plus deux (ces deux exceptions étant les 
sommets de départ et d'arrivée). 


De façon plus précise pour un graphe connexe: 
- le graphe n'a pas de sommets impairs, alors il est eulérien (et la chaîne est donc cyclique) 


- le graphe ne peut avoir un seul sommet impair de par la propriété (déjà énoncée plus haut) que dans un 
graphe, le nombre de sommets de degré impair est toujours pair. 


- si le graphe a deux sommets impairs, ces sommets sont alors les extrémités de la chaîne eulérienne 
Corollaire: un graphe ayant plus de deux sommets impairs ne possède pas de chaîne eulérienne. 


Avec cette caractérisation (comme nous allons le démontrer de suite après), les sommets a, b, c, d étant de 
degré impair, on sait immédiatement qu'il est impossible de parcourir tous les ponts de Künigsberg 
seulement une fois au cours d'une promenade. 


Démonstration: 


1. Supposons qu'un graphe G soit eulérien. Il existe alors une chaîne c parcourant une et une seule fois 
chaque arête (jusque-là c'est facile). Bien évidemment, dans le cas d'une chaîne, les sommets se situant 
aux extrémités de la chaîne sont de degré impair et sont au nombre de deux. 


2. Considérons maintenant un sommet x et supposons cette fois-ci non pas un graphe eulérien mais un 
cycle eulérien. Lors du parcours du cycle, à chaque fois que nous passons par le sommet x, nous nous 
retrouvons au point de départ et pour effectuer un nouveau tour chacune des 2 arêtes s'offre à nous (le 
chemin pouvant être parcouru dans les deux sens puisque le graphe est non orienté). Le sommet x est 
donc de degré pair et peut être défini n'importe où dans le cycle, d'où le fait que l'ensemble des sommets 
sont de degré pair. 


3. Réciproquement considérons un graphe G connexe dont tous les sommets sont de degré pair. Nous 
allons montrer par induction sur le nombre d'arêtes que G est alors eulérien: 


- Si G se réduit à un unique sommet isolé, il est évidemment eulérien. Sinon tous les sommets de G sont 
de degré supérieur ou égal à 2. Ceci implique qu'il existe un cycle # sur G: 
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- Considérons le graphe partiel H constitué des arêtes en dehors du cycle #. Les sommets de H sont 
également de degré pair, le cycle contenant un nombre pair d'arêtes incidentes pour chaque sommet. Par 
induction chaque composante connexe À, de H est un graphe eulérien, et admet donc un cycle eulérien 


&. Pour reconstruire un cycle eulérien sur G, il nous suffit de fusionner le cycle # avec les différents 
cycles 4. Pour cela, nous parcourons le cycle $ depuis un sommet arbitraire; lorsque nous rencontrons 
pour la première fois un sommet x appartenant à À, , nous lui substituons le cycle # . Le cycle obtenu est 
un cycle eulérien pour G, le cycle # et les cycles # formant une partition des arêtes. 


Figure: 27.15 - Graphe Eulérien? 


Remarque: Ce principe de décomposer un graphe en graphes connexes et de les sommer permet de 
construire un algorithme récursif permettant de déterminer si un graphe est eulérien ou non. 


D25. Deux graphes G et G ‘sont "graphes complémentaires" lorsqu'ils vérifient les conditions suivantes: 
1. Ils ont le même ensemble de sommets 


2. Deux sommets x, y sont voisins dans G ne sont pas voisins dans G 


D26. Un "graphe biparti" #,, est un graphe tel que nous puissions partitionner l'ensemble de ses 


sommets en deux classes respectivement de cardinal p et q de sorte que toute arête ait une extrémité dans 
chacune des deux classes. 


Exemple: 


Voici donc une représentation d'un graphe biparti K, ; classique. Il représente le problème fameux de 


l'approvisionnement de trois maisons au départ de trois usines (eau, électricité, gaz) sans droit 
d'alignement des services. Nous voyons immédiatement que ce graphe est non-planaire. 
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Figure: 27.16 - Exemple de graphe biparti 


Remarque: Le graphe biparti complet £#,, est un graphe de sommets de # = ? +4 sommets 


configuré de telle sorte que chaque sommet d'une classe soit adjacent à tous les sommets de l'autre et 
seulement à ceux-ci. 


D27. Deux graphes sont isomorphes s'il existe une bijection f de X dans X ‘telle que, pour tous sommets x 
et y de G: 


x adjacent à y dans & & f(x) adjacent à f{y) dans G' 
Nous disons aussi que f est un "isomorphisme de G sur G'". 
S'il existe une bijection f de X dans lui-même telle que: 

x adjacent à y dans G& & f(x) adjacent à f(y) dans G 


nous disons alors que f est un automorphisme dans G (par permutation des sommets il existe beaucoup 
d'exemples possibles….). 


Remarque: Attention!! Parfois nous parlons de graphes équivalents à "un isomorphisme près". Cela 
signifie plus clairement, qu'à l'exception d'une et unique violation parmi l'ensemble des arêtes, les 
graphes sont isomorphes. 


Comme l'isomorphisme dans le cas des graphes va d'un ensemble à un autre de même cardinal n, le 
nombre de bijections possibles différentes est (voir le chapitre de Probabilité sur les arrangements): 


n!' (27.14) 


Cela signifie qu'il existe au maximum n! graphes qui peuvent se regrouper dans une même classe 
d'équivalence. En conséquence, il existe au minimum (minorant) le rapport du nombre total de n sommets 
sur le cardinal majoré de la plus grande classe d'équivalence possible (mais pas nécessairement existante): 


x{x—1} 
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En utilisant la majoration grossière #1 < #*, nous avons: 


N > 27.16) 


D'où: 


log, N > —— —Alog:(%2) (27.17) 


Soit encore: 


: 21 
log, N > = = 2 (7.18) 
2 ñ ñ 


Ainsi, quand n tend vers l'infini, log, M admet un minorant de l'ordre de #?. 


1. MATRICE D'ADJACENCE 


Au plan formel, un graphe est aussi un ensemble sur lequel nous avons défini une relation binaire, 
antiréflexive (aucun élément n'est en relation avec lui-même) et symétrique (si x est en relation avec y, 
alors y est en relation avec x). La structure de graphe peut alors sembler particulièrement pauvre. 


Mais nous pouvons aussi associer à un graphe G de sommets x,,..,x, une matrice carrée M de dimensions 
#*# appelée "matrice d'adjacence" du graphe et dont les éléments valent 0 ou 1. En notant #4; le terme 
située au croisement de la ligne i (représentant le sommet x, ) et de la colonne j (représentant le sommet 


Z;), M est défini par: 
M = 1 si et seulement si x;,x; sont adjacents 


De par cette définition et celle du graphe lui-même, il vient que dans une matrice d'adjacence d'un graphe 
formel que les éléments diagonaux pour lesquels ? =; valent tous 0 et que #4; = #2;. 


Rappelons qu'une telle matrice est dite "symétrique" (cf. chapitre d'Algebre linéaire). 


Remarque: Nous savons aussi que les graphes sont représentés par des matrices dans le cadre de 
l'étude des chaînes de Markov dans le domaine des probabilités (cf. chapitre de Probabilités), 


Voyons un exemple à la fois abstrait mais facilement applicable à de nombreux domaines de l'industrie, de 
la sociologie et de la biologie. Considérons le graphe orienté suivant et observons qu'il n'est pas 
antiréflexif ni symétrique: 
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Figure: 27.17 - Exemple de chaîne de Markov (graphe antiréflexif ni symétrique) 


Nous pouvons représenter ce diagramme sous forme d'un tableau dans lequel nous noterons "1" quand une 
transition est possible de l'état mentionné en haut de la colonne de la case vers l'état mentionné au début 
de la ligne et "O" sinon: 


Tableau: 27.2 - Matrice d'adjacence 


Il est indispensable de comprendre parfaitement la signification des valeurs se trouvant dans ce tableau! 
Mais à ce niveau du site cela ne devrait pas poser de difficulté majeure. 


Maintenant évaluons le nombre de manières permettant d'aller: 
1. De E2 vers E2 en deux étapes 
2. De E3 vers E4 en deux étapes 
3. De E2 vers E7 en deux étapes. 


Il est facile dans le cas particulier ci-dessus de dénombrer ces possibilités. Mais dans le cas d'un graphe 
plus complexe cela devient difficile, voire impossible pour un être humain dans un temps raisonnable. 


Nous devons faire appel alors au théorème suivant: 


Soit un graphe orienté avec %,x2,..,x, sommets et de matrice d'adjacence: 


M = (r8,,) (27.19) 
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Pour tout entier naturel k, alors le nombre de chemins de longueur k d'un sommet x; à un sommet x; est 
donné par: 


M = me (27.20) 
où l'exposant de M dénote la puissance de k de la matrice d'adjacence. 
Démonstration: 


Effectuons une récurrence sur k: 


me =»; (2720 


désigne bien le nombre de chemins allant de x; à X; (où i et j peuvent être égaux). Supposons le résultat 
vrai pour l'entier k-1, avec & > 1 comme: 


M*=MFIM (2722) 


nous avons alors (par construction de la multiplication matricielle): 


Par hypothèse de récurrence, mr est le nombre de chemins de longueur k-1 allant de x; à x; et, est 
nous le savons (par construction) le nombre de chemins de longueur 1 allant de x; à X; et en particulier il 


est égal à 1 si (%,x;) est une arête du Graphe et 0 sinon! 


Donc, le produit: 


donne pour une valeur de ! donnée le nombre de chemins de longueur k allant de x; à x; dont la dernière 


arête est (x%,x;). 


La somme: 


donne donc toutes les possibilités (chemins) de longueur k allant de x; à x; quel que soit le point de début 
de la dernière arête! 


[IC.Q.F.D. 


Ainsi, dans notre exemple, la matrice d'adjacence M est donnée par: 
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0 0 0 0 0 0 0 
0 0 1 0 0 0 0 
1 1° & + 6 00 
M=10 0 1 O0 0 O O| (2726) 
0 0 0 1 0 0 0 
Œ 1 À 1 6. © Q 
QG LE L'O rE 


et n'est ni symétrique, ni antiréflexive comme nous en avions déjà fait mention. 


Donc si nous la portons à la puissance k, chaque composant me donnera toutes les possibilités (chemins) 


de longueur k allant de x, à x;. Aïnsi, nous avons: 


0 0 0 0 0 0 0 

RCD ES: 

1 1 3 1 0 0 0 
M?=|1 1 1 1 0 O0 O| 72 

0 0 1 0 0 0 0 

1 1 3 1 0 0 0 

1 1 3 1 0 0 0 


en utilisant par exemple la fonction PRODUITMAT ). 

Nous avons alors la réponse à nos trois questions en lisant la matrice ci-dessus: 
1. De E2 vers E2 en deux étapes nous avons donc 3 possibilités. 

2. De E3 vers F4 en deux étapes nous avons donc 1 possibilité. 

3. De E2 vers E7 en deux étapes nous avons donc 3 possibilités. 


Il est possible de gagner un peu de temps dans ce genre de calculs. Si nous notons €, la i-ème colonne de 
la matrice M, alors: 


MC; = M? (27.28) 
donnera la i-ème colonne de la matrice M au carré. Et ainsi de suite: 
MM?=M? (729) 


Donc nous obtenons systématiquement le nombre de chemins de longueur k d'un point de départ donné 
correspondant à la colonne i. 


Cet exemple a une autre approche très intéressante dans certains domaines étudiant le comportement 
d'individus dans diverses situations (achats, tourismes, accidents, etc.). 
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Si au lieu de noter dans la matrice M le nombre de chemins possibles d'un sommet à l'autre, nous notons la 
probabilité (la partie) du nombre total d'individus qui partent de ce même sommet pour en arriver à un 
autre alors nous avons par exemple (valeurs imposées par l'expérience!) la matrice: 


0 () ( 0 0 

0 () 0.094 0 

1 0954 0662 0.75 
M =|0 0 0.218 0 

0 () ( 0.175 

0 0034 0017 0.035 

0 0.012 0009 O.04 


D oO mm © © © 
OS mm © So © © © 


qui est déjà la matrice stochastique transposée du graphe visible ci-dessous (conformément à la théorie 
des chaînes de Markov, nous avons vu qu'il fallait prendre la transposée de la matrice stochastique pour 
calculer les probabilités d'états). 


En considérant que ces probabilités ne changent pas au cours du temps, nous avons alors une chaîne de 
Markov homogène (sans cycles). Nous voyons alors que: 


1. La somme des probabilités de transitions au départ de chaque sommet (état) doit toujours logiquement 
être égale à 1 (ce que nous avions déjà mentionné dans le chapitre de Probabilités) 


2. Tout le monde part de la première étape E1 
3. Certains stagnent (s'arrêtent) à une certaine étape 


4. Ceux qui arrivent à une étape de fin E5, E6 ou E7 y restent et ne reviennent pas sur leurs pas (états 
absorbants). 


Le graphe équivalent devient alors: 


Figure: 27.18 - Graphe équivalent à la matrice 


En appelant N (au lieu de M pour ne pas confondre) la matrice construite à partir du graphe ci-dessus nous 
voyons que si €; est une des colonnes de la matrice M alors par exemple: 
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( 0 0 0 0 0 0f0 0 

( ( 0.094 0 0 0 o|[0 0.094 

1 0954 0662 075 0 © O1 0.662 
NC=7%=|0 (el 0.218 O0 0 0 01[0]=10218] (2731) 

( ( 0 0.175 1 0 O0 0 

O0 0034 0017 0035 0 1 010 0.017 

0 0012 0009 004 O0 0 1[L0 0.008 


donne la somme des probabilités de transition que ce qui part de E1 arrive en 2 étapes en respectivement 
E1(0), E2(0.662), E3(0.218)... (la distribution du vecteur initial peut être quelconque tant que la somme 
des valeurs de la colonne est égale à 1)! 


Si nous multiplions ensuite encore une fois: 


0 0 ( 0 0 0 0 0 0 

0 0 0.094 0 0 O0 O1 0.054 0.062 

1 0954 0.662 0.75 0 0 O1 0.662 0.691 
NH=12=|0 0 0.218 0 0 0 010.218 |=|0.144! (27.32) 

Q O0 ( DES 1 0 0 0 0.038 

0 0034 0017 0035 0 1 O1] 0.017 0.039 

0 0012 0009 004 O0 0 110.009 0.025 


donne la somme des probabilités de transition que ce qui part de E1 arrive en 3 étapes en respectivement 
E1(0), E2(0.691), … et ainsi de suite. Nous pouvons ainsi savoir qu'elle est la probabilité qu'un individu 
arrivant à F2 puisse arriver à un des sommets terminaux (E5, E6 ou E7) en un nombre d'étapes donné. 


Remarque: Se rappeler que la somme des probabilités des colonnes T obtenues est toujours égale à 1 
pour la transposée de la matrice stochastique. 


En continuant encore longtemps ainsi... nous trouvons que la mesure d'équilibre Æ qui satisfait (cf. 
chapitre de Probabilités): 


Pl or=x 
est: 
Ô 
Ô 
Ô 
xæ=| 0 (27.33) 
0.45 
0.32 
0.23 
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quelle que soit la distribution du vecteur de départ. Propriété que l'on appelle "ergodique" dans le domaine 
des chaînes de Markov. 


Ce qui signifie 45% de probabilité de se trouver en E5, 32% de probabilité de se trouver en E7 et 23% de 
probabilité de se trouver en E6. Une autre manière de voir les choses est de dire que si une cohorte de 100 
individus part de l'étape F1 avec les probabilités constantes dans le temps entre les transitions d'étapes, à 
l'équilibre nous aurons 45 personnes en E5, 32 personnes en E7 et 23 personnes en F6. 


2. CATÉGORIES 


L'introduction des catégories à travers la "théorie des catégories" par Eilenberg et MacLane en 1942 avait 
pour but de transformer de difficiles problèmes de Topologie en problèmes plus abordables d'algèbre. Plus 
tard, la théorie des catégories s'est beaucoup développée, à la fois pour elle-même et pour ses applications 
dans les domaines les plus variés des mathématiques (par exemple en géométrie différentielle). Même si 
une partie de son développement autonome a parfois été critiquée, les catégories sont maintenant 
reconnues comme un langage puissant pour développer une sémantique universelle des structures 
mathématiques. On les utilise aussi en logique et plus récemment en physique, et une collaboration 
fructueuse semble se développer entre catégoriciens et informaticiens. 


Définitions: 


D1. Intuitivement une "catégorie" est juste un graphe orienté sur lequel nous nous sommes donné une loi 
pour composer des flèches consécutives, vérifiant certains axiomes. 


SL 


D2. Un "graphe orienté" est formé d'un ensemble d'objets, appelés sommets du graphe, avec des liens 
entre eux, représentés par des flèches d'un sommet À vers un sommet B, ce que nous notons f: A— 8. 
Nous disons que À est la "source" de la flèche, et B son "but". Il peut y avoir plusieurs flèches de même 
source et de même but (nous les disons parallèles") et il peut y avoir des flèches "fermées", dont la 
source et le but sont confondus. 


D3. Deux flèches f, g sont dites "flèches consécutives" si le but de la première est en même temps la 
source de la seconde: 


f:AB,g: BC 
nous disons alors qu'elles forment un chemin de longueur 2 de À vers C. 


Une catégorie est donc un graphe dans lequel nous définissons une composition de flèches, associant à 
tout chemin (f, g) de longueur 2 de A vers C une flèche du graphe de À vers À, dite "composée" du 
chemin, et notée fg: 
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Je 
Jah 
gh Le 
À 
e 
D 
Figure: 27.19 - Exemple de graphe de catégorie 


Cette composition vérifie les axiomes suivants: 


A1. Associativité : Si fgh est un chemin de longueur 3, les deux composés f{gh) et (fg)h que nous en 
déduisons sont associatifs. Il s'ensuit qu'à tout chemin de longueur n est aussi associé un seul composé de 
sommets (invariance de l'itinéraire). 


A2. Identités: À tout sommet À est associée une flèche fermée de À vers À, dite "identité" de A et notée 
id ,, dont le composé avec une flèche de source ou de but A est égal à cette autre flèche. 


Plus généralement, un chemin (de longueur n) de À vers À, est une suite (#,#...,7,) de n flèches 
consécutives: 


f: AA. f AA, : A: A (2735) 


Remarques: 


R1. Les sommets du graphe sont aussi appelés "objets" de la catégorie et ses flèches des 
"morphismes" (ou simplement "liens") dans le cadre de la théorie des catégories 


R2. Une flèche f est un isomorphisme (cf. chapitre de Théorie Des Ensembles) s'il existe une flèche g 
(appelée "inverse") telle que les composés fg et gf soient des identités (cet inverse est alors unique). 


Ainsi, une catégorie est formée par des objets (les sommets du graphe) et des liens entre eux (les flèches 
ou morphismes), mais l'idée essentielle est de privilégier les liens sur les objets. En fait, le succès des 
catégories dans les domaines les plus variés est dû à la richesse des informations sur les objets qui peuvent 
être déduites de la seule considération des liens et des opérations sur ceux-ci, quelle que soit la nature et 
l'anatomie de ces objets. 


Dans les quelques lignes qui suivent, nous expliquerons comment lire les graphes orientés que nous 
pouvons rencontrer parfois dans les livres de math. Ceci sera un bon exemple de la théorie des catégories, 
car nous avons déjà rencontrés de tels graphes sans les décrire dans les chapitres sur les Nombres et la 
Cryptographie par exemple. 
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Pour simplifier nous allons expliquer ces diagrammes lorsque les objets de base sont les ensembles (ce qui 
est le cas le plus courant sur l'ensemble du site de toute manière). 


Considérons trois ensembles À, B, et C et trois applications: 
J': AB, g'A—Ceth:B—C (2736) 


Nous pouvons considérer les applications f, g et h comme des flèches qui relient les objets (ensembles) À, 
B, et C pour former un triangle. 


A — C 


Figure: 27.20 - Exemple de diagramme commutatif 


Définition (simpliste): Nous disons que le diagramme fléché ci-dessus est "un diagramme commutatif" si 
tous les chemins que nous empruntons pour aller d'un objet (ensemble) à un autre représentent la même 
application. 


Remarque: Il existe deux façons d'aller de À à C . Nous pouvons y aller directement par g ou bien 
suivre d'abord f puis h. Ce dernier chemin est représenté par l'application composée # °.f (cf. chapitre 
de Théorie Des Ensembles). Ainsi, le diagramme ci-dessus est commutatif si #°f =g. 


Nous pouvons donc introduire la définition plus formelle: 


Définition: Le diagramme ci-dessus est commutatif si *°f=£g. 
Remarque: Rappelons que ceci veut dire que pour tout élément & € À, h( f (a)) =£ (a) ‘ 


Nous pouvons compliquer à souhait les diagrammes en considérant plus d'ensembles et de flèches 
(applications) les reliant. Par exemple: 


À. ———#y € 
F r 


BE —————— 5 


Figure: 27.21 - Autre exemple de diagramme fléché 


Ce diagramme étant commutatif si et seulement si 4° f=rcg. 
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Remarques: 


R1. Généralement dans la littérature mathématique de tels diagrammes sont sous-entendus comme 
étant commutatifs. 


R2. Comme déjà mentionné, les objets de ces diagrammes peuvent plus généralement être des groupes 
d'anneaux des espaces topologiques, etc. Dans ces cas, les flèches ne sont plus des applications 
quelconques mais respectivement des homomorphismes de groupes, des homomorphismes d'anneaux, 
des applications continues, etc. 
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Notes personnelles: 
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La mécanique est la branche de la physique qui a pour objet l'étude des forces et de leurs actions 
sous une forme abstraite (Larousse) 


28. PRINCIPES 


E, introduisant la mécanique nous faisons enfin, après une longue incursion préalable et obligatoire 


dans la mathématique, nos premiers pas dans le domaine de la physique théorique. version simplifiée. 


Comme nous l'avons déjà dit, la physique est donc une science fondamentale qui a une profonde 
influence sur toutes les autres sciences et sur la société humaine et qui a pour objectif d'expliquer le 
comment et non le pourquoi (voir l'introduction du site pour plus de détails). Les futurs physiciens et les 
futurs ingénieurs ne sont ainsi pas les seuls qui doivent avoir parfaitement compris ses idées 
fondamentales, mais tous ceux qui envisagent une carrière scientifique (y compris les étudiants qui se 
spécialisent en biologie, en chimie et en mathématiques) doivent avoir acquis la même compréhension. 


Le but premier de ce site, nous insistons.., est donc de donner à l'étudiant une vue unifiée de la 
physique en présentant ce que nous pensons être les idées fondamentales constituant l'essentiel 
(minimum minimorum) de la physique contemporaine. 


Jusqu'à présent, la physique est enseignée comme si elle était une juxtaposition de plusieurs sciences, 
plus ou moins bien reliées, mais sans aucun réel souci d'unité. Nous avons rejeté ce mode de 
présentation (pour l'avoir subi pendant nos études) et avons opté pour une présentation logique et 
unifiée en faisant au besoin à chaque fois référence à un chapitre du site qui contiendrait les 
démonstrations des outils mathématiques utilisés ou d'une autre théorie physique sous-jacente. 


Ce site diffère des supports habituels de physique utilisés à l'université non seulement dans sa 
conception mais aussi dans son contenu. Nous y avons inclus des sujets fondamentaux que nous ne 
trouvons pas dans la plupart des cours de physique générale et les avons soigneusement développés et 
démontrés tout en présentant de la manière la plus pédagogique et rigoureuse possible dans la section 
de mathématique du site, les outils nécessaires à leurs développements. 


Nous insistons sur le fait que tout étudiant devrait connaître les bases de la logique, l'arithmétique, 
l'algèbre, l'analyse vectorielle, le calcul tensoriel, le calcul différentiel et intégral et la géométrie 
analytique et différentielle avant toute étude des phénomènes physiques ceci afin de travailler avec 
rigueur et toute la compréhension nécessaires aux raisonnements mathématiques qui vont être 
introduits à partir de maintenant (les mathématiques sont les fondations de l'immense édifice de la 
physique théorique). Effectivement, pas un des outils ou résultats mathématiques présentés jusqu'à 
maintenant ne sera pas utilisé dans ce qui va suivre. 


Rappelons tout de même que la "physique" est donc la "science exacte/déductive" qui s'occupe de 
modéliser mathématiquement au mieux les phénomènes naturels, artificiels, observables ou 


non-observables. En de plus brefs termes, nous pourrions parler de description de la “réalité” (quant à 
savoir s'il s'agit de la réalité sensible ou vraie..). 


Lorsque nous voulons prédire ou décrire un phénomène physique concret, nous pouvons généralement 
passer par un modèle analytique où les différentes grandeurs sont exprimées par des indéterminées 
(valeurs abstraites) et les lois de la physique par des fonctions, dans la mesure où elles sont connues (le 
cas échéant, nous pouvons faire une hypothèse et la tester). En mettant en équation un phénomène 
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physique, nous traduisons la réalité en une expérience mathématique, virtuelle, selon certaines règles. 
Nous procédons à une simulation de la réalité portant sur des grandeurs exprimées. 


Les différentes "lois" sont élaborées historiquement très souvent sur des faits d'abord empiriques et sont 
vérifiées expérimentalement par la suite (voir la méthode hypothético-déductive dans le chapitre de 
Théorie De La Démonstration). En admettant que ces lois soient valables dans le contexte, nous 
pouvons donc nous attendre à ce que l'expérience mathématique soit en adéquation avec les faits 
expérimentaux attendus (ou inversement). Bien sûr, une expérience virtuelle n'est pas réelle et ne 
saurait exprimer la réalité dans toute sa subtilité. Ce n'est qu'un modèle ! Il est donc clair que la 
prédiction d'un phénomène physique peut diverger des faits expérimentaux réels. 


Remarque: Il convient peut-être de rappeler (faute d'un abus ou d'une mauvaise compréhension que 
nous retrouvons trop fréquemment sur les divers forums de l'Internet), qu'une "expérience 
scientifique" est un travail pratique de l'étude d'un phénomène qui est reproductible (par des 
groupes de chercheurs indépendants) et dont le nombre de reproductions est suffisamment élevé 
pour s'assurer que les erreurs (écarts-types) sur les mesures deviennent négligeables. 


Il convient aussi de préciser que la plupart des modèles théoriques que nous allons exposer sur ce 
site et qui font usage de l'analyse vectorielle peuvent être récrits avec les outils de l'analyse 
tensorielle et basés sur un raisonnement propre au formalisme Lagrangien (voir chapitre de 
Mécanique Analytique pour ce savoir ce qu'est cela...). Or, ces dernières méthodes ne peuvent être 
facilement utilisées pour une introduction simple à la physique car elles demandent des efforts 
supplémentaires de la part du lecteur et beaucoup plus de papier (souvent en tout cas) et de temps 
pour les mêmes résultats. Cependant, et nous y reviendrons, ces méthodes sont aujourd'hui 
incontournables et de première importance dans les différents domaines de la physique moderne 
comme la mécanique des fluides, la relativité générale, la physique quantique des champs, l'analyse 
de systèmes chaotiques et bien d'autres. 


Avant de commencer notre étude des phénomènes physiques, il nous faut définir les concepts sur 
lesquels se base la physique théorique. Ainsi, nous verrons dans l'ordre que: 


- L'être humain a créé un système d'unités de mesures et de dimensions de bases, dont les grandeurs 
représentatives sont arbitraires à un coefficient près, propres à identifier chaque phénomène physique 
de façon simple. 


- Certains concepts indissociables de la vision de notre environnement nous amènent à poser des 
hypothèses et des principes (à postuler quelque chose donc.) qui sont relatifs à notre réalité sensible 
tout en étant transposable à toute autre réalité de ce type. 


- La physique fondamentale nous amène à considérer les fondements de la nature en tant que concepts 
mathématiques abstraits. Ainsi, notre observation commune nous donne une vue concrète de l'Univers 
alors que la physique théorique nous en donne une vue abstraite. 


Nous pouvons alors être amenés à nous poser cependant la question suivante: les faits déterminent-ils 
quelle théorie est vraie ? 


En observant la nature, nous pouvons constater des faits: ce sont des données que nous ne créons pas. 
Les astronomes par exemple, constatent la position des objets célestes. Nous comprenons un fait dans 
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la mesure où il apparaît comme la conséquence de l'ordre des choses décrit par une théorie. Mais les 
théories gardent toujours le statut d'hypothèses: même lorsqu'une théorie s'accorde avec l'ensemble des 
faits observés, cela ne prouve pas qu'elle soit vraie. En effet, il existe toujours une infinité de théories 
possibles qui sont toutes compatibles avec tous les faits observés. Nous disons alors que les faits "sous- 
déterminent" les théories: les faits imposent des contraintes sur les théories, au sens où, seules les 
théories compatibles avec les faits observés, sont acceptables. Mais ces contraintes seront toujours 
assez faibles pour laisser le choix parmi une infinité de théories. 


Bien entendu, les scientifiques n'envisagent réellement qu'un nombre fini de théories, en fonction de ce 
qui paraît le plus simple dans un cadre conceptuel donné. A l'époque de Kepler, il existait par exemple 
trois grandes théories pour expliquer les mouvements des planètes, toutes compatibles avec les faits 
observés. Selon la théorie ptoléméenne, les orbites des planètes sont circulaires ou situées sur un 
épicycle autour de la Terre, immobile au centre de l'Univers. Dans la théorie copernicienne, le Soleil 
occupe le centre, les orbites des planètes et de la Terre étant situées sur des cercles et épicycles. Enfin, 
dans la théorie képlérienne, les orbites des planètes sont des ellipses dont le Soleil occupe un foyer. 


1. SYSTÈMES D'UNITÉS 


Définition: Une "grandeur" est l'expression nomologique quantitative d'une propriété, d'un effet ou 
d'une quantité abstraite définie par un modèle que présente l'objet ou le phénomène étudié. Une 
grandeur ne s'explique pas, elle se décrit par rapport à une définition. 


Nous reconnaissons deux types de grandeurs: 


- Les constantes: elles possèdent une valeur concrète exprimable numériquement et n'évoluent pas au 
cours du phénomène étudié. Ce sont des "grandeurs passives" (nous y reviendrons plus loin et 
énumérerons quelques-unes d'entre elles). 


- Les variables: elles ne possèdent une valeur concrète que dans un état déterminé, mais pas lorsque 
nous observons le phénomène physique dans son ensemble. Ce sont des "grandeurs actives". Les 
différentes variables décrivant un phénomène physique sont souvent corrélées entre-elles par le biais de 
fonctions. Nous disons alors par définition que ces variables ont une "relation fonctionnelle" entre 
elles. 


Remarque: Une grandeur n'a de sens que si elle est "observable", grandeur à laquelle nous 
associons un nombre, résultat d'une mesure effectuée à l'aide d'un appareil. 


Mesurer une grandeur physique revient à la comparer à une grandeur physique connue, de même 
nature (nous disons aussi "de même dimension"), pris comme étalon arbitraire. Le résultat de la mesure 
s'exprime ainsi à l'aide de deux éléments: 


- un nombre qui est le rapport de la grandeur mesurée à la grandeur étalon 
- un nom identifiant l'étalon choisi 


Le "nombre" constitue au fait la valeur mesurée de la grandeur et le "nom est ce que nous appelons 
communément "unité physique", ou plus simplement "unité" (l'expression quantitative d'une variable ou 
d'une fonction). Ces deux éléments sont indissociables, la valeur mesurée n'a de sens que si nous 


indiquons en même temps l'unité choisie. Elle change si nous changeons d'unité. 
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Remarque: Le passage d'une unité à une autre pour exprimer une même grandeur est appelé 
"conversion d'unité”. 


Définition: Certaines grandeurs peuvent, par souci de simplification d'écriture, s'exprimer à partir 
d'autres grandeurs. Nous disons alors que la nouvelle grandeur "dérive" des unités de bases. Nous 
disons également que deux grandeurs physiques sont des "grandeurs homogènes" si elles sont de même 
nature physique ou si nous pouvons les exprimer toutes les deux dans la (les) même(s) unité(s) de base. 


Ainsi, après un longue période de réflexion, et en dernière analyse le monde physique semble pouvoir 
se ramener aux concepts d'espace, d'énergie et de temps. 


Ainsi apparaît donc une autre définition possible de la physique: 


Définition: La physique est la science des propriétés et des relations mutuelles dans le temps de la 
matière et de l'énergie à un facteur de charge près. 


Notre rôle consiste donc à donner une description de ces propriétés et relations sous forme de lois ou 
relations physiques appliquées aux phénomènes observés, dans le cadre d'une théorie fournissant les 
éléments de prévision. 


Les grandeurs physiques ne sont pas toutes indépendantes les unes des autres mais reliées entre elles 
par certaines lois ou relations. Il serait alors peu raisonnable, quoique possible, de choisir une unité 
particulière pour chacune des grandeurs physiques sans tenir compte de leurs relations mutuelles. 


Constituer un système cohérent d'unités revient donc à déterminer un nombre minimum d'unités qui 
établissent les règles de construction de ces relations mutuelles. Ce sont les "unités fondamentales". A 
partir des lois physiques et des relations entre les différentes unités fondamentales, nous déduisons les 
unités des autres grandeurs qui deviennent alors par souci de simplification d'écriture les "unités 
dérivées". 


Les unités fondamentales sont au nombre de quatre (nous le justifierons plus loin): la longueur (mètres), 
la masse (kilogrammes), le temps (secondes), la charge électrique (coulombs). Le système ainsi 
constitué est le système M.K.S.C. (l'auteur du présent site internet assume le choix d'ajouter le 
Coulomb). 


Les unités du système M.K.S.C sont dans le cadre ce site internet : 


1. Le mètre [m], pour la longueur L (nous avons déjà défini le concept de longueur dans le chapitre 
Géométrie mais nous y reviendrons à nouveau plus loin). 


2. Le kilo [kg], pour la masse M (nous reviendrons plus loin sur la définition du concept de masse). 


3. La seconde [s], pour le temps T (le temps n'est pas mesurable en soi mais l'intervalle de temps /# est 
un concept arbitraire tout à fait valable - nous reviendrons également plus loin sur la définition de ce 
concept). 


4. Le coulomb [C] utilisé comme unité élémentaire de charge électrique q (ne dérive d'aucune unité 
connue à ce jour - nous reviendrons également plus loin sur la définition de ce concept). 
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Remarques: 


R1. Le concept d'angle 8 (en radians, degrés ou stéradians - voir les textes traitant de la 
trigonométrie plane, trigonométrie sphérique et géométrie plane dans la section de géométrie) n'a 
pas d'unité puisqu'il s'agit par définition d'un rapport de longueurs (pour le radian ou le degré 
d'angle) ou de surface (pour le stéradian). Il convient donc de l'assimiler à une unité dérivée et non 
pas comme unité fondamentale. Cependant, en physique, nous avons pris pour habitude d'indiquer 
sa présence dans les équations dimensionnelles afin d'aider à la relecture de certaines de celles-ci et 
de savoir que leur résultat est donné par rapport à une unité d'angle (sinon cela pourrait générer des 
erreurs d'interprétation hasardeuses pour ceux qui utilisent des équations sans en avoir vu la 
démonstration...). 


R2. Le lecteur remarquera que toutes les unités du système M.K.S.C. sont des "grandeurs 
extensives" c'est-à-dire que dans un système sur lequel nous effectuons une mesure, celles-ci sont 
additives (contrairement aux grandeurs intensives). Nous reviendrons plus en détails sur les 
grandeurs extensives et intensives en grande partie lors de notre étude de la thermodynamique (voir 
chapitre du même nom). 


R3. C'est une énorme chance d'avoir un système homogène tel que celui que nous avons au 21ème 
siècle. Effectivement, pour l'anecdote, en 1522 rien que dans la région de Baden-Baden 
(Allemagne) il y avait 112 unités de mesures différentes de longueur et 92 de surfaces... c'est dire. 
le cauchemar! En ce début de 21ème siècle il existe une série de normes ISO 80000 - dont l'accès 
est malheureusement payant. - qui a pour objectif d'harmoniser les notations, définitions et valeurs 
des unités dans tous les domaines de la science 


Ces précisions étant faites, toute grandeur physique connue à ce jour peut être exprimée à l'aide d'une 
unité qui s'exprime comme le produit de cinq facteurs dimensionnels et d'un facteur d'échelle arbitraire 
K: 


K {MT [2j (7T Ie ICT 


où les nombres ##,4,£,8,c appelés respectivement "ordre de masse", "ordre de longueur", "ordre de 


temps", "ordre d'angle" et "ordre de charge" sont des entiers positifs, négatifs ou nuls. 


L'expression précédente s'écrira sous la "forme canonique" définie par les étalons: 
{el {el [sl {cT 
l'angle n'ayant pas d'unité, nous ne le notons plus (mais il s'y trouve implicitement). 
Toute grandeur physique X s'exprime donc comme: 
X=xK {el {mf [ef ICT 


où x est la valeur de la grandeur physique dans le système d'unité associé au facteur d'échelle K. Il 
existe plusieurs couples (x, K) possibles, mais nous aurons toujours: 
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x'K= x =c" 


où la constante x, est la valeur de la grandeur physique lorsque nous choisissons de l'exprimer dans le 
système M.K.S.C. 


Donc deux grandeurs physiques Æ, et À, sont homogènes si et seulement si les quadruplets: 


(ra.h,4.01), (8 dé, 02) 
qui leur sont attachés sont égaux: 
Mr Eh = Qc 
Il découle, de ce que nous avons dit, que: 


- La somme ou la différence d'un nombre quelconque de grandeurs n'a un sens que si ces grandeurs 
sont homogènes et le résultat aura donc les mêmes unités que les opérandes. 


- Le produit ou la division de plusieurs grandeurs a pour unité le produit, respectivement la division des 
unités des opérandes. 


Remarques: 


R1. Les unités des différentes grandeurs ont un côté pratique mais pas infaillible en physique 
théorique: elles permettent cependant au physicien de vérifier si une relation démontrée entre deux 
grandeurs est au moins correcte au niveau des unités. Nous appelons ce genre de démarche une 
"analyse dimensionnelle" (nous vous conseillons d'aller voir la démonstration de la loi de Stokes 
dans le chapitre de Mécanique Des Milieux Continus pour un très bon exemple d'application). 


R2. Le développement des sciences a conduit la conférence générale des poids et mesures à 
introduire quelques unités supplémentaires pratiques (mais pas nécessaires) telles que: la 
température exprimée en "Kelvins" (qui dérive de l'énergie moyenne - mouvement brownien), la 
quantité de matière exprimée en Moles, l'intensité de courant exprimée en Ampères et l'intensité 
lumineuse exprimée en Candelas. Ainsi, le Système International ($S.I.) actuel, composé de sept 
unités de base (centimètre, gramme, seconde, Kelvin, candela, mole et l'Ampère) et de dix-sept 
unités dérivées suggère-t-il que sept unités sont nécessaires pour décrire toute la physique ? En fait 
non ! Comme l'analyse de Gauss le suggère, parmi les sept unités de base, quatre - le Kelvin, le 
Candela, la Mole et l'Ampère - peuvent être dérivées des trois autres. L'introduction de sept unités 
de base représente un équilibre pragmatique entre des expérimentateurs qui ont besoin d'unités 
adaptées à leurs mesures, et l'idéalisme des théoriciens, dont le but est de réduire l'arbitraire, la 
redondance, à son minimum. 


1.1. ANALYSE DIMENSIONNELLE 


L'analyse dimensionnelle est donc un domaine de la physique qui concerne les unités des grandeurs. 
Notamment, le fait que les unités soient relativement arbitraires fait que toute équation valable de la 
physique est homogène: quelque chose qui se mesure en mètres par seconde ne peut pas être égal à 

quelque chose qui se mesure en kilogrammes par mêtre. C'est un moyen très prisé et très efficace de 
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vérifier ses propres calculs (et celui des autres...). 


La puissance prédictive de cette approche valable dans des cas d'études simples a amené certains 
physiciens à énoncer le "principe zéro" de la physique ainsi: Ne jamais faire de calculs avant d'en 
connaître le résultat. 


Cet énoncé, qui peut sembler a priori paradoxal, signifie concrètement: Ne pas se lancer (si possible.) 
dans un calcul compliqué sans avoir trouvé au préalable la forme qualitative du résultat avec l'analyse 
dimensionnelle. 


Cette forme qualitative est nommée traditionnellement "l'équation aux dimensions" et représente donc 
la formule qui permet de déterminer l'unité dans laquelle doit être exprimé le résultat d'une recherche. 
C'est une équation de grandeurs, c'est-à-dire dans laquelle on représente les phénomènes mesurés par 

un symbole d'unité comme ceux que nous avons vus dans les paragraphes plus haut. 


Exemple: 
Voyons donc un exemple de légende souvent cité dans divers magazines ou livres de vulgarisation: 


L'analyse dimensionnelle a permis à Geoffrey Ingram Taylor d'estimer en 1950 l'énergie dégagée par 
l'explosion d'une bombe atomique, alors que cette information était classée top secret. Il lui aurait suffi 
pour cela d'observer sur un film d'explosion, imprudemment rendu public par les militaires américains. 


Le physicien Taylor suppose pour arriver à ce résultat que le processus d'expansion de la sphère de gaz 
dépend au minimum des paramètres du temps t, de l'énergie E dégagée par l'explosion et de la masse 
volumique de l'air €. 


L'analyse dimensionnelle le conduit alors pour le rayon de la sphère de gaz à l'instant t à : 


x 


riml=k (Ake-m-52]) (ote-m°]) (ds) (37 
où k est une constante sans dimensions. 


Et par tâtonnements nous trouvons relativement rapidement x =1/5,y=—1/5,Z= 2/5 tels que: 
r=k ES. oU5.215 (26.6) 
Effectivement: 


à — (re PE 5725). (a | ne15]). 1 (28.9) 


Taylor trouve alors la loi de dilatation temporelle du rayon du champignon atomique est proportionnelle 
à (il est inutile d'indiquer les autres unités puisque uniquement la partie temporelle nous intéresse!): 


rœg2/5 (28.10) 


Si nous connaissons r et t à partir d'un film, et, k étant supposée de l'ordre de l'unité et £ étant connue, 
nous obtenons finalement: 
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5 
£=47 81) 
A 


ce qui reste une grossière approximation. Mais arriver à un résultat pareil (d'ordre de grandeur) avec 
l'artillerie lourde de la physique théorique nécessiterait beaucoup plus de temps et de feuilles de calculs. 


1.2. NOTATIONS SCIENTIFIQUES 


Il est fréquent en physique que les grandeurs manipulées soient très grandes et lourdes à écrire. Par 
exemple, il est toujours embêtant d'avoir des grandeurs comme 8'000'000'000 ou 0.000'000'000"1. 


Alors nous pouvons adopter une convention d'écriture en puissance de dix dite "notation scientifique" 
telle que: 


- 8 000'000'000 s'écrive 8:10° (neufs zéros après le "8") 


- 0.000'000'000"1 s'écrive 1:10" Ho position après la virgule) ou 0 1:10? (neufs zéros après la 
virgule) 


Une écriture encore plus simplifiée consiste à utiliser le tableau ci-dessous mais uniquement si nous 
avons à travailler avec des grandeurs physiques: 


PAR ES en 
exa 1018 E  ldéci 10° d 
En 1015 P ne c 
téra 1012 T  Mmilli 107 m 
giga 10° G micro | 10 Li 
méga 10° M  hnano 10° n 
kilo 10? k  bpico |1012 P 
hecto 10°? h  femto | 10°!° f 
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déca 10! da  latto 10718 a 


Tableau: 28.1 - Préfixes des grandeurs d'ordre 
Par exemple, 10'000'000 grammes notés conventionnellement: 
10'000'000 [g] (28.12) 
sera écrit en notation scientifique: 
1:10” [g] (28.13) 
mais en écriture physique (selon le tableau ci-dessus): 
1:10 [Kg] ou 10[Mg] (28.14) 


Définition: Nous disons que 4:10" est "l'écriture scientifique" d'un nombre positif A si a est un nombre 


décimal 1 £æ <10 (c'est-à-dire que a s'écrit avec un seul chiffre autre que zéro avant la virgule), n est 
un nombre entier relatif. 


® Exemple: 
1350=1.35"10* 345.58:107 = 3.455810" 325:10*  3.25:107? (28.15) 


L'avantage de cette écriture est de donner un ordre de grandeur de À compris entre 2 puissances 
consécutives de 10 tel que: 


10 <135 18 <10 1034558 10" <1070 107 < 325-107 <107 (2816) 


Si de plus, comme il arrive souvent, nous utilisons des unités de physiques de multiple de 1'000 cela 
permet de placer ces grandeurs entre 2 unités dérivées consécutives. 


Remarques: 


R1. Si nous avons un chiffre de la forme 154'434"347786, fréquemment et selon le contexte, nous 
nous permettons de tronquer ce dernier et nous écrivons alors fréquemment avec une précision de 
trois chiffres après la virgule ainsi ce dernier nombre devient 154 434: 10° ce qui est plus simple à 
écrire mais dangereux à manipuler à cause de l'erreur induite par la troncation. Nous renvoyons à ce 
sujet le lecteur dans le chapitre de Statistiques à la lecture de la partie traitant des erreurs relatives. 


R2. Pour les mathématiciens la notation scientifique n'est qu'une écriture d'un nombre parmi 
d'autres et le choix de cette écriture est en relation avec le contexte du problème. Evidemment ces 
"nombres résultats" obtenus peuvent être des nombres purs et durs solution de problèmes abstraits 
mais aussi de problèmes concrets issus d'expériences, de mesures etc. et là nous nous rejoignons les 
physiciens. 
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1.5. TEMPS 


Définition: Le "temps" est une variable d'état (et non un “"mesurable") et donc une notion impalpable 
mais cependant rigoureusement définie. Il s'agit aussi d'un outil mathématique qui permet de mettre en 
équation l'observation de phénomènes physiques (observables) et d'en tirer ainsi un certain nombre 
d'informations. Cet outil existe car il existe des êtres pour observer (et mesurer) la nature et ses 
changements (principe socratique) et de la matière et du mouvement pour qu'il y ait ces changements. 


Remarques: 


R1. Le temps (et ses intervalles) étant un concept arbitraire, il est symétrique c'est-à-dire que tout 
phénomène observé enregistré peut dans l'imaginaire du temps inversé retrouver ces conditions 
initiales. Nous parlons alors de "symétrie du temps" (pour l'instant il n'a jamais été à notre 
connaissance démontré ou ne serait-ce qu'observé, que le temps peut subir une "brisure de 
symétrie"). 


R2. Le temps n'est une grandeur ni extensive ni intensive. On ne peut ni additionner le temps des 
éléments d'un système physique pour avoir la durée totale de celui-ci (de plus cette question n'a pas 
de sens) ni la pondérer. Cependant on peut additionner les intervalles de temps qui décrivent 
l'évolution d'un système! 


Nous représentons très souvent en physique le temps (compris dans un intervalle) par une flèche (axe) 
horizontale représentant le sens du temps. Comme le temps est une notion purement utilitaire, nous 
pouvons alors définir chaque instant du temps comme étant le temps zéro noté #,. Cette notion est très 
utilisée en physique car souvent la seule chose qui intéresse les physiciens est la différence de temps 
notée # (de par l'utilisation du calcul différentiel et intégral). 


Démontrons maintenant que la référence temporelle est indépendante du choix pour un observateur au 
repos. Soit un temps noté par la lettre t, nous avons alors: 


M={4+t)-G+f)=4-6 
où t'est la base arbitraire (non nécessaire) lorsque nous comparons une différence temporelle. 


L'intervalle de temps est donné par une mesure étalon qui ne peut être qu'un mouvement au mieux 
parfaitement périodique (qui se répète dans le temps). Ainsi, les premiers moyens de mesure du temps 
ont été le jour et la nuit, les positions du soleil et de la lune dans le ciel, le mouvement du pendule, la 
détente de ressorts, la période de dégénérescence du césium 137 ou encore les systèmes binaires 
d'étoiles massives. Bref, tant qu'un système observable produit un phénomène périodique stable et 
suffisamment petit pour que toute mesure physique puisse y être réduite, celui-ci peut être utilisé 
comme étalon d'intervalle temporel. 


Définitions: 
D1. Un "événement" consiste à donner une signification à un point de l'espace-temps. 


D2. Deux événements sont dits "événements simultanés", s'ils ont même valeur de la coordonnée 


temporelle. 
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D3. Nous appelons "coïncidence" la simultanéité de deux événements en un même point de l'espace. La 
coïncidence est un fait absolu, indépendant du choix du référentiel. C'est en fait un cas particulier du 
principe de conservation de la causalité. Deux événements coïncidant dans un repère peuvent être 
cause à effet l'un de l'autre (et réciproquement), et cette possibilité est conservée dans le nouveau 
repère. 


1.4. LONGUEUR 


Définition: Le concept de "longueur" x est donné par l'information qui donne le chemin parcouru par 
un objet dans un intervalle de temps donné. 


Remarques: 


R1. S'il n'y avait pas de matière dans l'Univers il n'y aurait pas de notion de mouvement et donc de 
longueur parcourue et aussi comme nous l'avons déjà fait remarquer, de temps (et encore. c'est 
sans considérer certains résultats de la physique quantique que nous démontrerons dans le chapitre 
qui lui est consacré). 


R2. La longueur est une grandeur extensive (additive). Effectivement, la longueur totale d'un 
système est la somme des grandeurs. 


Comme pour le temps il n'y a pas d'origine absolue de mesure des longueurs (il n'existe pas de point 
zéro dans l'Univers comme le postule la théorie de la relativité) et les physiciens s'intéressent de toute 
façon plus particulièrement aux différences de chemin parcouru x par rapport à une origine comme 
ils le font pour le temps. 


Ainsi, de manière identique au temps, nous avons pour un observateur au repos qui observe un point 
matériel en mouvement: 


Ar = +x)-(x0+2) 2-20 


où x' est une base arbitraire mathématiquement inutile lorsque nous comparons une différence de 
position dans une différence de temps d'un point matériel. 


Si un point matériel se situe dans un espace à trois dimensions spatiales (cas le plus fréquent en 
mécanique classique) dont nous avons arbitrairement choisi l'origine O, nous notons la position * de ce 
corps par sa distance en longueur x, largeur 4 et hauteur z (appelées "coordonnées cartésiennes") par 
une flèche imaginaire dit "vecteur" (cf. cl | ( ) reliant le point d'origine arbitraire 
du référentiel spatial au point intéressé de la façon suivante: 


“ETEE 


Remarque: La flèche au-dessus du F signifie bien évidemment qu'il s'agit d'un vecteur. 


Page: 1632/4839 


[v3.0 - 2013] 


La notation: 


(x,y,z)=(x,,x,,22) (28.20) 


est une notation simplificatrice utilisée fréquemment en physique et qui devrait s'imposer dans les 
petites classes (attention le fait que les chiffres soient abaïissés en indice ne signifie absolument pas ce 
que sont des composantes covariantes - voir chapitre de Calcul Tensoriel de la section d'Algèbre - il 
s'agit juste d'une convention simplificatrice d'écriture). Cependant sur le présent site Internet nous 
passerons de l'une à l'autre des notations en fonction des besoins et des traditions en vigueur (ce sera 
donc à vous de faire attention à ne pas confondre). 


La matrice: 


est quant à elle le tenseur métrique d'un espace pré-euclidien canonique à signature positive (cf. 
chapitres de Calcul Vectoriel et Calcul Tensoriel). Ceci constitue un cas particulier en physique 
théorique mais cependant un cas très fréquent d'étude en mécanique classique (il faut commencer par 
des espaces simples avant d'aller plus loin...). 

Nous reviendrons plus en détails sur ces concepts lors de notre étude des espaces ponctuels plus loin. 
1.5. MASSE 


Définitions: 


D1. La "masse" m d'un corps est dans un système fermé une quantité qui se conserve et qui caractérise 
l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais de différentes forces 
(attractives). 


Remarques: 


R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de masse. 
L'apparition de masse ne peut être due qu'à une action extérieure. Une autre façon de dire la même 
chose est que la masse totale contenue dans l'Univers est constante. 


R2. La masse est une grandeur extensive (additive). Effectivement, la masse totale d'un système est 
égale à la somme des masses qui le compose. 


En toute rigueur, nous devrions définir également: 


D2. La "masse grave" (ou "masse de gravitation") qui est l'amplitude avec laquelle un corps matériel 
interagit avec un champ de potentiel (selon la loi de gravitation de newton - voir chapitre de Mécanique 
Classique). 


D3. La "masse inerte" (ou "masse inertielle") qui est l'amplitude qui caractérise la résistance avec 
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laquelle un corps en translation est susceptible de changer de vitesse (c'est-à-dire celle intervenant dans 
la deuxième loi de Newton - voir chapitre de Mécanique Classique) 


Remarques: 


R1. Des expériences ont toutefois prouvé que ces deux masses étaient proportionnelles au 
dix-milliardième près. Cette identité expérimentale appelée "principe d'équivalence galiléen" est à 
la base d'un des postulats de la relativité générale (cf. chapitre de Relativité Restreinte). 


R2. Contrairement aux charges électriques (voir plus loin la définition de la "charge"), qui 
caractérisent l'amplitude d'interaction par la force électrique, il n'existe que des masses positives. En 
effet, les charges électriques peuvent se repousser aux mêmes titres qu'elles peuvent s'attirer. 


De plus, la masse est étant une propriété additive (donc "extensive" comme nous l'avons déjà dit) de la 
matière: pour un système de n points matériels de masse #4, ( = 1,...,#), la masse totale est : 


Li 
M 37 (28.22) 
il 


De même, pour une distribution continue (voir plus loin au cas où pour un rappel du concept de 
distribution continue) en volume de la masse d'un système de volume total V: 


Ma =Îfacer- [f œ@eor 65 
4 F={ AF=04} 


où &7(4) est la "masse volumique" ou "densité volumique" du système au point À et où &,(7) est la 
masse volumique du système au point repéré par x = £&4 (c'est ce que signifie l'expression entre 
accolades en-dessous de la deuxième triple intégrale). 


Donc 8, (4j est la masse d'un élément de matière, centré autour de À, de dimensions caractéristiques 
devant celles du système, mais grandes devant les distances interatomiques dans ce système définie par: 


Êy = — (28.24) 
va 
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Remarques: 


R1. L'intégrale est une intégrale triple (sur les trois dimensions de l'espace), mais elle pourra être 
ramenée à une intégrale simple en exploitant les symétries du système pour choisir judicieusement 
les volumes élémentaires d'intégration. 


R2. Le calcul de la masse lors d'une distribution non continue (discrète) de matière doit être fait 
avec les composantes vectorielles calculées séparément. Une fois ce travail effectué, il convient 
d'en prendre la norme. 


R3. La masse volume &, (4) est une grandeur intensive. Effectivement, la densité d'un système 


physique n'est pas égale à la somme de ces densités (c'est du bon sens!). Le lecteur remarquera que 
cette grandeur intensive qu'est la masse volumique est égale au rapport de deux grandeurs 
extensives. 


Définitions: 


D1. Nous disons qu'un système est un "système homogène" si sa masse volumique, surfacique, linéique 
(voir définition ci-dessous) est constante. 


D2. Nous disons qu'un système est un "système isotrope", si ses propriétés physiques sont identiques en 
tout point. 


Nous définissons aussi parfois la "masse surfacique" (ou "densité surfacique" de masse) pour des 
systèmes quasiment sans épaisseur et une "masse linéique" (ou "densité linéique" de masse) pour des 
systèmes de section négligeable devant leur longueur. Nous avons alors (S étant une surface et s une 
abscisse curviligne): 


Mis = Îl 23 (48 =([ PP où Min = [exas = [2645 (28.25) 
$ $ 


avec dans le cas général: 
dm  _dm 
ds al 


Remarque: Souvent, dans la littérature, ainsi que dans le présent site internet, la masse volumique 
est notée simplement ©, la masse surfacique €, et la masse linéique #. 


Définition: Avec ce qui précède, nous pouvons définir la "densité" comme étant la quantité d'éléments 
tous identiques et dénombrables par unité de volume, surface ou linéique. 


1.6. ÉNERGIE 


Nous ne savons pas ce qu'est exactement l'énergie (notée sous sa forme générale par la lettre E dans les 
petites classes) mais nous en connaissons ses effets. Ce que nous savons cependant, c'est qu'il en existe 
plusieurs formes dont voici une liste des plus connues: 
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- "L'énergie travail" qui est l'énergie créée par l'application d'une force sur un corps lui donnant une 
certaine énergie cinétique ( ) ou énergie potentielle (qu'elle soit 
gravifique, électrostatique comme démontré en mécanique dssique ou électrodynamique). 


- "L'énergie chaleur ” qui est une forme d'énergie déterminée par le nombre de micro-états d'un 
système (ci. 1e 


- "L'énergie de masse" qui est l'énergie contenue dans une certaine quantité de masse ( 


). 


De ces trois énergies découlent une grande quantité de familles d'énergies dérivées dont les plus 
connues sont: l'énergie nucléaire, l'énergie électrique, l'énergie solaire, l'énergie éolienne, l'énergie 
mécanique, l'énergie gravifique, l'énergie des marées, l'énergie électromagnétique, l'énergie fossile, 
l'énergie hydraulique, l'énergie corporelle, etc. 


Remarques: 


R1. La masse et l'énergie sont équivalentes comme nous le verrons lors de notre étude de la 
relativité restreinte (cf. cha inte), si nous définissons un système d'unités 
telles que la vitesse de la lumière vaille : = 1 (convention très utilisée par les physiciens dans la 
recherche de pointe). 


R2. L'énergie au même titre que la masse est une grandeur extensive. 


Nous pouvons quand même tenter de nous demander ce qu'est l'énergie exactement? 


Définition: "L'énergie" est l'effet d'une cause d'un changement ou de la conservation des propriétés 
d'un système. Cette cause étant non nécessairement déterministe et en moyenne nulle et conservative 
dans un système fermé. 


Remarques: 


R1. La vitesse, le potentiel, le nombre de micro-états peuvent être considérés comme l'acquisition 
d'une quantité d'informations sur un système. 


R2. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée d'énergie. 
L'apparition d'énergie ne peut être due qu'à une action extérieure. Une autre façon de dire la même 
chose est que l'énergie totale contenue dans l'Univers est constante. 


1.7: CHARGE 


Il est difficile de dire quelque chose sur la charge électrique (vous pouvez chercher une définition sur 
l'internet vous verrez...). Cependant si nous nous référons à l'approche de Yukawa (« 
) nous pouvons tenter d'en donner la définition suivante: 


Définition: Une "charge électrique" est une propriété conservative qu'a une particule se situant dans un 
champ de potentiel à symétrie sphérique à interagir avec la source de ce champ dans le cadre de 
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l'échange d'un quantum d'interaction (le photon en l'occurrence créé par les fluctuations quantiques du 
vide en présence d'une masse) définissant un champ vectoriel de type Coulombien. 


Remarques: 


R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de charges. 
L'apparition de charges ne peut être due qu'à une action extérieure. Une autre façon de dire la 
même chose est que la charge totale contenue dans l'Univers est constante. 


R2. La charge est une grandeur extensive. Effectivement, la charge totale d'un système physique est 
égale à la somme algébrique des charges qui le constitue. 


Ou une autre définition similaire à celle de la masse: 


Définition: La "charge électrique" q d'un corps est dans un système fermé une quantité qui se conserve 
et qui caractérise l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais des forces 
électrostatiques et magnétiques. 


Contrairement à la masse, il existe des charges électriques positives et négatives. La charge électrique 
reste cependant une propriété additive (extensive). Ainsi, pour un système de q particules de charge 
4; @ =1...,x), la charge totale est: 


x 
=D + (827 
Or gi (8:24) 
il 


et est donc aussi comme la masse, une propriété extensive. 


De même, pour une distribution continue en volume de la charge d'un système de volume total V (nous 
notons les densités de charge de manière identique si l'ambiguïté n'est pas possible de la même manière 
que pour la masse): 


Qn * [Jar æar = NT Oo 6629 
V={ 47=0À 
où &-(4) est la "densité volumique de charges" du système au point A, c'est-à-dire la charge d'un 


élément de matière, centrée autour de À, de dimensions caractéristiques devant celles du système, mais 
grandes devant les distances interatomiques dans ce système (&-(7) est la densité volumique de charge 


du système au point repéré par # = ©4) définie par: 
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Remarques: 


R1. L'intégrale est une intégrale triple, mais elle pourra être ramenée à une intégrale simple en 
exploitant les symétries du système pour choisir judicieusement les volumes élémentaires 
d'intégration. 


R2. Le calcul de la charge lors d'une distribution non continue (discrète) de matière doit être fait 
avec les composantes vectorielles calculées séparément. Une fois ce travail effectué, il convient 
d'en prendre la norme. 


R3. La charge volumique à, (4) est une grandeur intensive. Effectivement, la densité de charge 


d'un système physique n'est pas égale à la somme de ces densités (c'est du bon sens!). Le lecteur 
remarquera encore une fois que cette grandeur intensive qu'est la masse volumique est égale au 
rapport de deux grandeurs extensives. 


De même que pour la masse, nous pouvons donner les définitions suivantes: 


D1. Nous disons qu'un système est "système homogène" si sa charge volumique, surfacique, linéique 
(voir définition ci-dessous) est constante. 


D2. Nous disons qu'un système est "système isotrope", si ses propriétés physiques sont identiques en 
tout point 


Nous définissons aussi parfois la "densité surfacique de charge" (ou "densité de surface" de charge) 
pour des systèmes quasiment sans épaisseur et une "charge linéique" (ou "densité linéique" de charge) 
pour des systèmes de section négligeable devant leur longueur. Nous avons alors (S étant une surface et 
s une abscisse curviligne): 


Qu = [[ 25 (48 =[[ 2 (PIS où Qu ” [2 (Ads = [6x5 (28.30) 
ë 5 


avec: 


_dg  _dgq 
DT: 


Remarque: Souvent, dans la littérature, ainsi que dans le présent site internet, la densité volumique 
de charge est notée simplement &, la densité surfacique de charge 4, et la masse linéique #. 


1.8. DISTRIBUTIONS 


Définitions: 


D1. Une masse ou une charge sont dites "ponctuelles" si elles occupent un volume dont les dimensions 
sont très inférieures aux distances d'observations. 
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Remarque: La charge élémentaire est une excellente approximation d'une charge ponctuelle étant 
donné sa petite taille dont le rayon classique est de l'ordre du femtomètre, ce qui est bien sûr très 
petit devant les dimensions d'observation classiques. 


D2. Nous considérons N corps de charge ou masse finies dans un volume V. Si ce volume est supposé 
suffisamment grand pour que la distance moyenne entre les corps soit très supérieure à la dimension de 
ceux-ci, nous avons affaire à une "distribution discontinue" ou "distributions discrète" de ces corps 
(nous parlons parfois aussi de distribution non-uniforme). 


Les calculs sont impossibles à faire en partant d'une distribution discrète car, en général, le nombre de 
corps à prendre en considération est très élevé lorsque le volume est de dimension macroscopique. 
Dans ce cas, il faut introduire un autre type de distribution. 


D3. Nous considérons N corps de charge ou masse finies dans un volume V. Si la répartition des 
éléments est telle qu'il n'y pas de "trous" entre chacun d'eux (en d'autres termes: chaque élément est 
serré contre un autre) alors nous avons affaire à une "distribution continue". Une distribution continue 
peut alors être décrite par une fonction qui représente la manière dont les éléments se répartissent dans 
un volume, surface ou ligne. 


Remarques: 


R1. Nous pouvons préciser parfois, comme nous en avons déjà fait mention lors des définitions de 
la masse ou de la charge que les distributions définies précédemment peuvent être de type 
volumique, surfacique ou linéique. Si cela n'est pas précisé, c'est que l'information est implicitement 
triviale. 


R2. Le terme "continue" dans "distribution continue" provient du fait que nous intégrons la fonction 
d'où la nécessité qu'elle soit continue (au sens de Riemann ou de Lebesgue suivant les cas. - voir 
chapitre de Calcul Différentiel Et Intégral). 


2. CONSTANTES 


La physique à l'opposé des mathématiques est une science exacte dans le sens que sa vérification et sa 
validité se basent et sont mis constamment à l'épreuve par des faits expérimentaux. 


Comme l'être humain a dû choisir arbitrairement un système de mesures, certaines lois établies 
théoriquement à l'aide de propriétés de la matière ne sont souvent exactes qu'à un facteur multiplicatif 
constant près de normalisation relativement à ce système de mesure. Apparaissent alors dans les 
équations de la physique, des constantes dont l'existence n'est due qu'à ce système de mesure (mais 
cependant ce n'est pas toujours le cas), certaines constantes bien qu'en adaptant le système de mesure 
n'égaleront (du moins il semblerait) jamais l'unité. 


Il existe de nombreuses constantes en physique (une infinité au fait) mais certaines ont un statut 
particulier dans le sens qu'elles ne peuvent se déduire d'autres constantes. Nous en proposons ici la liste 
et les valeurs (non exactes) et nous les retrouverons fréquemment lors de nos développements dans ce 
site. 
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Remarques: 


R1. Les constantes sont données pour certaines au temps auquel le lecteur les lit (..) car selon 
certaines théories, les valeurs ne sont pas tout à fait fixes. 


R2. La série de normes ISO 80000 définit au niveau international les valeurs de nombreuses 
constantes scientifiques. 


2.1. CONSTANTES UNIVERSELLES 


Les valeurs listées ci-dessous sont des valeurs dont les scientifiques ont remarqué qu'elles semblaient 
(...) constantes et indépendantes de tous paramètres utilisés, et que la théorie suppose donc réellement 
constantes. 


Constante gravitationnelle 


Température absolue 


Gz= 6.6742.10711 [° 82 kg] 


7, = 213.15[°Æ€] 


Vitesse (célérité) de la lumière 


c = 299'792'458[m"s" | 


Nombre d'Avogadro 


Nu © 6.0221367: 108 [mo] 


y. 


Charge de l'électron 


ge =1.602:10%[C'] 


Constante de Planck 


h 26.626 10 #[J.5] 


Constante de Boltzmann 


k=13810%[J°k”] 


Permittivité du vide 


&, 8.854: 107 [c' Fm 


Susceptibilité magnétique 


4, =1.26:10% [PCT sm" 


Pi 


x = 3.141592654 


Constante de Dirac (utilitaire) 


Constante de Coulomb 
(utilitaire) 


h=h{27 210510 #[J:5] 


k=1/47e, = 8.987 10° LE c?] 


Tableau: 28.2 - Constantes universelles 
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Remarques: 


R1. La célérité de la lumière, la permittivité du vide et la susceptibilité magnétique du vide se 
déduisent les uns des autres par une relation que nous verrons lors de notre étude des équations de 


Maxwell (cf. chapitre d'Électrodynamique). 


R2. La constante de Dirac est aussi parfois appelée "constante de Planck réduite". 


R3. La constante de Boltzmann peut être calculée comme le rapport de la constante molaire des gaz 
R (voir plus bas les constantes chimiques) sur le nombre d'Avogadro N (cf. chapitre de Mécanique 


Des Milieux Continus). 


Il existe d'autres constantes d'ordre pratique qui se déterminent théoriquement et dont la valeur sera 
utile à tout ingénieur ou physicien qui souhaiterait appliquer dans la pratique certaines des relations qui 


seront démontrées sur ce site: 


2.2. CONSTANTES PHYSIQUES 


Définition: Une "constante physique" est une quantité physique dont la valeur numérique est fixe. 
Contrairement à une constante mathématique, elle implique directement et toujours une grandeur 


physiquement mesurable. 


Masse de l'électron (au repos) 


Masse du neutron (au repos) 


m, = 9.11 10 [kg] 


m, 21.674: 10 7 [kg] 


Masse du proton (au repos) 


m, =1.672:10 Ÿ [kg] 


Constante de structure fine 


æ=7.297 10 


Quantum de flux magnétique 


D, = 2.067-10 [F6] 


Constante de Stefan 
(appelée aussi 1ère constante 
de Stefan-Boltzmann) 


oz 5.67 10* [7° sp? K*] 


Constante de Stefan- 
Boltzmann 

(appelée aussi 2ème constante 
de Stefan-Boltzmann) 


Te 27.56 10% [7° M: K”] 


Rayon classique de l'électron 


Impédance du vide 


r, # 2.817107 [re] 


Z, = 316[P:C's"] 


Magnéton de Bohr 


Constante de Rydberg 


kg = 9274010 % [JT] 


R, #10.973:10° [| 
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Rayon de Bohr ay © 0.052910 [re] 


Electron-Volt 1[e7]2 1.602107" [7] 


Accélération gravitationnelle | Z æ 9.81 [r s”] 
terrestre moyenne 


Pression standard 8, =101'325[ Pa] = [at] 


Tableau: 28.3 - Constantes physiques 


2.3. CONSTANTES PHYSICO-CHIMIQUES 


Les constantes physico-chimiques sont des constantes physiques que l'on retrouve plus particulièrement 
dans l'ensemble des domaines ayant trait à la chimie. 


Constante molaire des gaz R=8.31 [7 moi K a] 
Constante de Faraday F = 96'458 [C mol”] 
Volume molaire F, = 224141 É mor] 
Unité de masse atomique uma 1.660510 [kg] 


Tableau: 28.4 - Constantes physico-chimiques 


Remarque: Le lecteur intéressé par les propriétés des éléments chimiques peut télécharger le 
tableau périodique des éléments proposé dans la rubrique de téléchargement du site. 


2.4. CONSTANTES ASTROPHYSIQUES 


Le tableau suivant contient les valeurs des constantes et paramètres couramment utilisés en 
astrophysique et aussi plus particulièrement en cosmologie. 


Constante de Hubble HE) 275 [ee Eu | Mpc| 


Densité critique de l'Univers | €, = 510% [te mr] 


Distance Terre-Soleil (parsec) | 3.856: 10" [>] 


Rayon Terrestre Rr © 6.378" 10° [we] 
Rayon Solaire R, = 6.96°10 [»] 
Masse Terrestre My =.5972 10 [kg] 
Masse Solaire M, = 1.989 107 [4] 


Tableau: 28.5 - Constantes astrophysiques 
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2.5. CONSTANTES DE PLANCK 


Les constantes de Planck sont principalement des curiosités physiques qui découlent d'un système 
d'unités particulier et dont les valeurs selon le système S.I. sont données dans le tableau ci-dessous. 


Remarque: Le lecteur intéressé par la provenance des différentes constantes de Planck (longueur 
de Planck, masse de Planck, etc.) devra se rendre dans le chapitre de Physique Quantique 
Ondulatoire du site où ces constantes sont déterminées avec les détails nécessaires. 


Longueur de Planck A3 = 210 [re] 
Temps de Planck t,=5.391.10 % [s] 
Masse de Planck M,=2.176 10 [Kg] 
Température de Planck T, #1.42:10°[K] 
Energie de Planck £, =1.956:10°[J] 
Densité de Planck De ot 107 [te] 
Force de Planck F, =1.21:10*[#] 
Puissance de Planck 2, 23.629:10[W] 


æ, 2185510 [s”] 


notée aussi parfois avec l'unité des 


Pulsation de Planck radians explicitement: 


æ, 2185510 | Rad 5 | 


Charge de Planck 4 =1.875:10 *[C] 
Courant de Planck 1, =3.479:10% [A] 
Tension de Planck U, 21.0432:107 [7] 
Impédance de Planck 1, = 29.98[Q] 


Tableau: 28.6 - Constantes de Planck 


Malgré les exemples donnés combien y-a-t'il de constantes ? Pourquoi jouent-elles un "rôle central" 
dans les théories physiques ? Ont-elles toutes la même importance ou certaines sont-elles plus 
fondamentales ? Selon quels critères ? Peut-on alors tester si elles sont vraiment constantes ? 


Pour essayer de répondre à certaines de ces questions, remarquons tout d'abord qu'à chaque étape de 
nos constructions théoriques il subsiste des paramètres constants qui ne sont pas et ne peuvent pas être 
expliqués en termes de quantités plus fondamentales, simplement parce que ces dernières n'existent pas 
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dans l'état de nos connaissances. Quand les théories s'affinent, il est en effet possible qu'une constante 
se trouve expliquée en termes de nouveaux paramètres, plus fondamentaux. Ainsi, la masse du proton 
est une constante fondamentale de la physique nucléaire, mais doit en principe pouvoir se calculer, dans 
le cadre de la chromodynamique quantique, en fonction de la masse des quarks et des énergies des 
liaisons électromagnétique et forte. Ce changement de statut est associé à celui du proton, qui de 
particule élémentaire devient corps composite. 


Nous définirons modestement les constantes comme tous les paramètres non déterminés dans un cadre 
théorique donné. Cette définition revient à accepter que nous soyons incapables d'écrire une équation 
d'évolution pour ces constantes qui se révèlent donc comme la limite de ce que les théories où elles 
apparaissent sont en mesure d'expliquer. Cependant l'hypothèse de constance est implicitement 
contrôlée par la validation expérimentale de ces théories. Les résultats des expériences doivent être 
reproductibles à divers moments et dans divers laboratoires. Si c'est le cas, dans la limite des précisions 
expérimentales, alors il est légitime de considérer que l'hypothèse de constance est valide. Cette 
définition implique qu'il n'existe pas de liste absolue de constantes, car l'appartenance à une telle liste 
dépend des cadres théoriques choisis pour décrire la nature et peut donc changer avec les progrès de la 
connaissance. 


Se pose maintenant la question de savoir s'il est possible de caractériser plus précisément le concept de 
constante et de déterminer si, parmi toutes les constantes, certaines sont plus fondamentales que 
d'autres. Pour cela, il faut commencer par révéler une relation entre constantes et unités. 


Ainsi, Planck découvre en 1900 qu'il était possible d'utiliser les trois constantes physiques 
fondamentales: 


G = 6.67259 1071 [r Ta du 
c= 299'792'458[ms"] 
h=hk{2x 21.05 10 [J'sl 


pour définir les trois unités de masse, de temps et de longueur à partir de la masse de Planck, de la 
longueur de Planck et du temps de Planck (voir le chapitre de Physique Quantique Ondulatoire pour la 
démarche mathématique qui permet de déterminer leurs valeurs). 


Planck baptise ces unités "Système d'Unités Naturelles" (SUN) car elles sont indépendantes d'un corps 
ou d'un matériau et [...] gardent nécessairement leur signification pour tous les temps et toutes les 
civilisations, même celles qui sont extra-terrestres et non humaines. La signification de ces unités met 
longtemps à émerger. Elles signalent l'échelle où gravitation et mécanique quantique deviennent de 
même amplitude. Elles sont donc très adaptées à la cosmologie primordiale et à l'étude des trous noirs 
ainsi que la mécanique quantique relativiste. 


Le choix des unités de Planck comme unités naturelles est lié aux considérations justifiant que G, c, h 
sont les trois constantes dimensionnées les plus fondamentales (connues à ce jour). Dans ces unités, la 
valeur numérique de ces trois constantes fondamentales est 1 comme nous l'avons déjà fait déjà 
remarquer. 


Le rôle des constantes dans la structuration des théories physiques peut être assez magnifiquement 
illustré par le cube magique ou "cube de Okun" des théories physiques ci-dessous (dont la validité reste 
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à vérifier bien sûr). L'idée consiste à "allumer" ou "éteindre" une à une les trois constantes 
fondamentales afin de voir comment les théories physiques s'articulent les unes par rapport aux autres. 


Remarque: Le lecteur comprendra mieux les explications qui vont suivre lorsqu'il aura étudié la 
relativité générale, la physique quantique des champs ainsi la physique quantique ondulatoire donc 
si jamais il peut sauter ce texte en attendant. 


Gravitation(newtonienne 


Gravitation quantique 


Relativité générale newtonienne 


Relativité restreinte Physique quantique 


Théorie quantique 
des champs 


Figure: 28.1 - Cube de Okun 


Quand G est mis à O, cela revient à supprimer toutes les forces gravitationnelles et à découpler la 
matière de l'espace et du temps. Quand h est mis à 0, nous supprimons le caractère quantique de la 
nature et nous découplons les natures corpusculaires et ondulatoire (de par la relation de De Broglie), 
quand 1/c est mis à O, la vitesse de la lumière est infinie et le temps et l'espace se découplent l'un de 
l'autre (de par les transformations de Lorentz). Pour visualiser cela, nous considérons le cube ci-dessus 
introduit par le physicien soviétique Mikhaïl Bronshtein qui reprend une idée développée initialement 
par Lev Landau, Dimitri Ivanenko et Georgi Gamow. 


Tout naturellement, au niveau le plus bas, nous trouvons (0,0,0) la mécanique newtonienne, qui ne 
prend pas en compte les effets relativistes, quantiques et gravitationnels. Au niveau supérieur où nous 
considérons l'effet d'une constante, nous trouvons les trois théories de la relativité restreinte (1,0,0), de 
la mécanique quantique en (0,1,0) et de la gravitation newtonienne en (0,0,1), trois théories testées 
avec une grande précision dans leur domaine de validité. 


A un niveau encore supérieur, la théorique quantique des champs en (1,1,0) prend en compte les effets 
quantiques et relativistes; la relativité générale en (1,0,1) prend en compte les effets gravitationnels et 
relativistes et la gravité quantique newtonienne en (0,1,1) est censée offrir une description quantique et 
non relativiste de la gravitation. Seules les deux premières théories sont actuellement fondées 
expérimentalement et théoriquement. 


Au niveau ultime se trouve en (1,1,1) la théorie du Tout (dénomination très prétentieuse et trop 
commerciale), censée donner une description quantique et relativiste de la gravitation. Sa formulation 
n'est pas encore connue, bien que les théories des cordes (voir chapitre du même nom), intensivement 
étudiées de nos jours, semblent des candidats sérieux. Ces théories apparaissent comme des cas limites 
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d'une théorie plus large et plus profonde mais non encore formulée: la théorie M (le M pour "Mère") 


3. PRINCIPES DE LA PHYSIQUE 


Les progrès de la science en général et de la physique en particulier étaient fondés il y deux siècles 
principalement sur l'expérimentation, c'est-à-dire que l'on reproduisait en laboratoire des phénomènes 
donnés pour les analyser systématiquement (la reproduction d'une observation validant une hypothèse). 
Cela revenait systématiquement à poser des questions précises à la nature et à décrire et étudier les 
réactions ainsi provoquées. La répétition à volonté d'un phénomène lors d'une expérience ne serait pas 
garantie s'il n'existait pas un principe général de causalité. 


3.1. PRINCIPE DE CAUSALITÉ 


Définition: Nous définissons le "principe de causalité" par le fait que dans exactement les mêmes 
conditions, les mêmes causes conduisent toujours aux mêmes effets. Autrement dit, si certaines 
conditions initiales sont parfaitement connues, le phénomène se déroulera de façon déterminée, 
toujours la même. 


Au fait, l'expérience n'est pas nécessaire si nous considérons les principes de premier ordre qui sont par 
définition "les principes logiques que nous pouvons déduire par induction et que nous ne pouvons 
vérifier expérimentalement avec certitude". 


Or, les exigences de la société ont très peu souvent laissé le temps aux grands hommes de science de 
penser à ces principes du premier ordre par des expériences imaginaires (méthode très usitée par Albert 
Einstein pour la parenthèse...). 


C'est dans un trilemne proposé par le sceptique de l'antiquité Agrippa, selon un argument rapporté par 
Sextus Empiricus, que la question de la justification de la connaissance a été posée le plus 
explicitement: 


H1. Ou bien la connaissance est fondée en dernière instance sur des principes premiers maïs arbitraires 
H2. Ou bien nous ne trouvons pas de tels principes et nous avons une régression à l'infini 
H3. Ou bien la justification est circulaire 


Ce trilemne porte aussi souvent, dans la philosophie contemporaine, notamment chez Karl Popper, le 
nom de "trilemne de Fries" ou "trilemne de Münchhausen" et nous ne savons actuellement pas dans 
quel cas de figure (H1, H2 ou H3) nous nous situons. 


Énonçons maintenant trois principes (ou hypothèses) premiers élémentaires: 


3.2. PRINCIPE DE CONSERVATION DE L'ÉNERGIE 


Le principe premier de conservation de l'énergie s'énonce (basiquement.. voir remarques plus bas...) 
ainsi: L'énergie totale, notée de tout système isolé et inertiel ne varie pas en fonction du temps s'il n'y a 
pas apport ou retrait d'énergie (ou de masse) ou de chaleur de l'extérieur de ce système. 


Ce principe peut être exprimé par la formule : 


AE, = AU+AE, +AE, 
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où ÀÆ,, est la variation totale d'énergie du système, A T7 la variation de l'énergie interne du système. 


C'est à dire son énergie propre correspondant aux énergies cinétiques et potentielles microscopiques, 
des particules qui le constituent. 


ÀÆ, est la variation de l'énergie cinétique à l'échelle macroscopique (mouvement du système dans un 
référentiel donné) et ÀÆ,, est la variation de l'énergie potentielle à l'échelle macroscopique, du système 


en interaction avec des champs gravitationnels ou électromagnétiques. 


En physique, une loi de conservation (rien ne se perd, rien ne se crée) exprime qu'une propriété 
mesurable particulière d'un système physique isolé reste constante au cours de l'évolution de ce 
système. La liste ci-dessous énumère des lois de conservations utiles à l'ingénieur et qui n'ont jamais été 
prises en défaut à ce jour et qui découlent pour la plupart de la conservation de l'énergie: 


- conservation de la quantité de mouvement 

- conservation du moment cinétique 

- conservation de la charge électrique 

- conservation du flux magnétique 
-conservation de la masse 


Le théorème de Noether que nous verrons un peu plus bas exprime l'équivalence qui existe entre les 
lois de conservation et l'invariance des lois physiques en ce qui concerne certaines transformations 
(typiquement appelées DR Ce théorème ne s'applique qu'aux systèmes descriptibles par un 
lagrangien ( | ue). Par exemple, l'invariance par translation dans le 
temps implique que l'énergie est conservée, l'invariance par translation dans l'espace implique que la 
quantité de mouvement est conservée, et l'invariance par rotation dans l'espace implique que le moment 
angulaire est conservé. 


Cette équivalence est démontrable et découle de l'invariance dans le temps des lois de la physique. Il 
s'agit du premier principe (théorème) de Noether que nous allons démontrer un peu plus loin. 


L'énergie que l'être humain quantifie avec l'unité "Joules" ne peut cependant être définie avec 
exactitude. Répondre à cette question revient à savoir ce qu'est la masse (relation d'équivalence 
d'Einstein) et donc à connaître l'élément fondamental de l'Univers (nous en avons déjà fait mention plus 
haut dans le présent texte). 
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Remarques: 


R1. L'énergie peut se trouver sous plusieurs formes (cela ne voulant pas dire qu'il existe plusieurs 
énergies différentes !!!) comme la chaleur, l'énergie cinétique, potentielle, électrique, magnétique, 
etc. comme nous en avons déjà fait mention plus haut. 


Ainsi, dans les applications grand public, et notamment dans le domaine de la nutrition, nous 
exprimons fréquemment l'énergie en calories. La calorie étant en toute DENON l'énergie qu'il faut 
fournir pour faire chauffer un gramme d'eau de un degré Celsius (« 

), mais les nutritionnistes nomment par simplification "calorie" ce que les 
physiciens nomment (correctement) "kilocalorie". 


En électricité, nous utilisons aussi le "Watt-heure", énergie consommée pendant une heure par un 
appareil ayant une puissance d'un Watt (joules par secondes). 


R2. La violation de ce principe de conservation de l'énergie dans un système isolé n'a encore jamais 
été observée mais sa validité ne peut être démontrée (d'où le fait que ce soit un "principe premier"). 


R3. Certains physiciens débattent du fait que ce principe premier découle du théorème de Noether 
que nous verrons plus loin. Mais cela est tout à fait discutable étant donné que le théorème de 
Noether considère l'énergie potentielle comme constante dans le temps d'où... 


3.3. PRINCIPE DE MOINDRE ACTION 


Le principe premier de moindre action (dit également "principe premier d'économie" ou "principe 
variationnel") s'énonce ainsi: 


Tous les phénomènes naturels s'accordent avec le fait que, la Nature, dans la production de ses effets, 
agit toujours par les voies les plus simples et les plus directes. 


Avec cet énoncé et le principe de conservation de l'énergie, nous pouvons alors établir des outils 
mathématiques d'une formidable puissance pour l'étude de la physique théorique. Mais nous ne 
pouvons développer à ce niveau du discours le formalisme mathématique de ce principe car il demande 
des outils que nous souhaiterions introduire plus loin, dans le chapitre de Mécanique Analytique (lors 
de l'étude du formalisme lagrangien pour être plus précis). 


En attendant voici les deux relations qui le résument: 


te 


S(a.4) = [E(a.dat 


JL | à JE | 
84 dt Er 


Remarque: La violation de ce principe dans un système isolé n'a encore jamais été observée mais sa 
validité ne peut être démontrée (d'où le fait que ce soit aussi un "principe premier"). 
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3.4. PRINCIPE DE NOETHER 


Le principe premier de Noether (appelé traditionnellement "théorème de Noether") associe de façon 
élégante des quantités physiques conservées aux symétries des lois de la nature. La symétrie de 
translation dans le temps (phénomène invariant dans le temps) correspond à la conservation de 
l'énergie, celle de translation dans l'espace à la conservation de l'impulsion (quantité de mouvement), 
celle de rotation dans l'espace à la conservation du moment cinétique etc. 


En d'autres termes, le principe premier de Noether énonce que la physique est: 


- Symétrique (invariante) par translation dans le temps (ceci ayant pour conséquence qu'il n'y pas 
d'origine du temps) 


- Symétrique (invariante) par translation dans l'espace (ceci ayant pour conséquence qu'il n'y a pas 
d'origine à l'espace) 


- Symétrique (invariante) par rotation (ceci ayant pour conséquence qu'il n'y a pas de direction 
privilégiée dans l'espace) 


Remarques: 


R1. Ce principe implique donc qu'un référentiel galiléen ( ) est 
homogène (pas d'origine de temps ou d'espace privilégiée) et isotrope (pas de direction privilégiée). 


R2. Il ne faut pas confondre l'invariance des lois et la non invariance des solutions DIRQPQUES 
auxquelles aboutissent ces lois! Par exemple, la décharge d'un condensateur ( 
) est invariante par translation dans le temps mais pas la solution. 


Ce résultat établi en 1915 par Emmy Noether juste après son arrivée à Gôttingen, aurait été qualifié par 
Albert Einstein de "monument de la pensée mathématique". C'est maintenant un des piliers de la 
physique théorique. 


Aujourd'hui, il est souvent présenté à l'occasion de cours sur la théorie quantique des champs. Cela le 
fait paraître plus compliqué et mystérieux qu'il n'est, et c'est oublier qu'il s'applique aussi à la mécanique 
classique. 


Remarque: Il est recommandé au lecteur de lire la démonstration du théorème de Noether en 
parallèle des chapitres de mécanique analytique et de mécanique classique. 


Ainsi, les symétries jouent un rôle majeur en physique. Elles permettent d'une part de simplifier les 
problèmes d'une part et de tirer de nouvelles lois d'autre part. Pour illustrer la première application des 
symétries il suffit d'évoquer la forme mathématique du DURE gravitationnel engendré par une masse 
ponctuelle située à l'origine du référentiel (Cf. Chap nique Cla ). En coordonnées 
cartésiennes, l'expression du potentiel gravitationnel est relativement complexe 
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alors qu'en coordonnées sphériques (système de coordonnées qui tire parti de la symétrie sphérique du 
potentiel) il prend une forme très simple : 


Fac 

r 

Les propriétés de symétrie d'un problème sont ici exploitées de façon à simplifier le traitement 
mathématique des lois physiques. Même si ces considérations mathématiques nous renseignent sur les 
propriétés physiques du système considéré, elles conservent cependant un caractère purement 
technique. 


Les symétries trouvent pourtant une autre application dont la signification physique est beaucoup plus 
profonde. Le fait, non fortuit, qu'un système possède des symétries doit certainement avoir des 
implications physiques. Intuitivement, nous pouvons saisir que la présence de symétries dans un 
système physique se traduit par l'invariance de certaines de ses propriétés physiques sous l'application 
de transformations spatio-temporelles ou, plus généralement, des transformations géométriques. 
L'invariance de propriétés physiques doit induire nécessairement des relations d'une nature nouvelle 
entre les variables du système. De telles relations doivent à leur tour révéler des lois plus profondes qui 
associent la géométrie du système aux lois de la nature. Ce raisonnement, bien qu'intuitif, nous invite à 
explorer plus en profondeur les relations qui pourraient exister entre les lois physiques et les propriétés 
géométriques de l'espace-temps. 


Considérons une expérience de mécanique plus ou moins complexe observée simultanément par deux 
physiciens O et O'situés en des lieux différents tel que chacun d'eux choisit un référentiel dont il est 
l'origine. 


Ils entreprennent de mesurer diverses grandeurs physiques et obtiennent des résultats numériques qui 
dans l'ensemble diffèrent. Cependant, les lois physiques qu'ils en tirent (à niveau de connaissance égal) 
sont identiques. Cette conclusion est triviale car nous savons tous que les lois de la nature ne doivent 
pas dépendre pas de l'emplacement des observateurs. 


Mathématiquement, la différence entre les référentiels de O et O' selon le référentiel de l'expérience 
étudiée est le passage de l'un à l'autre dans un plan par une rotation R{#) et/ou une translation T{?) 


(cf. ). 


Le fait que les lois physiques sont indépendantes de la position de l'observateur implique qu'elles ne 
varient pas après leur avoir appliqué une rotation et/ou une translation. Nous disons alors qu'elles sont 
"invariantes par rotation et par translation" ou encore qu'elles sont "symétriques par rotation et par 
translation". 


Rappel: En mathématiques le terme "symétrie" prend un sens plus général qui peut se définir comme 
suit: "transformation qui ne change ni la forme, ni les dimensions d'une figure". Nous pouvons 
remarquer que le sens courant du mot "symétrie" correspond à un cas particulier de symétrie au sens 
géométrique du terme, qui consiste à inverser les objets par rapport à un plan. 
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Remarque: En physique, la définition d'une symétrie est semblable à celle des mathématiciens mais 
s'applique aux lois de la nature et non plus aux figures géométriques. Ainsi une symétrie en 
physique est une transformation des variables du système - qui peuvent être des variables 
géométriques ou des variables plus abstraites - qui ne change pas la formulation des lois physiques. 


Donnons une définition rigoureuse d'une symétrie en physique: 


Soit un système S dont l'état évolue au cours du temps. Désignons l'état de S à l'instant t par S(t). A 
l'instant initial 4, , S se trouve donc dans l'état S£,). Considérons une transformation géométrique T qui 


agit en chaque point de l'espace et éventuellement du temps. En un instant t, l'action de T sur le système 
S a pour effet de le transformer en un système S'{£} = T[S (&] tel qu'à l'instant #, , le transformé par T 


de S(6,) est S'(4). 


Définition: La transformation T est appelée une "symétrie physique" si la transformée par T du système 
S (ce qui donne S") évolue de la même façon que S, c'est-à-dire que si nous appliquons les lois de la 
mécanique sur $'{£,) pour connaître son état S" en un instant postérieur t alors S'"(£) = SE) = TTS'(6)]. 


3.4.1. INVARIANCE PAR TRANSLATION DANS L'ESPACE 


Considérons un système isolé constitué de n particules en interaction repérées par les vecteurs position 


F,. L'interaction de deux particules i,j dérive d'un potentiel g%,F;,£) (cf. chapitre de Mécanique 


Classique). Chaque particule est soumise à des forces résultant de l'interaction avec les autres 
particules. Pour une particule i donnée, la résultante de ces forces s'exprime selon la loi de Newton 
(voir chapitre de mécanique classique) : 


ÊF,9 =mi(ñt)= SE (8,5, = D = p(r.F.t) (8:36) 


Appliquons au système la translation dans l'espace suivante : 


où } est un vecteur quelconque. Dire que la translation du système est une symétrie signifie que 
l'accélération et la force qui agit sur chaque particule sont inchangées après la transformation. 


E(F.0=E (A +11) (28.38) 
Ce qui implique : 
D -mV At éir, tt] Die p(ñ.F,6) (28.39) 


Cette égalité doit être vraie quelle que soit la position des particules, donc quels que soient >; et 7:. Il 


est clair que la seule manière de vérifier la dernière égalité dans ces conditions est d'égaler deux à deux 
les potentiels entre chaque particule j avec la particule i, c'est-à-dire : 
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Les potentiels sont alors nécessairement (et c'est là, la puissance du théorème de Noether!) des 
fonctions de 7; — 7; telles que: 


p(ñ.F.4)= (x - Ft) (28.41) 


Ce qui entraîne immédiatement que la résultante de toutes les forces appliquées aux particules du 
système est nulle et que donc la quantité de mouvement totale est conservée: 


d 2 2 —— 
DA Fpt)+ SEE ROSE = 0 DE) = 0 & Xi = c (28.43) 


L'invariance par translation de la loi de Newton entraîne donc nécessairement : 


1. Le potentiel entre les particules d'un système isolé est une fonction de leur distance relative (cela se 
confirmera en astronomie lors de notre étude du champ de potentiel gravitationnel, ainsi qu'en 
électromagnétisme en ce qui concerne le potentiel électrostatique et les potentiels de Yukawa à 
symétrie sphérique en théorie quantique des champs). 


2. La loi de l'égalité entre l'action et la réaction. 
3. La conservation de la quantité de mouvement totale d'un système ! 


Conséquence du point (3): l'origine de l'espace est inobservable (puisque la conservation de la quantité 
de mouvement est équivalente à l'invariance par translation dans l'espace)! 


3.4.2. INVARIANCE PAR ROTATION DANS L'ESPACE 


Imposons maintenant que les rotations autour d'un point fixe soient des symétries. Cette propriété doit 
être vraie quel que soit le point fixe considéré, notamment, si ce point fixe est précisément la position 
de l'une des particules du système. Il s'ensuit que le potentiel présente nécessairement une symétrie 
sphérique. Les forces agissant entre les particules sont donc colinéaires aux vecteurs qui les relient. 


Le moment cinétique du système s'exprime comme suit (cf. chapitre de Mécanique Classique) : 
b= Là => x (28.44) 

La dérivée par rapport au temps du moment cinétique total donne : 

db Se = LEONE 

=> TS XF) = Zn À xs +Dnn x fi = Dm xi = DR Xm (845) 


Or le dernier terme du produit vectoriel peut s'écrire : 


_ 


LUE sr (28.46) 
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où les F; sont les forces internes au système des particules j agissant sur la particule i. L'avant-dernière 


expression devient alors : 


db 


— = F. AXÊ, (28.47) 
dé 


Nous pouvons regrouper les termes 7: *Æ; et 7% XÆ; deux à deux et de par la propriété du produit 


vectoriel nous avons nécessairement: 

dd pis 2 

Te d'A XF, =0 (28.48) 

Donc nous en concluons que le moment cinétique est conservé et la conservation du moment cinétique 
est donc équivalente à l'invariance par rotation. 

Conséquence: il n'y a pas de direction privilégiée dans l'espace! 

3.4.3, INVARIANCE PAR TRANSLATION DANS LE TEMPS 


L'énergie totale du système est la somme de l'énergie cinétique de toutes les particules et de l'énergie 
potentielle résultant de l'interaction mutuelle des particules, soit sous la forme de la mécanique 
classique : 


E=E,+E,= Emi #,(8,F) (849) 


Nous supposerons que le potentiel F7 ; A ñ) ne varie pas avec le temps. Cette hypothèse se justifie de 


manière empirique par le constat que les potentiels observés dans la nature sont indépendants du temps 
dans des systèmes fermés à l'équilibre. 


Calculons la dérivée de l'énergie par rapport au temps : 


22 
CR Balr (RE )=12 MR 402 DER D 


dt dt 2 °° dt 2 dt dé 2 dl C8:50) 
_lS di Di 1e dy 2 me fi 
TU Et LR UNE LU 


Or, si le système est fermé (pas d'apport de masse de l'extérieur ni apport d'énergie de l'extérieur), le 
terme dr, / dt est nul (pas de variation relativiste de la masse non plus car la vitesse de chaque 


corpuscule ou du système entier est constante ou sa variation est en moyenne nulle). Il en est de même 
pour le terme dr. { dt où si le système est fermé (pas d'apport d'énergie de l'extérieur sous quelle que 


forme que ce soit) l'accélération moyenne de chaque corpuscule ou de l'ensemble du système par 
rapport au centre de gravité sera nulle. Donc: 


dE 


am, 52 + 2 ms. À | 
— =— Ô.ÿY< + RE (28.51) 
dt LT +2" ne 2 ñ 2." Fr 


Donc nous en concluons que l'énergie totale du système est une constante! 
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Quelle est la grandeur mécanique invariante par translation revient donc à se demander quelles sont les 
grandeurs mathématiques qui sont inchangées lorsque nous leur appliquons une translation. Il en existe 
deux : les scalaires et les vecteurs. 


Intuitivement, un scalaire est assimilé à un nombre réel ( ). Or, en 
mécanique, les nombres réels que nous pouvons construire le sont à l'aide de grandeurs vectorielles 
comme le vecteur position, la vitesse, etc. Pour qu'un tel nombre réel ait le statut de scalaire il doit être 
indépendant de l'espace. Ainsi, un vecteur position ne peut manifestement être considéré comme un 
scalaire. L'énergie de la particule est un nombre réel mais n'est pas un scalaire car elle dépend 
explicitement, dans sa formulation, de la position de la particule dans l'espace au travers de l'énergie 
potentielle. 


De la même façon, un vecteur n'est pas seulement un être mathématique possédant des composantes 
dans une base. Pour jouir du statut de vecteur, une entité mathématique doit se transformer de la même 
manière que les vecteurs de base de l'espace vectoriel. Selon cette définition, le moment cinétique n'est 
pas un vrai vecteur car, étant la composition par produit vectoriel de deux vecteurs, il ne se transforme 
pas comme les vecteurs de base. D'un point de vue mathématique il s'agit d'un pseudo-vecteur ( 


). 


Le seul vrai vecteur qui reste est la quantité de mouvement car il est construit à l'aide de la dérivée du 
vecteur position qui est, bien évidemment, un vrai vecteur. Nous en déduisons que la seule grandeur 
susceptible d'être conservée par translation est la quantité de mouvement totale du système. 


Par un raisonnement analogue au précédent, il est possible de supposer quelle grandeur pourrait être 
invariante par rotation. Sachant que seuls les scalaires et certains pseudo-vecteurs sont effectivement 
invariants par rotation, nous en concluons que la seule grandeur susceptible d'être conservée lors de 
rotations est le moment cinétique total du système. 


Enfin, toujours par le même raisonnement, l'invariance des lois de la mécanique par déplacement dans 
le temps, revient à rechercher les grandeurs conservées par une translation dans le temps. Ces 
grandeurs sont les vrais scalaires et les vecteurs sur la droite du temps. Aucune grandeur mécanique ne 
peut être assimilée à un vecteur sur la droite du temps. En revanche, l'énergie est bien un scalaire 
invariant par translation dans le temps puisque l'énergie potentielle est par hypothèse indépendante du 
temps. L'invariance des lois de la mécanique par déplacement dans le temps laisse donc supposer 
intuitivement la conservation de l'énergie. 


Ces raisonnements ne peuvent évidemment faire office de démonstration mais ils mettent en évidence 
une relation étroite entre la géométrie et les propriétés d'invariance d'un système. 


3.4.4. THÉORÈME DE NOETHER 


Soit L le lagrangien ( nique / ique) d'un système représenté par les 2n 
coordonnées généralisées g,,4, dans l'espace de configuration. Supposons que ce système soit invariant 


par la transformation infinitésimale #, suivante : 


Gi > 4; = h,(q) 


Où s est un paramètre réel et continu et pour lequel nous avons: 
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h,o(g) =g (28.53) 


La fonction #,(g) agit continâment sur le chemin variationnel selon la démarche intellectuelle qui sera 
énoncée dans le chapitre de Mécanique Analytique. 


Supposons que les fonctions g,,4, sont solutions des équations de Lagrange (ce que nous démontrerons 
dans le chapitre de Mécanique Analytique). D'après nos hypothèses les fonctions (définies): 


gs, é)=h, xs.) = La, (28.54) 
£ 


sont dès lors nécessairement également solutions des équations de Lagrange, ce qui se traduit par (nous 
omettrons l'indication de la somme par la suite afin d'alléger la lecture!): 


| || (565;) 


= a (a(s,£), d(s,t)) _d AL(gs,t), 85, )) 
0q; dt d; 


D'autre part, par hypothèse, le lagrangien est invariant pour les transformations du type de celles 
décrites par g, — g; = },(g). Il s'ensuit que sa dérivée par rapport au paramètre s est nécessairement 


nulle: 
— L(gks,.i),gs,t)) =0 (28.56) 


Et nous démontrerons par ailleurs aussi en Mécanique Analytique (sous forme d'intégrale comme étant 
nulle) la relation: 


dZ d£ 
— ÔÜg; + — Üg, = 0 (28.57) 
ôg 64; 


i i 
ce qui peut finalement s'écrire: 


DECRUEL EN 


- (28.58) 
0g, ds 04, ds 


mais nous avons aussi de par l'équation d'Euler-Lagrange (cf. chapitre de Mécanique Analytique): 


dL _d4£ dE 4 4Z 
0e 


— = ——— (2859) 
En _& FA 4; dt dg; 
Nous obtenons alors : 
d êl dm, 8L #| Ldg dE dh, = 0 (28.60) 
dé 0q, | ds EA {| dt| d4, ‘ds — dd, ds 


8 dh, ; 
Donc la grandeur Fr est bien une constante du mouvement ! 
gi @S 
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Le théorème de Noether s'énonce alors ainsi : 


Soit un système ayant un lagrangien Z(g,,4,,f) auquel nous appliquons une transformation 
infinitésimale g, — 4, = h,(g), où s est un paramètre réel et continu. Alors il existe une constante du 
mouvement notée C’(g',,4,.f) dont l'expression est donnée par : 


. 0 dh 
Ca;,qit)=| — : (28.61) 
üg; ds 5-0 


Appliquons le théorème de Noether aux cas étudiés précédemment. Fixons un référentiel arbitraire O 
cartésien. Notons (3,4, ,8,) la base orthonormée de ce référentiel. Considérons un système constitué 


de n particules repérées dans O par leurs vecteurs position >. Le lagrangien de ce système est alors 
Er, 


nt) où j = x, y,z distingue les composantes spatiales des vecteurs À, . 


Supposons maintenant que le système soit invariant par translation de longueur s le long de l'axe x 
uniquement. La translation le long de cet axe s'écrit comme suit : 


ra (n:@)=7,0 +5(8, 08) (28.62) 
et il s'agit donc d'un scalaire. 


La constante du mouvement donnée par application du théorème de Noether est alors (toujours sur 
l'axe x) : 


8L dh 82 
Cr hnt) = | —— = ——|2,08.|=— (28.63) 
Er raot) &r,, ds |, a. | r°&) dr, 


Nous définirons par ailleurs en mécanique analytique comme étant le moment conjugué p,,;. 


ôr. 


Xi 
Nous en déduisons dès lors que la quantité conservée est : »,;, c'est-à-dire la quantité de mouvement 
totale du système le long de l'axe x !!! 


En procédant de même avec les autres axes, nous démontrerions aisément la conservation de la 
quantité de mouvement totale le long des axes pour ceux-ci, ce qui nous permet de conclure que dans le 
cas général d'une translation infinitésimale: 


dr = s(&, ré, +) (28.64) 
la grandeur conservée est la quantité de mouvement totale du système. 


Supposons maintenant que le système soit invariant par rotation d'un angle infinitésimal s autour de 
l'axe z. Cette rotation s'écrit : 


FO (RC)=-AO+S(E XXE) (28.65) 


et il s'agit donc d'un vecteur. 
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La dérivée de #,(#{£)) par rapport à s donne : 


Li, (AG)) = = [© +s(8, x ())] =, XA(£) (28.66) 


En remarquant encore une fois que: 


d£, 


mis (20:67) 
ôr; 


P; 


la grandeur conservée obtenue par application du théorème de Noether est alors : 


8L dh, 


CERF = ds 


| = DLo(e, XR(£)) (28.68) 
50 


et nous avons démontré dans le chapitre de Calcul Vectoriel que: 
Fo(ÿxZ)=-Zo(ÿxx)=-(-ÿo(Z2xXx))=ÿo(ZXX) (28.69) 
ce qui nous amène à écrire: 
Z3 


CF'F',0)=6, o(p,XK())= 8, 0h, =b,, (28.70) 


On montrerait de la même façon l'invariance du lagrangien sous les rotations selon les autres axes ce 
qui conduit à la conservation des composantes suivant ces axes du moment cinétique total du système. 


En conclusion, nous avons mis en évidence trois lectures différentes des lois de la physique : 


Invariance des lois de la Conservation de la quantité |Homogénéité de l'espace : l'espace 

physique par translation de mouvement présente les mêmes propriétés en 
tous points 

Invariance des lois de la Conservation du moment Isotropie de l'espace : l'espace 

physique par rotation cinétique présente les mêmes propriétés dans 
toutes les directions 

Invariance des lois de la Conservation de l'énergie Homogénéité du temps : les lois de la 

physique par déplacement dans nature ne varient pas dans le temps 

le temps 


Tableau: 28.7 - Lois de conservation 
Autrement dit, l'Univers serait: 
P1. Homogène (pas d'origine de temps, ou d'espace, privilégiée) 


P2. Isotrope (pas de direction privilégiée). 
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3.5: PRINCIPE DE CURIE 


Le principe de Curie (que nous devons à Pierre Curie) découle un peu intuitivement du théorème de 
Noether et s'énonce ainsi: 


Si une cause présente une certaine symétrie ou invariance, alors son effet aura la même symétrie (ou la 
même invariance), ou une symétrie supérieure, à condition toutefois que la solution du problème soit 
unique. 


Remarque: A noter que les éléments de symétrie agissent sur les directions des grandeurs 
vectorielles, tandis que les invariances agissent sur les variables dont dépendent ces grandeurs. 


Exemple: 


Conservation de l'énergie/invariance par translation dans le temps, conservation de la quantité de 
mouvement/invariance par translation dans l'espace, conservation du moment cinétique/invariance par 
rotation dans l'espace tel que nous l'avons démontré lors de notre étude du théorème de Noether. 


Ainsi, dans un espace homogène et isotrope, si nous faisons subir une transformation géométrique à un 
système physique susceptible de créer certains effets (forces, champs), alors ces effets subissent les 
mêmes transformations. 


Autrement dit, si un système physique S possède un certain degré de symétrie, nous pourrons alors 
déduire les effets créés par ce système en un point à partir des effets en un autre point. 


Voici les six propriétés de symétrie découlant du principe de Curie: 


P1. Invariance par translation: si S est invariant dans toute translation parallèle à un axe, les effets sont 
indépendants des coordonnées de cet axe (l'intérêt étant alors de travailler en coordonnées 
cartésiennes). 


P2. Symétrie axiale: si S est invariant dans toute rotation autour d'un axe donné, alors ses effets 
exprimés ne dépendent pas de l'angle qui définit la rotation (l'intérêt étant alors de travailler en 
coordonnées cylindriques). 


P3. Symétrie cylindrique: si S est invariant par translation et rotation, alors ses effets ne dépendent que 
de la distance à l'axe de rotation (l'intérêt étant alors aussi de travailler en coordonnées cylindriques). 


P4. Symétrique sphérique: si S est invariant dans toute rotation autour d'un point fixe, alors ses effets ne 
dépendent que de la distance à ce point fixe (l'intérêt étant alors de travailler en coordonnées 
sphériques). 


P5. Plan de symétrie: si S admet un plan de symétrie, alors en tout point de ce plan: 
- un effet à caractère vectoriel est contenu dans le plan 


- un effet à caractère pseudo-vectoriel (voir le chapitre de Calcul Vectoriel pour voir la définition d'un 
pseudo-vecteur) lui est perpendiculaire 


P6. Plan d'antisymétrie: si, par symétrie par rapport à un plan, S est transformé en -S alors en tout point 
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de ce plan: 


- un effet à caractère vectoriel est perpendiculaire au plan 
- un effet à caractère pseudo-vectoriel est contenu dans ce plan 


La symétrie est fondamentale dans les sciences quelles que soient les disciplines. La symétrie est 
partout. Elle permet de décrire de manière précise de nombreux systèmes, de clarifier et de simplifier 
l'étude de leurs propriétés. Des résultats très importants peuvent ainsi être prédits de manière rigoureuse 
sans que l'on ait à faire appel à des théories mathématiques sophistiquées. 


4. ESPACES PONCTUELS 


L'étude des phénomènes physiques recourt dans un premier temps à leur représentation dans l'espace 
de la géométrie classique euclidienne à une dimension temporelle et à un nombre quelconque de 
dimensions spatiales. 


Les vecteurs que nous avons étudiés dans le chapitre de Calcul Vectoriel (tenseurs d'ordre 1) et les 
tenseurs (d'ordre quelconque) que nous avons aussi étudiés dans le chapitre de Calcul Tensoriel 
peuvent comme nous avons en déjà fait mention, être utilisés pour relier chacun des points de 
l'espace-temps à un référentiel et former ainsi des champs de vecteurs ou/et de tenseurs. Cet état de fait 
mathématique, nécessite la définition mathématique d'espaces formés de points ou également appelés 
"espaces ponctuels". 


La définition précise d'espace vectoriel ponctuel que nous allons faire sera construite à partir de la 
notion d'espace vectoriel que nous avons vue dans le chapitre de Calcul Vectoriel (voir section 
d'Algèbre) 


Voyons tout d'abord l'exemple particulier de l'espace ponctuel formé par des triplets de nombres qui est 
issu directement de l'espace géométrique classique à trois dimensions. 


Ainsi, donnons-nous des triplets de nombres notés: 


etc. Appelons Æ', l'ensemble de tous les éléments {A,B....} formés par des triplets de nombres. À tout 
couple (A,B) de deux éléments de Æ",, pris dans cet ordre, nous pouvons faire correspondre un vecteur 
*, appartenant à un espace vectoriel espace vectoriel Æ, , noté géométriquement 4g , en définissant 


celui-ci par un triplet de nombres tel que (nous utilisons la notation indicielle vue dans le chapitre de 
Calcul Tensoriel): 


avec à = 1,2, 3. Nous avons donc: 


Si nous définissons par rapport à cet élément l'addition et la multiplication par un scalaire, nous nous 
retrouvons comme nous l'avons déjà vu en théorie des ensembles (voir chapitre du même nom) avec 


une structure d'espace vectoriel. 
Page: 1659/4839 


[v3.0 - 2013] 


La correspondance que nous établissons ainsi, entre tout couple (A,B) de deux éléments de Æ', etun 


vecteur d'un espace vectoriel Æ, , vérifie manifestement les propriétés suivantes: 


P1. Antisymétrie: 42 = -BA 
P2. Associativité par rapport à l'addition: 4€ = 48+28c 


P3. Si O est un élément arbitraire choisi dans Æ",, à tout vecteur x de Æ, , il correspond un point M et 
un seul tel que 5yf = +. 


Lorsque nous avons muni l'ensemble Æ', de cette loi de correspondance avec Æ,, vérifiant les trois 


propriétés précédentes, nous disons que l'ensemble des triplets de nombres constitue un "espace 
ponctuel", noté &,. Les éléments de £&, sont alors appelés des "points". 


L'espace ponctuel £, se confond en tant qu'ensemble d'éléments avec l'ensemble Æ"', mais il s'en 


distingue en tant qu'espace ponctuel qui constitue un ensemble structuré par la loi de correspondance 
que nous nous donnons. De même, les espaces Æ, et &, sont distincts par suite de leur structure 


différente et nous pouvons établir une distinction entre les éléments de chacun des espaces. Nous 
disons que £”, constitue le support des espaces Æ, et &. 


Nous pouvons bien évidemment généraliser le support à Æ”',. Ainsi, Æ', muni de la structure d'espace 


vectoriel que nous avons définie précédemment constitue un espace ponctuel à n dimensions que nous 
noterons &,. Les éléments de &, étant appelés des "points". 


x 


L'espace vectoriel Æ, est appelé "l'espace associé" à &,. Lorsque l'espace vectoriel associé est un 
espace pré-euclidien (muni du produit scalaire), nous disons alors que &, est un "espace ponctuel 
pré-euclidien". 


Considérons un point O quelconque d'un espace ponctuel pré-euclidien £, et une base (&,) de l'espace 
vectoriel associé Æ,. 


Définitions: 


D1. Nous appelons "repère de l'espace" &, l'ensemble constitué par les éléments O (origine) et de la 
base (&, }. Ce genre de repère est noté: 


(O,8,) (28.74) 
ou encore simplement: 
(8) (28.75) 


D2. Les "coordonnées" d'un point M d'un espace ponctuel pré-euclidien &,, par rapport au repère (&,}, 
sont les composantes (contravariantes) ;? du vecteur + = ©3f de l'espace Æ, par rapport à la base (&,) 
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Soient deux points M et M' de £, définis par leurs coordonnées respectives ;* et x, nous avons: 


OM=x8 OM'=x"& (28.76) 


En utilisant les propriétés P1 et P2 données précédemment: 
MM'=MO+OM'=-OM+OM'=(-x +x")3 (28.77) 


Nous en déduisons que les composantes du vecteur 344£", par rapport à la base (&,), sont les 
n quantités (x°- x, différences des coordonnées des points M et M°. 


Soient (4) et (2 ‘;) deux repères quelconques de £, liés entre eux par les relations générales (cf. 


chapitres de Calcul Tensoriel et d'Algèbre Linéaire): 
3, = A%g', et &', = Alg, (28.78) 


Cherchons les relations entre les coordonnées d'un point M de &, par rapport à ces deux repères. Pour 
cela, exprimons les vecteurs 49" et {'@ sur chacune des bases de E,,: 


+ ——— 


O0" = de, O'O=a"ë, (28.79) 


ainsi que les vecteurs 5yf et O'Af, Soit: 


Nous avons d'autre part: 
OM = OO'+O'M = da +x Ve, = de +x% A8 =(æ +4ix")& (28.81) 


Identifiant ce résultat par rapport au vecteur &, dans l'expression de 5jf , nous avons: 


x = d + Aix] (28.82) 


Et de façon analogue: 


x = œ%+ A x"| (28.83) 


Ces deux relations sont plus que pratiques en physique où nous avons souvent à considérer un 
référentiel dans un repère (ainsi nous pouvons exprimer la position d'un point depuis l'un ou l'autre 
repère en usant de ces deux relations). 


Considérons maintenant un espace ponctuel pré-euclidien ainsi que M et M' deux points de cet espace. 
Nous avons démontré lors de notre étude de la topologie (cf. chapitre de Topologie), que la norme du 
vecteur MM'est une mesure possible de la distance entre M et M'. Nous avons donc: 


MM\= Par] (28.84) 
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Si les deux points M et M' ont respectivement pour coordonnées x et x", par rapport à un repère 


(8), nous savons que nous avons: 


La norme au carré est donc donnée comme nous l'avons vu lors de notre étude du calcul tensoriel (cf. 
chapitre de Calcul Tensoriel) par la relation: 


par] g CA € “in #)(x%Ÿ- x) (28.86) 


Si le point M' est infiniment proche du point M, ses coordonnées sont notées {x + dx* et le vecteur 
MM'= AM a pour composantes les quantiques /x*. 


Si nous notons ds la distance entre les points M et M". La relation précédente donne l'expression du 
carré de la distance entre ces points sous la forme: 


ds? = gydx' dx*| (28.87) 


Rappelons également (cf. chapitre de Calcul Tensoriel) que pour un espace ponctuel pré-euclidien où 
les vecteurs de base &; sont donc orthonormés, nous avons: 


Sy = dy (28.88) 
et l'expression de la distance devient alors: 
ds? = dx'dx? (28.89) 


Nous obtenons ainsi une expression qui généralise, à n dimensions, le carré de la distance élémentaire, 
par rapport à un repère cartésien orthonormé, dans l'espace de la géométrie classique (euclidienne). 


Les vecteurs de la physique sont généralement des fonctions d'une ou plusieurs variables, celles-ci 
pouvant être des variables d'espace ou du temps. Lorsque à un point M d'un espace ponctuel &,, nous 


attachons un tenseur, défini par ses composantes par rapport à un repère (&,), nous dirons que nous 


nous sommes donnés un "champ de tenseurs" (les champs de tenseur d'ordre 1 étant des champs 
vectoriels). 


Pour des vecteurs à n dimensions, la notion de dérivée d'un vecteur à trois dimensions se généralise et 
nous obtenons toutes les relations classiques relatives aux dérivées. 


Considérons ainsi un vecteur * appartenant à un espace pré-euclidien Æ, dont les composantes, sur 
une base (&,), sont des fonctions d'un paramètre quelconque &. Nous noterons ce vecteur x{&) et 


nous aurons: 
*(a) = (cé, (28.90) 
Par définition, la dérivée du vecteur x par rapport à la composante & est un vecteur noté: 


X'(&) (28.91) 
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selon la notation utilisée par les mathématiciens. Ou: 


x(a@) (28.92) 
selon la notation abrégée des physiciens. Ou encore: 
d X(&) (28.93) 


selon l'humeur du physicien. Ou encore: 


dE 
—— (28.94) 
da 


si nous respectons les écritures. 


Dans ce site, nous basculons d'une notation à l'autre sans préavis en fonction de l'envie de simplifier les 
écritures (il faudra s'y faire..). 


Etant donné que nous faisons actuellement plus de la mathématique que de la physique, nous noterons: 


dx? (ci) " 


(28.95) 
da 


x (a) = 


En rappelant (cf. chapitre de Calcul Différentiel Et Intégral) que la différentielle est donnée par: 


dx = X'(a)d& (28.96) 


Les différentes expressions de dérivations des vecteurs à trois dimensions relatives à la somme de 
vecteurs, au produit par un scalaire de deux vecteurs, sont aisément transposables aux vecteurs à 
n dimensions. 


Si un vecteur x de Æ, dépend de plusieurs paramètres indépendants, &, 8,7, la dérivée partielle du 
vecteur x(&, 8,y) par rapport à la variable &, par exemple, est un vecteur noté: 

—— ou d X (28.97) 
dont les composantes sont les dérivées partielles des composantes de x, soit: 


— = à, (2898) 


La différentielle totale du vecteur x{&, 5, y) s'écrivant (cf. chapitre de Calcul Différentiel Et Intégral): 


_ 


dx = — 
aæ 


dar apr y (28.99) 
98 9y 


Considérons maintenant un espace vectoriel pré-euclidien Æ, associé à un espace ponctuel &,. Dans un 
repère (&) tout point M de &, est associé à un vecteur x de Æ, tel que + = SGyf. Si le vecteur x 
dépend d'un paramètre & et admet une dérivée x'(&), il en est de même alors pour 5 . 
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Montrons que le vecteur dérivé *'{&) ne dépend pas du point origine © (statique) mais seulement du 
point M considéré. En effet, si O' est un autre point origine, nous avons: 


OM = 00'+O'M (28.100) 


et puisque le vecteur 59! est fixe et ne dépend pas de &, nous avons: 


mme 


400" ={0 (28.101) 
da 
d'où: 
aow 40 M _ *'(@)| (28.102) 
Cie da 


Nous pouvons donc noter la dérivée du vecteur 534 en mentionnant seulement le point M et nous 
écrirons: 
dO'M _dM 


= M'(@ (28.103) 
da da 


x (a) = 


La différentielle de 5yf s'écrit alors: 
di = M'(c)dæ (28.104) 


Si un point M de &, est associé, par rapport à un repère (&) à un vecteur x{«æ, 8, y) = OM, les 
dérivées partielles de 537 ne dépendront que du point M et nous écrirons, par exemple: 


x = OM (28.105) 
dx dæ 


Afin d'alléger les expressions des dérivées partielles totales des fonctions dépendantes de n variables, 
nous utilisons quand le contexte s'y prête, les notations indicielles suivantes. Si f{y},y?...,y*) est une 


fonction des n variables y, nous noterons les dérivées partielles sous la forme: 
à 
8,f = Le (28.106) 
dy 


Les dérivées secondes par rapport aux variables x et y s'écriront: 


Lorsque x est un vecteur tel que x = r'&, dont les composantes sont des fonctions de n variables y*, 


soit: 


x = x(y,y},..y") (28.108) 


Page: 1664/4839 


[v3.0 - 2013] 


les dérivées partielles du vecteur seront notées, en utilisant la convention de sommation: 


ne . 
D =4,X=0,(#8)=(8,x)& (28.109) 


Le concept d'espace ponctuel étant maintenant introduit, nous pouvons maintenant passer à l'étude du 
formalisme lagrangien et la détermination de la formulation mathématique du principe de moindre 
action (voir chapitre suivant). 
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Notes personnelles: 
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29. MÉCANIQUE ANALYTIQUE 


No devons la forme actuelle de la mécanique analytique appelée aussi parfois "mécanique 


lagrangienne" aux travaux des frères Bernoulli et particulièrement d'Euler et Lagrange. C'est 
effectivement en 1696 que commence l'histoire de la vraie physique théorique. 


Au fait, l'événement de départ de la mécanique analytique provient de l'observation suivante (énoncée 
au 17ème siècle): Tout système semble évoluer d'un état à un autre toujours en utilisant les moyens les 
plus simples et en conservant une grandeur constante entre les deux états. 


Remarques: 


R1. Les moyens précités peuvent être: le chemin le plus court, le chemin le plus rapide (les 
trajectoires spatio-temporelles à plus faibles amplitudes en gros...). 


R2. Selon le premier principe fondamental de la physique, la grandeur constante est choisie comme 
étant l'énergie. 


Cet énoncé est appelé dans le cadre de la mécanique "principe de moindre action (de Maupertuis)" ou 
dans le cadre de la physique générale "principe variationnel" ou encore parfois dans le cadre de 
l'optique "principe d'économie" ou "principe de Fermat". Dans le cadre mathématique faisant purement 
abstraction des concepts physiques, nous parlons de "principe de Hamilton". 


Plus techniquement, il est aussi formulé de la manière suivante: Un système se meut d'une configuration 
à une autre de telle façon que la variation de l'action (voir plus loin) entre la trajectoire naturelle 
effectivement suivie et toute trajectoire virtuelle infiniment voisine ayant les mêmes extrémités dans 
l'espace et dans le temps soit nulle. 


Au fait, bien que cet énoncé puisse paraître comme cohérent, il peut faire douter mais. nous verrons : 


1. Qu'en mécanique classique, nous pouvons démontrer la première loi de Newton en admettant ce 
principe comme vrai et en y superposant le principe de conservation de l'énergie et nous pouvons 
expliquer le mouvement de nutation de presque tout solide simple. 


2. En électromagnétisme, nous retrouverons toutes les équations de Maxwell (in extenso la loi de 
Biot-Savart, Faraday, force de Lorentz, loi de Laplace, etc.) à partir des propriétés du principe de 
moindre action et de conservation de l'énergie. 


3. En optique, nous démontrerons que le chemin suivi par la lumière est toujours le plus court et cela 
nous permettra de démontrer le principe de Fermat à la base de toute l'optique géométrique. 


4. En physique atomique, les propriétés du principe de moindre action nous permettront de déterminer 
certaines propriétés mathématiques des atomes et autres particules (les fermions et les bosons en 
physique quantique des champs). 


5. Le principe de moindre action nous permettra également de démontrer que tout corps, avec ou sans 


Page: 1670/4839 


[v3.0 - 2013] 


masse, est dévié par un champ d'accélération et. permet donc de déterminer l'équation d'Einstein des 
champs qui est à la base de tout le chapitre sur la relativité générale. 


6. Ce principe s'applique également pour obtenir des résultats puissants en géométrie comme nous 
allons le voir un peu plus loin. Ainsi, les techniques de la mécanique analytique sont très intiment liées à 
la mathématique pure. 


Il va donc sans dire par ces six petits exemples les applications phénoménales de ce principe!! 


Historiquement, il est intéressant de savoir que c'est Pierre-Louis Moreau de Maupertuis qui a énoncé 
le premier le principe de moindre action sous forme peu scientifique. L'intervention d'Euler et Lagrange 
dans ce domaine a été de mettre sous forme mathématique ce principe et de démontrer (tenez-vous 
bien.) qu'il découle d'une simple propriété mathématique des optima des fonctions continues. Il va 
sans dire, que savoir que cela a permis de redémontrer toutes les lois de la physique classique en a 
dérangé plus d'un... 


Ce principe a eu (et a toujours) des répercussions inimaginables et le problème fut d'appliquer 
l'expression mathématique de ce dernier à tous les phénomènes physiques qui avaient déjà étés 
démontrés de façon expérimentale et empirique à l'époque. Effectuer cette démonstration revenait ainsi 
à expliquer pourquoi tel phénomène ou telle loi était ainsi plutôt qu'autrement. Imaginez ! 


Ainsi, le premier à s'attaquer au problème fût donc le Bâlois (Suisse) Leonhard Euler. Mais nous avons 
également gardé le nom de Lagrange (d'où l'appellation: "formalisme lagrangien") pour définir toute la 
méthode et le formalisme mathématique construit autour du principe de moindre action. 


1. FORMALISME LAGRANGIEN 


La mécanique classique peut être formalisée de différentes manières. La plus courante est la 
formulation de Newton, qui utilise la notion de force ( ssique). Elle est de 
loin la plus simple lorsqu'il s'agit de considérer un problème concret et c'est pourquoi c'est celle qui est 
enseignée. Mais pour pouvoir traiter des problèmes plus complexes ou plus finement, et pour pouvoir 
faire des démonstrations rigoureuses, cette formulation n'est pas la plus pratique. 


La mécanique analytique, initiée dès le 18ème siècle, regroupe ainsi différentes formulations très 
mathématisées de la mécanique classique, notamment les mécaniques de Hamilton et de Lagrange 
(toutes ces formulations sont équivalentes!). 


Cette formalisation est assez peu enseignée dans les petites écoles car il faut bien l'avouer le formalisme 
lagrangien et hamiltonien (contenant donc le principe de moindre action sous forme mathématique) fait 
appel à un niveau d'abstraction un peu plus élevé que les méthodes normales et malgré qu'il soit souvent 
d'une aide précieuse dans l'élaboration de théories (physique fondamentale, physique quantique, 
relativité générale, théorie quantique des champs, théorie des supercordes), il en découle rarement de 
nouvelles solutions (mais plutôt une réduction et une méthode de validation utile et très puissante). 


Commençons donc notre travail: 
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1.1. COORDONNÉES GÉNÉRALISÉES ET RÉFÉRENTIELS 


Un réflexe naturel conduit généralement à référer la position d'un point dans l'espace à la seule 
connaissance de ses trois coordonnées cartésiennes x, y, z. Cette attitude est d'ailleurs le plus souvent 
justifiée par la simplicité d'un grand nombre de situations rencontrées dans la pratique, où il n'est pas 
nécessaire de rechercher de méthodes plus élaborées ou de passer dans d'autres systèmes de 
coordonnées (cf. chapitre de Calcul Vectoriel). 


Pour repérer la position d'un mobile (ou d'un point matériel) en physique il est nécessaire dans un 
premier temps d'associer un repère au référentiel. Ainsi, un "repère" est un système (physique concret) 
de repérage dans l'espace associé au référentiel. 


Les repères conventionnels en mécanique classique constituent majoritairement des bases d'espaces 
pré-euclidiens canoniques (cf. chapitre de Calcul Vectoriel) orientés et où chaque point, ou vecteur de 
l'espace, peut-être représenté algébriquement par ses valeurs d'affixes (la valeur à l'ordonnée 
(projection sur l'axe vertical) et la valeur à l'abscisse (projection sur l'axe horizontal). 


Voici quelques exemples triviaux: 


T M 
RE ————__—______________"/’————— 
[e x x 


Repère à une dimension 


Le mouvement de M s'effectue sur une droite 


M 
À Y 
RS ——+ y 
Repère à deux dimensions 
Le mouvement de M s'effectue dans un plan 


(ou plan d'Argand-Cauchy) Repère à trois dimensions 


Le mouvement de M s'effectue dans l'espace 
Figure: 29.1 - Mouvements dans des référentiels à 1, 2 ou 3 dimensions 
Remarque: Comme nous l'avons vu dans le chapitre de Géométrie Différentielle, la distance entre 


deux points d'une trajectoire courbe en parcourant la courbe est appelée "abscisse curviligne". 
Sinon, la distance entre deux points d'une trajectoire rectiligne est appelée simplement "abscisse". 


Définitions: 


D1. Un repère, assimilé à un référentiel, est dit "référentiel Galiléen" (c'est rare que nous en fassions 
explicitement mention en physique par manque de rigueur) si: 


- Nous pouvons le considérer comme immobile pendant toute l'étude du mouvement du système ou 
comme étant en translation rectiligne uniforme par rapport à un autre référentiel lui-même immobile. 
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Donc si nous négligeons le mouvement de rotation du Soleil autour du centre de la galaxie, alors le 
référentiel héliocentrique peut être considéré comme galiléen. Si nous négligeons le mouvement de 
rotation de la Terre autour du Soleil, alors le référentiel géocentrique peut être considéré comme 
galiléen. Si nous négligeons le mouvement de rotation de la Terre sur elle-même, alors le référentiel 
terrestre peut être considéré comme galiléen. Dans beaucoup d'expériences de mécanique à la surface 
de la Terre, nous constatons que le référentiel terrestre peut être considéré comme galiléen avec une 
très bonne précision. Heureusement qu'il y a quand même un tas de phénomènes où il faut tenir compte 
de la rotation de la Terre (déviation vers l'est, pendule de Foucault...etc.) 


- Nous pouvons le considérer comme un système où les lois de Newton sont vérifiées ( 


) 


D2. Un repère, assimilé à un référentiel, est dit "barycentrique" ( 
) s'il a pour origine le centre de masse (« | ) du corps 
étudié. 


Ainsi, le "repère de Copernic" est assimilé au centre de gravité (d'inertie) du système solaire, le "repère 
héliocentrique" appelé aussi "repère de Kepler" au centre d'inertie du Soleil. 


D3. Un repère, assimilé à un référentiel, est dit "référentiel géocentrique" lorsque nous prenons pour 
référence un système d'axes placés au centre d'inertie de la Terre. Les axes, parallèles à ceux du 
référentiel de Copernic, pointent vers trois étoiles fixes. Dans ce référentiel la Terre tourne sur 
elle-même en 24 [h.]. 


D4. Un repère, assimilé à un référentiel, est dit "référentiel Terrestre" lorsque nous prenons pour 
référence un système d'axes placés au centre d'inertie de la Terre et qui a un mouvement de rotation 
uniforme correspondant à la vitesse de rotation de la Terre. Traditionnellement un des axes est dirigé 
vers l'étoile polaire. C'est le référentiel auquel nous nous référons le plus dans la vie courante il n'est 
donc pas galiléen en toute rigueur! Ceci va induire des effets particuliers sur les mouvements dans 
l'atmosphère tels que nous les ressentons. 


Remarque: Dire qu'un repère orthonormé (©,5,;) est un "repère direct" signifie que l'angle orienté 
(,7) a pour mesure principale 77/2 (dans le sens horaire). Dire qu'un repère orthonormé (Q,5, ;) 
est un "repère indirect" signifie que l'angle orienté a pour mesure principale -xrj 2. Dans tout ce 
qui suit, si nous ne spécifions pas l'orientation, cela sous-entend que (Q,x, j) est direct. 


Il est bien exact que les trois paramètres x, y, z suffisent parfaitement à repérer un point matériel dans 
Ris usuel comme nous en avons déjà fait mention dans notre étude des espaces ponctuels ( 

| ), mais il n'en demeure pas moins qu'il est parfois inévitable, ou même tout 
simplement plus avantageux, d'utiliser un nombre de paramètres supérieur à trois. Nous pouvons 
évidemment envisager toutes sortes de paramétrages pour atteindre les coordonnées d'un point dans 
l'espace, de telle sorte que, d'une façon plus généralisée nous serons amenés à prendre en considération 
des relations du type (nous ne gardons plus la même écriture que celle que nous avions lors de notre 
étude des espaces ponctuels par cohérence avec les nombreuses références déjà existant sur le sujet): 
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x=x= x (4 ,4",..,q") 
y = x? = x (g',q?,.…,g") (29.1) 
RE SE d'à 


Les paramètres 4},4°,...,g* portent le nom de "coordonnées généralisées", paramètres auxquels un 


problème sera le plus souvent référé. Connaître leur expression en fonction du temps est le problème 
fondamental de la dynamique. Cela signifie que nous serons parvenus à une solution quand nous 
disposerons des relations indépendantes: 


g =q'(t) 
g=go 
g” =q"(é) 


Il est donc important de retenir que le nombre de paramètres 4° définissant le repérage d'un point dans 


l'espace est au moins égal à trois, sans être nécessairement différent de trois. C'est finalement la nature 
des situations envisagées qui suggèrent le choix du nombre des paramètres à utiliser (coordonnées 
cartésiennes, cylindriques, sphériques,.…). 


Dans une vision plus générale, la configuration instantanée d'un système, quelle qu'en soit la nature, 
sera déterminée par la connaissance, en fonction du temps, de n paramètres, n définissant le nombre de 
"degrés de liberté” du système (cf. chapitre de Mécanique Classique). 


Il est tout naturel, mathématiquement, d'associer la manipulation des n paramètres ;* au recours à un 
hyper-espace à n dimensions, dans lequel les ;* apparaîtraient comme les coordonnées d'un point P 
représentatif de la configuration d'un système quelconque. Nous donnons à cet espace à n dimensions 
£,,, le nom "d'espace de configuration". 


Mais la rigueur de la mathématique-physique, nous amène à disposer d'une description plus précise des 
phénomènes en ajoutant cette variable importante qu'est le temps, considérée souvent comme variable 
indépendante, aux x“. Nous en arriverons donc fatalement à utiliser un autre hyper-espace £,,, auquel 


nous avons donné le nom "d'espace des événements". 


Ce dernier espace de référence revêt un intérêt capital pour un grand nombre de problèmes de la 
science moderne et se trouve particulièrement bien adapté aux raisonnements de nature relativiste. Les 
variables indépendantes constituant les coordonnées spatiales et temporelles forment alors ce que nous 
appelons les "variables d'Euler". 


Dans la mesure où les paramètres ;* sont simplement présentés comme des fonctions explicites du 
temps, le point P décrit une courbe paramétrée, définie par x* = x*(£}, avec & = 1,2,...,#. Cela revient 
à exploiter simultanément les équations: 

xl=xl(6) 


x = x°(6) 


x "= x" (6) 
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Il arrivera fréquemment que, pour des raisons d'opportunité, nous souhaïitions changer de système de 
coordonnées généralisées, et utiliser un autre ensemble plus compatible avec les spécificités du 
problème envisagé. Nous substituerons alors au jeu des ;* un nouveau jeu de coordonnées 4*. Il est 


alors évident que nous devrons, avant toute chose, nous doter des relations de dépendance existant 
entre les deux ensembles de coordonnées ( riel): 


xl L LE M ET D 
x = x°(g,q°,..,q") 


# 
X 


x" (g,q°,..,q") 


2 


CRREE 


Les fonctions x!, x x" seront maintenant supposées définies, continues, de classe £? (pour 
travailler avec l'accélération) par rapport aux g°,4°..…...g" et devront conduire à un jacobien différent 


de zéro ( le Calct | ). 


Dans ces conditions, à chaque point À de l'espace des configurations des x, noté Æ,, correspondra un 
point À, de l'espace de configuration des q , noté Æ,. Nous avons ainsi effectué une transformation 


ponctuelle, autrement dit une application de l'espace sur lui-même. 


Pour étudier des milieux continus (concept radicalement différent du point matériel), nous aurons 
cependant deux approches différentes: 


1. Méthode de Lagrange: nous cherchons à caractériser le mouvement du milieu décrit par une 
formulation Lagrangienne consistant donc à le caractériser en se donnant un système d'équations au 
sens newtonien. Par dérivations, nous avons alors la vitesse et l'accélération du milieu. 


2. Méthode d'Euler: Au lieu de suivre le parcours d'un point, nous portons notre attention sur l'évolution 
des caractéristiques physiques en un point donné comme la vitesse, l'accélération la température, la 
pression ou autre. Nous parlons alors fréquemment de "système Eulérien". 


1.2. PRINCIPE VARIATIONNEL 


Le "principe variationnel" n'est donc que la forme mathématique contemporaine du principe de 
moindre action qui est, comme nous en avons déjà fait mention, à la base du formalisme lagrangien. 


Rappelons que selon l'énoncé du principe variationnel nous devons trouver dans tout phénomène 
physique, une certaine quantité qui est naturellement optimisée (minimisée ou maximisée) et qui décrit 


toutes les variables du système étudié et ainsi son issue. 


Voici la démarche que nous allons suivre; une fois cette démarche présentée, nous nous attaquerons à 
sa formalisation mathématique. 


Les propositions sont les suivantes: 


P1. Nous supposons donc le principe variationnel et le principe de conservation de l'énergie comme 
justes. 


P2. L'énergie totale d'un système fermé est constante et constituée de la sommation de l'énergie 


cinétique et l'énergie potentielle. 
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Si nous ne considérons que l'énergie cinétique, alors le système est dit "système libre"; si les deux 
énergies sont considérées, nous disons alors que le système est un "système généralisé". 


P3. Nous définissons une fonction mathématique (dont les variables sont les coordonnées généralisées) 
appelée "Lagrangien" qui est donnée par la différence entre les deux énergies précitées. 


P4. Sur l'évolution d'un système entre deux états, nous cherchons les propriétés de la fonction (du 
lagrangien) qui donne la minimisation de la variation de la différence des deux énergies sur l'évolution 
temporelle ou métrique du système. 


Enfin, une fois cette propriété déterminée (mise sous la forme que nous appelons "équation d'Euler- 
Lagrange") nous chercherons toutes les autres propriétés possibles afin d'avoir les outils nécessaires 
pour la physique théorique et vous allez voir cela marche terriblement bien... 


Donc, pour mettre cela sous forme mathématique, nous commençons par poser qu'il existe une fonction 
réelle de 2n variables: 


CPR À 4 rl R Lg... Er (29.5) 
que nous appellerons "Lagrangien généralisé" du système, dont l'intégrale satisfait à l'énoncé suivant: 


Dans un mouvement naturel partant d'un point A(g#..g*) à l'instant £,, arrivant au point 


B Cu en ) à l'instant £, , l'intégrale suivante appelée "intégrale d'action" ou simplement "action": 


S(a,4)= fat)... Of 06 


qui peut aussi être notée dans une écriture plus abrégée: 


te 


S(g.,4) = f£Ggat (29.7) 
ta 


doit être un extrémum (en fait, "un minimum" ou "un maximum", puisque nous aurions pu tout aussi 
bien prendre -L au lieu de +L dans le choix de la définition du Lagrangien généralisé). 


L'action S est ce que nous appelons communément en physique une "fonctionnelle" et a les unités de 
l'énergie multipliée par le temps puisque L est une énergie. 


1.3. ÉQUATION D'EULER-LAGRANGE 


Le principe de moindre action énonce donc que (l'intégrale) S est extrêmale si: 
est la trajectoire naturelle effectivement suivie par le système physique. 


Considérons alors une trajectoire très voisine à la précédente, que nous noterons: 


(fn + 6....g, + 69,.d + 6... d, + 64.) (29.9) 


Page: 1676/4839 


[v3.0 - 2013] 


C'est-à-dire que pour chaque i nous posons: 


dE) — 4; (6) + 6g, 6) 


(29.10) 
dite) — d,() + dd, (E) 


avec: 


Bgi(Ea)= Bgs(g) =0 (910 


pour assurer que nous partons toujours du même point À pour arriver au même point B. 


Remarque: Nous avons omis maintenant l'écriture des arguments t des fonctions du temps afin 
d'alléger les écritures. 


Si S{g,g) est bien l'évolution d'un système évoluant selon le principe de moindre action, alors l'action 
donnée par la variation: 


ÊS = S'(g + g,g + ôg)-S(g,4) (29.12) 


est nulle pour äg et £ÿ tendant vers zéro (sous-entendu que tout système physique revient à son état 
initial sans intervention extérieure). 


Ce qui nous amène à écrire: 


& te & 
ÊS = [£a + Üg,g + Êgldt — [GX = [Lt + g,g + 64) - L(g,g)]dt = 0 (29.15) 
ti à 


4 


Ce qui nous permet de justifier la dénomination de "principe variationnel" (aussi appelé parfois le 
"principe de stationnarité de l'action"): 


te te 


OS =  ( Zdé = [SEdt =0| (29.14) 
pl 


Ce principe stipule donc que la trajectoire d'une particule (ou d'un système de manière plus générale) 
s'obtient en demandant qu'une certaine fonctionnelle S appelée "action" soit stationnaire par rapport à 
une variation de la trajectoire. En d'autres termes, si nous effectuons une variation infiniment petite de 
la trajectoire, la variation doit être nulle. 


Pour un système mécanique simple, l'action est alors évidemment, de par le principe de conservation de 
l'énergie égale à l'intégrale sur la trajectoire de (par définition du lagrangien) la différence entre l'énergie 
cinétique et l'énergie potentielle. 


Dès lors, dans une théorie pour laquelle les forces dérivent d'un potentiel V, nous sommes naturellement 
amenés à définir le "Lagrangien" par la relation (il faudra s'en souvenir !): 


Z(g,4) = T(g.4) -V(g,d)| (29.15) 
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où T'et V sont la notation traditionnelle dans le formalisme Lagrangien de l'énergie cinétique et de 
l'énergie potentielle données par: 


T = F2 et F=#(g) (29.16) 


ND 


Remarque: Pour l'étude de la relativité générale, nous ne chercherons pas à ce que la variation de la 
différence des énergies soit minimale tel que c'est le cas pour les systèmes mécaniques, mais bien la 
variation de la longueur d'un arc ds (non dépendant du temps contrairement à l'exemple précédent) 
dans un espace quelconque lors d'une trajectoire d'un système libre. Ce qui nous amènera à écrire 
simplement (rappelez-vous en aussi car ce sera très important) l'action: 


ÊS = [5@s) =0 (29.17) 


pour une masse unitaire et en prenant les unités naturelles. 


Pour revenir à notre application du principe variationnel dans le cas du lagrangien généralisé, nous 
pouvons alors écrire la différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral) de dL 
et nous obtenons alors la relation: 


04, 


DE LA + dû pc (29.18) 
dg; 


Intégrons par parties (cf. chapitre de Calcul Différentiel Et Intégral) le deuxième terme de la somme de 
l'intégrale précédente: 


te te E te 
es g;d ue dé = : D Pad (29.19) 
Er A di à 


Le premier terme de la dernière égalité est nul: 


(A 


8 @L OL o£ OL . 
7, 4 2| ag, Co)08 C5) 22 C4)08 C4) = 2 Gp) 07 EG 4) 00 (#20) 


&%, %%, 

puisque nous avons déjà mentionné plus haut que par construction il faut que: 
Bqi(£a) = Bgs(Eg) = 0 (2920 

L'expression de l'intégrale de moindre action peut finalement s'écrire : 


ES = [ 2 Ggdt = O (29.22) 
dg; dt dq, 


Mais les ÿg, et äg, tendent vers 0 d'une infinité de manières différentes et nous devons cependant avoir 
néanmoins 5 = 0. Cela veut dire alors que chaque terme sommé de l'intégrale peut être pris 
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indépendamment et doit satisfaire: 


te 
Vie (L...n),68 = [ 0-0 0% ôg;dt = 0 
4 g; dé 44; 


Mais comme les fonctions $g; et 54, peuvent toujours tendre vers zéro de multiples façons, et que 


cette intégrale doit être quand même nulle, nous en déduisons que ce sont les intégrandes qui sont nuls: 


Ces n équations, satisfaites par le lagrangien généralisé du système pour le mouvement effectivement 
suivi, sont appelées "équations d'Euler-Lagrange", ou plus brièvement (mais plus rarement) "équations 
de Lagrange". Ce sont, comme nous allons le voir, les équations du mouvement du système: résolues, 
elles donnent l'évolution effective du système dans le temps. 


2 _ 4 81. 


— — = 0 
dq; dt dg; 


ou plus explicitement: 


OL(qr. dut) à (qd t) | 
%, dt GG, 


0 


Remarque: C'est en étudiant la physique (les chapitres suivants du site) que l'on comprend mieux 
les applications de cette équation (obtenue quasiment que par des développements purement 
mathématiques !!!) et qu'il devient alors possible de comprendre sa signification. A notre niveau du 
discours, il est inutile de dire quoi que ce soit. Il faut faire de la physique, et encore de la physique 
pour la comprendre et la voir apparaître. 


Donc dans l'approche lagrangienne, nous apprenons à raisonner à partir des concepts d'énergie 
potentielle et cinétique, au lieu des concepts de force. Les deux approches sont évidemment 
équivalentes physiquement, mais les énergies n'étant pas des quantités vectorielles, elles sont 
conceptuellement plus faciles à utiliser dans une vaste gamme de problèmes. En physique quantique par 
exemple, la notion de force n'a aucune signification mais les notions d'énergie demeurent valables. C'est 
une raison de plus pour se familiariser avec leur utilisation. De plus, la force au sens de Newton est une 
action instantanée à distance. En relativité, une telle chose est impossible. La notion de force est donc 
une création purement classique et macroscopique contrairement à notre intuition, son intérêt est limité. 


Voyons un exemple d'application particulièrement simple de l'équation d'Euler-Lagrange (les autres 
exemples seront vus pendant notre étude des lois de Newton, de l'électrodynamique, de la relativité 
restreinte, de la relativité générale, de la physique quantique des champs, etc..): 


Exemple: 


Dans un premier temps, posons sous une forme mathématique conventionnelle l'équation d'Euler- 
Lagrange (la notation des coordonnées généralisées n'est pas identique en mathématiques à celle de la 
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physique..): 


a (Een) (II) 5 Goom 


dx\ y 


Prenons un exemple mathématique pratique simple mondialement connu et très important (nous 
réutiliserons les développements effectués ici pour l'étude du pendule de Huygens). L'énoncé du 
problème est le suivant: déterminer quel est le plus court chemin entre deux points d'un plan (nous 
devinons que c'est la droite mais il faut le démontrer!). 


Ce problème consiste à trouver la courbe paramétrée la plus courte x(£},£ € [4,4 ] qui relie deux points 
(attention la variable t n'a rien à voir avec le temps dans cet exemple!): 


x) =2%,x(4)=2X (29.28) 
Ainsi la longueur infinitésimale par application de Pythagore est: 
al? = dé? +dx° 


FE (29.29) 
dL = Naf + dé = fe Sad = f+#%04t 
Ê 


Ainsi, la longueur de la courbe paramétrée est donnée par: 


& 
L= | 1+%{£)df (29.30) 


& 


Il s'agit d'une relation que nous retrouverons souvent en physique et en mathématiques!! 


Ainsi, ce problème, dont la solution géométrique est très simple, se formule sous forme de problème de 
calcul variationnel de la manière suivante: 


min L(x, À,£) = ie 3 (29.31) 
Ecrivons l'équation d'Euler-Lagrange que la solution de ce problème, si elle existe, doit vérifier. 
Nous avons donc: 


Z(x,y,y'}=41+y" 
8Z 8Z y' (29.32) 


va CE 


L'équation d'Euler-Lagrange dans ce cas particulier devient alors: 


4 [92(G»,y)| d(xy,y) à | y = 0 (29.33) 
ax &' d dx| f+»2 L 
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Donc: 


— 


où C est une constante d'intégration (cf. chapitre de Calcul Différentiel Et Intégral). Cette dernière 
égalité implique que (nous ajoutons un indice pour la constante qui nous évitera de la confondre avec 
deux autres constantes un peu plus bas): 


=C,CeER (2934 


PTE x=Q 1-32 (29.36) 
Ê 
Soit: 
2 
FP-c-r s(P+DF = ex, di (29.37) 
(C1 +1) 
d'où: 


dx =C,dt (29.38) 
et par intégration il vient donc: 
x()=Coé+Cs (29.39) 
ce qui est bien l'équation d'une droite. Autrement écrite: 
y{x)=ax+b (29.40) 


1.3.1. IDENTITÉ DE BELTRAMI 


Nous allons démontrer ici une relation utile dans certaines situations. Il s'agit d'une relation appelée 
"identité de Beltrami" qui simplifie l'application de l'équation d'Euler-Lagrange dans certaines situations 
bien particulières! 


Nous rappelons d'abord l'équation d'Euler-Lagrange: 


OE(gs,dit) | d OL(qr, dt) | Q (29.41) 


%, dé 64, 
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Ecrivons la différentielle totale exacte (cf. chapitre de Calcul Différentiel et Intégral): 


dL = RP 2 (29.42) 
æ %; %; 


Ce que nous écrirons sous la forme: 


di, da, di A &, A. 
dt © y, dt 04, dt  , 


En réarrangeant: 


&, _d_@. 
84; dt 4 8 


Multiplions avant de continuer l'équation d'Euler-Lagrange par g,: 


2E _— à a 2 = 29.45 
nn 40 (29.45) 
et injectons la relation antéprécédente dans la précédente: 
. & . d ëêL Ë dE . Sie 
B—-&—-—=|—-—g-—|-4g——=0 (2946) 
4, dé 04, dt 04; æ dé 04; 


Après une petite factorisation nous obtenons: 
8£ à GTA 
_ at) (29.47) 


Dans les conditions particulières (mais relativement fréquents en physique), que nous appelerons sur ce 
site la "condition de Beltrami", où: 


nous obtenons “l'identité de Beltrami": 


qui nous amène de suite à avoir: 
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qui nous sera par exemple utile dans le chapitre de Mécanique Classique lors de notre étude du 
brachistochrone. 


1.3.2. THÉORÈME DU CALCUL VARIATIONNEL 


Le théorème du calcul variationnel consiste à montrer qu'en considérant f une fonction continue sur 
[&,b] à valeurs réelles et H l'ensemble des fonctions continues sur [4,à] indéfiniment dérivables sur 


Ja, [ et qui s'annulent en a et b alors pour toute fonction # e Æ : 


b 


[; (x)A(x)dx =0 (29.51) 


a 


f est nulle sur [4,b]. 


Pourquoi s'intéresser à ce théorème? Parce que nous le rencontrerons très souvent lors de l'application 
du principe variationnel ayant une configuration de ce type. Effectivement, rappelons que le principe 
variationnel amène à avoir: 


ÊS = fôtas) =0 (29.52) 


et l'expression intégrée est rarement une fonction simple comme le lecteur s'en apercevra au cours de sa 
lecture des différents chapitres du site. Il est donc important de connaître une propriété qui simplifie 
parfois l'analyse du problème. 


Remarque: Certains penseront que le cas avec f{x) = 1 avec (x) = sin(x) et x e [0,2] contredit 
l'énoncé du théorème! Au fait ce n'est pas vraiment ça... le théorème se doit d'être valable pour 

Yh e ÆH et non juste pour l'exemple cité. D'où le fait que f devra bien être nul comme nous allons le 
démontrer. 


Démonstration: 


Pour simplifier nous prendrons le cas 4 =—1, ä = 1. À quelques détails techniques près la preuve par 
l'absurde ci-dessous peut être adaptée au cas a, b quelconques. 


Supposons que f ne soit pas nulle sur [—1,1]. Alors il existe x, e]-1,1[ tel que f (x) # 0. Nous 


pouvons supposer f (x,) >0 (même raisonnement si f (x5)} < 0). 


Par l'hypothèse initiale de continuité et de non nullité de f il existe alors un petit intervalle autour de x; 
sur lequel f est strictement positive. C'est-à-dire, qu'il existe 5 > 0 tel que [x - £,xn +] C[-1.1] et 


Vy e[x- e,x+e] f{y)> Ô. 


Considérons à présent la fonction #:[-1,1] —IR définie par 
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1 . 
#(x)= exp(- . ) si x|<1 
g{x)=0 sinon. 


Nous vérifions assez facilement que # est continue (positive) sur [—1,1] et indéfiniment dérivable sur 
]J-L1 (cf. chapitres d'Analyse Fonctionnelle et de Calcul Différentiel Et Intégral). 


De plus, #{—1) = #{1) = 0. Et donc, #e À. Voici une représentation graphique de # : 


Figure: 29.2 - Exemple de fonction pour la démonstration 


A partir de $# nous voulons obtenir une fonction continue sur [-1,1], indéfiniment dérivable sur ]—1,1 
positive sur [x — &,x, +£]et nulle en dehors de [ x, — £,x, +#] afin de montrer l'absurde de 


l'hypothèse de non nullité de f pour que le théorème soit vérifié (rappelons que nous sommes en train de 
faire une démonstration par l'absurde!). 


Pour ceci, il suffit de centrer # en x, et de la contracter. 
La fonction #:[-1,1] IR définie par: 


h(x}= | 


k(x}= 0 sinon. 


| sa xE[x%-E6,% +4] ——. 


répond aux critères exigés. De plus, #{—1)= x(1)= 0 et donc, x e H. 
Ainsi, la fonction f -* sera continue sur [-1,1] positive sur [ x, — £,x1 + €] et nulle ailleurs. 


Nous avons: 


1 
[f(x)2(x) dx=0 (29.55) 
= 
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Or, si une fonction g:[4,b] KR est continue et positive et: 


b 
Jetoar- Q (29.56) 


a 


cela entraîne forcément (nous supposerons cela comme trop intuitif pour avoir besoin d'être démontré) 
g= 0 sur [ab]. 


Par conséquent f (x)#{x)=0 sur [x £,x9 +€] or f(x)#(x) # 0 selon notre hypothèse absurde 


initiale, ce qui est contradictoire. 


L'hypothèse de départ est donc bien fausse et f doit être nulle sur [—1,1] 


OC.Q.FD. 


1.4. FORMALISME CANONIQUE 


Le formalisme canonique n'introduit pas une nouvelle physique mais propose une nouvelle gamme 
d'outils pour étudier les phénomènes physiques. Son élément central, le "Hamiltonien", joue un grand 
rôle en physique quantique. 


Comme dans le formalisme de Lagrange nous travaillerons avec des quantités comme l'énergie, T et V 
plutôt qu'avec des quantités vectorielles comme la force de Newton. 


Dans le formalisme de Lagrange, la description d'un système mécanique à n degrés de liberté décrits par 
les coordonnées générales 4, indépendantes (non contraintes) nous mène à n équations d'Euler- 


Lagrange: 
d£ d AL d 9£ dd 
0g; dt 0; dé 04, Ag; 


qui sont des équations différentielles du 2ème ordre. 


Dans le formalisme canonique (ou de Hamilton), un système mécanique à n degrés de liberté toujours 
décrits par des 4; indépendants nous mènera à 2n équations du premier ordre (plus simple à résoudre). 


Chez Lagrange nous comparons principalement des trajectoires et par conséquent les 4, et les 4, sont 


tous indépendants. Chez Hamilton nous devrons d'abord apprendre à définir les "moments généralisés", 
notés p,, pour remplacer les coordonnées généralisées 4, et 4, qui sont aussi tous indépendants. 


Remarque: L'origine des moments conjugués sera triviale dès que nous aurons vu un premier 
exemple concret. 
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1.4.1. TRANSFORMATION DE LEGENDRE 


Cette transformation est souvent utilisée en thermodynamique où elle permet de relier entre eux les 
différents potentiels thermodynamiques. En mécanique ou en géométrie elle permet de définir le 
hamiltonien à partir du lagrangien et inversement. Nous en donnons une description simplifiée et 
suffisante. 


Soit une fonction f(u,v) où u,v sont les deux variables indépendantes dont dépend f. 
Définissons: 


= PUY) wu,v) (29.58) 
dv 


La transformation de Legendre permet de définir une fonction gix,w) qui peut remplacer f(x, v) : 


Jfiu,v)h gu,w)=v'w-f (29.59) 


Soit maintenant la différentielle totale de f (cf. chapitre de Calcul Différentiel Et Intégral): 


CA dv = CRT + wdv (29.60) 


df = Là + — 
du dv du 
De la définition de g nous calculons: 
dg = wdv+vdw - df 


= on LE . 
ds (29.61) 


= PL = Le LR 
Ou dw du 


et nous avons donc: 
v=< © =-" (29.62) 


1.4.2. HAMILTONIEN 


Soit un lagrangien Z(g,,4;) que nous traiterons comme la fonction f ci-dessus avec les 4; jouant le rôle 
de u et les g; le rôle de v. A la place de w, nous définissons les moments généralisés également appelés 
"moments canoniques": 


_ 4Z 
Pi = — = ?;(4;;,4;)| (29.63) 


dq; 


avec i,.j = 1,2,...#. 
Avant de continuer voyons ce que nous permet de faire cette définition: 


Nous définissons donc, en analogie avec g, une fonction des g; et des p, que nous noterons Æ#(g,,p,): 
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g(u,w) | 
{ { { 


HGQ,r) = Dan - L@.d) 


il 


(29.64) 


Attention! La relation obtenue: 


* 
H(g,P;)= DT — Z(g;,4)| (29.65) 
il 


appelée "fonction de Hamilton" ou "Hamiltonien" est plus qu'importante (comme tout le reste 
d'ailleurs). Nous la retrouverons, entre autres, en physique quantique relativiste ou encore en physique 
quantique des champs. Par ailleurs, un très joli exemple de tout ce que nous avons vu maintenant est 
donné dans le chapitre de Relativité Restreinte où nous calculons le lagrangien et hamiltonien d'une 
particule libre. Les résultats sont assez pertinents et leur utilité et justesse en électrodynamique plus que 
étonnante. 


Exemple: 


Une autre application importante et très connue de la mécanique analytique est le calcul des surfaces 
minimales (physique et architecture). Si nous nous intéressons à la détermination d'une telle surface en 
imposant qu'elle soit une surface de révolution, nous allons voir que nous trouvons une caténoïde (soit 
la forme que prend un film de savon ente deux anneaux). 


Nous nous donnons les rayons À, et À; de deux cercles et l'écartement l entre les deux cercles. Nous 
cherchons une fonction y de classe {>l telle que: 


7(0) = A et yG)= AR (29.66) 
et que la surface de révolution sous forme paramétrique: 
((x (x cos #, y{x}sin #),xe [0,4], 40, 2x) (29.67) 
possède une surface minimale. 


Nous savons que la surface d'un volume de révolution peut s'écrire (cf. chapitre Formes Géométriques): 


s=| 27 (DaÎ + (7 dx = 27[ y4f1+ y ax = 27] Ep, y dx (9.68) 
Soit en faisant varier la fonction: 


6$ = [52 yx= 1 y +ar }a (29.69) 


Puisque g{y "= (8y)" l'intégration par parties du deuxième terme donne: 


(2) Oydx (29.70) 
dy" 
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Comme les bornes d'intégration sont fixes, le premier terme sera nul. Il reste alors: 


ES Ô y dx = (à) ôydx (29.71) 


et donc: 


58 = [6Z(».y)ax= I 6y- (æ) sl (2-5) n 


Le minimum cherché correspond à 45 = 0 quel que soit £y ce qui impose la condition: 


nous retrouvons l'équation d'Euler-Lagrange. 


Cette équation peut aussi s'écrire sous une autre forme. En introduisant le moment canonique pour 


simplifier: 
DES 


Nous avons alors immédiatement: 
dy dy d dy 
Nous obtenons alors: 


ôL 8 
d£=—dy+——dy'= p'dy+pdy" (29.76) 
à dy 


Ainsi, en posant l'analogie vue plus haut (méthode de Hamilton): 
H(y,p)=py'-£ (29.77) 
nous aboutissons à: 


dH =d(y'p-£) ab #-c)-0 (29.78) 


Ainsi en se rappelant qu'au début nous avions: 
S=27f p4fi+y %ax= 2x] LG, yhéx (29179) 


Nous aboutissons à: 
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aL., 2 _ 
Le —- fi+ >? = —"" 690 


Ce que nous pouvons aussi noter (car la constante a un signe indéterminé): 
—Y + 

EST € (2981) 

A fl +y' 

Nous avons alors: 


Ÿ te 
c 


TR = (29.82) 
Vi +y"° 


Nous avons déjà intégré ce type d'équation différentielle en détails dans le chapitre de Génie Civil dans 
l'étude de la chainette. Le résultat est: 


1 x 
y =—cosh E + | +cÿ (29.83) 
E £ 


la surface de révolution de cette courbe étant une caténoïde: 


Figure: 29.3 - Tracé de la caténoïde (Source: Wikipedia) 
Ce qui est un exemple remarquable qui montre l'intime relation entre la mathématique et la physique! 
Cette figure peut être obtenue avec Maple comme suit: 


>y:=cosh(x); 
>plot3d([x,y*cos(phi),y*sin(phi)],x=0..2,phi=0..2*Pi) 


Maintenant, si L dépend du temps (ce qui est quand même assez souvent le cas...) nous avons comme 
différentielle totale: 


2, 9Z ST AE! 
di "L'an 4 + — dé; + — dt 


7 04 r 0g; dé 
s, dE , _ (29.84) 
=: D — da; +2 Pidd; + —dt 
1 04; il dé 
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nous calculons aussi la différentielle totale de Æ(g,,p,) et y substituons le résultat obtenu 


précédemment: 


dH = Ÿ Gb, +Ÿ pdf, - Ds 44 Ya dû +de 


il il 10 
a£ 


Li : # AZ, 
= 2 dr, 2e a 


il 


(29.85) 


ce qui montre bien que Æ(g,,p,) est fonction des g, (et du temps). 


Nous pouvons donc aussi écrire pour sa différentielle totale: 


dH D D + Tdi (29.86) 


co dg, 


et comme les g, et p, sont indépendants nous identifions, en comparant nos deux expressions que: 


4 __L 
0, 9; 

dÆ sn 
— =, (29.87) 
dp, 

o4 __èL 

dé dé 


Ces relations sont extrêmement importantes car nous les retrouverons en magnétostatique, en physique 
quantique relativiste et aussi en physique quantique des champs sous une forme un peu plus barbare 
(mais magnifique aussi...). 


Considérons maintenant le deuxième terme du premier membre de l'équation d'Euler-Lagrange. Nous 
avons: 


d; = —;i=1,2,.x 
dp; 
aH 2# (29.89) 
5, = ——;i=1,2,.x 
ûg; 


Ces 2n équations sont appelées "équations canoniques du mouvement" et sont des équations 
différentielles du premier ordre. 
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Remarque: L'apparition du signe moins " -" entre les équations pour les g, et celles pour leurs 


moments conjugués, s'appelle une "symétrie symplectique". 


De: 


LS # 
a D 2 GE 4; + Tdi (29.90) 


il dp, EI ‘4, 
nous pouvons, sur une trajectoire qui obéit aux équations canoniques, calculer: 


dH <-0E . EL 4H . 0H 
= En | leve 
dt rod, 1 04; dk 


Sp + dar, + = 
CU UT 8 dé 


(29.91) 


Remarque: Si H ne dépend pas du temps nous avons alors 4Z j 4£ = 0, alors H (ainsi que L), sont 
une "constante du mouvement". 


Un exemple s'avère indispensable à ce niveau d'avancement de l'étude du formalisme Lagrangien. Nous 
allons nous restreindre à un cas particulier d'une particule soumise à une force en une dimension. Mais 
bien que cet exemple et les développements qui y sont liés soient simples nous retrouverons les 
résultats obtenus ici dans bien d'autres parties du site. Il est donc important de bien l'étudier et de bien 
le comprendre (ce qui nécessite malheureusement aussi que le contenu du chapitre de Mécanique 
Classique soit connu par le lecteur). 


Exemple: 


Soit une particule de masse m se déplaçant en une dimension (disons x) et soumise à une force dérivant 
d'un potentiel tel que: 


F=-—@x=-——=-(07) (2992) 
x 
Nous savons que son lagrangien est: 
1 2 . 
L= _" (x) (25.53) 


Nous n'aurons qu'un seul moment (la quantité de mouvement), noté p, conjugué à x et défini par: 


p= Le (29.94) 
8x 


équation que nous pouvons (que nous devons !) inverser (de la définition de la quantité de 
mouvement): 
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Nous pouvons noter en ce point que le moment p correspond (6 hasard !!) à la composante x de la 
définition élémentaire ? = #” (ce qui ne sera pas toujours aussi trivialement le cas). 


Selon la définition de l'Hamiltonien il vient alors: 


2 
H = i(p)p = Lx i(p)) = 2 p (2) +0 = +7 036 
ma 2 1 2m 


que nous écrivons souvent sous la forme: 


H =7T+#] (29.97) 


où T'est donc l'énergie cinétique exprimée en fonction des moments. 
1.4,3. CROCHETS DE POISSON 


Le crochet de Poisson {4,8},, est la façon standard de noter une certaine opération qui implique les 
quantités A(g,,p,) et B(g,,p,) ainsi que l'ensemble des variables canoniques (g,,p,) définie par: 


E,| 44 QE AA dE 
(4,8), =D -—— |) 909) 
1104 dP, Gp, da; 


qui exprime la manière de parcourir un champ (le crochet étant nul si les deux types de parcours sont 
égaux). 


de cette définition nous pouvons déduire certaines propriétés relativement triviales: 
P1. {4,8} = -{2, À} 


Démonstration: 


"| a4 38 a4aB| | ap 4 @B 64 
AR ÉEEETE EEE ET 
É 84 08 >| (29.99) 
EC 
= (8,4) 


NC.Q.FD. 
P2. {(A,B+C}={A,B}+{AC) 


Démonstration: 
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&4 8(B+C) 84 AB+C) 


(A,B+C}= ÿ| #20 24 | =) 


=, | 488 8C| 84[88 8C 
4ae-s-4es 
al 4: ko Cp,) Pl da 


a -À|( 04 88 64 LE a 84 | (29.100) 


04; dæ, d, dg %, op, OP; (72 
DE 28 44 >| 2 É ôC 64 4 
+2, 
i=l 


i= 


% æ,  æ, %; 
= {4,8} +(4,0 


%; æ, æ, 9%; 


i=l 


OC.QFD. 
P3. {4,BC}= B{A,C}+C{A.B) 


Démonstration: 


(A,BC}=Y 

i=l 
+ Efsece) Arr) 

P; dp, dp, 84; 24, 
x) ( ee HEhcue- 22) (29.101) 
Des DÉS 
alarm a] la &% 

= B(A,C}+C(4,8) 


22e C)_ 84 8(8-C) 2) 


OC.Q.FD. 
P4. {48,0} +{C, (4,8; }+{8,(C,4}}= 0 
Démonstration (nous allons simplifier la notation pour condenser...): 


(4,(8,03}+4{C,(4,8) }+{(2,(C,4)) 


-ÿle 4,2 [2 B,C-8,B8,C |-3,48, [Ela.89,0 2,80) 


= 


i=l i=l = 


DE ca,X[2, 48,B-8,48,B |-8,C8, (EL240,9-2,2,5])] ns: 


las, X[2,C8,4-28,C8,4]-2,88, | > [2,C8,4-8, c2,4]) 


= = 


Bon et ici, histoire de pas avoir un truc illisible, long et ennuyeux on va démontrer la propriété pour 
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# = 1 et nous supposerons (bien évidemment) qu'elle est valable pour tout n : 


(4,(3,0)}+4{C, (4,8}}+(8,(C,4)} 

= 8,48,[8,88,C -8,B8,C |-8,48,[8,88,C -8,88,C | 
+9,C8, [9,48,B-8,A8,B |-0,C8,[8,48,B-06,48,B| 
+8,88,[8,C8,4-8,C8,4]-8,88,[8,C8,4-8,C8,4] 

= 9,48,,89,C+0,49,89,,C-8,48,,89,C-8,40,B8,,C 
8, 48,,88,C-8,48,B8,,C +8,48,,88,C+9,40,B0,,C 
+9,C8,,40,B+8,C8,48,,B -8,C0,,48,B-0,C8,48,,8 
-8,C8,,40,B-8,C8,40,,B+8,C8,,48,8+0,C8,48, 8 
+9,80,,C0,4+9,B0,C8,,4-0,B0,,C0, 4-0 B,C0, À 
-8,B8,,C8,4-8,B8,C8,,4+8,88,,C8,4+0,88,C8, 4 


(29.103) 


Nous avons en plus (cf. chapitre de Calcul Différentiel Et Intégral) sous certaines conditions la 
propriété 9, = 4, Dès lors l'ensemble des termes s'annulent (c'est de l'algèbre élémentaire) pour 


avoir finalement : 


(A{B,0C}}+{(C,{A,8}}+{8,{C,A}}=0 (29.104 


où la dernière expression est appelée "identité de Jacobi". 


OIC.Q.F.D. 


Au-delà d'une simple notation, le calcul des crochets de Poisson est assez facile et permet d'obtenir 
nombre de résultats intéressants. D'autre part, ils sont intimement reliés aux "commutateurs" de la 
physique quantique que nous étudierons dans le détail dans le chapitre concerné. 


Considérons maintenant une fonction quelconque F(g;, p,,£) dont la dérivée totale par rapport au 
temps le long d'une trajectoire s'écrit (vous y reconnaîtrez normalement quelque chose que vous 
connaissez déjà.…): 

aF ôF . , ÔF 


—= ACL (29.105) 
4 & >| à malt a © 


Si cette trajectoire est une trajectoire physique, elle obéit aux équations canoniques de l'hamiltonien H 
du système: 


& Pi = | (29.106) 


et alors: 


PP PEL, HT (29.107) 


dé |%; 9, dp, da, dt 
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En particulier, cette équation permet un calcul facile des constantes du mouvement. En effet, le calcul 
de dF}f df est immédiat et le calcul de {F,Æ} un exercice assez simple. 


Il existe une famille de résultats intéressants des crochets de Poisson. Parmi les plus importants, 
calculons certains de ces crochets entre des variables canoniques, coordonnées et moments: 


2,0, 04; ge M; 
(gx:9,) = à AE 2 Lu 1 up à (29.108) 
im |09; ®, , da, 


puisque par définition, les coordonnées et moments ne sont pas directement dépendants: 


ôg ; a 
> RECET) (29.109) 


23 | dp, 
d'où: 
(gr,95) =(g;,qx} = O (29.110) 
et de manière identique: 
(PP) =(;,p:)} = 0 (29.111) 


Mais: 


L 04% ôp; 04% ; x 0g% dp; Ë \ 
@,P}= D - le SE = 5 6,6, = 8, (29.112) 
Fe 2 0; dP, CP; Pre dp; 2 _e 


où rappelons-le, ä,; est le symbole de Kronecker défini par: 


1 il} 
à, À | * (29.113) 
0 is j 


Attention ! {g,,p;} n'est pas commutatif. Effectivement, le lecteur contrôlera facilement que: 


(gr, P;} “(p;,4i} (29.114) 


Ce qui implique un résultat assez général que nous retrouverons dans le chapitre de Physique 
Quantique Ondulatoire : 


(g,P;}-{(P,,9,}#0 (29.115) 
1.4.4. TRANSFORMATIONS CANONIQUES 


Nous disons des g,,p, que ce sont des "variables canoniques généralisées". Ce n'est pas un 


euphémisme puisqu'il n'y a pratiquement aucune limite à ce qu'elles peuvent représenter physiquement. 


Puisque tel est le cas, il doit exister des transformations entre ces différents choix. Nous noterons @, , A 
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Nous ne sommes pas surpris par contre de constater que ces transformations sont soumises à des 
conditions assez sévères. En effet, les g,,p, sont généralisés et obéissent à: 


(du,95) = 0 (p:,p;}=0 (g,p;}= & (29.116) 


et les équations canoniques: 


- 04 
Pi == — (29:117) 


; ôg; 


sont invariantes de forme. Ainsi, à la suite d'une transformation des g,,p, vers les (, , 2 et définissant 


un nouvel hamiltonien que nous noterons #{(@,,2) nous devrons avoir: 


(0:90) =0 (8,P)=0 (0,,2)= 48 (29.118) 
et les équations canoniques: 


-  0K 
Q=— À=-— (29.19) 


, 
Strictement, les équations de transformation peuvent s'écrire: 


©, =0,(4;,P,,t) 
£ ui £G;,P;,t) 


avec i,j = 1,2,...,# et doivent pouvoir s'inverser puisque la physique reste indépendante des variables 
que nous employons pour la décrire, donc nous pouvons écrire les transformations inverses: 


Gi Gi: (228 Pt) 


(29.121) 
Pi = P:(Q,, Pt) 


avec i,.j = 1,2,...,#. Les g,,p,,0,,Æ forment 4n variables mais il est évident que seules 2n d'entre elles 
sont indépendantes. 
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Notes personnelles: 
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30. MÉCANIQUE CLASSIQUE/RATIONNELLE 


À sant d'aborder l'étude des corps solides en mouvement dans le cadre de la mécanique classique (à 


l'opposé de la mécanique relativiste) appelée également "mécanique rationnelle" ou "mécanique 
newtonienne", il peut sembler être dans l'ordre logique des choses de définir et d'étudier les propriétés 
relativement à leur état statique. 


Définitions: 


D1. Un phénomène est dit "statique" ou "en équilibre" lorsqu'il ne subit aucune dynamique 
(accélération ou in extenso: force), du moins apparente. Nous pouvons considérer un équilibre comme 
un état statique, bien qu'il ne soit qu'apparent car il peut être le résultat de deux dynamiques opposées 
qui se compensent! Ainsi, les grandeurs qui décrivent un phénomène statique sont des constantes, les 
valeurs concrètes de ces grandeurs sont calculables. La statique est un cas majeur d'étude du génie 
mécanique et du génie civil (voir chapitres du même nom). 


De manière plus technique cette définition est érigée au rang de principe appelé le "principe 
fondamental de la statique" qui énonce que pour qu'un système soit en équilibre, il faut que la 
résultante générale et le moment résultant des forces extérieures soit équivalent à zéro par rapport à son 
centre de masse ou de gravité (la condition est suffisante pour les problèmes de mécanique qui traitent 
des solides indéformables). 


D2. La "statique" est l'étude des conditions d'équilibre d'un point matériel soumis à des forces en 
équilibre. 


D3. Toute cause capable d'accélérer (concept défini plus loin) ou de déformer un corps est appelée 
"force" (concept introduit rigoureusement par Newton et sur lequel nous reviendrons en détails plus 
loin lors de l'énoncé des trois lois de Newton). 


Une observation plus approfondie fait apparaître la force comme le résultat macroscopique de 
phénomènes microscopiques complexes, à savoir des interactions à distance entre particules. Ces 
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interactions sont au nombre de quatre et je ne désire nullement en parler maintenant car elles font appel 
à des outils mathématiques qui sont hors contexte dans cette section du site. 


Remarque: En mécanique classique nous ne nous posons naturellement pas la question d'une 
transformation du temps. Les changements envisagés concernent la grandeur "position" et ses 
dérivées. En effet, en mécanique classique, nous postulons le "temps de Newton": le temps s'écoule 
de façon identique d'un référentiel à l'autre. 


D4. Si les lignes d'action de toutes les forces agissant sur un corps sont dans un même plan, le système 
de forces est dit "système coplanaire" et sa représentation schématique un "dyname": 


FE 


Fr 
Figure: 30.1 - Exemple particulier de système coplanaire 
où l'intersection des force se nomme un "noeud de forces". 


Si nous considérons par exemple un ensemble particulier de forces coplanaires dont les intensités 
(normes) ont été mesurées à l'aide d'un dynamomètre et les angles par rapport à une repère 
adéquatement choisi avec un rapporteur. Nous aurons alors un schéma du type suivant: 
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F 
Figure: 30.2 - Exemple particulier de système coplanaire mesuré 


Pour calculer les composantes de la résultante (et in extenso de sa norme), il peut être plus aisé de 
représenter les trois forces sous la forme suivante (après translation): 


X 


Figure: 30.3 - Représentation simplifiée des forces pour traitement 


Ensuite, avec de la trigonométrie élémentaire, connaissant les angles et l'intensité de chacune des trois 
forces, il est possible de déterminer leurs composantes respectives selon X et Y et leur somme 
algébrique selon chacun des axes donnera les composantes de la résultante (aujourd'hui ce type de 
raisonnement à l'air simple mais il a fallu quand même attendre la fin du 16ème siècle pour que ces 
raisonnements sur la statique des forces émerge). 
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Figure: 30.4 - Représentation de la résultante des forces d'une pont suspendu 


Un petit cas applicatif élémentaire est le portage d'une charge: 


Figure: 30.5 - Port de charge coplainaire symétrique 


par symétrie chacune des parties gauche/droite du câble est sous la même tension (force). En 
appliquant de la trigonométrie élémentaire (cf. chapitre de Trigonométrie), nous avons: 


Soit: 


Nous remarquons alors que nous avons tout intérêt à avoir: 


ang >0.5 (30.3) 


(soit un angle supérieur à 30°) sinon quoi nous aurions: 
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F'>ÆFp (304) 


Comme nous l'avons déjà mentionné, un système de forces concourantes coplanaires est en équilibre 
statique, lorsque la résultante de toutes les forces est nulle. Graphiquement, l'extrémité de la dernière 
force du dyname coïncide avec l'origine de la première force. Mathématiquement cela peut s'écrire: 


> Fi =R, =0 

a = R=0 (30:) 
n 

S'F = 

2 PF = À = 0 


DS. Un système matériel S (ensemble de points matériels {Æ,#2,} ) est dit "solide indéformable" (rigide), 


ou simplement "solide", si les distances mutuelles des points matériels le constituant ne varient pas au 
cours du temps. Ce que notons techniquement sous la forme suivante: 


VE VG, j): IPF] = (30.6) 


1. LOIS DE NEWTON 


Les trois lois de Newton sont à la base de la mécanique classique. Elles sont à posteriori indémontrables 
et non formalisables car elles énoncent des observations et découlent donc de notre expérience 
quotidienne. 


Cependant, les développements de la physique moderne et qui se basent sur les conséquences de ces 
trois lois sont en tel accord avec les conditions théoriques qu'impose le principe de moindre action et les 
expériences y relatives, que leur validité pourrait ne plus être mise en doute (...) 


1.1. PREMIÈRE LOI (LOI D'INERTIE) 


Définition: Tout corps ponctuel ou étendu persévère dans sa forme (géométrie) ou son état de repos ou 
de mouvement rectiligne uniforme (décrit par le centre de masse), sauf si des "forces imprimées" le 
contraignent d'en changer. 


Le corpos ponctuel est bien évidement sans dimension. C'est une création de l'esprit, un modèle, 
représentant un objet physique qui n'est animé que d'un mouvement de translation (pas de rotation sur 
lui-même). Nous admettons ici que notre espace physique est à trois dimensions auquel on adjoint le 
temps qui n'est pas ici une dimension mais un paramètre immuable et indépendant! 


Autrement dit: Tout corps au repos ou en mouvement rectiligne uniforme est soit imprimé par un 
nombre de forces nulles, soit la somme des forces imprimées est nulle (c'est le principe fondamental de 
la statique appelé aussi "principe d'inertie"). 


Corollaire: Lorsque la trajectoire d'un corps n'est pas une droite ou lorsque la vitesse de ce corps n'est 
pas constante, on peut en conclure d'après le Principe d'inertie que les forces qui s'exercent sur ce corps 
ne se compensent pas. 
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Remarque: Nous avons démontré ce corollaire lors de notre étude du théorème de Noether dans le 
chapitre traitant des Principes de la physique. 


Après la virgule de la première phrase du corollaire, jaillit en pleine lumière le mot "force". 
Questionnons donc ce mot: le langage courant regorge de significations différentes: la force du poignet, 
la force de l'âme... Aussi, la force peut-elle être aveugle ou majeure, selon le cas. Quoi qu'il en soit, 
elle a le pouvoir de changer le cours (le mouvement) et la forme (géométrie) des choses. Sans ignorer 
ce halo qui entoure le mot et qui a embarrassé plus d'un physicien avant lui, Newton donne à la force 
une signification très précise, qui se démarque de l'idée intuitive d'un effort physique. 


Propriétés: 

P1. La force est une grandeur vectorielle (cf. chap ). 

P2. L'effet d'une force, ne change pas si nous faisons glisser la force sur sa droite d'action. 
Une force est donc une grandeur physique qui se manifeste par ses effets: 


E1. Effet dynamique: une force est une cause capable de produire ou de modifier le mouvement ou la 
forme (géométrie) d'un corps. 


E2. Effet statique: une force est une cause capable de produire une déformation d'un corps. 
Toute force peut être représentée par un vecteur dont les quatre propriétés sont: 

P1. Direction: droite selon laquelle l'action s'exerce 

P2. Sens: sens selon lequel l'action s'exerce sur la droite 

P3. Point d'application: point où l'action s'exerce sur le corps 

P4. Intensité: la valeur (norme) de la force 

Il est possible de ranger la plupart des forces par familles telles que: 


F1. Les "forces de réaction": chaque corps exerce une force sur un autre corps qui est en contact avec 
lui. Par exemple, si un objet repose sur une table, cette table exerce une force égale et opposée sur 
l'objet (afin que ce dernier ne s'enfonce pas dans la table - ce sont des mécanismes quantiques qui sont 
à l'origine de cette force de réaction). Cette force est toujours à la verticale du point de contact. 


F2. Les "forces de frottement": la force de frottement existe lorsque deux corps sont en contact. Elle 
s'oppose toujours au mouvement. La force de frottement qui s'oppose au mouvement n'a pas seulement 
un effet négatif, elle est indispensable pour assurer aussi le contact entre deux surfaces (par exemple: 
contact des pneus sur la route, freinage, ….). 


F3. Les "forces de tension" exercées sur un corps: c'est une force qui tire sur un élément d'un corps 
comme par exemple, la tension exercée par un fil, par un ressort ( Géni 


F4. Les "forces à distance": ce sont les forces qui agissent par l'intermédiaire de champs vectoriels 
comme par exemple le champ électrique, le champ magnétique, le champ gravitationnel. Ce dernier a 
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comme particularité s'il est isotrope (nous le démontrerons lors de notre étude de la statique des forces) 
de pouvoir se réduire à l'étude du centre de gravité du corps. 


1.2. DEUXIÈME LOI (PRINCIPE FONDAMENTAL DE LA DYNAMIQUE) 


Définition: Le changement de mouvement est proportionnel à la "force motrice imprimée", et 
s'effectue suivant la droite par laquelle cette force est imprimée. 


Une force, nous le savons, est dans le langage de Newton ce qui provoque le "changement du 
mouvement" et pas autre chose. Mais, supplément au programme, les mots "changement du 
mouvement" de cette loi cachent une signification mathématique, différente de l'intuition "changement 
de vitesse". Pour Newton, nous avons vu qu'un corps au repos était caractérisé par sa quantité de 
matière, sa masse. S'inspirant de certains prédécesseurs, Newton pose qu'un corps en mouvement 
"transporte une certaine quantité", appelée sans fioritures: la "quantité de mouvement". C'est en fait 

cette quantité qui, sous le simple mot "mouvement" est contenue dans l'énoncé de la seconde loi. La 
quantité d'un mouvement est la mesure que nous tirons à la fois de sa vitesse (concept que nous 
définirons plus loin lors de notre étude de la cinématique) et de sa quantité de matière, autrement dit, 


par définition, le produit de sa masse par sa vitesse. 


P=m 


En utilisant les symboles mathématiques modernes, la première partie de cette deuxième loi peut alors 
se reformuler: 


La force est égale à la variation en fonction du temps de la quantité de mouvement, soit dans un cadre 
non relativiste: 


p-P 0 LE px 
dé dé dé 


Cette relation est donc valable tant que la vitesse est très inférieure à celle de la lumière comme nous le 
verrons lors de notre étude de la mécanique relativiste bien plus tard, car Newton supposa que la masse 
ne variait pas (ou ne semblait pas varier...) en fonction de la vitesse. Aïnsi, la "relation fondamentale de 
la dynamique" (R.F.D.) est donnée par: 


F = mn 


et peut s'énoncer ainsi: Soit un corps de masse m constante, l'accélération subie par un corps dans un 
référentiel galiléen est proportionnelle à la résultante des forces qu'il subit, et inversement 
proportionnelle à sa masse m. 


La "masse" est une mesure pour la quantité de matière contenue dans le corps (cf. 

ue). La masse est une constante indépendante de l'endroit où elle se trouve 
(unité S.I. Free [kg]). Le "poids", correspond lui à la force (unité S.I. newton: N) qu'un objet 
exerce sur un autre par l'intermédiaire d'un champ gravitationnel. Il dépend de l'endroit où nous nous 
trouvons (voir ci-dessous l'équation de la force gravitationnelle de Newton). 


Nous verrons (démontrerons) que dans le cadre d'un corps tombant dans un champ gravitationnel à 
symétrie sphérique, nous avons: 


Page: 1707/4839 


[v3.0 - 2013] 


dans le cadre de notre bonne vieille Terre, nous avons pour habitude de poser: 
lal=g (Go1n 


Dans le système Eulérien et en coordonnées cartésiennes, une grandeur donnée # d'un milieu continu 
aura une distribution en fonction des quatre variables indépendantes x, y, z, t. Pour de petites variations 
dx, dy, dz et dt, la variation totale de & s'exprimant par (cf. chapitre de Calcul Différentiel Et Intégral): 


dg= 1 12e, 428% +00 (30.12) 
äx dy ôz d6 


En suivant une particule dans son mouvement, nous observons pendant un temps dt des déplacements 
dx, dy, dz. Nous pouvons donc exprimer à partir de l'expression précédente la variation totale de 
pendant le temps dt. Nous obtenons ainsi l'expression d'une dérivée très importante en physique 
théorique dite "dérivée particulaire": 


RPM, O0 0PE, 0e 
dt 0x dt dy dt dz dt ût 


(30.13) 

En mécanique nous allons particulièrement travailler avec le champ gravitationnel Newtonien. Dès lors, 
la relation reliant la force à l'accélération prend une forme plus générale. Voyons comment: 

Soit la dérivée particulaire de la vitesse (pour les trois coordonnées spatiales): 


dv vdx dvdy dvdz dd 
+ + 


— — (30.14) 
dé Oxdt ydt Oz dt dt 


Ce qui s'écrit aussi: 


dv 7 1 Gi 
ST — — +y, 
dt dt x  * & 


Ce qui peut s'écrire aussi sous forme condensée: 
sn. d 22e … 
—_= —+(50ÿ)5= had Y (30.16) 


La deuxième loi de Newton s'écrit alors sous forme généralisée: 


: 8 _L 2). 
F=m|—+v0% |v| (30.17 
dé 


Cette formulation de la deuxième loi de Newton est de la plus haute importance en physique. Elle rend 
compte explicitement de la force subie par un point matériel dans un champ vectoriel en fonction de la 
vitesse et non plus de la position. Nous retrouverons cette formulation dans le chapitre de Mécanique 
Des Milieux Continus dans notre étude des fluides et plasmas, dans le chapitre d'Électromagnétisme 


Page: 1708/4839 


[v3.0 - 2013] 


ainsi que dans celui de Relativité Générale. 


1.3. TROISIÈME LOI (LOI D'ACTION ET RÉACTION) 


Énoncé: la réaction d'un corps étendu ou ponctuel solide est toujours de sens opposée et d'intensité et 
de direction égale à la force imprimée. 


Cette troisième loi est plus connue sous le nom de: "principe d'action/réaction" et découle de la 
première loi de Newton selon le raisonnement mathématique lors de notre étude du théorème de 
Noether dans le chapitre traitant des Principes de la physique. 


Ainsi, dans la nature, selon ce principe, il n'y pas de force isolée, chaque force à son "contraire", elles 
agissent par paire. 


Nous pouvons également dire encore que deux corps solides ponctuels ou étendus en contact exercent 
l'un sur l'autre toujours des forces opposées en sens mais égales en intensité et en direction. 


2. CONDITIONS D'ÉQUILIBRE 


Pour qu'un point matériel, soumis à des forces À À ES soit en équilibre statique, il faut que la 
résultante de ces forces soit nulle. Soit: 


DX: =0 (30.18) 


il 


La relation précédente, qui définit donc tout corps à l'équilibre, ouvre l'étude à de très nombreux cas 
pratiques et constitue à elle seule un immense chapitre d'applications pratiques que nous appelons la 
"statique des forces" et que nous développerons après avoir introduit le concept de moment de force 
plus loin. 


Cependant cette condition est suffisant uniquement dans le cas de points matériels. Si nous travaillons 
avec des objets étendus dans l'espace alors la condition susmentionnée est nécessaire mais pas 
suffisante. Nous verrons effectivement plus loin, lors de notre étude des "moments de force", qu'il faut 
rajouter une condition supplémentaire. 


3. CENTRE DE MASSE ET MASSE RÉDUITE 


Le centre de masse est un cas particulier du barycentre avec toutes ses propriétés que nous avons déjà 
largement développées dans le chapitre de Géométrie Euclidienne (donc nous conseillons fortement au 
lecteur de s'y référer) mais rapporté à la physique. 


On peut confondre "centre masse" et "centre de gravité” (dit également "barycentre") que si et 
seulement si la masse du corps étudié est homogène. 


Définition: Soit un solide formé de n points de masse »#,,7#,, #8 ,...,#, et repérés par leurs vecteurs de 


position %,7,,..,A respectifs. Nous appelons "centre de masse" (ou "centre d'inertie" s'il y a égalité 


# 
stricte entre masse grave et masse inerte) un point G auquel nous pouvons rattacher toute la masse du 
système (et donc son analyse!!) et tel que, l'origine étant arbitrairement choisie il soit donné par: 
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Si nous considérons le solide comme continu (vrai seulement à l'échelle macroscopique en première 
approximation) alors il vient: 


ls 


Fe = —— (30.22) 
oi 


Où les intégrales sont étendues au volume du solide en entier. 


De plus, si le solide est homogène (cas particulier), de masse volumique & , alors de = @dV, dV étant 


l'élément de volume. L'équation peut alors s'écrire (la notation de la triple intégrale est réduite à une 
seule par souci de condensation d'écriture): 


Soit en composantes: 


Propriétés: 
P1. Si le solide possède un axe de symétrie, alors G est sur cet axe. 


P2. Si le solide possède un plan de symétrie, alors G est sur ce plan. 
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P3. Si le solide possède plusieurs axes de symétrie, alors G est à leur intersection. 


Remarque: Le centre de masse G peut se trouver hors du solide (exemple: un tabouret, un 
boomerang, etc.). 


Il n'est pas évident de calculer le centre de masse d'un corps donné relativement simple. Ce n'est pas 
que les outils mathématiques à manipuler soient complexes loin de là (simple intégrale, Pythagore et 
quelques multiplications et intégrations par parties) mais il faut aborder le problème d'une façon 
élégante et si nous n'avons pas tout de suite la bonne approche nous nous casserons très vite les dents. 
Nous conseillons donc aux professeurs qui abordent ce sujet et les exercices y relatifs, de les faire avec 
les élèves (donc en classe) mais en laissant ces derniers débattre de la façon dont le professeur doit 
attaquer le problème au tableau noir (cela marche très bien). 


3.1. THÉORÈME DU CENTRE DE MASSE 


Sous l'action des forces extérieures À Ë  : F, agissant en chaque point du solide, chacun de ces 
points prend l'accélération correspondant à la force appliquée À. En utilisant la deuxième loi de 


Newton pour chaque point et en sommant les effets nous aurons (dans un cas non relativiste): 
n # # d 2 F d? # 
FD = D m—=—S mA (30.25) 
RAT AN a ar" 


en vertu de la position du centre de masse donnée par la relation: 


il vient si le référentiel est posé sur le centre de masse: 


s dre : 
FE," . DS où x = M (30.27) 
d£ il 
soit: 
> d°F, 
FE, =M FAR = M'ä,| (0:28) 
£ 


C'est le théorème du centre de masse, que nous pouvons énoncer ainsi: 


Le centre de masse d'un solide se meut comme un point matériel de masse égale à celle du solide et 
auquel serait appliqué la somme des forces extérieures. Un exemple simple est celui d'un projectile 
explosif décrivant en absence de pesanteur une trajectoire courbe. Si le projectile explose et se 
fragmente, le centre de masse des éclats continue à décrire la trajectoire courbe qu'il avait entamée. 
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Remarque: Dans le cas particulier du solide (ensemble de points) soumis au champ de la pesanteur, 
Ë. est le poids du solide et G s'appelle alors "centre de gravité" (d'où l'origine de cette 


appellation). 


Reprenons l'équation: 
(30.29) 


donnant la position du centre de masse. Sa vitesse vaut: 


. dy 1 dÆ ]  — 
= +4 = __ += — JL, = — . (30.30) 
"FH NH 27 & M 2 M 2? 


en posant: 


où est la quantité de mouvement du système, il vient: 
P=M'ÿ,; (0.32) 


Cette relation montre que si la somme des forces extérieures est nulle alors: 


Donc la quantité de mouvement du système entier est conservée et le mouvement du centre de masse 
du système est inaltéré. Ceci justifie les remarques faites lors de l'étude de la conservation de la 
quantité de mouvement. 


Dans l'étude des interactions entre particules, il est souvent commode d'utiliser un système de référence 
lié au centre de masse de l'ensemble des particules. Ce centre de masse étant au repos dans ce 
référentiel, sa vitesse y est nulle ainsi que la quantité de mouvement totale, comme le montrent les 
équations ci-dessus. Cette propriété constitue le puissant avantage de cette description. 


Remarque: En mécanique, l'usage du centre de masse (point matériel) est particulièrement aisé car 
le système de forces est régi seulement par la loi de Newton. Avec des particules électrisées 
(charges), il en va tout autrement. Les effets électromagnétiques sont dominants lors de leurs 
accélérations, ce qui induit des phénomènes ondulatoires interactifs nettement plus complexes. 
C'est la raison pour laquelle nous ne verrons jamais une étude sur ce site du "centre de charge" 
lorsque nous aborderons l'électrostatique dans le chapitre d'Électrodynamique.. 
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3.2. THÉORÈMES DE GULDIN 


Les théorèmes de Guldin permettent dans certains cas, de simplifier le calcul du centre de masse de 
certains COrps. 


Premier théorème: Soit une plaque plane, homogène, d'épaisseur constante e, de masse volumique & 
placée dans un plan cartésien xOy. Nous avons alors par rapport à l'axe y: 


Ve _ Dar _ Joan _e'ofus nl (30.34) 


[ar M e'p'S S 


Envisageons une rotation autour de l'axe x. Le volume décrit par un élément de surface dS lors de cette 
rotation vaut: 


dW =27ydS (30.35) 
et, par conséquent, le volume total décrit par la surface S complète est: 


F = [7 = 2x [ras =27'ySS (30.36) 


Ainsi, en procédant de même pour x, , nous obtenons finalement: 


Ye Ëc 


F F 
27S 


Deuxième théorème: Soit une tige courbe, homogène, de longueur 1, de section constante, de masse 
linéique &,. Nous avons: 


D mL LE 


[or &'E 
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x 


Envisageons une rotation autour de l'axe x. La surface décrite par un élément de longueur dl lors de 
cette rotation vaut: 


dV =2xydl (30.39) 
et, par conséquent, la surface totale décrite par la tige de longueur L est: 
S = [ES = 27" [val =27'y;L (30.40) 
Ainsi, en procédant de même pour x, , nous obtenons finalement: 


5 5 


= X , 
di 27L ox 


(30.41) 


4. CINÉMATIQUE DU MOUVEMENT RECTILIGNE 


Un phénomène est évolutif si, en l'observant, nous constatons un glissement de la valeur concrète d'une 
ou plusieurs grandeurs. Ces grandeurs ne sont pas des constantes mais des variables. Une évolution 
LLE4 


implique qu'il y a un début, une infinité d'états intermédiaires et une fin. Un "état" est la description 
d'un instantané d'un phénomène évolutif (pas forcément au sens temporel du terme). 


La relation fonctionnelle entre grandeurs pour un état donné peut être décrite par une équation. Pour 
un phénomène évolutif, il peut y avoir une infinité d'états que nous pouvons décrire par autant 
d'équations. Sous cette forme, cela n'a pas d'intérêt. Nous cherchons alors à trouver une équation 
unique qui met en relation les différentes grandeurs vérifiant tous les états que le phénomène évolutif 
considéré peut admettre. Par cette équation, nous pouvons ensuite calculer n'importe quel état du 
phénomène évolutif étudié: c'est "l'équation d'état" (notion tirée de la thermodynamique). 


La "cinématique" est donc la partie de la mécanique qui traite des mouvements sans s'occuper de ses 
causes (c'est Ampère qui a baptisé ce domaine ainsi). 


4.1. POSITION 


Définition: La position d'un objet est définie par son vecteur position dans le cas particulier d'un espace 
tridimensionnel: 


F =(x,y,Z) (30.42) 


or chaque coordonnée d'un objet en mouvement peut varier en fonction du temps comme: 
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Fr =(x(é),y(),z()) (30.43) 


Plutôt que cette notation un peu lourde en parenthèses... les physiciens notent fréquemment le vecteur 
position (ou vecteur d'espace) sous la forme d'un vecteur de 4 dimensions: 


- 3 dimensions spatiales 
- 1 dimension temporelle 
et nous écrivons alors: 
F =(x,y,Z,£) (30.44) 


et nous appelons alors ce vecteur un “"quadrivecteur d'espace-temps" dont les composantes sont les 
coordonnées généralisées du système. 


4.2. VITESSE 


Définition: La "vitesse scalaire", appelée aussi simplement "vitesse", notée v, est par définition la 
distance parcourue par un objet pendant une certaine quantité de temps: 


Lorsqu'un corps est en mouvement uniforme rectiligne, c'est-à-dire qu'il parcourt une distance donnée 
selon une dimension x, avec à = {12,3} en un temps toujours égal, le rapport précédent est constant 


dans le temps: 


ZX; è 
vy=i=c#* (30.46) 


Ê 


La "vitesse moyenne arithmétique" est définie comme étant le rapport de la distance parcourue entre 
un point de départ donné x;, à un instant #, et un point d'arrivée x;, à un instant £; : 


V = —————— = =C (30.47) 


Remarque: Il faut prendre garde lors de calculs de vitesses moyennes car il existe plusieurs types de 
moyennes en mathématique. (cf. chapitre de Statistiques)! Par exemple, il est fréquent d'utiliser la 
vitesse moyenne harmonique comme nous le montrons dans le chapitre de Statistiques. 


Ceci représente donc une moyenne (car nous ne nous intéressons pas de savoir comment le chemin 
entre x; et x; à été parcouru) mais nullement la vitesse instantanée du véhicule à un moment donné. 


Si nous désirons connaître la vitesse dite "vitesse scalaire instantanée" du véhicule en un point de sa 
trajectoire il faut faire passer le delta du temps # à un différentiel (cf. chapitre de Calcul Différentiel 
Et Intégral) tel que: 
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dt=t,-t=(4+e)-6 (3045) 
avec #£ quitend vers Zéro. 


Mathématiquement, nous notons cela correctement de la façon suivante: 


d=hmi#&+ei-# (30.49) 
50 
Ainsi, pendant une différence de temps infiniment petite, la distance parcourue sera également 
infiniment petite. Nous aurons donc: 


dx; =lim (xo +#)-Xjÿ (30.50) 


z—0 


et finalement: 


Si le corps étudié n'est pas en mouvement rectiligne dans un repère cartésien à trois dimensions alors sa 

position sera donnée par le vecteur {x,y,z) et nous noterons sa vitesse dès lors par: 

… [dx dy à TT 

= = —|- VV, ] =(5,ÿ,z) (30.52) 
dt dt dt 


Remarque: Si toutes les parties d'un corps se déplacent à la même vitesse et dans la même direction, 
nous avons alors un "mouvement de translation". Par contre, dans un "mouvement de rotation", les 
vitesses des diverses parties du corps ne sont pas les mêmes, en module et en direction (nous le 
démontrerons plus loin) et peuvent varier avec le temps. 


Attention ! Un mouvement ne peut être décrit que par rapport à un repère fixe: le mouvement absolu 
n'existe pas. Galilée avait déjà compris que: "Le mouvement est comme rien". Le mouvement n'existe 
pas en soi, mais relativement à autre chose. 


4.3. ACCÉLÉRATION 


Définition: "L'accélération scalaire", appelée aussi simplement "accélération", notée a, est par 
définition, la variation de la vitesse scalaire pendant une certaine quantité de temps telle que (nous 
passons directement à la limite): 


ou autrement dit: la vitesse avec laquelle évolue la vitesse. 


À nouveau, si le corps n'est pas en mouvement uniforme rectiligne nous aurons: 
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dv. dv 
3- v, 2 dl _( 
dt dt dt 


ape) = (5,55) (30.54) 


Si le corps est en mouvement rectiligne et uniforme (nous pouvons toujours généraliser à un 
mouvement non rectiligne) nous avons alors: 


x. 
V; Toy. dt = dr 
dé 


es) 


t t 
done > y, 4 HET =x| nd LPOPEe 
ù ù 
ù ù 


La constante est à déterminer en fonction des conditions initiales. Si la position initiale au temps zéro 
est nulle la constante sera nulle. Dans le cas contraire nous écrivons: 


Àx, = xp + v;' | (30.56) 


ce qui nous donne la distance parcourue par un corps pendant un laps de temps donné. 
Si le corps est en mouvement rectiligne et accélère constamment nous avons alors: 


dv. 
ä; = 6 à dt = dv, 
dt 


t t 
ja Are + = vf ta (80:57) 
û 
û 
DE -nG)=c +art-at = A =c*+aÂt 


La constante est à déterminer en fonction des conditions initiales. Si la vitesse initiale parcourue au 
temps zéro est nulle la constante sera nulle. Dans le cas contraire nous écrivons: 


Av, = V9 +4; 'Af (30.58) 
Nous voyons plus fréquemment cette relation sous la forme: 
6)=v, +a(é) 
ou encore majoritarement sous laf orme: 


V =VY ta'é| (3059) 


mais nous avons: 


dx 
1. =v +ta'it— dx =v,dt +a'tdt (30.60) 
Ê 


si nous intégrons cette relation, nous obtenons: 
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t t t 
fax = fa Li fa’ = Axe x, + vo + sa Af° (30.61) 
t 


Er En 


que nous retrouvons dans les écoles le plus fréquemment sous la forme: 


1 
x=Xx +vé+—a "sf? (30.62) 
0 0 > 


Cette relation donne la position d'un mobile en mouvement rectiligne et uniformément accéléré (dans la 
majorité des problèmes en physique on considère l'accélération constante ou en un point précis). De 
cette dernière, nous déduisons une très quantité de relations qui sont très intéressantes en physique 
aussi bien en considérant des cas idéaux que des cas réels. Effectivement, en la réarrangeant (alèbre 
élémentaire), il est possible d'obtenir l'accélération lorsque le temps pour atteindre une vitesse donnée 
est connu. On peut aussi calculer la distance qu'il faut à un mobile (toujours en mouvement rectiligne) 
ayant une accélération donnée pour atteindre une certaine vitesse. 


Le premier cas que nous considérons comme le plus connu, est la vitesse de chute à accélération 
constante d'un corps dans un milieu exempt de tout frottement (cas traité plus loin lors de notre étude 
de la tribologie). 


Comme nous l'avons déjà démontré précédemment, nous avons lorsque la vitesse initiale est nulle: 


V 1 2 
v=dg'éi=—-etx=—-ag'éÉ 
ä 2 


(30.63) 


Les deux relations combinées donnent (conformément à la tradition d'usage dans les écoles, nous avons 
remplacé le x par un h pour indiquer que la position est souvent assimilée dans la pratique à une 
hauteur): 


X = 


2 3 
(©) ELLE RSR CT (30.64) 
a 2? a 


Nous pouvons tirer de cette relation la vitesse de libération d'un astre (relation pratique quand nous 
étudierons le chapitre d'Astrophysique et intéressante pour comparaison lorsque nous étudierons la 
relativité générale): 


Supposons que vous savez déjà que deux corps s'attirent mutuellement avec une accélération selon le 
modèle classique de Newton (que nous démontrerons plus loin): 


Mis dans la relation de chute d'un corps y; = ,/2:4:} , nous obtenons: 


G' 
, m , 


v= [2 h (30.66) 


à la surface du corps attracteur principal nous avons donc la "vitesse de libération": 
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Nous pouvons répondre à partir de cette relation, à la question de savoir pourquoi certaines planètes du 
système solaire ont une atmosphère et d'autres pas (bon normalement il faut prendre en compte 
l'agitation moléculaire...) comme nous le verrons dans le chapitre d'Astronomie. 


Ce qui est aussi intéressant dans cette relation c'est que nous pouvons calculer quel doit être le rayon R 
d'un corps de masse m pour que sa vitesse de libération soit égale à celle de la lumière (allusion aux 
Trous Noirs). 


Nous avons dès lors: 


[4 - — À _. (30.68) 
À € 


Nous verrons dans le chapitre de Relativité Générale qu'après de relativement longs calculs dans un 
champ gravitationnel isotrope (métrique de Schwarzschild) nous retomberons sur cette relation. 


4.3.1. PLAN OSCULATEUR 


Les vecteurs vitesse v{f) et accélération &{f) liés à un point P en mouvement forment, à chaque 


instant t un plan appelé "plan osculateur" de la trajectoire (généralement curviligne sinon quoi le plan se 
réduit à une droite). 


Il est souvent utile de décomposer le vecteur accélération dans le plan osculateur suivant 
respectivement la tangente et la normale à la trajectoire: 


a =, + (30.69) 


où le premier terme du membre de droite est un vecteur parallèle à la vitesse et le deuxième un vecteur 
perpendiculaire à la vitesse et situé du côté concave de la trajectoire. 


Exprimons ces deux vecteurs (un exemple plus général est donné dans le chapitre de Géométrie 
Différentielle): 


Nous pouvons écrire que: 


dr dr ds > ns 
=—=—:—=7'y (30.70) 
dt ds dt 


Ÿ 
où ds est un élément courbe (l'abscisse curviligne) de la trajectoire et 7 un vecteur unité tangent à la 
trajectoire lié au point P. 

L'accélération s'écrit alors: 


. d5 déf'v) sdv, dT 
ä = — +y— (30.71) 
dt dt dt dt 


Le premier terme à droite de l'égalité est l'accélération tangentielle quant au second terme, même si la 
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vitesse est constante ce dernier apparaît dans l'expression de l'accélération pour exprimer le 
changement de direction de la vitesse. 


Décomposons le vecteur 7 dans la base orthonormée euclidienne 1? générée par la famille de vecteurs 
3,1: 


+} 
(] 
+} 


Nha, I? cos æ'i + ?|| sinæ'f=cosæ'i +sinæ'} (30.72) 
Ensuite, en dérivant par rapport au temps: 


dT _ . dæ- da -  — - da 
Do ee +cosæ@— j = (—-sin æ'i PER 
Ê ta 


dt dt 
| + . x| -ldæ 
= cos g+—/l'i tan æ+t—l';| — 


En comparant avec l'expression initiale du vecteur 7, nous voyons que les termes entre crochets 
ci-dessus sont les composantes d'un nouveau vecteur unité # perpendiculaire au vecteur 7, donc 
perpendiculaire à la trajectoire et dirigé vers le centre de courbure. 


De plus par la définition du radian, nous avons: 


27 (30.74 
dé R dt KR dt Rk 


où R est le rayon de courbure de la trajectoire. 


L'expression 47; 4t devient alors: 


Nous avons donc finalement (relation démontrée avec une autre approche dans le chapitre de 
Géométrie Différentielle): 


2 
2-4 x (077 
{ R 
où "l'accélération tangentielle" donnée par: 
= VF Go78 
Ag pr" (50.76) 


est un terme qui exprime la modification de l'intensité de la vitesse sur la trajectoire du point P et où 


"l'accélération normale": 
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_ vi 
d, 7 


"_R 


est un terme qui exprime le changement de direction du point P sans que nécessairement ce dernier 
change donc de vitesse! Communément cette dernière relation est assimilée à la "force centrifuge" 
(centrifuge signifiant: qui fuit le centre")!! 


Remarque: La force centrifuge est considérée en physique comme une force fictive car au fait ilne 
s'agit pas d'une force qui tend à nous éloigner d'un centre de rotation mais c'est juste qu'il y a une 
force qui n'est plus suffisante (la force de frottement dans le cadre d'un manège ou gravitationnelle 
pour des planètes) pour nous empêcher de suivre une trajectoire en ligne droite par simple inertie. 
Raison pour laquelle lorsque nous sommes éjectés d'un manège nous partons tangentiellement à sa 
rotation et non pas perpendiculairement à celle-ci. 


Nous constatons immédiatement que si 4, = 0 le mouvement est forcément rectiligne, accéléré ou non, 


tandis que si 4, # O la trajectoire est nécessairement incurvée. 


5. PRINCIPE DE RELATIVITÉ GALILÉEN 


Définition: Il est impossible pour un observateur animé d'un mouvement uniforme de savoir s'il se meut 
par rapport à son environnement ou bien à l'inverse si l'environnement se déplace par rapport à lui 
(nous ne pouvons pas distinguer le repos et le mouvement à vitesse et direction constantes). Dès lors, il 
ne peut exister de référentiel absolu (ou privilégié) qui puisse être considéré comme fixe vis-à-vis de 
tous les autres repères galiléens ce qui signifie clairement que tous les repères galiléens doivent jouir du 
même statut en mécanique puisqu'ils ne peuvent être distingués les uns des autres. Ce principe est 
nommé le "principe de relativité galiléen". 


Ce principe, (à ne pas confondre avec le principe de relativité restreinte car les hypothèses de départ 
diffèrent un tant soit peu...) découle directement de l'étude de ce que nous nommons la "transformation 
de Galilée". 


Définition: Une "transformation de Galilée" est une suite d'opérations mathématiques sur une loi 
physique qui permet de déterminer les propriétés d'une ou plusieurs "observables" (vitesse, force 
quantité de mouvement, etc.) lorsque nous passons lors de l'étude d'un phénomène physique d'un 
référentiel à un autre référentiel: l'un supposé au repos, et l'autre en mouvement uniforme. 


La question à l'origine historique était de répondre s'il est plus légitime d'étudier un phénomène dans un 
référentiel ou dans un autre. Plus exactement, nous souhaitons déterminer si la forme des lois physiques 
gardent les mêmes formes algébrique quelque soient les référentiels dans lequel nous les étudions. 


Voyons cela d'un peu plus près: 


Soient deux référentiels en mouvements l'un par rapport à l'autre à une vitesse constante &{u,,u,,u,). 
Pour un certain référentiel cartésien {X,ÿ,7) au repos (ou supposé tel) nous allons poser le deuxième 

référentiel (xX',ÿ",7) de façon à ce qu'il soit aligné avec l'axe des x afin de simplifier les calculs avec 

ä(u, ,0,0): 
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Zz 


X 


Figure: 30.6 - Exemple de référentiel en mouvement par rapport à un autre 


Nous allons également mettre dans le deuxième référentiel en mouvement, un point matériel 5 de 
coordonnées Fix! y'z". 


Remarque: Nous supposerons connu le concept de "quantité de mouvement" p défini plus loin avec 
rigueur. Rappelons donc dès lors que la quantité de mouvement du point P animé d'une vitesse 


er. el 


v (norme) dans (x',ÿ',7") est alors donnée par: 


p'=m'v' (30.80) 


Nous avons alors en appliquant les relations classiques de la cinématique: 


rep N es =Z 
É'=im = m 


x! 
Dp,=Mm, ne 


d(x-u,t) dx du, di dx 

——— = nl —-—ti-—u,|=m|—-0'i-l'u, 
dt dt dt dt dt 
dx 

ml—-u,|=mlv, -u 
dt (v, 1 


(30.81) 


d'où v', = v, -4, et donc (nous supposons connu le concept de "force" défini plus loin avec rigueur): 
— = x ==! an En À on () (30.82) 


Le résultat obtenu est donc fort intéressant puisque la deuxième loi de Newton garde exactement la 
même forme, et la même valeur dans les deux référentiels. Le fait que nous nous déplacions ou pas à 
vitesse constante ou pas n'a donc aucune influence sur notre vision du monde qui reste exactement la 
même. 


Conséquence: Puisque les forces sont identiques, aucune expérience de mécanique ne peut déterminer 
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si un référentiel galiléen est le repère absolu (autrement dit deux observateurs, dans deux référentiels 
galiléens différents, ne peuvent à l'aide d'une expérience de mécanique déterminer lequel se meut par 
rapport à l'autre). 


Donc, en mécanique classique, il n'existe pas de référentiel galiléen absolu! 


Toutefois notons bien que ce résultat est obtenu en supposant que: 


D er LE 
dt dt A 


c'est-à-dire que nous imposons que la vitesse relative est uniforme (constante) et la masse constante et 
surtout, que £=$". 


Mais au fait, cette transformation est fondamentalement fausse comme nous le verrons plus en détail 
lors de notre étude de la relativité restreinte (cf. chapitre de Relativité Restreinte), Effectivement, soit 
un objet se déplaçant le long de l'axe avec une vitesse v mesurée dans le repère primé: 


x'= vf" (30.84) 


quel sera alors sa vitesse w dans le repère non primé? Si la transformation de Galilée est 
fondamentalement vraie, il suffit de remplacer dans la relation précédente x' et t' par leurs expressions 
en fonction de t : 


x ui = vt Où x =(u+v}é (30.85) 
soit (loi d'addition des vitesses): 


dx  . 

W=—=x+y (30.86) 

dt 
Seul petit hic. une expérience simple impliquant des rayons de lumière fut réalisée au début du siècle, 
et montra que cette loi était fausse. Cette expérience dite de "expérience Michelson-Morley" 
bouleversa à tout jamais notre vision du monde... et amena Albert Einstein à développer la théorie de la 
relativité restreinte en imposant que la vitesse de la lumière quel que soit le référentiel est toujours 
constante (cf. chapitre de Relativité Restreinte): 


Remarque: Si nous mesurons les vitesses et autres grandeurs vectorielles, nous trouvons que les 
résultats de mesures des composantes x', y', z', t' ne sont pas identiques à celle obtenues sur x, y, z, t. 
Elles varient avec le système d'axe. Connaïissant ces valeurs dans un repère, nous pouvons passer 
aux valeurs dans l'autre repère: il s'agit de la "covariance" (co-variance: variance avec les 
coordonnées), ici pour les expressions vectorielles. 


Les lois sont des relations entre des observables, relations déduites d'observations nombreuses. 
La recherche des lois est régie par ce que nous pourrions appeler un "principe de simplicité": lois en 
nombre le plus petit possible, expressions les plus simples possibles entre grandeurs en nombre minimal. 
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Mais la caractéristique d'une bonne loi est la covariance lors d'un changement de repère. Cette 
invariance lors d'un changement de repère, cette invariance de la forme (de l'expression littérale) de la 
loi va permettre d'objectiver au maximum et, en principe totalement, la physique. 


La physique (dans le sens de la théorie qui décrit la réalité) ne sera plus liée à l'observateur ni à son 
espace-temps galiléen associé. Bien sûr cette covariance sera recherchée pour les transformations de 
référentiels en mouvement les uns par rapport aux autres. 


Un contre-exemple simple cependant: la force entre deux charges électriques immobiles dans un 
référentiel ne fait appel dans ce référentiel qu'à la seule théorie de l'électrostatique. Si ce même système 
est observé d'un référentiel en mouvement par rapport au premier, il faudra décrire l'ensemble à l'aide 
de la théorie de l'électromagnétisme. 


Par construction même la mécanique classique se trouve être covariante par transformation de Galilée 
(changement de repères galiléens): le postulat de la dynamique (force) prend en effet la même forme 
dans les différents référentiels galiléens comme nous venons de le voir. 


6. MOMENT CINÉTIQUE 


Définition: Le "moment cinétique" ou "moment angulaire" 3 par rapport à un point © d'une particule 
de masse m se déplaçant à la vitesse » en F est défini par: 


es 
… 


b=rxp 


avec ? étant la quantité de mouvement (voir la définition plus loin) donnée par: 
P = 


Par sa définition, le moment cinétique est un vecteur perpendiculaire au plan contenant les vecteurs F 
et à et si la particule se déplace dans un plan, la direction de & est constante mais pas nécessairement 
de même sens. 


Un cas particulier mais important en mécanique et astronomie du calcul du moment cinétique est le 
mouvement circulaire (plan) de rayon r. Dans cette situation, le "rayon-vecteur" F est alors toujours 
perpendiculaire à la direction du vecteur-vitesse ÿ et donc: 


b = né x 5 |b]= ver = mar = E = mr°à 


Nous voyons apparaître ici la définition du "vecteur rotation" & également noté parfois (à tort) &. 


Pour un mouvement plan mais non circulaire (comme une conique par exemple!), nous introduisons les 
composantes normale et tangentielle de la vitesse: 


pour obtenir (de par les propriétés du produit vectoriel): 
b= mr x(P, +7,)=mPXP, 


LA 


et sous forme scalaire: 
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ä 8 
b=mrv, =mr?=— (30.93) 


” dt 
où r est dès lors appelé le "rayon de courbure" de la trajectoire. 


Etudions maintenant la dérivée du moment cinétique: 


RL Le? 2 PEL EE ENET 
dé dé dé dé 


—X p=vXmv = 0 (30.95) 
dt 
et d'autre part: 
2 d ion 
FX =FrXxA (30.96) 
£ 
Ce qui nous donne finalement: 
de _ FxÆF=M| (30.97) 
£ 


La dérivée par rapport au temps du moment cinétique d'un mobile ponctuel est donc égale à ce que 
nous définissons par le "moment de force" jf sur lequel nous reviendrons plus loin et qui a comme 
unités celle de l'énergie et est un vecteur perpendiculaire au plan formé par F et F (par construction du 
produit vectoriel!). 


Remarques: 


R1. Cette dernière relation fait que nous appelons parfois le moment cinétique aussi "moment de la 
quantité de mouvement". 


R2. Il faut bien sûr prendre garde au fait que (cf. chapitre de Calcul Vectoriel) Fx F2 Fxr. 


Ce qui est fortement impressionnant dans ce résultat (variation instantanée du moment cinétique), est 
que tout corps ayant un moment cinétique non nul et soumis à aucun moment de force, conserve 
l'orientation et la norme de 3 dans l'espace et le temps. 


Ce résultat va nous permetre d'étudier la dynamique du gyroscope et de tous les autres corps ayant des 
propriétés similaires (comme la Terre qui tourne sur elle-même et qui pointe sur l'étoile polaire ce qui 
est un facteu important de l'origine des saisons!). Nous étudierons plus loin le gyroscope et ses 
propriétés, car son comportement est fascinant et les résultats théoriques en découlant trouvent des 
applications en astrophysique, physique atomique et même en philosphie. Effectivement, la 
conservation de l'orientation du vecteur moment cinétique amène à considérer que même si l'espace 
était totalement vide de son contenu dans l'ensemble de l'Univers et contenait un objet ayant un 
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moment cinétique, l'espace vide a toutefois une propriété qui permet à l'objet en question de savoir où il 
doit s'orienter. Ce qui est assez déroutant! Donc l'espace vide ce n'est pas rien sinon par rapport à quoi 
tourne l'objet dans le vide? Il tourne par rapport à l'espace lui-même! 


Nous avons également: 


Le 


b = (ifat 
l 


où l'intégrale s'appelle "l'impulsion de rotation" et la relation précédente porte quelquefois le nom de 
"théorème du moment cinétique" (nous verrons une généralisation de ce théorème lors de la 
démonstration du théorème de Kôünig). Il s'énonce ainsi: 


L'impulsion de rotation fournie par un moment de force entre les instants #, et £, est égale à la variation 


du moment cinétique durant cet intervalle de temps. 


En dynamique du solide ce théorème joue un rôle fondamental, analogue à l'équation de Newton 
F =#»#x en dynamique du point. 


L'utilisation du moment cinétique permet de montrer facilement la loi des aires (deuxième loi de 
Kepler), qui joue un rôle important dans la compréhension du mouvement des planètes ( 

ie) ou encore de montrer que dans un système Terre-Lune isolé, le moment cinétique total 
devant être conservé, si la Terre ralentit sa rotation et la Lune la garde constante, cela oblige la Lune à 
augmenter sa distance par rapport à la Terre. 


Voyons cela: 


Imaginons une particule en mouvement sous l'action d'une force À constamment parallèle à 7. Nous 
dirons que cette force est une "force centrale" si sa direction passe constamment par un même point 
fixe, appelé le "centre de force". La grandeur de la force ne peut donc plus dépendre que de la distance 
au centre de la force (dans le cas d'un champ de force). 


Dès lors: 


Donc le moment cinétique par rapport au centre de force est constant si la force est centrale. La 
réciproque est aussi vraie: si le moment cinétique est constant, sa dérivée par rapport au temps est nulle 
et la direction de la force est toujours colinéaire à 7 donc la force est centrale. 


Par exemple, dans le cadre du mouvement d'une planète autour du Soleil ou d'un électron autour du 
noyau de l'atome (dans le cadre du modèle de Bohr) le moment de cette force par rapport au centre est 
évidemment nul puisque qu'aucun élément extérieur n'agit sur le système, c'est-à-dire en se basant sur 
le schéma ci-dessous: 
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nous avons alors: 


donc: 


bmrFxXmymst (30101) 


D'autre part, l'élément de surface 45 décrit par le mouvement du rayon F vaut (selon la figure 
ci-dessus et la propriété du produit vectoriel): 


a$ = =(FxdF) (30.102) 
donc: 
dS  1(. le 
— ==|Fx—|=2{Fxÿ) (80.103) 
dé 2 dé 2 


= = —(FXm ÿ) =£g#*]) (30.104) 


Conséquences: 


1. La vitesse aréolaire est constante, c'est-à-dire que les aires balayées en des temps égaux sont égales. 
C'est la loi des aires de Kepler (cf. chapitre d'Astronomie)! 


2. Le plan 7, est fixe car ÿ xym° 5 = #**. Donc la trajectoire, d'une planète dans un cadre idéal par 
exemple, est plane. 
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6.1. MOMENT DE FORCE 


Nous venons de voir que le "moment de force" se définissait par la relation (variation temporelle du 
moment cinétique): 


es 


M=FxÆ| (30.105) 


où jf est donc le moment de la force À par rapport au point d'origine du vecteur F . Il est important 
de remarquer que le moment de force a les unités d'une énergie et est donc perpendiculaire à F et F 
par construction! 


Il faut aussi remarquer qu'augmenter le rayon d'application en diminuant ainsi la force pour garder un 
moment de force constant dans un système mécanique permet certes de diminuer l'effort (la force) mais 
au final pas l'énergie dépensée puisque la distance parcourue est alors plus grande. 


Si nous exprimons le module de jf, de par la définition du produit vectoriel, nous obtenons: 
We-fALFt sa fPLS coco 
Il apparaît une grandeur: 
b=|rlsine (0107 


qui est par définition le "bras de levier" de la force Æ et dont l'emplacement est donné par l'axe de 
rotation du corps due au moment de force résultant (attention à ne pas confondre ce b avec la notation 
du moment cinétique!). 


Attention! Le principe des bras de levier est donc un fantastique démultiplicateur de force mais en 
aucun cas il démultiplie le travail! 


Exemples: 
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Figure: 30.8 - Exemple de quelques bras de levier de tous les jours 


Le cas d'application des changements de roues d'hiver/d'été est très connu par les automobilistes 
puisqu'il est recommandé par la majeure partie des fabricants d'appliquer un couple de 120 [Nm] pour le 
serrage des boulons. 


Pour qu'un corps étendu, soumis à des forces À À vs À soit en équilibre total, il ne faut ainsi pas que 


uniquement la résultante de ces forces soit nulle (pas de translation) mais que la résultante des moments 
soit nulle aussi (pas de rotation). Soit: 


=, É _.. 
DÆ=0et Sd M, =0 (30.108) 
il il 


Lorsque les composantes d'un système satisfaisant aux deux relations ci-dessus sont connues, nous 
parlons alors de système "isostatique". 


Par définition, un "couple" est défini comme un ensemble de deux forces de grandeur égale mais de 
direction opposée, agissant suivant deux droites parallèles sur un même corps étendu. La résultante des 
forces bien évidemment nulle, indique que le couple ne produit aucun effet de translation. Mais la 
somme des moments étant non nulle, le corps subit une rotation telle que: 


M=nxA+AxF=nxA-nXxE=(n-2R)XA =bXxEF (0109) 


Signalons encore la composition de moments de force avec le cas ultra-classique suivant: 
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Figure: 30.9 - Moments de force élémentaires 


pour lequel il est assez évient que le moment de force résultant a pour composante de force la somme 
des deux forces élémentaires: 


FR=Æ+Æ (20.110) 


Pour le calcul de la distance résultante, nous allons utiliser le théorème du centre de masse qui comme 
nous l'avons vu plus haut et dans le chapitre de Géométrie Euclidienne est dans le cas général: 


_ ÿax 
Om Grid 


Da 


il 


et donc cans la situdation ici présente se réduit à: 


Rated 


R+E (21.112) 


Nous avons donc au final le moment résultant qui est: 


A d+Eé - 


MR=FR d=iA# +F 
R R ES | 2) A+F, 


=A.-d+F.d2 (21113) 


Ainsi, la résultante de moments de forces est la simple somme des moments de force élémentaires. 
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Figure: 30.10 - Moment de force résultant 


Maintenant que nous avons convenablement défini ce qu'était une force et un moment de force, nous 
pouvons de suite aborder l'étude de la statique des forces: 


6.2. STATIQUE DES FORCES 


La statique des forces est un domaine difficile à généraliser. La plupart des ouvrages se servent de 
nombreux exemples (comme les systèmes de poulies, les leviers, les équilibres, les frottements, etc.) 
afin d'amener le lecteur à assimiler la méthode d'analyse qu'il faut pour résoudre les problèmes relatifs à 
ce domaine de la mécanique classique. Loin d'être contre cette méthode, nous n'avons pas souhaité 
nous restreindre ou nous étendre (suivant les points de vue) à des exemples particuliers, mais avons 
préféré proposer une méthode d'analyse qui fonctionnerait à coup sûr. 


Définitions: 


D1. La "statique des forces" est le domaine de la physique qui étudie l'effet de la résultante de forces 
(ou moments de force) constantes au cours du temps, appliquées sur un corps ponctuel ou étendu. 


D2. Quand la somme vectorielle de toutes les forces et moments de force est nulle, il n'y a aucun 
mouvement. Nous parlons alors d'un "équilibre statique" (mais les forces existent tout de même à 
l'intérieur du système) tel que les forces et moments de forces se compensent mutuellement: 


DA = Ô ou/et DA =0 (30114 


il il 


Remarque: Les relations précédentes, nous montrent bien que ce n'est pas parce qu'un système est à 
l'équilibre statique qu'il n'est soumis à aucune force (la somme vectorielle des forces peut s'annuler 
mais les forces sont non nulles). 


Corollaires: 


C1. Lors de l'analyse d'un système de statique des forces, il faut toujours (!!!) travailler avec les 
composantes vectorielles des forces et moments de forces (de par la première loi de Newton). 


C2. Il faut donc s'imposer un repère par rapport auquel seront exprimées toutes les composantes de 
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forces: 


- Dans le cas d'un corps ponctuel sur lequel sont appliquées des forces, il faut assimiler l'origine du 
repère à la position du point. 


- Si les lignes de prolongement de toutes les forces sur un corps étendu sont toutes concurrentes en un 
point donné, le système peut être considéré comme un corps ponctuel ramené à ce point. 


- Si le corps est étendu et plongé dans un champ de forces (gravitationnel, électrostatique, 
magnétique...) isotrope, coplanaire et constant dans le temps, l'ensemble des forces imprimées peut se 
rapporter au centre de gravité. 


Démonstration: 


Nous avons vu lors de l'étude du calcul vectoriel (cf. chapitre de Calcul Vectoriel) que la somme des 
vecteurs d'un même ensemble, mis bout à bout (au niveau de la représentation imagée) ou additionnés 
algébriquement constitue ce que nous appelons la "résultante" du système de forces ou de moments de 
force: 


LA _ L # er 
8 SF ou/et kg = Sd Mi (30.115) 
il il 


Il est clair qu'un point matériel est donc par définition à l'état statique si la résultante des forces 
concurrentes est nulle. Ainsi, un corps ponctuel est au repos (vitesse constante nulle) si la grandeur A 


est nulle (voir les lois de Newton plus loin). 


Cette condition ne suffit cependant pas pour un corps étendu (non ponctuel): celui-ci peut ne pas se 
déplacer (pas de mouvement par translation), mais tourner sur lui-même par application de forces en 
dehors de son centre de gravité (les forces sont alors des moments de forces agissant sur des points du 
corps en question). 


Imaginons maintenant un ensemble de forces Ë , Chacune d'elles appliquée en un point de vecteur- 
position > d'un mobile étendu et toutes parallèles à une direction commune donnée, repérée par un 
vecteur unitaire &%. La résultante de ces forces est alors: 


k;, Dx: Yre-[S ae (30.116) 


EI FI EI 
Remarque: La norme de la résultante est donc: 


# 
EAË dE (30.117) 
il 


De manière analogue, la somme vectorielle des moments parallèles s'écrit: 


es _ L. # 
ke = UE xË =D AX(A) = x) (30.118) 
il il 


i il 
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Recherchons maintenant, la position 7,, d'un point fictif C, appelé le "centre des forces" tel que le 


moment de la résultante ke appliquée au point C soit égal au moment total A: En d'autres termes, 7, 
doit être la solution de l'équation vectorielle: 


es 


R3=reXRp (80.119) 
S'il est possible de trouver un tel point C, nous ne devons donc plus, en principe, calculer le moment 
individuel de chaque force et en faire la somme vectorielle. Il suffit plutôt, de déterminer la résultante 


LA et d'évaluer son moment résultant appliqué au point fictif C. 


En combinant les relations précédentes, nous avons: 


x x 
Ra Fe * re (ÿnr)- Sa]r«s (30.120) 


d'où nous tirons finalement: 


comme À = #4, (deuxième loi de Newton) supposons maintenant (cas particulier) que 5, .j,a; =a; 


nous pouvons alors écrire ce résultat très important: 


OIC.Q.F.D. 


C3. De par la troisième loi de Newton, tout corps solide rigide en équilibre stable, en contact avec un 
ensemble de corps solides rigides en équilibre stable eux aussi, subissent tous une force égale identique 
en chaque point de contact (identiquement répartie) mais opposée par ces derniers (assimilable et 
passant par leur centre de gravité lorsque c'est un champ de vecteurs isotrope et constant qui est à 
l'origine du contact). Ainsi: 


- les repères des forces d'action/réaction doivent être placés sur les différents points de contact lorsque 
ce sont une quantité dénombrable de forces qui en sont à l'origine. 


- les repères des forces d'action/réaction doivent être placés au centre de masse ou de gravité si les 
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forces à l'origine du contact (in extenso: de l'accélération) sont à l'origine d'un champ vectoriel 
gravifique, respectivement électrostatique/magnétique. 


7. BALISTIQUE 


Le mouvement parabolique est le mouvement d'un mobile animé, dans le champ de la pesanteur, d'une 
vitesse de translation ÿ, non parallèle à l'accélération de la pesanteur £. Par exemple un projectile 


possédant au départ une vitesse %, inclinée d'un angle £ par rapport à l'horizontale. 


Figure: 30.11 - Exemple de trajectoires balistique 


En l'absence de pesanteur et de frottement le mobile P suivrait la ligne de visée indéfiniment. L'action 


l 
de la pesanteur est de le redescendre, au temps t, de la valeur connue > g?. 


Nous posons la projection sur les axes: 
+ cu l'a+ 
FE)=vcos(f)'£'i FORMES er )j (30.124) 


combinaison d'un déplacement régulier selon x et d'un mouvement de chute avec vitesse initiale v,, 


selon y. Ce qui correspond aux équations suivantes: 
ER 
x) = vcos(8)é et y) = v, sin( 8} - je G0125) 


en éliminant le temps entre ces deux équations nous obtenons la trajectoire (équation d'une parabole): 


E 2 


= x'tan  ———— À 
d (6) 2vi cos’ (6) 


(30.126) 


qui avait déjà été obtenue par Galilée au début du 17ème siècle. 


Nous calculons ainsi la portée x, du projectile en posant y = 0 dans l'équation ci-dessus et nous 
obtenons facilement: 
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L 


ca | 


X4 sin(2#) (30.127) 


la solution + = 0 n'a aucun intérêt. 
La hauteur maximale »,,, peut être calculée en annulant la dérivée de l'équation de la trajectoire. 
Ainsi nous obtenons facilement: 
2 
w . 
Yax = sin? # (30.128) 

28 
Nous remarquons pour la portée maximale que pour une vitesse initiale donnée et un objectif x, à 
atteindre nous avons deux cas typiques dans la pratique: 


1. Nous nous sommes donné une portée maximale x, inaccessible car il n'est pas possible que 
sin(2 8) > 1. 


2. Une seule valeur $ = x/4 donne la portée maximale possible pour une vitesse initiale donnée. 


La courbe enveloppant toutes les paraboles, tracée pour une vitesse v, donnée dans toutes les 


directions possibles, est encore une parabole, appelée "parabole de sûreté". Sa rotation autour de l'axe y 
engendre un paraboloïde qui circonscrit (contient) la région de l'espace seule accessible aux projectiles. 


parabole de sûreté 


Figure: 30.12 - Illustration de quelques paraboles de sûreté 


Ainsi, il n'est pas trop difficile de trouver l'équation de cette parabole de sûreté: 


Le tir à la verticale & = x7/2 nous est connu et est donné par 
L'T 
Vo = N2'E' Ya © Ya = —— (30.129) 
28 


La portée maximale est quant à elle donnée par: 
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Donc quand x = x, = y = 0 tel que: 


qui est l'équation de la parabole de sûreté. 
8. CINÉMATIQUE DE ROTATION 


Les mouvement circulaires, appelés aussi "mouvements de rotation", décrivent donc la rotation d'un 
objet autour d'un axe (ou d'un point pour faire plus simple). L'usage veut qu'on le définisse par les 
données suivantes: 


- la direction de l'axe du plan de rotation dans l'espace 
- le sens de rotation sur le cercle de rayon constant autour de cet axe 
- la vitesse de rotation v 


tout ceci se résume avec la figure suivante: 


Figure: 30.13 - Illustration de quelques paraboles de sûreté 


où nous avons utilisé la relation démontrée dans le chapitre de Trigonométrie: 
diz Rd8 (30.132) 
Nous résumons ces trois indications par la donnée d'un vecteur "vitesse angulaire" instantanée: 


&=æ'r (30.133) 
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Le sens de rotation est dit positif lorsque, le pouce dressé dans la direction du vecteur unitaire #, nous 
saisissons l'axe de la main droite et que l'on voit tourner l'objet dans le sens des quatre autres doigts. 


La norme de la vitesse angulaire instantanée, représente l'angle parcouru par unité de temps, par l'objet 
qui se déplace dans le plan perpendiculaire au vecteur unitaire x: 


_d8 


D =— 
dé 


Bien évidemment, il va de soit que la vitesse angulaire est donnée en radians par seconde et non en 
tours par minute ou en degrés par seconde. Il faut donc prendre garde à toujours faire la conversion 
qu'il convient! 


Remarques: 


R1 Dans le cas général du mouvement circulaire, la vitesse angulaire de l'objet étudié varie au cours 
du temps: &{f). 


R2. Lorsque la direction de l'axe change, les composantes du vecteur unitaire #{£) sont également 
des fonctions du temps. C'est le cas d'une roue de moto dans un virage. 


Suite à la demande d'un lecteur, avant d'aller plus loin, remontrons que nous avons bien: 

diz Rd (30.135) 
En tournant d'un angle 48, un point de l'objet situé à une distance R de l'axe de rotation décrit un arc 
de cercle de longueur: 


Î = ran(9)=r fe À À. 


où nous avons utilisé le développement en série de Maclaurin (cf. chapitre de Suites Et Séries). 
Donc dans le cas des petits angles: 

Î=R'89— dd = R'd8 (30.137) 
Si dt est le temps nécessaire à ce mouvement, la vitesse curviligne du point est donc bien: 


Y _ he = @'ÀR (30.138) 


dt dé 
nous retrouvons alors le résultat déjà donné plus haut. 


Faisons maintenant de même que lorsque notre étude du mouvemement retiligne uniforme et 
déterminons la position angulaire en fonction du temps. Nous avons alors: 
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- 48 = d8 = œdt (30.139) 
dé 


Il vient alors: 
9 t 
(d8=-[at—8-4=-at-æ# (20140 
% fo 


et si # = 0, nous avons alors: 


g = Cr + æét | (30.141) 


à comparer avec la relation équivalente entre position et vitesse obtenue lors de notre étude de la 


cinématique rectiligne. 


Maintenant, considérons la définition de "l'accélération angulaire" (dont la notation traditionnelle un 


peu malheureuse.….): 
aæ 
Œ=—— (30.142) 
dt 
Nous avons alors: 
aæ 
æ= es = d@= dt (30.143) 
FA 


et donc: 


t 
de=|adt—e-m=-g (20.14) 


etsi # = 0, nous avons alors: 


& = &h + (30.145) 


Ce que nous pouvons noter: 
48 
— = h + @é (30.146) 
dt 


Il vient alors: 
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t t t 
(48 = [apat+ fœdt (30147) 
h  $ f 


soit: 
— & = = l(2-2) Go145 
9-6 = lié DSP Q) ©- 


etsi # = 0, nous avons alors: 


2 


1 
8(4\=% ae” (30.149) 


à comparer avec la relation équivalente entre position, vitesse et accélération obtenue lors de notre 
étude de la cinématique rectiligne. 


Intéressons-nous maintenant à l'aspect vectoriel du mouvement circulaire qui sera extrêmement 
important un peu plus loin et aussi dans de nombreux autres chapitres. Ainsi, donnons nous un repère 
euclidien orthonormé tel que: 


trajectoire 
circulaire 


X 


Figure: 30.14 - Exemple de mouvement circulaire autour d'un axe 


Nous voyons bien sur cette figure que: 
F@lsinaæ=r (0150 
Donc finalement nous avons: 


v=æR=@fr@l sina-[&l Fall sine (Go151 
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Nous voyons alors que nous avons affaire à un produit vectoriel tel que: 


v=&@xr(t) (30.152) 
Nous avons donc: 
. dv di&xr) d& _ _. dr 
= —=— = — x +Èx— 
dt dt dt dt 
que nous écrivons également: 
a=a, ta, (30.154) 


L'accélération du mouvement circulaire est formée dans le cas général, de deux termes, le premier étant 
"l'accélération tangentielle" exprimant toujours la variation de la vitesse sur la trajectoire et le deuxième 
l'accélération perpendiculaire le long du rayon appelée également "accélération centripète" (centripète 


signifiant: "qui tend à rapprocher du centre"). 
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Remarque: Si nous exprimons le mouvement circulaire du point P à partir d'un système d'axes 
situés dans le plan de la trajectoire, pour simplifier, alors, la position du point P est donnée par: 


ré) =r'cos(@)'i +r'sin(@)'} -rranferr 2]: +r'sin(@) j (30.155) 


Ce qui montre que le mouvement circulaire peut être considéré comme la superposition de deux 
mouvements sinusoïdaux déphasés de x} 2. Mais si nous écrivons: 


5 L FT Lu ‘ — L 
ré =n'san [e + =] i+n'sin(@)"} (30.156) 
ce qui est tout à fait envisageable pour une trajectoire imparfaitement circulaire et que que nous 


regardons les différentes caractéristiques paramétriques: 


x = Asin(@,f) 
. (30.157) 
y = Bsin(@,f+@) 


en faisant varier le déphasage & et le rapport &, / &, nous obtenons des courbes que nous appelons 
des "figures de Lissajous": 


æ{æalg0 a/8 nf4  n/B  n/2 En/8 3n/4 ?n/B ñ 


x 


CR PCA 
2 + 
y C4 Ÿ 


AAA Re 
US Reset LR 
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Le lecteur retrouvera des applications pratiques très importantes de la cinématique du mouvement 
circulaire pour l'industrie relativement à la mécanique dans le chapitre de Génie Mécanique (section 
Ingénierie). 


9. TRAVAIL ET ÉNERGIE 


Si un point de masse m subit un déplacement élémentaire 4F sous l'effet d'une force À, cette force 
effectue un travail élémentaire valant par définition: 


à = FodF (30.158) 


Si cette masse m est déplacée d'un endroit À à un endroit B, le travail total est: 


2 
Wir = + (30.159) 


Pour les unités, nous avons: 
[W]=Nim=J 
où J est le première lettre de "Joules". 


De la définition ci-dessous nous pouvons rapidement déduire le travail d'un moment de force (ou 
autrement dit: le travail d'une force dans un mouvement de rotation) puisque sur un élément 
infinitésimal de déplacement, nous avons: 


dW=Fxr. d8=M.d8 (30.160) 


Donc dans le cas d'un mouvement circulaire le travail d'un moment de force sera: 


2 
Wap = | M-48| (30.161) 


84 


Remarques: 


R1. Si West positif le travail est dit "travail moteur". Dans le cas contraire il est dit "travail 
résistant" (exemple: le freinage). 


R2. Si la force F est constante en grandeur et en direction (cas de la pesanteur au voisinage de la 
surface terrestre), l'intégrale du calcul de W prend une forme plus simple: 


B B 
Wiz = te For; —Fa) (30.162) 


Ce résultat montre que le travail ne dépend alors que des positions initiale et finale et pas du chemin 
parcouru. Le travail de la pesanteur est un cas particulier de ce type. 
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9.1. ÉNERGIE CINÉTIQUE 


La loi de Newton À = 3 est applicable le long du chemin A-B. En l'utilisant dans l'expression du 
travail il vient: 


an % dÿ À dÿ . 
Wan = (Fodr={m—odr =[m—ovdt=m{vody (30.163) 
dt dt 


et, en développant le produit scalaire au moyen des composantes, nous aurons: 


3 
F2 ne le +v,dv, + v,dv,) = smb *Y +) - sm - sm = E (B)-E, (4) 


(30.164) 


Lorsqu'un corps se déplace sous l'action d'une force résultante À quelconque, le travail de cette force 
d'accélération sur un chemin quelconque À, B est égal à la variation d'énergie cinétique du corps: 


Par définition, la relation: 


1 2 


E, =—mv| (30.165) 


est appelée "l'énergie cinétique" et elle se mesure en "Joules" (ou d'autres unités dérivées exotiques 
dont les physiciens théoriciens abusent parfois un petit peu trop...) et est toujours positive en mécanique 
ou n'importe quel autre domaine de la physique. 


L'équation: 

Win = E(B)-Æ (A) (30.166) 
porte quelquefois le nom de "théorème de l'énergie cinétique”. 
9.1.1. MOMENT D'INERTIE 


Pour un solide rigide tournant autour d'un axe à la vitesse angulaire &, l'énergie cinétique élémentaire 
d'un point quelconque de masse dm, situé hors de l'axe, vaut: 


dE 


= nr Lax ram = air ‘sin &)? dm = Leo r)dm (20.167) 
2 2 2 2 
puisque & et > sont perpendiculaires. L'énergie cinétique totale est alors: 


E, = (de = = & [ram (30.168) 


Nous avons pris l'habitude en physique de noter cette dernière relation: 


E. =-@J| (30.169) 
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où par définition, le "moment d'inertie" est: 


J = fr dre (30.170) 


Exemples: 


E1. Calculons la vitesse finale d'une boule chutant sur un plan incliné de frottement non nul (elle va 
donc tourner) dans un champ de potentiel gravifique. 


La réponse du néophyte en physique sera souvent obtenue en ne considérant que l'énergie cinétique 
mais pas la vitesse de rotation de la boule. Or, nous devons prendre celle-ci en compte via son moment 
d'inertie. 


Nous avons donc l'énergie cinétique totale étant l'énergie cinétique de translation du centre de masse 
plus l'énergie de rotation autour de ce même centre de masse: 


en égalant cette valeur à l'énergie potentielle gravifique (voir plus loin) et en supposant une vitesse 
initiale nulle de la chute, nous avons: 


1 I 
mgh = va É + re) (30.172) 
2 Fr 


Soit la vitesse acquise au bas du plan (frottement de roulement non-compris…): 


et nous avons démontré dans le chapitre sur les Formes Géométriques que le moment d'inertie d'une 
boule pleine était: 


2 


Je =—m#r" (30.174) 


5 


2gh [5 10 
ve = = = oi 
ra F% ous 


Nous voyons dans le cas particulier de la boule, que la vitesse finale de chute est (sans frottements de 
l'air ni de roulement) indépendante de sa masse et de son rayon (qu'elle soit creuse ou pleine) ce qui est 
relativement contre intuitif. 


Il vient alors: 


E2. Un deuxième exemple fameux est le calcul de l'énergie cinétique de rotation d'une planète 
parfaitement sphérique de masse homogène et de période de rotation constante. Nous avons alors: 
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2 2 10 SLR 5 
2 
1 5 1 4 3 47 ,32 47 (2) | 
—. riz wo re [2 TT pri 2 DR | LT (30.176) 
El (o3 | TNT 
167 ps 
15 7 


Remarque: Dans un solide, la répartition de la matière autour d'un axe sera évidemment différente 
selon l'axe choisi. Le moment d'inertie correspondant sera aussi différent. Il est donc indispensable 
de préciser l'axe par rapport auquel nous souhaitons déterminer ce moment d'inertie. Nous 
observons dans la pratique que les ingénieurs placent souvent l'axe de façon à ce qu'il passe par le 
centre de masse. Dans les tables, nous trouvons fréquemment les expressions des moments 
d'inerties de formes courantes (selon un axe donné) telles que le cylindre, le cône, la sphère, la 
barre, le tube (cf. chapitre sur les Formes Géométriques). 


Nous avons vu lors de notre étude du moment cinétique que: 


et le moment d'inertie étant donné par: 

J = [rare (30.178) 
Nous avons donc: 

db =rädm (20.179) 
d'où: 

b= & [ram (30.180) 


Nous obtenons finalement: 


= 


b = J&| (30.181) 


c'est l'expression donnant le moment cinétique d'un corps tournant sur lui-même (sur un de ses axes 
possibles de rotation). 


Etant donné que nous avons démontré lors de notre étude du moment cinétique que: 


db _ FxF=M (30.182) 
dt 


il vient alors dans l'hypothèse que la masse et la géométrie du solide restent constantes. que le moment 
de force est alors: 


Page: 1745/4839 


[v3.0 - 2013] 


(JS) =J7—| (30.183) 


et bien évidemment, si nous étudions un système dans lequel le moment cinétique est conservatif, il va 
de soi que: 


=0—b=c* =J& (230.184) 


Cette conservation du moment cinétique trouve une application dans une multitude d'expériences telle 
que celle connue qui consiste à se faire tourner sur une chaise et à écarter les mains ou les jambes ce 
qui fera diminuer la vitesse de rotation (et inversement). 


Une autre expérience curieuse (mais mathématiquement correcte) consiste à se poser sur un plateau 
tournant avec une roue en rotation tenue à l'horizontale (le moment cinétique vertical est donc nul) et 
de mettre celle-ci ensuite à la verticale. Comme le moment cinétique vertical doit rester nul, pour 
contrecarrer cela, le plateau sur lequel est posé l'expérimentateur se mettra à tourner dans le sens 
inverse de rotation de la roue. 


Les déplacements de masses importantes à la surface de la Terre (icebergs, crues des fleuves, plaques 
tectoniques, etc.) provoquent des variations du moment d'inertie de la Terre. Il s'ensuit des fluctuations 
de la vitesse angulaire donc une imperfection de l'étalon astronomique de temps (quelques millièmes 
par jour). 


Revenons maintenant aux méthodes de calcul des moments d'inertie. L'énergie cinétique d'un corps 
étant la somme de l'énergie cinétique de chaque élément de ce corps, nous avons: 


# 
E, = dE (30.185) 
14 


Dans le cadre d'un corps solide rigide en rotation autour d'un axe, nous avons: 


E,= -ÿE DIU : SŸs, -#J (30.186) 


il il 


Ainsi, pour un corps composé d'un ensemble de corps de géométrie différentes, le moment d'inertie 
total est la somme des moments d'inertie par rapport à l'axe de rotation tel que: 


# 
> =} (30.187) 
il 


Lorsque nous calculons le moment d'inertie d'un corps par rapport à un axe À donné, il peut être 
intéressant de savoir qu'elle est la distance à l'axe où nous pouvons placer fictivement toute la masse de 
ce corps pour avoir le même moment d'inertie. Par définition, cette distance notée k et appelée le 
"rayon de giration" est trivialement donnée par: 


J 
JA =-M=k- Fr ca (30.188) 
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où J, est le moment d'inertie connu du corps de masse M par rapport à un axe A. 


Par définition, le "moment d'inertie polaire" (ou également "moment d'inertie quadratique") est le 
moment d'inertie défini par rapport à un point (le pôle) et non plus par rapport à un axe et noté: 


À = fr’ a (30.189) 


Cette grandeur n'intervient en fait que pour les rotations libres et n'a d'intérêt, pour les rotations autour 
d'un axe fixe, que parce qu'elle facilite quelquefois le calcul des moments d'inertie axiaux en vertu de la 
relation suivante (en coordonnées cartésiennes): 


1 
Te) ml J,+J,+J,] (80.190) 
Démonstration: 


Lemme 1: Le moment d'inertie par rapport à un plan xOy est donné trivialement par: 


= 15 : 
5 = fz dm (30.191) 


dr 


Lemme 2: Le moment d'inertie par rapport à un axe est donné par: 
JT,” [rar - fo° + z° jam 
J, = fé + 2° dm (30.192) 


J, = [æ + y? dm 


En sommant ces relations, nous en déduisons: 


RCE 2[ +»? +2) dm (30.193) 
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Le moment d'inertie polaire est alors donnée par: 


J, = [rare = [a +y?+2z?) (30.194) 


En comparant avec le lemme 2 il vient: 


LJ, + J,+J,]) (80.195) 


OIC.Q.F.D. 


Si le corps en question à une symétrie sphérique, il vient de suite puisque J, = J, =J, = J que: 


Je EPS EET (30.196) 


D 


Un exemple est donné avec la boule (sphère pleine) dans le chapitre traitant des Formes Géométriques 
dans la section de géométrie. 


Supposons maintenant connaître le moment d'inertie Z, d'un corps solide rigide quelconque par rapport 
à un axe z L x,y (cet axe n'étant pas nécessairement uniquement assimilé à l'axe z commun) passant 
par le centre de masse G. Calculons ensuite le moment d'inertie J,, par rapport à un autre axe z', 


parallèle à z et distant de a , et faisons apparaître la liaison existant entre ces deux moments d'inertie 
différents: 


Dans un référentiel cartésien, nous avons pour tout point (x,y): 
r=2+yetr®=x+(y+a) (30.197) 
Nous avons alors: 
ee [ram = fé + y dm 
Jun = fr 3 dm = fé + (y +a) )dm = [a + 3° + 2ay + a° )dm (30.198) 
- fé + y )dm + [Car + a? jdm = L.+ 2a [ pa +a” [de Je 2a [dr + M 
Le terme: 


2a [ vd (30.199) 
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est nul car si le moment d'inertie est calculé par rapport au centre de masse G comme nous l'avons 
imposé dès le début, alors: 


Jar 


= =0 (30.200) 
[a 


YG 


En définitive, nous obtenons finalement le "théorème d'Huygens-Steiner": 


2 ne 
Ju =J,+a*M| (30.201) 


Comme nous le verrons dans le chapitre des Formes Géométriques dans la section de géométrie du site, 
il devient alors facile de pouvoir calculer le moment d'inertie d'un triangle équilatéral en connaissant 
celui d'une plaque carrée et en déplaçant l'axe d'inertie au point où se situe le centre de gravité du 
triangle (soit au tiers de la médiane située entre le centre du rectangle et un des sommets du rectangle). 


Comme il existe autant de moments d'inertie que d'axes de rotation et que ces derniers sont souvent 
dans les cas d'études assimilés aux axes principaux d'inertie (axe assimilés aux axes de révolutions ou 
aux plans de symétrie - voir plus loin), il peut être utile d'introduire un être mathématique utile dans le 
cadre de représentation des moments d'inertie qui n'est autre que la "matrice d'inertie" ou appelé encore 
(formulation plus moderne) "tenseur d'inertie". 


La démarche pour déterminer rigoureusement l'expression de ce tenseur est la suivante: soit À un point 


donné d'un solide dont nous cherchons à calculer le moment d'inertie et À l'axe d'origine O et de 
vecteur unité # par rapport auquel nous souhaitons calculer le moment d'inertie. Tout point 4 du 


solide peut être projeté (projection orthogonale) sur un point # & A à partir de la connaissance de 
l'angle & entre A et OA tel que: 


HA - OAsin 9 = HA = O4 sin? 8 [4 xaf (30.202) 
Dès lors: 
J, = fra = fle4 x dm = [l4 *2]f04 2er = f OA xä\o[OA Xüidm (30.203) 
D'après les propriétés du produit mixte (cf. chapitre de Calcul Vectoriel) et du produit scalaire: 
(XX ÿ)oZ = Xo(ÿxZ) et (xXÿ)oZ7 =Zo(xXÿY) (30.204) 


nous avons: 


(OA xüio(OA xXü\=wo[OA4 xü|=(#xOA où =fol#xOA |=#0|(O4x&|xOA | 
(30.205) 


et donc: 


J, - ff°[104 X#\1XOA |dm (30.206) 
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Comme # est un vecteur de direction constante quel que soit le point d'intégration, nous pouvons le 
sortir de l'intégrale tel que: 


Ji =& 0 ({(04 x 5 \x O4 | dre =ÿoÿ (30.207) 


Nous pouvons vérifier que si nous remplaçons & par ä +#%,, nous obtiendrons un résultat ÿ = à +, 


de par la propriété de linéarité du produit vectoriel (cf. le chapitre de Calcul Vectoriel), Ainsi, 
l'application qui à &# associe ÿ est donc une application linéaire qui peut être représentée, dans une 
base B donnée, par une matrice: 


—v=(J, PU (30.208) 


La matrice 17, 1,, est le donc "tenseur d'inertie" du système par rapport au point O, dans la base B. 


Le moment d'inertie d'un système par rapport à un axe À quelconque de vecteur unitaire # est donné 
par: 
o IE 


VOEA JT, =&o[(s, | (30.209) 


Le problème est donc maintenant de pouvoir calculer les éléments du tenseur {.7, \, pour une base B 


donnée. Soit un repère | ©,F, j,&| tel que © e A. Nous posons: 
= +8j+yt et OA= x +3 +zk (80.210) 


En utilisant le fait qu'un produit vectoriel puisse être représenté par une matrice antisymétrique 
(vérifiez c'est facile): 


0 -z yl{æ 
O4 x$=| z O0 -x||#| «oz 
y x Or 


nous avons: 


( TZ Ÿÿ ( TZ Y Œ -7 - zxY XZ & 
CA, *| OA, xü\ = z O0 -xlz O0 -x||8 2 _ 2 
Y 


x 
y x Of|-y x 0 


I 
Ÿ 
N 
Û 
#4 
# 
Le 


(30.212) 


et donc: 
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(F, Lo = (L(O4 x 5) x OA | dm = [104 x (OA x ü | dm 


7 - y? zxy xz æ 
= “[ xy -z} - x? YZz ' dm 
x me Fer + 


= — [rod fl z?+x? |dm ee 
— frzdre [oz jo + x? | dm 


[LES + y? \dm [ad . [ À 


Dans l'expression ci-dessus de la matrice d'inertie, nous reconnaissons les éléments diagonaux: il s'agit 
tout simplement des moments d'inertie du système par rapport aux différents axes de la base. Nous 
appelons "produit d'inertie" les éléments non-diagonaux de la matrice et nous les notons: 


Fe — fade, JT" — f'azdre, 2  fyzdre (30.214) 


Nous avons donc: 


xp LS 
Le KE lo Toy Je (30.215) 
ï Je Jo 


Si O est assimilé au centre de masse du solide considéré, nous notons simplement: 
Jo 7 op Jo) = (Jr, d 3) (80.216) 
Nous pouvons également généraliser le théorème d'Huygens en faisant usage de ce tenseur de symétrie. 


Pour ce faire, appelons (x', y’, z') les coordonnées d'un point A quelconque dans R'et (x, y, z) ses 
coordonnées dans R. Nous appelons (a,b,c) les coordonnées de l'origine O' de R' dans R: 


puisque: 


Nous avons alors: 


= f! x + y lame = fi (x'+ a) + (y'+bŸ dm 
= [a+ y dm + 2a [ x'am +a° [dm + 2b [ y'a + b° [am (30.219) 
a ES + Ma? +b?+ 2a [ x'dm + 2b [ >" dm 


Or, si O' coïncide avec le centre de masse G, alors selon la définition du centre de masse: 


Page: 1751/4839 


[v3.0 - 2013] 


[ra - 0 
GAdm = 0 = { fy'dm=0 (20.220) 
[ [ 


Nous en déduisons alors: 
Je = JartM(a?+b?) (30.221) 
et de même: 
Joux * Jo tME +0), Joy = Jos t Ma +c*) (30.222) 
avec: 
OG = ai +bj+ck =x Si + y +2zçk (80.223) 


Nous retombons sur le théorème d'Huyghens classique puisque 4? +? n'est autre que la distance au 
carré entre l'axe Oz et Gz et de même pour 3? + -? qui est la distance au carré entre Ox et Gx et 
a? +? qui est la distance entre Oy et Gy. 


Si nous nous intéressons maintenant aux produits d'inertie, il vient: 
nt “fard = pi LS a)(y'+ b)dm = "fx> dm ra [y'dm bfx ‘dim — ab [ dm (30.224) 
d'où, si O' coïncide avec G: 
Joy = dry 7 Mab, Je = Jog Mac, Ju = Jyp = 4bC (30.225) 


En résumé, le théorème d'Huygens généralisé, s'écrit: 


W vS + z£ | -MXYe MX 26 
à, à a 
PA Ps = | Je PRET + —MXxeYe Mi\xe +ZG | —Myeze (30.226) 
2 
MX —Mÿ:2z M a +yS| 


Le tenseur d'inertie étant réel et symétrique, nous avons vu dans le chapitre d'Algèbre Linéaire 
(théorème spectral) qu'il est toujours possible de trouver trois directions perpendiculaires de vecteurs 
8,,8,,8, telles que le tenseur (matrice) symétrique soit diagonalisable: 


Le trièdre formée par les vecteurs &,,8,,8, est appelé "trièdre principal d'inertie" et ses axes sont 


appelés "axes principaux d'inertie". Dans ce repère (7, | prend le nom de "tenseur principal d'inertie”. 
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En fait, pour trouver les moments d'inertie relativement aux axes principaux il n'est pratiquement jamais 
nécessaire de diagonaliser le tenseur d'inertie, car il suffit souvent de se laisser guider par la symétrie du 
système. Nous allons voir avec les théorèmes suivants que s'il existe des axes ou des plans de symétrie 
pour la distribution de masse, les axes d'inertie sont faciles à trouver. De plus, le système est en général 
suffisamment simple (ou décomposable en éléments suffisamment simples...) pour que ces axes soient 
évidents. 


Premier théorème: Si le système possède un plan de symétrie matérielle (in extenso: (4) = &{4") si A 
symétrique de A' par rapport au plan) alors tout axe perpendiculaire à ce plan est axe principal d'inertie. 


Démonstration: 


Choisissons un repère xOy dans le plan par rapport auquel le système a une distribution de masse 
symétrique et un axe Oz perpendiculaire à ce plan. Pour calculer (l xzdr# où pzdr , groupons les 


points par deux, symétriques par rapport à xOy. c'est-à-dire tels que z, = -z,. Nous aurons alors: 


et de même: 

VaZa TYaZa = O (30.229) 
c'est-à-dire, puis (symétrie matérielle! ): 

dm(A) = dm(A" (30.230) 


que toutes les contributions de paires de points symétriques sont nulles, ce qui implique: 7, = J, = 0, 
c'est-à-dire que l'axe des z est direction principale d'inertie. 


OC.Q.FD. 
Deuxième théorème: Choisissons comme axe Oz l'axe de symétrie. De même que ci-dessus, nous avons: 
[dr - oz =0 (30.231) 
Démonstration: 


Effectivement, car si nous groupons les points par paire A' et A' symétriques par rapport à Oz, nous 
avons: 


Ka" Xw, Ya "Ya (30.232 
mais z, =Z donc toujours: 
X4Za TXuZa “O0 (30.233) 
et de même: 


Za TYaZy = O0 (30.234) 
AZ A * VaZa 
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OIC.Q.F.D. 


Remarque: Lorsque nous avons déterminé deux axes principaux d'inertie grâce aux symétries 
précédentes, le troisième est tout simplement celui qu'il faut pour compléter un trièdre orthogonal. 


Troisième théorème: Si un système admet un axe de révolution pour sa distribution de masse, alors tout 
trièdre orthogonal incluant l'axe de révolution, est trièdre principal d'inertie. Le système matériel est 
alors dit "système cylindrique" et dans le trièdre principal d'inertie son tenseur prend la forme (en 
supposant que l'axe de révolution est le 3ème axe du trièdre): 


JT 


Î = 
0 2.2.7 


D S 


Q 0 
J 0 
0 J 


Démonstration: 


Si Oz est un axe de révolution, tout plan comprenant Oz est plan de symétrie et toute droite 
perpendiculaire à Oz est donc axe principal d'inertie (premier théorème). De plus, toutes ces droites 
perpendiculaires à Oz sont équivalentes. 


OIC.Q.F.D. 


Définition: Si la matrice d'inertie en © d'un système matériel est du type: 


(JF 


Î = 
D'a2. 


J 0 0 
D à 
0 0 J 
nous disons alors que le système est un "système sphérique" (ou un "système à symétrie sphérique"). 


Remarque: Le choix systématique d'un trièdre principal d'inertie permet de ramener le tenseur 
d'inertie de 6 à 3 composantes, calculées une fois pour toute. Cependant, ce choix implique 
l'utilisation d'une base qui sera le plus souvent en mouvement par rapport au référentiel utilisé, ce 
qui pourra poser des problèmes de dérivations par rapport au temps des vecteurs de la base. Nous 
pouvons alors, si c'est plus facile, obtenir les composantes du tenseur de symétrie dans une base 
quelconque à l'aide d'une matrice de passage entre la base principale et le base utilisée pour le 
calcul du trièdre principal d'inertie. 


Lorsque les moments d'inertie d'un solide sont connus dans les directions des axes principaux d'inertie, 
nous pouvons facilement déterminer le moment d'inertie J par rapport à n'importe quel autre axe 
passant par le centre de gravité en utilisant que ce nous nommons un "ellipsoïde d'inertie" (à ne pas 
confondre avec le moment d'inertie d'une ellipsoïde - démontré dans le chapitre traitant des Formes 
Géométriques). 


Démonstration: 
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Soient trois axes, centrés sur G, parallèles aux axes principaux. Dans leurs directions, portons des 
longueurs proportionnelles à: 


A= : De : 


— 
RFF 


Figure: 30.15 - Illustraiton de l'ellipsoïde d'inertie 


Dans cet espace des phases des moments d'inertie, tout point P = (x, y,z) désigne un moment d'inertie 
J tel que: 


Pour déterminer J en fonction des J,, ” J,, sans devoir calculer x, y, z, nous identifions les cosinus 


directeurs (cf. chapitre de Calcul Vectoriel) de l'axe de rotation à ceux de la droite 55. 


Ainsi, nous avons: 


Use > os Lis » s |. 
are (PA) LT 
NE 47 l 
_ cos æ cos Ê _cosy 
xs L “ui 


Soit: 
JG - 2e + +22 1 (0250) 


Nous pouvons maintenant calculer les conditions de normalisation de cette relation. Ainsi, si y,z = 0 et 
x= À, NOUS avons: 


Je + D? + Je? = JA m1 A = —. (30.240) 
J J, 
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Respectivement nous aurons: 


1 l 1 1 
B=— =, C= = (30241) 
TE 
Puisque: 
1 , | 1 di 1 | 
A=——— À -—ep"——8 CC =— (30.242 
7, J, J, J, Je Jr | 


Ce qui nous amène à écrire: 


2 


2 2 
2 2 2-X ,Ÿ EL 30.243 
J,x + f,y + J,z "r'n'a (30.243) 


Par substitution, nous obtenons: 


2 2 2 
cos & cos COS 1 
7 = — a — + É+ _. =—{J,cos æ+J, cos" 8+J, cos" y] (30.244) 
C* J|I A BE L#i 


Donc finalement: 
J, cos? æ+ J, cos? B+J,cos y=J (30.245) 


Ainsi, en connaissant les moments d'inertie d'un corps par rapport à ses axes principaux, .j,,./, nous 
pouvons connaître son moment d'inertie par rapport à n'importe quel axe ayant un angle &, $,y par 


rapport aux axes principaux. 


OIC.Q.F.D. 


9.1.2: GYROSCOPE 


Un solide (de révolution pour simplifier...), pouvant s'orienter librement autour d'un point fixe et 
tournant rapidement sur lui-même forme par définition un "gyroscope". 


Outre leur usage ludique... car ils permettent d'avoir des configurations considérées comme 
pédagogiquement exceptionnelles. les gyroscopes constituent une part importante des systèmes de 
navigation par inertie (avant l'apparition des GPS...) dans l'aviation, l'aérospatiale, la marine 
(stabilisation des bateaux), le cinéma/télévision (stabilisation des caméras) et encore bien d'autres. Les 
instruments de guidage par inertie de ces systèmes sont constitués de gyroscopes et d'accéléromètres, 
qui calculent à tout instant la vitesse exacte et la direction de l'appareil en mouvement. Les signaux 
recueillis sont communiqués à un ordinateur qui les enregistre et qui corrige alors les aberrations 
éventuelles de la trajectoire. 


Les planètes constituent un autre exemple fameux de gyroscopes. L'exemple le plus connu étant notre 
Terre qui tournant relativement vite autour d'elle-même et étant très massive son moment cinétique fait 
que son pôle Nord est toujours (à l'échelle du temps d'un humain .) orientée vers l'étoile Polaire quelle 
que soit sa position sur son orbite. 
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La figure suivante est un exemple de gyroscope connu dans les laboratoires des écoles et appelé 
"eyroscope symétrique pesant". Il s'agit bien évidemment d'un cas particulier et simplifié mais qui 
permet de comprendre le principe de base du gyroscope: 


(2 


disque amovible 
contrepoids 


/ 


' 
SL 


volant 
principal 


pied de support 


Figure: 30.16 - Exemple de gyroscope symétrique pesant 


Se composant d'un moteur électrique dont le rotor, le volant principal, forme la masse principale en 
rotation angulaire rapide. Le stator du moteur est fixé à une tige sur laquelle est positionné un 
contrepoids à l'opposé. L'ensemble est posé sur un pied de support à l'extrémité duquel se trouve un 
cardan monté sur un roulement horizontal qui autorise les orientations du gyroscope presque sans 
limitations dans toutes les directions. 


Dans ce schéma nous avons & qui est la vitesse angulaire instantanée du disque amovible de rayon R, 
Q est la vitesse de précession du gyroscope (rotation autour du pied de support), Æ est la force de la 
masse m complémentaire attachée au contrepoids et qui déséquilibre le gyroscope, r est la distance du 
cardan du gyroscope au contrepoids et finalement a est l'angle d'inclinaison que prend l'axe du 
gyroscope lorsqu'on le déséquilibre en attachant le poids supplémentaire au contrepoids. 


Pour débuter l'étude théorique de ce système, rappelons que avons démontré plus haut que le moment 
cinétique pour un solide ayant un moment d'inertie J s'exprime par la relation suivante: 


ES 


ä, = J.& (30.246) 


et nous avons vu que tout solide en rotation autour d'un axe quelconque a aussi un moment cinétique 
qu'il est alors d'usage de noter conformément avec ce que nous avons vu plus haut: 


ba =Jafà (80.247 


Nous avons aussi démontré plus haut que le rotor, comme toute masse en rotation rapide, produit alors 
un moment de force donné par: 


= da _ 742 (30.248) 


qui est vectoriellement colinéaire à & et passe donc par son axe de symétrie. Comme nous le savons 
déjà, c'est cette dernière relation qui met le mieux en évidence que le gyroscope maintient toujours une 
direction identique dans l'espace même lorsque nous déplaçons son support. 
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En d'autres termes un gyroscope libre animé d'une grande vitesse de rotation a pour propriété 
fondamentale de conserver son axe de rotation selon une orientation fixe par rapport à l'espace absolu. 
C'est ce que nous appelons la "première loi gyroscopique" ou "loi de fixité”. 


Tÿypiquement le "gyroscope de Foucault" représenté ci-dessous, excellent exemple pratique de la loi de 
fixité, garde son orientation quelle que soit la manière dont nous manipulons le socle sur lequel il est 
posé: 


Figure: 30.17 - Gyroscope de Foucault 


Si nous posons le gyroscope de Foucault toute une journée sur une table avec un moteur qui maintient 
la rotation du disque massif central constante, nous observons alors la rotation de la Terre car le 
gyroscope tourne alors très lentement sur lui-même en 24 heures! 


Pour revenir à nos considérations mathématiques. intéressons-nous maintenant au moment de force du 
contrepoids qui déséquilibre notre gyroscope symétrique alors que le disque est en rotation et qui 
génère une rotation générale du gyroscope comme le permet de constater l'expérience. Nous avons 
alors pour le moment de force faisant tourner le gyroscope autour de son axe (tige de soutien): 


M == 1x Æl< [FA snazrma.snæ (20249) 


Puisque le gyroscope ne précesse pas lorsque le système est équilibré c'est que le moment de force du 
poids supplémentaire qui déséquilibre le gyroscope génère un moment cinétique selon la relation 
démontrée plus haut tel que: 


db _ 
— = =r.m a .snéæ (30.250) 


dt 


Ce qui schématiquement peut être représenté de la manière suivante (il s'agit de notre gyroscope vu 
d'en haut): 
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_ 


W 
Figure: 30.18 - Gyroscope symétrique pesant vu de haut 


Nous avons alors dès que le gyroscope se met à tourner (dans un mouvement circulaire): 


En prenant l'approximation de Taylor (cf. chapitre de Suites Et Séries) au premier ordre de la tangente 
pour les petits angles: 


dŒ&=—"— (30.252) 


Faisons l'hypothèse, pour simplifier l'étude du problème, que la variation du moment cinétique total par 
rapport à l'axe de rotation du gyroscope (la tige de soutien donc!) peut être assimilée au moment 
cinétique du rotor seuil si ce dernier tourne suffisamment vite et que sa masse est suffisamment grande. 
C'est-à-dire que: 


nous avons alors: 


db | d (Ba ba) > den (30.254) 


dé dé d£ 


et dès lors puisque de par cette approximation tout le moment de force est assigné à la variation du 
moment cinétique du rotor seul: 


Il vient enfin: 
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Donc lorsque le gyroscope symétrique pesant est équilibré (lorsque M est nul au numérateur de la 
fraction), son moment cinétique garde donc une orientation fixe quelle que soit la valeur du 
dénominateur puisque { sera alors toujours nul. 


Le mouvement de rotation résultant d'un déséquilibrage du gyroscope est donc dit "mouvement de 
précession" lorsqu'il est provoqué volontairement, et "dérive" lorsqu'il est dû à un élément perturbateur. 


Indiquons pour finir les gyroscopes ludiques pour petits enfants comme la toupie ci-dessous: 


Figure: 30.19 - Gyroscope (toupie) ludique. 


que pouvons grossièrement représenter ainsi (vue de côté et vue du dessus) pour en faire une analyse 
mathématique (faites l'essai avec vos enfants pour voir si cela les intéresse autant que le jouet...): 


Figure: 30.20 - Illustration technique de la toupie 


où nous faisons l'hypothèse que l'extrémité de l'axe de la toupie est posée sur le sol sans possibilité de 
glissement et que celle-ci a une vitesse angulaire& constante et suffisamment grande pour ne pas avoir 
son inclinaison 8 qui varie dans le temps. 


En utilisant la même technique que pour le gyroscope symétrique pesant nous avons (bon nous aurions 
pu utiliser plus simplement la relation Z = ækR vue dans le chapitre de Trigonométrie…): 


db, =b,sin(#)dg (30.257) 
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Nous avons aussi pour le moment de force: 


M=Rg mg sin8g (30.258) 
Par contre le moment cinétique change! Effectivement, nous avons donc dans ce cas particulier: 
db, =basin(#)dg (30.259) 


il s'ensuit que sous les mêmes hypothèses que le gyroscope pesant que: 


db db : à . Là 
% = Pa =D sin (8) = à, sin (8) {à (30.260) 


d'où sous forme vectorielle: 


dm ={xb, (30.261) 
dt 


et nous savons que cette dernière relation (démonstration faite plus haut) peut être complétée en 
écrivant: 


à . ” 
_—® — Qxb,=M (30.262) 
É 


Il vient alors: 
Gb, -sn9=kRe.m.g.sin# (30.263) 


Soit: 


a-eme kg me 
b J.&æ 


@ 


(30.264) 


Nous voyons que la différence avec le gyroscope symétrique pesant est que la vitesse de précession est 
alors indépendante de l'angle. 


Remarques: 


R1. Un cycliste roulant en ligne droite est stabilisé (loi de fixité oblige!) par le moment cinétique de 
ses roues qui est perpendiculaire au sens de roulement. 


R2. Sans probablement s'en rendre compte, on se penche en bicyclette dans un virage pour produire 
une précession dans les roues et tourner plus facilement. Effectivement le mouvement de 
précession fait pivoter la roue de la bicyclette dans la direction où on se penche sans qu'on ait 
besoin de tourner le guidon. 
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9.2. ÉNERGIE POTENTIELLE GRAVIFIQUE 


Si le travail de la force À entre les points À et B ne dépend pas du chemin suivi, nous disons que cette 
force dérive d'une énergie potentielle ou bien que le champ de force est un "champ conservatif" 
(contre-exemple: dans un mouvement avec frottement le travail dépend nécessairement de la voie 
choisie). Cette indépendance par rapport au chemin suivi implique que: 


Soient deux points À et B de l'espace. Il y a plusieurs chemins possibles pour joindre ces deux points. Si 
nous en choisissons deux au hasard nous avons: 


z 
Sur le 1° chemin: [F o df 


Le 


x 8 a 
Sur le 2°" chemin: [° °F, 


(30.265) 


Si le champ est conservatif nous avons: 


2 E 8 : B =. A m 
1S odn = F o dr, = (7 odr = [F odr| (30.266) 


ou encore que le travail total sur un chemin fermé (aller et retour) est nul. Nous notons cela (cf. 
chapitre de Calcul Différentiel Et Intégral): 


$F odF =0 (30.267) 


Le travail en jeu est donc une fonction du lieu seul (Æ,) c'est-à-dire dépendant uniquement du point de 


départ et du point d'arrivée. En effet, si le travail dépendait du chemin, il serait possible de choisir la 
voie la plus généreuse quand le système fournit du travail et la voie la plus économique quand nous le 
ramenons à l'état initial. Ce serait donc un mouvement perpétuel et le principe de conservation de 
l'énergie l'interdit (cf. chapitre de Thermodynamique). 


Attachons alors à chaque point P du champ de force une valeur de la fonction Æ, (un nombre réel) 


correspondant au travail effectué par le champ de force lorsque le mobile passe d'un point P à 0, 0 étant 
un point de référence choisi arbitrairement. Donc par définition: 


û 
E,(P) = [éi odr avec Æ,(0)=0 (30.268) 


Page: 1762/4839 


[v3.0 - 2013] 


En généralisant cette définition, nous dirons que le travail effectué par une force conservative lorsque 
le mobile passe de À à B est égal à la diminution d'énergie potentielle entre A et B: 


£ 
UP = 1 odr = -(E,(8)- &,(4)) 
(30.269) 


Par définition Æ, est l'énergie potentielle et se mesure en Joules. 
L'équation précédente s'utilise très souvent sous forme différentielle soit: 


0.270 


Il existe aussi rappelons-le une relation entre l'énergie et le gradient de la force donnée qui découle 
simplement de la définition du travail: 


F=-V:"E,| (30.271 


Application: Travail de la pesanteur et énergie potentielle gravifique au voisinage de la surface de la 
Terre. C'est donc un cas particulier où la force est constante. 
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x 


Figure: 30.21 - Exemple avec la force gravifique 


Soit un point de masse m se déplaçant selon une trajectoire quelconque AB. Le poids ##£ effectue le 
travail: 


A] 
an (Foar- FoG- A) mBeG 7) 027) 


En exprimant les différents vecteurs en composantes: 
E = (0,0,-2), à = (xa,VasZa) ; Fa = (AgsV:Z8) (80.273) 
et en calculant le produit scalaire au moyen de ces composantes nous obtenons: 
Was = ME O2 — Pa) = MB(Z» —Z4) = MS(Za —Zz) (30.274) 


La différence z, - z, représente la différence d'altitude entre les points À et B. Nous constatons bien 
que le travail ne dépend pas du chemin suivi mais seulement des points de départ et d'arrivée. Si, en 


sens inverse, nous voulons faire passer le point de masse de B à À, le travail, fourni alors par un agent 
extérieur vaut: 
Wa = Wan = -MS(Za —Z») (30.275) 
ce qui montre bien que le travail total sur un chemin fermé est nul: 
ÿF odf =0 (30.276) 
En comparant les relations: 


Win = -(E(B)-EÆ, (24) et Wip = ML(Za-Zp) (30.277) 


et en identifiant, nous obtenons ainsi: 


E,(z)=m'g'z| (30.278) 


qui est l'énergie potentielle gravifique, z étant l'altitude de la masse m. Nous notons plus simplement la 
plupart du temps cette relation sous la forme: 
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E,=m'g'h (30.279) 


Remarque: Le choix de zéro de l'énergie potentielle est souvent arbitraire; nous le fixons par 
commodité. Seules les différences d'énergie potentielle sont généralement intéressantes comme 
nous allons le voir de suite. 


La relation précédente est au fait une expression utile à proximité de la surface terrestre. À distance 
ræ À où R est le rayon de la terre, la force de gravitation faiblit et l'approximation n'est plus valable 
(si r& À aussi, d'ailleurs..). 


Pour déterminer la relation correcte, considérons deux masses #2 ,#,. La première est supposée au 
repos et fixe la deuxième est amenée de l'infini à une distance donnée de # (le même raisonnement est 


applicable pour le champ électrique). Le travail dW de la force gravitationnelle en un point quelconque 
étant donc: 


dW = Fdx (30.280) 
et l'énergie potentielle du système: 
dE, =-dW (30.281) 


Alors: 
dE, =-dW =-Fax=-G78 4x (30.282) 
X 


d'où simplement après intégration (l'énergie potentielle en un point): 


Æ> = g2272 (30.283) 
X 


Voyons si cela est cohérent avec Æ, = mgz … 


À hauteur nulle de la surface terrestre, x= À, nous avons: 
E, = C2 =E,p (80.284) 


où le choix du signe "-" dépend uniquement du référentiel choisi qui est dans le cas présent conforme à 
ce qui est d'usage de prendre dans les écoles. 


Nous élevons l'objet de k << R: 


1 1 
= Chant, ——— = GA 30285) 


Paz 
E,(R +4) =-G 22 2 -G 7972 
0e bé R(+ AR) R (+4/R) 


R+k 


R+kh 


Nous utilisons l'approximation grossière: 
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——Z]-x (30.286) 
valable quand x <<1 d'où: 

E,(R + X) = C2 ( - h{R) = Larn +R =U, -F;h=U, +mgh (20.287) 
Comme à la surface de la terre nous avons l'habitude de poser en laboratoire £7, = 0, nous obtenons 
bien finalement: 

E,(h) = mgh (30.288) 


et nous voyons qu'il s'agit effectivement d'une grossière approximation. 
Remarque: Nous pourrions appliquer le même développement dans l'étude de la force de Coulomb 
et du champ électrique mais jusqu'à maintenant nous n'avons jamais mis de laboratoire à la surface 
d'une charge. (sic!). 

9.2.1. ÉNERGIE POTENTIELLE D'UNE SPHÈRE DE MATIÈRE 


Nous allons calculer ici l'énergie potentielle d'une sphère de matière. Cet exercice de style va nous être 
très utile en astrophysique pour déterminer la température interne des étoiles et dans le chapitre de 
Cosmologie pour le départ du modèle de Friedmann. 


L'expression d'une énergie potentielle d'un système de deux masses mises en présence est donnée par: 


__ Cn 
Fr 


E» = (30.289) 


Soit une sphère de masse M, de densité massique & et de rayon r et entourée d'un anneau sphérique de 
rayon intérieur r, de même densité massique £ et d'épaisseur dr. 
L'énergie potentielle de l'anneau sphérique de rayon interne r et d'épaisseur dr se calcule comme suit: 


La masse de la sphère de rayon r et de densité massique & est: 
4 
M=-7r £ (30.290) 
3 
La masse de l'anneau entourant la sphère de rayon r, d'épaisseur dr et de densité massique £ est: 


m=4x r?dr © (30.291) 


En introduisant les deux dernières expressions dans celle de l'énergie potentielle: 


G 27 0 (4xrr2pàr) 


dE» =- =" (are) rt dr 
r 
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En intégrant l'expression précédente entre 0 et R, cela revient à ajouter successivement une suite 
d'anneaux d'épaisseur dr pour obtenir la sphère entière de rayon R et donc l'énergie potentielle de la 
sphère entière. 


5 


1 2° 1 2 À 
E, ---G(4xe) (ne Ch ‘5 (0255) 


Ce qui s'écrit encore: 


2 
a 4 3] ,1 
s,--iofiror| R (30.294) 
—— 
M° 
Soit finalement: 
3GM®| 
== (30.295) 
5 À 


9.3. CONSERVATION DE L'ÉNERGIE MÉCANIQUE TOTALE 


Comparons maintenant les équations: 
Win = -CE(B) - E,(A) = E(B)- Æ (A) (30.296) 
puisqu'il s'agit du même travail. 
Ce qui entraîne: 
£,(4)+£ (4) =Æ,(8)+Æ,(4) (30.297) 


somme des deux formes d'énergie en chaque point ou encore, les lieux A et B étant quelconques, en 
écrivant l'équation sous une forme générale: 


E,+E, =c"| (30.298) 


Remarque: Nous nommons souvent l'énergie totale d'un système "l'hamiltonien du système" comme 
nous l'avons déjà mentionné dans le chapitre de Mécanique Analytique. 


En l'absence de frottement s'il s'agit d'énergie mécanique, nous écrivons aussi la variation tel que: 
dE, +dÆ,=0 (30.299) 


Une augmentation d'énergie cinétique entraîne donc une diminution d'énergie potentielle (et 
réciproquement) puisque la somme des deux reste constante. 


Contre-exemple: S'il y a frottement, donc dégagement de chaleur, l'énergie mécanique totale n'est plus 
constante! (l'énergie mécanique seulement). 


Par ailleurs reprenons la relation: 
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dW =-dE, & dE, = -dW (30.300) 
et donc: 
dE, =-dW=-Fodr=-(Fdx+Fdy+Ædz) (30.301) 


D'autre part, Æ, étant une fonction scalaire dépendant des coordonnées d'espace, formons sa 
différentielle totale: 


0E 0E 0E 
dE, = —Eax+ —Edy+—?az (30.302) 
ax dy 9z 


en comparant avec l'équation précédente et en identifiant terme à terme, nous avons: 


d'où l'expression affirmant que la force dérive d'une énergie potentielle si le travail en jeu est 
indépendant du chemin suivi. Si nous exprimons la force À en termes de vecteurs-unités, nous 
obtenons: 


= 2 a = ÔE, - 0E,- 0E, - —_— 
FF +EjtEk=-|—i+—j+—"k|-=-gad(E,) (30.304) 
üx dy dz 


En définitive, l'affirmation que la force dérive d'une énergie potentielle Æ, peut se résumer ainsi: 


F= —grad(Æ,)| (30.305) 


Dans le cas de la gravitation: 
F = mg = -grad(E,) (30.306) 
ce qui s'écrit aussi avec l'opérateur nabla (cf. chapitre de Calcul Vectoriel): 


F=-grad(£,)=-V(E,) (230.307) 


Le champ de gravitation est donc caractérisé par l'ensemble des vecteurs £. 


9.4, CONSERVATION DE LA QUANTITÉ DE MOUVEMENT 


Un mobile, lors d'une interaction avec un autre point matériel, peut transmettre tout ou partie de son 
mouvement (énergie cinétique ou/et potentielle). C'est le cas lors d'un choc, par exemple (ceci dit le 
calcul de la force d'un choc est extrêmement difficile à effectuer sans de nombreuses simplifications). 
La grandeur ainsi échangée est la quantité de mouvement ? . Elle vaut par définition (nous l'avons déjà 
vu lorsque nous avons parlé de la deuxième loi de Newton): 
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Évidemment, nous avons: 


à 
M; = MP = [Éd (30.309) 
â 
La quantité: 
t 
[fa 
ä 


est parfois appelée "impulsion", et l'équation précédente porte quelque fois le nom de "théorème de la 
quantité de mouvement". 


Il s'énonce ainsi: L'impulsion fournie par une force entre les instants £, et #, est égale à la variation de 


la quantité de mouvement durant cet intervalle de temps. 


Mais revenons-en à notre conservation de la quantité de mouvement (et donc de l'énergie et 
réciproquement.….). L'intérêt de la grandeur de quantité de mouvement résulte du fait qu'elle est 
conservée dans les interactions (en première approximation..). En effet, soient deux mobiles en 
collision, en vertu de l'égalité de l'action et de la réaction (3ème loi de Newton) nous avons: 


F ; = -À, (30.310) 


et en utilisant le théorème de la quantité de mouvement nous pouvons écrire: 


En additionnant membre à membre ces deux équations, nous déduisons: 
D os s A  … 
2 A * Pa) =FtÂ,=0carÆ,=-A", (30.312) 


et donc: 


Pi + Pa = c*| (80.313) 


La quantité de mouvement totale est constante, elle se conserve donc. 


9.5. LOI DE NEWTON GENERALISÉE 


Revenons maintenant un petit peu à notre principe de moindre action dont nous avons parlé au tout 
début de cette section: 


Prenons le cas d'un objet lancé en l'air et repérons deux points de sa trajectoire en deux instants 
quelconques. Une infinité de courbes passent entre ces deux points et pourtant la nature n'en choisit 
qu'une seule. Qu'est-ce qui distingue cette courbe - la trajectoire physique - de toutes les autres? A cette 
question nous pourrions, très justement, répondre que cette courbe se distingue des autres par le fait 
qu'elle est solution de l'équation différentielle de la trajectoire … avec les conditions initiales 
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appropriées. Mais dans le cas où nous ignorons les conditions initiales ou lorsque le problème ne peut 
être ramené à une équation différentielle, par quel moyen pouvons-nous alors distinguer la trajectoire 
physique de tous les chemins possibles? 


Le principe de moindre action s'exprime dans ce contexte par un minimum de vitesse pour un minimum 
de chemin parcouru. 


En fait de vitesse, il convient mieux en mécanique de considérer la quantité de mouvement car cette 
dernière grandeur est directement liée aux propriétés inertielles des corps. Mathématiquement 
Maupertuis traduisit le principe de moindre action comme suit. 


Si nous considérons le mouvement d'un corps entre deux points A en £, et B en f,, pour une énergie 
totale E donnée, la trajectoire sélectionnée par la nature est celle pour laquelle la grandeur Dr suivante 


est minimale: 


Et 
A = [ x 0 dF 
A4 (30.314) 
Trajectoire physique 


; : d'action minimale 
Trajectoires non 


physiques 


Ata 


La trajectoire physique entre deux points À et B aux instants £, et £, est celle pour laquelle l'action est 


minimale. 


En sachant que: 


nous obtenons alors: 


8 1] tr] 
Aî = [rs o vdi = [rrv'at = [27,94 (30.316) 


t, ta t4 
où T'est l'énergie cinétique du corps. 


Nous le voyons, l'action prend une forme étonnamment simple et s'exprime directement en fonction de 
l'énergie cinétique. Quelques années plus tard, à partir d'une intuition semblable à celle de Maupertuis, 
Euler parvint à un énoncé très similaire de l'action mais en partant du constat que les corps tendent à 
adopter un état où l'énergie potentielle est minimale. L'action d'Euler s'exprimait en fonction de 
l'énergie potentielle au lieu de l'énergie cinétique. Qui de Maupertuis ou d'Euler avait tort ou raison? 
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En fait, leurs énoncés respectifs de l'action étaient équivalents. Nous savons que dans un champ 
conservatif, si nous appelons U l'énergie potentielle alors l'énergie totale E vaut T + U et cette énergie 
est une constante. Nous en tirons que T = E - U et que donc: 


2T=-T+E-U (30317) 


D'où: 


ta 
AË = [(TE,9 +E-U(.û)dt (30318) 


ta 


Cette relation est vraie quel que soit le chemin d'énergie totale initiale E. Nous en concluons que la 
valeur de la constante E ne permet pas de discriminer les différentes trajectoires et peut donc être 
éliminée de la formulation de l'action. L'action de Maupertuis peut alors se réduire à une nouvelle 
grandeur notée S: 


ta ta 
sè — [res — U(F,t)}dt = [1,941 (30.319) 


ta ta 


Cette nouvelle formulation de l'action fut donnée par Lagrange en 1788. S s'appelle "l'action 
lagrangienne" ou "action hamiltonienne" et la fonction: 


L(r,t)=TC,t)-U(r,f) (30.320) 


porte le nom de "lagrangien mécanique". Aïnsi formulé, le principe de moindre action devint l'un des 
outils les plus puissants de la mécanique. 


Nous avons déjà vu comment nous exprimons le principe de moindre action mathématiquement. Dans 
le cas qui nous intéresse, l'action n'est pas une fonction de variables analytiques mais de trajectoires! 


Considérons le cas très simple d'un corps de masse m se mouvant sur une seule dimension (que nous 
représenterons par un axe Ox) d'un point d'abscisse x, à l'instant £, à un point de coordonnée x, à 


l'instant #, . Supposons qu'il est soumis à un potentiel U qui ne varie pas avec le temps c'est-à-dire 
Ü = U(x). L'action de ce corps sur un chemin C quelconque menant de (x,,4) à (x,,£,) est alors: 


1) 


û 


2 
S(C) = FETE) - UGD Ia = f (à) -U(alaæ (03 


Soit €, le chemin physique et $; l'action sur ce chemin. Notons par x les valeurs de la position x sur 
le chemin physique. Considérons maintenant un chemin C très proche de €, tel que les positions le 
long de C aient les valeurs x{£) = X(£) +£(f) que nous écrirons, pour alléger les écritures x=x7+#. 


Calculons l'action pour ce chemin: 


[1 (a&+9Ÿ _. 
S(C) = [ fn (#a re) U(x +e)|dt (30.322) 
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Comme £ est infiniment petit, il est possible de développer le potentiel en développement limité: 


_ _ au 
U(x+E)=U(X)+€-—— (30.323) 
dx 
Quant au premier terme, il se ramène à: 


» 2 2 : 
amre)| _fdx) ,,dMde fde) ou 
d dt dt dt (a 


Comme nous ne considérons que les variations du premier ordre, le dernier terme peut être négligé, ce 
qui donne pour l'action sur le chemin C: 


à D dE 
SC) = A "ET er 


Posons maintenant que la variation 4 de l'action entre le chemin physique €, et C est nulle: 


-Ù E——|dt (30.325) 
(x) — ra 


ÊS = S(C) —S(Cn) = 0 (30.326) 
et ainsi: 
5$ - t > dE 
# . dt 


dE 0-0 
"LE dt dt dx 


-u)-e à - ME " À] - U(x)|4 


30.327) 


Le premier terme dans la dernière intégrale peut s'intégrer par parties comme suit: 


à L 1 

dx d mn d°x 
| dns L Jr gra (30.328) 
H dé 


Or, tous les chemins partent de x, à l'instant #, et arrivent à x, à l'instant £, . Ceci implique qu'en £, et 
t, la variation £& est nulle ce que nous écrivons £(x%,4) = &(x,,£,) = 0. Donc le premier terme de 
l'intégration par parties est nul. La variation de l'action prend alors la forme: 


+ 2— 1— 
d°x au dx 
ÊS = E——-E#€ dé = 
fl” dt? &| le dx 


Cette intégrale doit être nulle pour tous les chemins très proches du chemin physique €; , donc quelle 


Edt = Q (30.329) 


que soit la valeur de £. Pour qu'une telle condition soit remplie il faut que le terme devant £ soit nul, 
c'est-à-dire: 
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Or nous connaissons au fait cette équation: le premier terme n'est rien d'autre que #27‘ 4 où a est 
l'accélération du corps, et le second - l'opposé du gradient du potentiel - est l'intensité de la force en un 
point donné. Celle-ci se réduit donc à l'équation: 


dx au 
d£ dx 


(30.331) 


qui n'est autre que la deuxième loi de Newton sous forme généralisée que nous avions obtenu plus haut 
sous la forme suivante: 


Le principe de moindre action contient donc implicitement la mécanique newtonienne. Ainsi, il est 
possible de reconstruire toute la mécanique de Newton avec le seul principe de moindre action!!! 


Cet échafaudage de calculs peut paraître bien compliqué pour aboutir à un résultat que nous 
connaissions déjà mais tout l'intérêt du principe de moindre action réside dans le fait qu'il permet de 
tirer des lois fondamentales à partir de la seule connaissance du lagrangien d'un système. 


Les théories les plus récentes comme la théorie quantique des champs, les théories de jauge ou la 
théorie des supercordes ont toutes pour point de départ l'expression de l'action du système. Les 
physiciens en dégagent ensuite des lois fondamentales qui régissent le comportement des particules 
élémentaires. 


10. PUISSANCE 


Définition: La puissance est le taux instantané de variation du travail (énergie sous forme quelconque). 
Nous avons donc la "puissance instantanée" donnée par: 


pa 
dé 


(30.333) 


Si le travail est fourni de façon régulière (constante), nous avons alors la "puissance moyenne": 


Avec cette définition, le lecteur pourrait penser qu'un véhicule qui roule à une vitesse constante fournit 
donc une puisse nulle puisque son énergie cinétique ne varie pas. En réalité il n'en est rien, car la 
voiture doit constamment vaincre le frottement des pneus avec la route (voir plus loin l'étude de la 
tribologie), le frottement visqueux avec l'air (cf. chapitre de Mécanique Des Milieux Continus), et la 
perte d'énergie du aux vibrations et frottements des ses propres composants comme les essieux, les 
roulements à bille, les ressorts, etc. Ainsi, un véhicule doit à chaque seconde fournir l'énergie qu'il a 
perdu dans ces différents frottements. Nous avons alors la "puissance d'une force": 
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où nous avons utilisé la définition de l'énergie (force sur une distance) et où Æ- représente la somme 


des diverses forces. 


Remarques: 


R1. L'unité de la puissance est le "Watt" et se note [W] mais en technique, certains utilisent encore 
souvent le "cheval" [ch] défini comme suit étant égal à 736 [W] (car un cheval pouvait à l'époque 
soulever 75 kilos à 1 mêtre en 1 seconde sous la gravité terrestre). 


R2. En exprimant le travail (énergie) à partir de l'équation } = P.£ , où la puissance est donnée en 


[kW] et le temps en heures, il apparaît alors l'unité d'énergie [kWh] (kilowattheure), très utilisée en 
pratique. 


10.1. PUISSANCE D'UNE MACHINE TOURNANTE 


Le travail élémentaire dW effectué par la force # faisant tourner une solide (un cylindre dans le cas 
présenté de suite) autour de son axe d'un angle 8 vaut: 


a = Far = r[Tael] = Frd8 (20.336) 
27T 


La puissance instantanée est alors: 


Or, comme nous l'avons démontré plus haut (il s'agit en fait plutôt d'une définition.….): 
F'r= | (30.338) 


La puissance d'un couple est alors donnée par: 


P=M:æ| (30.339) 


Il s'agit d'une relation très prisée par les passionnés de véhicules à moteur. Effectivement, connaissant 
le couple moteur (le moment de force) et le régime moteur (qu'il faut covertir dans les bonnes unités), 
nous obtenons facilement une approximation de la puissance développée par le moteur. Si nous divisons 
le résultat par 736, le lecteur obtiendra la mesure de la puissance en "chevaux". 


10.1.1. RENDEMENT 


A cause des frottements, la puissance restituée par une machine appelée aussi "puissance utile", est 
toujours inférieure à la puissance absorbée. Nous tenons compte de cet effet au moyen du rendement 
défini par: 


p. 


= <1| (30.340) 


abordée 
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Nous y reviendrons beaucoup plus en détail lors de notre étude de la thermodynamique (cf. chapitre de 
Thermodynamique). 


11. MOUVEMENTS RELATIFS ET FORCES D'INERTIES 
Voyons maintenant des développements qui vont nous permettre d'introduire un élément très important 
et utile en mécanique des fluides (cf. chapitre de Mécanique Statistique) et en météorologie (cf. 


chapitre de Génie Marin & Météo). 


Considérons un référentiel fixe X, Y, Z et un référentiel mobile x, y, z. Ils sont donc en mouvement 
relatif et nous envisageons une rotation possible du référentiel mobile. Il s'agit d'exprimer, la vitesse, 
l'accélération d'un point P de l'espace au moyen des coordonnées du référentiel fixe (coordonnées 
absolues) à partir de celles attachées au référentiel mobile (coordonnées relatives) et du mouvement 
d'entraînement du référentiel mobile. 


Nous définissons dans notre étude: 

F = {(x{£),y(é),z(£)) vecteur de position de P par rapport au référentiel mobile 

F = (x), Yoté), Zo 6) vecteur de position de P par rapport au référentiel fixe 

& = (..) vecteur de position de © par rapport à l'origine du référentiel fixe 

Ÿ, = (...) vitesse absolue de P par rapport au référentiel fixe (supposé inconnue) 

ä, ={...) accélération absolue de P par rapport au référentiel fixe (supposé inconnue) 
Ÿ, = (...) vitesse relative de P par rapport au référentiel mobile (supposé connue) 

ä, = (..) accélération relative de P par rapport au référentiel mobile (supposé connue) 


v, = (...) vitesse d'entraînement au point O du mouvement relatif du référentiel mobile par rapport au 
référentiel fixe (supposé connue) 


&, = (...) accélération d'entraînement du référentiel mobile (supposé connue) 


& = (..) vitesse angulaire du référentiel mobile 
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À 


Figure: 30.22 - Exemple de référentiel en mouvement et en rotation par rapport à un référentiel fixe 


la position du point P est donc donnée par la "relation de composition des positions": 


F = tr (30.341) 


La vitesse absolue se calcule comme suit: 


= 
2 


£ 


CLR PEL 


dt dt dt 


= +, + 


(30.342) 


€ L# 


Œ d , ,d 


Le dernier terme est la contribution due à la rotation du référentiel mobile. Il s'agit maintenant 
d'exprimer la valeur de cette contribution en envisageant des rotations d'angle 44 = & dt autour de 


chacun des axes, successivement: 
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æ,di(—J) . 
@, dt i æ,dé(—i) 
“3 
nouvelle position 
æ,di(—k) des axes 
@, dt ÿ 


di = (je, -ko,)dt, dj - (ka, -? @,)dt,dt = (F@, - j @, jt 


(30.343) 


Nous obtenons ainsi les vecteurs élémentaires 4? ,dÿ,dk figurant les déplacements des extrémités des 
vecteurs-unités }, LE . Nous les introduisons dans l'expression ci-dessous qui devient, après 
réarrangement des termes: 

di dj 


dk cu = 1 _ av nn 24 
2 rer =(@,z-y@,)'i +t(ax-z@) j+t(ay-xe,) k=&xr (35034) 


par définition du produit vectoriel. La vitesse absolue du point P s'exprime donc selon la "loi de 
composition des vitesses": 


V, =v, +v, +&XFr| (30.345) 


nous constatons que dans le cas particulier où le référentiel mobile ne subit qu'une translation (& = 0}, 
nous trouvons l'équation ÿ, = ÿ, +, caractéristique de la transformation de Galilée et nous disons alors 


que les référentiels sont en "translations relatives". 


Remarque: Si nous nous concentrons uniquement sur les termes de vitesse d'entraînement et de 
rotation du référentiel mobile nous obtenons alors ce que nous appelons la "formule de Bour"”. 


En procédant de la même façon que pour la recherche de la vitesse absolue il vient, en dérivant la 
relation précédente: 


_ … 


dé, d 
d, =4 + — 
dt dt 


avec: 
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d(@xr) _dl(ez-ya) i+(ax-za) j+(e,y-xe,) E] 


dé di 
de, d - d? d@ 2 dy - di 
2 +, TD — Ji ET y — 
E dt dt FE dt d (30.347 
æ, … + 11 @, . + dj 
ji + ji + A —"j— — 
di m7 “4x à "a va 
. E de, - : £ 
UNIT CAT DE : ee F— , x 
dt dé dt dé dé 


(30.348) 


Si nous regroupons les termes: 


bé 0 
& ” 


2 


4 ee ](É 
Si nous regroupons les termes: 


[est - 4] (u$-«$] (ss ax À 


(30.350) 
= (az L a»)? +(&x- az) +(ay- ar) À 
et nous avons: 
A = ka) = (£a, -i nr =Gæ@,-jæ) (80.351) 


Donc: 
(a,z-e,y)(je, -Ke,)+(ax-e,z)(te, -Te,)+(ay-ae,x}(e, -ja,) 
had Ce u) 

} 


+(a,z- æ,y)(-ke, )+(æ x- @,z (£a, ) (30.352) 


172  (@,x- 2 +[a (æ,z- ay)-& (er @,x)]|j 


Finalement: 


Page: 1778/4839 


[v3.0 - 2013] 


de , 
Es A+ — + XV, +—xrF+æx(xr) (30.353) 
dt dt 


mais (!) rappelons-nous que: 


ainsi: 
Phi tr 
dé  dt\ di d£ dt 
2 2 | Tu + TE 30.355 
fre] dx di dy dj dr dk (30.355) 
ä&, 


ee m7 dt dt dt dt dt dt 


L'accélération absolue ou la "loi de composition des accélérations" s'exprime alors comme: 


he 


a 
4, =a ta, T2ŒXV, + —Xr + SX(SXFr)| (30.356) 
£ 


Le terme: 
äe=2®8XV (30.357) 


est appelé "accélération de Coriolis" (-1820) et le terme &x*(&Xx7r) est simplement l'expression de 
l'accélération centripète dans ce cas particulier. 


La loi de Newton F = #1: 4 doit comporter tous les termes contenus dans l'équation générale ci-dessus. 
Pour un observateur situé dans le système fixe, cette loi s'écrit alors: 


ps 


s L :  … d&. PRE es 
F = ma, +ma, + 2m@XV, url +m@x(&xr)] (30.358) 
Ê 


où l'on a en premier terme à droite de l'égalité la force d'entraînement, en troisième la force de Coriolis 
et en dernier la force centripète. 


Si le point P est lié rigidement au référentiel mobile, un observateur dans ce système ne perçoit aucun 
mouvement, par conséquent aucune accélération &,. Nous avons donc affaire à un système de forces 


en équilibre. Le problème de dynamique est alors ramené à un problème de statique. C'est le "principe 
d'Alembert". 


Exemple: 


Etant donné que pratiquement toutes nos observations sont faites sur Terre, c'est-à-dire dans un 
référentiel mobile dans l'Univers, la force de Coriolis peut y être mise en évidence. 


L'étude du mouvement d'un corps par rapport à la Terre est l'une des applications les plus intéressantes 
de l'équation démontrée précédemment. La Terre a une vitesse angulaire (supposée constante!) dont la 
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direction est celle de l'axe de rotation de la Terre. Appelons g, l'accélération de la pesanteur mesurée 


en un point À à la surface de la Terre si celle-ci ne tournait pas. &, correspond alors à 4,. En tirant 


l'accélération d'entraînement et relative nous obtenons l'accélération mesurée par un observateur en 
mouvement avec la Terre: 


D 
4, +4, =d'=a, -2&XV, -—xFr-x(&xr) (30.359) 
dé 
. d&. Re .: 
où — x} = 0 est négligé dans le cas de la rotation de la Terre. 
dé 


Nous considérons d'abord le cas d'un corps initialement au repos, ou se déplaçant très lentement de 
sorte que le terme de Coriolis est nul ou négligeable comparé au dernier terme. L'accélération que nous 
mesurons dans ce cas est appelée "accélération effective” de la pesanteur, et nous la désignons par £. 


Par suite: 


En supposant que la Terre est une sphère (en fait sa forme s'en écarte légèrement) et qu'il n'y a pas 
d'anomalies locales, nous pouvons estimer que £, est dirigé vers le centre de la Terre. Le deuxième 


terme -&{(&xr) étant l'accélération centrifuge elle est dirigée vers l'extérieur. 


Puisque & est la somme de g, et de l'accélération centrifuge, la direction de &, appelée la "direction 


verticale", s'écarte en réalité légèrement de la direction radiale; elle est expérimentalement déterminée 
par un fil à plomb. Les liquides se maintiennent toujours en équilibre avec leur surface perpendiculaire 


à £. 
L'ordre de grandeur de l'accélération centrifuge est: 
Sx(æxr) = @ tr = 33910 [ms *] (30.361) 


où r est le rayon de la Terre. L'accélération centrifuge décroît de l'équateur aux pôles car le rayon de la 
Terre n'est pas constant (la Terre est aplatie aux pôles). Cette variation de l'accélération est toujours très 
petite quand nous la comparons avec la pesanteur &, & 9.80 [m' s?] mais elle explique cependant la 


plupart des variations observées de la valeur de la pesanteur avec la latitude. 


Le gradient de l'accélération centrifuge a pour effet de déplacer légèrement la direction radiale d'un 
corps qui tombe en chute libre: le déplacement est vers le Sud dans l'hémisphère Nord et vers le Nord 
dans l'hémisphère Sud. 


Considérons ensuite le terme de Coriolis. Dans le cas de la chute d'un corps, la vitesse v, est dirigée 
vers le bas. D'autre part, comme & se trouve le long de l'axe de la Terre, &*XŸ, est dirigé vers l'Ouest. 
Le terme de Coriolis -2#&*%, est donc dirigé vers l'Est; le corps qui tombe sera dévié dans cette 
direction. 


Pour un corps tombant dans un plan parallèle et tangent à la surface de la Terre, nous avons: 
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Sens de rotation 


Trajectoire espérée 
Trajectoire réelle 


Figure: 30.23 - Illustration de l'effet de la force de Coriolis avec un projectile 


C'est exactement ce phénomène que l'on observe dans le cas des cyclones (nous y reviendrons plus en 
détail dans notre étude de la météorologie dans le chapitre de Génie Météo). Une zone atmosphérique 
dépressionnaire (de faible pression relative) donnerait des courants atmosphériques (vents) convergents 
vers la dépression si la Terre ne tournait pas autour de son axe. 


N/A 


Figure: 30.24 - Génération des cyclons de par la force de Coriolis 


La force de Coriolis due à la rotation de la Terre dévie donc les vents Nord-Sud en direction de l'Ouest 
et les vents Sud-Nord vers l'Est pour un observateur se situant au Pôle Nord. Nous observons dès lors la 
formation de cyclones tournants dans le sens contraire des aiguilles d'une montre dans l'hémisphère 
Nord et inversement dans l'hémisphère Sud (à cause de la direction du vecteur & dans cette partie de 
l'hémisphère). 


Comme second exemple, considérons les oscillations d'un pendule. Pour des oscillations de faible 
amplitude, nous pouvons supposer que le mouvement du pendule se fait selon une trajectoire 
horizontale. Si l'on fait osciller le pendule initialement dans la direction Nord-Sud, la force de Coriolis 
va dévier le mouvement du pendule vers la droite pour un observateur situé au Pôle Nord. En d'autres 
termes, le pendule tourne dans le sens des aiguilles d'une montre dans l'hémisphère Nord et dans le sens 
contraire dans l'hémisphère Sud. Cet effet observable est nul à l'équateur (parallélisme parfait entre ÿ, 


et &) et maximale aux Pôles. 


Cet effet fut démontré de façon spectaculaire par le physicien français Jean Léon Foucault, quand en 
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1851 il suspendit un pendule de 67 mètres de long à l'intérieur du Dôme des Invalides. A chaque 
oscillation, le pendule faisait tomber du sable sur un cercle, ce qui démontrait expérimentalement que 
son plan d'oscillation est de 11°15' par heure. L'expérience de Foucault est une preuve frappante de la 
rotation de la Terre. Même si la Terre était toujours couverte de nuages, cette expérience aurait montré 
aux physiciens que la Terre tournait. 


Comme troisième exemple parlons des tourbillons que l'on peut observer dans la baignoire ou le lavabo. 
Ce n'est qu'une légende que ce dernier tourne différemment en fonction des hémisphères. Car la vitesse 
et la masse mises en jeu sont beaucoup trop faibles pour être observables dans de tels objets. Au fait, le 
sens de rotation est dû aux imperfections (aspérités) du siphon. Par contre, si vous allez en équateur, il 
y a des étudiants qui se font un plaisir de vous montrer que l'effet existe avec une petite expérience 
mise en place avec une allumette. En se déplaçant de dix mètres, ils vous montreront que le sens de 
rotation du siphon change en fonction de l'hémisphère dans lequel on se trouve! 


12. THÉORÈMES DE KÔNIG 


Nous avons vu jusqu'à maintenant, comment calculer le moment cinétique ou l'énergie cinétique d'un 
système dynamique par rapport à un unique référentiel (soit galiléen, soit barycentrique) 


Les théorèmes de Künig donnent eux les moments cinétiques et l'énergie cinétique totale d'un système 
dynamique par rapport à un référentiel galiléen À,, et barycentrique À, 


12.1. PREMIER THÉORÈME DE KÔNIG 


Utilisons pour démontrer ce théorème le moment cinétique d'un corps de masse M (l'exemple étant 
toujours facilement extensible à un système dynamique discret ou continu de matière). 


Exprimons le moment cinétique d'un élément #, du corps solide par rapport à l'origine O du référentiel 
galiléen À; (noté: /O,R par la suite): 


b;oR = > OA XVyg (30.362) 
E 
Exprimons le moment cinétique dans À ar rapport à son centre de masse G (noté: /@, RA'): 
dr. 
box = Dm GA XVyyp (30.363) 
E 
Le référentiel À. étant en translation par rapport à À,,,, nous avons: 
der. gai. 
Viug Vip + Vous (30.364) 
Sans oublier que: 
O4, = O0G +CA, (30.365) 
que nous insérons dans l'expression du moment cinétique: 


br = D OA XV = Dm (OC + GA |X (Pig + Voir) (30.366) 


i 
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De par la propriété du produit vectoriel, nous avons: 


bio = > OGXVp + > GA XV gs + > OCX Var DS GA XV (30.367) 


Étudions maintenant la valeur que prend chacun des quatre termes de la relation précédente. Nous 
savons par la définition du centre de masse que (dans un cadre non relativiste): 


764 û EF A TI d — _ 
s. =0—= 2 raG4 -0= 2m GA -Xn(i a) = 2 rai =(0 (30.368) 


i 


d'où: 
DETAIL Tx[ 5m | =Ù (30.369) 


et également: 


Finalement, il vient: 


bon = 2 GA XV, pe +2 OCX Var = br +OGx Ve D ra = bo + MOGX Ver 
i 1 i 


Donc finalement: 
bor = Dior + MOGXVer (20.372) 


Ce théorème qui se rapporte à un point fixe permet l'application plus aisée du théorème du moment 
cinétique. 


12.2, DEUXIÈME THÉORÈME DE KÔNIG 


Utilisons pour démontrer ce théorème l'énergie cinétique d'un corps de masse M (l'exemple étant 
toujours facilement extensible à un système dynamique discret ou continu de matière). 


Exprimons l'énergie cinétique d'un élément >, du corps solide par rapport à l'origine O du référentiel 
galiléen À; (noté: /O,k par la suite): 


Exprimons l'énergie cinétique dans À, par rapport à son centre de masse G (noté: /&, À"): 
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Avec de même que précédemment: 


Il vient dès lors: 


E so … =Y FEV; 2 _ =Y 78; | Vu Ver | (30.376) 

2 2° 

o] 1 

et donc: 
E _. F2, +9 m5 +118 om =£Æ + lune Re. 
ao nier a 2 PE Voir ns 2 PE Vip Voir  Éeçir ME VGir Voir 2 PE Vip 
2 i 2 i 2 i ? : 
(30.377) 


et comme pour le moment cinétique, de par la définition du centre de masse, nous avons: 
Si. =0 
2 rave © 0 (30.378) 

d'où le deuxième théorème de Kônig: 


E 


1-2 . 
or © Ecrire * San (30.379) 


13. MOUVEMENTS OSCILLANTS 


Le mouvement oscillatoire est le mouvement d'un corps qui va et vient de part et d'autre de sa position 
d'équilibre. Il existe une quantité incroyable de phénomènes physiques de ce genre. Nous allons traiter 
dans cette section les grands classiques à partir desquels les développements sur des phénomènes plus 
complexes s'inspirent. 


Nous étudierons dans l'ordre les pendules des plus simples aux plus complexes et utiliserons souvent 
des résultats antérieurs pour en déterminer de nouveaux. 


Nous retreindrons notre étude des mouvements oscillatoires aux pendules. Les autres viendront au fur 
et à mesure dans leurs chapitres respectifs. 


Il existe neufs pendules très connus qui sont les suivants (ordre dans lequel nous les étudierons): 
pendule de Newton, pendule simple, pendule physique, pendule élastique, pendule conique, pendule de 
torsion, pendule de Foucault, pendule de Huygens. 
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13.1. PENDULE DE NEWTON 


Nous n'allons pas trop nous étendre à décrire le pendule de Newton. Une photo suffira: 


(es) 


Figure: 30.25 - Pendule de Newton 
Le principe de fonctionnement est le suivant: 


Si vous lancez une bille, à l'extrémité une seule et unique bille se déplacera. Cela semble logique et 
cohérent d'après la conservation de la quantité de mouvement qui découle de la conservation de 
l'énergie comme nous l'avons déjà vu. 


Un peu plus curieux, lorsque vous lancez initialement deux billes, ce sont deux billes qui se déplacent à 
l'autre extrémité! 


La démonstration est simple et le fonctionnement se base sur une condition très simple que nous allons 
déterminer pour le cas particulier de deux billes (c'est toujours le même principe pour un nombre de 
billes supérieur): 


Soient p,;,p,; les quantités de mouvement des deux billes initiales et ?,,,2,, celles des deux billes se 


situant à l'autre extrémité. Nous avons donc: 
PaVy + MBVa © avis Ÿ MhVag (30.380) 


Nous avons pour l'énergie cinétique: 


PV (30.381) 


ir nr +1 
SE 


2 


après regroupement et simplification de chacune des deux relations précédentes: 


PA Vi) © PH(Vo y Va ) _—_. 
MC = V) = MU vE ) 


De la deuxième relation ci-dessus nous avons: 


A (Vs A Nm +usl= ml, va lv +v2;]1 (80.383) 
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En divisant par la première il reste: 


(V; + | = IV +Vs; | (30.384) 


Nous en tirons: 


Ms =Vf +Vs; — Vi; 
Vip = ENV 


(30.385) 


Injectons la première de ces deux relations dans: 
PA (Vs — M |= Pa (Vas — Va | (80.386) 
Nous avons alors: 
Pa (vis — (Vas + Var = )l= #0 (vos — va | (80.387) 


Ce qui nous donne en réarrangeant: 


Va (PE Pa) +2 
Vpn (30.388) 
a + M 


Au final en procédant de même pour l'autre vitesse finale, nous déduisons l'expression des deux vitesses 
après le choc élastique: 


VO Te) +2 VO 2) + ravi so 
a a. OU. 


Pa +, : Pa +, 


Hypothèse: Supposons maintenant qu'en prenant une seule des billes avec v,, = 0, il y en ait deux qui 
partent à l'autre extrémité tel que: 


_ (7% #8) Vo = 2 Vi 
Pa +, 1 Oomtm, 


(30.390) 


et dans cette dernière situation considérons le cas où toutes les billes du pendule de Newton ont la 
même masse (cas correspondant à celui que l'on trouve dans le commerce). Alors: 


M = M My =Ù0, Vi = Vi (80.391) 


Nous voyons que notre hypothèse initiale est fausse: si à masses égales, une seule bille est lancée alors, 
à l'autre extrémité, une seule bille partira de par la conservation de la quantité de mouvement 
(hypothèse des "chocs élastiques")! 


Par contre, si nous lançons deux billes dans un pendule de Newton composé de masses identiques nous 
avons après simplification des équations: 
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deux billes qui partent à l'autre extrémité. 
Il suffit de procéder à des raisonnements identiques pour 3, 4, 5, … billes. 


OIC.Q.F.D. 


13.2. PENDULE SIMPLE 


Soit, T la période de temps nécessaire pour qu'un pendule simple (voir figure ci-dessous) parcoure un 
cycle complet et que l'on peut écrire: 


qui est donc l'inverse de la "fréquence propre" du système en l'absence de frottement. 


O 


* 


Figure: 30.26 - Pendule simple 


Lx 


La variation de l'énergie potentielle du système étant: 


LE, =m'g'h-m£g'h=m'g'(h-h)=m'g'(l'cosæ- L'cos%) (30.394) 


Pia 


#" v? et que la conservation de l'énergie nous permet de poser: 


ml 


Nous savons que AF, = 


ÂF, = AA (30.395) 
Après simplification nous obtenons: 


v? =2: g'L'(cosæ cos a) (30.396) 


Nous pouvons exprimer & par rapport à la distance parcourue par le pendule: 
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Si nous revenons à: 
v?=2:g'L: (cos —cos a) (30.399) 
et que nous le dérivons, nous obtenons: 


dv 


, da V LE: (x 
2':v'—=2'g'l'sanæ' — nr sin|— again (30.400) 


dt d£ 


Si l'angle & est petit, nous pouvons remplacer avec l'aide de la série de Taylor (cf. chapitre de Suites Et 
Séries) et sans erreur trop grave, sin & par le premier terme de son développement en série: 


3 ra 


sinŒTœ-—+—-... (30.401) 
31 5! 


X 
et comme = 7 nous obtenons: 


Etant donné que dans un cadre périodique: 
=@æ*'x (30.403) 


nous pouvons alors écrire que: 
æ?=£ (30.404 
L 


d'où: 


Es 
æ@=.|* (30.405) 
{ 


27 
Comme & = T7 nous pouvons poser: 


Es 


T£=27".|— (30.406) 


Lust 
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Donc la période de balancement est indépendante de l'amplitude ce qui explique pourquoi le nombre de 
balancements par minute d'un pendule simple est constant, quelle que soit l'ardeur que nous mettions à 
le faire balancer... Nous parlons alors "d'isochronisme”. 


SI: 
L=i,+N':2P (30.407) 


où 4 est la position du centre de masse de l'objet et N le nombre de maillons éventuels que l'on aurait 
pris pour la longueur L de la chaîne et P étant le pas de la chaîne. 


T227 RUE (30.408) 
E 


Nous appelons "pendule physique" un solide quelconque pouvant osciller librement dans la pesanteur, 
autour d'un axe À, avec une petite amplitude (8 < 5°). 


Ce qui nous donne finalement: 


13.3: PENDULE PHYSIQUE 


Son mouvement est déterminé par l'équation suivante: 


2 
M Ji (30.409) 


où M est le moment de rappel et J, le moment d'inertie du pendule par rapport à son axe d'appui A. 


En faisant une analyse des forces sur notre pendule nous obtenons une autre relation pour M: 
M=-m'g'r=-m'g'd'an8=-m'g'd'f (30.410) 


pour - #4 £&8£<& et où d est la distance de l'axe d'appui du pendule à son centre de masse. Le terme 
négatif apparaît ici pour exprimer le fait que la période diminue avec le temps. Comme l'angle 8 est 
petit, nous avons remplacé sin 8 et sans erreur trop grave par le premier terme de son développement 
en série de Taylor: 


3 
do (30.411) 
31 5! 
Donc le moment de rappel peut s'écrire: 
d?8 a 
M=Jy =-m g'd 8 (80.412) 


d'où l'équation différentielle du mouvement: 


d?8 d°8 [m'g'd _ 
Jim gd 8-08 — + :8=0 (30.413) 


dt? 
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Nous avons vu dans les mouvements harmoniques oscillants que nous obtenions la position angulaire 
d'une masse par la relation: 


9 = 8, sin(@'£f) (30.414) 
ce qui nous permet d'écrire: 


2 . . . : “ . 
d*(& sin(@ 2. fr £ À] « in(e 9 =-80° sn(a2 + [M E4]8 sata 
A 


dt? JT, 
(30.415) 
et par simplification nous obtenons: 
p= "EE ae 
Ja 
d'où: 
T=0x La (30.417) 
m'g'd 


En exprimant le moment d'inertie J, au moyen du théorème de Steiner en déduisons que: 
Ja=Jçt+m'd? (30.418) 
et en introduisant encore le rayon de giration k: 
Ji =m'k?+md? (30419) 


d'où: 
k? 
J,=m'd" E +4) (30.420) 


Soit x la position de l'axe de rotation A mesurée par rapport à une origine quelconque et a la position du 
centre de gravité par rapport à la même origine nous avons: 


d'=|x-al (30.421) 


tel que représenté ci-dessous: 
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Figure: 30.27 - Pendule physique dit "pendule d'inertie" 
d'où: 


k? 


= 


mal | «kdl (30.422) 
& 


ce qui nous donne aussi pour la période: 


comme la racine nous gêne nous élevons le tout au carré, ce qui nous donne finalement 
—— +|x- 4] (30.424) 


Comme nous connaissons x et T, cette relation nous permettrait à partir du tracé d'un graphique de 
déterminer la position de G et k. 


Ainsi, en portant sur un graphique 7°? en fonction de x: 


Tè 


Figure: 30.28 - Illustration de l'asymptote vertical pour la détermination du centre d'inertie 
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La courbe obtenue présente une asymptote verticale (7 = « ) pour x = 4 et deux minima. 


En dérivant T? par rapport à x et en annulant les dérivées, nous trouvons la position des minima: 
x=atk (30.425) 


13.4. PENDULE ÉLASTIQUE 


Étudions maintenant les oscillations propres d'un solide suspendu à un ressort élastique tel qu'il oscille. 
Après l'écart du solide de la position d'équilibre, il accomplira des oscillations harmoniques dans le sens 
vertical, si le ressort élastique subit des déformations proportionnelles à l'allongement du ressort. 


Nous aurons souvent dans ce site à faire avec de petits mouvements autour d'une position d'équilibre. 
Ce type de mouvement caractéristique de ce que nous appelons un "oscillateur harmonique" est très 
fréquent. Il se généralise à toutes sortes de situations physiques, telles que les circuits RLC (cf. chapitre 
de Génie Électrique), le modèle quantique corpusculaire et ondulatoire de l'atome, les résonateurs à 
quartz ou toute autre structure vibrante faiblement autour de son point d'équilibre. 


Nous savons que la force de rappel d'un ressort est proportionnelle et opposée à la déformation telle 
que (voir le chapitre de Génie Civil pour la démonstration): 


F =ma=-k" AL (30.426) 


L'équation différentielle de l'oscillateur harmonique peut donc s'écrire: 


d?x  k (30.427) 


Nous prendrons la démarche très simple qui consiste à essayer une solution, en l'occurrence: 


<= cos toû (30.428) 
C'est une solution, car en effet: 

dx . 

— = -œsin(@t) 

dt (30.429) 

d?x 

—+ - cos(@f) 

dt 


pour autant que nous prenions la fréquence propre: 
Æ (30.430) 

œ=,[— 

Lc: 


(30.431) 


Nous avons aussi le "mode propre": 


x = sin(@é) 


comme solution. 
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Une solution générale est donc: 


x (#) = Asin (@)+ Bcos(æt) (07 


Pour trouver À et B, il faut spécifier les conditions initiales. Prenons par exemple: 
x=N y» y, (30.433) 
à {=0. 


Nous avons alors: 


x(t=0)=8-A 
vd) = Amcos (ot) - Basin (æf) (°0459 
v (0) = A@ = v, 


Calculons maintenant le travail (énergie) nécessaire pour déformer l'oscillateur harmonique. Nous 
avons: 


WF = [Fax = f'adx = & [xdx = SE xè = xè| = SEA (30.435) 


Ainsi, l'énergie potentielle élastique dans un ressort de constante k, ayant subi une déformation x est 
donc donnée par: 


kx°?| (30.436) 


Pour une description plus réaliste, une meilleure modélisation, nous allons supposer que l'oscillateur est 
soumis à une force supplémentaire représentant les frottements. Il arrive souvent que l'approximation 
par laquelle la force de frottement est proportionnelle à la vitesse, et opposée à la vitesse, soit une 
bonne approximation. Ce n'est pas la seule possible, et ce n'est pas toujours la meilleure. Nous parlerons 
des forces de frottement plus tard. 


Ainsi nous considérons une force de friction de la forme (ne pas confondre avec la notation du moment 
cinétique qui n'a absolument aucun rapport): 


# __,=+ (30.437) 
Pour notre système de coordonnées: 
dx (30.43 
F,--2% (30.438) 
dt 
La deuxième loi de Newton impose: 
d?x dx (30.439) 
—="kx-b— 
à dt 
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Pour se conformer à une notation usuelle dans le cadre de l'oscillateur, nous notons: 


k b 30.440 
2 7 _=y ( ) 


d'où l'équation différentielle: 


2 
LE "s La +@2? x=0 (30441) 
d£ d£ 


Nous prenons la fonction d'essai: 


__ at (30.442) 


En substituant, nous trouvons: 
et (4° Fe 2 2) + &) = 0 (30.443) 


Comme nous cherchons des solutions non nulles e #2 20 ) il faut que: 


d'où: 
A -YTY TS (20445) 
AY 2 @&, 


et la solution générale est: 


+ 


x(0) = 4e % + 4e" = 9" (at + 4e " (30.446) 


où deux constantes sont déterminées par les conditions initiales. 


Nous verrons qu'il correspond à un amortissement faible. En effet, nous pouvons écrire avec des 
racines carrées réelles: 


Aa= vip =-ypsife -7 Goaun 


et la solution générale peut alors s'écrire: 


x()= 8e" CAT + 4e ir?) (30.448) 


En utilisant les propriétés complexes des exponentielles et en particulier la "formule d'Euler" (cf. 
chapitre sur les Nombres): 
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zx(6) = e*|A4e*t Li” Ae"v° il. 


À, cos| J& - y'i\+i4 sin| Je - y 
+4 cos|- fai _ v°é |+i4, sin(-/a) = v'é| 


(30.449) 


Choisissons 4 = À, et rappelons que sin(—-&æ) =-sin(æ) (cf. chapitre de Trigonométrie). Aïnsi: 


x(£) =e* |A cos| Aa — p£i+ À, cos| fai — y] (30.450) 


et comme nous avons aussi cos(-æ) = cos(&æ). Alors: 


x() =e "24 cos| Jei - ÿh\=e"*C'cos| Je? —y#| (30.451) 


posons & = Jai - y? et comme la fonction trigonométrique est périodique à # = +2£7T avec ke N 


alors: 
x(t) =e "Ccosiæét+#i (30.452) 


L'allure générale de la x{£) normalisée à l'unité est la suivante: 


Figure: 30.29 - Illustration de l'amortissement de l'amplitude d'une pendule élastique 


Quand @, =} nous disons qu'il y a "amortissement critique", quand , qu'il y a "amortissement 
o 


œ,<Y 
sur-critique”. 


Le rapport: 


est quant à lui appelé "facteur de qualité”. 


13.5: PENDULE CONIQUE 


Le pendule conique consiste à prendre une masse m considérée comme ponctuelle et suspendue en 
A d'un fil ©4 = Z fixé en O. 


La masse étant écartée d'un angle & de la verticale, l'objectif de ce pendule est fréquemment (car c'est 
le cas le plus simple) de déterminer la dépendance entre l'angle et la vitesse si l'on considère que les 
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trajectoires sont circulaires. 


Figure: 30.30 - Illustration du pendule conique 

La masse m se déplace autour de la verticale OC, en décrivant un cercle de rayon: 
r =CA= OAsinæ=Zsinæ (30.454) 

Les forces suivantes agissent sur la masse m: 


2 2 2 
or | (30.455) 
ue) = mo R = m@°Lsin æ 


Fy a L sin & 


tan ==" (30.456) 
Fe F4 
ou, comme: 
sin & 
tan & = (30.457) 
cos æ 
alors: 


cosæ=# (30.458) 
@£ 
L'angle & est donc d'autant plus grand que la vitesse angulaire & est élevée, ce que confirme 
l'expérience. Pour cette raison, le pendule conique fut longtemps utilisé comme régulateur de vitesse 
sur les machines à vapeur (il ferme l'arrivée de vapeur quand la vitesse dépasse une limite fixée à 
l'avance et l'ouvre quand elle tombe au-dessous de cette valeur). 


Nous avons aussi: 


Page: 1796/4839 


[v3.0 - 2013] 


cos & = j2 sin & 
BE Fr cos FE - COS TA 0.459) 


d'où après simplification: 


v= LE ina G0.460) 


13.6. PENDULE DE TORSION 


Le pendule de torsion est un système qui fut utilisé par Coulomb pour la mesure de la charge électrique 
élémentaire et par Cavendish pour la mesure de la constante gravitationnelle G. 


Le pendule de torsion consiste en un solide rigide suspendu à fil de torsion vertical. Lors des 
oscillations le fil exerce un moment de rappel que l'on supposera proportionnel à l'angle de torsion 8: 


M = -k8 (30.461) 
où k est la "constante de torsion" de ce fil particulier (cf. chapitre de Génie Mécanique). 


Nous avons donc: 


2 
M=J, _ =-X9 (30.462) 
Ê 


soit l'équation différentielle: 


LEURS O (30.463) 
dt? J 


£ 


Par analogie avec le pendule physique où nous avions une équation différentielle identique à un facteur 


près, il vient: 
FT IT Des (30.464) 
& 


Le pendule de Foucault est une expérience formidable pour rendre compte de la rotation de la Terre. Il 
existe plusieurs méthodes mathématiques pour analyser le comportement du pendule de Foucault. Nous 
avons choisi de présenter la plus simple qui ne nécessite que peu de pages de calcul. 


13.7. PENDULE DE FOUCAULT 


D'abord un petit texte explicatif peut s'avérer pertinent tellement cette expérience est importante. 


L'expérience de Foucault a pour but de démontrer que la Terre tourne sur elle-même. Vous lancez un 
balancier (une bille de plomb au bout d'un fil). Il a un mouvement de va-et-vient régulier dans la même 
direction. Si vous l'emportez dans une voiture et que vous ne tournez pas trop brusquement, le pendule 
se moque des virages: il continue à battre dans la même direction. C'est qu'un pendule reste toujours 
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dans le même plan, malgré les mouvements de son support. 


C'est pourquoi le physicien français Léon Foucault eut l'idée d'attacher un lourd balancier de 67 mètres 
de long sous le dôme du Panthéon, en présence de Napoléon III et de quelques savants. À chacune de 
ses allées et venues, le pendule venait écorner un tas de sable où il laissait une marque. Or, la trace 
n'était jamais à la même place: il y avait 3 à 4 millimètres d'écart entre un balancement et le suivant, 16 
secondes plus tard. Le pendule restait dans le même plan, mais le Panthéon, Paris, la Terre tournaient! 


Soit la figure ci-dessous: 


Axe de rotation 


Figure: 30.31 - Illustration élémentaire du pendule de Foucault 


Nous considérons que c'est la vue d'un référentiel géocentrique (la Terre) vu en coupe selon un plan qui 
contient l'axe de rotation. 


La taille du pendule est bien évidemment exagérée sur la figure. Il oscille cependant quand même dans 
un plan méridien, entre À et B (un observateur terrestre voit la droite AB tourner par rapport au sol 
terrestre selon le cercle vert, vu en perspective, dans le sens rétrograde). 


Soit T la période de rotation de A (ou B). La vitesse de À (v, ) , sur ce cercle, est due au fait que, dans le 


référentiel géocentrique, le point M, à la verticale du point de suspension, et le point du sol terrestre 
coïncidant avec À à un instant donné, n'ont pas la même vitesse dans le référentiel géocentrique: le 

point M étant plus éloigné de l'axe de rotation terrestre il va plus vite que A (de même la vitesse de 
B étant supérieure à la vitesse de M). 


La différence de ces vitesses se calcule aisément en supposant que la rotation terrestre est uniforme en 
raisonnant sur une période d'une journée (sidérale) 7. 


Nous savons que: 
NT 
v=@'r=— (30.465) 
T 


De ceci il découle facilement que: 
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27T 
AV = — (ru ra) (30.466) 
T 


étant donné que dans le triangle AHM: 
Pa Ta = AM = AM'sin À (30.467) 


alors: 


27 
Av = — AM sin À (30.468) 
0 


Or, A n'est autre que: 
v, =— AM (30.469) 


Donc: 


To 


sin À 


T = (30.470) 


Nous avons donc obtenu l'expression de la période du pendule de Foucault. 
Exemple: 


La période du pendule du Panthéon (aller et retour) est de 16.5 secondes, l'amplitude maximale de 6 
mètres et le temps d'amortissement de 6 heures. Nous pouvons ainsi observer un déplacement de 
plusieurs millimètres par aller et retour du pendule. 


Remarque: Le sens de la rotation est celui des aiguilles d'une montre, pour un observateur placé 
au-dessus du pendule, dans l'hémisphère Nord ; et dans le sens contraire du sens de rotation des 
aiguilles d'une montre dans l'hémisphère Sud. 


Aux pôles (où l'angle est de 90° et le sinus unitaire), la période du pendule égale celle de la Terre et est 
donc de 24h. A l'équateur (où l'angle est de 0° et le sinus nul), la période de rotation du plan 
d'oscillation est infinie: le plan d'oscillation est fixe par rapport à la Terre. A Paris (où l'angle est de 
48°52' et le sinus 0.75), la période de rotation est de 31 heures et 57 minutes. 


Cependant, l'importance du pendule de Foucault est autre. 


Le plan d'oscillation du pendule est en réalité fixe et c'est la rotation de la Terre sur elle-même qui 
donne lieu à une rotation apparente. Mais finalement. quel est le système de référence ? 


En effet, tout mouvement est relatif. Si la Terre est en rotation, elle l'est par rapport à quelque chose. 
Nous ne pouvons pas parler d'un mouvement sans définir un cadre de référence. La question qui se 
pose donc est de savoir par rapport à quel système de référence le plan d'oscillation du pendule est fixe. 


La première idée qui vient à l'esprit consiste à dire que le plan du pendule est fixe par rapport au Soleil. 
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Mais, si Foucault avait réussi à construire un pendule capable d'osciller suffisamment longtemps, disons 
pendant un mois, il se serait aperçu que le plan d'oscillation dérivait également par rapport à la position 
du Soleil. Notre étoile ne fait donc pas partie du système de référence en question. 


Peut-être faut-il alors considérer les étoiles proches du Soleil ? Mais là aussi, si l'expérience pouvait 
durer suffisamment longtemps, elle montrerait que le plan des oscillations se déplace nettement par 
rapport aux étoiles après quelques années. Quel objet choisir dans ce cas ? Le centre galactique, la 
galaxie d'Andromède, le Groupe Local, le superamas local ? Chacun de ces objets donnerait l'illusion 
d'être fixe par rapport au plan des oscillations, mais finirait, après un temps de plus en plus long, par 
révéler une dérive. 


Finalement, en dernier recours, nous pouvons considérer les objets les plus lointains, les galaxies ou 
quasars situés à des milliards d'années-lumière. Avec ce système de référence, et si l'expérience de 
Foucault était réalisable, le plan des oscillations serait enfin fixe et il n'y aurait plus de dérive. Ce n'est 
donc qu'en considérant les objets les plus lointains, en fait l'Univers observable dans son ensemble, que 
nous pouvons obtenir un cadre par rapport auquel le plan des oscillations se stabilise. 


Le pendule de Foucault se moque donc de la présence de la Terre, du Soleil ou de la Galaxie. Son 
mouvement lui est directement dicté par l'Univers dans son ensemble. Cette expérience met en 
évidence une sorte de lien mystérieux entre chaque point et l'Univers tout entier. Jusqu'à nouvel ordre, 
la nature de ce lien reste inconnue. 


Une conclusion similaire fut tirée par le physicien autrichien Ernst Mach à la fin du XIXe siècle (nous 
retrouverons le "principe de Mach" dans le chapitre de Relativité Restreinte). 


D'après la physique de Newton, le produit de la masse d'un corps par son accélération est égal à la force 
qui s'exerce sur lui. Par conséquent, pour une force donnée, plus un objet est massif, plus son 
accélération est faible. De ce point de vue, la masse est donc une mesure de l'inertie du corps, c'est- 
à-dire de sa faculté à résister à une force. 


Supposons maintenant que toute la matière de l'Univers disparaisse, excepté pour ce corps. Ce dernier 
est alors complètement isolé et plus aucune force ne s'exerce sur lui. Cela signifie, d'après la physique 
de Newton, que le produit de sa masse par son accélération est égal à zéro. Or l'accélération ne peut pas 
être nulle. En effet, comme toute la matière de l'Univers a disparu, il n'y a plus de système de référence 
par rapport auquel on pourrait définir la vitesse ou l'accélération. Cette dernière est donc indéfinie et 
non pas nulle. D'un point de vue mathématique, il ne reste qu'une seule possibilité, que la masse du 
corps soit nulle. 


Ce raisonnement montre que la masse et l'inertie d'un corps ne sont pas vraiment des propriétés de 
l'objet lui-même, mais plutôt le résultat d'une interaction avec le reste de l'Univers. Tout comme le 
pendule de Foucault, le principe de Mach nous montre qu'il doit exister une sorte de connexion entre 
les propriétés locales d'un corps et les propriétés globales de l'Univers. Comme dans le cas précédent, la 
nature de cette connexion mystérieuse reste à déterminer. 


13.8. PENDULE DE HUYGENS 


Nous cherchons à construire un pendule dont la période soit indépendante de l'amplitude (et non pas 
juste en approximation comme nous l'avons vu plus haut!), ce qu'il est d'usage d'appeler "l'isochronisme 
rigoureux". Pour cela nous disposons deux lamelles de forme cycloïdale à des positions symétriques et 


déterminées telles que représentées sur la figure ci-dessous: 
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Figure: 30.32 - Principe du pendule de Huyghens 


Le choix de la cycloïde est dû au fait qu'il s'agit d'une courbe "brachistochrone" (voir la définition plus 
bas) et depuis les travaux de Huygens en 1659, nous savons aussi qu'il s'agit d'une courbe "tautochrone" 
(les balanciers dans les montres modernes ont par tradition cette forme). C'est-à-dire que les corps qui 
tombent dans une cycloïde renversée arrivent au point le plus bas dans le même temps, de quelque 
hauteur qu'ils commencent à tomber. 


Donc contrairement à une idée reçue, le chemin le plus rapide pour un corps en mouvement non 
horizontal tombant sur un support solide n'est pas la ligne droite. 


En effet, l'un des problèmes les plus connus de l'histoire des mathématiques est le problème du 
brachistochrone qui consiste donc à trouver la courbe le long de laquelle une particule glisserait d'un 
point à un autre en un minimum de temps en étant soumis à un champ uniforme de pesanteur. Ce 
problème a été posé par Jean Bernoulli en 1696 comme un challenge pour les mathématiciens de son 
époque (et s'en fut un !!!). La solution fut trouvée par Jean Bernoulli lui-même ainsi que par son frère 
Jacques Bernoulli, Newton, Leibniz et le marquis de l'Hospital. Le problème brachistochrone est 
important dans le développement des mathématiques et s'avère être une des applications principales de 
la méthode du calcul des variations. 


Nous considérons dans le champ de la pesanteur deux points a et b et un point matériel m se déplaçant 
sans frottement sur une courbe d'extrémités a et b. Déterminer la courbe, appelée brachistochrone, pour 
laquelle le temps de parcours est minimal lorsque le point m part du point a avec une vitesse nulle. 


Considérons le schéma ci-dessous: 
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Figure: 30.33 - Chemin quelconque pour attaquer le problème sans biais 


A l'abscisse x sur le graphe, l'énergie potentielle perdue est Æ, = #gy, équivalente à l'énergie cinétique 
acquise par le point matériel depuis le départ telle que: 


1 
— my? = mgh (30.471) 


È 


D'où sans trop de surprises: 


V=, l2gh (30.472) 


La vitesse v est mesurée le long de la courbe si bien que nous devons réécrire l'expression en 
composantes horizontales et verticales: 


Nous allons poser que s représente l'abscisse curviligne et ds l'accroissement de cette distance le long de 
la courbe. dx et dy représentent les composantes horizontale et verticale de ds. 


Ainsi: 
- ds/dt représente la vitesse le long de la courbe 
- dx/dt représente la composante x de la vitesse 


- dx et dy sont données par le théorème de Pythagore exactement de la même façon que nous l'avions 
fait dans le cadre de notre étude du formalisme lagrangien. 


eds 
dt 


2 
A) PRE 1+(y'{x)) (30.473) 


En insérant l'équation obtenue d'après les principes de la dynamique: 


à 
2870) = LG) (30.474) 


Une simple intégration nous donne alors l'expression de t à minimiser: 


Nous nous retrouvons avec une fonction similaire à celle que nous avions lors de notre étude d'un cas 
pratique du formalisme lagrangien. 


Il s'agit maintenant de trouver le minimum atteint par t parmi toutes les fonctions y(x) satisfaisant: 
y{x=0)=0,y(x=a)=à (30.476) 


Le problème fondamental dit du "calcul des variations" consiste à chercher, parmi les fonctions 
y = f(x) continâment dérivables sur un intervalle donné [a,b] et pour lesquelles les fonctions f(a) et 
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f(b) sont des valeurs données, celles qui rendent maximum ou minimum l'intégrale précédente. 


Pour appliquer cette méthode, nous partons de l'équation d'Euler-Lagrange (cf. chapitre de Mécanique 
Analytique): 


a (een) an 0 (30477) 


dx dy y 
qui donne les extremums de l'intégrale. 


Identiquement à un exemple que nous avons vu le cadre de notre étude du formalisme lagrangien (cf. 
chapitre de Mécanique Analytique) nous posons dans notre cas: 


Z(x,y,y) = fo (30.478) 


Donc: 


æ 
2y' (30.479) 
OZ _ 2æ __Y" | 2æ | Y' 
ftp? 2oN1+r" +2 2e 
2gy 


Nous souhaitons injecter des deux dernières relations dans l'équation d'Euler-Lagrange: 


s(RGxn) Een = 0 (30.480) 


dx dy dy 


mais nous anticipons relativement facilement que la dérivée par rapport à x va nous donner un monstre 
indigeste à simplifier (j'ai essayé... mais j'ai l'excuse de ne pas être doué pour les maths). 


Nous allons alors utiliser l'identité de Beltrami démontrée dans le chapitre de Mécanique Analytique qui 
s'écrit avec la notation choisie ci-dessus: 


A 
Z—y'—=c"* (30.481) 


dy" 
ce que nous avons le droit de faire puisque la condition de Beltrami est ici satisfaite: 


œ = 0 (30.482) 
hs 


Ce qui nous donne: 
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Le c* (30.483) 


Mr 


Soit après réarrangement: 


+2 +2 y' _ Vi+»* J+»2- # (30.484) 


| 


de es re fre 


donc au final: 


1 


A+»°.f22 


 nte 
€ (30.485) 


ou autrement écrit: 


patyt)= 1 2K Go) 
Dec? 


où la constante n'est autre que -D, l'altitude minimale atteinte par le point mobile. Plus explicitement: 


| 1 
vf+y*)= er = (30.487) 


Il faut donc résoudre cette équation différentielle pour trouver la fonction qui donne le chemin le plus 


rapide. Mettons-la sous la forme: 
(8) = K (30.488) 
dx 


et rappelons que nous avons: 


d 
D = tan 9 (30.489) 
dx 


Nous avons alors (cf. chapitre de Trigonométrie): 


2 a! Ÿ 
yl1+tan É neS re (30.490) 


D'où: 


y = K cos’ 8= © (1+005 (26) (30.491) 


Remarquons que nous avons (toujours en utilisant des relations trigonométriques remarquables): 
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ee 0. _ À pin(28) = -—" K2tan 8605? 8=-2K cos? 8 
an 


49 dyd® tn 


(30.492) 
(1+cosi28)) 
TR — — =-K|1+cos( 28] 
Donc: 
Lu =-—K{1+cos(28)) (30.493) 

Ce qui est facile à intégrer (cf. chapitre de Calcul Différentiel Et Intégral): 

X= -k(e Pt 28 ) +cfe = - «(e Ra 28 ) + cie 

2 2 2 (30.494) 


=— . 28+sin(28\1+c"° 
Nous avons donc à ce point (pour rappel): 


x =< 28+sin(2811+cf° 


(30.495) 
&, PERS 
y=—{l+cos(28)] 
2 
Posons pour simplifier l'écriture # = 29, nous avons alors: 
K. . te 
X=-—|æ+sanæi+e 
2 (30.496) 


K, | 
y=—i{l+cos æi 
2 
Rappelons maintenant que nous avons la condition initiale: 
y(x=0)=0 (30.497) 
et comme K est non nul, cela impose que: 
cos(&,-p )=—1 (30.498) 


et donc que: 


dy=0 =-7T (30.499) 


Dès lors, nous devons avoir: 
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= (-r+sini-x)) +6 = 0 (30.500) 
et nous en déduisons immédiatement que: 


FT 
ce = (30,501) 
Dès lors: 


K. . £7 
Un Dir 


(30.502) 
K. 
=—(1l+cosæ) 
2 
Pour clore, faisons le changement de variable traditionnel: 
X=@-7 
KE (30.503) 
a =— 
2 
Il vient alors: 
x=-al(g-7\+sn(g-7ril-ar-=-alp+sin(g-7ril=-alp-san(pi 
(30.504) 
y=ail+cosæi=all+cos @-7ril=all-cos(æil 
Donc au final: 
x=-al@-sin(@i 
(30.505) 
y=all-cosiæil 


Comme le signe du coefficient a de x n'a que pour effet une translation sur l'axe des X, il est d'usage de 
représentation cette paire d'équations sous la forme: 


x=al8-sin8) 
(30.506) 
y=all-cos8) 


En posant 4 = 1 nous avons dans Maple 4.00b: 


>plot([theta-sin(theta),1-cos(theta),theta=0..6*Pil); 
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0.5 


Ô 2 4 ô 8 10 12 14 16 18 
Figure: 30.34 - Tracé de la cycloïde avec Maple 4.00b 


Donc à comparer par rapport aux réponses intuitives de la courbe la plus rapide que donnent souvent 
les humaines par intuition (en rouge la courbe brachistochrone): 


Figure: 30.35 - Comparaions de la brachistochrone avec les autres chemins intuitifs (source: Wikipédia) 


Soit les dérivées: 


. = a(1 -cos 8) 

ss (30.507) 
D = a sin 8 

48 


Ainsi: 
(d,2)° + (4,7) = a? [E - 2c058+ cos? 8) + sin? 8] = 2a?(1-cos8) (30.508) 
La conservation de l'énergie: 


1 2 
tué = mgy (30.509) 


s'écrit donc: 
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v= . = 22 (30.510) 
£ 


d'où: 


+ 2 ss 
ads VG Guy) Laÿ2(r code las cosin 
Pey fe f2gail-cos 9) £ 


Donc le temps requis pour aller du haut au bas de la cycloïde que décrit le pendule de Huygens est: 


LÉ 
T = j fhae-r ft (30.512) 
oVe g 


Cette durée ne dépend donc que de paramètres fixes. 


L'énoncé en 1696 du problème brachistochrone peut être considéré comme l'authentique acte de 
naissance du calcul des variations, car c'est ce problème qui suscita la recherche de méthodes générales 
progressivement élaborées au cours d'une véritable compétition. 


Remarque: Une ligne brachistochrone d'une surface est une courbe sur laquelle doit glisser sans 
frottement un point matériel pesant placé dans un champ de pesanteur uniforme de sorte que le 
temps de parcours soit minimal parmi toutes les courbes joignant deux points fixés. Autrement dit, 
ce sont les lignes les plus courtes en temps, alors que les géodésiques (cf. chapitre de Relativité 
Restreinte) sont les lignes les plus courtes en distance. 


13:9; PENDULE DOUBLE 


Le problème du pendule double est un exemple classique d'application du formalisme lagrangien et de 
la théorie du chaos et donc in extenso un joli exemple scolaire de physique non linéaire. 


Voici comme ce dernier est souvent représenté (les coordonnées x et y sont positives sur les deux axes 
représentés ci-dessous!): 
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Figure: 30.36 - Illustration du pendule double 


La position de la masse »a sera donnée par les coordonnées (x,») et celle de la masse »+, - solidaire 


de #à et donc non indépendante - sera donnée par les coordonnées (x, »2). 


Le mieux est de réduire l'étude du système en passant par les coordonnées généralisées (& &) via les 


transformations: 
ñn =A sang M =A cos (30.513) 
et: 
2 = A + sin & Ya = +lacosé (30.514) 


Donc en coordonnées cartésiennes et en utilisant la notation traditionnelle du formalisme lagrangien, 
l'énergie cinétique est alors: 


L.._ 3. %, 
= —#AUÛ +5 #22 (30.515) 


2 
et comme: 
_læ|_|la as] R ) -t 4 cos 
| l&ln dt k cos 4 ‘L-4 sin & (30.516) 
E 2 - : 3 : 
= \f(a & cos) +(-4 4 sin 4) = PE cos 4 + sin? 4 = 4. 
et: 
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dF, À sin 4 +, sin & 


aix difatäsnæ || |a 
dé CAR | [as cos +2 cos 6, 


dt  +hcosd 
fe cos 4 +L6, cos 6 | 


Va = 


= (A4 cos & +L8 cos& +(-14 sin & - 6, in& 


là sin 4 —- 26, sin 8 
242 2 5 À 242... 2 (30.517) 
_ fé cos" & +2hL846 cos & cos & +58" cos" & 
HS sin? 4 +24L48, sin 8 sin & +26 sin? & 
= IE +156 + 21488, (cos & cos 8, +sin & sin 8, ) 
= Jr +58 +2hh4é cos(4 -&) 
Nous avons alors: 
l l l : 2 1 = : — 2 
T= SA +5 mé = (à à) F5 | IS +5 +2hl;46 cos(a -&)) 
(30.518) 


Di Dlr 


me + 2m (RS? +126 + 2hhâé cos(4 - 8) 

= (ra +) + 2m (RE + 2h 4 cos(4 - 8) 

Pour l'énergie potentielle nous avons (le signe est négatif car les masses sont en-dessous du point 0): 
= pa gn — Mn 22 = ra gh cos 4 —-mg(h cos + cos) (20,519) 

Le lagrangien (cf. chapitre de Mécanique Analytique) vaut donc: 


1 22,1, 24 a 
L=T-V = (rn +m)En + mé + m4 HAS 520) 


+ (ra +) gh cos 4 + gl, cos & 


Nous utilisons maintenant l'équation d'Euler-Lagrange avec les coordonnées généralisées choisies: 


L _à 81 _ 
04 dt88 
4 4 (30.521) 
êL _d | 
08, dt 86, 


Nous avons alors pour & : 
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— =-Mhl}846 sin (4 - &)-(r8 +782) sh sin & 


. 
A = Ur +) + mn cos(4  &) 
_—_ Ê +mh0 hi D 
où LA +2) 4 À +mhhé cos(& — 8) +mahhé &c0s(8 - &) 
= (a+) À +mhl2ék cos(4 - &) +m hé (-d sin(4 - &) +6 sin (4 - &)) 
= (ra +0) 8 À +mmhliéb cos(4 - &)+mhhé (& - à }sin(g - &) 
Donc nous avons au final pour le lagrangien avec la coordonnée généralisée 8 : 
oh 8 6 sin (4 — 8) (r + m2) gi sin 
- (ra +m)d NF -mhlé cos(4 -&)-mhhé (&-4)sn(a -&)  . 
= (a+) gh sin & (ra +) À - mhlaél cos(4 - &)-mhlE sin(4 -&) 
A 
Nous avons de même pour & : 
5 = -mhl46 sin (4-&)-"nelsine 
A = m5 +mhi4 cos(4 -&) (20.524) 
TE _ mb & +mhi38 cos(& -&) +rhi4 (& - à }sin(4 - &) 


Donc nous avons au final pour le lagrangien avec la coordonnée généralisée &, : 


mL sin (& — & } — gl sin & 
28 -mhlô cos(4 -&)-"mhh6 (8 -à )sin(g -&) (80.525) 
= mel; sin & -mi56 -mhlô cos(4 -&)+mhé sin(4 -&)= 0 


Ce qui nous donne au final le système d'équations différentielles suivant: 


(ra + m2) eh sin 4 + (ra +) 4 +mhb cos(4 -&)+mhé sin(4 - &)- 


: | | (30.526) 
mAgl) sin & +138 +mhl4 cos(4 —-&) +mhb@ sin(4-&)= 


Avec Maple 4.00b cela donne pour la représentation des coordonnées de ##, dans le temps: 


>with(plots): 

> with(plottools): 

> 
Eql:=(m1+m2)*11/2*diff(diff(thetal(t),t),t)+m2*l1*12*cos(thetal(t)-theta2(t))*diff(diff(theta2(t);t),t) 
+m2*l1*2*sin(thetal(t)-theta2(t))*diff(theta2(t),t)/2+(m1+m2)*g*l1*sin(theta1(t))=0; 
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> Eq2:=m2*l1*2*cos(thetal(t)-theta2(t))*diff(diff(thetal(t),t),t)+m2*122*diff(diff(theta2(t),t),t) 
-m2*l1*12*sin(thetal(t)-theta2(t))*diff(thetal(t),t}2+m2*g*l2*sin(theta2(t))=0; 
> ml:=2;m2:=3;11:=6;12:-4;8:-9.81; 

> ff:=dsolve({Eq1,Eq2,theta1(0)-0.5,D(theta1)(0)=4,theta2(0)-1,D(theta2)(0)= 
-2},{thetal(t),theta2(t)},type=numeric,output-listprocedure); 

> Thetal:=subs(ff,thetal(t));Theta2:=subs(ff,theta2(t)); 

> X1:=t->l1*sin(Thetal(t)); 

> Y1:=t->11*cos(Thetal(t)); 

> X2:=t->l1*sin(Thetal(t))+12*sin(Theta2(t)); 

> V2:=t->l1*cos(Thetal(t))+12*cos(Theta2(t)); 

> plot([Y2,X2,0..100],numpoints=100); 
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Figure: 30.37 - Tracé avec Maple 4.00b des coordonnées d'une des masses 
14. TRIBOLOGIE 


Définition: La "tribologie" est la science des frottements (notion très intuitive à tout un chacun car 
nous pouvons ressentir ses effets dans la vie quotidienne) qui interviennent lorsque deux surfaces en 
contact sont mises en mouvement l'une par rapport à l'autre, produisant une force qui s'oppose au 
mouvement. 


La plupart de ces phénomènes relatifs aux frottements peuvent se comprendre en première 
approximation sur la base des lois phénoménologiques du frottement énoncées dès le 18ème siècle par 
Amontons et Coulomb (mais déjà mises en évidence par Léonard de Vinci 200 ans auparavant), à partir 
de la notion de coefficient de frottement. 


Ceux-ci observèrent déjà deux types de frottements a priori distincts: 


1. Le "frottement statique" est celui qui oppose une résistance lorsqu'un objet posé sur un plan est à la 
limite du glissement alors qu'on lui impose une force de traction Fe (tangentielle au plan). Cette 


opposition à la force de traction est par ailleurs expérimentalement proportionnelle au poids 5 de 
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l'objet. 


Mais intervient une valeur limite de la force tangentielle de traction à partir de laquelle l'objet 
commence à glisser. C'est ce que nous notons: 


245 JPÎ] cs 


où Fr im est donc la force limite de traction permettant de faire bouger l'objet initialement statique, 45 
est le "coefficient de frottement statique" sans dimensions et exprime la proportionnalité de la force 
limite de frottement avec le poids 5 de l'objet ou de sa forme normale au plan d'application. Raison 
pour laquelle cette dernière relation est aussi souvent notée: 


(Fin [5 45 [ML 0.520) 


Remarque: Dans la pratique, il est infiniment facile de déterminer ce coefficient avec un simple 
dynamomètre pour connaître la force limite et une balance pour connaître le poids de l'objet étudié. 


Nous observons expérimentalement que contrairement à l'intuition, la force limite de traction est en 
première approximation indépendante de la surface de contact entre l'objet et le sol (dans les limites des 
cas physiques courants évidemment car plus la surface est petite, plus la pression est grande et alors la 
surface de contact peut devenir plastique aux hautes pressions). 


Autrement dit, si un kilo de sucre est posé sur une table. Pour déplacer cet objet, de poids 5 (la masse 
multipliée par la constante de gravité), il faut exercer une force F. parallèlement à la surface de la 


table. Mais l'expérience montre que cet objet ne se déplacera pas tant que la force Fr est inférieure à 
une force minimale Fr in Et Amontons et Coulomb ont montré que cette force minimale est 


directement proportionnelle via un coefficient de frottement statique au poids. 


Nous pouvons détailler l'approche de la relation précédente en s'imaginant deux surfaces présentant des 
rugosités en dents de scie d'un angle & et imbriquées: 


Figure: 30.38 - Zoom sur la surface de contact 


Si nous appliquons une force normale correspondante au poids 5 et une force horizontale À, nous 
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avons à cause des dents de scie dans le cas limite la situation suivante: 


P 


Fr 
Figure: 30.39 - Simplification du problème avec les vecteurs 


nous voyons alors bien que la pièce mobile ne commencera à bouger que quand il y aura début de 
glissement soit lorsque: 


|F | =tanæ. F] (30.529) 


Pour simpliste qu'elle soit, cette approche permet de lier le frottement (statique) aux caractéristiques de 
la rugosité. De plus les valeurs expérimentales typiques des coefficients de frottement statique, de 
l'ordre de 0.3, correspondent à des pentes de la rugosité de surface de l'ordre de 15-20 degrés, ce qui est 
tout à fait compatible avec les caractéristiques typiques que l'on peut mesurer pour les rugosités de 
surfaces! 


Cet argument repose cependant sur une hypothèse implicite: l'emboitement parfait entre les rugosités 
des deux surfaces. Nous parlons dans ce cas de "surfaces commensurables". Ce n'est bien sûr pas le cas 
en général dans la nature: même à l'échelle atomique, deux surfaces idéales, présentent des légères 
différences de distance interatomique qui empêchent l'emboîtement. Une légère disparité suffit à rendre 
très irrégulière la répartition des points de contact entre les deux surfaces contrairement au cas 
commensurable. Nous parlons alors de "surfaces incommensurables", 


Autrement dit, nous aboutissons très vite à la conclusion que le frottement entre deux surfaces 
incommensurables en tout point est non-nul, tandis qu'il s'annule exactement si ces deux surfaces sont 
en tout point commensurables. 


2. Le "frottement dynamique" est celui qui oppose une résistance lorsqu'un objet posé sur un plan est 
déjà en glissement. Cette opposition à la traction est par ailleurs expérimentalement proportionnelle 
encore une fois au poids de l'objet tel que: 


|F |= Hp ]É| (30.530) 


mais avec le "coefficient de frottement dynamique" (qui existe en plusieurs sous-familles: coefficient de 
roulement, de glissement, .….) qui est en général beaucoup plus petit que le coefficient de frottement 
statique: 


Donc le frottement n'est pas le même au départ de notre objet que lors de son glissement. Cela 
correspond très bien à notre expérience quotidienne du frottement (lors de déplacements de meubles 
dans nos habitations par exemples). 
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A nouveau, nous remarquons expérimentalement que contrairement à l'intuition, la force de traction 
est indépendante de la surface de contact entre l'objet et le sol. 


Ainsi, que l'on pose le kilo de sucre bien à plat ou sur la tranche, la force de frottement est la même (si 
la qualité de surface est la même de tous les côtés du paquet de sucre)! 


Un autre fait étonnant concerne la valeur typique de ces coefficients de frottement, qui s'écarte assez 
peu de ns = 0.3, pour des surfaces très différentes les unes des autres. La technologie permet 


toutefois de concevoir des surfaces avec des coefficients de frottement soit bien plus petits ( 
Hp,s = 0.001) soit plus grand (Hp 5 # 1). 


Ces deux lois, sont appelées "lois de Coulomb": 


(Fr [= 45 IT IE 20 1 


L'origine simpliste du frottement entre deux solides est donc dû au fait que: 


- Tout solide n'est jamais lisse mais possède des aspérités qui rendent la surface de contact rugueuse (les 
aspérités s'imbriquent partiellement ou non et provoquent plus ou moins de frottement). 


- Les impuretés entre les deux surfaces de contact sont souvent plus importantes au niveau des sources 
de frottement que les imbrications des aspérités de surface. 


- Le frottement est faiblement dépendant de la surface car la rugosité à l'échelle atomique est telle que 
seulement un très faible pourcentage de la surface totale des deux objets sont réellement en contact 
(surface de contact réelle est donc beaucoup plus petite que la surface de contact apparente) ce qui 
explique que la force de traction tangentielle soit proportionnelle au poids car cela force la surface de 
contact réelle à augmenter. 


La complexité sous-jacente du frottement est donc extrême. L'origine du frottement fait dans la réalité 
intervenir une multitude d'ingrédients, couvrant un spectre très large de phénomènes physiques: 
rugosité des surfaces, élasticité, plasticité, adhésion, lubrification, thermique, usure, chimie des 
surfaces, humidité, etc. 


Nous allons ici faire une analyse scolaire des quelques frottements courants dans les cas d'études 
simples de la physique cinétique (du mouvement). Il faut bien prendre garde que ces modèles sont 
simplifiés à l'extrême afin de montrer seulement la démarche intellectuelle. 


14.1. FROTTEMENT EXPONENTIEL 


Il est d'usage d'appeler par "frottement exponentiel" le frottement généré par des courroies 
non-crantées (cas très important dans la pratique) sur un support fixe! 


Pour étudier ce cas de frottement considérons la figure ci-dessous où & est l'angle d'enroulement de la 


courroie autour de la poulie où on néglige l'épaisseur et la masse de la courroie par rapport aux autres 
éléments et où on se place à la limite du glissement et en mouvement uniforme. 
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Figure: 30.40 - Schéma macro du contact poulie/courroie 


De par l'existence de frottement il y a évidemment un différentiel de tension dT sur un point de contact 
mais cela étant dû uniquement au frottement puisque nous soupposons la rotatin uniforme. Voyons cela 
de plus près isolant une portion et en appliquant le principe fondamental de la statique (avec 
subtilité): 


T+daT 


X 


Figure: 30.41 - Zoom sur un élément différentiel de la courroie 


Nous avons alors: 
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D = 0: Toos[ 2) + dsa (Tr +aricos[ Se) - ( 
on 2 2 


(30.533) 
5° F,=0: dN- (T+arisin[ À) -Tan( =0 
_ 2 2 
Soit après simplification: 
D =0: sçdN— AT cos) =Û 
30.534) 


5 F,=0: dN-dTsin (e) —2T sin e) = 0 
— 2 2 
et comme l'angle est très petit, nous avons: 
48 
cos (S) Z cos(0) =1 (30.535) 


et pour le sinus nous utiliserons le développement de MacLaurin (cf. chapitre Suites Et Séries) pour les 
petits angles: 


ES 48 
san|—|=— (30.536) 
2 2 


Nous avons alors: 


DEF, =0: gsdN-dT =0 


(30.537) 
2 Fy =0: 4N— are ar = 0 


En négligeant la multiplication d'éléments infinitésimaux et en simplifiant il reste: 


DE, =0: usdN=aT 
(30.538) 
ZF,=0: dN=T48 


où la première équation nous est déjà connu puisqu'elle correspondant au frottement statistique 
horizonal habituel déjà vu plus haut. Nous pouvons maintenant combiner ces deux relations pour 


obtenir: 


Hsd8= T (30.539) 


En intégrant il vient alors: 
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8 I 
| 4sd8= | LEA (30.540) 
0 7 T 


Nous avons alors: 


et au final: 


A = Ts (30.542) 


ce qui est très important! Par exemple dans la pratique avec une tension de 500 [N] en tirant, cela ne 
produit une tension réelle de l'autre côté du support circulaire fixe que de 250 [N] parce que le 
frottement est exponentiel. Raison pour laquelle il vaut mieux utiliser des poulies que des supports 
circulaires fixes! 


Évidemment à cause de la friction on aura: 

D > (30.543) 
ce qui implique évidemment que: 

eMsB > (30.544) 
et donc: 

HgB>0 (30.54) 


14.2. FROTTEMENT VISQUEUX HORIZONTAL 


Nous avons donc vu qu'en première approximation, la force de frottement dans le cas de glissement est 
proportionnelle au poids d'un corps par un coefficient de frottement dont la valeur dépend de la nature 
et de l'état des surfaces de contact mais indépendant de l'aire de contact. Cependant nous n'avons pas 
dit que l'expérience montre que dans des cas réels typiques la force de frottement est aussi 
indépendante de la vitesse communiquée au corps. 


En lubrifiant par un fluide visqueux les surfaces en contact, la force de frottement est réduite et dépend 
de la vitesse (c'est typiquement le cas des pneus de voiture qui sont visqueux). 


Remarque: Pour rappel, le terme "visqueux" ne signifie pas forcément que ça coule et que ça bave. 
Cela signifie que la loi de comportement dépend de la vitesse de déformation (cf. chapitre de 
Mécanique Des Milieux Continus). 


Considérons alors un mobile en contact avec un sol plan via un fluide ou matériau visqueux. Nous 
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savons qu'il y aura frottement et supposons que celui-ci soit proportionnel à la vitesse: 


Fe =—Xv| (30.546) 


où k est le "coefficient de frottement visqueux". 
Nous avons alors en appliquant la première loi de Newton: 


F = nd =—}v (30.547) 
dé 


Dès lors il vient: 


1 & 
—dv=-—df (30.548) 


v A 
En intégrant il vient: 
&, . 
In(v)-Infg)=-—6# (30.549) 
mi 
Soit: 


inv) = In(w) ne (30.550) 
mi 


En prenant l'exponentielle: 


& & 

— + 20e 
ni. = (30.551) 
v=g ve? =vye ”* 


Ainsi, la vitesse décroit exponentiellement d'une vitesse initiale jusqu'à une valeur nulle asymptotique 
sous l'hypothèse de proportionnalité du frottement avec la vitesse. 


C'est une relation très souvent utilisée dans les animations faites par ordinateur représentant des objets 
qui semblent s'arrêter de manière naturelle. Il faut simplement bien choisir la valeur de k. 


Nous observons une chose intéressante c'est qu'un corps mobile lourd décélère moins vite à cause des 
forces de frottement qu'un corps mobile léger! 


Montrons comment nous calculons la puissance perdue par frottement. Nous savons que: 


_dW _d(F.2)_dF.x, F.dx 
dt dt dt dt 


F 


si la variation de la force est négligeable par rapport à la variation de vitesse nous avons alors: 


F.d 
P= __ F-v (30.553) 
dt 


et donc dans le cas du frottement (en valeur absolue): 
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P= F,|.v= Hv|-v=kv (30.554) 


Ainsi, la puissance dissipée lors d'un mouvement est proportionnelle à la vitesse en cas de frottement 
coulombien et proportionnelle au carré de la vitesse en cas de frottement visqueux. 


14.3. FROTTEMENT VISQUEUX VERTICAL 


Soit un solide indéformable chutant à la verticale dans un champ de gravité. Nous assumons que la 
force de la résistance de l'air est proportionnelle à la vitesse (comportement visqueux aux faibles 
vitesses): 


Fe =—#v (30.555) 


et utilisant le principe fondamental de la dynamique: 
mg — kv = ne (30.556) 
dt 


Soit autrement écrit (plus traditionnel): 


d 
m = +kv = mg (30.557) 
dt 


La solution de cette équation différentielle linéaire du 1er ordre est (cf. chapitre de Calcul Différentiel 
Et Intégral): 


que nous pouvons détailler si besoin (sur demande). 


En posant qu'à l'instant nul nous avions une vitesse initiale donnée il vient: 


vé= 0 =" =Æicsc-y -7% (30.559) 
sr - 


Ainsi: 


k k k 
A Fa + De Re 
vf -Æ). gs = 1-67 |+ve * (30.560) 


Ainsi, nous voyons que lorsque le temps tend vers l'infini (suffisamment grand quoi...) alors la vitesse 
tend vers: 


RE 
t+o 


donc k peut être déterminé expérimentalement! 


C'est une relation très souvent utilisée dans les animations faites par ordinateur représentant des objets 
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qui semblent freiner jusqu'à une vitesse constante de manière naturelle. 


14.4. FROTTEMENT VISQUEUX DE STOKES VERTICAL 


C'est typiquement le cas du parachutiste effectuant une chute libre. Nous avons vu dans le chapitre de 
Mécanique Des Milieux Continus que la force visqueuse de Stokes était donnée par (comportement 
visqueux aux vitesses moyennes et élevées): 


F,= pvc (A, )= — pSCv? =-hv2 (30.562 
lorsque la vitesse est subsonique (modeste en d'autres termes...). 


L'équation différentielle est la même qu'avant dans le cas de la présence du champ de gravitation à la 
différence que la vitesse est cette fois-ci au carré: 


dv 
mg—kv? =m— (20.563) 
dé 
Soit: 
£ 2 FLE g=0 (30.564) 
ni dé 


mais nous n'allons pas chercher à la résoudre, seulement à déterminer la valeur limite de la vitesse et 
justement vitesse limite est atteinte lorsque celle-ci... ne varie plus (ben oui forcément...). Donc à ce 
moment: 


dv | 
— = 30.565) 
dé 
et l'équation différentielle devient: 
& FA PA 
= g=Û0 . = - 2 (30.566) 
mi & OS! 


Ainsi, il est possible de changer sa vitesse de chute limite en fonction de son facteur de forme, et de sa 
surface d'exposition apparente et de sa masse (dans le cas d'étude ci-dessus nous négligeons la force 
d'Archimède qui s'applique sur la parachutiste et qui freine aussi sa chute). 


Exemple: 


Considérons une sphère de rayon R, de masse volumique £ lâchée sans vitesse dans un liquide de 
masse volumique &;, , de viscosité #. La sphère est soumise à son propre poids, à une force de 


frottement visqueux et à la poussée d'Archimède. 
Nous avons donc globalement selon la première loi de Newton: 
À 4 
mŸ. = _rk og — 67EiRv L TR PE 


dt 3 
+ force misqueuse de Stoke + 
force d'attraction force d'Archimède 
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(30.567) 


où les deux derniers termes (force visqueuse de Stokes aux faibles vitesses et force d'Archimède) ont 
été démontrés dans le chapitre de Mécanique Des Milieux Continus. 


En réarrangeant, nous avons: 


dv 4 3 
ORAN ." g(o-P) = 


WW | & 


née _ Pie | (30.568) 
8 


et encore: 


mi dv, EUR _ m ldv 184 


14. 9u 

4 3 dt 4 4 spodt 4R pdt 2Rp 

_xrR p zR° 0 ze © 5 8 8 

3 3 (30.569) 
à 9 P% 

dt 2Rp p 


Il nous reste donc: 


dv, _ v= 1 Aa g (30.570) 
dt 2Ro e 


Nous posons: 


2 
T= 28° (30.571) 
344 


qui sera assimilée à une constante de temps. Nous avons alors: 


ce qui donne: 


Pia 
Vim = T|l-—<]g (30.574) 
| ü | 


Résolvons ceci dit l'équation différentielle en commençant par celle sans second membre (cf. chapitre 
de Calcul Différentiel et Intégral): 


dv 1 
—+—v=Û0 (30.575) 
dé T 


Nous avons alors vu dans le chapitre de Calcul Différentiel Et Intégral que la solution homogène était 
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alors donnée par: 


1 
——? »] 7C 
= Ce? (30.576) 
Nous pouvons ajouter la solution particulière qui est logiquement lorsque t tend vers l'infini: 
% 
Vy = Wim = (2 g (30.577) 
2 
Nous avons alors: 


1 
. ——+ 
VV, + Vg = Vin HV = « Be) 4ce " (30.578) 


Il nous reste à déterminer C qui s'obtient lors t tend vers O car nous avons alors: 


Donc: 
per lo Ph per 
vé=0)=0=71-—Tlg+Cet =r1--lg+C=C=-rl1- 7 ]g (30.580) 
8 8 re) 
Nous avons alors: 


1 t 
Lx Lx + % __ 
{8e}. du) F -(-4) 1-e © | (30.581) 
8 8 8 


14.5. FROTTEMENT VISQUEUX DE STOKES HORIZONTAL 


C'est une première approximation où l'on s'intéresse par exemple à la distance d'arrêt sans freinage d'un 
mobile sans prendre en compte le coefficient de frottement avec le sol mais seulement avec l'air 
ambiant (vitesse subsonique toujours.….). 


Nous avons alors selon la première loi de Newton: 


m® =—kv? (30.582) 
dt 


Supposons que nous souhaitions savoir en quel temps T le mobile qui avait une vitesse initiale v, aura 


décéléré à une vitesse donnée Vr. 


Nous avons alors: 
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Donc: 


y 
0 LA û 


où nous observons déjà un premier problème avec ce modèle c'est que à l'arrêt, la vitesse finale étant 
nulle, il faudra un temps infini pour y arriver... mais continuons, nous reviendrons plus loin sur ce 
constat. 


La loi d'évolution de la vitesse se détermine de façon analogue puisque: 


mn 1 1 ml 1 
t= la" Ve s |) Gus 
£ Vf W La Vf V9 
Alors: 
ml ml ml ml l 1  & 1 | Voë | 
= —=——+i—=—+—i=—|1+——i] (20566) 
&vs kvo £v, Kw Vs Vo M  V A 


Notons la constante de temps: 


Fr 
T=— (30.587) 
vof 
Alors: 
1 1 Ë 
—=—|1+— | (30.588) 
Vf Vo T 
soit: 
__ 
vrG)= £ (30.589) 
1+— 


T 


La distance parcourue à l'instant t en ne laissant le mobile ralentir que par les forces de frottement est 
donc: 


t t t 
v l Ê 
û 01+— 01+— 
T T 


Le résultat est joli mais on se rend bien compte que ce n'est pas vraiment juste car à un temps infini, la 
voiture aura parcouru une distance infinie ce qui est manifestement irréaliste. Cela provient du modèle 
qui est trop simpliste donc améliorons-le. 


L'idéal, objectivement parlant, serait de prendre en compte le frottement visqueux pneu/sol plus le 


frottement de l'air. Nous aurions alors: 
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eu = k'y2? (30.591) 
dt 


mais le problème avec cette équation différentielle, c'est qu'elle va nous amener à une singularité si 
nous continuons les calculs. Elle n'est donc pas exploitable. 


Nous essayons alors avec la forme suivante: 


dv 
me = _ma-mfv. (30.592) 
£ 


qui exprime donc qu'il y a une force de frottement proportionnelle au poids du véhicule ce qui est 
simplement la forme suivante de la deuxième loi de Coulomb: 


Fr im = Hp P= Hp mg=m(g Hp)=m.a (30.593) 


et le deuxième terme étant le frottement visqueux de Stokes dont nous avons sorti le terme de masse 
compris dans la densité se trouvant implicitement dans la constante k de 3,,2. 


Nous avons alors en simplifiant les termes de masse: 
; nn 
—=-& ff" (30.594) 


Donc on voit déjà que dans ce modèle nous allons perdre l'effet de la masse qui a normalement pour 
implication de rallonger le trajet d'arrêt (dans la réalité!). Mais continuons quand même... 


Nous avons donc à intégrer: 


Nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 


1 1 Vo __——— 
[-—— = -arctan — (30.596) 
ä + (es a 


œ ; 
E (30.597) 
8 


Donc en posant: 


{ 
& 
Il 


Soit: 
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t 
1 dv 1 y 
[dé == 2] — = 2 —— arctan 0 (30.598) 


Un peu réarrangé cela donne: 


e TE) 


Donc on tombe maintenant déjà sur un temps fini... ce qui est plus rassurant comme résultat. 


Cherchons maintenant la distance d'arrêt. Nous avons en utilisant le fait que: 
dx 
v = . — dt = dxfv (30.600) 
£ 


la possibilité d'écrire: 


Soit: 


Ce qui nous amène à: 


Ce qui donne déjà: 


| vdv L_ [28 4 


er Er = m(a)-n(a+ |] (30.604) 


Nous avons donc: 
-L= SL" (= (a+ Eve ] (30.605) 
Soit: 
: 2 8 2) . 
= l° (a+ 8% ) in (a)] = a" É + 3) (30.606) 


Nous avons donc notre résultat final. Meilleur que le précédent mais indépendant de la masse... mais en 
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attendant c'est mieux que rien. 


Remarque: Avec un freinage sec l'essieu avant d'une petite voiture (Mercedes Classe A) a une force 
de freinage typiquement de l'ordre de 2.8 [kN]. 
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Notes personnelles: 
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31. MÉCANIQUE ONDULATOIRE 


No nous intéresserons ici à l'étude des propriétés mathématiques des cordes vibrantes que nous 


pouvons également par extension et dans un souci de généralisation à des cas immatériels assimiler au 
concept des "ondes". Cette étude est très importante car nous aurons besoin de certains des résultats 
obtenus ici en thermodynamique, physique quantique, astrophysique, électrodynamique et théorie des 
cordes (pour ne citer que les plus importants). 


Définitions: 


D1. Une "onde" est un transport d'énergie sans transport de matière. Elle est concrétisée par la 
propagation d'une perturbation d'un milieu d'où l'appellation "d'ondes progressives". La vitesse avec 
laquelle l'onde progresse dépend des propriétés physiques du milieu. 


D2. Dans le cas où la perturbation du milieu (déformation de l'onde) se fait de façon perpendiculaire à 
la direction de propagation de l'onde, nous parlons "d'onde transversale" ou de "perturbation 
transversale" (typique des ondes dans les cordes par exemple). 


D3. Dans le cas où la perturbation du milieu se fait parallèlement à la direction de propagation de 
l'onde, nous parlons "d'onde longitudinale" ou de "perturbation longitudinale" (typique des ressorts). 


1. FONCTION D'ONDE 


Soit une perturbation y = f(x) définie dans une région donnée de l'espace. Si nous remplaçons x par 


x-b, nous définissons dans cette même région, une perturbation f(x-b) identique à f(x) mais translatée 
d'une distance b dans la direction des X positifs (à droite donc si l'on adopte le système de 
représentation conventionnel vu en analyse fonctionnelle). 


Si t représente un temps et si l'on pose à = »:£, alors v peut désigner la vitesse de translation de la 
perturbation. 


Ainsi, nous appelons "fonction d'onde", la relation mathématique: 


f(xtvé)| (311) 


qui décrit la progression d'une perturbation y(x,t) dans l'espace: 
- y{x,£) = f(x - vf) décrivant une onde qui progresse vers +X 
- y(x,£) = f(x +vét) décrivant une onde qui progresse vers -X 


v est par définition appelée "vitesse de phase de l'onde". Elle est constante dans un milieu homogène. 
"L'amplitude de l'onde" est la valeur maximale de la perturbation: 


Yax “Ÿ (12) 


En l'absence d'amortissement, elle conservera la même valeur en chacun des points x où l'onde passe. 
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2. EQUATION D'ONDE 


Sans aller dans des considérations trop techniques, nous dirons que toute fonction f dont l'argument est 
x +v£ jouit de la propriété: 


tone) = 0 et) (31.3) 
ax v dé 


Démonstration: 


LR, =l'f{x-v = f'{x- vi) 0 
# ds (314) 


2 f(x) =-v'f{x-v) = J'(x -v) = = JV) 


et donc l'égalité s'ensuit immédiatement (il s'agit simplement de l'application des dérivées composées tel 
que démontré dans le chapitre de Calcul Différentiel et Intégral). 


Suite à la demande d'un internaute qui n'a pas trouvé cela très clair, faisons un exemple. Considérons la 
fonction suivante: 


fx vé)= (x vé? (81,5) 


et dès lors: 


JC =v = =") = - 1 Se Dx — vf 
=) =f 


À His - Lee = y “2{x- vi = -2rv+v# 
Of Of 2. En PE 
=") =f 


Pour en revenir au cas général, dérivons une seconde fois, nous obtenons alors une autre forme de 
l'équation d'onde que nous retrouverons aussi fréquemment: 


2 2 
SG) = LES) LE PS JV) = JG -w) 
(31.7) 


RL, 
Ex] XV = XV V XV XV 37 XV 


Ce qui nous amène à écrire l'une des relations les plus importantes en physique appelée "équation de 
propagation", "équation d'onde" ou encore "équation de d'Alembert" et que nous retrouverons dans de 
nombreux autres chapitres du site (Électrodynamique, Physique Quantique Ondulatoire, Relativité 


Générale, Acoustique): 


ca 1 4 
rw] sf tw) = TT ft) (31.8) 
x V 
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OIC.Q.F.D. 


Remarques: 


R1. Ne pas oublier (cf. ch ( Tr :gral) que la somme des solutions à une 
équation différentielle est aussi solution de l'équation différentielle. Ainsi, la solution générale de 
l'équation d'Alembert est la superposition de deux ondes progressives arbitraires allant dans des 
directions opposées. 


R2. Lorsque deux ou plusieurs ondes se propagent dans un milieu, la fonction d'onde qui en résulte 
est la somme algébrique des fonctions d'onde de chaque onde. Nous disons alors que les ondes 
"interfèrent" et nommons cette considération le "principe de superposition des ondes". 


Considérons maintenant une corde de longueur L attachée par l'une de ses extrémités à une terminaison 
fixe. Supposons maintenant qu'une perturbation se propage sur cette corde. Lorsque la perturbation 
arrive à la terminaison, nous observons que celle-ci change de signe en même temps que sa vitesse de 
propagation s'inverse: l'onde subit ainsi une réflexion avec inversion. 


Pour décrire le phénomène, il faut imposer: 


v(Lt)=0 vi 


Une fonction d'onde f(x - vf) quelconque, qui progresse vers la terminaison, ne peut pas vérifier la 
condition: 


FE M). = JE) 
pour toutes les valeurs du temps ! 


L'astuce consiste à la remplacer par une autre fonction d'onde y(x,t) dont la forme est semblable à f à 
grande distance de l'origine de la perturbation, et qui s'annule au point de terminaison pour toutes les 
valeurs du temps. Pour cela, nous pouvons imaginer au point de la terminaison, un miroir qui donne de 
la corde une image de même longueur dans laquelle nous inventons une onde virtuelle: 


J(2L—(x+vé)) = FL - x) — vi) 
symétrique de f {x — vf), mais de signe opposé. 
Nous décidons ainsi: 
- que les deux ondes progressent l'une vers l'autre pour s'annuler au point de terminaison 
- toute partie de l'onde réelle qui dépasse le point de terminaison devient virtuelle 
- toute partie de l'onde virtuelle qui pénètre dans la corde devient réelle 


A leur intersection, les deux ondes réalisent une interférence destructive au point de terminaison. La 
somme algébrique de ces deux fonctions d'onde est aussi une fonction d'onde: 
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JCx. à) = f(x- vi) - F(2L-(x+v))| (31.12) 


qui a la propriété voulue en x=L : 
JL, à) = f(L-vt)- f(2L-(L+v)) =0 VY£ (3113) 


Si nous considérons maintenant une terminaison libre, sans frottements avec son support d'attache, nous 
nous retrouvons dans un cas similaire au précédent à la différence que l'interférence est constructive au 
point de terminaison plutôt que destructive telle que la fonction d'onde s'écrive: 


Jx.ë) = f(x vê) + F(2L-(x+vé)) (31.14) 


Remarques: 


R1. Lorsque l'onde arrive sur une terminaison libre ou fixe, l'énergie transportée est intégralement 
renvoyée en arrière. 


R2. Lorsqu'une terminaison n'est pas exactement adaptée, seule une partie de l'énergie est absorbée 
par le point Q, le reste est réfléchi. 


3. TYPE D'ONDES 


En physique théorique (et dans la pratique), nous restreignons fréquemment l'étude de certains 
phénomènes à des cas particuliers d'ondes. Principalement, nous en distinguons trois que nous allons 
brièvement mais soigneusement développer: 


3.1. ONDES PÉRIODIQUES 


Si un événement produit une onde qui ne transporte qu'une seule perturbation produite en un point 
donné, il existe de nombreuses perturbations qui sont capables d'exciter un milieu de manière répétitive. 


Le point spatial de la source subit alors périodiquement la même perturbation. La durée d'un cycle 
complet est appelée identiquement à l'étude des pendules: "la période" T. 


Si la perturbation peut se propager sous forme d'onde, à vitesse v, elle est décrite par la fonction d'onde 
que nous connaissons: 


= f(x.é)= f(x-vt) (3115) 


En chaque point du milieu perturbé, l'onde périodique impose une "périodicité temporelle" de la 
perturbation qui nous impose d'écrire: 


vx =c)=fxttm D= f(x Vxr mEZ (31.16) 


Après plusieurs cycles d'excitations de la source, plusieurs perturbations sont distribuées dans l'espace. 
La distance entre deux perturbations successives est appelée "longueur d'onde" 4. 


La "périodicité spatiale" impose ainsi aussi: 
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pé=c*)=fixtmaiû = f(x) Wt neÆ (3117 


A est le chemin parcouru par l'onde pendant le temps T: 


jsvreye” (31.18) 
T 


Si une fonction d'onde est périodique dans le temps, elle l'est aussi dans l'espace, pour autant que 
l'impulsion ne se déforme pas lors de sa progression. 


Démonstration: 


SO = ft + D) = fav + D) = fx -vt -mvT) = f(x -m À vi) 


(31.19) 
= f(x-%4,6) 


En posant #, = -#,, nous avons bien: 
J(.t) = f(x+n A6) (3120) 
[IC.Q.FD. 


3.2. ONDES HARMONIQUES 


Pour ces ondes, la fonction d'onde solution de l'équation d'Alembert est une fonction trigonométrique 
de type sinus ou cosinus (ou une somme): 


Vi) = f(x-vt)= ÿ'sin(K(x -v£)) ou y(x.f) = f(x - vi) = Ÿ'cos(K(x -vf)) (31.21) 
La présence de k appelé "nombre d'onde" est exigée pour 2 raisons: 
- k s'exprime en [1/##] pour la cohérence des unités des fonctions trigonométriques 
- la valeur de k doit assurer la périodicité de la fonction d'onde: 
1. périodicité angulaire de la fonction mathématique: sin(&fx — vé) + 277) = sin(&(x — vé}) 
2. périodicité spatiale de la fonction d'onde: sinf&(x + 4) — v£) = sin(&(x —- vf) 
En égalant ces deux expressions: 

k(x-vé) +27 = k((xt4)-v)=k&(x-v)+£A (3122) 


ce qui implique: 


Introduisons: 


A=v'T (3124) 
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dans l'expression de K : 


X 
&k'v=— =27f = &@| (31.25) 


d'où autre relation importante: 


æ | 
v=—| (31.26) 
k 


La fonction d'onde de l'onde harmonique peut alors s'écrire sous la forme: 
pÉx,6) = ÿ'sin(ix - &) ou yéx,£) = ÿ'sin ÊE = :] progressive selon +X 
px.) = ÿ'sin(kx + @f) où yfx,f) = ÿ'sin ÊE + :] progressive selon -X 


(31.27) 


3.3. ONDES STATIONNAIRES 


Imaginons une corde excitée de manière harmonique. Au lieu d'adapter sa terminaison pour extraire de 
l'énergie de la corde, imposons que cette terminaison soit fixe. L'onde est alors réfléchie. 


Une nouvelle fonction d'onde doit être définie pour décrire la superposition de l'onde incidente: 
fx. ê) = ÿ'sin(&x- @f) (31.28) 
et de l'onde réfléchie (symétrique et de signe opposé): 
(2.6) = ÿ'sin(&(2Z -x)-@f) (31.29) 
en analogie avec le résultat que nous avions trouvé lors de notre étude des terminaisons: 
VCx.£) =" f(C2L-x)-v) (3130) 


La relation trigonométrique: 


_ + 
sin(p) - sing) = 2sin ( £ os(2 1) (31.31) 


nous donne: 


Ex Ë) = p6x,6) + y, (x,6) = 2ÿ sin(k(x — Z))'cos(&£ - @f)| (31.32) 


Ce n'est plus une onde progressive car x et t ne se combinent plus comme (x — vf). Certains points de la 
corde ne bougent jamais. Ils satisfont: 


sin(K(x-L))=0—=K(x-L)=t#7— La —L)=+#7 (3133) 
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et sont situés en: 


(31.34) 


Pour des raisons évidentes, nous ne conservons que les valeurs de n pour lesquelles x 4 Z. 


1 


Remarque: Chacun de ces points est appelé "noeud de la vibration". 


Nous observons dans un tel système, des fuseaux de vibration, de longueur 1/2, dans lesquels la corde 
vibre transversalement dans une zone de hauteur 4 (deux vers le haut, deux vers le bas). 


Remarque: Les points où l'amplitude de vibration est maximale sont des "ventres de la vibration". 


Puisque sin(&(x — Z£j) =1, les ventres sont distants de 4/2 et situés à 4; 4 des noeuds. 


Si nous imposons maintenant une terminaison fixe aux deux extrémités d'une corde en vibration, nous 
nous retrouvons avec une "mise en résonance". 


Le plus souvent, nous n'observons pas grand-chose jusqu'à ce que nous trouvions la fréquence 
d'excitation qui place les noeuds de vibrations sur les deux points de terminaison fixe. 


Dès lors pour une corde de longueur L : 


implique: 


L = y À UT -2L (31.36) 
: ñ# 


La corde est alors le siège d'une onde stationnaire dont l'amplitude de vibration est considérablement 
plus grande que l'amplitude d'excitation (quatre fois). 


Nous disons alors que la corde est rentrée en "résonance" avec l'excitateur. 


La relation: 


montre qu'il y a plusieurs longueurs d'onde possibles dont la plus grande correspondant à n=1 est 
appelée "longueur d'onde fondamentale" et vaut bien évidemment 4 = 27. 
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3.4. MODES DE VIBRATION TRANSVERSALE DANS UN FIL TENDU 


Nous avons vu comment une onde peut progresser dans une corde. Montrons maintenant pourquoi c'est 
possible et établissons la relation y(x,t), donnant la forme de la corde en fonction du temps. 


Soit un fil de diamètre &, longueur L et masse m, la densité linéique du fil (supposée constante le long 
de celui-ci) est alors: 


= (1.39) 


Par un léger choc, créons une petite perturbation (afin de ne pas déformer le câble et maintenir 
constant sa densité linéique) transversale. Isolons, dans la zone perturbée, un élément de fil, de 
longueur AZ. 


Approximations: 


A1. Chaque élément de la corde peut être découpé de façon infinitésimale de façon à être presque 
parallèle à l'axe x. Les angles &,,8, sont donc considérés comme petits. 


A2. La corde est considérée comme déformable mais non allongeable donc la norme des forces dans la 
corde est constante en tout point quelle que soit la déformation. 


Pour la suite du raisonnement, nous nous servons de la figure ci-dessous: 


x x + x 


Figure: 31.1 - Illustration d'un élément de cordre 


Si les angles sont petits, le bilan des forces donne: 
DE, = Fcos8, -(Fcos8,) = F(cos8, -cos8,) = 0 (31.39) 
ce qui signifie qu'il n'y pas de déplacements selon x : 
DE, = Fsin & -(Fsin 8) = F(sin@, -sin@) (31.40) 
Si les angles sont vraiment petits, nous avons le premier terme du développement qui donne: 
sanxætanx (31.41) 


Donc: 
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3 F, =F(sin8, -sin@) = F(tan&, -tan&@) (3142) 


accélération selon y. 


La loi de Newton appliquée à la masse Ây# = ,Ax donne (nous considérons que chaque point de masse 
se déplace seulement selon y car il n'y a pas allongement): 


Les tangentes sont données par les dérivées partielles de la fonction y(x): 


(31.44) 
P 


à 
SE, = Fitan 8, -tan 8,) 2 = 


xl) dx 


Qui s'égalise avec l'avant-dernière relation: 


2 
aber eo (31.45) 
dé 8x, ôxl 
et donc: 
CAE 
y _F 8x 8x? (31.46) 
8? à Âx 


Si ÀAx — 0, les deux tangentes tendent vers la même valeur, mais la fraction du membre de droite tend 
vers une Valeur finie: 


LA En 
4xL, & 2., (31.47) 
lim À © -2> 
Il en résulte l'équation différentielle: 
2 2 
dE PE x 


Cette dernière relation s'écrit plus souvent sous la forme suivante: 


2 d 
ie AT =0| (31.49) 


ax à 


et se nomme "équation des cordes vibrantes". 
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Remarque: Dans certains ouvrages, la densité linéique est notée 4, et la force de tension dans la 


corde 7; ce qui donne: 


2 
CSS AE Q| (31.50) 


Si nous vérifions que les unités de F/ , sont celles du carré d'une vitesse {[#1:571])*, comme l'exige 


l'analyse dimensionnelle. Pour simplifier l'écriture, nous posons: 


Nous allons maintenant considérer un cas particulier très intéressant dans le cadre de la musicologie qui 
est celui de la corde tendue (la plupart des instruments à corde fonctionnant ainsi). 


3.4.1. CONDITIONS DE DIRICHLET 


L'objectif est dans le cadre de l'équation différentielle obtenue précédemment (petites déformations 
dans les cadres des instruments de musique) de trouver une fonction y(x,t) solution de cette dernière 
avec les conditions initiales, typiques à un instrument de musique suivantes: 


C.I.1. y(0,£) = yÉZ,f) = 0 (les extrémités À et B sont fixes - il s'agit des "conditions de Dirichlet") 
C.I.2. yfx,0) = f(x) (forme initiale du fil à l'excitation) 


C;1.3; —— = Ô (vitesse initiale nulle en tout point) 
la 


Les deux dernières conditions sont appelées "conditions de Cauchy". 


Pour résoudre cette équation différentielle linéaire, nous allons faire usage de la méthode de séparation 
de variables en posant: 


vx. û = Æ(ATE) (3152) 


L'équation différentielle: 


devient dès lors: 
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Py_P(XRTE)_ 2|ax aT(e PTE) F & 
TO + 0 re ET 
a ôf L; 0x 
0 (31.54) 
dy _PIXGTE) _ 8 | ax(x) 0 PX(x) 
SE — T)+X = T{é 
2 ni | (E)+ A2) —— |=T() Æ 
=Û 
Nous avons donc: 
x #7 
ax? _ À 8x (31.55) 
X FT 


En mettant la deuxième relation dans la première, nous en tirons: 


TE) _ F &y 


Æ(x) 


2 
; dé ; À & (31.56) 
_. = TE a 2 
êx x 


Le membre de gauche de la dernière relation ne contient pas la variable t et celui de droite ne contient 
pas la variable x. La seule et unique façon d'égaler ces deux expressions est de les considérer chacune 
comme constante, que nous noterons — 42: 


x à 
8x - Pdf æ--pn 615 
À PT 


Ainsi, nous avons deux équations différentielles: 


dx 
FA 


+ÆX-=0et D + 6Aÿ T=0 (31:58) 
? 


Ces deux équations étant similaires, résolvons-les de manière générale (cf. chapitre de Calcul 
Différentiel Et Intégral): 


2 
EE + Sat) = 0 avec 8ER* (3159) 
É 
L'équation caractéristique est donc: 
r+8=0—A=b-44 =-48 (31.60) 


d'où: 
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+ 
= LE B=utiv=Otiy (3161) 


Fa 


Nous savons que la solution générale si les racines de l'équation caractéristique sont complexes, est de 
la forme: 


at) = Cie“ cos(vé) + Cie" sin(vé) =C cos(J85) +6 sin(./ 66) (31.62) 

Pour nos deux équations différentielles, nous avons donc par similitude: 
ÆX(x) = À cos(Ax) + B sain(Ax) et T(£) = À cos(Avé) + B, sin(Avé) (31.63) 
Cela donne pour la solution de notre équation d'onde: 
JÉx,8) = Æ(xÏT (8) = (A cos(Ax) + 2 sin(Ax)i( À cos(Avé) + B, sin(Avé)| (31.64) 

Déterminons les constantes 4,8; en tenant compte des conditions initiales. 

y(0,5) = 0— 0 = À (A4, cos(Avé) + B, sin(Avé)|, VE — À = 0 (31.65) 
Il ne reste que: 

JÉx,8) = (8, an(Ax))(A4, cos(Avé) + B, sin(Avé))= sin(Ax)(8, 4 cos(Avé) + BB, sin(Avé)) (31.66) 

Posons: 

BB, = 4,B,4, =b = y(x,f) = an(Ax)(b cos(Avé) + asin(Avé)) (31.67) 


La condition initiale y££,£) = 0,£ impose: 
RAT 
sin(AZ) = 0—= 4 'L=x: n= A=— A EN 


(31.68) 
 yix 9-sn[ c]fee [24] (2) 


Pour tenir compte de la vitesse initiale nulle, dérivons y{x,f£) par rapport au temps: 


pe 528 sa()|- D [Re] + 2 ces] 
(31.69) 


= 0 = — LE sn “fe Rec] a +0 — 


Il ne reste que: 
VÉX, f) -baa[ cos[ ee]. xx E€[-b,+b] (3170) 


La constante b représente donc l'amplitude du déplacement transversal du fil. Cette amplitude ne 
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pouvant être la même partout en un temps donné et une position donnée pour tout type d'excitation 
satisfaisant les conditions initiales, il doit exister autant de valeurs à, que nous choisissons de valeurs n 


dans ##x/ AÎ. 


Le principe de superposition des solutions des équations différentielles linéaires (cf. chapitre de Calcul 
Différentiel Et Intégral) permet d'écrire que la combinaison linéaire de toutes les solutions pour la corde 
est finalement: 


van =ÿe, sin Mesh COS ce (31.71) 
H=] L FE 


Les à, doivent être choisis de manière à satisfaire la condition initiale qui donne la forme de la 
perturbation: 


FOEPCOEDX: sin Eos) ny: sn (>) (31.72) 


H=l H=l 
Cette expression pour f(x) suggère de la comparer au développement en série de Fourier (cf. chapitre 


des Suites Et Séries): 


Piai= d'a cos(#kx) + à, sin(xkx)l (31.73) 


H=Û 


Dans laquelle £ = x {£ et 4, = 0,#x#. Le théorème de Fourier impose alors que les à, sont donnés par: 
) 2 
Bb, =0,b, = z{/® sin(#kx) (31.74) 


Imaginons maintenant une corde de longueur L fixée en ses extrémités et tendue. Choisissons la 
perturbation la plus simple possible: nous grattons la corde en son milieu de manière très sèche, pour 
l'écarter d'une petite distance H de sa position d'équilibre. 


La perturbation initiale y(x,0) est alors: 


#G = € pour 0 < x < 1/2 et f(x) = 


— 1 cire (31.75) 


Calculons les coefficients de Fourier: 


112 
b, .= pren É x - a 2%, sn( er): ee < x) ses) Gti 


L'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral) donne: 


La fonction d'onde devient: 
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SCIENCES.CH) 
w BH sin | 2— _. 
vx Ë) = De sa [2 Eje[ ee —. k ce [2e Je fe 31. 
#=l > 


À cause du sin(x7r{ 2), les termes pour lesquels n est pair sont tous nuls. Il reste: 


GO LP LL cos 4” EL LS cos EL le _ cos ur] 
PP mIRC UE Fa Moon Dr FE D 1 au 1 


(31.79) 


Si nous ne retenons que le terme en n=1, nous aurions: 


ve = Fsn( =]ee fe jan r]e(7 po = Pin ice) 


(31.80) 


Nous avons: 
27 
&k =— (3181) 
2E 
qui est le nombre d'onde correspondant à une longueur d'onde: 


A =—=2Z (3182) 


et: 


qui serait la fréquence de vibration du fil de la première harmonique. 


Ainsi, pour une valeur n quelconque, il est facile de démontrer que le n-ème "mode propre" est donné 


par: 
vx) ) = sin «fe (31.84) 


avec: 


relations appelées "lois de Mersenne" (1644-1648). 


où le mode de plus basse fréquence avec n valant 1 est appelé le "mode fondamental" associé à sa 
"fréquence fondamentale". 
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Ainsi, après avoir été gratté sec au milieu de sa longueur L, un fil maintenu rigidement à ses deux 
extrémités peut osciller suivant plusieurs modes. Le mode fondamental # = 1 (harmonique 
fondamentale) correspond à la plus petite fréquence possible. Il lui correspond la longueur d'onde 
À = 21. 


Les fréquences d'ordre n supérieures sont appelées "fréquences harmoniques". Pour un même 
déplacement initial H, l'amplitude maximale de la vibration diminue selon ;-? comme nous le voyons 
dans l'expression de notre fonction. 


Une autre manière d'exciter la corde est de la faire osciller de manière sinusoïdale, ce qui signifie dès 
lors que y(x,t) est de la forme: 


vx, = y(x)sin(@t - #) (31.86) 


En substituant cette relation dans l'équation d'onde de la corde, nous obtenons: 


2 
ee + AG) =0 (31.87) 


La solution se réduit alors à: 
= : X ; X ‘ 
vx) = ni [=] ou y, (x) = à, sin (=) eN (31.88) 
4] 


La valeur n=0 ne peut pas être incluse car elle donne une corde sans excitation. En mettant cette 
fonction dans l'équation d'onde précédente et en simplifiant, nous obtenons trivialement: 


m— ne Leu (31.89) 
x 8 F 21, 


Ce sont les "fréquences d'oscillations de Dirichlet" pour une corde. Les cordes d'un violon par exemple 
sont des cordes de Dirichlet. 
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Mode propre n = 2 


Figure: 31.2 - Quelques modes fondamentaux d'une corde fixée 


Les mêmes analogies, raisonnements et développements pourront être faits avec les conditions de 
Neumann ci-dessous. 


Remarques: 


R1. La théorie prédit que la vibration peut être une combinaison linéaire de plusieurs modes. Ce 
phénomène porte le nom de "vibration simultanée". Il se produit abondamment dans un piano. 


R2. Les instruments de musique sont conçus pour émettre des sons à des fréquences 
conventionnelles, étant admis que la hauteur d'une note perçue par l'oreille est définie par la 
fréquence fondamentale, par exemple le: Do (264 Hertz), La (440 Hertz). 


R3. Lors de la construction de l'instrument, nous décidons de la valeur de &, (en choisissant le 


diamètre et de la nature de la corde) et nous déterminons la longueur L en cherchant le compromis 
entre l'intensité sonore que nous voulons émettre et la résistance mécanique de l'instrument qui doit 
supporter les forces F de tension. 


3.4.2. CONDITIONS DE NEUMANN 


Alternativement aux conditions de Dirichlet où les extrémités sont fixes et à hauteur égales, les 
conditions de Neumann supposent que les extrémités sont de petites boucles autorisées à glisser le long 
de deux barres sans frottements. 


Pour notre corde, les conditions de Neumann spécifient les valeurs 4y/äx aux extrémités. Mais tant 
que les boucles sont supposées sans masse et sans frottements, la dérivée y / 4x doit s'annuler aux 
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extrémités x = 0,2. Si tel n'était pas le cas, alors de par la nullité de la masse de l'extrémité, le 


changement de vitesse sera dû à une accélération infinie, ce qui ne peut être autorisé ! C'est ainsi que 
nous imposons au lieu de la condition de Dirichlet, la condition de Neumann définie par: 


C.L.1. d 00 = d 9 = 0 
ax ax 


les conditions C.I.2. et C.I.3. restant identiques. 


Ce changement de condition n'empêche pas que la méthode de résolution par séparation de variables 
est la même que précédemment et que nous tomberons identiquement sur la relation suivante à laquelle 
il faudra appliquer la nouvelle condition initiale: 


DVÉX,6) = A(XxÏT (8) = (À cos(Ax) + 2 sin(Ax) (4 cos(Avé) + B, sin(Av£)| (31.90) 


sur laquelle nous appliquons donc la condition de Neumann: 


dy 

—— (0,f) = 0 

ra ) 

dy . 

a = À(-A sin(Ax) + B cos(Ax))(4, cos(Avé) + B, sin(Avé)) (31.91) 
x 


= (0,4) =0— 4(2,)(4, cos(Avé) + B, sin(Avé)) = 0, vi = 2 = 0 
x 
Il reste donc: 

VX, ê) = cos(Ax) (44 cos(Avé) + AB, sin( Avé)) (31.92) 
en posant à = 4,4,,4 = 4,8, la fonction se simplifie en: 


JEx ê) = cos(Ax)(bcos(Avé) +a sin(Avé)) (31.93) 


La condition initiale, LL = 0,Y£ impose: 
x 


-sin(AL)= 05 d°L=n 7 1= ne N 
(31.94) 
ARITX H#ZTV : AITV 
= yx,t) = cos] "| |bcos| 5 | +asin| =; 
L L Fe 


Les mêmes développements pour la C.I.2. que nous avions faits avec la C.I.1. de Dirichlet s'appliquent 
ensuite de manière identique: 


Jx,f) =bcos LR cos RARE (31.95) 
ré L 


ensuite, l'analogie avec les séries de Fourier s'applique de manière similaire mais avec les cosinus au 
lieu des sinus. 
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Les fréquences de Neumann d'une corde sont les mêmes que pour celle de Dirichlet soit: 


F (Æ] _ 
@ = |—]—] (3196) 
&\2 


La particularité réside cependant dans la valeur de la fonction spatiale qui vaut cette fois trivialement: 


- RITX RITX 
vx) = Se cos] —— | où y,(x) =b, cos —|,xeN (3197 
— L L 
Effectivement, pour n=0 nous avons cette fois une amplitude à, identique qui est transmise tout le long 
de la corde sans que celle-ci ne vibre cependant ! 


Par ailleurs, faisons remarquer, que la fonction yfx,f) = af + h satisfait aussi pleinement les trois 
conditions initiales incluant celle de Neumann. 


Effectivement, nous avons bien: 


C1 OH -=-? (9-0 
dx ax 
CI2 y(x.0) = (D =b ( 
c13, 2@0 5 

dé 


1.98) 


CO 


et de plus, y(x,£) = af + b vérifie aussi l'équation d'onde: 


Les) 


2 2 
RL Ÿ 20 (3199) 


dx vf 


3.4.3. LAGRANGIEN D'UNE CORDE 


Nous allons maintenant déterminer le lagrangien d'une corde, calcul qui nous sera en partie utile lors de 
l'étude de la théorie des cordes. 


Nous gardons donc notre corde ayant une densité linéique et tension constante dont les extrémités sont 
situées en x = 0,x = Z et dont la vitesse de la perturbation transversale est non relativiste. 


L'énergie cinétique est alors simplement la somme des énergies cinétiques de chaque élément 
infinitésimal de la corde. Nous pouvons alors écrire en notation Lagrangienne: 


1; æŸ 
T= [tar) Ë (31.100) 


L'énergie potentielle intervient dans l'élongation de la corde dont une portion infinitésimale peut être 
vue comme variant de (x,0) à (x + x, 0) quand la corde est à l'équilibre. Quand une corde est 
momentanément mise sous tension de (x, y) à {x +4x,y + dy) alors la variation de la longueur d1 d'un 
élément infinitésimal de la corde est donnée trivialement par: 
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À 2 dy : 1{ dy ? 
di =Aldx) +{(dy) -dx=dxl [+|—]) -11=z4dx-| — 31.101 
Ne C0 D Ê (2) Deus, 


Nous avons utilisé ci-dessus pour approximation le développement limité au deuxième terme en série 
de Taylor (cf. chapitre sur les Suites Et Séries), qui nous donne: 


rx ie _x- rt (31.102) 


Le travail effectué pour étirer chaque élément infinitésimal étant FA}, l'énergie potentielle totale est 
alors exprimée par: 


F = fra & fi (22 


La lagrangien étant défini par Z=7-#ÿ (cf. chapitre de Mécanique Analytique), nous avons alors: 


ele) 20e 


où £ est défini, très justement, comme étant la "densité lagrangienne": 


= c=la (31.105) 
2° 
L'action pour notre corde est alors: 


jure] 2407] 


Dans cette action, le chemin d'action est la fonction y(x,t). Pour trouver les équations du mouvement, 
nous devons examiner la variation de l'action quand nous varions: 


VC E) — y(x.f) + Üy(x.f) (31.107) 


Ce qui donne: 
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Dr 2 ÿ 
“is pes 202) 37 (0e2 520) | 


fe. D, 24(x08(6y(.0), 8(8y(x9) | 
fil. 


CRT &° 


(En D , 24(x, Es Ce &9) , (0) ® dE o) | (31.108) 
ZX 


Fe a 7 dU9) (6» 1) 
f fale dé ôx ôx 


b dy 4(5y) _ 4 4(6y) 
jafa[a> FE 


dx dx 


Car: 


(31.109) 


Ée (&y(x, Lo)) EG) < 20 (870.0) t)) 
&° 


et ce identiquement pour le second terme. 


Nous ne devons pas avoir de dérivées temporelles agissant sur les variations. Alors en utilisant la 
relation triviale suivante sur le premier terme: 


: a(ä 
dy 9°y . O1 2 rage FL — 6y (31.110) 


et identiquement sur le deuxième, nous pouvons réécrire l'action: 


a(5 a( à 
58 = jajale a? & 8 (8) su 
dé dx dx 
D d ; dy 4 dy dy | 
-faja( fade - à — A y bre #2): (31.111) 


s 4 ET « 


4 FRE: 
-pfage)fe- a. p(- rDy]far fajur 2 y 


Comme nous l'avons vu en mécanique analytique, le bon chemin est donné par 45 = 0. Dès lors, nous 
devons avoir: 


s-prol er] 


Ainsi, notre expression contient trois termes. Chacun de ces trois termes doit s'annuler 
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: 8y_ dy 
a- jafala® re ôy =0| (31.112) 


indépendamment comme nous allons le voir: 


1. L'annulation du troisième terme se fait selon une condition triviale qui nous est déjà bien connue 
(heureusement.….): 


jafa[a ro }e- sa ir-ri2- O (31.113) 


et donc: 


dy _& 8y - m0 (31.114) 
dx F 8Ë 


nous retrouvons donc l'équation différentielle d'une onde transversale telle que nous l'avions démontrée 
plus haut. Notre hypothèse sur le troisième terme ne peut donc être que juste ainsi que l'expression de 
notre action. 


2. Le premier terme est déterminé par la configuration de la corde aux temps 4, : 


1 t 
4 É 

farel dx (31.115) 
FT À 


Or, si nous imposons la connaissance de ces configurations dans le temps, nous aurons par définition: 
Oy(x,t,) = Oy(x,f) = 0 (31.116) 


(connaissance totale du chemin d'action car connaissance des conditions initiales, donc pas de 
variation). Cela valide encore une fois l'expression de notre action et la valeur nulle du terme comme 
attendu. 


3. Le second terme est un peu plus intéressant: 


D'abord, ce n'est que parce que nous connaissons les positions des extrémités de la corde que nous 
pouvons connaître ces modes de vibrations, nous le savons bien! Il nous faut donc savoir comment se 
comportent les extrémités. Pour cela nous allons revenir sur des choses qui nous sont connues: les 
conditions de Dirichlet et de Neumann d'une corde. 


Supposons que nous imposions les conditions de Dirichlet (voir plus haut), les extrémités sont alors 
fixes et nous aurons forcément à ces mêmes extrémités: 


y(0, f) = Éy(Z,i) = 0 (31.118) 
et donc le deuxième terme disparaît bien (ouf!). 


Si, à l'opposé, nous choisissons que les extrémités se meuvent librement, alors les variations: 
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6y(0,f) = Sy(Lf) (21119) 


sont non contraintes et dès lors, seulement les conditions de Neumann: 
Fe) à 
D a,0= V{,L)=0 
ax dx 


(voir plus haut pour plus de détails) nous permettront d'avoir le deuxième terme de l'action nul. 


Pour prendre pleinement conscience de l'importance de ces conditions initiales, considérons la quantité 
de mouvement p, portée par la corde (il n'y pas d'autres composantes du mouvement car nous avons 


supposé implicitement une excitation transversale dès le début seulement dans cette direction y). 


La quantité de mouvement est simplement la somme des quantités de mouvement de chaque élément 
infinitésimal le long de la corde: 


1 
Py - flan)? (31.120) 


Vérifions juste par curiosité (c'est une curiosité anticipée.) si la quantité de mouvement est bien 
conservée: 


de 


où nous avons utilisé l'équation d'onde transversale pour la substitution. 


Nous voyons par le résultat de ce petit calcul que la quantité de mouvement est trivialement conservée 
si nous imposons les conditions de Neumann, alors que pour les conditions de Dirichlet, la plupart du 
temps la conservation n'est pas respectée! Effectivement, c'est trivial (il n'y pas besoin de calculs pour 
s'en rendre compte), lorsque les extrémités sont attachées au mur, le mur exerce constamment une 
force sur la corde. 


3.5. MODES DE VIBRATION DANS UNE MEMBRANE TENDUE 


Nous dérivons le phénomène de la même manière que la vibration transversale de la corde. Toutefois, 
la densité linéique £, du fil doit être remplacée par la masse surfacique &, de la membrane. 


De plus, nous remplaçons la force F de tension unidirectionnelle du fil par une force de tension 


appliquée sur le pourtour de la membrane. Cette force s'exerce dans toutes les directions du plan et se 
décrit par unité de longueur: 


Nous avons (analyse dimensionnelle): 
dF, = tdxdy' f,,(x,y,f) = Odxdyf, (x, y,£) (31.123) 


Il est d'abord évident que: 
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2 2 
PACS) FREE = dE, = cap HE 20 (31.124) 
£ 


et comme: 
dF, =dF +dF, = tTdxdy' f, (x, y,f) +Taxdy" f,(x,y.é) = Tdxdy| f,.(x,y,6) + f,(x,y.6)] (31.125) 


L'analyse dimensionnelle (eh oui … à nouveau...) donne: 


2 2 
dF, = Tdxdy RAP RARE (31.126) 
ax dy 


Nous avons donc: 


2 2 2 2 2 2 
Täxdy Eee "cry 4 PL T HE (31.127) 
äx dy dé dé T\ dx" dy 


L'analyse dimensionnelle donne: 


de LS (1128) 
g 


Donc finalement nous obtenons pour équation d'onde en coordonnées cartésiennes (exprimé avec le 
laplacien): 


Nous cherchons la solution particulière de cette équation qui vérifie les conditions suivantes: 
C.L.1. La membrane est fixée sur son pourtour R (conditions aux limites) 
C.IL.2. La position et la vitesse initiales sont données (conditions initiales) 


La symétrie du problème suggère d'utiliser le laplacien en coordonnées polaires (cf. chapitre de Calcul 
Vectoriel): 


Remarque: Nous avons changé de notation en posant Y := # 


Et les conditions fixées: 


C1. vé 2 0,v8e[0,2x],y(&,8,f) = 0 (conditions aux limites) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


F(r,8,0) = f(r,8) 


C2. V8e[0,2x], vr e[0,R conditions initiales 
[0,277], vr el 26.80 - 00.0 ) 
É 


où les fonctions f,g sont données. 


À nouveau, pour chercher la solution, nous allons utiliser la méthode de séparation des variables telle 
que: 


y6r,8,5 = ÆX(r,8)T (6) (31.131) 


et de même que pour la corde: 


ei 4 8°T 
ax? lon (31.132) 
re 6 T 


et identiquement que pour la corde, nous obtenons pour T une solution du type: 
TE) = Acos(Avt) + Bsin(Avf) (31.133) 


Pour X(r,8) la méthode change car nous avons maintenant une équation différentielle à deux 
variables telle que: 


8° X(r,8) 


"© + xfr, 9 =0 (31134) 
8xir, 8° 9 


Pour intégrer cette équation, nous cherchons les solutions de la forme X{r,8) = A(r)@(8), nous 
obtenons en reportant: 
1 l 


RERO 
La 8 


R@"+ 4?2R@G =0 (31.125) 


En se rappelant qu'en coordonnées polaires: 


D'où, en séparant les variables: 


8"... 1 
e 9" R(r) 


(rR"r)+rR{r) + ÆrR(r)l (21.137) 


Le membre de gauche de la dernière relation ne contient pas la variable r et celui de droite ne contient 
pas la variable 8. La seule et unique façon d'égaler ces deux expressions est de les considérer chacune 
comme constante, que nous noterons {{ . Les équations différentielles vérifiées par R et & sont alors: 


RU) +rR)+(Ær + 4)RG)=0  E(8)- EE) = 0 (31.138) 
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La fonction @ est périodique de période 2 x, il existe donc un entier naturel n tel que x; = -# 


? et donc 


manière identique à la corde, nous obtenons: 
O(9) = C'cos(x®) + Dain(n®) (31.139) 
Dans la première équation différentielle: 
2pu 1 f 32.2 2 = : ; 
FR')trkRr)+{Ær —-# ]Rr)=0 (31140) 
Pour simplifier, nous effectuons le changement de variable x= 4r. L'équation différentielle devient: 


2 
u ce Ris (#-n#)R=0 (1.141) 
dx dx 


Nous reconnaissons ici l'équation différentielle de Bessel d'ordre n telle que nous l'avons avec sa 
solution présentée dans le chapitre des Suites Et Séries. Dès lors, la solution générale est du type: 


R(r) = J,(2) = J, (Ar) (31.142) 
Ce qui nous donne finalement: 
vfr,8,6) = RM O(OÏT(E) = J, (Ar) C'cos(#9) + D sin(x9) \( A cos(Avé) + Bsin(Avé)i (31.143) 


Parmi les solutions à cette équation, cherchons celles qui vérifient les conditions aux limites en posant 
Renan 2L 


v8e [0, 2x], vi > 0, R(L)O(8)T(E) = 0 (31.144) 


À moins que &@ ou T soit la fonction nulle, ce qui donne pour solution la position d'équilibre. (qui ne 
vérifie sans doute pas les conditions initiales), nous devons avoir AZ) = 0, c'est-à-dire: 


J, (bi) = 0 (31.145) 


La fonction Bessel d'ordre J, a une infinité de zéros positifs | 4, He (il suffit de tracer cette fonction 


avec un ordinateur pour le voir tel qu'avec Maple en mettant la commande: plot(BesselJ(2,x),x=0...100) 
où vous pouvez changer la valeur 2 par une autre valeur) qui fournissent une infinité de valeurs 
convenables de b telle que: 


# 
Æ = Et (31.146) 
L 


Ce qui correspond finalement à une infinité de solutions de l'équation différentielle initiale que nous 
pouvons écrire: 


(an cos(ant)+ À sin(ast))cos(x8) + 
Va tr, 8,2) = J,(4r) (31.147) 
(ra cos(œnt) + dE sin(aht)) sin(x8) 
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En ayant modifié le nom des constantes d'intégration et en ayant posé æ,, = Av (ce qui vérifie 


l'analyse dimensionnelle). Maintenant que cette solution satisfait les conditions aux limites, nous devons 
nous attaquer aux conditions initiales. 


D'abord pour les mêmes raisons que la corde, la solution finale est la superposition linéaire des solutions 
telle que: 


Le La 
vtr.809= 3 Syi(r, 8) (61148) 
#0 =] 
Nous allons déterminer les coefficients &,,4,,7,,%, de façon à ce que la solution y donnée 
précédemment vérifie également les conditions initiales, à savoir: 


f(r,8,0) = Don (Ar), cos(n6) + y sin(x8)| 


HmÛ ml 


gtr,8,0) = SV a), (Ær)l & cos(n8) + y, sin(x8) | 


Hd] =] 


(31.149) 


Ces deux relations sont similaires, étudions la première. Elle peut s'écrire: 


f(r,8,0) = 2 Du, an) cos(#6) + ue J. cn) No) (31.150) 
#0 Ml Html 

qui est le développement en série de Fourier de la fonction f {r,8). Nous avons donc (cf. chapitre sur 

les Suites Et Séries): 


LA 


QI, Ar) = [ /0.608 = A) 
=] 2x à, 


L'3 


DXNACOE L[r6.9 cos(r6)d8 = f({r)neN (31151) 
M] > 
Him] 


DAC DE à [7 0.9sin(r8)40 = g,(r),nE N° 


En utilisant l'orthogonalité des fonctions de Bessel nous pouvons déduire de ces relations les 
coefficients af, ax ,y* (et de même pour les autres). 


Pour cela, supposons n fixé et posons Z,,(r) = J,(4,r). Montrons #7 # p — Z,, 62, = 0 où le produit 
scalaire est défini par: 


1 
Zn "2 = frZx (r)Z,(r)dr (31.152) 


Puisque Z,,2, vérifient l'équation différentielle en R(r), nous avons: 
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2 (7) +2.) + (Cr) -#°)Z tr) = 0 
r? Z, r) + r£, {)+l (Ær) - x? 1Z,(7) = 0 


En combinant ces deux relations nous obtenons: 
(CAN = (AL) )r2,7, =r(2,2, 2,2, )t(2,2,2,2,)=(r(2,7,-2,2,))] (1154 
En intégrant membre à membre entre 0 et L et en tenant compte de: 
Z,(L)=J,(42)=0 et Z,(L)=J,(ÆD)=0 (31155) 


Nous obtenons: 
pA 
(4) - > | (2.092, Cr AC PC 0 2 ql =0 (31156) 


D'où le résultat énoncé puisque #4 # p — À, # À, - 


La relation: 


LT (Aer) = Lf76.9 cos(x60)48 = f(r) (31157) 


M] 


Peut donc s'écrire: 
=D Zn (1158) 
#=l 
Utilisant l'orthogonalité de Z,,,7, pour »# # p nous en déduisons: 


JS °2,= Saz, er, Hd iz oz, )-dizcz,) G11-) 


Him] Ml 


Les coefficients & sont donc donnés par: 


F 
I 
f 02 [AO Grndr 
a* = # 2 = 0 (31.160) 
Por or UE 


r° 7» fr (J,(Æ nl dr 


Ce qui n'est pas aisé à calculer à la main... 


Nous procédons de la même façon pour les autres coefficients. 
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4. PHASEURS 


Il existe plusieurs façons d'exprimer les fonctions d'ondes que nous avons vues précédemment. Les 
physiciens (ainsi que les électrotechniciens) utilisent une formulation, appelée "phaseur" ou 
"représentation de Fresnel", permettant d'économiser avantageusement le poids des écritures et ainsi de 
simplifier considérablement l'étude des problèmes complexes (ou simples). Les phaseurs font usage des 
propriétés des nombres complexes pour exprimer les fonctions d'onde trigonométriques sous une forme 
simplifiée dans tous les phénomènes où apparaissent des oscillations. 


Ce que nous appelons "phaseur", est une fonction f dont la valeur est complexe et qui, dans un espace à 
1 dimension, s'écrit: 


ft =ets-#) (31161) 
Dans toutes les applications en physique, t est la variable du temps. 


Comme cette fonction est complexe, elle a une partie réelle que nous appelons ici g et une partie 
imaginaire que nous appelons h. Leur identification est facile puisque comme nous l'avons déjà 
démontré lors de notre étude des nombres complexes (cf. chapitre sur les Nombres): 


JUx,Ë) = cos(kx — @f) +isin(kx — &) (31.162) 


Ainsi, les parties réelles et imaginaires sont simplement: 


C9 


g(x,t) = R(J) = cos(kx - &t) _ 
hx,t) = K(f) = sin(äx — @é) (31.163) 


Le module de f se calcule aisément en calculant: 
Lf1= ff = cos (lx - @) +sin*(kx- af) =1 (31.164) 


Les parties réelles et imaginaires varient lorsque la position ou le temps varient. Le module ne change 
donc pas, il est toujours égal à 1. Le changement se manifeste simplement par la simple variation 
d'angle que fait le vecteur représentant f dans son plan complexe. C'est là une raison suffisante pour 
parler de phaseur, puisque la variation de f peut être visualisée comme un simple changement d'angle 
ou de phase. 


Si nous sommes dans un espace physique à plus d'une dimension, disons 3, alors l'expression pour 
f devient: 


SEE) = re 2 Los of — @t) +isin(& or — @f)| (31.165) 


La situation est un peu plus difficile à visualiser (...). Elle est la même qu'en une dimension, mais là tout 
se passe le long d'une direction définie dans l'espace 3D par le vecteur # . Plus précisément, nous 
aurons: 


cos(f 07 —@)=cos(k,x +k,y+4,z- a) 
(31.166) 


sin(£ oF - @) = sin(k,x + &,y +&,z - @) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


La variation dans le temps reste la même qu'en une dimension spatiale mais un déplacement dans 
l'espace est un peu plus compliqué qu'en une dimension. Ici tout déplacement spatial dans une direction 
qui n'est pas orthonormale à # fera que le produit scalaire changera de telle sorte que l'argument 


f variera. Ici ce n'est pas seulement la grandeur ou la norme du vecteur # qui donne le taux de 
variation de f sous un déplacement spatial mais aussi l'angle que fait ce déplacement par rapport à la 
direction de # puisque nous avons un argument qui varie comme # .# et donc qui dépend de cet angle 
noté ici #.En effet, nous avons: 


£or= El fFlcos(r 


La quantité Z est souvent appelée le "vecteur d'onde". Physiquement il est relié le plus souvent à 
l'équivalent du moment (linéaire) de l'onde pour laquelle il est évident que la définition usuelle de la 
quantité de mouvement (2 = ## ) n'a plus de sens. 


Une partie importante des systèmes étudiés en physique ne peuvent être caractérisés par un point et 
donc décrits par une trajectoire. Une vague, une onde, une bande élastique qui oscillent n'ont pas une 
unique position définie, ce sont des "milieux continus" sur un certain intervalle. La question que nous 
nous posons dans notre tentative de les décrire est plutôt la suivante: comment décrire le déplacement 
de ce milieu dans l'espace et dans le temps. Par exemple, pour une vague, si nous figeons le temps, 
comment l'amplitude À, de cette vague varie-t-elle d'un endroit à l'autre de l'espace? Nous pouvons 
aussi figer l'espace en regardant un seul endroit et demander comment l'amplitude varie avec le temps? 


Les coordonnées et le temps jouent maintenant un rôle similaire de paramètres indépendants. Nous 
mesurons l'amplitude du phénomène en tout temps et en tout lieu. Nous chercherons donc à obtenir une 
expression du type: 


A= A(x,f) ou À= A6 
en une ou trois dimensions. 


Le point important est que nous cherchons à exprimer A, dont le nom correct est un "champ", comme 
une fonction des coordonnées du temps. Par exemple, si la vague est très régulière peut-être est-elle 
décrite adéquatement par À- cos(&f) si je regarde à un seul endroit et par À - cos{&x) lors d'une 
fixation imaginaire du temps ? 


La quantité & va caractériser la fréquence de la variation du même phénomène. 


Le nom de "fréquence angulaire" est facile à comprendre puisque la fonction cosinus ou sinus fait un 
cycle si son argument change de 2x7 sur un temps d'une période /4 =T. 


Rappelons que: 
27 
PR EE 


Dans la description des systèmes harmoniques, la notation phaseur peut être très utile comme nous 
l'avons déjà dit. L'équation la plus souvent rencontrée est l'équation d'onde (que nous avons démontrée 
au début de ce chapitre). En une dimension, elle s'écrit: 
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a? 
— A(x,f)- 
"= (x,é) 


1 2 
—— A(x,fj =0 (31.170) 
v? dé? Gt) 


Nous vérifions par simple substitution que la solution est du type: 
A(x,f) = À sin(kx - @ét) ou A(x,f) = À cos(&x - @) (31.171) 
ou une combinaison linéaire dont la forme la plus générale est: 
A(x,t) = À cos(&x — @é) + A sin(âx - @f) (31.172) 


Une manière rapide et efficace d'écrire toutes ces relations de façon condensée et utilement imagée, est 
d'écrire: 


A(xt) = Aet®-#)| (31.173) 


Dans les trois cas, la substitution permet de le vérifier. Prenons, par exemple, la solution sinus. Alors: 


A(x,t) = À sin(&x - @t) 
84 8? A 


= _ = 22 : _ 
nd Mr &° A sin(Xx — &) (31174 
2 
= À --0A cos at) = TE = -2 4 sin(lx - @t) 
É 


Le remplacement dans l'équation donne: 
Fa 
[-# È JA sin(fx- @t)=0 (31.175) 


qui sera satisfait si et seulement si: 


Fu 
v? 


= =kt1y) (31176) 


La substitution du phaseur comme solution de l'équation d'onde transforme cette dernière équation 
différentielle en une simple équation algébrique & = &{#&) appelée "relation de dispersion". 


Elle est évidemment caractéristique de l'équation qui la génère. Celle qui apparaît ci-dessus est 
particulièrement simple et caractérise une onde libre dans un milieu non-dispersif, tel que décrit par 
l'équation d'onde que nous avons écrite. 


La solution phaseur: 
A(x,t) = Aeï®-# (31177) 


satisfait donc aussi l'équation, avec la même relation de dispersion. Est-elle donc aussi la description 
d'une onde? La réponse est oui, et même deux fois plutôt qu'une, comme nous allons le voir ci-dessous. 


Une onde physique n'est évidemment pas complexe. La solution phaseur est complexe et a donc une 
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partie réelle et une partie imaginaire. Nous montrons ici que chacune des deux parties peut représenter 
une onde réelle générale. Utilisons même un point de départ un peu plus général. Imaginons que 
l'amplitude 4, est elle-même complexe. Nous pouvons donc l'écrire: 


4 =|4le (1178) 
Nous avons donc: 
A(x,8) = Ag 2 4 (cos(kx - @t + 8) +i sin(kx — @t + 8)) (31.179) 
Nous étudions d'abord la partie réelle de cette expression: 


RCACX,5)) = À cos(kx — @é + 9) = A [cos(kx — @f) cos(d) - sinkx - @f) sin 6] 


31.180 
= À cos 6 cos(kx - @f) - À sin sin(lx - @) aus 


Cette partie réelle est donc de la forme la plus générale (et réelle) de la solution monochromatique pour 
l'équation d'onde, soit: 
A(x,£) = À cos(&x - @f) + À sin(&x — @) (31.181) 
Clairement, il suffit d'identifier: 
ô = - [a 2 
A sos À _ À À 6 (31.182) 
A sin ô = À 6 = - arctan( À, / A) 


qui relient deux paramètres à deux autres. La partie réelle du phaseur est donc suffisante pour décrire 
entièrement l'onde monochromatique. 


Nous pouvons refaire exactement la même chose avec la partie imaginaire du phaseur et démontrer de 
façon identique qu'elle est suffisante pour décrire entièrement l'onde monochromatique. 


Conclusion: il est donc possible d'utiliser le phaseur pour faire toutes les manipulations mathématiques 
demandées par le problème physique et à la fin, ne garder que la partie réelle ou imaginaire, selon ce 
qui a été convenu dès le début. 


Comme nous l'avons déjà dit, la forme réelle la plus générale de la solution est: 
A(x,t) = À sin(&x - @f) + A, cos(kx — @f) (31.183) 
Cette fonction a le comportement d'un sinus (ou d'un cosinus) dont l'amplitude est donnée par: 
A = A+A (31184) 


De plus les conditions initiales ajustent À, de telle sorte qu'à x =0 et £ =0 (initialement), le champ 
A(zx,f) a la valeur 4, donc. Ces deux conditions fixent ces deux paramètres. Nous aurions pu utiliser la 
forme toute aussi générale: 


A(z,t) = Asin(&x-@t+8) (31.185) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Ici l'amplitude connue est 4, et les conditions initiales sont telles qu'à x = 0 et £ =0, le champ a la 


valeur: 
A(x,t) = A sin(ô) (31.186) 
Encore une fois, deux conditions fixent deux paramètres. 
L'amplitude est une chose évidente, la phase un peu moins. Pour qu'une fonction du type: 
A(x,f) = A sin(arg+ 8) (31.187) 


ait n'importe quelle valeur que l'on veut lorsque son arg (argument) est, disons nul, il suffit d'ajuster la 
valeur de la phase %. C'est comme faire glisser la fonction sinusoïdale le long de l'axe, de façon à 
satisfaire des conditions initiales physiques imposées par le système étudié. 


De deux fonctions de type sinus ou cosinus qui ne commencent pas au même point de leur cycle, nous 
disons qu'elles sont "déphasées". Ceci devient vital lorsqu'il y a plus d'une onde en présence. Imaginons 
le cas le plus simple de deux ondes de même amplitude: 


A(x.9 = 4 sin(8 + 6,) 
At) = 4 sin(8 +) 


(31.188) 


Ici l'argument est une variable et les phases des paramètres constants. Nous considérons le résultat 
physique de l'onde résultant de l'addition de ces deux ondes. 


Si 4, - à =2kr,ke £ l'onde résultante sera une onde sinusoïdale d'amplitude 2 fois 4,. Cependant, si 
À - à =kAkEZ, l'onde résultante sera identiquement nulle partout. La différence est donc 
considérable et nous trouvons toutes les situations intermédiaires. Il est donc important de garder en 
tête la phase à l'origine de l'onde ou mieux, sa phase relative par rapport à d'autres ondes de notre 
système physique. 


Dans le phaseur, soit la partie réelle, soit la partie imaginaire, est suffisante pour donner une description 
générale de l'onde (toujours monochromatique jusqu'à maintenant). Elles sont respectivement 
composées d'un cosinus et d'un sinus et donc déphasées de x; 2 l'une par rapport à l'autre ! 


Il est souhaitable de revenir sur la "relation de dispersion" que nous avions obtenue. Nous avons vu 
que, pour l'onde monochromatique libre, celle qui est solution de l'équation homogène, cette relation 
s'écrit pour que la phase de la solution corresponde à cette réalité (attention il s'agit de ne pas confondre 
le symbole de la vitesse et de la fréquence!): 


a =kv = o=ak)ek=k(®) (31189) 
Toujours dans le cas libre, nous pouvons avoir une situation physique qui correspond à l'addition de 


plusieurs ondes monochromatiques libres. Le résultat n'est pas monochromatique et s'écrit évidemment 
comme une somme: 


A(x,0) = DA (xd) =D 4e #4) (31190) 
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Nous lui donnons souvent le nom de "paquet d'ondes" pour des raisons évidentes. Puisque tout est libre, 
chaque composante satisfera: 


2 — 32,2 2 
@, =kKvV, (31.191) 


Nous noterons ici deux choses pour l'équation des ondes libres: 


- D'abord, même pour des ondes libres, elle est quadratique, nous pouvons donc changer le signe du 
vecteur d'onde et/ou de la pulsation sans affecter l'équation. Nous observons trivialement que pour une 
ou plusieurs composantes du vecteur d'onde positives l'onde se propage vers les x croissants pour ces 
composantes positives et qu'inversement, pour une ou plusieurs composantes négatives l'onde se 
propage vers les x décroissants. De même, une pulsation négative ou positive signifie que le temps varie 
vers le passé, respectivement le futur. 


- D'autre part, certains types d'ondes n'obéissent pas à une équation aussi simple que l'équation 
homogène. C'est le cas des vagues, par exemple, tant du fait de la nature du liquide dans lequel elles se 
propagent que de la force de rappel gravitationnel. Parfois aussi, une onde qui serait totalement libre, 
ou à peu près, cherche à se propager dans un milieu où les conditions de propagation sont sérieusement 
affectées. Par exemple une onde sonore qui tente de se propager dans le mastic ou une onde 
électromagnétique qui cherche à se propager dans un conducteur (un métal). Dans ce cas, une partie 
importante de la différence entre onde libre et onde modifiée par le milieu peut se décrire par un 
changement de la dispersion. 
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Notes personnelles: 
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32. MÉCANIQUE STATISTIQUE 


L. mécanique statistique, appelée aussi "thermodynamique statistique" ou encore plus généralement 


"physique statistique", a pour but d'expliquer le comportement des systèmes macroscopiques 
(constitués d'un grand nombre d'objets en interaction) à partir de leurs caractéristiques microscopiques. 
C'est de façon beaucoup plus générale, la physique quantique qui décrit les propriétés et l'évolution des 
systèmes physiques à l'échelle microscopique. La mécanique statistique est donc construite sur cette 
description quantique comme nous le verrons sur les développements mathématiques qui suivront. 


La démarche présentée ici est d'aborder la mécanique statistique élémentaire pour en déduire ensuite la 
thermodynamique. La mécanique statistique constitue en effet, avec la physique quantique et la 
relativité, l'un des piliers de la physique moderne dans l'explication de phénomènes à partir de leurs 
constituants. Il est important de la percevoir d'emblée comme une théorie fondamentale, et non pas 
comme une simple tentative pour justifier à posteriori la thermodynamique. La thermodynamique 
elle-même y gagne en retour compréhension plus juste et plus profonde de ses principes et de ses 
méthodes. 


1. THÉORIE STATISTIQUE DE L'INFORMATION 


Le mot "information" est utilisé dans des contextes très variés, dans des sens totalement différents 
suivants les disciplines scientifiques: nous pouvons à titre d'exemple citer la thermodynamique avec le 
concept d'entropie, la physique appliquée avec la théorie du signal, la biologie avec la théorie du 
génome et la physique quantique avec la probabilité d'obtenir de l'information. 


Se pose alors la question, s'il est possible de construire une théorie de l'information et si elle est unique? 
Notre démarche ici, ne vise pas l'information en tant que telle, mais la quantité d'information. Lorsque 
nous parlons de quantité et de mesure, nous pensons à la notion de contenu ou de valeur de 
l'information. La science de l'information de par son objet doit se sentir concernée par ce 
questionnement. Si nous définissons "l'infométrie" comme l'ensemble des techniques de mesures 
mathématiques et statistiques de l'information, nous souhaiterions avoir une définition suffisamment 
claire du concept de quantité d'informations qui puisse nous amener à définir une mesure, c'est-à-dire 
un ensemble d'opérations parfaitement définies, nous amenant à des axiomes clairs et dont le résultat 
est un nombre. La synthèse que nous développons ici n'est pas ambitieuse. 


Nous nous intéressons donc ici aux fondements de la théorie statistique de l'information connue 
également sous le nom de "théorie de Shannon". La formule de Shannon qui en ressort est certainement 
l'un des concepts fondamentaux de toute la physique puisqu'elle touche la brique irréductible de la 
physique: l'information !! 


Nous montrerons (plus bas) qu'un système physique isolé a pour état le plus probable, celui qui contient 
le plus d'états et qui est donc à fortiori le plus imprévisible. L'état le plus improbable est donc celui qui 
est le plus prévisible. Dès lors, puisque l'imprévisibilité apparaît comme un attribut essentiel de 
l'information, nous identifions la mesure quantitative de l'information à son improbabilité. 


Ainsi, la quantité d'information h(x) apportée par la réalisation d'un événement x de probabilité p(x) 
sera une fonction croissante f de son improbabilité 1/p(x): 
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= ee 39 1) 
Lu ) du 


De plus, la réalisation de deux événements indépendants x et y apporte intuitivement une quantité 
d'information qui est la somme de leurs quantités d'informations respectives, soit: 


1 1 1 1 
A(X,>)= = f|——— | — | = hr) +h (32.2) 
jé En 1) ls SE 


La fonction logarithme est donc par ses propriétés une candidate naturelle pour f telle que: 


1 
A1 ——| (323 
f #7] (32.3) 


où 4 est bien évidemment un nombre positif. 


Remarque: Le choix de la base du logarithme définit l'unité d'information qui est complètement 
arbitraire. Par la suite, et sauf précision contraire, "log" désignera le logarithme en base &. 


Ainsi, la "quantité d'information intrinsèque" d'un événement x est donc de par les propriétés du 
logarithme: 


h(x) = -Alog(p(x)) (32.4) 


Elle peut être considérée, comme nous l'avons fait, comme une mesure d'incertitude sur l'événement, ou 
comme celle de l'information nécessaire pour résoudre cette incertitude. Voyons un exemple qui motive 
cette définition. 


Exemple: 


Convenons que la connaissance de la réalisation d'un évènement qui avait pour probabilité 1/2 fournit 1 
bit d'information. Lançons maintenant n pièces de monnaie et prenons connaissance du résultat de 
l'expérience : nous acquérons n bits d'information. Or l'évènement en question avait pour probabilité 


1/27. Donc le nombre de bits d'information est ici: 

—logs(p) (32.5) 
où p est la probabilité de l'événement. Ce qui motive la définition! 
Définitions: 


D1. Nous définissons "l'information intrinsèque par paire" de deux événements x et y de probabilité 
conjointe p(x, y) (cf. chapitre de Probabilités) par: 


h(x, y) = -Alog(p(x.y)) (226) 


D2. Nous définissons de même "l'information conditionnelle" de x sachant y par (cf. chapitre de 
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Probabilités): 


h(x{ y) = -Alogip(x/yii (22.7) 


qui peut donc aussi s'écrire (ce n'est qu'une manière de noter différente que nous avons déjà présentée 
dans le chapitre de Probabilités): 


h(x|y)=-Alog(p(x|y)i (22.8) 


Il s'agit de la quantité d'information restant sur x après l'observation de y. La formule de Bayes (cf. 
chapitre de Probabilités) nous permet de remarquer immédiatement que si x et y sont indépendants: 


h(x1{ y) = k(x) (32.9) 
ce qui concorde avec le sens commun. 


Nous souhaitons aussi mesurer la quantité d'information que la donnée d'une variable, par exemple y, 
apporte sur l'autre, x. C'est le cas en particulier lorsque nous identifions x au choix d'un signal appliqué 
à l'entrée d'un canal et y au signal correspondant observé en sa sortie. p(x) est alors la probabilité à 
fortiori que x soit émis et p(x / y) la probabilité à fortiori que x ait été émis, sachant que y a été reçu. 


Une mesure de cette quantité d'information, nommée "information mutuelle" est: 


i(x,y) = Alog PGI») (32.10) 
pr) 


il s'agit de la mesure logarithmique de l'accroissement de la probabilité de x (donc de la baisse de sa 
quantité d'information) dû à son conditionnement sur y. Si la donnée de y est équivalente à celle de x 
(cas d'un canal parfait), elle est égale à l'information intrinsèque h(x). Elle est nulle si, à l'inverse, x et y 
sont indépendants. 


Nous avons bien évidemment: 
i(x,y) = A(X) —h(x/y) (32.11) 


et de par les propriétés des logarithmes: 


Ge» =Atee( PE (32.12) 


N 
N 


PDP) 


cette dernière égalité justifiant le terme "mutuelle". Alors que les informations intrinsèques étaient 
positives, l'information mutuelle peut être négative. Nous verrons que sa moyenne, beaucoup plus 
importante dans la pratique, ne peut l'être. 


Les événements individuels étant généralement moins importants que les moyennes, nous les 
considérerons par la suite comme provenant d'une source aléatoire, discrète, finie, stationnaire, et 
blanche (i.e. de réalisations successives indépendantes). Les événements sont donc interprétés comme 
le choix d'un symbole dans l'alphabet de la source. Soit n la taille de cet alphabet, et x,,--,x, ses 


symboles. La source est donc décrite par la variable aléatoire x, qui prend ses valeurs dans l'alphabet, 
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avec des probabilités respectives p, ,---, p,, telles que: 


Sr. =] (32.13) 


il 


La quantité d'information moyenne de cette source est l'espérance de l'information intrinsèque de 
chaque symbole de l'alphabet de la source (cf. chapitre de Statistiques). Elle est appelée "entropie" (par 
la notation S(X)) de X et est donnée par la relation: 


S(X) = E{h(x)} = A p, log(?;)| (32.14) 
il 


appelée "formule de Shannon” et il s'agit bien d'une espérance car son expression générale pour une 
variable aléatoire discrète est comme nous l'avons vu dans le chapitre de Statistiques donnée par: 


ñn 
EC) = mx (8215) 
= 
avec dans le cas présent: 
x; =—Alog(p,;) (32.16) 


Cette dernière écriture constitue cependant un abus de notation: en effet, l'espérance mathématique a 
un sens si h(x) est une fonction de x. Or h(x) ne dépend pas des valeurs de x, mais seulement des 
probabilités associées. Nous noterons parfois plus rigoureusement l'entropie d'une distribution: 


SP, 7) (217 


Les "entropies conjointes et conditionnelles" sont définies de manières similaires avec les notations 
idoines: 


SCX,Y) = Efh(x,y)} = SN p(x ,Yj)log(p(x.y;)) (218) 


EI j=l 


et (nous adoptons cette fois-ci le symbole "|" et non plus le symbole "/" pour indiquer la relation 
conditionnelle): 


SIA) = {ax )} = Ad PGrplog( PO) 62.10) 


I je 


Il faut noter dans la dernière expression que l'espérance est effectuée dans l'espace produit, et que donc 
le coefficient est la probabilité conjointe. 


"L'information mutuelle moyenne", appelée par abus de langage "information mutuelle" se définit elle 
aussi de manière directe: 
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# M A 
ICX,F) = E{i(x,y)} = ASS p(x,y;)log CT 
El jel ï 


* IST px, »)l08 Go) 
ir gel p(x)plr;) 


Remarque: Il est à noter que la définition de la quantité d'information, par une mesure 
logarithmique peut paraître arbitraire, quoique raisonnable, compte tenu des propriétés attendues 
d'une telle mesure. Shannon, et plus tard Khintchine ont montré que compte tenues de certaines 
propriétés posées en axiomes, la fonction logarithmique est la seule à convenir. 


Exemple: 


Soit une variable aléatoire binaire, valant 1 avec une probabilité p (et donc 0 avec une probabilité 1-p). 
Son entropie vaut: 


SP) =8,(-p)e S,(p) -S,(1-p)=0 
= -pÂlog(p) -(1- p)Alog(i- p) = 0 


(32.21) 


avec Ü < p < 1 et avec un logarithme en base 2 tel que pour un événement à deux états équiprobables, 
l'entropie d'obtention d'un des deux états soit égale à l'unité. Ceci dit, il vient naturellement que 4 =1. 


Elle est représentée à la figure ci-dessous, en "Shannon" (unité correspondant à l'utilisation du 
logarithme à base 2). Nous remarquerons sa symétrie par rapport à #2, valeur pour laquelle elle atteint 
son maximum, égal à 1. 


0 02 0,4 0.6 0.8 L 


Figure: 32.1 - Entropie d'une variable binaire 


Il convient maintenant de faire la liaison entre la théorie statistique de l'information et la mécanique 


statistique: 
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2. LOI DE BOLTZMANN 


Nous allons d'abord démontrer par l'intermédiaire d'un cas simple, que pour tout système, l'état le plus 
probable est l'état d'équilibre ! 


Considérons un système isolé (un système est dit "isolé" lorsqu'il est imperméable à tout flux - chaleur 
(adiabatique), matière, champs, …) peuplé de N particules discernables. Ce système est partagé en deux 
compartiments (ou niveaux) identiques et séparés d'une paroi imperméable. Chaque compartiment est 
supposé contenir un nombre À/,W, de particules. 


Pour une configuration donnée du système, nous parlons de “"macro-état" dans le sens où il est possible 
de par la quantité de particules de mesurer une grandeur dite macroscopique telle que l'énergie, la 
masse, la pression, etc. 


Si nous fixons ce système particulier, il est bien sûr possible pour un nombre N de particules de 
concevoir un nombre donné de macro-états. Tel que: 


- 1 particule: 2 macro-états (2 configurations possibles soit 1 configuration par macro-état) 

- 2 particules: 3 macro-états (4 configurations possibles par permutations des compartiments) 
- 3 particules: 4 macro-états (8 configurations possibles par permutations des compartiments) 
- 4 particules: 5 macro-états (16 configurations possibles par permutations des compartiments) 
etc. 


Définition: Nous appelons "micro-état", une configuration de permutations du macro-état. 


Remarque: Parfois au lieu de “"micro-état" nous trouvons dans la littérature "probabilité 
thermodynamique" ou "complexions". 


Déterminons maintenant à l'aide de l'analyse combinatoire (cf. chapitre :s) le nombre de 
micro-états &2 possibles pour chaque macro-état. Par analogie, ceci correspond à s'imaginer que le 
système est une tige sur laquelle sont enfilées des boules (particules) et que la tige est séparée par une 
frontière imaginaire en un de ses points (boulier chinois). Pour une telle situation, nous avons: 


| 
o-_M 
AA 


Ceci nous donne tous les arrangements possibles des "particules gauches" avec les "particules droites" 
(de la frontière) pour un macro-état donné (le nombre de manières dont les particules peuvent se 
partager entre les deux compartiments). Mais nous avons aussi dans ce cas particulier: 


NW NI Nl 


o- M _ 
MIA, MUN-MNI (N-NIAl 


Or cela correspond à la combinatoire tel que: 
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TT 
MOMIN-MU VO iN-N Ml 


Æ 
ND 
AN 
È 


et donc: 


Nous avons finalement pour tous les macro-états d'un système de N particules, un total de: 


à à 
bhens = > Ch (32.26) 
1-0 À 2) 


micro-états (configurations) possibles. Or, nous avons bien vu dans l'exemple initial que: 


N N 
DC => Cm=2" (G227 
1-0 


N2=0 
Ainsi, la probabilité d'existence d'un micro-état donné est de 2-* et elle est équiprobable !! 


Nous pouvons maintenant énoncer le premier postulat de la mécanique statistique (postulat de Gibbs): 
tous les micro-états discernables et accessibles d'un système isolé sont équiprobables. 


Revenons-en maintenant à notre question initiale sur l'équilibre: 


La notion d'équilibre associée à un macro-état nous est fournie par la thermodynamique classique. Nous 
y voyons qu'un système est dit à l'équilibre lorsque son état est caractérisé par l'indépendance 
temporelle des grandeurs macroscopiques (masse, énergie, pression, …) et de la constance des 
potentiels thermodynamiques (énergie interne, enthalpie, énergie de Gibbs, ….). 


Pour savoir pourquoi l'équilibre est l'état le plus probable, il nous suffit de chercher quel est le couple 
(M, N,) qui maximise: 


puisque tous les micro-états sont de toute façon équiprobables. Il est facile de contrôler que ce 
maximum est donné pour: 


M =M, (32.29) 


Nous pouvons dès lors énoncer le deuxième postulat de la mécanique statistique: l'état d'équilibre est 
l'état qui correspond au plus grand nombre de configurations (micro-états) et est l'état le plus probable!! 


Ou en d'autres termes: Un système atteint l'équilibre lorsque son entropie devient maximale!! 


Soit maintenant à considérer le système suivant: 
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Lo squitore = 0 
P(x) P(X) | 
A X mr 
2 É eguisore 
P(x) P(x) 


Figure: 32.2 - Exemple d'évolution de l'entropie d'un système 


La fonction de distribution P(x) qui décrit la position des particules selon l'axe x à l'équilibre (£ = 0) va 
évoluer vers une autre fonction de distribution correspondant au nouvel équilibre £, . À l'équilibre P(x) 
est constante. Mais entre les deux équilibres, elle évolue, et devient de plus en plus large. Nous perdons 
donc de l'information sur la position des particules. Nous pouvons donc ré-énoncer le deuxième 
postulat en disant qu'un système hors d'équilibre évolue toujours dans le sens d'une perte d'informations 
(d'un élargissement de la fonction de distribution caractéristique). 


Parallèlement, le deuxième principe de la thermodynamique classique nous indique que toute évolution 
naturelle doit nécessairement correspondre à un accroissement d'entropie {4$ > 0}. Il doit donc exister 
un lien étroit entre l'information que nous possédons sur l'état de chacune des particules et l'entropie du 
système. 


Le cas que nous venons de décrire montre clairement que les paramètres ou concepts: nombre de 
configurations, désordre, équilibre, quantité d'information et entropie d'un système isolé servent à 
représenter l'état d'un système. Ces paramètres jouent le même rôle. Des relations mathématiques 
doivent donc les relier les uns aux autres. 


Rappelons que nous avons démontré que l'entropie statistique infométrique d'un système est donnée 
par: 


SCX) = E(h(x)} = -AŸ p;log(r,) (82.30) 
il 


Si nous appliquons cette relation au cas d'un système physique en équilibre pour lequel nous souhaitons 
calculer l'entropie, nous avons démontré: 


# (32: 


Pis Par Py CE 
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Il nous faut encore savoir à quoi correspond cette probabilité constante. Nous avons démontré 
précédemment qu'à l'équilibre, nous avions: 


qui est donc le nombre de micro-états à l'équilibre. Ainsi, la probabilité de tirer un micro-état parmi tous 
est de: 


Nous avons ainsi: 


sb Are ef] 


= —-À = lo8(R)-2 a Libeto “7 ge) - À fi +— +...+ à) 


Comme les probabilités des micro-états sont équiprobables et que nous sommons sur l'ensemble de ces 
derniers, il vient: 


et donc (sans oublier que dans ce cas particulier les probabilités ont toutes la même valeur!): 


S=-AY p;log(p;) = Alog(N) = c*log({) (32.37) 
i=l 


Puisque l'équilibre est lié au désordre maximum, et que le désordre est lié à l'information manquante, il 
paraît raisonnable de relier l'entropie statistique de l'information à l'entropie statistique 
thermodynamique en physique. Pour cela, il faut que la constante nous permette d'obtenir les bonnes 
unités et il vient naturellement de choisir cette constante telle qu'elle soit égale à la constante de 
Boltzmann k qui a les mêmes unités que l'entropie thermodynamique. Ainsi: 


S'= klog($è) (32.38) 


Il nous faut encore choisir la base du logarithme. L'expérience montre qu'il faut choisir le logarithme 
népérien qui permet de retrouver des résultats de la mécanique classique après développements. 


Ainsi, nous obtenons finalement la "loi de Boltzmann": 


5 = kin(&)| (2229) 
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qui nous donne l'entropie thermodynamique d'un système à l'équilibre! 


De par les propriétés mathématiques de l'espérance (cf. chapitre de Statistiques), en particulier la 
multiplication par une constante, nous avons pour un ensemble N de sous-systèmes: 


SN: ) = N° S(Q) = Min(&) = NT >, log{p;) (22.40) 


i=] 


puisque comme nous l'avons signalé plus haut lors de notre présentation de la formule de Shannon, 
l'entropie S est une espérance (sans oublier que dans ce cas particulier les probabilités ont toutes la 
même valeur!). 


3. DISTRIBUTIONS STATISTIQUES PHYSIQUES 


Nous distinguerons quatre différentes statistiques qui proviennent ou non d'effets quantiques et qui 
conduiront à quatre distributions distinctes connues. Ce sont les distributions de Maxwell, Maxwell- 
Boltzmann, Fermi-Dirac et de Bose-Einstein. Elles trouvent de nombreuses applications en physique 
comme le rayonnement du corps noir qui sera démontré dans le chapitre de Thermodynamique. 


3.1. DISTRIBUTION DE MAXWELL (DISTRIBUTION DES VITESSES) 


Pour un gaz en état d'équilibre, posons-nous la question suivante: Quelle est la probabilité qu'une 
molécule ait ses composantes de vitesse comprises entre v, et v, +dv, , v, et v, +dv, , v, et v, + dv, 


dans un repère cartésien habituel ? 


Cette probabilité 4*P dépend de ÿ (c'est-à-dire: (v,,v,,v,)) et de dv,,dv,,dv, . Elle ne dépend pas de 
la position de la molécule puisque le gaz est supposé à l'équilibre par rapport à son centre de masse. 


Nous postulons dans un premier temps que 4°? est proportionnelle à chacun des intervalles 
dv,,dv,,dv, tel que: 


d°P = f(v)dv,dv,dv, (3241) 


et qu'il n'y a pas de directions privilégiées. Nous pouvons faire une rotation circulaire des axes 
cartésiens, la probabilité sera inchangée (isotropie de l'espace). 


L'isotropie amène que la fonction f(#) ne dépend pas du vecteur ÿ, au mieux elle dépend de la norme 
de cette vitesse, tel que: 


d°P= J(v)dv,dv, dv, (32.42) 


Soit 4F, (noté aussi souvent 4P(v,) en fonction du contexte) la probabilité pour une molécule d'avoir 


sa composante suivant l'axe Ox comprise entre v, et v, +4v, alors: 
dP, = dP(v,)=@,({v,)dv, (3243) 


de même: 
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dP,=@,(v,)dv, dB=@g(v)dv, (3244) 


L'isotropie de l'espace impose: 
PV, ) = Pv,) = Av.) = P (32.45) 
La loi des probabilités composées implique: 
d°P= dEdEdE — f(v) = gv,)2v,)a(v,) (5246) 


Déterminer les fonctions f et # relève de la méthodologie mathématique suivante: 


pv. gt + 2 
0, dé, dvêr, 7 P0,)P0%) —. 
2.47 
__J dgr) 
giv,) dv, 
Puisque: 
dv v v 
= Hits 2h x  - 
v P: re 2x F3 À 2 + (32.48) 
Ce qui nous donne finalement 
NRA OR IE TP. 


v dv v,giv,) dv, 


Le membre de gauche de la dernière égalité dépend uniquement de v , celui de droite uniquement de y, 


. Le résultat ne peut être qu'une constante que nous noterons & . Il suit que: 


J_ ag) _, 1 dv.) = av,dv, (32.50) 


v,gv,) dv, av, ) 
En intégrant: 
dv. = Œ 3 te 
Ts =inig{v,)i+ef = far, Fe +c; (32.51) 
x 
Donc: 
æ LE 3, te 
In {gxXv, ) 1 . +(e =] "5% +0 (2252) 


et posons c* = {n(4). Il vient donc: 


In (giv,) 1 = D +iIn(4) = [a = SA = Av, ) = 4e7 (32.53) 
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Donc identique: 


g,)= 47 pv)=4e g,)=4e1 (9°) 
La loi des probabilités composées impliquant: 
Jo) = gv,)8v,)8v,) (32:55) 


Nous avons finalement: 


Remarquons que & est nécessairement négatif sinon la probabilité pour une molécule d'avoir une 
composante de vitesse infinie serait infinie ce qui voudrait dire que toutes les molécules seraient à 
vitesse infinie et que l'énergie serait infinie !!! 


Nous posons: 
æ 
à =-—B avec B>0 (32.57) 


Finalement, il vient que: 
d'P=dPdPdl = Ae° dvdv,dv, (3255) 


Il nous reste à normaliser A. La probabilité pour une molécule d'avoir une composante de vitesse 
comprise entre ]J-æ,+«[ ou une intensité de vitesse comprise entre [Ü,+c[ est égale à 1 (100% de 


chances). Ainsi en utilisant exactement la même méthode calcul que celle vue dans le chapitre de 
Statistiques pour la loi Normale, nous avons: 


+e +e 2 +e 2 FT E 
| dP(v,)= | 4e av, = À | e 4 dv, =1= AË = À = Ë (32.59) 


—© —© —© 


Nous avons jusqu'ici parlé en terme de probabilités. Un langage équivalent consiste à chercher, dans 
une enceinte contenant N molécules, le nombre dN de molécules ayant certaines caractéristiques, à 
savoir par exemple, le nombre de molécules 44/{v, \ ayant une composante de vitesse comprise entre 
v, et v, +dv,. Ce nombre étant bien évidemment égal dans une dimension à: 

dW(v,) = NaP, = N4e Ÿ dv, (32.60) 
Plus généralement: 


B 3/2 
dNtv) = MP = “(à ” dv,dv, dv, (32.61) 
FT 


Pour obtenir dP nous nous plaçons dans l'espace des vitesses c'est-à-dire un repère cartésien de 
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coordonnées (Qv,v,v,). Les composantes v, ,v,,v, ne sont pas indépendantes puisque liées par la 


p°'E 
relation: 

5:32 2 2. 

V=Yy +v, tv (32.62) 


L'extrémité des vecteurs vitesse ÿ ayant une intensité de vitesse v, c'est-à-dire de composantes de 
vitesse liées par la relation ci-dessus, se trouve dans l'espace des vitesses sur la sphère de rayon v. Il en 
sera de même pour l'extrémité des vecteurs vitesse ayant une intensité y + dy. 


Dans l'espace des vitesses, nous délimitons une portion d'espace comprise entre la sphère de rayon v et 
la sphère de rayon v» + 4, de volume égal à 4m? dv. 


La probabilité 4° P est proportionnelle à dv,dv,dv, c'est-à-dire au volume élémentaire dans l'espace 
des vitesses. Pour obtenir dP(v), nous devons intégrer 475 à tous les vecteurs vitesses possibles c'est à 


dire ayant leur extrémité entre les deux sphères. Cette intégration est particulièrement simple puisque 
l'intensité v de la vitesse dans cet espace (inter-volume) est constante. Nous obtenons donc: 


BY" 
dP(v)=|=| e7* 4rv'dv (2263) 
7 
et ainsi, dans une enceinte contenant N molécules, le nombre de molécules dN(v) ayant un module de 
vitesse compris entre v et v+ dv est: 
dW(v) = MiP(v) (32.64) 


Rappelons maintenant que conformément à ce que nous avons longuement étudié dans le chapitre de 
Statistiques, la valeur moyenne < & > d'une grandeur G est le produit de G pondérée par la probabilité 
d'obtenir G intégré à toutes les valeurs possibles de cette grandeur telle qu'en une dimension nous avons 
(selon x): 


+o 1i2 ko 1/2 

: Ë 1 _—— 

(5 } — vi dP(v,) = Ë vw EXP (-2 )dv, LL Ë 7 = — (32.65) 
0 FA 9 x)  4B 2B 


où l'intégrale a été calculée en faisant un changement de variable v’ = x et où nous avons ensuite 
utilisé une intégration par parties. 


Nous avons respectivement de manière générale: 


3/2 312 
(= Pro = a+) È exp(-Bv°)dv = an( + 2e = _ (32.66) 


où l'intégrale a été calculée de la même manière. 


Donc: 
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Kw DEC >= v en OU LH D + D +E D= 


28 


La thermodynamique, ou la mécanique des fluides (voir théorème du Viriel) nous donne pour un gaz 
parfait monoatomique (cf. chapitres de Mécanique Des Milieux Continus et de Thermodynamique), de 
capacité calorifique et volume constant: 


E, = 3 yxr (32.68) 
2 
Si nous formulons l'hypothèse que la partie de l'énergie liée à la température est due à l'agitation 


cinétique des molécules, nous pouvons écrire: 


E, = Mia atr Cd (32.69) 
2 2 A 


Nous définissons alors la vitesse thermique moyenne par: 


3KT | 
cv se Ven >= [2 | G270 


Fr 


Une application pour l'électron dans le cas des semi-conducteurs (où nous approximons certaines 
relations par une distribution de Maxwell-Boltzmann) donne une vitesse thermique moyenne à 
température ambiante de 120'000 [m/s]. 


Mais pour en revenir à notre distribution... Nous avons donc: 


# ET "A 
mi 2xT 


Ainsi, nous avons finalement: 


3/2 
aPtv)= 47 || egpl- | (3272) 
27kT DkT 


qui est donc la distribution des vitesses dans un gaz monoatomique dont voici un exemple de tracé (les 
unités des axes en ordonnées sont arbitraires): 
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Figure: 32.3 - Distribution des vitesses dans un gaz monoatomique 


La relation précédente donne donc la proportion des molécules de gaz ayant à un instant t donné une 
vitesse v. Nous voyons que la densité de probabilité s'étend jusqu'à l'infini et nous trouvons une 
probabilité non nulle (tendant vers zéro) que la particule ait une vitesse extrêmement élevée. En fait, si 
nous avons un système de particules identiques à la même température T, alors nous en retrouverons un 
certain nombre avec ces vitesses très élevées. Au coeur des étoiles ce sont ces rares particules très 
rapides qui sont capables de vaincre la répulsion coulombienne entre les noyaux et de aire qu'ils 
s'approchent l'un et l'autre pour initier le mécanisme de fusion nucléaire qui est la source d'énergie des 
étoiles. 


Nous avons alors pour une unique direction spatiale et selon une notation courante dans la littérature 
anglo-saxonne (en adoptant les développements précédents on tombe relativement facilement sur ce 
résultat) la fonction de distribution suivante: 


mv? 


1/2 
2 
= 47° | ——— | (3273) 
F6) LE) PT or 


et pour les trois dimensions spatiales la notation suivante aussi courante dans la littérature anglo- 
saxonne (certains termes sont simplement mis sous la racine): 


2f : — rv? 
= LT lex (32.74) 
F6) (2) : 


Cette fonction de distribution permet donc de définir la vitesse la plus probable (la valeur "modale" 
comme l'on dit en statistiques) notée parfois v,,, qui correspond au maximum de la courbe f(v), soit là 
où la dérivée première est nulle. Ainsi, pour une unique dimension spatiale nous avons en adoptant la 
notation anglo-saxonne pour la proportion de molécules de gaz: 
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1/2 2 
#1) — ee LE EXP me 
dv dv 27KkT 2kT 
Fr He mov? mr 3 mi re mr? 
= BAV| —— EXp|—-—— |—-8— 77 | —— exp|-———| (32.75) 
27KT 2kT 2kT 2KkT 2XkT 


1/2 2 
2&T 27KT 2KT 


Dès lors (vous remarquerez que le résultat aurait été le même si nous avions pris toutes les dimensions 
spatiales. ce qui est cohérent!): 


1- 7,2 = 0 
2KkT 

= #21 (3276 
2&T 
> XT 


DV = — 
A 


d'où la vitesse la plus probable (attention! ce n'est pas la vitesse maximale puisque nous savons que la 
distribution s'étend jusqu'à la vitesse infinie): 


Pour la vitesse moyenne (l'espérance) et en utilisant directement toutes les dimensions spatiales nous 
avons: 


Nous avons donc une intégrale du type: 


+o 
[ v exp(-ax° )dx (32.79) 
Û 


Le mieux est de décomposer ,3,-2X? en ,2.,,-2*? et on intègre par parties. Nous avons alors: 


+o L 1 L Ho 
[r(nr Jars 2. De “| 


——— 4 — 
û 


+0 1 5 
D dx (32.80) 


La dernière intégrale est facilement calculable. C'est la même que dans le chapitre de Statistiques pour 
la loi Normale. Donc: 
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Il vient finalement: 


. 312 ko . 3/2 1 
san VD (2 af 
2RKT Fe 2xT 2RkT Es 
),82) 


_{ m YŸ 8272 (er) 
| LorkT m2 rm 
et là par contre le résultat est dépendant du nombre de dimensions spatiales que nous prenons! 


3.2. DISTRIBUTION DE MAXWELL-BOLTZMANN 


En physique quantique corpusculaire, nous apprenons que l'énergie d'une particule est quantifiée, c'est 
à dire que les valeurs possibles pour l'énergie forment un spectre discret. Même si, dans un certain 
nombre de situations courantes, pour une particule et encore plus pour un système constitué d'un grand 
nombre de particules, les niveaux d'énergie sont si serrés que nous pouvons traiter, sur le plan 
mathématique, ce spectre comme continu (approximation du continuum), il n'empêche qu'en toute 
rigueur ils sont quantifiés. Cette approche quantifiée des distributions physiques au niveau 
corpusculaire de la matière est souvent désignée sous le nom de "statistique quantique". 


Une particule, ayant un niveau d'énergie Æ; , peut être dans différents sous-états. 


Nous savons (nous n'avons pas utilisé l'équation de Schrôdinger dans le chapitre de Physique Quantique 
Corpusculaire pour le montrer strictement) que, pour décrire un atome, nous introduisons quatre 
nombres quantiques, à savoir: 


- le nombre quantique principal qui quantifie l'énergie 

- le nombre quantique secondaire qui quantifie le moment cinétique 

- le nombre quantique magnétique qui quantifie le moment magnétique 
- le spin qui quantifie la rotation propre des électrons de l'atome 


Ainsi pour une même énergie (pour une valeur particulière du nombre quantique principal), un atome 
ou un électron peuvent posséder différentes valeurs des nombres quantiques secondaire, magnétique ou 
de spin. 


Pour qualifier la possibilité de sous-états correspondant à une même énergie, nous employons 
l'expression "dégénérescence" et nous traduisons par la variable g; le nombre de dégénérescences 


correspondant à un même niveau d'énergie Æ; . 


Nous allons considérer un système composé de N particules qui se placent sur K différents niveaux 
d'énergie Æ;. Nous trouvons x, particules sur le niveau d'énergie Æ,. Nous avons alors toujours les 


relations suivantes pour l'énergie totale (que nous notons par la même lettre que celle utilisée en 
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thermodynamique) et pour le nombre de particules: 


X 
Dd'rE, ni 2 


il 


(32.83) 
X X 
Dr = NS dr =0 
Est IT 
Nous supposerons (c'est important) ces quantités constantes et que le système est entièrement 
déterminé par la distribution | x,} des particules sur les K différents niveaux d'énergie. 


Il existe un grand nombre & de configurations microscopiques possibles qui sont compatibles avec la 
distribution | #,}. Il y en a (voir les permutations avec répétition dans le chapitre de Probabilités): 


= (281) 


Mais nous avons négligé la dégénérescence possible des niveaux i. S'il existe g, sous-niveaux dont 


l'énergie est Æ,, nous avons alors: 
è 


Q = m8 8 Ex MT E (32.85) 
nl lg! [ls 


| \ Exemple 
l 2 3 2 particules : A et B 
AB  ::.  ... 3 états : 1,2et3 
as MUR vive 
+ AB 
: ga } A B ::. 
9 états distincts < FH à 4% > Discernables (4 # 8) 

A B 
B A 
A B 
\ B À 


L 


Figure: 32.4 - États dans la distribution de Maxwell-Boltzmann 


Remarque: g, est donc la dégénérescence de l'état d'énergie Æ;, à savoir le nombre d'états 
possédant cette énergie. 


En prenant le logarithme, il vient: 


E 
Ie) = In(W1) + D 0m Ing) — In Di (22.86) 


il 
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et en utilisant la formule de Stirling (cf. chapitre de Méthodes Numériques): 


nl et In(xl) = xin(x) -n (32.87) 


en se rappelant que celle-ci est une approximation grossière pour les plus petites valeurs de n mais 
devient une approximation acceptable pour n supérieur à 1000. 


Nous avons: 
x x £; 
In($2 = Min) - MN + >: 2 In(g)-21n(2,)+2%1= Nin(AM) + D In (| (32.88) 
FE I #; 


Nous recherchons maintenant la distribution la plus probable, c'est-à-dire celle qui maximise & (et 
donc qui maximise implicitement l'entropie qui ne peut selon l'expérience qu'augmenter pour un 
système isolé). Pour trouver l'extremum, nous allons différencier cette expression tel que : 


gin(&) _, 


(32.89) 
dm; 
donc tous les autres paramètres autres que x, sont fixés. 


Or, comme: 


il il il 


= NeN- .- + a[n- Sn]-0 


il i=] 


X X x 
DAE=UGSU-SnE-0e co-Sna)-0 
(32.90) 


où &, 8 sont des constantes qui permettent de s'assurer de la cohérence de l'analyse dimensionnelle 
(des unités quoi...). 


Il est donc équivalent et nécessaire pour prendre en compte également ces paramètres intrinsèques (le 
fait d'ajouter ainsi de manière astucieuse des termes nuls est nommé "méthode des multiplicateurs de 
Lagrange") d'écrire: 
9In(sè) 0 
ên; 


(32.91) 
sous la forme plus complète suivante: 


re+efv- Sn]-4u-$ na))-0 (32.92) 


Donc après réarrangement: 


mo 5 fr Sn] {ua 


3] il 
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ce qui donne après une première simplification (élimination de la dérivée des constantes): 


dn(s) _ eg r Ya £. | : 2 S Te, + 8n;E;] (32.94) 
da 


0, Es Es 


Ce qui nous amène à écrire (puisque tous les termes de la somme indexés sur une valeur i différente de 
celle de la dérivée partielle sont nuls): 


JIn(sa) | 
x, ES 


(an, + 6n,Ë = @+BE (3295) 


ï 
Ce qui nous donne finalement: 


dn(Q) 


=&+ BE, (32.96) 
ên; 


qui devra donc aussi être nul. Ainsi, nous avons astucieusement fait apparaître un résultat qui n'en est 
pas moins très puissant. En imposant de maximiser l'entropie nous avons fait apparaître deux termes 
(incluant chacun une constante qu'il faudra déterminer plus tard!) et dont la somme doit être nulle pour 
assurer la validité expérimentale du modèle théorique lorsque l'entropie du système isolé est maximale. 


Mais cette dernière relation équivaut aussi à rechercher (ce qui va nous être très utile plus loin!): 


L4 
din(@) = d| Nin(M) *Sn[£) =0 (32.7) 
il À; 


Effectivement voyons cela en utilisant à nouveau la méthode astucieuse des multiplicateurs de 
Lagrange (ajout de termes nuls en supposant les niveaux d'énergie Æ; et le nombre de dégénérescences 


g,; lixes) et en se rappelant (cf. chapitre de Calcul Différentiel Et Intégral) que: 


dx 


CE gages 


Nous avons alors: 
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Es 
afroun +$n[2)-a[r- s; }-eo-ÿ na ]|- 
# il 


il il 


> 2 “[se] 2 a -aÿ an - 3 E,dn,= Sf[s] 47 ge | an 


il 


0 
=-[-[£)-e-s le = 0 (32.99) 
7; 
MEET BE, 
7; 


= | |--0-6# 
8; 


d'où: 
n, = ge “## (32.100) 
Rappelons que nous avons pour l'entropie de ce système: 


S=klin(@) (32.101) 


et donc: 
dS = kd(in(R)) = Ed (32.102) 
et comme: 
nn BE, (32.103) 


Nous avons donc: 
dS s 
E DCE BE;)dn = 5Y" “SE dn, = &dN + BU (32.104) 
il il 
La thermodynamique nous conduit à (cf. chapitre de Thermodynamique): 
dU = TaS + © di, (32.105) 


i=] 


où nous voyons donc apparaître le potentiel chimique qui a une influence lorsque le nombre de 
particules considérées varie. 


Si toutes les particules (ou groupes de particules) sont identiques 44 = &* = x donc: 
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dU = TaS + HD dN, = TaS + HdN (32.106) 


il 


Ce qui finalement conduit à: 


ds LOU _ HE y (107 
ÆE KT KT 


et nous amène à identifier: 


8 AÛ | E py = BU + adN (32.108) 
& WW 


et donc: 


sn — (32.109) 
Ue 


Nous pouvons donc réécrire la relation suivante: 
ufr 


A; = ge 


sous la forme finale et traditionnelle de la "fonction de Maxwell-Boltzmann": 


—E; + 
= ex 5 EX Ex (32.110) 
(ir ] ame) () 


Que nous retrouvons plus fréquemment dans la littérature sous la forme suivante: 


et particulièrement sous cette forme: 


HE; 
EST, si) = i 32.112 
Jus (E,T, ii) ex — | ( ) 


Nous retrouverons cette relation dans le domaine de la théorie des semi-conducteurs (cf. chapitre 
d'Électrocinétique) ainsi que dans notre étude des plasmas (cf. chapitre de Mécanique Des Milieux 
Continus). 


x 
Comme À = px , NOUS avons: 
il 


x |< —Ë, _. 
N = g, exp| — exp|——=| (32.113) 
&: AS P = 


Nous pouvons alors calculer #, / 7 et nous obtenons ainsi la formulation discrète de la "statistique de 
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Maxwell-Boltzmann": 


exp] — 
Bi SAP| 


P=— = (32.114) 
; EX — 
De | à) 


il 


Cette relation donne donc le rapport entre le nombre de particules qui par hypothèse n'interagissent pas 
entre elles (sinon le modèle est trop complexe) dans un état d'énergie donné Æ; et le nombre de 


particules qui n'interagissent pas entre elles et pouvant prendre les différents états d'énergie discrets Æ; 


. Ainsi, connaissant N, il est possible à l'aide de cette relation de connaître la proportion de particules 
dans un état d'énergie particulier. 


Remarque: La statistique de Maxwell-Boltzmann s'applique en l'absence d'interaction entre 
particules et est donc valable pour un gaz parfait mais ne s'applique pas, par exemple, à un liquide. 
De plus, elle s'applique uniquement aux hautes températures lorsque les effets quantiques sont 
négligeables. À basse température nous utilisons la statistique de Bose-Einstein pour les bosons (en 
référence au nom de Bose...) et la statistique de Fermi-Dirac pour les fermions (en référence au 
nom de Fermi) que nous étudierons plus loin. 


Nous appelons le terme au dénominateur, la "fonction de partition canonique". Elle est le plus souvent 
notée Z,, tel que: 


Les ensembles microcanonique, canonique et grand canonique correspondent à des ensembles de 
systèmes soumis à des contraintes differentes qui sont respectivement : 


- Microcanonique: énergie fixée, nombre de particules fixé, volume fixé 
- Canonique: énergie moyenne fixée = température imposée, nombre de particules fixé, volume fixé 


- Grand canonique: énergie moyenne fixée = température imposée, nombre de particules moyen fixé = 
potentiel chimique imposé, volume fixé) 


Ceci est vrai en quantique comme en classique. 
3.2.1. DISTRIBUTION DE BOLTZMANN 


Voyons maintenant une première application intéressante de la fonction de distribution de Maxwell- 
Boltzmann. 


Considérons le cas intéressant où: 


- Le volume ainsi que le nombre de particules sont fixés (système microcanonique) 
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- Le fait que le nombre de particules soit fixé, le potentiel chimique est nul 


- Une température suffisamment élevée pour que les états d'énergie soient en quantité infinie 


Il va relativement de soi que si les états d'énergie sont en quantité infinie, le facteur de dégénérescence 
g; sera égal à l'unité. 


Nous avons alors la distribution de Maxwell-Boltzmann qui devient sous ces conditions la "distribution 
de Boltzmann": 


—E 
bei ) l —E \ (32.116) 
P= __X4T/ exp | a 


Ze Ze V# 


que nous retrouvons plus fréquemment sous la forme suivante: 
fa(ET) =] œun 
,4) = EKP| —— 32. . 
d ET 


Si nous considérons que dans un gaz globalement neutre, l'énergie est définie uniquement par l'énergie 
cinétique (cas du gaz parfait). Donc avec le passage au continu, nous avons: 


TT  (-E 
Zmc = | ar()à (32.118) 


Dès lors, nous pouvons intégrer la fonction de Boltzmann ci-dessus sur toutes les vitesses et nous 
devrions avoir: 


ni -E 1 27 
Pi-00 <v <+wi= | exp(5r jé | exp 2 |j=1 (G2n9) 
Lo Zmc &T Zmc Lo &T 
Avec la fonction de partition microcanonique: 
2e mv? 
Zme = | exp|-——|dv (32.120) 


pour que la condition de normalisation soit satisfaite (et puis de toute façon cela correspond aux 
développements effectués plus haut!). 


Nous reconnaissons ici une intégrale qui nous est familière et démontrée dans le chapitre de Statistiques 
lors de notre étude de la loi Normale. Nous avons alors: 


Dès lors, la fonction de densité de probabilité s'écrit: 
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P(-00 <v < 400) = ul | ex — 
DER Pr] @2u2 
Le: 


Maintenant, puisque la vitesse est traitée comme une variable aléatoire, intéressons-nous au calcul de la 
valeur moyenne du carré de la vitesse qui se note traditionnellement de la manière suivante (la notation 
n'a aucun rapport avec les ket-bra de la physique quantique ou des produits scalaires fonctionnels!): 


En statistiques, nous noterions cela: 


1 + my? 
El | = mm | v expl-— [dv … ., 
2AkT © 2kT | (8212) 
ni 
Concentrons-nous sur: 
a 
[ v? exp | (32125) 
2kT 
Or, si nous posons: 
= Es (32.126) 
mm 


Nous avons alors: 


Soit avec un changement de variable: 


ds 
a [ye 7 d (22129) 


— 


et il s'agit exactement de l'intégrale de la loi Normale Centrée démontrée dans le chapitre de Statistique 
comme valant: 


, 


y 
+  — 
[ ve (e] DT G19 
2 


Dès lors: 
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o 2 3/2 
Elw |= | 2 exp _— — = (2 bn 
F2 &T rer "A 2 
mi ma | 

_ (32.130) 
ee 
DT Um mn 2 m )2 m 

m 
et au final: 
(Eÿ= mr) mil 2 ler (32.131) 

2 2 m 2 


pour une particule pour une dimension spatiale. Nous retrouvons au fait le même résultat qu'avec la 
distribution de Maxwell des vitesses démontrée, avec une démarche plus rigoureuse, mais nous 
arrivons aux mêmes conclusions. 


3.3. DISTRIBUTION DE FERMI-DIRAC 


Le principe d'indiscernabilité peut avoir des conséquences très importantes sur la statistique. Nous 
distinguons deux types de particules indiscernables: les bosons (comme le photon) et les fermions 
(comme l'électron). 


Rappels: 


R1. Les premiers correspondent à des particules dont la fonction d'onde représentative est toujours 
symétrique alors que celle des fermions est antisymétrique. 


R2. Le principe d'exclusion de Pauli impose que 2 fermions ne peuvent pas se trouver dans le même 
état quantique. Les bosons, eux le peuvent ! 


Leurs propriétés respectives ont pour conséquence importante que l'énergie minimale d'un ensemble de 
N bosons est égale à N fois l'énergie minimale de chaque boson. Alors que pour un ensemble de 
fermions, l'énergie minimale est égale à la somme des N énergies les plus faibles. 


Ces deux types de particules entraînent deux types de statistiques: la statistique de Fermi-Dirac pour les 
fermions (que nous allons démontrer en premier) et la statistique de Bose-Einstein pour les bosons (qui 
suivra). 


Il n'existe donc qu'une seule manière de répartir N fermions sur les états d'énergies accessibles (au lieu 
des N! pour les particules discernables). Il ne peut pas y avoir plus de particules x, dans un niveau 


d'énergie Æ; qu'il existe de dégénérescences g,. Donc: 


Le nombre de combinaisons possibles pour un niveau Æ,, dégénéré g, fois et comportant x, particules 


est donc la combinatoire € =. . Le nombre total de configurations est donc: 
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a=[1c 1 —E— 6 
i Le 


i Al -%)l 


N 


.133) 


Ce qui peut se vérifier avec la figure ci-dessous: 


\ Exemple 
2 particules : A et À 
3 états : 1,2et3 


ni & 
3 états distincts À À 
A +. À 7 Indiscernables (4 = B) 
ES 


Figure: 32.5 - États dans la distribution de Fermi-Dirac 


La statistique est donc bien différente du cas classique de Maxwell-Boltzmann. En prenant le 
logarithme du nombre de micro-états et en faisant usage de l'approximation par la formule de Stirling 
comme plus haut, il vient: 


In(e) = D [les inte) - 8 )- (2 1n@e) —# ) - (Ce -m)in(g -m)- (@ -#))] (2139 
Que nous pouvons déjà simplifier une première fois: 


In($2) = 2 [& In(g;) 7% Inr;) -(g; -#;)In(g; -x;)] (32.135) 


1 


et en différenciant cette expression pour trouver le maximum, nous obtenons: 


d'In(sè) = dy [g; In(g;)-#;In(x) -(g —-#;)In(g; -x;)] =0 (32.136) 


Terme à terme: 
l.dig,in(g,)i=0 
2. dinin(r)i= dx, nr) +24 (n,)) = dr In(x) + x; La = dr, In(x,) + dr, 
3. d((g; -x)in(g; -#)) = d(gsln(g; -x)) - dx; In(g; —#)) 
= deiln(e; -#)- gdin(g; -#)-dmln(g, -#)-#dIn(g; -#) 


0 


“« | 1 | ana, -n9+n | 1 | -2)+8 +, 


Or, nous avons par conservation et par symétrie: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Donc finalement: 


—dIn(£è} D 2 [in(x;) — In(g, — ,) kr; - (ll (32.139) 


Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore une fois la 
méthode des multiplicateurs de Lagrange: 


In(x;)-In(g, -#,)+æ+ $EÆ, = 0 (32.140) 


Ce qui nous amène à la distribution de Fermi-Dirac: 


Les paramètres £ et æ jouent le même rôle que dans la distribution de Maxwell-Boltzmann. Nous 
avons ainsi: 


Nous avons alors: 


- &i 

BU TE -u | G214 

exp 5 £ +1 (32.143) 
&T 


Ainsi, en physique quantique, la statistique de Fermi-Dirac désigne le nombre de fermions 
indiscernables qui n'interagissent pas entre eux (sinon le modèle est trop complexe) sur les états 
d'énergie d'un système à l'équilibre thermodynamique dégénéré (donc le nombre de fermions occupant 
le niveau d'énergie donné!). 


Pour les systèmes macroscopiques, les niveaux d'énergie sont si serrés (ou tellement nombreux) que 
nous pouvons considérer le spectre d'énergies comme continu (approximation du continuum). 


Nous raisonnerons donc dans ce contexte de continuum, ce qui nous permet d'écrire en normant aux 
nombres de particules mises en jeu (tout ce que l'on demande à la fonction c'est de nous dire comment 
sont réparties les N particules): 


Jro(E,T, si = 


er(# “)+1 32.144) 


ou: 
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Jrote, ds 4) — 


1 
£(Ee-x) +1 


g 


(32.145) 


pour la fonction de Fermi-Dirac avec le tracé correspondant plus bas de la distribution. 


Cette relation est très importante par exemple dans la théorie des semi-conducteurs (cf. chapitre 
d'Electrocinétique) qui est à la base de l'électronique des 20ème et 21ème siècles. 


De manière numérique, nous pouvons simuler l'évolution de l'allure de la distribution (qui n'est pas une 
distribution dans le sens mathématique du terme) en fonction de l'énergie et de la température. Pour 
cela, nous supposons pour simplifier que la constante de Boltzmann vaut 1 et que le potentiel chimique 
mu vaut 2 (nous notons que celui-ci est en toute rigueur fonction de la température). Ainsi, nous 
pouvons écrire le petit programme suivant sous Matlab 5.0.0.473: 


clear all;kb=1; % Constante de Boltzmann 

mu=2; % Potentiel Chimique 

T=0.001:0.1:1; % ” Gradient " de température pour le programme 
for j=1:length(T) 

beta(j)=1/(kb*T(j)); 

epsilon-0.1:0.1:4; % L'énergie avec le pas 

for i=1:length(epsilon) 

Nf(i,j)=1/(exp(beta(j)*(epsilon(i)-mu))+1); % Nb(epsilon,beta) moyen de fermions au 
end % niveau d'énergie epsilon 

hold on % 

plot(epsilon,Nf(:;j)); 

pause(0) 

end 


0 05 1 15 2 25 3 35 î 
Figure: 32.6 - Tracé avec Matlab 5.0.0.473 de la distribution de Fermi-Dirac 


Au zéro absolu T = Q nous voyons que nous avons une marche. A cette température, les niveaux 
d'énergie dégénérés sont occupés à bloc en partant du niveau d'énergie le plus bas jusqu'à un certain 
niveau représentant la chute de la marche. Nous disons alors que le gaz de fermions est "complétement 
dégénéré". 
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La fonction de Fermi-Dirac, au zéro absolu, vaut donc 1 si E est inférieur à Æ et O0 pour les valeurs 
supérieures (le système choisit son état d'énergie minimale où les N particules occupent les N états de 
plus basse énergie). 


Évidemment, dans les hautes énergies d'excitation (ou hautes températures) la probabilité (rapport) 
d'occupation d'un état est très faible et donc il n'est pas important d'appliquer le principe de Pauli (la 
probabilité que deux électrons veuillent occuper le même niveau d'énergie est très faible). Pour ces 
raisons, ce régime limite entre le comportement quantique et classique est appelé parfois "régime 
classique" et la haute température correspondante à l'excitation énergétique est appelée "température 
de Fermi”. 


Le potentiel chimique est quant à lui par définition le dernier niveau énergétique occupé au zéro absolu 
(la fameuse marche d'escalier!). Comme nous le verrons dans le chapitre de Physique Qunatique 
Ondulatoire, celui-ci est noté Æ; (et à l'opposé # en chimie...) et nous l'appelons "niveau de Fermi" ou 


"énergie de Fermi”. Nous voyons alors immédiatement que quelle que soit la température: 


| E,-4 | #E) | 1+1 | 2 (32.146) 
a M ex +] à 
| LT }h 1 LT 


la probabilité d'occupation par les électrons est donc de 1/2 dans ce niveau. La définition du niveau de 
Fermi peut alors être donnée par: 


Ë; — {= 0 (32.147) 


La principale application aux solides de cette statistique est la modélisation des phénomènes de 
transport électronique (gaz d'électrons): théorie des métaux, des semi-conducteurs, population des 


niveaux d'énergie et propriétés de conduction (cf. chapitre d'Electrocinétique). 


3.4. DISTRIBUTION DE BOSE-EINSTEIN 


Les bosons sont d'autres particules quantiques qui peuvent indistinctement se placer sur tous les 
niveaux d'énergie. Le principe de Pauli ne s'y applique donc pas! Dans ce cas, le nombre d'objet à 
permuter est x, + g;, -1 (les x, particules et les g, — 1 intervalles entre les niveaux). Parce que les 


particules sont indiscernables et les niveaux et sous niveaux permutables, il faut diviser par x! puis 
aussi par (g, —1)! Le nombre de configurations sur un niveau Æ;, g, fois dégénéré qui contient x, 
particules indiscernables est ainsi égal à: 


Q =] (x, +8, —1l)l on 
nl, -Di 


Ce qui peut se vérifier avec la figure ci-dessous: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Exemple 
St — 2 particules : Aet À 
123 3 états : 1,2et3 
AT Se de 
AA 
6 états distincts | 
A A > Indiscernables (4 = 8) 
A  -:. À 
A 4 


Figure: 32.7 - États dans la distribution de Bose-Einstein 


Son logarithme avec usage de la formule de Stirling et après simplification est donné par: 


In(Q) = D TC +8; -Din(e +8 -D -% ne) -(g; -Din(g -D] (32140) 


Le maximum de In{$è}) correspond à annuler 4 {In{£2)}, soit: 


“din(@)) = [int +8; 1) +In@)]dx = 0 (52150) 


1 


Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore une fois la 
méthode des multiplicateurs de Lagrange: 


“nr, +g -D+in(x)+a+$Æ =0 (32151) 


et donc: 


qui est la distribution statistique de Bose-Einstein. Cette distribution diverge lorsque: 
Œ+BE, =0 (32.53) 


C'est la "condensation de Bose-Einstein". Dans cet état, tous les bosons se retrouvent dans le même 
état. 


Les paramètres $£ et æ jouent le même rôle que dans la distribution de Maxwell-Boltzmann et Fermi- 
Dirac. Nous avons ainsi: 
l 
B=—eta= _ (32.154) 
&T &T 


Le nombre (moyen) de bosons est alors donné par: 
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| 
ñ; E - y (32.155) 
EXP CET “1 


à comparer avec le nombre (moyen) de fermions au même niveau d'énergie (fonction de Fermi-Dirac): 


Ei 
—. E - ji 41 (62156) 
&T 


ï = 


Ainsi, en mécanique quantique, la statistique de Bose-Einstein désigne la distribution statistique de 
bosons indiscernables (tous similaires) et n'interagissant pas entre eux (sinon le modèle est trop 
complexe) sur les états d'énergie d'un système à l'équilibre thermodynamique. 


Pour les systèmes macroscopiques, les niveaux d'énergie sont si serrés (ou tellement nombreux) que 
nous pouvons considérer le spectre d'énergies comme continu (approximation du continuum). 


Nous raisonnerons donc dans ce contexte, ce qui nous permet d'écrire en normant aux nombres de 
particules mises en jeu (tout ce que l'on demande à la fonction c'est de nous dire comment sont 
réparties les N particules): 


1 


RTS — 
Fr 4) Ë & à (32.157) 
exp| ——|-1 
&T 


pour la fonction de Bose-Einstein. Elle n'est donc définie que pour les énergies supérieures au potentiel 
chimique (sinon quoi elle est négative!). 


De manière numérique, nous pouvons simuler l'évolution de l'allure de la distribution en fonction de 
l'énergie et de la température. Pour cela, nous supposons pour simplifier que la constante de Boltzmann 
vaut 1 et que le potentiel chimique mu=2 (nous notons que celui-ci est dans l'absolu fonction de la 
température). Ainsi, nous pouvons écrire le petit programme suivant sous Matlab 5.0.0.473: 


clear all;kb=1; % Constante de Boltzmann 

mu=2; % Potentiel Chimique 

T=0.001:0.1:1; % ” Gradient " de température pour le programme 
for j=1:length(T) 

beta(j)=1/(kb*T(j)); 

epsilon-0.1:0.1:4; 

for i=1:length(epsilon) 

Nf(i,j)=1/(exp(beta(j)*(epsilon(i)-mu))-1); % Nb(epsilon,beta) moyen de bosons au 
end % niveau d'énergie epsilon 

hold on % 

plot(epsilon,Nf(:;j)); 

pause(0) 

end 
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Figure: 32.8 - Tracé avec Matlab 5.0.0.473 de la distribution de Bose-Einstein 


À haute température, lorsque les effets quantiques ne se font plus sentir, la statistique de Bose-Einstein, 
comme la statistique de Fermi-Dirac qui régit les fermions, tend vers la statistique de Maxwell- 
Boltzmann: 


si _2 0 2 
a+fe, 


Figure: 32.9 - Exemple de tracé des trois distributions 


Aux basses températures, cependant, les statistiques de Bose-Einstein et de Fermi-Dirac diffèrent entre 
elles. Nous nous plaçons, par exemple, à température nulle: dans la première, nous attendons alors que 
le niveau de plus basse énergie contienne tous les bosons, tandis que dans la seconde, les niveaux de 
plus basse énergie contiennent g, fermions. 


Par ailleurs, à température nulle (-273.15 [°C]), la statistique de Bose-Einstein montre de manière 
évidente que toutes les particules doivent occuper le même état quantique: celui de plus basse énergie. 
Ce phénomène est observable à l'échelle macroscopique et constitue un "condensat de Bose-Einstein". 


La statistique de Bose-Einstein est utile à la compréhension des phénomènes électromagnétiques 
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ondulatoires car les photons sont des Bosons (rayonnement du corps noir, interaction 
matière/rayonnement). Elle est très largement utile à l'étude des phénomènes vibrationnels dans les 
solides (les phonons suivent la statistique de Bose-Einstein). Elle a aussi été utilisée pour expliquer les 
transitions de phase dans l'Hélium (phénomène à très basse température). 


Remarques: 


R1. La statistique de Bose-Einstein a été introduite par Satyendranath Bose en 1920 pour les 
photons et généralisée aux atomes par Albert Einstein en 1924. 


R2. Un résultat mathématique appelé "théorème spin-statistique" relie le spin d'une particule et le 
type de statistique qu'elle suit. Il stipule que les particules de spin entier sont des bosons, alors que 
les particules de spin demi-entier sont des fermions. La démonstration de ce théorème ne se trouve 
pas encore sur le présent site Internet à ce jour. 


Pour terminer, voici un résumé simplifié des choses qui peut éventuellement aider à une meilleure 
compréhension: 


Bosons Statistique de Bose-Eïinstein Particules indiscernables qui 
(photons, gluons...) n'interagissent pas. 
+. É Aucune contrainte sur le 


TR LN — , 
a | E, «| F nombre de particules par état 


Fermions Statistique de Fermi-Dirac Particules indiscernables qui 
(électrons, protons, n'interagissent pas. 
neutrinos...) », = &i Le nombre de particules par 
me [ÊE) état est égal à O0 ou 1 
&T 
Classiques Statistique de Maxwell- Particules discernables qui 
Boltzmann n'interagissent pas. 
Aucune contrainte sur le 
HE, nombre de particules par état 
v=ue(#5) 


Tableau: 32.1 - Similitudes des différentes distributions quantiques 
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TT 2 3 Exemple 
15 2 particules : A et B 
| 3 états : 1, 2et3 


9 états distincts 
Discernables (A Æ 8 


& à» QD > : 
L 


L 
> à Ù : 


TAB. 1: Maxwell-Boltzmann 


6 états distincts CE | 


> = 
> 


TAB. 2: Bose-Einstein Indiscernables (4 = B) 


Plus restnictif : quand une particule se trouve dans un état, 
moins d'états disponibles pour les autres particules 
L 
L 


— 
Le 
= 


3 états distincts 


TAB. 3: Fermi-Dirac 


Figure: 32.10 - Résumé des états dans les trois distributions 
4. LOI DE FICK 


Nous avons vu dans le chapitre de Thermodynamique la démonstration de l'équation de propagation de 
la chaleur proposée par Fourier en 1822 obtenue à partir de l'équation de continuité. Nous avions 
obtenu (il est très recommandé au lecteur de s'y référer à nouveau ne serait-ce que pour lire les 
remarques relatives à la démonstration): 


OT(xt) _ ST(x.f) 


=0 (32.158) 
d 1 2 


En se basant sur les mêmes hypothèses que Fourier, Fick proposa en 1855 qu'un flux de particules 
pourrait se diffuser à travers un matériau selon une loi similaire, la "deuxième loi de Fick", de la forme: 
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dp(x.1) _,, Set) | 


32.159) 
à p D 0! ( 29) 


où la constante de proportionnalité est le "coefficient de diffusion de la matière" et © la densité de 
particules par unité de volume (et non la densité de masse!). 


Remarque: En pratique, la diffusion joue un rôle essentiel dans la fabrication de céramique, de 
semi-conducteurs (dopage), de cellules-solaires et dans la solidification des métaux (traitement au 
carbone et à la chaleur). Car lorsque deux matériaux chauffés sont mis en contact, leurs atomes 
diffusent l'un dans l'autre. 


Il faut comprendre que tout diffuse dans tout! Donc pensez aux pesticides sur les fruits et légumes, 
à la pollution dans les nappes phréatiques, au PET dans les boissons. 


Dès lors, la relation du flux surfacique de chaleur que nous avions utilisée en thermodynamique (voir 
chapitre du même nom) pour obtenir la loi de Fourier et qui était: 


peut alors s'écrire certainement aussi (nous allons le démontrer) dans le cas de la masse sous la forme 
d'un flux surfacique de particules appelé "première loi de Fick": 


®,=-DV.p| (32161) 


où D est le coefficient de transport de la matière (à déterminer...). Nous retrouvons dans la littérature 
cette dernière relation fréquemment sous forme unidimensionnelle. Il vient alors: 


D. = 2e (32.162) 
P % 
Soit sous forme discrète: 
Â 
®D,, = D (32.163) 
P Âx 


Si la variation de distance est mis en correspondant avec une longueur L parcourue par la diffusion, 
nous avons alors la notation encore plus simplifiée: 


D, = Fu (32.164) 
FA 


Pour retrouver la relation connue par les petites classes de chimie il faut savoir que les chimiste on pour 
habitude de noter la densité par la lettre C pour indiquer qu'il s'agit d'une Concentration. Dès lors, nous 
avons: 
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ÂC 


?» = PR 32.165) 


Mais ce n'est pas le seul changement de notation fait par les chimistes. Effectivement il faut se rappeler 
que le flux surfacique de particules (masse) est défini par la quantité de masse passant par une surface 
constante par unité de temps. Nous avons alors: 


Âm 
A _pAC (2166) 
Sy L 


Comme l'origine du temps est souvent pris comme étant zéro et que la masse initiale est nulle il vient 
alors après réarrangement le relation classique finale connue par les chimistes et biologistes (au signe 
près puisque ce n'est qu'une question de convention): 


_ DSACH 
à 


(32.167) 


Exemple: 

Les plantes absorbent de l'eau pour la photosynthèse. Nous savons par mesures expérimentales que la 
coefficient de diffusion de l'eau dans l'air est de D = 24.107” [m° #1] . Les pores d'absorption des 
plantes ont tyiquement une section de l'odre de SZ 8.0 1077 [mr | . La distance de diffusion est de 
l'ordre de L = 2.5.10 7° [#2]. La densité de vapeur d'eau à l'intérieur de la plante est de l'ordre de 

C3 = 0.022] kg mr ] et à l'extérieur C{ & 0.011 Leg mr | . Dès lors, la masse d'eau absorbée en 
une heure est d'environ: 


DSAC# 24.10° .8.10711.(0.022—0.011).3'600 
RE ——  E ——————————————————_— 


FA > 5.10 æ 3.10? [kg]  (2:168) 


Résultat qui convient d'être multiplié par les millions de pores qu'a une plante. 


Remarque: Au fait, Fick démontra d'abord la première loi et en procédant en tous points de manière 
identique à l'équation de la chaleur il obtint la deuxième loi qui porte son nom. 


Les coefficients #,7) sont appelés globalement "coefficients de transport" et respectivement 
"coefficient de diffusion thermique" dans le domaine de la chaleur et "coefficient de diffusion" dans le 
domaine de la matière. 


Nous pouvons estimer les valeurs de ces coefficients à l'aide d'un modèle microscopique simple. 


Considérons pour cela une tranche de fluide (flux de chaleur et flux de masse sont considérés comme 
un fluide) perpendiculaire à l'axe des x et d'épaisseur 24, où 4, correspond au libre parcours moyen 
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(projeté selon x), dans laquelle existe un gradient de concentration dirigé selon l'axe x. Déterminons le 
courant de ce gradient à travers la section S d'abscisse x. 


Pour faire simple, nous pouvons considérer que, parmi toutes les particules se trouvant entre l'abscisse 
x— À, etx, un tiers, ont leur vitesse dirigée selon x (les deux autres tiers étant sur y et z), et parmi ces 


dernières, la moitié a une vitesse positive (finalement nous devons considérer le 1/6 par direction). 


Comme 4, est le libre parcours moyen, ces dernières particules franchiront la section S sans avoir subi 


de collision: elles participeront donc au courant de diffusion. 


Notant g{x-— 4,) la concentration volumique à l'abscisse x — 4, (et considérant que cette 
concentration est constante entre x— 4, et x, ce qui, vu l'ordre de grandeur de 4, , est à peu près 
vérifié), le nombre de particules se trouvant entre les abscisses x — 4, et x et traversant effectivement 


la section S vaut alors: 


= PG-AÀ,)S2, 
pe 


N (32.169) 
Cette traversée prend un temps égal à À, /v , où v est la vitesse moyenne d'agitation thermique. Par 
conséquent, la densité de courant circulant de la gauche vers la droite vaut: 

£(x - ÂÀ,)À, ù _ (x - À,)V 


Diy = 5 7" g — (62170) 


En procédant de la même manière pour les particules se trouvant à droite de x, nous obtenons pour la 
densité de courant circulant de droite à gauche: 


La densité de courant totale circulant à travers S vaut donc: 


PGx-A,)v p(x+4,)}y px 1,)-0(x+4,)_ 
Er: 6 6 L 


Or, nous pouvons aussi écrire cela sous la forme: 


” _ 2(2&x-2,)- 20) _ #7 À)7 6) 


Da UE PR (5174) 


d 6 3 


Si À, est très petit, nous pouvons écrire: 


D, pe y 


(32.174) 


P(x — À,) — 2x) 1,_de 
x 


Vu les simplifications apportées au modèle, le facteur 3 a toutes les chances d'être peu réaliste. En 
revanche, la relation de proportionnalité entre gradient de concentration et courant de diffusion est tout 
à fait crédible, Nous écrirons finalement en généralisant à l'espace: 
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_ 


?, =-DY. © (32.175) 


où D alors donnée par: 


Dz= | (32.176) 


est la constante de diffusion massique. Comme D est positive, nous constatons que le mouvement de 
diffusion des particules a lieu dans le sens opposé au gradient, ce qui tend bien à homogénéiser les 
concentrations. 


Remarque: Si nous souhaitons obtenir le flux de charge, il suffit de multiplier la relation obtenue à 
gauche et à droite par la charge élémentaire. 


Nous pouvons également estimer le flux d'énergie thermique transportée par ces mêmes particules selon 
x. En effet, dans chaque tranche de fluide, n particules transportent chacune une énergie E 
correspondant à une quantité de chaleur Q donnée (selon la loi de Joule). Nous avons donc un flux 
surfacique d'énergie ®, dont la première composante est donnée par le même type de bilan que les 


développements précédents: 


PRUCOE 
RC D 3 * AT &x 


(32.177) 


Nous y trouvons immédiatement la définition de la capacité calorifique (si nous divisons par la masse 
nous aurions la capacité calorifique massique selon ce que nous avons vu dans le chapitre de 
Thermodynamique). Ainsi, dans le cas unidimensionnel: 


= lave =C. p| (32.178) 
3 


Il y a donc un simple rapport de proportionnalité entre # et C. 


Remarque: Selon les auteurs le flux est noté avec le symbole de la densité de courant, soit ;. 
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Faisons un petit tableau récapitulatif pour les quelques lois de diffusion démontrées jusqu'à maintenant 
sur ce site (dans leurs chapitres respectifs) en utilisant la notation la plus courante en physique (et non 
celle des thermodynamiciens..): 


Thermodynamique Mécanique Statistique Électrocinétique 
Jo = AT j, =-DV.p j=0Ë--.UÛ 
Densité de courant thermique | Densité de courant particulaire | Densité de courant électrique 
T': température & : concentration U: potentiel électrique 
# : conductivité thermique D: coefficient de diffusion & : conductivité électrique 
flux thermique: flux de particules: flux de courant électrique: 
Po = [[z sas &,=[[5, cas 1=[f5 ° ds 
s 5 $ 


Tableau: 32.2 - Similitudes des différentes lois de diffusion en physique 


5. MOUVEMENT BROWNIEN 


Le mouvement brownien est une description mathématique du mouvement aléatoire d'une petite 
impureté organique ou non immergée dans un fluide et qui n'est soumise à aucune autre interaction que 
des chocs avec les petites molécules du fluide environnant. Il en résulte un mouvement très irrégulier de 
la grosse particule, qui a été décrit pour la première fois en 1827 par le botaniste Robert Brown en 
observant des mouvements de particules à l'intérieur de grains de pollen: 


Figure: 32.11 -Exemple de mouvement Brownien (source: Wikipédia) 
L'origine du mouvement dû aux molécules n'était pas du tout évidente au début du 19ème siècle car: 


1. Il n'était pas encore communément admis que la matière était simplement discontinue et donc 


composée de molécules. 
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2. On ne comprenait pas même en admettant l'aspect moléculaire de la matière que quelques molécules 
soient capables de déplacer des impuretés plusieurs millions de fois plus grandes que celles des 
molécules du fluide. 


3. Même si on admettait l'aspect moléculaire, on ne comprenait pas qu'une très grande quantité de 
chocs de milliards de molécules ne s'annulent pas entre eux et que l'impureté soit finalement immobile 
(on verra que cela est dû au fait que la matière n'est pas continue). 


Le traitement mathématique du problème utilisant l'aspect moléculaire et statistique de la matière a été 
une affirmation pour les scientifiques partisans de l'aspect atomique de la matière et ouvrit encore une 
fois la porte au nouveau domaine de la mécanique statistique déjà un peu utilisée à l'époque par 
Maxwell dans le cadre des gaz. 


Comme toujours il existe plusieurs modèles mathématiques et suivant la tradition du présent site 
Internet nous avons choisi la plus simple et... ce n'est pas celle d'Einstein mais celle de Langevin 
(effectuée deux ans après dans un souci de simplification). 


Le point de départ est le théorème d'équipartition de l'énergie cinétique (cf. chap 


): 
E, = Nm =3 À pr 
2 2M4 
soit pour une particule: 
a 
2 24 


avec pour rappel v qui est la vitesse moyenne! Si nous simplifions l'analyse à un seul axe de translation 
possible la relation devient (nous spécifions maintenant qu'il s'agit de la moyenne afin de ne pas nous 
mélanger les pinceaux avec la suite): 


En écrivant ceci nous stipulons donc qu'une particule en suspension dans un fluide en équilibre 
thermique possède, dans la direction x par exemple, une énergie cinétique moyenne égale à celle d'une 
molécule gazeuse de nature quelconque, dans une direction donnée, à la même température. Il s'agit 
donc à nouveau d'une identité forte entre les solutions diluées et les gaz parfaits. 


Une particule comme celle que nous considérons, grande par rapport aux molécules du liquide, et se 
mouvant à la vitesse v par rapport à celui-ci subit comme nous l'avons pseudo-démontré dans le 
chapitre de Mécanique Des Milieux Continus (loi de Stokes) une résistance de: 


F, =-67uRv = -£v 


où & sera appelé "coefficient de friction" (correspondant donc à la viscosité) et où R est le rayon de la 
sphère. 


Maintenant, écrivons selon l'équation de la dynamique de Newton (on ne spécifie plus que la vitesse est 
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selon x dans la notation qui suit): 


dv d?x 
m— =mn—>=-6miRvV+F (32.183) 


La force complémentaire Æ,,,, introduite par Langevin, est aléatoire (stochastique). On sait a priori 


lea. 
peu de choses d'elle, si ce n'est qu'elle semble a priori indifféremment positive ou négative, et que sa 
grandeur est telle qu'elle maintient l'agitation de la particule, qui, sans elle, finirait par s'arrêter sous 
l'effet de la résistance visqueuse. 


L'équation précédente multipliée par x, peut s'écrire encore: 


(32.184) 


mx qe ÊxV+xX 
dt aiea. 


Elle est alors appelée "équation de Langevin" ou "équation stochastique de Langevin". 
Or, rappelons que (cf. chapitre de Calcul Différentiel Et Intégral): 


d(xv) = xdv+vdxe cit, = nn 32.185) 
dt dt dt 


d'où: 
1 + 
dv _d(xv)_ dx _d(xv)_ 2 Êæ j 2 di La id _ 2 (2186) 


X— = vV— A v 


dt dt dt dt dt dt | 2 dé 


En établissant cette dernière relation, nous avons aussi montré que: 


2 
m=1% (uen 
2 dt 
Nous pouvons alors écrire: 
1 dr > 
32 nm = Exv+xE, (2188) 
et aussi: 
1 dx 1 dx? : 
— mr = 2 — +xÆ (82189) 
2 dt? 2 dt | 


Si nous prenons la moyenne (nous changeons de notation pour la moyenne car la barre n'est pas très 
adaptée esthétiquement parlant lorsqu'il y a des puissances): 


LE np) - eo . PAP 
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Nous posons maintenant que: 


(XF ua.) =Û0 (32.191) 


en d'autres termes nous pouvons voir cela comme le travail moyen de la force aléatoire qui est nul. 


Il reste alors: 


2/2 2 
1, 2) (2) - xt / (x } (32.192) 
2 dr? 2 dt 
Posons: 
2 
; _idfx } (32.193) 
2 dt 
Nous avons alors: 
ee 2 no 1 
me may } —£u (32.194) 
Et comme: 
ART 
ma (2) =—— (32.195) 
Na 
Donc: 
du RT 
M = —£u (32.196) 
dt ON, 
Soit autrement écrit: 
di 
+ SU=— (32.197) 
dt 4 


Il s'agit donc d'une équation différentielle à coefficients constants d'ordre 1. Nous avons démontré dans 
le chapitre de Calcul Différentiel Et Intégral que la solution homogène était: 


7 + (32.198 
= C6 7 6 ) 


où la valeur de C nous importe peu car ce terme va de toute façon disparaître dans les développements 
qui vont suivre. La solution particulière peut être déterminée simplement par la contrainte au temps 
Zéro: 
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alc = 
e * +u 
ë Ee RT (82.199) 
A +é|Ce * +u, |=— 
dé ” 


d RT 
m—©+êu, =—— (32.200) 
di un 
Une solution triviale simple est alors: 
RT 
u,=c* = (32201) 
CN 4 


Nous avons alors: 


Or après très peu de temps le terme en exponentielle devient quasiment nul. Nous avons donc en 
régiment permanent: 


Soit: 


(r}= 2, = 2D4t| (32.204) 


V4 


a LI 


où D est appelé "coefficient de diffusion" (comme en thermodynamique). Nous remarquons dès lors 
que la position moyenne de la distance x parcourue est in extenso proportionnelle à la racine carrée du 
temps. Einstein avait appliqué un exemple numérique avec des particules en suspensions d'un rayon 
d'un millième de millimètre avec une eau à 290 [K] et trouva ainsi un déplacement moyen de six 
millièmes de millimètre en une minute. 


La relation (où il convient de ne pas confondre le R du rayon de la particule en suspensions au 
dénominateur avec le R de la constante des gaz parfaits au numérateur): 


D=— = ————| (32205) 


est parfois appelée "relation de Sutherland-Einstein" (car William Sutherland l'a découverte en 
Australie pratiquement au moment où Einstein écrivait cette même relation dans sa thèse) et que l'on 
retrouve aussi fréquemment sous la forme suivante (où k est pour rappel la constante de Boltzmann): 
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Einstein avait ainsi trouvé une relation qui offrait la possibilité de calculer le rayon R des atomes avec 
un thermomètre, un microscope et un chronomètre pour seuls instruments. Le physicien Jean Perrin 
reçut le prix Nobel pour la vérification expérimentale de ce résultat. 


Le lecteur remarquera, que si nous avions faire les mêmes développements que précédemment, mais en 
divisant à gauche et à droite l'équation différentielle: 


ZOO 2 


par m nous aurions eu comme résultat (considéré à juste titre comme plus général): 


&T 


_ (32.208) 


Em 


La méthode de Langevin redonne le même résultat que le premier modèle proposé par Einstein deux 
ans plus tôt et que le deuxième modèle deux ans plus tard. 


On peut se demander jusqu'à quel point la relation de Sutherland-Einstein prouve l'existence de 
molécules. Autrement dit, que serait la limite du coefficient de diffusion D si la nature était continue, 
c'est-à-dire si le nombre d'Avogadro était infini? 


Nous pressentons bien évidemment alors que D s'annulerait, et que le déplacement de diffusion 
brownien disparaîtrait tout simplement dans cette limite. Autrement dit, le mouvement brownien 
cesserait immédiatement si la Nature était continue! Ce qui est un résultat remarquable de preuve de 
l'aspect discret de la nature! 
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Notes personnelles: 
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33. THERMODYNAMIQUE 


L. "thermodynamique" est la partie de la physique qui traite des relations permettant de déterminer 


formellement les échanges (variations) d'énergie sous forme de travail mécanique et de chaleur dans le 
cadre de l'étude des transformations des 4 états de la matière (mais principalement des gaz parfaits dans le 
cadre scolaire) sous la base d'hypothèses simplificatrices entre un système (isolé, ouvert ou fermé) et son 
environnement extérieur. 


Les objectifs principaux de la thermodynamique sont: 


1. Avec un minimum de variables de pouvoir déterminer l'état et les échanges énergétiques d'un système 
sous des contraintes prédéfinies et souvent considérées comme idéales. (il y a à peu près une différence 
de 5% entre les valeurs théoriques et celles qui sont mesurées) et entre états d'équilibre et donc sans faire 
interevenir le temps 


2. De trouver les "variables d'état" (définissant l'état du système étudié à l'équilibre thermodynamique), 
telles que ces différentes informations puissent être obtenues en ne connaissant dans l'idéal que l'état final 
et initial du système. 


3. De se débrouiller à ramener les équations toujours à une forme mettant en évidence des variables 
(variations) facilement mesurables dans la pratique. 


Nous verrons plus loin que tout système peut au point de vue énergétique être décrit par: 
- Son volume, sa masse, sa pression, sa température. 

- Son énergie potentielle, son énergie cinétique, son potentiel chimique... 

- Ses propriétés physiques comme la capacité à absorber la chaleur, à irradier, … 


Attention!! Bien que la puissance prédictive théorique des équations de la thermodynamique soit 
passionnante à mettre en pratique, cette théorie est au final malheureusement (et forcément) une jungle 
d'équations à cause du nombre de combinaisons possibles des quelques paramètres que nous pouvons 
choisir à loisir comme fixes ou variables dans la pratique. Alors courage et n'oubliez pas que c'est en 
forgeant qu'on devient forgeron! 


Remarque: Il est très difficile de présenter la thermodynamique d'une manière pédagogique purement 
linéaire au contraire des autres domaines de la physique. Le plan de ce chapitre est donc actuellement 
un vrai mélimélo de notions qui seront parfois définies préalablement et d'autres qui ne le sont que bien 
plus tard dans le texte. Le lecteur aura donc compris que ce chapitre nécessite dans sa forme actuelle 
une restructuration majeure pour arriver à maturité et cela sera fait dans un avenir plus ou moins 
longtemps... 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


1. VARIABLES THERMODYNAMIQUES 


En thermodynamique, il existe plusieurs concepts majeurs très utiles suivant le type de système maintenu 
ou laissé en libre évolution étudié et les moyens de mesure à disposition. 


Nous souhaitons ici donner les définitions les plus importantes et nous démontrerons si possible leur 
provenance plus tard sachant qu'il est très difficile d'avoir une présentation purement linéaire de la 
thermodynamique (comme déjà mentionné!). 


Définitions: 


D1. Un "système" est un corps ou un groupe de corps subissant ou non des évolutions et qui constitue un 
ensemble bien défini et bien délimité dans l'espace et entouré par le milieu extérieur. L'ensemble 
système/milieu extérieur est dénommé "univers". 

D2. Le "travail", noté W, est l'énergie associée à la valeur ou au changement de la dynamique d'un 
système par l'agissement de forces mécaniques diverses (d'où le choix du terme "travail"….). 


D3. La "chaleur" ou "énergie calorifique", notée Q, est l'énergie associée à la valeur ou au changement de 
la dynamique d'un système dû à l'agitation moyenne des molécules (énergie cinétique moyenne). 


D4. "L'énergie totale" d'un système, notée E, est la somme de toutes les énergies qui spécifient ce système 
par rapport à son centre de masse (moment d'inertie, de masse, énergie cinétique interne...) et aussi (!) par 
rapport à un référentiel extérieur (énergie cinétique, énergie potentielle, rayonnement entrant). 


D5. "L'énergie externe" qui est liée à la position du système comme l'énergie cinétique ou l'énergie 
potentielle (gravitationnelle/électrostatique). 


D6. "L'énergie interne" d'un système, notée U, est la somme de tous les types d'énergies internes qui le 
distinguent uniquement par rapport à son centre de masse tels que le travail W échangé avec l'extérieur, la 
chaleur Q échangée (énergie cinétique moyenne interne), l'énergie de masse (relativiste, nucléaire), le 
moment d'inertie. 


De nombreux ouvrage de vulgarisation montrent qu'à ce point de notre étude de la physique nous avons 
typiquement comme énergie totale d'un corps: 


1 1 1 
E, 4 = nn + Je + mgh + …-. + Mc? +... 
2 2 , as 2 Ca 
——— érergk gravitatiorme Île ; D An ne émer gie de masse _. 
énergie cmétique énergie de rotation émur gie potentielk éhstique (33.1) 


énergie cinétique totale 


énergie mécanique 


D7. Les "énergies échangées" qui sont dones les énergies qui sont échangées avec l'extérieur. Les plus 
courantes sont le travail mécanique W et la chaleur Q précédemment définies. 


D8. "L'entropie", notée S, permet de quantifier la qualité et le sens d'évolution de l'énergie d'un système. 
Nous démontrerons que l'entropie d'un système isolé ne peut que croître. 
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DS. "L'enthalpie", notée H, est la quantité de chaleur, reçue par un système qui évolue à pression 
constante (isobare). En chimie ce concept est très utile, car dans une transformation chimique une partie 
de l'énergie injectée aura juste servi à repousser l'atmosphère ambiante lors du changement de volume 
dans la transformation. Ainsi, l'enthalpie rajoute à l'énergie interne U un terme correctif prenant en compte 
l'énergie emmagasinée/perdue par la pression environnante qui compresse le système (s'il est 
compressible…). 


D10. "L'énergie libre" ou "énergie de Helmholtz", notée F, caractérise la fraction d'énergie interne 
utilisable sous forme de travail. Elle est simplement la différence entre l'énergie interne et l'énergie 
calorique dissipée à cause de l'entropie à une température donnée. 


D11. "L'enthalpie libre" ou "énergie libre de Gibbs", notée G, caractérise la fraction d'enthalpie disponible 
sous forme de travail. Elle est simplement la différence entre l'enthalpie et l'énergie calorifique dissipée à 
cause de l'entropie à une température donnée. 


Pour résumer, dans l'ordre d'apparition et d'importance nous avons les types d'énergie suivant: 


lravail 


chaleur 


pression 


température absolue 


volume 


énergie totale 


énergie interne 
entropie 
enthalpie 

énergie libre 

G lenthalpie libre 


Tableau: 33.1 - Différentes grandeurs thermodynamiques 


nmirlulcim <|slvlol= 


Indiquons que nous ne reviendrons pas sur le concept de température T qui est comme nous l'avons vu en 
Mécanique Des Milieux Continus (théorème du Viriel) et en Mécanique Statistique (rayonnement du corps 
noir), un paramètre qui permet de relier avantageusement le mouvement moyen de différents corps avec 
leur énergie cinétique moyenne (sous-entendu leur "excitation" ou désordre") ou respectivement le 
rayonnement de certains corps avec leur énergie d'émission. Mais rappelons quand même l'origine du zéro 
Kelvin, car c'est une question redondante sur le web: 


Nous avons démontré dans le chapitre de Mécanique des Milieux Continus qu'à pression P constante 
(système "isobare"), le volume d'une quantité fixée de gaz parfait est proportionnel à la température 
absolue. C'est la "loi de Gay-Lussac" (dans le cas des gaz parfaits...!): 


W=ceT (33.2) 
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et nous y avons alors mentionné que les mesures expérimentales donnent alors une droite, qui extrapolée 
(un peu brutalement...) dans les valeurs négatives de la température en Celsius donne un volume nul pour 
un gaz parfait (en négligeant les aspects quantiques à cette frontière.) à une température 
systématiquement de -273.15 [°C]: 


-300 -200 -100 0 100 200 
Température [°C] 


Figure: 33.1 - Représentation de la loi de Gay-Lussac avec la pression 


d'où le choix confortable de poser le 0 [K] à cette valeur et de redéfinir une nouvelle échelle de 
températures. 


Par ailleurs, une difficulté est de parler de variation de température, lorsque par exemple nous étudions la 
sensibilité de l'eau à passer de la phase solide à la phase liquide. Nous observons effectivement 
expérimentalement qu'il suffit dans des conditions idéales de laboratoire de passer de -0.1 °C à +0.1 °C 
pour observer le passage de changement qualitatif de l'eau de l'état solide à liquide. Parler alors de 
sensibilité en % de température est difficile avec l'échelle traditionnelle dans le cas présent. Mais si nous 
parlons en échelle absolue alors cela correspond au passe d'une température de 273.05 à 273.25 [K], soit 
une sensibilité de transition de phase pour l'eau de 0.1% en température autour de son point de fusion. 


2. SYSTÈMES THERMODYNAMIQUES 


D'une manière générale, un système thermodynamique est l'ensemble des corps situés à l'intérieur d'une 
surface fermée imaginaire et souvent considérée comme extensible sans déperdition d'énergie que nous 
appelons "frontière". 


La frontière peut aussi sous indication de ses caractéristiques être matérielle! 


Signalons que la frontière peut se limiter à une surface élémentaire dS associée avec son vecteur normal 
enveloppant une particule fluide (voir le chapitre de Génie Météo pour un bon exemple!). Nous l'appelons 
dans ce cas "frontière particulaire". 


Il est souvent intéressant en thermodynamique, de faire le bilan des énergies qui sont transférées entre le 
système thermodynamique et le milieu extérieur, c'est-à-dire de considérer tout ce qui traverse la frontière. 


Les principaux transferts (mais pas les seuls!) susceptibles d'être opérés sont: 


1. Le "transfert-travail" W: Travail (mécanique) macroscopique ordonné effectué par une force sur une 
distance. Quand aucun transfert-travail (énergie) n'est opéré à l'échelle macroscopique, le système est dit 


"système sans travail". 
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2. Le "transfert-chaleur" Q: Énergie provenant de la variation du nombre de micro-états à l'échelle 
microscopique. Quand aucun transfert-chaleur (énergie) n'est opéré à l'échelle microscopique, le système 
est dit "système adiabatique", dans le cas contraire il est dit "diatherme”. 


3. Le "transfert de masse" M: Masse injectée dans le système. Quand aucun transfert de masse n'est opéré, 
le système est dit "système fermé". 


Définitions: 
D1. Un "système isolé" ne peut échanger ni travail, ni chaleur, ni masse avec le milieu extérieur. 
D2. Un " ê à â ; L el _ 
. Un "système ouvert" peut échanger du travail, de la chaleur et de la masse avec le milieu extérieur. 


D3. Un "système fermé" peut échanger du travail et de la chaleur mais pas de matière avec le milieu 
extérieur. 


Remarques: 


R1. Certains systèmes comptabilisent un bilan des actions extérieures qui leur sont appliquées nul. Ils 
sont alors dits "pseudo-isolés". 


R2. Nous parlons de "système homogène" si la nature de ses constituants est égale en tout point, alors 
qu'il est un "système uniforme" ou "système isotrope" si ses caractéristiques sont égales en tout point. 


3. TRANSFORMATIONS THERMOD YNAMIQUES 


Une "transformation thermodynamique" est l'opération au cours de laquelle l'état du système se modifie en 
passant d'un état initial à un état final. 


Nous en distinguons au moins de deux types: 


1. La "transformation thermodynamique quasi-statique" qui amène un système d'un état initial à un état 
final à travers une succession d'états qui sont exclusivement des états d'équilibre. 


2. Les transformations où toutes les variables d'état changent simultanément appelées "transformations 
polytropiques". 


Il est possible que certaines variables restent constantes lors d'une transformation thermodynamique. Dans 
ce cas, nous utilisons une dénomination bien spécifique: 
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P pression isobare 

T température isotherme 

V volume isochore 

U énergie interne isoénergétique 
S entropie isentropique 
H enthalpie isenthalpique 
Q chaleur adiabatique 

G enthalpie libre (énergie de Gibbs) extensive 


Tableau: 33.2 - Dénomination des grandeurs constantes 


Remarques: 


R1. Les études isobares sont d'un intérêt pratique important puisque tous les systèmes en contact avec 
l'atmosphère sont souvent, à l'équilibre, naturellement ou de manière forcée à pression constante (c'est- 
à-dire à la même pression que l'atmosphère environnante!) dans les laboratoires. 


R2. Il est difficile de construire réellement des transformations isothermes utiles. Le maintient de la 
température exige un excellent contact thermique et un temps de réacction assez long pour garder la 
température uniforme. Ce type de transformation sera donc, dans le monde réel, assez lent. Attention! 
Une transformation adiabatique peut être réversible ou irréversible, alors qu'une transformation 
isotherme est forcément réversible pour la gaz parfaits. 


R3. Beaucoup de transformations réelles sont considérées comme adiabatiques. Il suffit pour cela que 
le contenant soit très bien isolé ou même que la transformation soit assez rapide pour que les échanges 
thermiques soient négligeables. 


Nous distinguons également deux cycles de transformations thermodynamiques principaux qui sont: 


1. Le "cycle thermodynamique fermé": le système décrit une suite de transformations telles que l'état final 
et l'état initial de la transformation est identique et que la quantité et les propriétés des éléments 
participants au cycle sont toujours les mêmes. 


2. Le "cycle thermodynamique ouvert": le système décrit une suite de transformations telles que l'état final 
et l'état initial de la transformation est identique et que la quantité et les propriétés des éléments 
participants au cycle ne sont pas toujours les mêmes 


4. VARIABLES D'ÉTAT 


Définition: "L'état thermodynamique" d'un système est l'ensemble des propriétés qui le caractérisent, 
indépendamment de la forme de sa frontière. Les variables qui décrivent l'état du système en ne 
connaissant que l'état final et initial de celui-ci sont appelées principalement "fonctions d'état" ou 
fréquemment "variables d'état" et encore parfois "grandeurs d'état". 
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Remarque: Certaines fonctions d'état jouent un rôle particulier dans la définition des états d'équilibre 
d'un système. Ce sont des grandeurs accessibles, à l'échelle macroscopique, directement ou 
indirectement grâce à des instruments de mesure. Ces fonctions d'état particulières (comme la 
pression, la température, le volume, etc.) sont appelées "variables d'état d'équilibre d'un système 
thermodynamique". 


La définition précédente suppose implicitement l'existence d'un état et des variables d'état, c'est-à-dire que 
les grandeurs caractéristiques du système sont définies (ou théoriquement accessibles dans le sens de la 
mesure) à tout instant et en tout point du système. Ceci est loin d'être évident si nous considérons des 
évolutions rapides telles comme des explosions. 


Cette difficulté peut être éludée en se retranchant derrière "l'hypothèse de l'état local": Nous supposons 
qu'à tout instant, les grandeurs caractéristiques ont localement les mêmes expressions que dans une 
configuration stationnaire, ce qui sous-entend que les temps nécessaires aux changements d'état sont 
négligeables devant les durées caractéristiques de l'évolution. 


Le choix des variables d'état dépend de la nature du problème traité. Nous pouvons néanmoins séparer 
l'ensemble de ces variables d'état en: 


1. Des variables d'état dites "grandeurs extensives", proportionnelles à la quantité de matière et donc au 
nombre d'atomes/molécules du système servant à les définir (donc elles sont additives). C'est typiquement 
le cas de la masse, le volume, l'entropie.… 


2. Des variables d'état dites "grandeurs intensives", indépendantes de la quantité de matière (donc par 
extension, non additives). C'est typiquement le cas de la pression, la température, l'énergie … 


D'une manière générale, une variable intensive dépend du point envisagé dans le système étudié 
(température, concentrations peuvent varier d'un point à l'autre) alors que la grandeur extensive est définie 
sur la globalité du système. 


Montrons maintenant avec un exemple particulier que le rapport de deux variables extensives est une 
grandeur intensive. Pour cela, rappelons la loi des gaz parfaits ( 
) qui est donc une équation d'état (nous reviendrons sur les équations d'état en détails plus tard): 


PV=N A kT=RRT 


qui comprend donc trois variables thermodynamiques P, V'et T (ce qui laisse à choix deux variables de 
contrôle et indépendantes et une variable dépendante). 


Nous pouvons calculer la concentration C (à ne pas confondre avec la notation de la capacité calorifique 
que nous verrons plus loin!), qui est donc une grandeur intensive, par le rapport de deux grandeurs 
extensives ñn, V: 


— 
RT 


STE 
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Les variables d'état possèdent par ailleurs une propriété particulière: leurs variations ne dépendent pas de 
la nature de la transformation qui affecte le système mais uniquement de l'état final et initial du système à 
l'équilibre (ce qui est très utile en pratique...!). Il s'agit du concept d'intégrale de chemin que nous avons 
déjà traité en détail dans le chapitre de Mécanique Classique et de Calcul Différentiel Et Intégral. 


Citons les grandeurs extensives et intensives les plus courantes en thermodynamique: 


IP pression intensive 
T température intensive 
IV volume extensive 
IE énergie totale extensive 
[Ur énergie interne extensive 
Is entropie extensive 
IH enthalpie extensive 
F énergie libre extensive 
G enthalpie libre extensive 


} 


Tableau: 33.3 - Grandeurs extensives et intensives courantes 


À l'opposé, le travail W et la chaleur Q ne sont pas des variables d'état, car elles dépendent de la nature de 
la transformation. Néanmoins il existe des cas particuliers où la chaleur et le travail ne dépendent plus du 
chemin suivi lorsque les transformations s'effectuent soit à pression constante, soit à volume constant 
(nous verrons cela plus loin). 


4.1. PHASES 


Définition: Un système dans lequel les différentes grandeurs intensives varient de façon continue 
constitue une "phase". 


Nous pouvons donc considérer que toute grandeur intensive dépend des coordonnées du point envisagé: le 
système est constitué par une seule phase si la grandeur intensive est continue dans tout le système. C'est 
le cas des gaz, des liquides et de certains solides constituant des solutions solides. 


Si la grandeur intensive présente une discontinuité (ou plusieurs), le système est dit "polyphasique". 
Cependant, si les grandeurs intensives ont même valeur en tout point du système, la phase est dite "phase 
uniforme": le système a alors même température, pression, composition en chacun de ses points. 


Pour un système homogène, il peut être commode de ramener les variables extensives à l'unité de masse. 
Nous parlons alors de "grandeurs massiques" (ou "spécifiques"), généralement notées en minuscules. 


Nous utilisons si possible pour éviter toute confusion les règles de notation suivantes: 
- Toute grandeur non massique est représentée par une lettre latine majuscule 
- Toute grandeur massique (très utilisée en chimie!) est représentée par une lettre latine minuscule 


Dans le cas contraire, nous spécifierons de quel type de variable il s'agit. 
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5. ÉQUATIONS D'ÉTAT 


En physique, et plus particulièrement en thermodynamique, "l'équation d'état" d'un système à l'équilibre 
thermodynamique est une relation entre différents paramètres physiques, appelés donc les "variables 
d'état” déjà traitées au début de ce chapitre, qui déterminent son état. Il peut s'agir par exemple d'une 
relation entre sa température, sa pression et son volume. À partir de l'équation d'état caractéristique d'un 
système physique, il est possible de déterminer la totalité des quantités thermodynamiques décrivant ce 
système et par suite de prédire ses propriétés. 


Les équations d'état sont généralement restreintes à un type de comportement ou de phénomènes 
physiques donnés. Un même corps peut donc avoir plusieurs équations d'état, concernant par exemple son 
état magnétique ou son état thermodynamique. 


Pour qu'un corps puisse être caractérisé par une équation d'état à un instant donné, il faut que l'état de ce 
corps dépende uniquement des valeurs prises par les paramètres à cet instant. Les corps présentant un 
phénomène d'hystérésis ne peuvent donc pas être caractérisés par une équation d'état. 


5.1. ÉQUATION D'ÉTAT D'UN GAZ PARFAIT 


Nous avons démontré dans le chapitre de Mécanique Des Milieux Continus que l'équation d'état d'un gaz 
parfait était (relation déjà introduite une peu fortuitement plus haut): 


PV =nRT| (35) 
Soit: 
RT 
V(P,T) = _ (33.6) 


et l'équation d'état des gaz réels (aussi démontrée dans le chapitre de Mécanique Des Milieux Continus): 


N? 
P+a[T) (F-NB)=NT (637) 


Pour déterminer des équations d'état particulières et idéalisées des solides et liquides, il faudra d'abord 
introduire plusieurs coefficients permettent de caractériser certaines propriétés globales de milieux 
continus. 


Ces coefficients doivent être définis avec précaution, dépendant de la façon dont on les mesures, c'est- 
à-dire dépendant de ce qui est réellement mesuré. 


Prenons, par exemple, le concept de compressibilité (volumique) d'un échantillon. Il est raisonnable de 
dire que l'idée sous-jacente est la mesure du changement de volume sous un changement de pression. Si la 
pression augmente, le volume diminuera, il apparaît donc raisonnable de définir un coefficient de 
compressibilité par: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


où le signe "-" sert à garantir un # positif dans le cas d'une compression. 

Mais cette définition ne veut rien dire. Nous n'y avons pas spécifié les conditions dans lesquelles les 
mesures sont prises. Clairement, nous augmentons (ou diminuons) la pression mesurée à l'aide d'un 
manomètre par exemple et nous mesurons avec une règle (!) le changement de volume qui en résulte. Cela 
semble simple, mais c'est incomplet. Si nous augmentons la pression assez vite, le volume va diminuer mais 
la température va augmenter. Mesure-t-on le changement de volume immédiatement ou attend-on que la 
température soit redevenue celle qu'elle était en plaçant l'échantillon en contact thermique avec un 
thermostat avant de mesurer le changement de volume. Dans ce dernier cas, la mesure aura été faite à 
température constante. 


En d'autres termes, mesure-t-on le changement de volume d'un réceptacle en contact thermique parfait 
avec son environnement extérieur (nous lui laissons le temps d'aller à l'équilibre) ou isolé thermiquement 
de cet environnement. C'est très différent! 


De plus, V étant une variable extensive, il y aura avantage à définir la compressibilité comme une quantité 
intensive, c'est-à-dire indépendante de la quantité de gaz considéré (ici isothermique), ce qui rend plus 
facile la construction des tables de valeur. Nous avons alors intuitivement la définition suivante du 
"coefficient de compressibilité (relative) isothermique": 


sur lequel nous reviendrons un peu plus tard. 


De la même manière intuitive, nous pouvons définir le "coefficient de dilatation (relative) volumique 
isobare" (appelé plus rarement "coefficient de compression (relative) volumique isobare"): 


dy p = LES (33.10) 
: FLeoT PF 


sur lequel nous reviendrons aussi un peu plus tard. 


Ainsi, par exemple, pour un gaz parfait il vient: 


PF 


Nous verrons un peu plus tard une autre approche pour retrouver cette égalité. 


5.2. ÉQUATION D'ÉTAT D'UN LIQUIDE 


Maïntenant les variables d'état (macroscopiques) d'un liquide sont assez trivialement son volume V, sa 
pression P et sa température T. Son équation d'état peut alors par exemple se mettre aussi sous la forme: 


V = FUN (33.12) 
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Sous forme différentielle cela donne: 


(+) ar4(à) dP (33.13) 
FP T 


En introduisant les coefficients thermoélastiques comme nous l'avons déjà fait plus haut, il vient: 
ay 
= y pdT - YrdP (33.14) 


L'expérience montre que pour les liquides, les coefficients thermoélastiques varient très peu avec la 
température et la pression (oui... l'expérience c'est quand même utile parfois). Nous pouvons donc les 
supposer constants, pourvu que les variations de la température et de la pression restent modérées. 
Comme par ailleurs les variations de volume d'un liquide sont très faibles, nous pouvons faire la même 
approximation que celle démontrée dans le chapitre de Mécanique Des Milieux Continus avec la 
déformation vraie longitudinale. C'est-à-dire que: 


où f est le volume de référence constant. Compte tenu de ces remarques, nous obtenons trivialement 


par intégration l'équation d'état générale d'un liquide: 
TP) =Pifi+ayp(T-%)- tr (P-R)] (310 


Remarquons que l'approximation d'un fluide incompressible, très utilisée en mécanique des fluides, 
consiste à supposer que: 


ay p = 0, Tr = 0 (33.17) 
L'équation d'état du liquide devient alors: 
fe 29 1£ 
PCT, P) = = (33.18) 


Indiquons aussi que dans les petites classes, les solides sont considérés comme des liquides 
incompressibles. Nous avons alors la fameuse relation connue de nombreux écoliers: 


F = [+ @y PT -T ] (33.19) 


ou autrement écrit: 


AP = ay pVoëT (33.20) 
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Ces deux dernières relations sont exactement les mêmes que la formulation technique de loi Gay-Lussac 
pour les gaz (cf. chapitre de Mécanique Des Milieux Continus). 


Nous pouvons refaire le même raisonnement avec un élément de longueur mais en définissant un autre 
coefficient thermoélastique linéique. Dès lors, il vient une autre fameuse relation connue de nombreux 
écoliers: 


AL= @; plQAT (3321) 


Nous pouvons alors déterminer la relation entre &; ? et &y p (qui sont tous deux de beaucoup inférieur à 


l'unité). Effectivement pour un cube de côté L, nous avons: 
3 3 
AV=(In +4) -8 = (+7 HAT) -8=É(1+@ PAT) -8 


= B|1+3ar PAT+36 PAT? + @AT° |- 230 SAT 

LP LP L LP 

« A —, — 
—0 0 


et donc il vient: 


3%, p = y p| (33.23) 


Nous avons par exemple pour l'eau à température ambiante: 
ay,p22610% [k7], 2245107 [Pat] (6329 


Exemple: 


Un réservoir de volume V, aux parois supposées indéformables, est complètement rempli d'eau 
initialement à l'équilibre thermodynamique à la pression initiale Æ de 1 [bar] et à la température initiale 
7 de 298 [K]. Après avoir reçu une certaine quantité de chaleur, le liquide atteint un nouvel état 
d'équilibre thermodynamique, à la température de 398 [K]. Nous avons alors puisque F = F5, l'équation 
d'état du liquide qui se réduit à: 


PCT. P) _ 


1=litæp(T-D)-2r(P-R)l (325 
Fe [+ a,p 6-27(P-R)| 


Soit après réarrangement: 


Œ 
P= TE (T-T)i+R 2158 [bar] (3326) 
y 
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5.3. ÉQUATION D'ÉTAT D'UN SOLIDE 


Considérons maintenant le cas particulier d'une poutre (ou d'un fil), composée d'un solide élastique. Les 
variables d'état typiques du système sont alors sa longueur L, sa température T'et la force de tension F 
(positive dans le cas de la traction et négative dans le cas de la compression). L'équation d'état se met 
donc sous la forme différentielle suivante: 


a-(#) ar4(à) dF (33.27) 
OT} T 


Par analogie avec le coefficient de dilatation volumique isobare &y P, nous définissons le "coefficient de 


dilatation linéique": 


1 {8 Li 
Er F - —_— (33.28) 
F 


Par ailleurs, nous avons démontré dans le chapitre de Mécanique Des Milieux Continus, que pour un essai 
de traction (sans composante tangentielle) isotherme effectué sur un solide élastique nous avions 
(implicitement c'est la loi de Hooke pour rappel): 


by 
ta 


Mais nous pouvons aussi utiliser la déformation vraie longitudinale après quoi il faut évidemment adapter 
le terme de droite en conséquence: 


Il vient alors: 


L'équation d'état du solide peut alors s'écrir en y injectant cette dernière relation: 


d£ 
— = y pÂT +——— (33.32) 
L L,F E.S 


Cette relation nous donne donc la variation d'allongement relative correspondant à une variation 
infinitésimale de la force de tension et de la température, connaissant le coefficient de dilatation linéique. 


L'équation d'état ci-dessus s'intègre facilement en supposant que le coefficient de dilation linéique, le 
module de Young et la surface de section sont constants: 
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Si les déformations sont très faibles, nous avons démontré dans le chapitre de Mécanique Des Milieux 
Continus que la variation relative d'allongement pouvait s'écrire: 


d aF 
— = A RAT +—— (3335) 
L,F E.S 
Donc après intégration: 
A are LE | 6530 
Z ? ES 


Exemple: 


Une poutre cylindrique en acier de rayon de 15 [mm] est initialement dans un état d'équilibre 
thermodynamique caractérisé par une longueur initiale de 1 [m] à la température initiale de 300 [K] et une 
force de tension initiale nulle. La poutre est chauffée jusqu'à un nouvel état d'équilibre pour lequel sa 
température finale est de 400 [KT]. Pour calculer sa nouvelle longueur sous l'hypothèse particulière que la 
poutre est libre de tout mouvement et que la déformation est considérée comme faible: 


£ = 
lo =a(T-%)+—=Ù (6337) 
FA S 


Soit: 
L= lb iT-T + =1-12.10% .100+1=1.0012 [re] (33.38) 


Si la poutre est par contre encastrée des deux côtés, nous pouvons alors calculer la force de tension interne 
générée sous l'hypothèse des petites déformations. Nous utilisons alors: 


Soit: 
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F=-aE SiT-TGi+ÆM=-@E SiT-T) 
=-12.106.2.10!!.7.0.0157 .100 = 170 [&W] 


Nous voyons la un phénomène bien connu en construction mécanique: la déformation d'origine thermique 
d'un solide est généralement très faible, mais l'empêcher peut générer des efforts énormes, susceptibles de 
détruire un mécanisme. 


6. PRINCIPES DE LA THERMODYNAMIQUE 


Les principes de la thermodynamique sont les briques de la mécanique énergétique ou thermique. Chaque 
principe implique une grande quantité de concepts que nous essaierons de présenter et définir au mieux. 
C'est la partie "sensible" de ce domaine de la physique. 


La thermodynamique est basée sur quatre principes fondamentaux (dont certains sont démontrables): 


PO. Le "principe zéro de la thermodynamique" ou "principe de l'équilibre thermique" est défini par le fait 
que si deux systèmes thermodynamiques 1 et 2 sont en équilibre thermodynamique avec un troisième 3, ils 
sont eux-mêmes en équilibre thermodynamique (il s'agit d'une "'assertion" dans le langage de la théorie de 
la démonstration). 


Donc si deux corps en contact sont en équilibre thermique, ils ont la même température et donc que l'état 
reste stationnaire. Deux corps à même température en contact sont en équilibre thermique. 


Remarque: Nous avons utilisé ce principe implicitement (lorsque nous avons énoncé que l'état 
d'équilibre était le plus probable) dans le chapitre de Mécanique Statistique pour démontrer la loi de 
Boltzmann. 


P1. Le "premier principe de la thermodynamique" ou "principe de conservation" concerne le caractère 
conservatif de l'énergie et énonce qu'au cours d'une transformation quelconque d'un système, la variation 
de son énergie totale est égale à la somme des variations de tous les types d'énergie le définissant: 


AE,, = AU+AE, +AE,| (3341) 


Si le système est isolé la variation d'énergie totale sera bien évidemment toujours nulle! 


Bien évidemment, lorsque le système étudié (le conteneur et son contenu) est dans le même référentiel 
que l'observateur, il ne nous reste plus que le terme de variation d'énergie interne: 


ÂE,, = ALU] (33.42) 


ou en termes différentiels: 
dE = AU (33.43) 


Reste à déterminer l'expression exacte de la variation d'énergie interne U et des variables dont elle dépend 
(développements que nous ferons un peu plus loin). 
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Remarque: Ce principe est démontrable si nous acceptons le théorème de Noether ( 
) d'invariance dans le temps des lois de la physique comme un principe supérieur. 


P2. Le "deuxième principe de la thermodynamique" appelé aussi "principe de Carnot-Clausius" ou encore 
"principe d'évolution" concerne le caractère d'irréversibilité et est associé au concept d'entropie. Ce 
principe énonce que la chaleur ne peut passer d'elle-même que d'un corps chaud à un corps moins chaud 
(ou qu'un corps va inexorablement refroidir). L'opération inverse nécessitant l'apport de travail mécanique 
pris sur le système extérieur ce qui est donné par la relation (démontrée un peu plus loin): 


Le terme de gauche de l'égalité nous dit que l'entropie ne peut qu'augmenter et que pour cela, l'échange de 
quantité chaleur avec le système extérieur est toujours positif (numérateur du terme de droite de l'égalité). 
Donc le corps fournit de la chaleur au système extérieur et refroidit inexorablement. 


La notation particulière 8@ est ici pour indiquer que la chaleur est une différentielle totale inexacte. Il 
s'agit d'un concept sur lequel nous reviendrons plus loin. 


Remarque: Nous démontrerons grossièrement. cette relation plus loin en utilisant la loi de Boltzmann 
sur l'accès à l'information dans un système telle qu'étudiée dans le chapitre de Mécanique Statistique. 


P3. Le "troisième principe de la thermodynamique" ou "principe de Nernst" concerne les propriétés de la 
matière dans le voisinage du zéro absolu et énonce qu'à la limite du zéro absolu, température qui ne saurait 
être atteinte ( ), l'entropie d'équilibre d'un système tend 
vers une constante indépendante des autres paramètres intensifs, constante qui est prise nulle. 


Démonstration: Il s'agit du "théorème de Nernst" dont le résultat formel est simplement basé sur le 
deuxième principe donnant l'entropie (cf. ): 


S = kin(Q) 


Nous voyons que si nous considérons un cristal à la température du zéro absolu, la position des particules, 
les unes par rapport aux autres est parfaitement définie de façon unique. Par conséquent, il n'y a qu'une 
seule complexion possible pour un cristal au zéro absolu. Le nombre de complexions { est donc égal à 1. 
Ce qui entraine que: 


S = kln() = 0 


Rappelons que le "zéro absolu" est la température la plus basse accessible théoriquement en physique. À 
cette température, une substance ne contient plus à l'échelle macroscopique, l'énergie thermique (ou 
chaleur) nécessaire à l'occupation de plusieurs niveaux énergétiques microscopiques ( 

ue). Les particules qui la composent (atomes, molécules) sont toutes dans le même état 
d'énergie minimale (état fondamental). Cela se traduit par une entropie nulle due à l'indiscernabilité de ces 
particules dans ce même niveau d'énergie fondamentale (selon le troisième principe de la 
thermodynamique) et par une totale immobilité au sens classique selon le théorème du Viriel. 
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Cependant, au sens quantique, nous avons vu dans le chapitre de Physique Quantique Ondulatoire que les 
particules possèdent toujours une quantité de mouvement non nulle d'après les relations d'incertitudes de 
Heisenberg et que selon les distributions de Fermi-Dirac et de Bose-Einstein (cf. chapitre de Mécanique 
Statistique), qu'il y a quand même différents niveaux d'énergie lorsque nous prenons en compte le principe 
d'exclusion de Pauli. D'où l'émergence de la thermodynamique quantique. 


7. CAPACITÉS CALORIFIQUES 


Dans une transformation donnée, un apport À de chaleur se traduit en général par une élévation AT de 
la température du système. 


Définition: Nous appelons "capacité calorifique" (ou "capacité calorique", ou encore "capacité 
thermique" ou enfin "chaleur spécifique") C du système, la quantité: 


La capacité calorifique est donc de par ses unités, l'énergie qu'il faut apporter à un corps pour augmenter 
sa température de 1 Kelvin. C'est une grandeur extensive (plus la quantité de matière est importante, plus 
la capacité calorifique est grande). Sous forme infinitésimale, nous avons: 


_ 50 
_& 


(29 AQ 
(33.48) 


Nous voyons que l'avantage pédagogique d'avoir une écriture utilisant des variations discrètes plutôt 
qu'infinitésimales permet de ne pas avoir se poser la question si nous avons une différentielle totale exacte 
ou inexacte. (voir plus loin la distinction). 


Dans le cas d'un gaz parfait, nous admettrons que la totalité de la chaleur échangée (énergie) est mise sous 
forme d'énergie cinétique des atomes ou molécules (énergie thermique), donc nous pouvons alors écrire: 


et nous démontrerons plus loin comment déterminer exactement la valeur de cette capacité pour de tels 
gaz. 


Voyons cependant déjà comment déterminer cette capacité calorifique pour des solides cristallins (que 
nous supposerons à volume constant). Pour cela, rappelons que nous avons démontré dans le chapitre 
d'Électrocinétique que dans un cristal, la densité d'états dans un volume sous certaines conditions bien 
précises était: 
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Or la relation antéprécédente est indépendante du fait que dans le domaine de l'électrocinétique nous 
considérions des électrons ou toute autre particule vecteur d'une propriété quelconque (charge, chaleur ou 
autre). Ainsi dans le cadre de la thermodynamique des solides cristallins, un modèle consiste à supposer le 
vecteur de chaleur comme une particule ayant des propriété ondulatoires similaires à l'électron qu'il est 
d'usage d'appeler le "phonon”. 


En supposant que les phonons sont identiques dans les trois directions de l'espace et en se rappelant la 
relation de Planck-Einstein (cf. chapitre de Physique Quantique Corpusculaire) valable pour toute 
particule de par le principe de dualité onde-corpuscule: 


E =kv (33.52) 


et (cf. chapitre de Mécanique Statistique) de la statistique de Bose-Einstein pour les bosons (particules non 
soumises au principe d'exclusion de Pauli pour rappel...): 


1 


— 33.53 
ep(Ê TE #1 | 


que nous noterons dans le cas présent sous la forme suivante (puisque le potentiel chimique est nul dans le 
cas qui nous intéresse): 


Jae(E,T,{i) = 


1 1 l 


RE) = ———— = —_—_— = —— 
BvkT hojkT _y (33.54) 
exp E }- 1 © 1 1 


nous avons en combinant ces trois grands résultats: 


U =3[ mn(@)D(a)da = 3| hn(e)D(a)de = 3[ hon(æ)D(a)dæ 
@ [re] ii 
+ h&@ 
EL 
J _fœ@jxT 
2€ af —] 


4 (33.55) 


D(@)de 


Nous avons alors (en écrivant abusivement que la chaleur est : 
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aU- PaV 
: -(# -(#-2r) _ pE {de 
=) ee = 2). 2 
T y ST }y T T }y 
F 

| | ho/kT 
free )Pode=3f10 DER dore 

L aT CTI _ J KT | hafkT 2 

& le ll 

(33.56) 

=3{ño ——|# agi D(@)d@ 

& | Sh@ÎkT — 1l XT 

ho  haT 
= 3k| pre ——; Dia) æ 

> #T LRORT _]| 


À partir de là il existe deux principaux modèles de prévision de la capacité calorifique des cristaux, le 
modèle de Debye et le modèle d'Einstein, chacun faisant des hypothèses sur la densité de modes des 
phonons. 


Dans le modèle d'Einstein un seul mode de fréquence (respectivement pulsation) est supposé possible, de 
sorte la vibration du solide est schématisée par N oscillateurs harmoniques à cette fréquence. Cette 
pulsation partiuclière est souvent associée à ce que nous appelons la "température d'Einstein": 


La densité de modes est alors symbolisée par N distributions de Dirac (cf. chapitre de Calcul Différentiel 
Et Intégral) autour de cette valeur tel que: 


: 2 halkT ho \ oh kT 
Cy = 3k| fe) —— Vatar da = (EE | ne 
m AT? (Shaft _;| KT 7 (ohofRT | 
(33.58) 
2 OT 
= (se) —— 
(eOT _ | 


Ce modèle prévoit une valeur limite de la capacité calorifique aux hautes températures (nous utilisons un 
développement de Taylor): 


c EN pre | (1+R@/ET) . Fi (1+R@ET) 
FT—+40 — — | ———— |" | ES" 7 ne 
ET?) ((1+ha/kT)-1) KT?) (hofkTÿ | (359 


= EN (1+R@ ET = ZEN 


Il est d'usage lorsqu'on présente cette relation de considérer une quantité de matière correspondant à une 
mole et de faire apparaître ainsi la constante des gaz parfaits: 
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Cy T-540 = 3EN 4 = 3R | (33.60) 


Cette valeur avait été donnée initialement par Dulong et Petit et elle est en assez bon accord avec les 
résultats expérimentaux. Nous parlons souvent de la "loi de Dulong et Petit". 


En revanche aux faibles températures, il faut faire appel au modèle de Debye qui consiste à supposer la 
relation de dispersion comme linéaire avec la vitesse de propagation des phonons (vitesse du son dans le 
cristal) supposée comme indépendant de la température: 


æ@(k)=v£ (33.61) 


La densité d'états s'écrit alors: 


2 d® 27 d@ Dry 2Hv 2rv 
Nous avons alors pour la capacité calorifique: 


1 Fa Ph r 


—— À = —— | dû (33.63) 
Cho RT 127 3 UE LR 


U=3{ ho — 
@ 


Dans le modèle de Debye, seule la branche acoustique des phonons est considérée, 

ce qui revient à schématiser le cristal comme un réseau monoatomique formé des atomes 

les plus lourds. Dès lors, les modes de résonances sont limités à une certaine fréquence (pulsation), avec le 
volume correspondant, dite de coupure telle que (nous changeons la notation de la constante de 
Boltzmann afin de ne pas la confondre avec le nombre d'onde): 


(KE) 
—— x 
ge fr de- PET . 
27 VS 0 go _] 2 e*-1 À 

_ h er) f  , _Wh (ar) f ee. 

mr lier 2m i\m) ie 

: NE 
33.64 

7, (ET \ P x É &TŸ'P À D 
= TE | fr TE | | x 

27 y o® —i 27 vh o® 1 


3x 3x 
k p k D 3 
= INT ne. | F dx = 9NERT re 3 (EE 
vh x) Seti vRNGrN) à e*-1 
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où (nous avons mis les deux formes d'écritures les plus courantes): 


1/3 1/3 
Th = 2 (6 F) _ ES (33.65) 


E F 2kp£ 7T 
Nous avons alors pour la capacité calorifique: 
au 3h 8 P Wh'P9 æ 
=) 52587 | jour -20= ler de 
OT Jy 272v ep 1 om ? OT MOT _ 
3h “P a R©  pojkT Ph h P ae 
_ | _ PRET PS Te ÎD= SR — Du ad dæ 
2 à her 1 À ke 2 KT? à (her _ | 
keT 4 (33.66) 
x 
37h? #l ñ ) keT , _ Wh (ur) ï no. 
2 2 J 2 
2 kpT? 1 (ri À 2 TA R ] Gex 1) 
3 x 
D 4 x 
En LE dx 
TD 0 (e*-1]| 
Si la température est petite, nous avons alors: 
340 4 x 
T tr xe 
Cyr-0 = Kg T | ———Z 4% (33.67) 
D/ 0 le* —1| 


Ce qui est difficile à calculer. Alors nous passons plutôt par le cheminement suivant: 


3 4co 
Cy r-0 (à) =. T T Î F dx| (33.68) 
d eT F,T—0 oT Th 0 e* —1 


Et cette dernière intégrale nous est connue. Effectivement, nous la démontrerons en détail plus bas en 
utilisant la fonction zêta de Riemann lors de démonstration de la constante de Stefan-Boltzmann: 


3 +on 3 
Cyr0 =9Mp-2|T|Z| | dr|=0w rl T Las 
| (D) ei eT| (7) 15 
: (33.69) 
rm à rm 12Wkper | T 
= QNEp—— TT" = 3 Mg — AT = EE | — 
1575 © STD 5 (à 


Soit: 
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= - = 


et les relevés expérimentaux correspondent bien à ce comportement! 


Remarque: Cette capacité n'est pas constante. Elle dépend bien évidemment elle-même de la 
température et du matériau/fluide considéré défini par le nombre de degrés de liberté qui change en 
fonction des atomes/molécules (ce qui explique la différence de capacité calorifique entre les gaz 
monoatomiques et les autres). 


En thermodynamique, il faut aussi toujours préciser quelle est la transformation considérée car AQ 


dépend de la nature de la transformation. Nous distinguerons en particulier la capacité calorifique à 
volume constant (isochore) notée: 


a] 
Cy = 5e (33.71) 
OT Jy 
et la capacité calorifique à pression constante (isobare) souvent utilisée en chimie et notée: 
(] 
Cr = 20 (33.72) 
OT }» 


La différence entre la chaleur spécifique à pression constante et la chaleur spécifique à volume constant 
tient évidemment au travail qui doit être fourni pour dilater le corps en présence d'une pression externe. 
Ces deux expression mettent aussi en évidence une différence fondamentale dans les montages 
expérimentaux de mesure, c'est-à-dire des situations physiquement différentes. En pratique, pour utiliser 
ce concept de capacité calorifique, nous devons identifier pour notre expérience quel C utiliser selon la 
façon dont le montage/machine aura été constitué. 


Il est alors assez intuitif que la chaleur spécifique à pression constante est toujours strictement plus grande 
que la chaleur spécifique à volume constant. Nous démontrerons d'ailleurs plus bas que nous avons même 
précisément pour un gaz parfait: 


Si au lieu de considérer le système entier, nous rapportons les mesures à une unité de masse (ce qui est 
beaucoup plus utile en pratique!), nous définissons alors la "capacité calorifique massique" à volume 
constant (isochore): 


et la capacité calorifique massique à pression constante (isobare): 


Cy = JL 50 99 7EC) 
P (33.75) 
M OT }» 
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Si au lieu de considérer le système entier, nous rapportons les mesures à une mole du corps considéré (ce 
qui est beaucoup plus utile en chimie!), nous définissons le "capacité calorifique molaire" à volume 
constant (isochore): 


m _ [a 
Cy -__— nr 
# aT y 
et la capacité calorifique molaire à pression constante (isobare): 
mu _ 150 
Cp - — _—, 
a\AT P 


où nest le nombre de moles du système. 


Nous avons donc bien évidemment par extension, en passant au cas discret, la relation très utile en 
pratique: 


AQ=m.c.AT 


où c est la capacité calorifique polytropique massique. 


Il s'agit d'une relation très importante dans la pratique et dont les applications au quotidien sont légio n car 
elle permet dans des cas idéalisés de calculer la chaleur utilisée ou fournie lorsqu'une certaine quantité de 
matière subit un changement de température ou de calculer la température finale deux deux corps mis en 
contact. 


Pensez-y lorsque vous prenez votre douche ou que vous chauffez une casserole d'eau. Vous connaissez 
alors AT ainsi que la quantité d'eau M utilisée pour votre douche/bain ou casserole. Cela vous donnera 
l'énergie totale utilisée ÂQ et en connaissant le coût de l'énergie dans votre ville vous en déduirez 
rapidement le coût d'une douche, d'un baïn ou d'une casserole d'eau bouillante! 


Une autre application sympathique est de calculer l'augmentation de température (dans un cas idéal) d'un 
objet lâché à une certaine hauteur sous l'hypothèse que toute son énergie potentielle est convertie en 
chaleur après avoir touché le sol (le seul problème étant de trouver la valeur de capacité calorifique 
polytropique massique dans les tables): 


mgh = me ;àT 


où c; est la capacité énergétique polytropique massique (il s'agit simplement de c mais donné en joules par 


kilo et par kelvin plutôt qu'en calories par kilo et par kelvin). Donc après réarrangement nous avons: 


Le cas important de la température d'équilibre finale de deux corps mis en contact est simple à obtenir. 
Effectivement, comme la chaleur perdue par l'un des deux corps sera gagnée par l'autre, nous avons en 
choisissant convenablement AT pour chacun des deux corps afin que Â@ soit de même signe: 
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AR -Trl=cn (Ts -T] (33.81) 


Soit après un réarrangement élémentaire: 


7, - VAR + 
74 +C278 


Exemple: 


Nous avons donc dans un système sans échange de travail mécanique mais uniquement de chaleur la 
relation suivant: 


AU=CAT=C(T-7%) (33.83) 


Or, la puissance est l'énergie divisée par le temps (cf. chapitre de Mécanique Classique). Il vient alors 
(attention à ne pas confondre la notation de la puissance avec celle de la pression!): 


Ce qui permet déjà de calculer la puissance à fournir pour chauffer une quantité de matière donnée à une 
température donnée et un temps donné sans considérer de changement d'état sinon quoi il faut prendre en 
compte la chaleur latente. 


La fraction précédente peut aussi s'exprimer comme le débit volumique d'un fluide ÿ en [»#°s°] 


multiplié par la densité du fluide: 


P=V.p.c,(Z -7) (33.86) 


ce qui permet de connaître la puissance fournie par un débit d'eau entrant dans un radiateur à une certaine 
température et sortant de celui-ci avec le même débit mais avec une autre température. 


Nous retrouvons aussi cette relation parfois dans la littérature sous la forme suivante: 
E=m,(Z-%)=2c,(R-7) (35387 
après avoir bien évidemment multiplié les deux côtés de l'égalité par le temps. 


Dans certaines transformations, nous avons un apport ou un retrait de chaleur alors que la température du 
système reste constante (par exemple dans les transformations de changement de phase d'un corps). Cela 
provient d'un autre phénomène: 
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Définition: "L'enthalpie de changement d'état” ou "chaleur latente", notée L et donnée en joules par 
kilogramme, correspond à la quantité de chaleur nécessaire à l'unité de quantité de matière ou de masse 
d'un corps pour qu'il change d'état. C'est une valeur très importante en pratique pour effectuer des calculs. 


Nous avons donc bien évidemment par extension la relation très utile en pratique: 


Dm: E 


qui donne donc la quantité de chaleur à fournir pour faire changer de phase une certaine quantité de masse 
m (le signe de Q est alors par convention négatif). Inversement, si la quantité de matière revient à un 
niveau d'énergie plus faible, cette quantité de chaleur latente sera donnée à l'environnement et non 
absorbée et le signe de Q est alors positif! 


Remarque: Pour le passage de l'état liquide à l'état de vapeur, nous parlerons "d'enthalpie de 
vaporisation". 


L'enthalpie échangée lors du changement d'état résulte de la modification (rupture ou établissement) de 
liaisons interatomiques ou intermoléculaires. Il existe trois états physiques principaux pour tout corps pur: 
l'état solide, l'état liquide et l'état gazeux. Les liaisons sont plus fortes dans l'état solide que dans l'état 
liquide et ces liaisons sont quasi absentes dans l'état gazeux. Il existe comme nous le savons déjà un 
quatrième état obtenu à très haute température où la matière se trouve sous la forme d'un plasma d'ions et 
d'électrons ( : lieux ( IS). 


Nous différencions trois modes d'échange de chaleur: 


1. La "convection": fluide venant alternativement au contact d'un corps chaud et d'un corps froid 
(phénomène typique des mouvements de l'atmosphère terrestre). 


2. Le "rayonnement": un corps à température donnée émet un rayonnement électromagnétique susceptible 
d'être absorbé par un autre corps. 


3. La "conduction": le transfert d'énergie se produit des zones chaudes vers les zones froides par collision 
des particules les plus excitées (zone chaude) avec les particules voisines moins excitées et ainsi de suite 
de proche en proche. 


8. ÉNERGIE INTERNE 


Dans le chapitre de Mécanique Classique, nous avons vu (deuxième théorème de Kôünig) que l'énergie 
totale d'un corps par rapport à un référentiel galiléen extérieur R' au centre de masse était donnée par la 
somme de l'énergie cinétique et potentielle par rapport à ce même référentiel, additionnée de l'énergie 
cinétique et potentielle de ce même corps par rapport au référentiel assimilé à son centre de masse R 
(référentiel barycentrique). 


Ce que nous écrivons sous la forme: 


E,,=(£E +ÆE 


+ 
tot GtR  Eyçie || 


E +Æ£ 


GR | ÉyGiR | 


=iE + E 


ce ct2 | EyGie | 


+0 


où U est la grandeur énergétique (énergie interne) propre au centre de masse du corps concerné. 
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Sous une forme plus simplifiée, la relation précédente s'écrit traditionnellement en thermodynamique: 


E, 


tot 


=£ + £, +ÙÜ (33.90) 


Le premier principe de la thermodynamique s'écrit alors: 


DrFeE, EE +s,. +0) 


Donc l'énergie totale est la somme des énergies mécaniques macroscopiques (cinétiques et potentielles) et 
microscopiques (énergie interne). 


En règle générale, les systèmes étudiés en thermodynamique sont globalement au repos (v, = 0) par 
rapport à l'expérimentateur et donc ÀÆ, = 0. De même, nous avons en général un champ de potentiel 
constant et isotrope dans la chambre d'expérimentation ce qui implique À, = 0. 


En conséquence de ces simplifications la loi de conservation de l'énergie, ou premier principe de la 
thermodynamique, se réduit comme nous l'avons déjà mentionné à l'énergie interne tel que: 


O+W =U] (33.92) 


Remarque: L'énergie interne U n'est souvent donnée qu'à une constante additive près, c'est la raison 
pour laquelle certains l'appelle à juste titre "surénergie interne". Comme nous l'avons démontré dans le 
chapitre de Mécanique Classique, l'énergie totale d'un système, est la somme des énergies élémentaires 
de celui-ci. Ainsi, l'énergie interne est une grandeur extensive. 


Considérons maintenant un système décrit par les variables d'état thermodynamiques: 


LEE 


, (33:93) 


Dans une transformation élémentaire 4x,,4x, …,dx, le travail élémentaire dW (si nous ne nous intéressons 
qu'à cette forme d'énergie) se mettra sous la forme (cf. chapitre de Calcul Différentiel Et Intégral) d'une 
différentielle totale exacte: 


dW = Adx + Adx; +..+ Adx, (33.94) 


si nous avons la relation suivante, démontrée dans le chapitre de Calcul Différentiel Et Intégral, qui est 
satisfaite (qui sont les coefficients des dx): 
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alors dans ce dernier cas, nous avons une différentielle totale inexacte (la différentielle dépend donc du 
chemin parcouru!) ce qui nous amènerait à écrire: 


ÊÔW = Adx + Adx, +...+ Adx, (33.97) 


Puisque le travail W est d'une manière ou une autre une force sur une distance, nous avons déjà démontré 
dans le chapitre de Mécanique Classique que celle-ci dépend du chemin parcouru et pas seulement du 
point de départ et final. 


Dans la même transformation, la quantité de chaleur dQ se met sous une forme similaire: 


dO = Bdx, + B,dx, +... +B,dx, (33.98) 


si encore une fois la relation suivante est vérifiée pour les variables d'état: 


— = —— (33.99) 
ôx; 0% 
ou sinon dans le cas contraire: 
0Q = B,dx + B,dx, +...+B, dx, (33.100) 


Les grandeurs caractéristiques d'une transformation du système mais dont la valeur dépend non seulement 
de l'état initial et de l'état final, mais aussi du chemin suivi sont appelées "grandeurs de transfert". 


Rappelons qu'au vu de ce qui a déjà été étudié dans le chapitre de Calcul Différentiel Et Intégral, nous 
avons alors pour un cycle thermodynamique: 


AU = Ÿ dit = AQ=f ôQ #0 AW=Ÿ ôW #0 (33.101) 


et c'est le fait que l'énergie interne soit une différentielle totale exacte qui impose logiquement que la 
chaleur Q soit une différentielle totale inexacte de par la propriété de linéarité de l'intégrale (sinon quoi 
elle n'annulerait pas par sommation la variation de travail W sur un cycle fermé). Effectivement, selon le 
premier principe de la thermodynamique, si l'énergie est conservative alors nous avons pour l'énergie 
interne d'un système fermé et isolé (sous forme discrète): 


Ce qui implique que quelle que soit la transformation, les variations de travail et de chaleur sont données à 
l'intérieur de ce système conservatif par (sous forme discrète): 


AQ + A = 0| (33.103) 


ou plus techniquement: 


bau=bi50+67\-$60+f a7-0=D50--b37 


#0 #Ù 


33.104) 
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Donc quelles que soient les façons dont les transformations se font à l'intérieur du système, l'état final et 
initial sont identiques en termes énergétiques. Ce qui nous impose que les transformations 
thermodynamiques soient indépendantes de la manière dont les phénomènes ont lieu à l'intérieur du 
système. A7} est alors une différentielle totale exacte (« ‘gral) que 
nous écrirons dU. 


8.1. TRAVAIL DES FORCES MÉCANIQUES 


Rappelons maintenant que nous avons vu dans le chapitre de Mécanique Classique que par définition, le 
travail est donné par une force sur une distance (quelle que soit l'origine de cette force: mécanique, 
rayonnante, nucléaire, etc.). Il s'ensuit donc la relation très importante en thermodynamique: 


dW = Fodi =P:S:dx= P'dV 


qui exprime donc, à pression constante (isobare), la variation de l'énergie due au travail des forces 
extérieures de pression sur un système (généralement un gaz en thermodynamique...) dont le volume a 
varié (sans être restreint par une frontière rigide!). 


Bien évidemment, si la variation de volume est nulle ou la pression est nulle. la variation de l'énergie due 
au travail des forces de pression sera alors nulle. 


A l'équilibre, la pression P est prise comme étant celle du système considéré (pression interne) soit celle de 
l'atmosphère environnante puisque la pression est alors égale (sinon il n'y aurait pas équilibre). 


De même, la variation de volume est prise comme étant soit celle du système considéré (volume propre) 
soit la variation de l'atmosphère environnante puisque de toute manière la variation de volume sera la 
même pour les deux! 


De plus, nous voyons que le chemin intervient dans l'expression précédente du travail et donc que celui-ci 
est une grandeur qui dépend du chemin parcouru (cf. | 1). Ceci 
implique que nous devons écrire 4}# au lieu de dW. Il existe bien sûr quantité d'autres manières 
d'exprimer le travail, mais par la définition de celui-ci même, il s'agira toujours d'une différentielle 
inexacte. 


Ce résultat a une implication directe sur l'expression de la variation de chaleur pour laquelle le théorème 
du Viriel (cf. cha UX € us), que celle-ci est donnée par son agitation 
thermique. Il convient de rappeler que cette agitation est donnée par l'énergie cinétique moyenne et que 
l'énergie cinétique existe de par l'application d'une force sur une distance pour chaque particule. Ainsi, la 
chaleur est elle, aussi une différentielle inexacte 4Q ! 


Finalement, nous avons dans le cas d'un fluide (liquide ou gazeux) ayant une variation d'énergie interne 
polytropique: 


dU = 60 +6W 


Au cours de son évolution, le volume V du système peut donc varier. Si nous considérons une évolution 
infiniment petite au cours de laquelle le volume varie de dV et si nous notons Æ la pression extérieure 


subie par le système, nous écrirons dans un cadre plus général (le signe négatif devant la pression est une 
convention!): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


ÔW =-EdW +dT (33.107) 


où -P4F est le travail dit de "refoulement extérieur" (si 4} > 0, l'augmentation du volume du système 
exprime ainsi la fourniture d'un travail à l'environnement extérieur, ce qui explique le signe - indiquant que 
l'énergie interne du système diminue) et où dT (à ne pas confondre avec une variation de température!!) 
est une autre forme d'énergie (si le système est réactif au niveau chimique par exemple, il peut fournir une 
éventuelle énergie chimique aussi). 


Sauf systèmes particuliers (piles, accumulateurs.) la seule énergie échangée est le travail des forces de 
pression de sorte que nous n'ayons plus que: 


OW =-Pdÿ (33.108) 


et alors nous pouvons à loisir écrire dW au lieu d'utiliser la différentielle inexacte puisque ce travail n'est 
dépendant que d'une variable d'état (la notation dW étant souvent utilisée en physique dans ce cas)! 


Par ailleurs, la plupart des systèmes étudiés sont par hypothèse, à l'équilibre, à la même pression interne 
que la pression extérieure (atmosphère environnante). Ce qui nous autorise dans ce cas particulier à écrire: 


P =P (33.109) 


€ 


où P est donc la pression dans et en dehors du système (le système est alors dit "isobare" comme nous le 
savons déjà et plus rarement "monobare"). 


a 


| 


Figure: 33.2 - Exemple d'une sphère à l'équilibre avec l'environnement 


Dès lors, nous avons dans ce cas particulier: 


ÔW =-Pdr 
2 


(33.110) 
AR = Ed 


La quantité de chaleur ©, mise en jeu dans une transformation isochore (à volume constant) se réduit 
alors bien évidemment à la variation de l'énergie interne telle que (attention à la notation traditionnelle @, 


qui peut faire oublier que nous avons affaire à une variation de chaleur!): 


6Q=@Qy=U;-U (33.11) 
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Si nous considérons un système évoluant d'un état 1 vers un état 2 dans une atmosphère environnante 
isobare (à pression constante) et donc que sa propre pression interne est à l'équilibre avec cette 
atmosphère, nous avons alors le "travail des forces mécaniques à pression constante": 


2 
AI = Se -F)| (33.112) 


Ou si le système évolue d'un état 1 vers un état 2 dans un environnement isotherme, nous avons alors le 
"travail des forces mécaniques à température constante": 


2 2 2 
RT av F 
AW =-| Par = (° je =-ART| = -2RTIn (2) (33.113) 
| Ar CT ñ 


Si on veut produire une quantité raisonnable de travail, il sembe à priori que le volume devra atteindre des 
dimenions totalement irréalistes. Aussi nous construisons la majorité des machines thermiques avec un 
retour cyclique. 


8.2. ENTHALPIE 


Considérons le cas isobare très courant dans les laboratoires de chimie puisque les béchers sont ouverts à 
l'atmosphère ambiante. Si nous considérons une telle situation, nous avons alors la variation d'énergie 
interne: 


U, -U, = AQ- P(V, -V)— AQ =U, -U,+ P(V, -M)=(U, + P,)-(U + PF) (G3114) 


où donc la pression P et le volume V sont les variables d'état internes au système étudié! Il est important 
de remarquer à nouveau que si la variation de chaleur AQ est nulle et que le volume interne augmente la 


variation d'énergie interne U est alors négative, ce qui sera interprété par l'expérimentateur comme un 
emprunt d'énergie au système extérieur et donc il est courant de parler de perte ou de réaction 
endothermique! 


La quantité de chaleur @, mise en jeu dans une transformation isobare (l'indice de @,est indiqué dans ce 
sens. peut faire oublier que nous avons affaire à une variation de chaleur) est égale à la variation de deux 


termes à forme identique: 


AQ=Qp=(U, +P7)-(U +P/)=H)-H,) = AH (B3US) 


où nous définissons donc une nouvelle fonction d'état commode, "l'enthalpie" H (grandeur extensive) dans 
une transformation isobare comme donnée par: 


H=U+PF = +nRT]| (33.116) 


où n est le nombre de moles internes au gaz parfait subissant le changement de volume! Nous voyons par 
ailleurs que si la pression environnante est nulle, l'enthalpie est égale à l'énergie interne. Le fait qu'il y ait 
des forces de pressions extérieures (ou intérieures) rajoute une énergie au système qui définit donc le 
concept d'enthalpie! 
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La relation antéprécédente exprime donc le fait que lorsqu'un système évolue à pression constante, la 
chaleur reçue (ou échangée par le système avec le milieu extérieur) est égale à sa variation d'enthalpie. 


Il vient également avec cette définition une nouvelle écriture possible pour la capacité calorifique à 
pression constante très fréquemment utilisée en chimie: 


De manière plus explicite, nous avons encore pour la relation antéprécédente en utilisant la loi des gaz 
parfaits: 


ddl ddl +2 


bn ras Le 2RT 


où pour rappel (cf. chap iqu 1x Co ) le nombre de degrés de liberté ddl pour 
un gaz parfait monoatomique est de 3. Le dernier terme de cette relation n'est évidemment pas valable 
pour les fluides! 


Parfois, nous écrivons évidemment également la définition de l'enthalpie sous la forme d'une variation telle 
que: 


ÀA = AU+ PAV = RAT 


dans le < cas particulier d'application aux domaines de validité des gaz parfaits (c! 
us) en ce qui concerne le dernier terme. 


Il est important de bien mémoriser que le terme PV dans les relations précédentes représente le travail des 
forces de pression de l'atmosphère environnante sur le système ou, par équivalence, respectivement du 
système sur l'atmosphère environnante qui l'entoure. Mais la variable n est toujours le nombre de moles du 
gaz parfait du système étudié et non pas de l'atmosphère environnante. 


L'enthalpie est un concept énormément utilisé en chimie thermique (voir chapitre du même nom) et nous 
l'utiliserons sans cesse lors de son étude. 


Dans la pratique il est cependant difficile (voire impossible) de connaître l'énergie interne. Nous calculons 
alors plutôt la relation suivante pour une mole (n valant alors 1) de gaz parfait: 


H-U=RT=PV 


qui est donc une valeur strictement positive donnant l'énergie (ou plutôt le surplus d'énergie) disponible 
dans le gaz parfait à cause de la pression environnante (il n'y a qu'à poser la pression comme étant nulle 
pour le voir!). 


Exemple: 


Prenons une unité de volume molaire de gaz parfait aux conditions normales de température et de pression 
(quel que soit ce gaz parfait, son volume molaire sera dans ces conditions toujours de 24 litres selon la loi 
des gaz parfaits!). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Le travail des forces de pression qui ont été nécessaires pour amener ce gaz parfait aux conditions 
susmentionnées est alors de: 


H-U=PV 21015-10524 22" 436[J] Gin 
1 000 


ou: 
H-U=RT=293.15.831=2'436[/J] (33.122) 


qui est donc l'énergie sous forme du travail des forces (mécaniques) de pression que nous pourrions 
récupérer d'un volume molaire d'air. 


L'énergie interne sous forme de chaleur ET de travail mécanique que nous pourrions en théorie récupérer 
(le problème est de trouver comment...) de ce volume molaire est donné, pour un gaz monoatomique (voir 
plus bas pour la démonstration), par: 


ire RT= ZAT= 6[ÆJ] (33.123) 


H=Q=c#RT=U+PV= 


et nous pourrions calculer aussi l'énergie interne de liaison des électrons, et des noyaux des atomes... et 
l'équivalence masse et énergie, mais nous sortirions des cas industriels courants. 


Pour l'eau, où nous ne pouvons utiliser que la première relation, car la deuxième n'est valable que pour les 
gaz parfaits, le volume molaire étant 1'000 fois plus petit, nous ne pouvons en tirer qu'une énergie que 
1'000 fois plus petite (environ 2 [J]). Raison pour laquelle dans le cas des fluides, nous considérons qu'il 
n'y a aucune différence entre l'enthalpie et l'énergie interne. 


Voyons maintenant d'autres implications théoriques des quelques éléments vus précédemment qui nous 
seront très utiles aussi bien en acoustique (cf. chapitre de Musique Mathématique) ou en mécanique des 
milieux continus (voir chapitre du même nom). 


8.3. LOI DE LAPLACE 


Nous avons démontré dans le chapitre de Mécanique Des Milieux Continus avec le théorème du Viriel que 
l'énergie interne (énergie cinétique) d'un gaz parfait monoatomique était donnée par: 


où nous avons repris la notation du chapitre de Mécanique Des Milieux Continus (un grand N au lieu d'un 
petit n). 


Nous avons donc: 


aU = SRUT (33.125) 


Si le processus est à volume constant, nous supposerons qu'il n'y a aucun travail mécanique (force sur une 
distance) fourni (collisions inélastiques sur les parois) et alors: 
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aU = 60 + 5 = ËQy = SHUT (33.126) 


donc où dW est nul! 


Il vient alors la possibilité de calculer la capacité calorifique à volume constant: 


(33.127) 


où l'on observe dès lors, que pour un gaz parait, la capacité calorifique volumique est indépendante du 
volume!! Nous avons in extenso pour une mole: 


C 
= Ey,= 38 
N 2 33.128) 


de sorte que nous pouvons écrire pour un gaz monoatomique parfait à volume constant l'énergie: 


u=2rRdNreor (33.129) 
2 NW 


À 


ce qui permet donc de connaître dans la partique, et à partir de tables, la varation d'énergie interne d'un 
gaz en fonction de sa variation de température puisque: 


ce qui correspond évidemment à un travail fourni ou absorbé. Sous forme différentielle nous l'appelons la 
"première loi de Joule" (l'énergie interne d'un gaz parfait ne dépend que de la température): 


dU = nCydT 


Un cas intéressant de la relation antéprécédenteest de se rappeler que comme nous sommes à volume 
constant nous avons alors: 


ce qui nous permet d'écrire: 


AU = CyAT=Cy(B-7)=Cy = Ïr (33.132) 


Donc s'il y a décompression, cette dernière relation est négative. Dans ce cas le gaz perd de la chaleur au 
profit de l'environnement raison pour laquelle lors d'une détente gazeuse le récipient refroidit! 
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Si le processus a lieu à pression constante (énergie cinétique constante des atomes du gaz) alors nous 
avons (voir théorème du Viriel): 


SW =-PdV =-KNaT (33.133) 
(les collisions qui repoussent la paroi du volume font perdre de l'énergie au système d'où le signe "-"). 
Ainsi: 


dU =60p +ÜW —60h = dU -5W = SANT + HAUT = DAMIT (33.134) 


Ainsi nous pouvons aussi calculer la capacité calorifique à pression constante: 


cp=[S€) D (33.135) 
p à À 2 


où l'on observe dès lors, que pour un gaz parait, la capacité calorifique à pression constante est aussi 
indépendante de la pression!! Nous avons in extenso pour une mole: 


Cp 5 
V=——=—| (33.137) 
y 3 
avec la "relation de Mayer”: 
Re, (33.138) 
2 My 2 N4 


qui nous donne par la même occasion puisque R est positif: 
CPp>Cy (33.139) 


Si le gaz parfait est diatomique, il y a 5 degrés de liberté (3 pour la position du premier atome +3 pour la 
position du deuxième -1 pour la contrainte que la distance entre les deux est fixée) et nous avons alors: 


En faisant les mêmes développements, nous obtenons (valeur que nous utiliserons dans le chapitre de 
Musique Mathématique mais qui est utile dans de nombreux autres domaines): 
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(33.141) 


n.- 
Il 
QE 
Il 
Un 


Quand un système isolé de gaz parfait subit une transformation adiabatique à pression constante, la 
variation d'énergie interne du système sera soutirée par la variation de travail interne. Ce qui 
traditionnellement se note par un signe négatif tel que (en utilisant le résultat obtenu plus haut): 


dU =-ôW=-PdV =CyadT (33.142) 
Remarque: Attention!!! Rappelons que le choix du signe pour le travail W n'est qu'une convention de 


signe!! Ainsi, dans le présent cas d'étude il est pour tradition de mettre un "-" au lieu d'un "+". Mais 
cela ne change rien aux résultats qui vont suivre!!! 


Soit: 
PdV +CydT =0 (33.143) 


Prenons maintenant l'équation des gaz parfaits PF = » RAT (sans collisions) et différencions. Nous 
obtenons: 


PaV + FAP = NkàiT = àT = _— (33.144) 


Soit en éliminant dT entre les deux dernières relations, nous obtenons: 


PaV +VaP 


PaV +Cy O (33.145) 


Soit après simplification et réarrangement des termes: 

(AR +04 )Par + CyVaP=0 (3146) 
ce qui rapporté aux quantités de moles s'écrit (selon l'habitude des chimistes): 

(R+cÿ } pdV + ci Var = 0 (33.147) 
bref. et en nous rappelant que: 
Ch—-Cy=nR=M (33.148) 
Nous avons: 
ChPdV +CyVaP =0 (33.149) 


En utilisant la définition du "coefficient de Laplace", appelé aussi "coefficient adiabatique" déjà rencontre 
plus haut: 
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(#4 
y=—2| (33.150) 
Cy 


nous avons l'expression: 


VPAV +VaP =0 (33.151) 


En remaniant: 


Y—+—=0 (33.152) 
CE 
Nous obtenons par intégration: 
dV rdP » 
[— +|— = (33.153) 
F P 


soit: 
In(P)+ yin(f)=c" (33.154) 


qui est équivalent en utilisant les propriétés des logarithmes à: 


PYY=6c"| (33.155) 


Il s'agit de la "loi de Laplace" qui donne la relation entre pression et volume dans une transformation 
adiabatique d'un gaz (ce qui ne signifie pas que la température est constante rappelons-le mais seulement 
que l'échange de chaleur avec le système extérieur est nul ou négligeable!). Nous retrouverons d'ailleurs 
cette relation dans le chapitre de Génie Météo. 


Ainsi, nous avons aussi l'information qui peut être utile dans l'industrie: 


#2 
y2 v2 1-y - . _ 
= rar = fyrrar en 2 PET CV A 
yl yl Es à 1-7 1=y _. 
it tes 
1-7 1-y 


8.4. COEFFICIENTS THERMOÉLASTIQUES 


Si nous différencions V(P,T) nous avons (cf. chapitre de Calcul Différentiel Et Intégral): 


dy = Nr LLARTE (33.157) 
OT aP 


ou autrement écrit: 


a -[7) ar#(à) dP (33.158) 
OT /p OP }r 
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Nous avons introduit de manière naturelle dans le chapitre de Musique Mathématique un coefficient 
nommé "coefficient de compressibilité isotherme" (l'indice T indique que la température est maintenue 


constante): 


(33.159) 


que nous pouvons réintroduire ici: 


(33.160) 


ay = (Se) dT- trVaP 
dT}> 


De même il serait intéressant d'avoir un autre coefficient pour le premier terme qu'il suffirait de définir par 
analogie (l'indice V et là pour indiquer qu'il s'agit d'un coefficient volumique et le P pour indiquer que nous 
sommes à pression constante): 


y p= 


1 


F 


( 


o7 


êT 


) 


(33.161) 


appelé "coefficient de dilatations volumique isobare". 


Aïnsi, nous avons: 
av = y pVAT — YrVaP (33.162) 


Soit nous avons le travail mécanique (la différentielle totale est inexacte car nous avons plus d'une variable 
d'état) en multipliant par la pression pour avoir les bonnes unités: 


ÔW = y pPVAT - YrPVdP (33.163) 


Pour une transformation isotherme le premier terme est nul, et pour une transformation isobare, c'est le 
second qui est nul. 


Les données des coefficients thermoélastiques (mesurés expérimentalement) doivent permettre de 
remonter à l'équation d'état des gaz parfaits par intégration de V(P,T), ce qui est licite, puisque V est une 
fonction d'état. Dans le cas du gaz parfait par exemple, nous pouvons écrire par intuition des dimensions 
des constantes (nous présenterons plus loin de notre étude des équations d'état le cheminement 
mathématique inverse pour des raisons pédagogiques): 


Nous avons donc: 


et donc en multipliant par la pression: 
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Par = aT- FAP = PV +FaP = Pre (33.166) 


Ce qui conduit à: 


d(PF) = pret (33.167) 
T 
Soit: 
acrw) = M (33.168) 
PF T 


Ce qui donne immédiatement après intégration: 
PF 
In(PF)=In{f)+c" in =) =c* (33.169) 


Soit: 
PV =e"T (33.170) 
Cela dit, nous avons différencié V pour obtenir deux coefficients tels que: 
dV = aVaT- 7Va4P (33.171) 


Nous pourrions faire de même pour la pression et la température et nous avons alors au total trois 
relations: 


8 êT 
(à) ar +) dW (33.172) 
OT }y  /r 


mais parmi les 6 facteurs que nous voyons dans ces trois relations, quatre sont déjà définis (certains sont 
l'inverse des coefficients définis plus haut). Il manque par contre la définition d'un seul coefficient pour les 
deux facteurs manquants. Nous choisissons celui qui dans la pratique est le plus souvent utilisé en analogie 


avec les autres coefficients: 
1 m) | 
= —| — (33.173) 
P\ OT }y 


appelé "coefficient d'augmentation de pression isochore”. 


Nous avons ainsi les trois coefficients très utilisés dans la pratique: 
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= (à) œ (à) NES (33.174) 
ro), Por), Par), 


respectivement et dans l'ordre: 


1. Coefficient de compressibilité isotherme. 
2. Coefficient de dilatation isobare 
3. Coefficient d'augmentation de pression isochore 


Nous retrouverons ces coefficients lors de notre étude des mouvements de convections dans le chapitre de 
Génie Marin & Météo. 


9. CHALEUR 


Avant de continuer, il va à tout prix nous falloir éliminer une des deux plus grandes difficultés dans la 
bonne compréhension de la thermodynamique (mise à part celle de la différenciation entre les 
différentielles totales exactes et inexactes qui a déjà été réglée dans le chapitre de Calcul Différentiel Et 
Intégral): 


- La différence entre la chaleur et la température 
- La différence entre l'énergie-travail et l'énergie-chaleur 


Comme nous l'avons vu dans le chapitre de Mécanique Des Milieux Continus, la température caractérise 
un état d'équilibre thermodynamique et traduit l'existence d'une agitation thermique (théorème du Viriel) et 
elle peut varier lorsque l'extérieur fournit un travail # > 0. Cependant, l'expérience nous montre que c'est 
en "chauffant" un système que nous augmentons le plus aisément sa température. Mais qu'est-ce donc la 
chaleur?: 


Considérons un système thermodynamique à l'équilibre, et écrivons son énergie interne totale E comme 
étant la somme des produits de l'énergie E d'un micro-état i par la taille de la population P de ce même 
micro-état i : 


Sa variation au cours d'une transformation infinitésimale (que nous supposons à nombre de particules 
constantes) est (différentielle totale): 


ag -|°5 dE + LR dE, = S EdB + S PdE, (33.176) 
8B |, ÔE, |, i i 


1 


où dE, est le déplacement de l'énergie Æ; du micro-état i provoqué par la transformation, et 4E la 
variation de la population À de ce même état i. 


Nous avons vu plus haut que sous certaines conditions, si le système au cours de cette transformation 
infinitésimale subit une variation de travail 5j et de chaleur 8€ , son énergie interne varie de: 
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dE = dU = ÊW + 50 


Nous pouvons maintenant comparer cette dernière relation (exprimant le premier principe de la 
thermodynamique) avec celle qui la précède (découlant de la mécanique statistique) et identifier les 
termes de la manière suivante: 


dU = Y Ed? +9 PdE, = 6Q+6W 


1 1 


Examinons le cas d'une transformation dans laquelle le système reçoit seulement de la chaleur: 
OW = 0 


Dans cette situation aucun des paramètres extérieurs au système ne varie en général dans la 
transformation de sorte que 4£Æ, = 0. Nous en déduisons: 


6Q = > EdB 


1 


Ainsi, lorsqu'un système reçoit seulement de la chaleur, son énergie varie par modification des populations 
de ses états microscopiques: si la quantité de chaleur reçue est positive, la probabilité des états d'énergie 
élevée augmente, au détriment de celle des états de plus basse énergie. Enfin, si nous tenons compte que le 
système doit être à l'équilibre (l'état le plus probable comme nous l'avons démontré dans le chapitre de 
Mécanique Statistique) dans les états initial et final de la transformation, nous constatons, comme nous 
pouvions nous y attendre, que la température du système varie: elle a augmenté si la quantité de chaleur 
reçue est positive (cela se démontre en choisissant une distribution canonique pour décrire les états 
d'équilibre macroscopiques du système). 


Cela explique la confusion fréquente entre ces deux concepts très différents que sont température et 
chaleur. Cette confusion est accentuée par le décalage entre le langage quotidien et la terminologie 
scientifique. Dans le langage quotidien, lorsque nous parlons de chaleur d'un corps, nous affirmons en 
réalité que sa température est élevée. La confusion est regrettable parce que la notion de chaleur est bien 
présente en physique mais sa signification est autre. 


Ainsi, chauffer un système, c'est lui fournir de la chaleur, c'est augmenter son énergie interne (le nombre 
de micro-états de haute énergie) par des moyens qui ne sont pas purement mécaniques. La chaleur est 
donc une forme d'énergie particulière! 


9.1. ENTROPIE 


Un système macroscopique isolé tend vers l'équilibre. Il l'atteint en un temps fini (qui peut être 
extrêmement grand). L'état d'équilibre est unique: les exceptions à cette affirmation sont trop spéciales 
pour mériter une digression. 


L'existence même d'un état d'équilibre est fondamentale pour la thermodynamique. Cependant, le 
processus de marche à l'équilibre ne résulte pas d'un dogme: il ne doit pas en exister en physique! Comme 
toute autre loi, il est soumis à vérification et doit être analysé. Une question, notamment, se pose: quelle 
est la contrepartie microscopique de la marche à l'équilibre, processus macroscopique. 
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Nous avons vu dans le chapitre de Mécanique Statistique que par définition: l'état d'équilibre est l'état qui 
correspond au plus grand nombre de configurations (micro-états) et est l'état le plus probable. 


Ce qui nous avait amenés à la relation suivante: 
S= Aln(Sà (33.181) 


où S représente l'espérance statistique de l'information sur les micro-états et que nous avions appelée 
"entropie”. Il est évident que S a les unités de 4 qui comme nous l'avions montré est une constante. 


La question qui se pose alors en thermodynamique est: quelle est la constante qui permet de caractériser 
pour un gaz, fluide ou solide l'espérance mathématique du nombre des états. 


Il vient alors en regardant toutes les relations qui existent en thermodynamique qu'une seule constante 
apparaît systématiquement dès qu'il s'agit de caractériser un état thermodynamique. Il s'agit de la constante 
de Boltzmann: 


À = k = 13806. 10 2 [Y K*] (33.182) 


Donc S a les unités correspondant au rapport J/K qui permet donc de mesurer le degré de désordre d'un 
système au niveau microscopique. Intuitivement: plus l'entropie du système est élevée, moins ses éléments 
sont ordonnés et capables de produire des effets mécaniques, et plus grande est la part de l'énergie 
inutilisée ou utilisée de façon incohérente. 


L'entropie est une grandeur extensive. Effectivement, nous avions montré que le choix du logarithme dans 
la loi de Boltzmann venait de ce que l'entropie d'un macro-état était l'espérance de l'ensemble des micro- 
états: 


il 


pe fe 3] 


eh. go)- CRE 


ce qui nous avait amenés à: 
S= Aln(Sà (33.184) 
et montre bien que l'entropie est une grandeur extensive car sommable sur les micro-états (complexions). 


Ce qui reste difficile maintenant c'est de savoir si l'énergie dans les unités de l'entropie provient du travail 
W, de la chaleur Q ou des deux? Au fait la réponse est simple car dans notre développement de la loi de 
Boltzmann, à aucun moment le système (idéal) étudié n'a fourni un travail (mécanique). Donc la seule 
énergie mise en cause est celle de la chaleur. 


Ainsi: 
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Or, l'entropie ne peut pas être donnée en toute rigueur par: 


5-40 
AT 


car c'est la définition de la chaleur spécifique. Par ailleurs, si le lecteur se rappelle de nos développements 
en Mécanique Statistique, l'étude se faisait dans un système isolé avec deux cavités. Donc si le passage 
d'une cavité à l'autre se fait très lentement (de façon à ce qu'il n'y ait pas une détente du gaz) la 
température restera constante (détente isotherme). Ce qui implique donc la définition (nous retrouvons 
donc la forme discrète du deuxième principe de la thermodynamique déjà introduit au début de ce 
chapitre9: 


As = 8 
T 


Pour passer à la forme différentielle, il convient de se rappeler que la chaleur Q est une différentielle 
inexacte. Donc pour une transformation réversible: 


Donc l'entropie est une différentielle totale exacte (la chaleur dépend de la manière dont se fait la 
transformation, mais S ne dépend que de l'état final et initial de la chaleur Q) et comme: 


S= Aln((} > 0 


as = 2 > 0 
T 


Si le système est dans une transformation adiabatique (sans échange de chaleur et de travail avec 
l'extérieur) alors le numérateur est nul et l'entropie est in extenso nulle aussi (raison pour laquelle un 
système adiabatique et forcéement isentropique!). Sinon, le système prend de l'entropie à l'Univers dans 
une évolution naturelle. 


Nous avons finalement: 


Ce qui signifie que l'entropie (espérance de l'information intrinsèque) dans un système en contact avec 
l'extérieur ne peut qu'augmenter ou rester constante. 


Ce qui est important c'est que tout processus (non adiabatique) convertissant de l'énergie d'une forme en 
une autre dans un système isolé en perd obligatoirement une partie sous forme de chaleur. 


En ce qui concerne l'Univers. toute la question est de savoir s'il s'agit d'un système thermodynamique 
isolé ou non... Mais comme par hypothèse le Big Bang a engendré le temps et l'espace (puisque la 
relativité montre que espace et temps sont indissociables), alors rien n'existait avant lui puisque le temps 
n'existait pas avant. et il n'y avait pas d'espace puisque c'est le Big Bang est à l'origine. Donc il n'y rien 
autour (par hypothèse..). 


Nous avons alors la relation très utile en mécanique des fluides (et en cosmologie): 


aU = 60 +5 =TaS - PaV 
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qui se nomme "identité thermodynamique" relative à l'énergie interne U ou encore "fonction 
caractéristique d'un fluide à l'équilibre" ou plus souvent "équation fondamentale de Gibbs" (on remarquera 
au passage qu'il s'agit d'une somme de produits de grandeurs intensives et extensives). Si la quantité de 
matière n'est pas constante (matière insérée ou extraite du système), cette dernière relation s'écrit alors 
pour une variation de dn moles: 


dU = TaS - PdV +jidn (33.192) 


où 4 est un coefficient de proportionnalité qui porte le nom de "potentiel chimique" et qui peut être donc 
mesuré de par le fait que la relation précédente amène à la définition que: 


fe) | 
=|— 33.193 
on SF Ù 


qui dit que le potentiel chimique est l'énergie dont varie le gaz lorsqu'on lui injecte ou retire dn mole de 
gaz, tout en gardant constant le volume de l'enceinte et en interdisant les échanges de chaleur avec 
l'environnement. 


On retrouve souvent dans la pratique la relation antéprécédente sous la forme suivante après 
réarrangement (et en supposant la quantité de matière constante): 


dS = an (33.194) 
2 


Cette dernière relation est souvent assimilée au premier principe de la thermodynamique pour des 
systèmes fermés dont la variation d'énergie potentielle et cinétique globale est constante. 


Remarquons qu'en utilisant le relation qui lie la varation d'énergie interne d'un gaz parfait monoatomique 
en fonction de sa variation de température à volume constant démontrée plus haut (première loi de Joule): 


dt = CyaT (33.195) 
et l'équation des gaz parfaits (cf. chapitre de Mécanique Des Fluides): 


PF =2RT (33.196) 


Nous avons alors en utilisant la capacité calorifique molaire à volume constant (se rappeler que nous ne 
pouvons l'injecter dans cette relation que pour un gaz parfait car elle est alors indépendante du volume!): 


ds LE LL (33.197) 
T Fm 


Et donc en intégrant entre deux états, il vient: 
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2 2 2 


2 
AS = [as = CERTES nMT 4 [,r 
T WF  : CR F 
1 il 1 1 
20T dv 7, y, (33.198) 
BOUCLE IniTiË +rRin (WE =ACY DE rue (7 
17 rad ZI F 


Soit la variation d'entropie d'un gaz parfait à pression constante: 


T F: 
ÀS' = xcy [à +2Rin ä) (33.199) 
f ñ 


Et comme nous avons démontré aussi plus haut que: 
3 
ch = 2" (33.200) 


Il vient alors en utilisant aussi les propriétés algébriques du logarithme: 


2h22 ha 
2 7 ñ 2 17 F 
3 3 
= #Rlinll2 À letol 2 1e pri 2 2.23 
7 ñ z ñ 


Et comme dans la pratique il est plus facile de mesurer une pression qu'un volume, nous avons en utilisant 
la loi des gaz parfaits où à température constante: 


(33.201) 


le résultat suivant très important dans la pratique considéré comme la variation d'entropie d'un gaz parfait 
à volume constant: 


3 


T,\2 EP 
ÀS = #kRin a 22 (33.203) 
Æ A 


Pour l'une et lautre des deux relations, il vient bien évidemment dans le cas isotherme que: 


puisque la rapport des deux températures est égal à l'unité. 
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9.1.1. ÉCOULEMENT DE LA CHALEUR 


Maïntenant que nous avons introduit les notions élémentaires de la thermodynamique, faisons de suite un 
exemple d'application très important des premier et deuxième principes de la thermodynamique. 


Considérons deux systèmes fermés 1 et 2 étant en contact thermique et formant un système total qui est 
supposé isolé thermiquement de l'environnement. 


isolation 


} 


Figure: 33.3 - Système total isolé avec deux sous-systèmes en contact 


Dans les deux systèmes, il n'y a pas d'éléments mécaniques, comme des pistons ou autres, qui peuvent 
travailler. Donc: 


OM = ÔW = OW = 0 (33.205) 


Les conditions et les hypothèses étant posées, nous utilisons les ingrédients de la thermodynamique pour 
faire notre recette. Il vient alors par application du premier principe tel que démontré plus haut dans un 
premier temps pour l'ensemble: 


Ut = dUi +aU; 
dUynt = 6Qpot + Was = 0 (83.206) 
D 


Dont nous déduisons que: 
dUi +dUj =0 (33.207) 
Nous avons aussi pour chaque sous-système: 


6 = 0 = dU, - 60 


(33.208) 
SW = 0 = dUn - 60 


D'où nous déduisons de ce dernier système d'équations en sommant: 
dU, +dU = 6Q +603 (33209) 


et comme nous avons démontré juste avant que: 
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dUi +dU3 =0 (33.210) 
Il vient: 


dU +dU3 =0= 60 + 602 (33.211) 


et donc: 


ÊQ =—-002 (33.212) 


Appliquons maintenant le deuxième principe (principe d'évolution). Nous avons: 


ô ô ô 
dSe = di +48) _ 50 , 502 _ or 
A DB T 
Or avec la relation antéprécédente, nous avons: 
ô —ô 1 1 
dSt = 5e ei _ Ê5|—-—| (3214) 
E % FE % 


Nous avons maintenant deux scénarios possibles, pour le premier, nous avons: 


B >7 (5-2) (33.215) 
Z 


et lorsque: 
PB > — 60 >0 (33.216) 
Donc: 
dStpt > O (33.217) 


Pour le deuxième scénario, nous avons: 


A >D (5-2) (33.218) 
Z 


et lorsque: 
ZA >B — 6Q <0 (33.219) 
Donc: 


dStpt > O (33.220) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Nous concluons que quoi qu'il arrive, l'entropie augmente pour un système isolé. Ce résultat est donc 
conforme à ce que nous avions communiqué lors de notre présentation du deuxième principe. Donc ce 
résultat démontre l'impossibilité d'une machine thermique ditherme isolée fournissant un travail perpétuel 
puisque l'entropie ne peut faire qu'augmenter dans tous les cas! 


Nous voyons aussi comme nous l'avons déjà mentionné que l'entropie définit la flèche du temps dans 
l'Univers (ou inversement). 


9.2. CYCLE DE CARNOT 


Le cycle de Carnot a pour objectif principal de calculer le rendement thermique d'un cycle 
thermodynamique d'une machine ditherme très idéalisée…. (donc le modèle est très éloigné de la pratique!) 
basée sur une source de chaleur à laquelle nous prenons de la chaleur pour la transformer en travail et 
ensuite pour laquelle nous utilisons du travail afin de lui fournir de la chaleur et ainsi de suite en boucle 
(penser à une locomotive par exemple!). Nous parlons alors de "cycle réversible". 


L'idée est assez simple. mais comme toujours il fallait y penser! Pour information nous avons choisi une 
approche mathématique du cycle de Carnot qui permet de se soustraire de toute intégrale est qui est plus 
proche du raisonnement fait à l'époque de Carnot par Carnot lui-même. Cette approche peut donc faire 
hérisser les cheveux à certains lecteurs. 


Du point de vue de l'énergie interne, sur un cycle thermodynamique, il n'y aura pas eu de variations 
(puisqu'à chaque début de cycle nous devons nous retrouver dans la situation du cycle précédent). Donc: 


AU =0 


Il s'agit jusqu'ici simplement du rappel du principe de conservation de l'énergie (premier principe de la 
thermodynamique). 


Ce qui implique que sur un cycle le bilan de la chaleur ©, empruntée à la machine pour produire un 
travail (mécanique) #, et de la chaleur Q; réinjectée ayant nécessité un travail (mécanique) jf est nul 


tel que sur un cycle: 
Q +0; +W, + = 0 


ou évidemment ce qui est emprunté aura, comme il est d'usage, un signe positif et ce qui est injecté un 


C+Q+W-08W--(Q +0) 


Le rendement thermique # est par définition le rapport de ce que la machine peut donner réellement 


donner sous forme de travail (donc le différentiel entre ce qu'elle a donné #,, et ce qu'on doit lui donner 


pour qu'elle fonctionne F7) sur la chaleur que l'on lui a injecté (à l'aide du travail #7). Donc: 
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+] pr Hia+o) o+a 


RE a a 2, 


ce qui est toujours inférieur à l'unité (et supérieur à 0) puisque la quantité de chaleur extraite (signe positif 
par convention) est obligatoirement inférieure ou égale à la quantité de chaleur injectée (signe négatif par 
convention). 


Or, nous avons démontré que dans la condition d'une détente isotherme ou compression isotherme (donc le 
cycle est supposé comme étant très lent dans le modèle de Cournot), nous avions: 


AQ=TAS (33.225) 


Or, dans notre cas ©, ,@, sont en réalité un abus de notation courant en thermodynamique car il s'agit de 


variation de chaleur (nous devrions noter objectivement AG, AO, ). Nous avons alors pour le rendement 


thermique réversible à compression ou détente isotherme: 


étant donné que dans une transformation thermodynamique quasi-statique la variation d'entropie ne 
dépend que des valeurs initiales et finales de température (les variations intermédiaires étant considérées 
comme nulles puisque infiniment petites car infiniment lentes) elle tend alors à être une transformation 
réversible. Il vient alors: 


ÀS, =—AS; (33.227) 


et donc nous avons pour le rendement thermique réversible à compression ou détente isotherme: 


Des | 
Il 
—t 
| 
HIS 
N2 


La transformation étant quasi-statique, la relation obtenue est bien évidemment l'efficacité maximale 
théorique pour un moteur fonctionnant entre ces deux températures. Elle n'est donc jamais atteinte dans 
un cycle réel. Nous disons alors que le "rendement de Carnot" est un maximum (l'entropie injectée étant 
dans un cas réel toujours plus grande que l'entropie extraite par construction!). 


Dans le cas d'une machine à vapeur d'eau, l'efficacité théorique maximale serait donc (ne pas oublier que 
la température est en Kelvin et donc toujours positive!): 


Te _;_ 298 


m=1-<=1 =0.2=20% (33.229) 
L 3 


Par exemple dans le cas d'une central nucléaire à eau sous pression, nous trouvons le fameux rendement 
souvent mentionné dans la presse: 
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Z _,_ (G5+273) 
7 (285+ 279 


= 45% (33.230) 


Le rendement réel de la conversion de la chaleur des fissions en électricité est de l'ordre de 33% seulement 
car le rendement réel est toujours inférieur au rendement théorique maximum. 


Remarque: Nous pouvons noter en passant l'intérêt du condenseur. Si on laissait s'échapper à 
l'atmosphère la vapeur sortant des turbines, d'une part on perdrait une eau purifiée au lieu de la 
recycler, d'autre part on aurait une température de source froide plus élevée: 100 [°CT au lieu de 
35 [°C] on perdrait alors environ 12% sur le rendement de Carnot. 


Nous retrouvons enfin implicitement également l'un des énoncés historiques du second principe de la 
thermodynamique en envisageant le cas où 7, = 7. Dans ce cas, l'efficacité est nulle et le moteur ne 


fournit donc aucun travail. 
10. RELATIONS DE MAXWELL 


Revenons dans un premier temps à ce que nous avons déjà rappelé un peu plus haut mais en nous 
restreignant à deux variables. C'est-à-dire à la différentielle totale exacte: 


ox 


de = Mix + y = Eat Ed [€ a+[à dy (33.231) 
ôx @ } d x 


Nous avons donc aussi: 


En insérant dy dans dx: 


ou encore: 
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comme les termes entre parenthèses sont des fonctions et que dx et dz sont par contre arbitraires, la seule 
solution à cette relation est: 


BE BEL EL « 


Multipliant la deuxième relation par (&/ &x), 


CIÉÉROIERES 
x , > | es 1 x , & , (99.209 
a) a) 2) +1=0 (33237 

0x jy \® /, \E } 


Venons-en maintenant aux faits. Rappelons l'équation fondamentale de Gibbs: 


Nous avons alors: 


dU =TaS — PdW (33.238) 


relation très utile dans les fluides où la pression est constante et la variation de chaleur se fait par celle de 
l'entropie. Ainsi que la relation définissant l'enthalpie: 


dont nous allons modifier la différentielle: 
dH = dU+WadP+PdW (33.240) 
et y injectant (premier principe): 
AU = 6Q-— PdW (33.241) 


nous avons (remarquez que si la transformation est isobare la variation d'enthalpie représente alors 
uniquement la quantité de chaleur reçue par le système fermé): 


dH = 60 +VaP (33.242) 
et en y injectant l'entropie (deuxième principe) nous obtenons: 
dH =TaS+VaP (33.243) 


Ainsi, en ayant juste rajouté PV à l'énergie interne U nous avons bien une fonction d'état (H) où nous 
maïîtrisons la pression et l'entreprise comme variables indépendantes, alors que pour U seule, nous 
maîtrisons l'entropie et le volume en tant que variables indépendantes. Nous 


Nous allons donc utiliser les deux relations suivantes qui vont nous être utiles: 
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dU = TaS - PaV _ 
dH=TAS+VaP 


Nous introduisons maintenant une nouvelle quantité que nous appelons "énergie libre" (celle qui est 
réellement disponible dans le système) et qui sera donnée par la "relation de Gibbs-Helmholtz": 


(83.245) 


et donne simplement la différence entre l'énergie interne et l'énergie calorique dissipée à cause de 
l'entropie à une température donnée. L'idée étant cette fois de contrôler le volume et la température 
comme variables indépendantes (voir juste un peu plus bas lorsque nous en prenons la différentielle), ce 
qui est bien évidemment une situation des plus importantes en chimie! 


Nous introduisons également une autre nouvelle quantité que nous appelons "enthalpie libre" (celle qui est 
réellement disponible dans le système) et qui sera donnée identiquement par: 


G= A-TS| (33.246) 


qui est simplement la différence entre l'enthalpie et l'énergie calorifique dissipée à cause de l'entropie à une 
température donnée. 


Nous avons donc pour l'énergie libre la forme différentielle: 
dF =dU-SiT-TasS (33.247) 
en y injectant le premier principe et deuxième principe: 
dF =(6Q- PdV)- SAT -TasS = (TAS - PdV)- SdT - TS =-PadV - SAT (33.248) 


Ainsi, nous voyons que si la transformation est isotherme dF se réduit au travail reçu par le système fermé 
(puisque 4dT est alors nul). 


De même pour l'enthalpie libre: 
dG = dH-SaiT-—'TAsS (33.249) 
en y injectant: 
àG =(TdS +WadP) - SiT - TaS = WdP-—SaàT (33.250) 


Par conséquent, dans le cas d'une transformation isotherme et isobare la variation d'enthalpie libre est 
nulle. 


Nous avons donc quatre relations: 


aU =TaSs - Pda 

d'A =TaS +VaP . 
dF =-—FdV - SaT 

àG =VaP-SaT 
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appelées "équations de Gibbs". 
Nous remarquons que ces équations sont toutes de la forme: 


dz = Maäx+ Ndy (33.252) 


Or, rappelons que selon le théorème de Schwarz (cf. chapitre de Calcul Différentiel Et Intégral) si dz est 


bien une différentielle totale exacte, nous avons alors: 


a E 
—| =|— | (33253 
y : ox ; 


Ce qui nous donne les quatre relations: 


| 3 
Le | 
Re 
t 
Il 
eee 
CAL: 
rt” 
+ 


(33.254) 


Il 
PTS 
D | 
S18 
Lu, 
4 


NS NN 
$ 318 RIS & 


Gr), ="(ér) 


Par ailleurs, par la définition même des dérivées partielles et des quatre relations: 


dU =TAS — Pa 

dH = TasS +VaP | 
(33.255) 

dF =-—PaV - SiT 

àG =VaP - SàT 


nous avons: 


Toutes ces relations sont mises à profit pour calculer les variables thermodynamiques non directement 


mesurables à partir des données expérimentales. 


Pour clore les définitions de ces variables thermodynamiques, indiquons le fait que d'avoir posé: 
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H=U+PF 
F=U-TS (33.257) 
G=H-TS 


ou autrement dit, le fait que pour tout couple X, Ÿ de variables conjugées et une fonction 
thermodynamique f nous posions: 


s'appelle une "transformation de Legendre" (voir pour les détails mathématiques de la transformation le 
chapitre de Mécanique Analytique). Ce type de transformation permet donc de modifier l'ensemble des 
variables indépendantes pour avoir un ensemble de variables mieux adaptées au problème considéré. 


Maïntenant voyons une relation qui nous sera utile en météorologie!: 


Nous savons que la chaleur spécifique est donnée par définition à pression constante par: 


Maintenant rappelons que l'enthalpie s'écrit: 
dH =TaS +VaP (33.261) 


comme dS est une différentielle exacte, nous pouvons l'écrire en fonction des paramètres de température 
et de pression seuls: 


s-[à) aT(à) dP (33.262) 
OT /p 8 }/r 


Nous avons donc: 


d#H =T (&) ar (à) dP +rp=r(à) àT + r(S) +ÿ |dP (33.263) 


Comme par ailleurs dH est une différentielle exacte, nous pouvons aussi l'écrire en fonction des 
paramètres de température et de pression seuls: 


an = (97) ar4(à) aP= CaT+ (SE) dP (33.264) 
OT }h 8 }r OP }r 


Nous avons alors les deux relations à identifier: 
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an-7[S) aT+ (Se) +y |aP 
ST ) æ), 

an = CAT (SE) dP 

æ), 


Il vient alors: 


(5) ee r(S) +r-[à) (33.266) 
aT p aP r 9P T 


11. ÉQUATION DE CONTINUITÉ 


Considérons de manière générale un système ouvert, limité par une frontière £ quelconque (déformable 
ou non) et animé d'un mouvement quelconque (en déplacement ou immobile) par rapport à un référentiel 
considéré comme fixe. 


Ce système, qui est représenté sur la figure ci-dessous, est susceptible de transférer de l'énergie (ou de la 
masse) entre lui-même et l'extérieur. Ce système peut être inertiel ou non. 


Soit une grandeur extensive À (comme la masse ou la charge). La grandeur quantitative correspondante est 
a (elle peut exprimer par exemple l'isotropie ou l'anisotropie du système). 


Z 


frontière 2 


volume 


grandeur À 


X 


Figure: 33.4 - Système ouvert en mouvement ou non dans un référentiel et transférant de l'énergie 


D'une façon générale, la valeur de À à l'intérieur du système est, à un instant quelconque: 
A= [[fe"< ‘a (33.267) 


£ étant la densité de la grandeur extensive A. 


Le taux de variation spatial de À est donné par la dérivée dA/dt. Les causes de variations de A peuvent être 
liées à deux phénomènes différents: les flux et les sources ou puits. 
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En comptant positivement ce qui entre dans le système, le flux de À à travers la frontière 2 est donné par 
l'intégrale de surface: 


NN 


FS —. 


dans laquelle nous définissons: 
- æ comme le vecteur flux surfacique (ou le vecteur densité de courant) total relatif à A 
- 45 comme l'élément de frontière, exprimé par un vecteur normal à la surface et dirigé vers l'extérieur 


Remarquons que, contrairement à l'acceptation usuelle en physique, le concept de flux contient déjà la 
dérivation par rapport au temps. Par ailleurs, afin d'alléger le texte, l'expression vecteur flux surfacique est 
réduite au terme flux dans tout ce qui suit. 


Ce flux peut être décomposé en plusieurs flux, selon la relation: 


… 


= -&, + =, + (33.269) 


[a 


Le terme , est un flux par déplacement absolu, caractérisant un flux lié à un écoulement fluide. Nous 


avons la relation: 
P, =£2'a'v, (33.270) 
où ÿ, est la vitesse absolue d'une particule fluide par rapport au référentiel fixe. 


Le terme 4 est un flux par déplacement apparent, mis en jeu seulement lorsque la frontière £3 se 


déplace (par exemple si le volume V est en révolution). Nous avons la relation: 


D, =p'a'ÿ, (33.271 
où Ÿ, est la vitesse apparente de déplacement (dans le sens déformation!) d'un point de la frontière &2, par 
rapport au référentiel fixe. 


Le terme , est le flux total par conduction, caractérisant un flux lié à un phénomène de transfert de 


proche en proche, sans déplacement fluide (par exemple: conduction thermique, conduction électrique, 
travail mécanique). 


Le terme #, est un flux par déplacement relatif, résultant à la fois du déplacement du fluide et de celui de 
la frontière £. Nous avons la relation: 


où ÿ, est la vitesse relative d'une particule fluide par rapport à un point bien défini de la frontière &. En 


vertu du principe de composition des vitesses (vitesse absolue est la somme de la vitesse relative et de sa 
vitesse apparente), nous avons: 


she 


y, 
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"Va. 


Lorsque la frontière { est traversée par un fluide, le débit-masse élémentaire (c'est la masse qui nous 
intéresse le plus souvent en physique donc £ sera une densité massique) est: 


où #, désigne la portion de frontière £ traversée par le débit masse (ou fluide). 


Si nous comptons positivement l'effet d'une source, le taux d'augmentation de À est donné par: 


ESS (33.276) 


où # est le flux volumique d'une source de A. 


En tenant compte à la fois des flux et des sources, nous avons le taux de variation spatial de A: 


. = ‘1h dS dl Ld (33.277) 


Le bilan spatial de À est finalement exprimé par la relation: 


A ” 
— = ffadM + [[D o4dS$ + W (33 278) 
di Il Il € [fé (33.278) 


Dans le cas particulier d'un système en régime permanent (par exemple dans le cas d'un fluide qui s'écoule 
ou d'un solide qui est le siège de conduction thermique, de conduction électrique, de réaction nucléaire.…), 
toutes les grandeurs locales sont constantes en tout point du système. Si, de plus, nous choisissons une 
frontière & indéformable, il est possible de raisonner par rapport à un référentiel lié au système. Nous 
avons alors, en tout point fixe du système par rapport à ce référentiel: 


p=c;a=ct;W=c* (33.279) 


Il en résulte pour l'ensemble du système: 


Donc dans le cas particulier d'un système en régime permanent, avec une frontière indéformable €, liée 
au système, le taux de variation spatial de toute grandeur extensive scalaire est nul. 
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Le taux de variation uniquement spatial de À est: 


Le — se a'dW = ge a) + [[ "a (33.281) 


La variation élémentaire du volume V est due au déplacement (au sens de la déformation!) de la frontière 
& , de sorte que 


d(4V) = d(dV) = (dS ov,]dt (23202) 


Dès lors nous pouvons écrire que: 


fe zur) “(fe a+ (af eÿ,)at - és co 


nous avons donc: 


pe ar È [T$ odS (33.284) 


En prenant en compte les flux des sources et des puits, nous avons: 


fr (ea) dv = > as ff [té &)od8 + [f# dV (33.285) 


Le théorème de Gauss-Ostrogradsky (cf. chapitre de Calcul Vectoriel) va nous permettre d'écrire 
l'intégrale de surface en une intégrale de volume, et en groupant tous les termes sous le même signe 
intégrale, nous obtenons: 


Lei + 


psc (88) 


Comme les limites d'intégration (frontière {2 ) sont arbitraires, l'expression entre crochets est 
identiquement nulle. 


dV =0 (33.286) 


Considérons maintenant que la grandeur extensive scalaire soit la masse M, nous avons alors: 


avec 4 =. 


Comme la masse n'est pas susceptible d'être transférée par un phénomène de conduction (dans un cas 
classique (non quantique)), nous avons #, qui est nul. Comme la masse est conservative, il n'y a ni 


source, ni puits de masse de sorte que # est également nul. 
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Nous avons dès lors: 


La relation: 


BP (ps j=0) (33.290) 


est appelée "équation de continuité" ou encore “équation de conservation (de la masse)". 


Le signe "-" est ici car nous avons défini le flux entrant comme étant positif. Il est possible que dans la 


littérature ainsi que sur ce site, vous trouviez un "+" à la place de ce signe. 


Il y a une autre forme beaucoup plus fréquente sous laquelle nous trouvons l'équation de continuité. Le 
lecteur aura remarqué que le terme 2, a les unités d'une densité de surface de courant massique 


(Kg'm?s"1) ce qui nous amène en analogie avec l'électronique (cf. chapitre d'Électrocinétique) à noter: 


(2%, i=j (33.291) 


Ce qui ramène l'équation de continuité à: 


11.1. ÉQUATION DE LA CHALEUR 


Appliquons maintenant ce résultat à la diffusion de la chaleur. 


Comme pour l'équation de conservation de la masse, nous pouvons écrire pour la chaleur dans le cas 
d'absence de sources: 


#68, =0| (33.293) 
dé 


où q est la quantité de chaleur par unité de volume (ne pas l'oublier sinon nous aurions pris un Q 
majuscule!) et D, le flux de chaleur dont la quantité entrante a été définie comme négative. 


Une variation de température entraînant une variation de la quantité de chaleur est définie en première 
approximation par la loi physique suivante (cela découle de la définition de la chaleur spécifique massique 
aussi..): 


dq “pe dT (33.294) 


où #© est la densité de matière et c, est la capacité calorifique massique. Ou de manière équivalente 


(puisqu'en thermodynamique, comme nous l'avons déjà précisé les minuscules sont rapportées à la masse): 


dQ = pCat 
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Le flux de chaleur étant trivialement induit par une différence spatiale de température, nous obtenons 
alors la "loi de Fourier" qui exprime le flux de chaleur proportionnellement au gradient spatial de 
température: 


D, =-L'V'T| (33.295) 


Le signe "-" étant simplement dû au fait que le flux de chaleur va du plus chaud au plus froid et « est le 
"coefficient de transport de la chaleur" exprimant la "conductivité thermique" du matériau dépendant des 
propriétés atomiques de la matière (cf. chapitre de Mécanique Statistique). 


En insérant les deux précédentes relations dans l'équation de conservation de la chaleur, nous avons: 


PT 4 G o(- 97) -0 
(33.296) 

ME GG T)-0 

dé P'c, 


De façon plus esthétique et générale, nous la retrouvons sous la forme condensée de "l'équation de 
diffusion de la chaleur" ou appelée plus sobrement "équation de la chaleur": 


êT PT 


m0 (03207) 


Gr 8x° 


où le coefficient de proportionnalité est appelé dans le cadre de la chaleur: "coefficient de diffusion 
thermique": 


Il est possible de démontrer son origine microscopique comme nous l'avons fait dans le chapitre de 
Mécanique Statistique. 


Il faut cependant toujours faire attention aux unités de # suivant que nous travaillons avec la capacité 
calorifique massique c,, ou la capacité calorifique C au dénominateur! 


Donc sous forme totalement explicite, nous avons en une dimension: 


2 
2 (33.299) 
84 £Cy 0x 
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Remarques: 


R1. Nous retrouverons cette équation dans le chapitre de Méthodes Numériques pour introduire le 
lecteur au concept de résolution d'équations différentielles par la méthode des éléments finis avec un 
exemple de résolution avec MS Excel. 


R2. C'est en étudiant cette équation que Fourier a introduit les séries et la transformée qui portent son 
nom, et qui sont devenues si importantes dans l'étude des phénomènes de propagation/diffusion. 


R3. L'équation de diffusion se retrouve dans de nombreux domaines (thermodynamique, fluides, 
finance...) et il existe une littérature considérable sur les différentes solutions de cette équation 
différentielle du second ordre. Dans le chapitre d'Analyse Fonctionnelle nous montrerons comment 
résoudre cette équation avec la transformée de Fourier et la transformée de Laplace. 


Insistons sur le fait que toutes les relations du type: 


sont appelées "équations de diffusion" du paramètre physique D. Nous allons tout de suite voir comment 
la résoudre en prenant comme exemple l'équation de diffusion de la chaleur et cela nous permettra aussi 
de comprendre pourquoi Fourier a introduit la fameuse transformée qui porte son nom. Mais rappelons au 
lecteur que nous la retrouvons dans de multiples contextes ( | ue). 


Remarque: Cette équation (du moins sa forme et donc l'étude de sa résolution!) se retrouve dans des 
domaines inattendus comme dans la diffraction en physique ondulatoire, dans l'équation de 
Schrôdinger en physique quantique, en finance dans l'équation de Black & Scholes, en électrocinétique 
dans le domaine des résistances, dans l'étude de la propagation des champs électromagnétiques dans la 
matière, dans l'étude des réactions en chimie, en neutronique nucléaire, etc. 


Résolvons donc la forme générale de l'équation de diffusion:: 


Pour résoudre cette équation différentielle du second ordre, nous allons utiliser la méthode de séparation 
des variables (cf. cha gral) plutôt qu'en attaquant directement par les 
transformées de Fourier (qui nécessite à démonstration préalable du théorème de convergence dominée 
qui me fait horreur). 


Nous supposons dès lors en utilisant la méthode de séparation des variables que: 
u(x,£) = X(x)T(Ë) 
où T(t) par le principe du second principe de la thermodynamique doit diminuer lorsque t croît. 


Nous avons avons: 
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du : OX(x)T(E) | _ #() AC) 79 + x (x EE - x°T 

ok æ O6 ôE (33.303) 

2 2 2 2 99.909 
or, AO 7494 x D TT 
& & De De 

d'où l'équation de diffusion: 
2 2 
Ou Ou OT po À (33.304) 


Ce qui peut s'écrire en posant que chacun des expressions à gauche et à droite de l'égalité sont assimilables 
à des fonctions: 


GE) = F(x) (33.306) 


donc pour que l'égalité soit vraie pour tout t et x les fonctions G et F doivent être constantes. Donc nous 
avons le droit d'écrire: 


Le fait d'écrire la constante négative et au carré est une simple anticipation du résultat historiquement déjà 
connu... Mais pour comprendre pourquoi la constante est obligatoirement négative, il suffit de penser que 
que T ‘est obligatoirement négatif (la température d'un système isolé ne va pas augmenter tout seul mais 
naturellement diminuer selon le principe de l'entropie) et comme D et T sont positifs alors in extenso. 


Ce qui nous donne le système de deux équations différentielles indépendantes du deuxième ordre: 


X"+A2X = 0 
(33.308) 
T'+ A DT = 0 
que les américains écrivent sous sous la forme suivante: 
x 2 
x +A Æ=0 
(33.309) 
R+ADT=0 


Nous résolvons la deuxième équation différentielle: 


1_8TC) _ 


_— -A2D=in(ft)y=-A22Dt+c" (33310 
TO à (T(£)) | ) 


Donc: 
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— À? e — À? er 29 9 
T{£) =£ Àë Dé+c'e = eg À Dr = A(A}e 4 D (33.311) 


Pour la première équation différentielle: 


8X(x)° 
x? 


+4 X(x)=0 (83312) 


Nous avons alors le polynôme caractéristique: 


Soient les racines: 


n2=+ L_ 32 =+;1 (83314 


Donc comme le discriminant est négatif (cf. chapitre de Calcul Différentiel Et Intégral): 
X(x) = A e (Ax+c'e) +8 (De Ax+EE) (33.315) 


Soit: 


ilAx+c"| 


+B'Aie 


_ 32 ae à 
u(x,0 = TOX(» = A(Ale À Di [ataie ilAx+e ) 


(33.316) 


| Ax+c® | —iAx+c*| | _ 32 
[ais F4 (4e NV } 42 


Si nous mettons l'exponentielle des constantes en exposant dans les facteurs tel que: 


G (4)Æ" = Ci (4) 
Cn (Ale *" = € (4) 


cela simplifie l'expression: 
| ; 1 ee - 72 
u(x,t) = [Ci (4) 47 +0 (je Axe À DE (3.318) 


dont les coefficients seront déterminés au cas par cas par les conditions initiales dont les cas scolaires les 
plus connus et faisant l'objet d'une littérature abondante sont: 


- Conditions de Dirichlet: 
x=(0,Z) w(0,#)=0=#(Z,f) (33.319) 


- Conditions de Neumann: 
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x={07) LS 0,£i=0=- 2) L,£) (33.320) 
dx dx 


Puisque pour chaque valeur de 4 possible nous obtenons une solution, il apparaît donc qu'en faisant la 
somme de toutes ces solutions, nous obtenons la solution générale. Nous avons donc: 
ri : ûl 53 "#2 
u(x,9 = ZX (Ci (2) À +0 (2e 147 | À 21 
À 


(33.321) 


à cause de la présence au carré du 4 dans l'exponentielle temporelle en facteur de la paranthèse, si nous 
sommons sur tous les 4 de —c,+ alors la somme de tous les termes de la paranthèse s'annuelle pour 


tout couple 4 positif et négatif de même valeur. Il nous faut alors sommer que sur la demi-droite infinie 
(soit à gauche soit à droite cela n'a pas d'importance) si nous ne voulons pas que le résultat soit nul. Si nous 
choisissons abitrairement le demi-droite infinie positive, nous avons alors: 


+ . L . 
dix ii= 7; (Ci (4 et 47 +C (Aie FAX \e (33.322) 


À=0 


Rien ne nous interdit maintenant de sortir un facteur 4 des constantes C (Ai, G {À 1, le seul effet que 


cela aura sait de changer leur normalisation donnée par les conditions initiales. Nous avons alors: 


+ 


" : u _ 2112 
atene > AG Code LA (ie A FE 
À=0 
1 "u . "u _3 _ 392 
=> (SDF +0 (2e 7) 2 3 
À=0 


Comme 4 est un paramètre réel continu (et accessoirement positif), en le faisant tendre vers zéro la 
somme peut être changée une intégrale (en faisant cela à la physicienne) et nous avons alors: 


Te AŸDt+5À Te A* Dt-i4 
u(x.é) = | CGiäie MHIAX 2 + | Clädie nn” 33.323) 
0 0 
Et en faisant un changement de variable pour la deuxième intégrale, nous avons: 
+ 2 : te = 2 | # 
f nu — À Dé Ax+c | g (l —À Di Ax+c | 
u(x, f) = | Clädie dA- | Cyi-Aie d À 
Û 0 : 
di —ADtH| Axtc*| . — ADiHAxc* | us 
= | Cläie dA+ | Ci-lie d'À 
(il 0 


En regroupant les constantes, nous avons: 
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1 bu 2 ‘ 
u(x = — | Fi Le À DHÉAX 33 | (33.325) 


2x À 


avec: 


FiAi= 270 (4) pour ÀA>0 
F(A)=4#2nC; (4) pour 4 <0 


(33.326) 


Nous avons maintenant une chose intéressante! Au temps t nul, l'intégrale précédente s'écrit: 


1 © 
u(x,Ë) = —— [FA Axa (33.327) 


27 À 


et en changeant la notation pour le paramètre 4 ainsi que la notation pour x, nous avons: 


1 
u(x9=— | Fioie#aæ (33328) 


Ver! 


Et alors direz-vous? Eh bien comme nous l'avons vu lors de notre étude des transformées de Fourier (cf. 
chapitre Suites Et Séries) il s'agit d'une transformée de Fourier inverse qui est une somme infinie de 
fonctions trigonométriques réelles! Ce qui signifie que toute fonction décrivant la distribution de 
température au temps t nul pour une barre de longueur infinie et dont les extrémités au même moment 
tendent vers zéro (donc implicitement il s'agit d'une fonction de période infinie) telle que: 


uix,01= f(x) 
f() 0 


satisfait l'équation de la Chaleur en tant que série trigonométrique infinie. Revenons à notre notation 
initiale: 


1 Fe 2 ; 
u(x = — | F( de À DHÉÂX 3 (33.330) 


2x À 


Pour rappel du chapitre de Suites Et Séries (avec la notation adaptée ici présente) nous avons en 
appliquant la transformer de Fourier inverse: 


- 


2x - 


1 + 
| 


u(x,0) = FF (A0 = (D = F(De dx (3330) 


Donc F\ À\ est la transformée de Fourier de la fonction recherchée telle que: 
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+ 


1 1 —iÂx 
F(A)=— | fre "dx (33.332) 
= | 


—0 


Ce qui donne alors en faisant en injectant la transformée de Fourier avec un changement de variable qui 
s'impose: 


| = Pr ne MF! 
+ +00 (33.333) 
e n | 2 ; 
= 1 | | | a Di+iAx 3 3 
27 ©, . 


Toujours en gardant en tête que si nos posons t comme étant nu ci-dessousl, nous retrouvons alors bien 
Li 0)=T(<r C359 


Puisque dans la dernière égalité le terme ge DE Ax est indépendant de la variable v, nous pouvons le 
mettre dans la deuxième intégrale tel que: 


Lee ne 
u(x,0) = Î fl)e Av à — À? DEHAX à 3 = | Î Î fe ir, À? DEHAX 3,32 (33.335) 
—00 | —00 


0-0 


Nous y reconnaissons alors une double intégrale dont nous pouvons changer l'ordre d'intégration par 
l'application du théorème de Fubini (cf. chapitre de Calcul Différentiel Et Intégral) 


+0 +00 


1 T7 is —ÆDIHAx PAT a —ADHAx 
u(x 0 =— | | fie 7e d'Adv= — | fin | 8e d'Adv 
DT . . DT , , 
—00 —00 _ — 
+00 +0 (33.336) 
1 f f —ÆDt-A(v-x) 
=— | file dAdv 
27 ©, Et 


et rappelons que dans la chapitre de Suites Et Séries nous avons démontré que la transformée de Fourier 
d'une Gaussienne est une autre Gaussienne tel que: 


2 +60 2 , = 2 
F(fo)=Fle À) 1 feat _] 
Les] 


Il vient alors dans le cas qui nous intéresse en faisant une correspondance terme par terme 
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+ +c0 + LL 
in OI e DA ag = | F6) Pre 40 là 
27 27 


(33.338) 
ko _ {vw 
2 + [ FOR LE 4Dt 
27 ©. D 
Soit: 

2 

1 +0 _(V2) 
u(x D =—— | five 4H jy | (33.339) 
2x Dit ! 


Donc toute fonction f(v) injectée dans la relation ci-dessus satisfera alors aux conditions initiales que nous 
nous sommes imposés: 


uix,0i= f(x) 
J(0) 0 


Pour information, de nombreux physiciens nomment dans la solution précédente, l'expression: 


EX VI 


l 
VA 
le "noyau de chaleur". Donc le résultat final n'est en réalité qu'une convolution de la f(v) avec ce "noyau". 


Dans la pratique cette intégrale n'est pas calculable analytique puisqu'il s'agit d'une convolution avec une 
Gaussienne (cf. chapitre de Statistiques). Raisons pour laquelle on résout presque toujours l'équation de la 
chaleur aux conditions initiales susmentionnnées avec des méthodes numériques (cf. chapitre de Méthodes 
Numériques). 


Mais résolvons un cas simplistes mais réel: 
Exemples: 


ET. Lorsque deux extrémités d'un système de taille L sont maintenues à deux températures différentes 7 
et 7;, la solution de l'équation de la chaleur est stationnaire (indépendante du temps). Nous avons alors: 


PT(x) | 
8x? 


La solution à cette équation différentielle est très simple et ne nécessite pas l'utilisation du résultat 
précédent (c'est du calcul intégral de base avec conditions initiales connues): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


T(x) = A+(R-7)— (33343) 


C'est une situation que nous retrouvons dans la vie de tous les jours. 


E2. Considérons le cas où nous mettons en contact deux barreaux de longeur infinie (puisqu'avec la 
transormée de Fourier il faut toujours qu'une des variables ballaie l'ensemble des réels) et de température 


opposée en signe (sur l'échelle des Celsius donc) tel que: 


Nous avons alors: 
2 2 2 
0 _{v-xi j 0 _{v- 2 +0 _{v- 2) 
| five 4Dt = | —Tie 44 qv+ | Te 404 y 


1 
u(x.£)]= 
2./xDt Le 2/7 Dt Le 0 


2 2 (33.345) 
T + _{V- à) 0 _{V7 3) 
= — 1 (eo 42t -[e 42t a 
= e V e V 
2/7 Di 
0 
et faisons le changement de variable: 
VER _ Nr = 
VaDt  2Dt 
Soit: 
dv=-2#Didt (33.347) 
Nous avons alors: 
7 Ka 2 -x/2 Dr 2 
u(xti= 1 Ü —2/Dte ar- | -2Dte ar 
xDi x/2/Df Es 
% La _ 2/2 Dr si % re _ -x/2 VD 
nr = | -e “dt- | -e “ dr|= — | —e ‘dr+ | e “ dr| (3.348) 
x | _x fn . Ÿ |, pn . 
T -x/24Dt +00 , 
0! [ efar- ( + ‘ar 
ŸT - -x/2Dt 


Comme la fonction intégrée est une fonction paire (cf. chapitre d'Analyse Fonctionnelle) nous avons: 
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-x/24Dt ho 
1 rt 1 ri nn. 
| e “dtT= | e “dt (33.349) 
0 x/2 Dr 
Soit: 

6 4 x/2Df 
ulxil= >= | Far | e tarl=--ù | Fat 
Vr | pc _, ADF V7 | _, Bt 

(33.350) 
2.,/Df 
oT x/2: _2 
= 0 | 2 F äâT 


Ce qu'il est d'usage de noter: 


X . 
axes a] | (33.351) 


2,/Dt 


où ‘erf” est appelée la "fonction d'erreur de Gauss" et n'est pas calculable de façon exacte analytiquement 
(il faut passer par des développements en série limité). On la retrouve cependant dans des tableurs comme 
Microsoft Excel sous le nom ERF( ). 


12. RAYONNEMENT THERMIQUE 


L'étude du corps noir est à la base de la célèbre théorie de la physique quantique ondulatoire, un des 
piliers de la physique moderne. En effet, certains résultats expérimentaux ne pouvaient pas être expliqués 
sans l'introduction de la fameuse constante de Planck, de l'utilisation de la quantification de l'énergie (le 
quanta), de l'acceptation du modèle atomique et de la théorie statistique de Boltzmann (implicitement le 
deuxième principe de la thermodynamique dont Planck était un spécialiste). 


Avant de commencer nous allons faire exceptionnellement (pour ce site) faire un crochet historique qui 
s'avère très utile pour comprendre pourquoi l'étude du rayonnement thermique est si importante en 
physique. 


Le fait que tous les objets échauffés émettent une lumière d'une même coleur à la même température est 
une curiosité qui était connue depuis de nombreux siècles dans certains métiers, longtemps avant que 
Gustav Krichhoff commence ses investigations scientifiques et théoriques sur la nature de cette étrange 
corrélation. Afin de simplifier son analyse, il élabora le concept d'un objet parfaitement absorvant et 
parfaitement émissif. Ainsi, en tant que parfait émetteur, il serait tout sauf noir si sa température était assez 
élevée pour qu'il puisse rayonner dans des longueurs d'onde de la partie visible du spectre. Donc 
relativement au retoure d'expérience, le rayonnement de cet objet aurait une intensité et une étendue 
spectrale indépendante du type de matériau dont il est constitué. L'objectif était alors de mesurer la 
répartition spectrale de l'énergie rayonnée pour chaque longueur d'ondre et pour chaque palier de 
température et en dériver une équation dépendante donc que de deux variables (longueur d'onde et 
température) permettant de reproduire cette répartition et donc ce pour tout matériau mises dans les 
conditions d'un corps parfaitement émessif et réceptif. 
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Définition: Un "corps noir" (ou "récepteur intégral") est défini comme un corps ayant un "coefficient 
ZA 


d'absorption énergétique" & et un "coefficient d'émissivité”" £ égaux à l'unité ( 


) 


Le premier principe de la thermodynamique établit une équivalence entre le travail et chaleur comme 
modes de transfert d'énergie entre un système et son environnement (et en fait le bilan au niveau de 
l'énergie interne). Nous nous intéressons ici à la chaleur, que nous pouvons définir comme "l'énergie qu'un 
corps communique à un autre à cause de leur différence de température". 


La chaleur se communique d'un endroit à un autre de trois manières différentes comme nous en avons déjà 
fait mention plus haut: 


1. Par conduction: c'est un transfert de chaleur dans un ensemble de points matériels en contact qui se fait 
sans mouvements macroscopiques, sous l'influence d'un gradient de température. La conduction est donc 
le résultat de collisions moléculaires. Nous l'observons principalement dans les solides: dans les métaux, 
elle fait intervenir les électrons libres qui les rendent bons conducteurs de chaleur. En revanche, dans les 
isolants, la conduction se fait mal. De là la forte correspondance entre les propriétés thermiques et 
électriques des solides. 


2. Par convection: la convection implique le transport de la chaleur par une partie d'un fluide qui se 
mélange avec une autre particule. Elle prend sa source dans un transport macroscopique de matière et ne 
concerne donc pas les solides. 


3. Par rayonnement: la conduction et la convection supposent la présence de matière. Le rayonnement, 
lui, permet un transfert d'énergie qui peut s'effectuer à travers le vide. Il s'agit ici de rayonnement 
électromagnétique. Soulignons que le rayonnement n'est pas un mode de transfert de chaleur mais 
d'énergie, celle-ci pouvant se transformer en chaleur au contact d'un corps. 


Le rayonnement thermique émis par un corps porté à une certaine température résulte d'une conversion de 
l'énergie interne du corps en rayonnement. Inversement, l'absorption est la transformation de l'énergie 
incidente en énergie interne. 


Lorsqu'une surface est soumise à un rayonnement absorbé, nous effectuons le bilan d'énergie selon la loi 
de Kirchhoff vue en photométrie: 


a+to+tT=l 


où rappelons-le quand même, & est la fraction du rayonnement absorbée, £ est la partie réfléchie 
(diffusée) et T la partie transmise (qui traverse la surface). Ce bilan résulte du principe de la conservation 
de l'énergie. 


Nous allons maintenant nous pencher sur les mécanismes d'absorption et d'émission et établir un lien entre 
chaleur et énergie rayonnante avant de nous intéresser directement au corps noir: 
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12.1. LOI DE STEFAN-BOLTZMANN 


Nous avions défini lors de notre étude de la photométrie (cf. chapitre d'Optique Géométrique) le concept 
d'émittance (énergie irradiée par un corps non ponctuel par unité de surface) pour l'ensemble du spectre. 


Ce que nous avions omis de préciser cependant, c'est que pour qu'un corps rayonne (outre le fait qu'il 
puisse être lui-même éclairé par un autre corps) il faut qu'il soit chauffé (que l'on fournisse une énergie 
d'excitation aux constituants du corps en question - sous-entendu aux électrons). 


Donc nous devrions pouvoir établir une relation entre la température d'un corps et son émittance. 


En 1879, le physicien autrichien Stefan a pu établir expérimentalement que l'émittance totale (7) du 


corps noir (ou "exitance énergétique" du corps noir) à une température T'augmentait proportionnellement 
à la quatrième puissance de la température telle que: 


M(T)= 0" T!| (33353) 


où M(T) est l'intégration sur toutes les longueurs d'onde (ou les fréquences... peu importe) de Af{A,T\: 
MT) = PE (33.354) 


avec W{A,7) donné par la loi de Planck que nous déterminerons plus tard. 

Rappelons également que (ceci sera démontré lors de notre démonstration de la loi de Planck): 
g=5.67 10 [W:m?:K*] (33355) 

est la "constante de Stefan". 


En 1884, Boltzmann a démontré indirectement la loi de Stefan en se basant sur l'étude du corps noir à 
l'équilibre thermique (où nous considérons que les bords de la paroi du corps noir définissent les 
terminaisons des ondes électromagnétiques) à partir de la théorie de l'électromagnétisme et d'un 
raisonnement thermodynamique. 


Dans un premier temps, Boltzmann a déterminé quelle était la pression de radiation du rayonnement dans 
une telle enceinte (ou dans un tel corps). 


Voici les développements qui l'ont mené à déterminer la pression de radiation P(T) à la température 
d'équilibre thermodynamique T pour la densité interne d'énergie £{7) correspondante: 


Rappelons l'expression de la "relation d'Einstein" que nous avons démontrée lors de notre étude de la 
relativité restreinte: 
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Considérons maintenant une enceinte de volume V dont les parois sont réfléchissantes pour les photons 
(cas du corps noir). Nous étudions la variation de la quantité de mouvement avant et après la collision sur 
une surface infiniment petite ds (ce qui permet de considérer les trajectoires avant et après le choc comme 
rectilignes et symétriques par rapport à l'axe orienté OX perpendiculaire à la surface du corps noir 
coïncidant avec la surface ds). 


Ainsi, nous avons avant collision pour la quantité de mouvement: 


et après collision: 


Si la collision est élastique (ce qui est confortant relativement au photon...): 
lP',|=lp,l et LP | = PA (83.359) 
Nous avons alors: 
P'=-pü, tp,ä, (33.360) 
La variation de la quantité de mouvement est alors: 
d=p-p={-r8,+r,8)-(r8,+p8,)=-2r8, (63361) 


Comme: 


nous avons alors: 
dp = -2pü,cos& (33.363) 


En ne considérant que la norme de l'expression et qu'il s'agit d'un unique photon: 


kv 
dp=2—cosæ (33.364) 
€ 


Remarque: Nous supposons qu'après son rebond, le photon conserve sa fréquence (ce qui nous amène 
à supposer que le corps noir comporte des ondes stationnaires à l'équilibre thermodynamique). 


Jusqu'à présent, nous avons raisonné sur un unique photon, mais l'enceinte contient en réalité un gaz de 
photons. L'énergie interne volumique u du rayonnement contient une densité volumique n de photons de 
fréquence identique v. Dès lors, la quantité n de photons par unité de volume dans l'enceinte est: 
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Remarque: Nous précisons les unités, car nous avons remarqué que la suite posait parfois quelques 
problèmes de compréhension. 


Nous considérons que pendant un intervalle de temps dt, le nombre de photons pouvant potentiellement 
frapper la surface ds sous un angle d'indice & est contenu dans un cylindre de génératrice cdt dont l'axe 
est incliné nécessairement d'un angle & et ayant comme surface de base ds. Le volume de ce cylindre est 
de par la projection de la surface de base: 


dW =cdtcos &ds (33.366) 


Le nombre de photons 4x, pouvant potentiellement heurter la paroi ds par unité de temps est: 


dn, = niv = 4 G7 = cos adsdt (33.367 
kv kv 


[en 
(eù 
[ep] 
—7 


Dans cette dernière expression, nous avons supposé que tous les photons de dV avaient une quantité de 
mouvement dans la direction sous-tendue par &. En réalité, les photons arrivants réellement sur ds sont 
contenus dans un angle solide 4£à entre deux cônes de demi-angle au sommet & et æ+4æ (pour des 
raisons de géométrie de l'expérience du corps noir qui était, sauf erreur, sphérique et par ailleurs cette 
symétrie sphérique facilite les calculs...). 


La relation entre 4Q et & est comme nous l'avons vue dans le chapitre de Trigonométrie: 
dR=d{(2r({i-cosa))=2#sinadæ (33.368) 
Sachant que dans le volume entier (rappel), l'angle solide vaut: 


2 
£è = SL 4x (33.369) 
r? 


Le nombre dn compris dans l'angle solide élémentaire 4 qui parvient sur la surface ds sous un angle 
d'incidence compris entre & et 4aæ est alors: 


d£è 27T sin &d & uc cos & uc sin cos éd Ydsdi . 
AR = — dr, = —— sit = —— (33370) 
çà 4x kv 2hv 
Soit maintenant la définition de la pression P: 
dp 
_dF _ Fdn _\dt (33.371) 
ds ds ds 
en substituant ce qu'il convient: 
kv 
ui 2 c08 ue sin cos & 
Pgo ec EME pds (33.372) 
P= dt __ dt 2hv 
ds ds 
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Ce qui donne après simplification: 


P=usin œcos ada=ucos &d(-cos@) (33.373) 


La pression totale de radiation dans ce cas particulier étant donnée par: 


2/2 ni 12 
P = nhv [ cos’ œd(- cos &) = -nhv 


(33.374) 


nv 
3 


Ce qui est équivalent à écrire (à l'équilibre thermodynamique pour une température donnée): 


PT) = —- (33.375) 


relation trrrrès importante que nous utiliserons dans le chapitre de Cosmologie lors de notre étude du 
modèle d'Univers de Friedmann dominé par la matière. 


L'énergie totale est la densité d'énergie multipliée par le volume considéré: 
E = ET) (33.376) 


Supposons que ce volume puisse varier. Le travail de la pression de radiation lors d'une dilatation dV du 
volume est: 


aW = -P(T)d" = -Éar (33.377) 
La variation d'énergie interne du système en vertu du premier principe de la thermodynamique est: 
dE = dO+dW (33.378) 


Or d'après Æ = &{T)W", nous avons: 


dE = doi) + o(T)d" = Lu + E(T)dW (33.379) 
d'où: 


dp(T)VaT | 


dQ = dE -dW = p(T)aV + 
Q 27) GT 


4 
(4) = Ai (33.380) 


d p(T)WaT 
àT 
et selon le deuxième principe de la thermodynamique (ne pas confondre la notation avec la surface….): 
= (33.381) 


Nous avons: 


&S = + d'o(TWaT (33.382) 


3 TaT 
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Autrement écrit, cela correspond à: 


AN = TE Lie FPE Le TR > 0 Le 
5 T TaT av 


(33.383) 


Comme dS est une différentielle totale, nous avons démontré dans le chapitre de Calcul Différentiel et 


Intégral que S satisfait alors le théorème de Schwarz: 


S _ &$ 


— (33.384) 
OT oFeT 


nous avons dans ce cas: 


à (407). à [&aTw] _ dem 
aT\3T aV | TaT 


Ce qui nous amène à écrire: 


dx ) 44 UE] (33.386) 
TAT 34T\ T 
En calculant la dérivée du membre de droite: 
27) aT 
ae _4 47 PT C7 
TAT 3 ‘dis 


En simplifiant: 


22) _ 4 PT) _4 (D) 


(33.388) 
àT 3 AT 3T 


ce qui s'écrit encore: 


ar :) = +2 (33.389) 


àT 
Soit: 
_148 0), _42D) (3 300) 
3 àT s F 
qui devient l'équation: 
der) = PS (33.391) 
PT) T 


Ce qui donne après intégration: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


In (e(T)) = 4In(D)+c* (33.392) 


Finalement: 


OT) =c* Tt= 0," Tt| (33.393) 


avec: 
Css. = 7,56.10 % [J'#K*] (33.304) 


étant la constante de Stefan-Boltzmann dont la valeur avait été donnée à l'époque dans un premier temps 
expérimentalement. 


Nous voyons ci-dessus la correspondance qu'il y a entre la relation que nous avions posée au début et celle 
que nous venons d'obtenir: 


(D) = o,T et MD) = OT" (33.395) 


Comme nous n'avons pas encore, à ce point, démontré la loi de Planck, nous pouvons faire un 
raisonnement osé mais que nous justifierons par la suite avec démonstration à l'appui. 


Remarque: Les deux dernières relations nous donnent une information fondamentale comme quoi tous 
les corps qui ne sont pas à zéro kelvin (au zéro absolu) rayonnent! 


M(T) et £2{7) sont différenciées au niveau des unités par les dimensions d'une vitesse. Or, intuitivement et 


grossièrement (..), la vitesse qui peut tout de suite nous apparaître comme triviale dans ce cas d'étude est 
la vitesse de la lumière c. Ainsi, nous remarquons que: 


T _c 
—— =— (33,396) 
Css À 
Ce qui nous donne: 
€ ; 2e 
MT) = 320 (33.397) 


Curieux n'est-ce pas. mais nous le démontrerons plus loin car notre philosophie sur ce site est de ne 
jamais (ou le moins possible) laisser place à l'intuition. 


Remarque: Lorsque nous étudierons la loi de Planck, {7} sera notée R(T) afin de ne pas confondre 
une densité d'énergie avec la radiance (car la notation peut malheureusement porter à confusion). 


Considérons maintenant une chambre ou cavité isolée (comme une fournaise) en équilibre thermique à 
une certaine température T. Cette cavité sera sûrement remplie de rayonnements électromagnétiques de 
différentes longueurs d'onde. Supposons qu'il existe une fonction de distribution M(T) dépendant 
uniquement de la température. 
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Logiquement, la quantité totale d'énergie électromagnétique, à toutes les longueurs d'onde, absorbée par 
les murs de la cavité doit être égale à celle émise par les murs autrement le corps formant la cavité verrait 
sa température changer. Kirchhoff raisonna que si le corps formant la cavité est fait de différents 
matériaux (se comportant donc de façons différentes avec la température), l'équilibre entre radiation émise 
et radiation absorbée doit s'appliquer alors pour chaque longueur d'onde (ou domaine de longueur d'onde). 


Nous voyons ainsi que M(T) est une fonction universelle, la même pour toutes les cavités sans égard à leur 
composition, leur géométrie ou la couleur de leurs parois. Kirchhoff ne donna pas cette fonction, mais il fit 
remarquer qu'un corps parfaitement absorbant, c'est-à-dire un corps pour lequel 4 = 1 apparaîtra (façon 
de dire...) noir. 


Il vient alors que le rayonnement emmagasiné en équilibre dans une cavité isolée en équilibre 
thermodynamique (comme le sont les étoiles) est à tous égards le même que celui émis par un corps 
parfaitement noir à la même température. 


Évidemment, si la cavité est fermée, nous ne pouvons pas mesurer le courant d'énergie qui s'en échappe. 
Mais pratiquons un tout petit trou dans cette cavité (suffisamment petit pour ne pas perturber l'équilibre du 
rayonnement électromagnétique à l'intérieur), alors l'énergie électromagnétique s'échappant de ce petit 
trou est la même que celle émise par un corps parfaitement noir. 


Cependant, aucun objet n'est réellement un corps noir. Le noir de charbon a un coefficient d'absorption 
très près de 1 mais seulement pour certaines fréquences (incluant, bien sûr, le visible). Son coefficient 
d'absorption est beaucoup plus petit dans l'infrarouge lointain. Tout de même, la plupart des objets s'en 
approchent dans certaines gammes de fréquences. Le corps humain, par exemple, est presque un corps 
noir dans l'infrarouge (d'où les lunettes de nuit militaires...). Pour traiter les différents corps, appelés "corps 
gris", nous introduisons un facteur appelé "émissivité totale", &, qui relie l'émittance émise par le corps à 
celle émise par un corps noir parfait pour lequel £ = 1. Nous avons donc: 


MT) = eoT* 


Remarque: La relation de Stefan-Boltzmann nous donne la puissance émise par un corps par unité de 
surface en l'exprimant de façon proportionnelle à la quatrième puissance de la température. Cet 
exposant nous donne la raison pour laquelle il devient de plus en plus difficile d'augmenter la 
température d'un corps en le chauffant, celui-ci perdant de plus en plus rapidement l'énergie que nous 
fournissons pour son échauffement. 


12.2. LOI DE PLANCK 


Pour établir la loi de Planck, nous n'allons pas faire le développement original de Max Planck bien que 
passionnant du point de vue intuitif il n'était qu'une succession de bricolages (admis par Max Planck 
lui-même). Nous allons introduire cette loi avec une approche moderne et la plus simple possible en 
matière de formalisme mathématique. 


Pour cela, nous considérons maintenant le corps noir comme un système isolé à l'équilibre thermique, dans 
lequel le rayonnement est à l'état stationnaire et réfléchi totalement par les parois. Les photons peuvent 
être dès lors considérés comme des particules n'interagissant pas entre elles dans un puits de potentiel à 
parois rectilignes. 
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Ainsi, identiquement à ce que nous avons vu dans le chapitre de Physique Quantique Ondulatoire, la 
résolution du problème est celle d'un puits de potentiel à parois rectilignes pour lequel nous avions obtenu 
pour fonction d'onde: 


Br me 
2 


ee 
ü 


»] 


.399) 


Y,=Y ,sn(ex)=Ÿ,,sin|x CEE É,) (2 


fonction à laquelle il convient d'appliquer les conditions aux limites. 


Les conditions que nous avions imposées lors de notre étude de ce cas en physique quantique ondulatoire 
étaient trop restrictives (c'est la raison pour laquelle elles sont appelées "conditions aux limites strictes"). 
Effectivement, les atomes de la paroi absorbent et émettent le rayonnement quelle que soit la manière 
dont le rayonnement est incident. Mais l'équilibre impose au moins que les conditions aux limites soient 
périodiques de par la définition même de l'équilibre. C'est la raison pour laquelle nous imposons ce que 
nous appelons les "conditions aux limites périodiques": 


- pour x=0 et x= 2, nous avons: #(0) = Y(L )=c* 
- la fonction d'onde % doit présenter un nombre entier de demi-longueurs d'onde sur la longueur Z, 
- dans le corps noir, U =Q donc £,,, = 0 


- si aux extrémités (x = 0 et x = Z,) nous avons y =.-#* l'argument du sinus a la même valeur #2# (à un 


facteur multiplicatif réel près) en 0 et en Z,. 


Donc nous devons avoir: 


L,' DAT -E,4)=2,27 (83.400) 


et comme Æ,, = 0, après quelques simplifications élémentaires, nous avons: 


2 2 2 2 2 
ne E,. = a HE. = ag À = 4 #2 (33.401) 
FE Fi LE  Grm LE 2m 


où Æ,, est l'énergie totale du niveau quantique n selon x (cf. chapitre de Physique Quantique Ondulatoire),. 


L'énergie totale de la particule présente donc une suite discrète de valeurs, les seules permises. La valeur 
de L est quant à elle déterminée à l'aide du modèle de Bohr ou de Sommerfeld en fonction des cas. 


Puisque les fonctions d'onde correspondantes dans le puits sont T =0 = Æ£,, = 0 , nous avons donc: 


2 
ah sain| x: ps 
£, 
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(33.402) 


Ainsi, l'énergie totale peut s'écrire: 


2 
2m Wamn W[2m,) 


E = 
” Fr mi 2m Fi 2m L, 2m 


Ainsi, étant donné que la fonction d'onde est une probabilité conditionnelle, nous avons sous forme de 
phaseur: 


L'ES A A PET EN Dé a cg (33.404) 


et les énergies discrètes associées sont alors: 


| ET 64 
E = ( &? + &? + 2? | = (33.405) 
d 2m 
Le vecteur # étant donc défini par: 
— 27 TR TR l 
KE = #, —,#, —, 4 — (33.406) 
L, L, Z, 


Remarque: Nous constatons facilement que les écarts d'énergie entre niveaux consécutifs sont d'autant 
plus faibles que les dimensions du corps noir (assimilé à une boîte) Z, ,Z,,£, sont plus grandes; pour 


des dimensions macroscopiques, ces écarts sont alors totalement inappréciables. Ce constat nous 
permettra un peu plus loin de faire une petite approximation. 


Explication: Pour un électron (5# = 10? [Kg]) enfermé dans une boîte cubique de côté Z =1 [#1] , l'écart 
entre deux niveaux consécutifs est: 


27h? 


— (33.407) 
ml, 


E Eu = (2 +1 


2 +Laxu ns = L'EAU TS 


donc environ 10-* [J] … 


Les vecteurs Æ qui nous intéressent (puisqu'ils représentent respectivement chacun un micro-état 
possible), plongés dans l'espace des phases des nombres d'ondes, ont leur extrémité située en l'un des 
noeuds d'un réseau tridimensionnel constitué de mailles élémentaires dont les arêtes sont parallèles aux 
axes et qui mesurent respectivement 277/ Z,,27/£,,27f Z,. Nous voulons évaluer le nombre de vecteurs 
pour lesquels cette extrémité tombe dans l'intervalle entre les deux sphères centrées à l'origine et de rayons 
de norme K et K + dK. Le volume de la coquille sphérique comprise entre les deux sphères est donc 
trivialement donné par: 


dY =47 K°?4K (33.408) 


Le nombre de mailles élémentaires (de micro-états) incluses dans cette région de l'espace des Æ est, à peu 
de chose près, égal au nombre de fois que son volume contient celui de la maille élémentaire, qui vaut: 
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27 2x 27 _8r 


—"—"—=—— (33.409) 


LE & 


Nous obtenons ainsi le nombre de micro-états dans le volume 4ÿ (donc la densité de micro-états): 


4x K°dK _VK°dK 


ST O7 (33.410) 
7 


Or, il ne faut pas oublier les relations suivantes (cf. chapitres de Mécanique Ondulatoire, Physique 
Quantique Corpusculaire et Relativité Restreinte): 


27 & 
KE =—=— (33411) 
À C 
Donc comme: 
2 
=D Œ=lio (33.412) 
Les € 


et (rappel): 


il vient alors: 


VKŸdK _ Va ,,_Varnv , _V4arv 


D mm 4 
27 270? 27 0° rc c? 


Mais quand les physiciens avaient développé ce modèle théorique (il paraît que c'est Bose qui aurait été le 
premier à le faire), ils avaient remarqué que le résultat final ne correspondait pas à l'expérience à facteur 2 
près. Dès lors ils multiplièrent à l'époque empiriquement la densité de micro-états par un facteur 2 tel que: 


V'Ax v? V8n v? 
= — 
2 ec 


2 dv (33415) 


Ce facteur 2 s'expliquerait aujourd'hui (je n'en ai jamais vu la démonstration personnellement...) par le spin 
1 du photon. Ce qui autorise a priori trois valeurs pour sa projection: -1, 0, 1. La valeur O serait interdite 
par la théorique quantique des champs (si quelqu'un possède la démonstration, je suis preneur!). 


Dans un corps noir à l'équilibre thermodynamique, les photons (qui par ailleurs sont des bosons) forment 
un gaz dont les constituants n'interagissent pas entre eux chimiquement. Ce type de situation est 
typiquement décrit par la distribution de Bose-Einstein que nous avons démontrée dans le chapitre de 
Mécanique Statistique. Ainsi, puisque {{ = 0, nous avons dans le cas d'un spectre discret d'états d'énergie 
(c'est donc ici qu'apparaît le concept de quantification que Planck avait introduit à l'origine en bricolant): 
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&; (v) 


Le &i . 
| . E, ue. kv, _, 2419 
P|xr Pl xr 


et dans un cas que nous considérons comme continu: 


Fer 
an AO ce 


Ex sé —] exp sé 
PUxr KT 
Avant de continuer il est important que le lecteur se rende compte que l'analyse du rayonnement du corps 
noir vient donc suite aux deux relations précédentes à imposer: 


dv 
(33.417) 
| 


- Premièrement une quantification des niveaux d'énergie par paquets hv alors qu'à l'époque de la 
découverte du phénomène la nature était considérée comme continue dans tous ses phénomènes. 


- Deuxièmement à considérer que la théorie de l'entropie de Boltzmann et la distribution statistique de 
Bose-Einstein qui s'ensuit est un pilier de l'étude des systèmes physiques. 


Dans le corps noir, nous avons pour énergie interne: 


Ferv 


dv 
” . ° 8h w 

Î É pe ” 1 FE ex cs = 1 | 2- 

P ET P (33.418) 


£&T 


— = = fe6:Na» [7 ré | 


La radiation d'un corps noir (sa "brillance monochromatique" comme disent certains..)est donc donnée 
par la "loi de Planck": 


_ Br 1 _2ñh@ 1 _ 
CLS ne Er F7 er ho [7 si ] (33.419) 
exp| —|-1 exp|——|-1 
&T &T 


La première égalité est souvent écrite sous la forme suivante qui permet une interprétation du résultat: 


2 
BATV 1 
R(v,T)= D 
e> kv (33.420) 
exp| — |-] 
xT 
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2 
où 7°” correspond à la densité volumique de mode de rayonnement du corps noir, hv à l'énergie 


l 
moyenne par quantum d'énergie et Ce) l représent la population des modes. 
exp| — |- 


Enfin, voyons une autre manière courante d'écrire la loi de Planck. Puisque: 


ÆR(v,Tjdv = R(A,T)jdA et v = = = (33.421) 
(v,T) (4,7) de 2 
donc: 
dv —c 
A( De Te v,7) = R(A,T) (33.422) 


Or, comme À{A,T) 2 0,R(v,T) 2 0, il convient de prendre la valeur absolue telle que: 


REDS=|< —|RG,T) = ZT RC.T) (33.423) 


Enfin, nous obtenons encore une autre forme de la loi de Planck qui exprime la densité de flux d'énergie 
pour une longueur d'onde précise donnée par: 


8h 1 
RAT) = 
(4,7) Fi kc (33.424) 
exp] ——|- 
AXT 


Remarque: Planck a donc proposé cette loi par une successions de bricolages théoriques et d'analogies 
en 1900 sans connaître la distribution statistique de Bose-Einstein ce qui est remarquable 
expérimentalement parlant! 


Si kv«# &T (donc dans le domaine des grandes longueurs d'ondes), le développement de Taylor (cf. 
chapitre Suites Et Séries) de $* pour x petit donne donc: 


2 
u “iris. æ 1+x (33.425) 


Ce qui nous donne: 


EXP (33.426) 
Cr ]et+ ART 


et la loi de Planck devient donc la "loi de Rayleigh-Jeans" (qui avait été découverte avant la loi de 
Planck): 
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“rh 1 87h AT 8rkT 


Que nous retrouvons aussi parfois dans la littérature spécialisée sous la forme: 


_ ÀT _ 87v? LT 


eYŸ ec € (33.428) 
V 
kc . kc 655425) 
EXP] — | —1= exp] — 33.429 
Per P[ er 


R(v,T) = 


A l'inverse, kv:> £T nous avons: 


et la loi de Planck devient donc: 


hc 
RAT) = —— 
(AT) ern(- FF) (33.430) 
FH 


qui n'est rien d'autre que la "première loi de Wien" (qui avait été découverte avant la loi de Rayleigh- 
Jeans). Cette loi décrit effectivement la présence d'un maximum de rayonnement, mais, contrairement à la 
loi de Rayleigh-Jeans, elle fournit des valeurs fausses pour les grandes longueurs d'onde (donc les petites 
fréquences). En outre, elle implique que l'intensité de rayonnement tende vers zéro avec l'augmentation de 


la température, ce que contredit également l'expérience. 


Voici un schéma présentant les différences entre les trois lois: 
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1e-23 
Rayleigh-Jeans 
— Yyien 
1e-24 Planck 


1e-25 
5 
Æ 1e-26 
ce 
o 
ü 
5 dle-27 
La 
(na 
1e-28 
1e-29 
1e-30 
1e+08 1e+09 
Frequency [Hz] 


Figure: 33.5 - Tracé des trois lois dans une échelle log-log pour camparaison (source: Wikipédia) 


Nous voyons ci-dessus que la loi de Jeans était bonne aux basses fréquences alors que celle de Wien l'était 
aux hautes. Historiquement il a fallu de nombreux essais et pas mal d'années aux physiciens pour trouver 
la modèle adéquat qui amena finalement Max Planck à considérer la quantification des états d'énergie (ce 
dont il ne renda compte lui même que bien après avoir élaboré son modèle). 


Nous pouvons également redémontrer la loi de Stefan (nous l'avons déjà fait plus haut mais avec une autre 
démarche) mais cette fois-ci en explicitant la provenance de la constante de Stefan-Boltzmann &, , . 


Rappelons d'abord que le flux énergétique (cf. chapitre d'Optique Géométrique) est entre autres donné 
par: 


dE =Z(84Sdéècos 8 (33.431) 


Comme la luminance dépend de la fréquence et donc de la température du corps émetteur, nous pouvons 
ajouter: 


d'P(v,Tidv = L(8,v, TidSd$ècos dv (33.432) 
L'énergie rayonnée à travers une surface élémentaire 45 cos& donnée est donc dès lors: 


d'P(v, Tidvdt = L(89,v,T)dSdSècos Sdvdt (23.433) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Si le volume d'émission est considéré comme un volume élémentaire assimilé à un cylindre de hauteur cdt 
et de sommet ayant pour surface 45 cos& (cf. chapitre d'Optique Géométrique) la densité d'énergie par 
unité de fréquence et par stéradian est alors donnée par: 


L(8,v, T)dSd 8 cos Odvat 


dU(v, TT) = 
69) cdt dS cos 8 


= ze v,T)d£èdv (33.434) 
€ 


Compte tenu de l'isotropie du corps noir à l'équilibre, nous avons en intégrant sur l'ensemble de l'angle 
solide la densité d'énergie par unité de fréquence seule: 


dU(v,T) = Dre (33.435) 
€ 
L'analyse dimensionnelle nous donne: 
47 £ Er 
— L(8,v,T) = R(v,T) = L(8,v,T) = —R(v,T) (33.436) 
€ 47 
Enfin, il est utile de considérer la puissance totale émise par unité de surface (donc l'émittance): 


dM(v,T) = Z(8)d£ècos® (33.437) 


Si nous intégrons sur la demi-surface d'une sphère (par rapport au point de surface de l'émetteur): 


212 


M(v,T) = faeaccse - [ A) cos81 (2xsin 848) (33.438) 


Effectivement pour une sphère (cf. chapitre de Trigonométrie): 
d0= 27sin89d89 (33.439) 


Comme la luminance est indépendante de 8 (isotropie du rayonnement du corps noir), l'intégration est 
élémentaire, et nous trouvons: 


MT) = 72 = 7 R(v, D) = LR(T) [7° mr] (33.440) 
4x7 4 


L'émittance totale est alors donnée par: 


“he F h” 
M(T) = ri ES nt Ales “DE TJ: ———— dy = 2R—T dan a me Ê DES ut 
Exp 
En posant x = kv/kT , nous pouvons simplifier l'intégrande de sorte que: 
(ar) ET\ (xt ‘ 
ee a. PTT) 2e Gour 
€ k é” =1 C 15 1%"# 


Démontrons, car ce n'est de loin pas évident, que: 
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1 s 7 
0-1 15 


Écrivons l'intégrande sous la forme suivante: 
3, x _ x! x y 3 x À 
mle*-1l =2e {le -1l e*=xe [1-07 | (33.444) 


Pour le terme: 


(33.445) 
Posons ; = ,-*, nous avons alors: 
1 
—— (33.446) 
1-£ 


et nous avons démontré dans le chapitre d'Analyse Fonctionnelle, en utilisant des résultats du chapitre de 
Suites Et Série, que sous la condition k| <1 , la dernière fraction peu s'écrire: 


1 œ 
—= Zeit +8 +. (3447 
1-£ eur 
Dès lors: 
-1 
re *{1-e | =re"{1te +e 4e +. |e re +200 27 + 7e 37 +. (83.448) 
D'où: 
œ [ra] 
| dx = fixe” + re 2 4e 7 +. |dx (33.449) 
0 -1 û 


Nous pourrons donc remplacer notre intégrale par une somme d'intégrales définies. Nous voyons qu'en 
faisant des intégrations par parties successives, nous obtenons: 


œ œ wa] 
= = < [re] Pas fe ax = fe ax = <|-1 "| 
A 0 #5 CE # L # 0 
=-<] a (0x) À (0-1 = © 
ñ ( ñ ñ# ñ# 
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Donc: 


Î a=6f ee.) (33.451) 
0-1 27 3 4 Ml À 


Or, nous avons démontré dans le chapitre de Suite Et Séries lors de notre étude de la fonction de zêta de 
Riemann que: 


a] 1 À 
AO EEE (33.452) 
n=l # 0 
Donc: 
œ co 4 4 
| dr= 67 =6ç(@)= 7-7 (33.453) 
o-1 "17 90 15 


Au final, la constante de Stefan-Boltzmann peut donc s'exprimer analytiquement sous la forme: 


4 
g- ne = 5.67051:10° [W:#°:K*]| (63454 
15c"# 


Franchement. il était difficile de le deviner... 


Déterminons pour quelle fréquence, nous avons le maximum de densité d'énergie. En d'autres termes, cela 
revient à chercher où la dérivée: 


dR(V,T)_ d |. hkv 1 


= —|87x— | (33455) 
dv dv e x) 
exp|—|-1 
&T 
s'annule. Donc: 
kv 
2 3 EXP| —— 
dR(v,T) _ 8'37hv 1 kv° &T 
RS 7 (33.456) 
dv c _ hv ee € &T : 
ET “(2-1 
Divisons par À(v,T\: 
kv 
1 RD 3 à PET 3 (av) 3 4 [x 
— © = — = 0 =expl—|---— — | = 
Riv,T) dv v ÀT kv v &T]J v xT &T _ 
EXP Pr = (33.457) 
3 3 kv k kv 1 #v 
= —-— expl-—|-—=0& expl -—|-=1--— 
v y &T | 4T &T 3XT 
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La dernière relation admet une seule racine positive que nous pouvons déterminer avec Maple 4.00b (en 
utilisant la commande: >evalf(solve(exp(-x)-1+1/3*x=0,x));): 


me = 2.82144 (33.458) 
&T 


Ce qui nous donne la "deuxième loi de Wien" ou "loi de déplacement de Wien" qui dit donc qu'à mesure 
qu'on augmente la température d'un corps noir, la longuer d'onde à laquelle l'intensité du rayonnement est 
la plus forte devient de plus en plus courte: 


= 282144 À = à 2 (33.459) 
k k 


où a est appelée "constante de Wien". La figure ci-dessous représente bien ce résultat à l'aide des échelles 
logarithmiques: 


Soleil (5900 [KT 


Halogène (3200 [K7T) | 
| 
| 


10 
NN 
Fer chauffé à blanc (1600 [ÆT) 


be =." 
Flemme (1200 [K] mu 
10° | |_Z Humain G10[&) NN 
we 


_ d'onde [ {4##] 


Figure: 33.6 - Représentation de la loi (distribution) de Planck avec le déplacement de Wien 


Luminance spectrique Le m° sr | am ] 


Ainsi, non seulement l'augmentation de la température entraîne un accroissement de la quantité totale 
d'énergie rayonnée mais la loi de déplacement de Wien nous dit que la longueur d'onde à laquelle la 
quantité maximale de rayonnement est émise multipliée par la température du corps noir est toujours une 
constante (ou autrement vu: la longueur d'onde maximale est inversement proportionnelle à la température 
comme le montre le trait vert dans la figure ci-dessus)! Ce qui est un résultat extrêmement simple qui nous 
dit deux choses importantes: 


- Si la température double, alors la longueur d'onde maximale sera la moitié de la longueur d'onde 
précédente. 
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- Si nous connaissons la constante (ce qui est notre cas), alors nous pouvons calculer la longueur d'onde 
maximale pour toute température à laquelle se trouve un corps noir. 


Il est alors aisé de comprendre maintenant pourquoi tout matériau à des températures basses émet 
principalement des radiations de grande longueur d'onde dans la partie infrarouge du spectre et qu'à 
mesure que la température s'élève, il y a plus d'énergie rayonnée dans chaque région du spectre et la 
longueur d'onde de pointe diminue en se déplaçant vers les longueurs d'ondre plus courtes. Il en résulte 
que la couleur de la lumière émise passe du rouge à l'orange, puis au jaune et enfin au blanc bleuâtre (et 
plus loin dans l'ultraviolet). 


Remarque: Bien évidemment la deuxième loi de Wien est aussi parfois donnée dans la littérature non 
pas par rapport à la fréquence, mais à la longueur d'onde... 


Insistons sur le fait que la loi de Planck n'est valable que dans les cas où le rayonnement est à l'équilibre 
thermique. Cette restriction est importante dans la pratique, car les phénomènes d'émission ou d'absorption 
de rayonnement par la matière se produisent le plus souvent dans des conditions hors de l'équilibre: dans le 
cas par exemple de l'éclairage par une lampe électrique ou du chauffage électrique par rayonnement 
infrarouge, il y a transformation irréversible (et donc hors d'équilibre) d'énergie électrique en énergie de 
rayonnement; de même, le rayonnement solaire est produit par les réactions nucléaires qui ont lieu à 
l'intérieur du soleil et qui consument peu à peu sa substance; au niveau microscopique également, 
l'émission d'un photon par un atome excité est très souvent un retour irréversible de l'atome à son état 
fondamental (émission spontanée hors d'équilibre). Dans le cas du corps noir, au contraire, le rayonnement 
est confiné à l'intérieur d'une enceinte fermée (nous laissons éventuellement une fraction négligeable de ce 
rayonnement s'échapper à l'extérieur pour y être soumise aux mesures) et nous pouvons ainsi parvenir à 
l'équilibre thermique avec les parois. 


La loi de Planck que nous avons démontrée précédemment est parfaitement vérifiée par l'expérience dans 
tout le domaine des températures accessibles à ce jour: 


' 483 nm 


RAT) MAT) 


100 500 1000 1500 2000 2500 
966 nm (IR) À [x#] 


Figure: 33.7 - Représentation de la loi (distribution) de Planck 


Nous remarquons à la lecture du graphique ci-dessus, qu'un corps chauffé entre 5'000 et 6000 [K] a un pic 
d'émission au milieu du spectre visible. Dans le domaine de la colorimétrie, nous associons une 
température à une couleur en cherchant la température du corps noir pour laquelle le pic de radiation a son 
maximum dans la longueur d'onde de la couleur donnée. 
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Il est à noter que beaucoup de sources lumineuses émettent un flux lumineux qui ne suit pas la loi du corps 
noir (un filament d'ampoule, par exemple) et que la loi de Wien ne s'applique pas à eux. En revanche, il 
reste avéré qu'ils émettent à une longueur d'onde d'autant plus courte qu'ils sont chauds. 


Il faut également garder à l'esprit que le flux lumineux provenant d'un objet n'est pas forcément de nature 
thermique ; autrement dit sa couleur ne renseigne pas toujours sur sa température. Par exemple, la couleur 
du ciel provient de lumière solaire bleue diffusée par l'air et non d'une hypothétique température de 15'000 
[K]. De même un arbre est vert, non pas parce qu'il est à 8'000 [KT], mais parce qu'il réfléchit la lumière 
verte qui compose la lumière du jour. 
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Notes personnelles: 
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34. MÉCANIQUE DES MILIEUX CONTINUS 


A, sens strict du terme, la mécanique des milieux continus (abrégée M.M.C.) est la branche de la 


mécanique qui a comme propos l'étude des mouvements, des déformations, des champs de contraintes 
au sein de milieux continus. 


Définition: 


D1. Nous désignons par "milieu", tout fluide (solide, liquide, gaz ou plasma selon ce que nous avons vu 
en thermodynamique), déformable ou non, quand nous le considérons d'un point de vue 
macroscopique, par opposition à une description corpusculaire. 


D2. Nous désignons par "milieu continu", un milieu tel que si M et M' appartiennent à un milieu et si M 
appartient au voisinage M, alors quelle que soit la déformation subie par ce milieu, dM" appartiendra au 
voisinage de dM. 


Cette branche apparaît souvent comme la science de l'ingénieur qui permet de comprendre et de décrire 
le monde matériel qui nous entoure et les phénomènes courants qui s'y déroulent: mouvements de 
liquides, de gaz, vol des avions, hélicoptères, fusées, satellites, navigation des bateaux, déformations 
des corps solides, structure interne des étoiles, etc. Par ses attaches à la mécanique thermique 
(thermodynamique), elle s'étend jusqu'à la thermique, l'énergétique, l'acoustique. 


Prenant en compte les comportements des milieux continus, elle englobe l'hydrodynamique, la 
dynamique des gaz, l'élasticité, l'acoustique, la plasticité et d'autres comportements. Elle est la clé de ce 
que nous appelons aujourd'hui la "modélisation", qui n'est autre que l'art d'analyser un phénomène 
physique et de le décrire en termes mathématiques, ce qui permet de l'étudier avec la rigueur propre à 
cette discipline. 


Cette section du site est divisée en 4 parties principales: solides, liquides, gaz et plasmas (dont certaines 
notions ont délibérément été développées dans le chapitre de Musique Mathématique du site). Dans 
chaque partie, nous introduirons les outils mathématiques spécifiques à l'étude de tel ou tel milieu 
continu avec une complexité (toute relative) croissante. Cependant, par choix, il a été décidé d'exposer 
les théorèmes avec les outils mathématiques les plus simples possibles mais tout en arrivant aux mêmes 
résultats. Ainsi, par exemple, la démonstration de l'équation de Navier-Stokes qui prendrait 150 pages 
de développements mathématiques rigoureux n'en prend plus que 27. Il y a donc un avantage non 
négligeable aussi bien pour l'auteur que pour le lecteur à procéder ainsi. 


Remarque: Concernant les équations de Navier-Stokes, nous donnerons aussi des exemples 
pratiques de celles-ci lors de notre étude de la météorologie (cf. chapitre de Génie Marin & Météo). 


1. SOLIDES 


Des atomes d'un même élément ou d'éléments différents s'assemblent en des édifices spécifiques. Cela 
conditionne la force de leurs interactions électriques, qui définissent la structure finale de la substance. 
Dans les conditions normales sur notre planète, la matière existe à l'état solide, liquide, gaz ou plasma. 

Si les forces interatomiques sont assez intenses, la collection de particules conserve sa forme et son 


volume. 
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Cette propriété de conserver la forme et le volume, ainsi que des propriétés élastiques distinguent les 
solides. 


1.1. PRESSIONS 


Les notions de "compression" et "contrainte" (que nous pouvons englober abusivement dans le terme 
de "pression") sont de première importance en mécanique des fluides (solides inclus donc!). Il convient 
donc de définir ces différents types de pression avec un minimum de rigueur! 


Définitions: 


D1. Nous appelons "pression de compression", notée traditionnellement P, le rapport exprimé par la 
force F qui s'exerce (s'appuie) sur un élément de surface S à la perpendiculaire de celle-ci. Ainsi, sous 
forme scalaire: 


P= — (34.1) 
S 


Remarque: Si une force agit sur une surface finie, nous parlons alors aussi de "force répartie". 


D2. Nous appelons "pression de contrainte" le rapport exprimé par la force F qui tire sur un élément de 
surface S non nécessairement à la perpendiculaire, force qui peut dès lors être décomposée en deux 
vecteurs respectivement tangent et normal. Ainsi, sous forme vectorielle: 


Figure: 34.1 - Illustration des contraintes tangentielle et normale 


où & et T sont respectivement la "contrainte normale" et la "contrainte tangentielle" (parfois indiquées 
avec un s en indice pour indiquer que c'est par rapport à une surface). 


Nous pourrions très bien englober les deux définitions ci-dessus en une seule et travailler avec les 
signes des forces. Mais par souci de cohérence avec ce qui est enseigné dans les écoles, nous garderons 
ces deux définitions qui s'identifient par définition par le fait que leurs forces sont opposées par rapport 
à un élément de surface S. 
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1.2. ÉLASTICITÉ DES SOLIDES 


D'une manière ou d'une autre, une contrainte de compression ou de traction peut déformer le triplet 
hauteur, largeur, épaisseur d'un corps. S'attaquer directement à l'étude d'un cas qui déforme ces trois 
paramètres est un peu long et sera abordé plus bas dans la partie traitant de la détermination de 
l'expression du module de Young de cisaillement. 


Mais il est utile, ne serait-ce que du point de vue du vocabulaire de donner un exemple à partir du cas 
le plus simpliste qui puisse être. Si nous imaginons un corps élastique à une dimension (n'ayant ni 
hauteur, ni largeur mais juste une longueur) sous l'application de deux forces de contraintes 
parfaitement colinéaires mais antagonistes, nous pouvons imaginer que le corps en considération 
s'allonge d'un certain facteur. 


Définition: La "déformation normale" sous des forces axiales et antagonistes est donnée par le rapport 
entre la variation de longueur du corps sur sa longueur initiale (soit: l'allongement relatif) tel que: 


-- Bi 
FA 


(34.2) 


Cette relation est une forme extrêmement simplifiée de tous les types de déformations qui peuvent 
exister et que nous verrons plus loin en détails. 


Il y a nécessairement une relation entre forces de compression et de traction et la variation de 
dimension d'un corps. Cette relation est dépendante de la structure atomique du matériau et devrait 
rigoureusement faire appel à la physique quantique pour être déterminée (nous nous en abstiendrons 
cependant dans cette section du site). Nous observons cependant suivant les matériaux des 
caractéristiques diverses qui intéressent au plus haut point les ingénieurs: 


Comraiate 


Comrainte 


IXformation € Défonmation L 
(a) {b) 


Contrainte 
Conmraime 


EDXformation Li 
(ç) 


Figure: 34.2 - Comportement sous contrainte/compression pour certains matériaux 


Les figures ci-dessus représentent la variation de la contrainte de compression en fonction de la 
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déformation pour certains matériaux (habituellement nous représentons ces caractéristiques en 
inversant les axes). 


- Les matériaux ductiles comme l'acier doux (a), cessent d'être linéaires à la limite d'élasticité notée ar, 


ci-dessus. 


- Sous traction les polymères (b) caoutchouteux s'allongent d'abord en dépliant leurs molécules (cf. 
chapitre de Génie Des Matériaux) puis en tirant sur les liaisons chimiques (cf. chapitre de Chimie 
Quantique). 


- La plupart des matériaux biologiques (c) sont sous contrainte, même lorsqu'ils ne sont pas déformés. 
La peau, par exemple, est comme un gant de caoutchouc enveloppant le corps. 


- L'élastine (d) est habituellement renforcée de collagène dans les systèmes biologiques comme les 
artères. Un tendon est fait principalement de collagène. 


Dans un cas plus général, les ingénieurs ont pour habitude de définir les points représentés ci-dessous 
dans leurs mesures d'essais de traction: 


a 
se" 
€ Ÿ 


Résistance 
de rupture 


Limite d'élasticité 


vle-sassase ---- Limite de proportionnalité 


Contraime 
a 


DXformation . 


Figure: 34.3 - Définitions de termes importants pour l'étude des déformations 


La caractéristique ci-dessus comporte une partie linéaire comme c'est le cas d'une certaine classe de 
matériaux. Cela signifie que la pente de la caractéristique est une constante, qui reflète la déformation 
élastique du matériau sous l'effet de la contrainte croissante. Cette contrainte élastique par unité de 
déformation définit le "module de Young" (il n'y a pas de composante tangentielle dans ce cas d'étude!): 


cette relation étant valable aussi bien en contraintes de compression qu'en traction. Nous reviendrons 
sur cette relation dans les paragraphes suivants. 
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Remarques: 


R1. La "rhéologie" est une partie de la mécanique qui étudie la plasticité, l'élasticité, la viscosité et 
la fluidité caractéristiques des corps déformables. C'est une branche très importante de l'ingénierie 
industrielle. 


R2. Attention les calculs qui vont suivre sont relativement longs et difficiles et ce même si nous 
avons essayé de les simplifier au maximum. Cependant, tous les résultats nous seront infiniment 
utiles que ce soit pour déterminer l'équation de Navier-Stokes ou pour l'étude de la résistance des 
matériaux (cf. chapitre de Génie Mécanique)! 


1.2.1. LOI DE HOOKE 


Étant donnés les définitions données précédemment, nous obtenons la relation: 


M] _ Fr). 
LI= | (344) 
LL) ES 


qui est par définition la "loi linéaire de Hooke" en contrainte normale uniquement! 


Lo 


Figure: 34.4 - Illustration de l'effet d'une contrainte normale 


Il est assez intuitif de supposer que plus la force de liaison des atomes constituant le matériau étudié est 
grande, plus grande est la force à appliquer pour éloigner les atomes, donc pour étirer le corps. Les 
solides, qui ont des grandes forces de liaisons, ont une haute température de fusion (cela est approfondi 
dans le chapitre traitant de la Chimie Quantique). 


Si nous notons: 


Nous nous retrouvons avec la loi que nous connaissons: 


F=k&lA] (346) 
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qui est la force de rappel des ressorts (cf. chapitre de Mécanique Classique et Génie Mécanique). 


Mais il existe plusieurs types de contraintes avec leurs modules respectifs. Ainsi voici les définitions des 
plus importantes dans la partie linéaire de leur caractéristique avec le schéma explicatif associé: 


Figure: 34.5 - Illustration de l'effet d'une contrainte de cisaillement 


D1. Nous définissons le "module de cisaillement" ou "module de rigidité" par le rapport de la 
composante normale de la force (pression de compression) à la déformation de cisaillement: 


—= (34.7) 
€, y 


où le numérateur est appelé "contrainte de cisaillement" et où } est "l'angle de déformation". 
Généralement cet angle étant petit, nous avons l'approximation: 


8, = y =tan(p) = PA 
FA 


S est la surface de la face supérieure ou inférieure du corps déformé représenté ci-dessus. 


D2. Nous définissons le "module d'élasticité de glissement", appelé également "module de glissement" 
ou encore "module de Coulomb" par le rapport de la composante tangentielle de la force (pression de 
contrainte) à la déformation de cisaillement: 


GT a 
z. y 2(1+7) (34.8) 


où 7 est le "coefficient de Poisson" dont nous démontrerons l'origine un peu plus bas dans le présent 
texte. 


Remarquez que bien que le numérateur de la définition précédente soit une force divisée par une 
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surface, il ne s'agit pas d'une pression car la force est tangentielle (d'où le T en indice de F) à la surface. 


C'est parce que toute force peut être décomposée en une force normale et tangentielle (voir la 
définition plus haut de la pression de compression et de la pression de contrainte) que nous avons les 
deux définitions distinctes ci-dessus. Dans la grande majorité des cas de laboratoires, nous nous 
arrangeons pour avoir une force purement tangentielle (d'où le T en indice de F) ou purement normale 
(d'où le N en indice de F) à la surface S. 


Dans la pratique il n'est souvent fait usage que de la deuxième définition et ce à un point tel que cette 


ALI 


dernière est souvent assimilée au "module de rigidité” aussi. 
® Exemple: 


Une chose intéressante (pour la parenthèse...) si nous considérons que les plaques tectoniques sont en 
cisaillement entre elles nous avons alors d'après le module de glissement: 


az 
Fr=y GS=—.GS (349) 
LE 
Or pour une plaque tectonique en frottement de longueur Z, sur une hauteur H' 


lazl 
Fr = 


-C'(D-A)=6. El (Z9 À) (34:10) 


et puisque l'énergie est une force multipliée par une distance, il vient: 


E=F;.AL=|G 


[lai | 
7 | A|a- GAP.H Gain 


qui est typiquement l'énergie dégagée par le cisaillement de la friction de deux plaques tectoniques dont 
les surfaces de contact ont une hauteur moyenne H, une longueur initiale Z, et qui subissent une 


déformation de ÀZ.. 
Typiquement pour un tremblement de terre du type Sumatra (2004), nous avions: 
AL = 10 [re], 4 = 10'000 [>], Zn & 10'000 [we], G 2 10! [Pa] (24.12) 
Dès lors il vient: 
Ez=106[J] (3413) 
en d'autres termes. mille fois l'énergie de la bombe nucléaire d'Hiroshima. 
Soit en notant M la magnitude sur l'échelle de Richter: 


Ez10"4M 106 = 2276 (3414) 


alors que les estimations donnent un intervalle de 6.2 à 8.5... donc, nous ne sommes pas trop mauvais 


dans l'approche théorique. 
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Voilà pour un exemple non appliqué à l'industrie. 


D3. Nous définissons le "module de compressibilité omnidirectionnel", comme le rapport de la 
contrainte volumique à la déformation volumique (nous démontrerons plus loin les développements 
mathématiques qui amènent au dernier terme de la relation): 


get (34.15) 


E 


Nous pourrions encore définir beaucoup de modules tels que le module de flexion, de flexion pure, de 
flexion composée, de torsion... Nous étudierons certains d'entre eux plus loin. 


Pour chacune des différentes définitions de modules que nous pouvons envisager, nous pouvons définir 
une loi de Hooke qui lui est adapté. Cependant, tout cela peut paraître assez arbitraire, mais au fait il 
n'en est rien car toutes les définitions de modules que nous avons vues précédemment sont un cas 
particulier d'une relation mathématique généralisée qui sera démontrée sur ce site dans un proche 
avenir. 


1.2.2. MODULE DE GLISSEMENT 


La condition nécessaire pour qu'un solide rigide soit en équilibre statique est comme nous l'avons vue 
dans le chapitre de Mécanique Classique, que la résultante des forces que l'extérieur exerce sur le corps 
soit nulle: 


Cependant, quand un solide subit des contraintes et qu'il peut en subir, il peut y avoir déformation qui 
peut être suivie d'une rupture ou d'une modification similaire. Plus, précisément, il y a "déformation" 
d'un corps (non nécessairement solide) quand les distances entre certains points du corps ont changé. 


Lorsque dans l'étude théorique de l'élasticité, nous excluons les modifications du corps étudié telles que 
les ruptures, nous disons que nous nous restreignons aux "déformations élastiques". 


La géométrie et la physique des déformations peuvent être complexes. Leur description se déduit de 
celle d'un certain nombre de déformations élémentaires dont nous préciserons plus loin les 
caractéristiques. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Figure: 34.6 - Cube sous contraintes normales 


Les forces scalaires de contraintes de traction F,,F,,F, engendrent sur leurs faces respectives des 


tensions "normales" (perpendiculaires donc!): 


F F F 
T2 og og =—2 (3417 
S d L 
x y £ 


En admettant que la force F, agit seule, la déformation unitaire est par définition: 

g',=—? (34.18) 
Lorsqu'un parallélépipède est soumis à un effort de traction F,, il y a intuitivement contraction des 
dimensions dans la direction x. Contraction observable de façon tout aussi intuitive pour Æ,. 


Nous avons alors si À, agit seule: 


où le signe "-" indique une contraction et où 7 est un coefficient appelé "coefficient de Poisson". 


Si À, agit seule: 


mu _— T 34 20 
(2 x — Tr (34.20) 


En acceptant le principe de superposition des forces, l'effet produit par plusieurs forces agissant 
simultanément est égal à la somme des effets produits par chacune des forces superposées agissant 
séparément. Dès lors: 
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Ey =E'y+E",+E", (3421) 


Ceci est admissible, étant donné la linéarité des équations unissant la déformation unitaire et la tension 
normale. Nous obtenons alors: 


8, -=[s -7(s, +a)] (34.22) 
a --[&-r(&+c)] 


En ayant procédé de manière identique pour les deux autres directions OY et OZ. 


À partir des relations précédentes, il est aisé de trouver les équations unissant «à €: 


_ E 7 
ae la tea) 

_ Æ£ 7 _. 
Ty = TT Ê de (4,+6, +.)| (34.23) 


g.= À ë + di (4,+e +)| 
Fer 1-27 


Soit un matériau soumis à des contraintes diverses. À l'intérieur de celui-ci, nous opérons, par la pensée, 
l'extraction d'un parallélépipède rectangle. Les faces de celui-ci sont sollicitées par des contraintes 
normales & et tangentielles T (sur le schéma ci-dessous le solide est en équilibre statique). 


+ 4 


Figure: 34.7 - Illustration générique d'un matériau sous contraintes normales et tangentielles 


Les contraintes normales & et de tangentielles T représentent les actions du parallélépipède de 
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matériau Ôté mentalement sur les faces de l'élément examiné. 


Il est intéressant (dans le sens que cela facilite l'analyse) de rechercher les contraintes qui existent dans 
un plan faisant un angle 8 avec l'axe des x. Pour ce faire, nous imaginons un triangle de matière ayant 
un angle 4 au sommet enlevé hors de la matière mentalement. Nous négligerons l'effet de la pesanteur. 


Soit: 


Figure: 34.8 - Recherche des expressions des contraintes dans un plan oblique 


Posons: 
CB=ds,CA=dx, AB=dy (34.24) 
et dz étant l'épaisseur du solide (non représenté sur le schéma ci-dessus). 


Sur la longueur ds, des contraintes apparaissent et se décomposent en contraintes normales & et 
tangentielles T (ces dernières étant aussi appelées "contraintes de cisaillement" ou "contraintes de 
flexion" ). 


Le problème consiste à établir les relations entre ,T et G,,&,et T,. 


Les conventions de signes sont: 


- Les contraintes & exerçant une traction sont positives alors que les tensions & exerçant une 
compression sont négatives. 


- Les contraintes T ayant tendance à faire tourner le parallélépipède dans le sens des aiguilles d'une 
montre, sont positives. Dans le sens antihoraire, elles seront négatives. 


L'équation d'équilibre de projection sur la direction ON est: 


Gdzds — [o,dedx cos 8 + G,dzdy cos (90° - 8) +1, dedy cos 8 + T,, ddxcos (90° - 8)] = 0 


(34.25) 
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Rappelons que: 


& Fy=Sa (8426) 


Comme 4x = ds cos 8 et dy = dssin # nous avons: 


ods = G,ds sin °8 + a,dscos*®0 + tds sin cos 8 + 7, ds sin cos 8 
| (34.27) 
g=o,sin°#+o, cos*8 +7, sin 28 


comme: 
sin?8 = I=toer et cos 289 = 1Froree 34.28) 
2 
alors: 
Œ, T . 
g= 5 (1-cos28)+ ral + cos 28) + Tysin 28 (34.29) 
Finalement: 


= CG ra) EC -G,)cos28+7,sin28 (3430) 
Conclusion: En fonction de &,,&, et T,,, il est possible de calculer la tension normale qui existe sur 
une surface plane quelconque d'angle 8. 
L'équation d'équilibre de projection sur la direction de OT est: 


Tdzds — © dzdycos 8 +T_dzdy cos(90° -8)+ o dzdx cos(90° -89)-T dzdxcos8 = 0 
x LL y LL 


Tds = O,ds sin 8 cos 8 — ,dssin cos 8 —T, ds sin *8 + tr, ds cos*8 = 0 


T= (a - ©, }sin 29+T,, (cos 29 — sin 28) 


comme cos 28 — sin29 = cos 28 alors finalement: 
.! — in 289 + 28 (34.32 
= (a o, }sin Ty COS (34.32) 


Conclusion: En fonction de &,,&, et T,,, il est possible de calculer la tension T tangentielle qui existe 


sur une surface plane quelconque d'angle 8. 


Soit, à présent, la situation suivante: 
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Y 


Fig. B 


Figure: 34.9 - Mise en situation pour revenir au cas tridimensionnel 


Il s'agit à gauche d'un bloc de matière dont l'on extrait virtuellement un petit plan de forme carrée (en 
bleu sur la figure de gauche) que l'on va étudier en ne prenant en premier lieu qu'un des triangles 
rectangles le composant pour ensuite étudier l'ensemble. 


Avant la sollicitation, nous considérons donc le losange abcd qui est en fait initialement un carré à x/4 
suivant la direction OX (schéma perspective suite à la demande d'un internaute): 


Figure: 34.10 - Situation initiale 
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Pendant la sollicitation, ce losange se déforme sous l'action des contraintes tangentielles décomposées 
en contraintes de cisaillement pures et devient le losange a'b'c'd' (schéma perspective suite à la 
demande d'un internaute): 


Figure: 34.11 - Situation finale 


La diagonale bd est alors étendue et la diagonale ac est comprimée. L'angle en a qui valait 7/2 vaut 
après déformation x7/2+7% (en a'). De même, l'angle en b qui valait x/2 vaut à présent x {2-7 
(Figure A). 


ZON 


Remarque: L'angle F est appelé "angle de glissement" et nous le considérerons comme faible. 


Nous pouvons nous rendre compte de l'effet de la déformation en isolant le losange et en lui faisant 
subir une rotation de x/4. Après déformation, nous avons la forme indiquée par les lignes en pointillés 
(Figure B). 


L'angle de glissement étant petit, nous avons: 
aa" 
ad 

Donc } représente le glissement du côté ab par rapport à dc divisé par la distance entre les deux plans 


ab et dc. L'analyse qui vient d'être effectuée reste valable quel que soit le corps solide ou liquide 
considéré. 


Soit, à présent, le cas d'un solide élastique obéissant à la loi de Hooke. Le problème va consister à 
établir la relation entre l'angle de glissement F et les contraintes tangentielles T agissant sur les côtés 
du losange. 


Soit le triangle rectangle oab. L'allongement du côté à et le raccourcissement du côté oa pendant la 
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déformation s'obtiennent à partir des équations suivantes: 


£, --[< -7(a +a)] 
E, = =[ (9, + a)] (34.34) 


ë, [a -7(&+a)] 


Comme: 
Ty = OT O,=0="-T CO, =0 (3435) 

Nous avons: 

1 1+7 1 1+7  - 

a = rec) ( le et = -rq- | - L (34.36) 
Donc: 
1+ 
oa' =oatoae, = oa(1+ ,) roalt-{ 7« (34.37) 


alors la longueur oa' diminue si T augmente. 


1+ 
ob'=ob +obe, = ob (1 +e,) = ob F- De (34.38) 


donc ob' augmente si T augmente. 


Pour l'angle triangle rectangle oa'b', nous avons: 


ob june 0+7), 
” 1(x Æ y) ob! E E 
tan (oc'b") =tan|—|=+y||=igl += |=—- =—— (3439) 
212 4 2] oa (1+7) (1+#) 
oa|1- T ar 


Or: 


= 


Comme tan (Y est petit) nous avons: 


w | 
we 
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1+2  1+ dé à ee 

e E 

= (34.41) 
t=* 1- | 

: E 

Soit: 
7-17, (34.42) 
2 E 


Finalement, nous avons la relation donnant le "module de glissement", ou "module de Coulomb", que 
nous avions donné plus haut sans démonstration: 


1.2.3. MODULE DE COMPRESSIBILITÉ 


Nous reste encore à voir la provenance mathématique de l'expression d'un autre module tout aussi 
important que le module en cisaillement: le module de compressibilité # . 


Soient les équations déterminées dans l'étude précédente: 
À 
Ex -[c né, +a)] 


£, = =[ -7 (s, + c)] (34.44) 


| 
a. = fe: -7(a + c] 
Si les forces appliquées sur le cube sont égales en intensité, nous avons: 
Ty “9,0, =O (3445) 


Ce qui nous donne: 


1 g 
ë, =[e-7(o+ o)] 54727) 
ë, = [e-r(e+ o)] = FU -2m) (34.46) 
&, = [o-r(e+0)] - FU -2m) 


En sommant les termes selon le principe de superposition linéaire des forces: 
3 
étre re» Lu 27) (3447) 


Or: 
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la], JA, az 

Lo Lio Lo 

& LoLoL0 + E,EroLyo Leo + Ex Lo Zoo Lo © [AE | Zoo + AE, 
> PE, +E,+€)= AV 


RUFE TEL 


L,0L%0 di IAZ, | Lo Lo (34.48) 


 …. Ar 
DE, tE+E Na 
Finalement: 
A K1 = 2 
— = g 72) 7) (34.49) 
A E 
ce que nous notons également: 
2 Pi 27) S'#Æ (34.50) 
E 
ou encore: 
k = LA (34.51) 
T 


avec £ étant par définition le "coefficient de compressibilité". 
1.2.4. MODULE DE FLEXION 


Pour l'étude du module de flexion considérons la situation ci-dessous: 


> 


Figure: 34.12 - Exemple d'une barre en flexion 


Compression M D 
Tension 

La figure de gauche ci-dessus représente un matériau à l'état statique. La figure de droite représente le 
même matériau mais soumis à un moment de force couplé M. 


Comme le matériau subit à sa surface à la fois une compression et à l'opposé une tension, il doit donc 
exister une frontière (une ligne ou un plan) ou aucune contrainte n'existe. Cette ligne ou ce plan (c'est 
rare que nous ayons affaire à un matériau ayant uniquement deux dimensions...) est appelé "plan 
neutre". Ce plan neutre va nous servir de référence pour définir la contrainte de flexion. 


Maintenant que ce plan est défini, considérons les figures ci-dessous: 
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Figure: 34.13 - Illustration du plan de flexion pour déterminer le module de flexion 


Soir R le rayon de courbure de la barre (cylindre, plaque, parallélépipède, ...). La déformation sur le 
segment ;,.; est définie par la relation: 


Les longueurs mn et ij sont définies par: 
ÿ = nn = mm = RO (34.53) 
et la longueur à, j, par: 
hh =(R-y)d9 (34.54) 


ainsi l'expression de la déformation devient: 


de 2 Gas 


dé FE 
ce qui indique que la déformation varie de façon linéaire avec y. 


Nous pouvons définir le module de flexion par: 


Considérons l'état statique de la barre. La somme des contraintes de tractions et compressions sont 
alors nulles. Effectivement, nous le voyons bien si nous considérons le schéma ci-dessous: 
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N.A 


Figure: 34.14 - Agrandissement sur le plan de flexion 


Considérons æ4S$ la force agissante sur un élément de surface dS. Nous pouvons considérer l'équilibre 
des forces à l'état statique tel que: 


En substituant l'expression de la contrainte obtenue précédemment: 


E E 
- +48 = ps =0 (34:58) 


En supposant linéaire la caractéristique de contrainte en première approximation donc Æ =4#. 


En simplifiant un tant soit peu: 


pa =0 (34.59) 


Si nous multiplions l'intégrale par & alors la relation doit être égale au moment de force Àf appliqué tel 


que: 


Fe M (3460) 


En substituant par l'expression de la contrainte obtenue précédemment: 


E 


E 2 
M = (oods = (- “ds = xp (34.61) 


Ce qui nous amène à définir le terme: 


1 1e (34.62) 


que les ingénieurs nomment le "moment d'inertie de la barre par rapport au plan neutral" ou encore 
"moment d'inertie statique". Ce terme représente une mesure de la rigidité de la section transversale de 
la barre d'un point de vue géométrique, sans considérations des propriétés matérielles. 


Substituant cette relation dans l'équation de contrainte de flexion, nous obtenons le "module de 
flexion": 
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La difficulté pour l'ingénieur consiste souvent à localiser mathématiquement le plan neutral... 


1.3. ONDES TRANSVERSALES DANS LES SOLIDES 


Les ondes sonores transversales ou "ondes S" (ondes de cisaillement) ne se produisent que dans les 
solides. Les couches successives du milieu se déplacent latéralement sans qu'il y ait de changement de 


volume, de densité ou de pression: 


Figure: 34.15 - Exemple d'onde de cisaillement 
Le milieu se déforme de la même manière que vous pouvez déformer un livre ou une rame de papier 
posé à plat en poussant le haut horizontalement. Ni le livre, ni la rame ne changent de volume. 


L'obtention de l'équation d'onde pour des ondes transversales est presque la même que pour une corde 
(cf. chapitre de Mécanique Ondulatoire). Prenons trois minces couches planes contiguës du milieu (voir 
figure ci-dessous): 
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X À 


Figure: 34.16 - Agrandissement sur trois couches d'une onde de cisaillement 


Les centres des couches se situent en x,,x,,x, avec 


X, — Xÿ = Xÿ—X, = ÀX (34.64) 


Le déplacement transversal des trois couches adjacentes est y,,»,,»,. Les angles de déformation 


respectivement entre la couche b et la couche a, et, entre la couche c et la couche b sont au premier 
ordre en approximation de Taylor (cf. chapitre sur les Suites et Séries) 


à = act [#2 2 |: =D 


(34.65) 
8, = arctan Ver VB | Ver 
Xe — Àÿ 


Xe — Àÿ 


Si nous calculons les forces entre les couches pour un morceau de couche de surface S, nous obtenons 


A _ - ge Ya Ya 

s ax (34.66) 
FE _ - ge 7e ŸE 

5 dx 
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où G est le module de glissement du milieu. La résultante des forces est alors: 


F, = F, - À = so[22 He) (34.67) 
dx dx 


La force de la tranche F, sera égale à tout moment au produit de la masse du morceau de couche b, 
d'épaisseur dx, surface S et densité £, multipliée par l'accélération de la couche: 


2 
2 (34.68) 
&Œ }, 


Nous avons alors: 


Ce qui donne: 


Ce que nous venons de déduire pour une valeur quelconque x, , est aussi vrai pour n'importe quelle 
coordonnée: 


Il s'agit donc d'une équation d'onde de la forme (rappel) d'une équation de Poisson (plus 
particulièrement il s'agit d'une équation de d'Alembert): 


avec: 
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Les ondes transversales ne se propagent que dans les solides et de ce fait, nous ne pouvons pas les 
entendre à moins de les transformer en ondes longitudinales par des moyens mécaniques ou électriques. 
Les ondes transversales peuvent se transmettre le long d'une barre ou d'une tige quelconque ou même 
d'un fil métallique, et ceci sans besoin que ce dernier soit sous tension. Même si le fil métallique est 
sous tension, la vitesse des ondes de cisaillement ne dépend pas de la tension. C'est le module de 
cisaillement élevé de l'acier qui donne aux guitares électriques ce bruit caractéristique. 


Un autre cas remarquable d'ondes transversales (de cisaillement) est celui des ondes sismiques. On y 
trouve des ondes sismiques de cisaillement et aussi des ondes longitudinales ou de pression. Les ondes 


de cisaillement se propagent dans la croûte terrestre à 3'600 Lo. | et les ondes de pression à 


6'000 [re 57 je Lors d'un séisme ou d'une explosion atomique, les deux types d'onde seront produits, 


mais comme les ondes se propagent à des vitesses différentes, elles n'arriveront pas en même temps à 
des stations de détection lointaines. C'est à partir de cette différence des temps d'arrivée que l'on 
détermine la distance à l'épicentre. La direction est obtenue à partir de la direction des oscillations. 
Seules les stations suffisamment éloignées pour recevoir les deux types d'onde séparément peuvent 
faire la détermination de l'épicentre. 


Pour résumer, nous avons pour les ondes longitudinales dans un solide ( 


): 


et pour les ondes transversales: 


Pour les détails des développements mathématiques concernant les gaz et les solides, le lecteur devra se 
rendre dans le chapitre de Musique Mathématique (Acoustique). 


2. LIQUIDES 


Les fluides usuels sont de deux types: les liquides et les gaz (les solides sont aussi parfois considérés 
comme des fluides. ce n'est qu'une question d'opinion...). Étymologiquement, un fluide est susceptible 
de s'écouler. Le liquide adopte la forme du récipient qui le contient tout en conservant un volume 
propre à peu près invariable. Le gaz n'a pas de volume propre: il envahit uniformément (mécanique 
statistique de Boltzmann) le récipient dans lequel il est maintenu. Une atmosphère en constitue un cas 
spécial, du fait qu'elle est maintenue par la gravité à la périphérie d'un astre, ce qui exclut l'uniformité 
de la densité ou pression. 


La distinction entre liquide et gaz est subtile. Nous pouvons cependant dire que le volume propre des 
liquides manifeste l'existence d'une cohésion liée à une densité assez grande (liaisons de Van der 
Waals); cette cohésion disparaît avec le volume propre chez les gaz. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Si nous comparons les fluides avec les solides, la première remarque qui s'impose concerne l'isotropie 
(les propriétés sont les mêmes dans toutes les directions spatiales) des fluides usuels qui est toujours 
réalisée (si nous n'agissons pas sur le fluide en tout cas!). 


Nous allons aborder la théorie de la mécanique des fluides en difficulté croissante et par redondance. 
D'abord, il va être démontré que les propriétés d'un fluide statique sont isotropes (théorème de Pascal). 
A l'aide de ce résultat, il va être plus simple de comprendre le théorème de Bernoulli qui va nous 
permettre, entre autres, de définir le concept de "pression hydrostatique". Ensuite, nous construirons un 
modèle très important de la dynamique des fluides, connu sous le nom de "équations de Navier-Stokes", 
que l'on retrouve dans tous les domaines possibles (astrophysique, mécanique quantique, 
météorologie,..). Ce modèle de dynamique des fluides est conséquent en développements théoriques et 
résultats expérimentaux et peut être considéré comme un terrain difficile. Cependant, pour faciliter la 
lecture, nous avons choisi de ne pas aborder celui-ci directement par usage du calcul tensoriel. Nous 
avons ainsi fait en sorte que les variables tensorielles apparaissent d'elles-mêmes d'écoulant des 
résultats simples de l'analyse vectorielle que nous obtiendrons. Une fois les équations de Navier-Stokes 
déterminées et démontrées, nous verrons que nous pouvons retrouver l'expression du théorème de 
Bernoulli à partir de ces mêmes équations. 


La dynamique des fluides, ou "hydrodynamique", est de loin, le domaine de la mécanique classique le 
moins aisé en ce qui concerne la description et la prédiction. C'est pourquoi le théorème de Bernoulli 
s'utilise fréquemment, non pour expliquer en détail le comportement d'un fluide, mais pour en faire une 
description qualitative. 


2.1. THÉORÈME DE PASCAL 


Le résultat qui va suivre est de la plus haute importance pour comprendre l'ensemble de la mécanique 
des fluides. Il faut prendre le temps de comprendre! 


e 
red: 


Si nous considérons les forces s'exerçant, en l'absence de mouvement, sur un tétraèdre élémentaire 
OABC de volume élémentaire V, il est toujours possible d'adopter un volume suffisamment petit pour 
avoir une pression uniforme s'exerçant sur les faces du tétraèdre. 
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Soient #,,8;,8:,P, les pressions de réaction du fluide dues aux contraintes extérieures sollicitant les 


faces respectives OBC, OAB, OAC et ABC de surface S'onn, Saunas - SOient également les cosinus 


directeurs (cf. chapitre de Calcul Vectoriel) du vecteur unitaire ;; normal à la surface ABC. 


Le système étant en équilibre, la résultante £ des forces de réaction du système est nulle. Nous avons 
donc les équations suivantes résultant de la projection suivant les trois axes de coordonnées: 


R, = A1 Soc — P'Sosc © 0 
R, = Ba'Sou — P'Sou = O (34.78) 


y 
Re = B3' Soc PS © 0 


= 


Par simplification élémentaire, il vient: 


Nous obtenons alors la relation suivante: 


P= Puy = Pas = P33| (84.80) 


Conclusion importante: en un point quelconque d'un fluide, la pression est indépendante de la direction 
de la normale # à la surface élémentaire sur laquelle elle s'exerce. 


Par le principe de l'action et de réaction de Newton, nous sommes amenés à énoncer le "théorème de 
Pascal": 


Les fluides incompressibles transmettent intégralement et dans toutes les directions, les pressions qui 
leur sont appliquées. 


Ce théorème est fondamental aussi bien en mécanique des fluides qu'en mécanique des gaz et les 
implications pratiques sont énormes (ce théorème explique entre autres, que la pression est 
indépendante de la géométrie du contenant du liquide)! 


2.2. VISCOSITÉ 


En mécanique des fluides, il est utile de considérer plusieurs types fluides ayant des caractéristiques qui 
les différencient. Ceci s'avère particulièrement pratique pour les simulations tout en restant conforme à 
l'observation expérimentale (cf. chapitre de Génie Météo Et Marin). 

Nous définissons la "viscosité" Æ par les forces internes s'opposant au déplacement des diverses 
couches composant le fluide. Nous distinguons la "viscosité dynamique" #4, et la "viscosité 


cinématique" {4 . 


1. La viscosité dynamique: 


ki 7 = (34.81 

ne 34.81) 

© Avas 
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avec {{, étant le coefficient de viscosité dynamique (l'unité étant le Poiseuille [PI]), dF variation de la 


force de frottement entre deux couches infiniment voisines, 4v variation de la vitesse par la distance 


entre deux couches infiniment voisines [5"}] et dS étant la surface considérée [;#° ]. 


Conclusion: le Poiseuille est la viscosité d'un fluide nécessitant 1 Newton pour faire glisser à la vitesse 
de 1 mètre par seconde, deux couches fluides de 1 mêtre carré distantes de 1 mètre. 


Remarque: Anciennement, l'unité employée était la "poise": 1 [P]=107! [F7] 


2. La viscosité cinématique est définie par: 


Hi, =—| (34.82) 


Une transformation de la définition de la viscosité dynamique donne (il faut se rappeler de cette relation 
pour plus tard !!): 


dF 
T=—=n,8v 
ds Ha £ 


Soit: 


1 
DV=—T (34.84) 
H à 


Par définition les fluides ayant les caractéristiques suivantes: 


Figure: 34.18 - Caractéristiques de viscosité de différentes fluides 
sont nommés respectivement: 


- (1) Fluides pseudo-plastiques 
- (2) Fluides newtoniens (contraintes de cisaillement proportionnelles au gradient de vitesse) 
- (3) Fluides dilatants 


Il existe encore 3 autres types de fluides non représentés sur la figure et dont la viscosité est supposée 
nulle (cf. chapitre de Thermodynamique): 
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- (4) Fluides parfaits 
- (5) Fluides semi-parfaits 
- (6) Fluides réels 


Remarques: 


R1. Le comportement d'un fluide parfait est très différent de celui d'un fluide réel aussi petite soit la 
viscosité de ce dernier. En effet, le fluide parfait, parce qu'il n'a pas de viscosité, ne dissipe jamais 
l'énergie cinétique. Alors qu'un fluide réel très peu visqueux la dissipe efficacement grâce à la 
turbulence, et au phénomène de cascade qui l'accompagne. 


R2. Nous reviendrons sur les propriétés de la viscosité dynamique et cinématique lors de la 
démonstration des équations de Navier-Stokes-(Reynolds). 


R3. Les fluides qui ne sont pas newtoniens sont appelés en toute généralité dans la littérature 
"fluides non-newtoniens".… et nous ne traiterons pas les ferrofluides ici car trop complexes 
théoriquement à analyser. 


Les fluides non-newtoniens ont donc une déformation qui dépend de la force que nous leur appliquons. 
Le meilleur exemple est celui du sable mouillé en bord de mer: quand nous frappons le sable, il a la 
viscosité élevée d'un solide, alors que lorsque nous appuyons doucement dessus, il se comporte comme 
une pâte. Par ailleurs, certains fluides non-newtoniens ont des propriétés telles qu'il est possible pour un 
individu de courir dessus sans couler ou de couler en restant en position. 


2.2.1. LOI DE POISEUILLE 


En 1835 un médecin français, Jean Léonard Marie Poiseuille fit une série d'expériences soignées, pour 
déterminer comment un fluide visqueux s'écoule dans un tuyau étroit. Son but était de comprendre la 
dynamique de la circulation sanguine chez l'homme. Le plasma du sang se comporte comme un fluide 
newtonien, tandis que le sang entier ne l'est pas. Presque la moitié du volume normal du sang est faite 
de cellules assez grandes pour perturber l'écoulement laminaire, surtout quand elles entrent en contact 
avec les parois des vaisseaux, un phénomène qui prend de l'importance dans les capillaires très étroits. 
Néanmoins, l'analyse de Poiseuille s'applique à l'écoulement dans les veines et les plus grosses artères et 
elle a une grande valeur, bien qu'elle soit un peu simpliste. 


Le résultat de Poiseuille peut être établi en considérant le fluide dans un tuyau comme formé de 
couches cylindriques orientées selon un axe x de rayon r concentriques qui se déplacent à des vitesses 
qui vont en décroissant à partir du centre (symétrie circulaire supposée). 


Alors la relation définissant la viscosité s'écrit: 


dv 


x 


F=iS 
Xa 7 


Ce qui nous donne la force de viscosité sur le cylindre. La surface de contact de chaque couche 
cylindrique de longueur l est donnée par $ = 2#ri et donc: 
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dv, 


F = 4,277 (34.86) 
dr 


L'origine de l'accélération (in extenso de la force) ne peut se faire que par une différence de pression 
telle que: 


APS = AP'xr =#F (3487) 
ce qui nous amène à écrire: 


APrrr? = y, 277 we 
dr 


= dv, = rdr (34.88) 
” ui 


En intégrant membre à membre, nous obtenons: 


Y 2 
[a sr [rar (34.89) 
2Hgl J 


Soit: 


AP, 
v = —{(R?-7r2)) (3490) 


La courbe représentative de la vitesse en fonction de r est une parabole dont le sommet se situe sur 
l'axe centre du cylindre (> = 0 ). Le débit volumique transporté par une couche cylindrique entre r et 
r + dr est dJ =v,dS = v,(27rrdr) . Aïnsi, le débit total est: 


À AP 
J = Perl R?-r rar (3491) 
Jaul 


et nous obtenons la "loi de Poiseuille" pour le débit laminaire visqueux: 


=———| (34.92) 


Nous trouvons donc le résultat logique que le débit augmente avec le gradient de pression AP/{ et le 
rayon du tube, et diminue avec la viscosité. 


Nous trouvons par ailleurs une relation analogue à la loi d'Ohm (cf. chapitre d'Électrocinétique) où la 
différence de potentiel est donnée par la résistance multipliée par le courant alors que la différence de 
pression est donnée par la résistance visqueuse multipliée par le débit. 


2.3. THÉORÈME DE BERNOULLI 


Quand nous discutons du mouvement d'un fluide, l'équation de continuité (cf. chapitre 
Thermodynamique), qui exprime la conservation de la masse (volumique) du fluide est une notion 
importante. 
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BP Go(p°5,) =0| (34.93) 


Considérons cette équation dans le cas particulier qui nous intéresse ici un fluide non visqueux en 
écoulement laminaire se déplaçant à l'intérieur d'un tube de lignes de courants parallèles (le mouvement 
du fluide est de type irrotationnel - voir chapitre de Calcul Vectoriel), délimité par la surface À: 


Figure: 34.19 - Fluide non visqueux en écoulement laminaire d'un tube de lignes de courants parallèles 


Nous sommes en régime stationnaire (l'aspect du mouvement est indépendant du temps) et la masse 
n'est ni apportée par une source ni enlevée par un puits à l'intérieur de la région considérée. Le volume 
de fluide qui traverse 4 dans l'intervalle /# correspond à un cylindre de base 4, de longueur », : Â# 


et donc de volume À :, : #. La masse de fluide qui a traversé 4 pendant le temps A est donc: 
A'A'v'Aé (3494) 

De même: 
Æ'A'v'AM (8495) 


est la masse de fluide qui a traversé 4, pendant le même intervalle de temps. Avec les hypothèses 


faites, l'équation de conservation de la masse exige que les deux masses soient les mêmes, ou exprimé 
autrement: 


A'A' A =2'A'v'A (34.96) 
D'où: 
A'A' nu" 4% (34.97) 


Ceci est la forme de l'équation de continuité dans le contexte qui nous intéresse. De plus, si le fluide est 
incompressible, la densité est partout la même et l'équation précédente se réduit à: 


A'n=A'Y (3498) 


Considérons maintenant une région dans un fluide où il y a un flux stationnaire comme l'indique la 
figure ci-dessous: 
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Figure: 34.20 - Agrandissement sur une région du fluide 


Pendant un court intervalle de temps As, le fluide qui, initialement, traversait 4 a progressé jusqu'à 
une surface 4 à la distance Ax, = », ‘ Æf tandis que le fluide qui traversait 4, se retrouve en 4, à une 
distance Âx, . Puisque le reste du volume entre les surfaces 4 et 4, reste inchangé, nous allons porter 


notre attention sur les deux volumes (égaux) hachurés sur la figure. 


Ces deux volumes sont égaux, car le fluide est incompressible et l'équation de continuité est valable. 
Soient Æ et F, les forces exercées sur les surfaces 4 et 4, en raison de la pression existant dans le 


fluide. À cause de ces forces, le fluide produit ou reçoit du travail en déplaçant les deux volumes. En 
A4, la surface est poussée par le fluide et le travail exercé sur le fluide est Æ ‘ Âx alors qu'en 4, le 


fluide pousse la surface et le travail effectué par le fluide est Æ, ‘ Âx. Le travail total exercé sur le 
volume de fluide situé entre 4 et À, est donc: 


W=F'A-F,Ax = B'A'Ax-E'A'Ax, (3499) 
en appelant & et & les pressions respectives en 4 et À et en écrivant: 
F=P:A (34.100) 
d'après la définition de la pression. Comme: 
A'Ax = A'Ax, (34101) 
d'après l'équation de continuité et l'hypothèse d'incompressibilité, nous pouvons écrire que: 
W=(R-E2) A'Ax (34102) 


Le travail extérieur exercé sur le système change son énergie propre comme l'établit la 
thermodynamique (#7 = AT} ). Pour le volume de fluide considéré, l'énergie propre des volumes mise en 
évidence comprend l'énergie cinétique et l'énergie potentielle de gravitation. Le fluide entre 4 et 4, 


gagne de l'énergie dans le volume 4, : x, . Supposons que les deux volumes aient une masse égale m, 
de nouveau à cause de l'équation de continuité. Alors le gain net d'énergie est: 


l 1 
AU = EE, 0, (5m mes] (5m +m es) (34.103) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Puisque nous avons déjà supposé le fluide incompressible, la densité £ est la même partout et m peut 
être remplacé par £' A4,’ x, aux deux extrémités. D'où: 


AU = ÊE ea] (Fes +0: | ‘A'Ax (34104) 
En combinant cette relation avec # =(Æ#-2£,): A4:Ax nous obtenons: 
ei LR . 
or ris ss PUrTPE . 5 P% +9'g'z| (34105) 


ou: 


roûtpeatR=rovtpezte (34.106) 


Comme l'équation ci-dessus concerne des grandeurs prises en deux points arbitraires le long d'une ligne 
de courant, nous pouvons généraliser et écrire: 


se +0 g'z+P=c*| (34107) 


Ce résultat, connu sous le nom de "théorème de Bernoulli", exprime la constance de la pression le long 
d'une ligne de courant dans un fluide incompressible, irrotationnel et non visqueux et où les forces 
volumiques extérieures dérivent d'une énergie potentielle (nous reviendrons là-dessus après avoir 
déterminé les équations de Navier-Stokes). 


Signalons aussi une manière élégante et simple de retrouver cette relation. La conservation de l'énergie 
nous donne le long d'une ligne de courant: 


E,+£E,+EÆEp=c"* (84108) 


avec respectivement et dans l'ordre la somme de l'énergie cinétique, de l'énergie potentielle et de 
l'énergie de pression. Soit: 


l 
Eu +mg+F.d=6c" (34109) 
et si nous divisons tout cela par le volume, nous obtenons alors: 
1 2 - #8 a, . 
3 +og+P=c" (34110) 


voilà... 
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Remarques: 


R1. D'une ligne de courant à l'autre, c'est la valeur de la constante qui change. De plus, l'utilisation 
du théorème de Bernoulli exige de connaître la forme des lignes de courant. 


R2. La conservation de la quantité de gauche exprime la conservation de l'énergie le long d'une 
ligne de courant et nous y trouvons respectivement l'énergie cinétique volumique, l'énergie 
potentielle volumique de pesanteur et la pression. 


Considérons maintenant deux applications importantes du théorème de Bernoulli. 


Si le fluide se déplace dans un plan horizontal, l'énergie potentielle de gravitation reste constante et 
l'équation de Bernoulli se réduit alors à: 


1 dx Ÿ t 
—'p'|——| =6*) (34111) 
2 F a) 


Donc, dans un tuyau horizontal, la vitesse est d'autant plus grande que la pression est plus faible et 
réciproquement. Nous utilisons aussi cet effet pour participer à la poussée d'un avion (attention ce 
paramètre est mineur, car ce n'est pas ce qui contribue le plus au vol d'un avion, c'est l'effet Magnus 
dont la démonstration sera donnée plus loin un jour...). 


Vitesse plus grande, 
pression plus faible 


Force 
résultante 


Vitesse plus petite, 
pression plus forte 


Figure: 34.21 - Illustration du profil d'une aide avec les pressions correspondantes 


Le profil d'une aile est construit de telle sorte que l'air ait une vitesse plus grande au-dessus de la 
surface de l'aile qu'au-dessous, ce qui produit une pression plus forte au-dessous qu'au-dessus. Il en 
résulte donc une force résultante vers le haut. 


Autrement dit, une spécialiste dans l'aérodynamique (pour les avions) ou en hydrodynamique (pour les 
stabilisateurs de roulis des gros bateaux) dirait: 


- À l'extrados: Par effet de courbure, les particules d'air (d'eau) sont contraintes de parcourir une 
distance plus grande. Leur vitesse va donc d'abord s'accroître fortement pour diminuer ensuite afin de 
retrouver au bord de fuite la vitesse initiale de l'écoulement. Tout l'extrados est donc le siège d'une 
dépression locale généralisée. La couche limite, d'abord laminaire, devient peu à peu turbulente, voire 
tourbillonnaire lorsqu'on s'approche du bord de fuite. 
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- À l'intrados: le profil constituant un obstacle à l'écoulement, l'air (l'eau) va se trouver freiné: nous 
voyons donc apparaître une surpression localisée sur l'intrados. En fait, avec la forme des ailes d'avion 
actuelle, en position horizontale, l'effet Bernoulli serait négligeable. Pour qu'un avion décolle, il faudrait 
que l'extrados ait une surface beaucoup plus grande. 


C'est bien mieux ainsi non ? 


Autre chose encore, si le fluide n'est pas en mouvement, nous avons l'équation de Bernoulli qui s'écrit: 


2-g.z+P=c" 


Il s'agit de "équation de Laplace" en hydrostatique (utilisée dans les vases communicants). 
2.3.1. THÉORÈME DE TORRICELLI 


Le théorème de Torricelli permet de déterminer la vitesse d'écoulement d'un liquide. C'est un cas 
classique d'étude dans les petites écoles. 


Considérons un volume fermé contenant un liquide de masse volumique & et muni d'un orifice de 
surface $,, duquel le liquide coule vers l'extérieur. Nous voulons déterminer la vitesse v, d'écoulement 


du liquide de cet orifice. Le volume est supposé être assez grand pour que ni le niveau du liquide, ni la 
pression P au-dessus de sa surface $, ne varient de façon appréciable pendant l'écoulement. Comme le 


tube d'échappement de liquide va de la région de la surface du liquide à l'orifice ouvert à l'air libre, nous 
avons À = P. Un liquide coulant à l'air libre est à la pression atmosphérique, À = P, , car le liquide est 


entouré d'air libre et rien ne peut maintenir une différence de pression. D'après l'équation de Bernoulli, 
avec Zz, -Z, =», nous trouvons sur une ligne de courant: 


1 1 
P+ SPù + ogh = Fat sen, 


d'où: 


APE 
a =" PC RE a) +2gh 
2 


De l'équation de continuité (v,$, = v,$, ), nous déduisons que si $; > $, alors v, >», et vŸ est alors 
négligeable devant v?. Dans le cas particulier, mais fréquent, où le réservoir est ouvert à l'air libre ( 
P = P,), la densité d'énergie de pression disparaît. Le fluide coule sous l'effet de la gravité, sans être 


poussé par une différence de pression. Nous trouvons alors (en multipliant par la surface de l'orifice, 
nous obtenons le débit): 


Cette relation constitue le "théorème de Torricelli". Chose curieuse, nous avons déjà vu cette relation 
en mécanique classique pour la vitesse de chute libre d'un corps. Il en retourne l'observation faite par 
Torricelli: si le jet est dirigé directement vers le haut, il atteint presque le niveau de la surface du liquide 
dans le volume. La raison pour laquelle le jet n'atteint pas effectivement ce niveau est une certaine 


perte d'énergie à cause du frottement. 
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2.3.2. EFFET VENTURI 


Certaines applications pratiques de la mécanique des fluides résultent de l'interdépendance de la 
pression et la vitesse. Il y a une catégorie de situations dans lesquelles la variation d'énergie potentielle 
gravitationnelle est négligeable. L'équation de Bernoulli relie alors la différence de pression à la 
différence d'énergie cinétique donc la variation du carré de la vitesse. 


Nous considérons un fluide incompressible (!), non visqueux et de masse volumique € . Le fluide 
s'écoule en régime permanent dans une canalisation cylindrique de rayon À, et de section £; suivie par 


un tube cylindrique de rayon À, et de section #;, . Le raccordement est fait par une canalisation 
conique assez longue pour que l'on reste en régime laminaire. 


Nous savons (équation de continuité) que: 


qui veut dire, comme nous l'avons vu, qu'une diminution de la section traversée par le fluide se traduit 
par une augmentation de sa vitesse. 


Dans toute situation où le flux entrant est environ au même niveau que le rétrécissement z, Zz,, 
l'équation de Bernoulli s'emploie pour exprimer la différence de pression: 


1 1 
R+=pû +0mMm"E +52 +2&a (3417) 


devient: 


Utilisant l'équation de continuité, pour éliminer v,, nous obtenons: 


LE 


2 
de sd - = 


= 
Si 


(34.119) 


Comme &, > #, le second membre de la relation est positif et Æ# > & : il y a donc une chute de pression 
dans la région étroite. En arrivant à la région divergente à nouveau en $, = $,, la pression du fluide 


augmente de nouveau et la vitesse reprend sa valeur initiale. Cette diminution de la pression qui 
accompagne l'augmentation de la vitesse est appelée "effet Bernoulli" ou "effet Venturi". 


Ainsi, la vitesse du fluide augmente dans un goulot d'étranglement pour satisfaire l'équation de 
continuité (conservation du flux/masse) et le fait qu'il soit incompressible (sinon il y aurait une sorte de 
bouchon...). 
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Remarque: Paradoxalement l'effet Venturi se produit aussi lors du franchissement d'un sommet ou 
d'une crête par l'air atmosphérique ou également dans les rues des villes. En effet, l'air qui arrive sur 
la montagne ou la crête à tendance à "s'é 


s'écraser" dessus. La section d'écoulement de l'air au sommet 
est donc plus faible qu'à la base. Il se produit donc également un effet Venturi: la vitesse du vent est 
plus élevée sur les sommets et les crêtes qu'en bas (les professionnels du planeur en savent quelque 
chose.…..). 


2.3.3. TUBE DE PITOT 


Le tube de Pitot permet la mesure de la vitesse d'écoulement d'un gaz subsonique. Le tube de Pitot 
consiste à pratiquer dans un tube, un orifice de prise de pression en A et en B: 


Figure: 34.22 - Tube de Pitot 


Le point A est un point d'arrêt, car la vitesse y est nulle (il n'y a pas d'écoulement dans l'orifice, c'est 
juste une prise de pression). Loin de l'obstacle (le tube de Pitot) l'écoulement est supposé uniforme de 
vitesse v et de pression À; . 


En A (point d'arrêt), en utilisant la relation de Bernoulli le long de la ligne de courant et en considérant 
la variation de hauteur entre A et B négligeable, la pression vaut: 


Pa = P3+ se (34.120) 


Nous avons donc: 


= 2(247 À) (34.121) 


re) 


Donc pour les avions à partir de la différence d'une mesure de pression et de la connaissance de la 
densité du gaz, il est possible de connaître la vitesse! 


Remarque: En aéronautique, la pression dynamique s'ajoute à la pression statique pour donner la 
pression totale qui peut être mesurée au point de vitesse nulle du tube Pitot. En enlevant la pression 
statique, on trouve la "pression dynamique". 


2.3.4. PERTE DE CHARGE (PRESSION) 


Lorsque, dans un écoulement d'un fluide parfait, il n'y a aucune machine (ni pompe ni turbine) entre les 
points (1) et (2) d'une même ligne de courant, la relation de Bernoulli peut s'écrire sous la forme 
suivante : 
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l 
(2 -w) +P8(22-2)+(R-A)=0 (64122 


Lorsque le fluide traverse une machine hydraulique, il échange de l'énergie avec cette machine sous 
forme de travail pendant une durée donnée. La puissance P échangée est alors (cf. chapitre de 
Mécanique Classique): 


où par convention, si P > Q l'énergie est reçue par le fluide (pompe) sinon, si P < Q l'énergie est 
fournie par le fluide (turbine). 


Si le débit-volume est @,,, la relation de Bernoulli s'écrit alors logiquement: 


1 
SPL) +08 (2-2)+(B-A)= 2 Gas 


P 
e? 


Un fluide parfait n'existe pas. Lors d'un écoulement dans une conduite, les forces de frottement 
dissipent une partie de l'énergie cinétique et potentielle ce qui se traduit par l'existence de pertes de 
charges dont il s'agit de tenir compte. 


Considérons un écoulement cylindrique horizontal stationnaire et incompressible. Si nous appliquons la 
relation de Bernoulli entre l'entrée et la sortie, nous obtenons: 


Æ = B (34.126) 


Or, expérimentalement, nous observons qu'il faut imposer une pression plus importante en entrée pour 
entretenir le régime permanent. En effet, les forces de viscosité résistent à l'écoulement. Il faut donc 
imposer une suppression ÀF. que nous appelons "perte de charge en pression" et qui est due à 


l'existence de forces de frottements (viscosité) ou de pertes singulières (géométrie des circuits de 
distribution). 


L'équation de Bernoulli généralisée s'écrit alors dans ce cas d'étude qui fait partie de l'ingénierie des 
procédés: 


F1 
SP +084 +À Ti 5 +Pg2+P+AË, (34127) 


Cette relation est souvent utilisée dans l'étude théorique (...) des problèmes de conduite. 
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2.4. ÉQUATIONS DE NAVIER-STOKES 


Soit un parallélépipède élémentaire extrait d'un fluide statique à l'équilibre de dimensions dx, dy, 

dz représenté à la figure ci-dessous. La matière à l'équilibre composant le parallélépipède est en général 
soumise à des forces de volume dans toutes les directions (théorème de Pascal) dont les composantes 
sur les trois axes orthogonaux sont représentées sur la figure ci-dessous (ces forces peuvent être de 
nature gravitationnelles, électromagnétiques ou inertielles…). 


Figure: 34.23 - Parallélépipède élémentaire extrait d'un fluide statique à l'équilibre 


Remarques: 


R1. Il est important de remarquer que les composantes de tous les vecteurs visibles sur la figure 
ci-dessus sont exprimées en newton par unité de surface, soit en d'autres termes par unité de 
pression (qui est l'unité de la contrainte pour rappel...). 


R2. Il est important d'être attentif au plus haut point à ce qui va suivre car certains des résultats que 
nous obtiendrons ici seront réutilisés dans le chapitre de Relativité Générale pour comprendre le 
tenseur d'énergie-impulsion!! 


Nous pouvons, comme nous l'avons représenté ci-dessus, décomposer et translater l'ensemble des 
forces auxquelles est soumis le parallélépipède aux centres des faces de ce dernier. Nous représentons 
bien évidemment chacune des contraintes sur chacune des faces comme la somme des contraintes 
normales et tangentielles telles que nous l'avions fait pour l'étude des solides sous contrainte (selon les 
trois axes toujours, d'où la somme de trois composantes!). 


Au total, nous nous retrouvons avec 18 composantes de contraintes normales et tangentielles: 
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Brtit = Pngsr se - 
x px F7 HR ds 2 x # Ex — 4S 
THE += TE + +T Es (419 
Le J 7x FAN : y æ # FAN 
CR ES ES 
ds ds 


Nous cherchons à minimiser le nombre de composantes normales afin de déterminer quelles sont les 
contraintes suffisantes sur chacun des axes. Ainsi, nous poserons: 


x x X 

= el À )/ r 
T, +, = y (34.129) 
us 1 — % 
Et, Oz 


Donc trois composantes suffisent pour connaître les forces de contraintes normales aux surfaces selon 
chaque axe. 


Si nous effectuons la somme des moments de forces par rapport aux centres de gravité pour chaque axe 
de symétrie du parallélépipède (XX",YY',Z2") il est évident que sur les 12 composantes tangentielles, 6 
suffisent pour décrire l'ensemble du système. 


Ainsi pour le plan XOY passant par le centre de gravité nous avons: 


D 
= SAVE +80) + Eu + 6)] = Sd [En + En] © Sd Exor 
Pour le plan XOZ: 
L dx pu dz je, dx fa az 
(en dar) + (did) + (rt, dep) + (8 dx) 
1 =! æ 1! #1 #1 Il … 1 ee 
- STE, +r pre = Sd [x +] Fe 


Pour le plan ZOY: 


=" dz =!" dy = az =" dy 
( a drdy) + (7 » dde)" "+ (T ddr) + (T y dr) = 


Ex 


1 Æ=tt =" Æ = 1 Æ + 1 Ps 
= S[E RER ET CES: | = 47 | Ex +] 5 Eror 


Donc pour chaque plan (XOY, ZOY, ZOX), une composante suffit pour décrire l'ensemble de moments 
de forces. 


Ainsi, par souci de simplification d'écriture, nous poserons (il est plus conforme de faire les 
développements avec des indices en minuscules): 
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Tror Ty x x 
Lez = Tu €t Oy = D, (34.133) 
Toy ln Or 


Au total, cela nous fait donc 3 composantes tangentielles plus 3 composantes normales qui sont 
suffisantes et nécessaires pour décrire les contraintes sur le parallélépipède selon chaque axe du plan de 


symétrie de ce dernier: 


Nous pouvons obtenir les mêmes composantes d'équilibre en considérant cette fois un tétraèdre régulier 
élémentaire (extrait du cube) statique. Le but étant de démontrer que nous retrouvons bien les 6 


composantes déterminées précédemment. 


Figure: 34.24 - Tétraèdre régulier élémentaire extrait d'un fluide à l'équilibre 


Remarque: Il est important d'observer à nouveau que les composantes de tous les vecteurs visibles 
sur la figure ci-dessus sont exprimées en newton par unité de surface, soit en d'autres termes par 
unité de pression (qui est l'unité de la contrainte pour rappel...). 


Pour connaître l'aire des faces OAC, OBC, OAB , nous multiplions la surface ABC (notée ci-après: S) 


par le cosinus de l'angle que forment les vecteurs &, et f};. 


Effectivement, soit les surfaces: 


s DA et g= 7" AC H'Chcos(ri4) LR LE N2 ss 
RE 2 2 LE 


Cependant, nous cherchons à exprimer les $; en fonction de S. Le schéma ci-dessous (coupe du 


tétraèdre) devrait aider à comprendre le raisonnement: 
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pg=7xr-rÎ2-80,=r/2-8, (34.136) 


et donc: 
sin(@) = 5 =san(r/2-8 )=cos(8,) (34.137) 
Fe) 7 it , ) = cos(&, 
Finalement: 
_ À cos 8, A id 
ë 2 
Le rapport: 
A cos8, À 
5 cos 4 
P 2 y 
5 ——— = (34.139) 
S 
2 
d'où: 


S 
Sy =—=Cos@, (34.140) 


TR 


Le principe d'analyse étant le même pour toutes les autres surfaces telles que: 


S, = Le ne de. A SE & (34.141) 


2 V2 2 
Nous écrirons donc: 


cos 4 cos 4 


. 


=n (34.142) 


tel que: 


Sy SES, =S'mM,S, = SR (34.143) 
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Remarque: Nous pouvons facilement connaître les valeurs des & à l'aide de l'analyse vectorielle. 
Effectivement, le plan ABC étant d'équation: 


axtbytez+td=0,a=b=c=1, (34.144) 
en simplifiant par Z, : 
l'xtl'y+lz+d'=0 (34.145) 
Le vecteur normal au plan étant bien: 
N=(LLD (84.146) 


pour connaître les cosinus de l'angle du vecteur normal avec les &,, il suffit d'assimiler ces derniers 
aux vecteurs de base ;, LE tel que (trigonométrie élémentaire): 


F1 _ 1.0.0) | 


= ——7 "> (34147) 


2 A 


eten procédant de même pour tous les autres 8. 


L'équilibre des forces nous donne: 
NS - Oo S"T-Tt, S'm-Tt,. Sn = 0 (34.148) 
Après simplification: 
N,=0,1+1,,mt+t,,n (34.149) 


Suivant les autres axes: 


NW =T i+OomtT,.n 

tr 
POLE °° (34.150) 
N, = Toul ttryMt OA 


Soit en résumé: 


N, = 01 +tomt Ten 
À, = Ty +Om+tTe# (34.151) 


N = Le + Ty + On 


En utilisant la représentation matricielle, nous obtenons: 


, Ox Ty ||} 

= er p] 
N, Tr Oyy Lys || (34152) 
A] [tm %, [7 
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Soit en notation indicielle les contraintes normales et tangentielles sont données par la relation 
traditionnelle suivante (où nous ne distinguons plus ce qui est tangentiel de ce qui est normal donc il y a 
une perte de clarté): 


N,=0,n,= 2%; (34.153) . 
J 


Nous voyons apparaître une grandeur mathématique &,; ayant 9 composantes, alors qu'un vecteur dans 
le même espace jp° en possède 3. Nous connaissons ce genre d'être mathématique que nous avons déjà 
étudié en algèbre dans le chapitre de Calcul Tensoriel. La grandeur &;; est appelée "tenseur des 


contraintes du second ordre". En outre, certaines composantes peuvent être égales (&G;; = &;,sii * j) 


, ce qui le rendrait symétrique. Il ne possède alors plus que les 6 composantes distinctes, relativement 
aux nombres de composantes suffisantes pour décrire totalement un système à l'équilibre. 


Pour étudier les déformations d'un milieu continu tel qu'un fluide, nous considérerons d'abord le cas de 
très faibles déformations. Les petits déplacements 7 d'un point seront représentés par u, v, w parallèles 
aux axes d'un référentiel OXYZ. Nous admettons que ces composantes sont des quantités très faibles 
variant d'une façon continue dans le volume du corps considéré. 


Soit un segment linéaire OP situé dans un solide avant déformation. Dans un référentiel OXYZ, nous 
noterons x,Yp:Zp €t Xy»9,:Z, les Coordonnées de O et P. 


Pendant la déformation, la ligne OP devient O'P' tel que représenté ci-dessous: 


Figure: 34.25 - Segment linéaire dans un solide avant et après déformation 
Soient #,,V5,Ww, les déplacements du point O parallèlement aux axes OX, OY, OZ et 


u,,V,,w, les déplacements du point P parallèlement aux mêmes axes. 
Les coordonnées des points O' et P' sont alors: 

(x + 40,30 + VoZo + Wo) et (x, LL PP PR w,) (34.154) 
Avant déformation, soit L la longueur OP : 


Après déformation, nous avons une longueur L' valant: 
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[= [(x, +u,)- (x +x)] 4 [0 +v,)- (0 +»)] 4 [(2, +w,)-(2 + )] (34.156) 
Si ÂZ est l'allongement de l'élément OP pendant la déformation, nous avons: 
LT =(L+AL) = P+2LAL+APË (4157) 
En effectuant les quelques transformations suivantes: 
L=B+2LAL+AË- 
[6 + u,) +(% +4) 2x, +u,) (o + )] + 
Le, + v, | +(v +%) _ 2{», +y,) ( +»)] + 


E +») *(s, +w) -2(z, +w,) (Z +) 


(34.158) 


En développant: 
[x +u? +0xu, +2 +u7 +0xu —Dx x —Dx uw —-Dxu — Du u ]+ 
> x LS | 29 Û 29 (1) ‘0 r0 0 > »0 
L: +w, +2y,v, +35 +%5 +2) 2, Vo — 2VyVo — 2V0Vy -2v,v |] + (34.159) 
3 


[es + w5 + 22,w, +20 +5 + 2200 — 22,2 — 22,% - 22, - 2m, | 
Soit: 
P+2LAL+AP = 
[és 2) +00) +2, 2) ]+ 
2x, -2)(2, 20) +9, -n)(, -»)+(3, -2)09, -w)]+ us. 
[e, -u) +, =») +(w, =") ] 
En négligeant les termes de déplacement d'ordre supérieur et en tenant compte de la relation: 
P=(x, -x) +», -n) +(z, -2) (34.161) 
il vient que 2 disparaît avec {x, x) +{v, -») +(z, -2) ainsi que les termes au carré, nous 


} 
avons: 


[(x, 2, -)+(9, 7 )v, -w)+(2, -2)(, -%)] (34.162) 


Or, la géométrie analytique (trigonométrie élémentaire; rapport des côtés opposés et adjacents à 
l'hypoténuse) donne les relations suivantes: 


73 7 si Yy 0 = mn, Zy 7 =} (34.163) 
£ L u 
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qui sont les cosinus directeurs de la droite L. 


Nous pouvons alors écrire: 


E= = (a, = ü) + =) +5 (M -w) (34.164) 


La variation z#, étant un déplacement faible, nous avons recours à un développement en série de Taylor 


} 
(cf. chapitres Suites Et Séries) dont nous négligeons les termes d'ordres supérieurs (linéarisation des 
équations): 


u,=utx 0 u+y,ô,u+z, du (34.165) 
Nous avons également: 
Up =U + X0,u + Jo0,u +Zp0,u (34.166) 
La différence donne: 
U, —üg © (x, = x Jeu k (», =» )é,u +(2, - Ju (34.167) 
Donc, nous pouvons maintenant écrire: 


u, "up “li Lou +mLôäu+tn Lu 


V, = Vo =ILO,v+mLla,v+nLa&v (34.168) 


W, M “Law +mLô wtaLaw 
Finalement: 
= (11au +mLau +n Lau) + Pi L8,v+mLa,v+nLa,v) 
FA L : 5 
+7 (1L8,w+mL8w+nLô.w) PRE 
L x y £ 
=} Gu+mi u tal ou +mid,v +m8v+mn Av+anio,w +mAË,w + A w 
En groupant, nous avons: 
ge =}? du +? 2,v+ Fa Bw+ mn(2v+8w) +ai(du+dw)+mi (ax +8v) (34.170) 


Cette expression permet en un point quelconque le calcul de la déformation £& dans une direction ayant 
comme cosinus directeur 1, m,n en fonction des déplacements u, v, w en ce point ! 


Soit le cas où la ligne L coïncide avec l'axe OX, nous avons ? = 1,## = # = 0, l'équation précédente 
devient alors: 


€, = O,u (34171) 


Nous avons, si L coïncide avec l'axe OY {= 1, = # = 0j ou avec l'axe OZ (x = 1,? = #2 = 0): 
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£, =0,v et E = ZW (34172) 


Les grandeurs &,,£€,,€, sont appelées "déformations normales" et n'ont pas d'unités. 


Pour l'interprétation des termes (av + 8,w) (8x + 3,w), (au + 8v), nous nous référerons à la figure 


suivante: 


X 


Figure: 34.26 - Situation permettant de faire émerger les tensions de cisaillement 


Soient deux segments de droite OR et OQ situés dans le plan XOY. Avant déformation OR et OQ 
coïncidaient avec le référentiel orthonormé YOX. Après déformation, ils peuvent prendre la position 
O'R' et O'Q". Les composantes du déplacement de © sont u, v. 


- La composante du déplacement de R' est calculée comme suit: 
du 
du = dytg8 avec B=ig8=— (31172) 
dy 
car l'angle est faible . 
En toute généralité comme x = f(x, y,z), nous écrirons: 
B= Ou (34174) 


- La composante du déplacement de Q' est elle: 


&æ=d,v (34.175) 


Comme avant déformation, l'angle QOR est de xx} 2 , après déformation, l'angle droit est réduit de 
æ+ 8. Cette réduction æ+ $ est appelée "déformation de cisaillement" ou "déformation tangentielle" 
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et est notée par },, 


Nous procéderons de la même façon pour les autres termes, d'où: 
Ver = OU +O,W (34.176) 
Hs 0m 


Compte tenu du quadruplet de groupes d'équations démontrées précédemment dans cette section (voir 
les déformations des solides): 


E 
œ, .. BEC +6, +)| 


E 7 
Cr = EE, + E te +tE 
La Efe ge Le 1] 


T : E, + — (a+e+a) 


C1+n| 7 1-2 


lue CA +2,v,V,, = dut AW, Av + 2,w 


M, ts ll 

N,|=|lts Os Toy ||” 

N, Tyx Le Tr #8 

T= 2 ÿ 
2(1+7) 
(34.177) 
Nous pouvons résumer: 
E 7 
Tex 1+ n Le. i- (a+ Eyy +2.)| 
E 
Op” [ee 1-2 (& Eyy * 2] 
_- _Æ 7 

Tex Se + (er t +2.)] —. 

E E L 
TL, =T,,.= = À u + 2 v 
xp px 2{1+7) Gr | y ) 

E E 
Bet Be rep) Gta * 2") 

E E 
Tyz — Tyz n Frx = (x + 8,w) 
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Généralement, nous posons pour simplifier les notations (il faut cependant ne pas croire que la 
déformation en cisaillement devient une déformation normale ! ce n'est qu'une convention d'écriture 
dont le physicien doit se rappeler !): 


My lis eetun  ees (47) 


De même, nous posons: 


EE Tes Ten (64180) 


Soit finalement: 


TT. = F E.. + 7 Ê T =T = E 
# 1+y| % 1-27 FPS © 
8, E + & CR (34.181) 
1+71 77 1-27 é 2{1+7) ? 
a . 1e CL de = 2Ery 
# 1+7 1-27 2(1+7) 
En tenant compte que: 
2(1+7) (34.182) 


Nous obtenons les tensions de cisaillement comme suit: 


Heaule + 1e 
1-27 
ee 


; y x 20 Ey 
Ty 20e, +2 | Te “Ty “208, (34.183) 


Considérons maintenant, pour exemple, un fluide circulant dans la direction de OY avec un gradient de 
vitesse dans la direction de x: 


sens 
qu 
déplacement 
du 
flude 


v, + G,V,dx 


Q x x + dx x 


Figure: 34.27 - Situation permettant de faire émerger les contraintes normales 
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En se plaçant au niveau de y et au point 1 d'abscisse x, nous avons une vitesse v, et au point 2 


d'abscisse x+dx, une vitesse: 
v, + 2,v,dx (avec &,v, # 0) (34.184) 
Dans la direction de x, il n'y a pas de composante de vitesse donc: 
v, = 0 (avec 4,v, = 0) (34.185) 


Nous supposons maintenant que les tensions de cisaillement sont proportionnelles à 4,v, à un facteur 


près tel que: 
Try = dy DVy (84.186) 


avec pour rappel: 


ki 7 (34.187) 


vas 
Il est donc possible de considérer des déplacements par unité de temps en posant: 


ü —> Y, VV, W—>v, (34.188) 


En rapprochant cette dernière relation de: 


Ty = G(av+aw)= (av, +äv,) (4189) 


Tex = C(awtdu)= 4 (Av, + Av) 


nous pouvons dire alors que G initialement valable dans un milieu élastique solide considéré par ses 
déplacements est l'analogue de 4, dans le cas d'un fluide visqueux considéré par ses déplacements par 


unité de temps. Ainsi, nous voyons que les unités sont conservées. 


En considérant également les déformations par unité de temps pour les contraintes normales (nous y 
reviendrons en détail un peu plus loin), nous avons alors le système d'équations: 


: 7 
Tyx = 24 Ex Ÿ 15 


À = On + Dig TE = 2 0n + AE + On + On) 
7 7 


Tyy © Ha (é, = 27 À = 2436 + 2H 


é=2448, + al, +8, +8) 


é= 24,8, + (8, +8, +8.) 


Ër x £ À = 2H GE 2H; 
7 
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Ty“ Tyx “26e * 2 
Toz ES Tyx n 2Hà Éyz L 24% x 
Tr Us 


E 2Hà Éxy n 24% (28 


(34.190) 
Ainsi, nous obtenons une écriture condensée: 
= 24,0, +a{&+8,+4,)8, (34191) 
où ä; est le symbole de Kronecker: 


=] , i=j 
À, = (34.192) 
ô, ;=0 ? î a à 


Le tenseur Æ; décrit ainsi en partie l'ensemble des contraintes d'un fluide visqueux dans lequel nous 


avons supposé dans le cadre de l'hypothèse d'un fluide newtonien qu'il y a des relations linéaires entre 
les tensions et les déformations normales. 


Nous posons maintenant la somme des contraintes dynamiques sous une forme générale que nous allons 
justifier: 


Ë, = 248; + a(& +62 + &3 +) 8; — pô; (84.193) 


où le terme p 5;; se justifie par le fait que dans le cas statique, une pression dynamique constante 


p existe toujours en un point d'un fluide ce que l'on n'a pas dans le cas d'un solide. Pour justifier le signe 


négatif, nous observerons que dans l'expression de Æ;, les deux premiers termes du membre de droite 
ij 


correspondent, dans l'étude précédente, à des contraintes d'extension, alors que la pression 
p correspond à une compression du fluide. 


Il nous reste à présent, à déterminer le coefficient &. Soit i = j, nous avons alors ä, Du 1. Il vient 


successivement et par addition: 
Fi © 24 En + a (8 +6 + &) gi 
Ba © 2Hg6 * & (& +&at &) : 
B3 = 2H30e +a(& + +&)-? 


AtEt Es 24 (8 + 2 + & +3a(& +6; +83) -3p 


(34.194) 


Cette expression doit répondre à un fluide qui est également dans une situation statique (au repos) telle 
que: 


A +ÆtB3=-3p (34195) 
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Il vient alors que dans le cas statique: 


AC +a, +8,)+ 3a(8, +4. &) =0 (34196) 
Puisque: 
1 + dn tés #0 (34.197) 
Nous avons alors: 
2 | 
24 t34=0—aœ= ES (34.198) 
L'expression générale des contraintes s'écrit alors: 
E,=24,8 +4. +4, +]4,- 34.199 
ij — <a Gj 3 #a (& ba + 3 ) ;; = PA; (34199) 
Présentement, nous allons introduire les opérateurs de l'analyse vectorielle afin de disposer d'une 
expression plus générale. De cette façon, nous pourrons adapter la formulation à n'importe quel 


système de coordonnées (cartésiennes, cylindriques, sphériques,.…) ce qui facilitera la résolution de 
problèmes pratiques. 


Nous avons vu que pour un solide, nous avions: 


Yy "26, “Ou +0, 
Va = LE “0,%+0,W (34.200) 


Ve dE OV TOM 


Nous allons déterminer ces équations sous une forme indicielle en considérant toujours des 
déplacements par unité de temps (vitesses). 


) (34.201) 


tel que i, j = {1,2,3} et que 1— xx =x, 2 px =y: 3—2,x =2 


Pour i = j = 1 nous avons ainsi: 


| l | 
En = S (a + 8%) = PV ou Eyy A,V, (34.202) 
Pour i = 1,j = 2 nous avons: 
1 _1 
Êa = AU + 8) OU £,, = (2% 2,v,) (34.203) 


Nous pouvons dès lors écrire: 
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(34.204) 
En effectuant la somme des termes de: 
Ex Ÿ Eyp * Êrz © De Ve + D5Vy Ÿ Ve (84.205) 
Or, les outils de l'analyse vectorielle nous permettent d'écrire: 


Exx ds Ep ui Êgz : Ve . CAR A CAR + 9v (34.206) 


Pour le fluide, nous aurons ainsi: 


L'équation générale dynamique des contraintes s'écrira alors sous la forme suivante pour un fluide 
newtonien: 


2 
B; = 2 8; = 3440 °v)d; - pô; (34.208) 


Tenseurs des contraintes que certains auteurs notent (l'écriture est un peu dangereuse maïs elle a une 
justification dans un cadre d'étude plus approfondi des fluides!): 


g=-pl+A(Vov)I+2uD (34209) 
ou encore pour différencier vecteur et tenseur: 


g= -pl+A(Vov)1+24D (34.210) 


Si les contraintes normales (fluide incompressible) sont négligeables le deuxième terme se simplifie et 
nous avons alors (relation que nous retrouverons dans le chapitre de Génie Marin Et Météo): 


g= —pl+2uD (34.211) 


Il est, à présent, utile de repasser sous une forme développée pour l'équation précédente, en se 
rappelant que (voir plus haut): 


2 . 

Fe; -_P 7340 y) + 2 Hg Vs 
2 … 

Fos 2 ue Es 2 Hg 3,v, 


2. 2 = 
Ex . PTS eN) +24 CAL 
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x} xx C6” 

Ex — Ha (&v, LS 2,Vs) 

B; = Ha(&v, +.) 
(34.212) 


Écrivons maintenant le système d'équations de Newton (sommes des contraintes dynamiques internes 


et externes à un élément de volume d'un fluide) qui est: 


= ++ = dv = + — (34.213) 
7 “PMP IS, 


3 
— > &; est la somme des forces externes par unité de volume 
x, # 
à J=l 


- f, est la notation traditionnelle (malheureuse...) de l'accélération massique en ;# 872 
- £ est la densité du fluide 


et qui peut s'écrire sous forme condensée: 


odÿ=V(&)+of (34214) 


avec: 
80; 6; 
(div), = V(@), = =——=—— (34215) 
6x; 6x; 
Nous avons: 


Ve = Een + Dry + Orlrs + Pfx 
PV = Es + D Ey + Gb Ÿ Pfy (84216) 
Ve = Een + DEy + Orr Ÿ Pfe 


En introduisant les expressions de Æ; obtenues dans la relation ci-dessus, nous aboutissons aux 


équations: 
2 + 
ÆV= - GP A ER a».)+8, La (és + FVy ]]+ & Lau (ae + am)taf 
2 + 
Æ:v,= 8, [ 4 [&v, + 2v,) |- 8,p- 6, ÉREE 2H, 2) 8, [ 4 [&v, +8 1e, 


2 + 
AV,= 8, [4 (av, + 2v:)]+ GA [a (&v, 5 Va )]- EP a (Eu 2 Hg a»): aa 


(34.217) 
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Ce sont les "équations de Navier-Stokes de la dynamique des fluides newtoniens". Il en existe deux 
formes condensées que nous allons de suite déterminer: 


En reprenant la première équation de Navier-Stokes et en la développant, il vient: 
SE 
24,v, & —9,p- 6, (4 (V °ÿ) E 2438, | [4 (2%, : eV F2 [4 (av, ë 2v,)F PS 


2 s 
E 72 = 2 AOÛT 00) ii 2H dv, H8,v, +409, + Ha dev, + Had +ef, 


2uËv, 
=-à p- Le, (Vov)+ 4, dv, FEV, + HV + Hay À Ha OV À He On Ve YO 
= -2,p- 240,0 09) + 4 (Av, + BV, + dv.) + a (div, + dv, + dv, +e$, 
(34.218) 
Comme: 
Av, Fan Van 2,(2v, +4,v , + av,)= 8. (V 05) (34.219) 
et que: 


PV, + Bv, + Bv, = Ve(V(v,)) (34.220) 
Nous obtenons: 
e4,v, = -8,p -< 48, % 09) + 4,0. (Voÿ)+ 4, Vo(V(v )+0.f. (34.221) 
En simplifiant, il vient finalement: 
pd, = -8,p += 48,0 09 +19 oO +2R (422) 


En opérant de la même manière pour les deux autres composantes, nous pouvons réduire le système 
d'équations de Navier-Stokes à une seule équation vectorielle: 


04,5 =-V:p+ AA oP)+4,V o(V:5)+of (34.223) 
Comme (cf. chapitre de Calcul Vectoriel): 
A'v=Viy=Vo(V 5 =V(Vor)-Vx(VXÿ) (34.224) 
Nous avons: 
pas = 9: p+ 00 09) + HV o5)-Vx xt af (4225) 


Soit en final: 
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-_ 4 se 6 _ 
P4,ÿ = ND RNCS ARNS (V Xxv) +07 (34.226) 


Remarque: Nous trouvons également parfois dans la littérature, une équation contenant une 
seconde viscosité lb , alors que {{, ne se manifeste rigoureusement que lors du cisaillement pur 


selon nos hypothèses, 4, apparaît lors d'une compression omnidirectionnelle s'accompagnant d'une 


variation de densité. 


L'équation précédente s'écrit alors: 


04,5 = -Ÿ:p+ = + 4) VV 05) - 4% X (VX 5) + of| (24.227) 


C'est "l'équation de Navier-Stokes" ou aussi appelée "équation de mouvement pour un fluide 


newtonien". 


2.4.1. FLUIDE INCOMPRESSIBLE 


Dans un fluide incompressible, nous avons par définition © = <*. L'équation de conservation qui est 


(cf. chapitre de Thermodynamique): 
Vo(oÿ)+&p=0 (34228) 


s'écrit alors: 


soit: 


s'écrit alors: 


pod =-Ÿp+u,Vo(ÿÿ)+of (3423) 


ou autrement: 


od,ÿ =-V:p+u,V?v+ of (34.235) 


Si de plus la viscosité 44, est négligeable, nous avons donc pour un fluide parfait: 


pd, = —Ÿ:p+of| (34234) 
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Cette équation est appelée "équation d'Euler de 1ère forme" ou encore "équation locale du bilan de 
conservation de la quantité de mouvement". Nous réutiliserons cette relation dans le cadre de notre 
étude des ondes de gravité (vagues) dans le chapitre de Génie Météo Et Marin. 


Il existe une deuxième forme de l'équation d'Euler dans le cadre d'un fluide incompressible et à 
viscosité négligeable que nous allons de suite déterminer (souvent utilisée dans l'industrie): 


Si v = f'(x,y,z,t), nous pouvons écrire: 


- dx Ov dy dv dz 
EVE —— + + — — + — 
0x dt y dt Oz dt dt 
Ce qui peut aussi s'écrire: 

dv =(8,%)v, + (8,5)v, + (8,9)v, + 8 

_ Le, (ni + v,f+ Vk) |" + La, (ni + v, j + vk) |" + [2 (ui + v,f+ À) | + 8,V 

= [ve 8,v, ]i + [v, 8,v, |3+ [dv ]E + Lv, 8,v, | + [v, 8,v, |3+ Lv, 8,v, |E + [% 6, ]i + 

[v 8v, |3+[v 8,v, ]£+ 8,5 


Z ZE 


Ce qui s'écrit encore: 
(v,8, Fr, +v,8,) (vi +v,J +vÆ) +4,V (34.237) 


Le premier facteur peut être considéré comme le produit scalaire suivant: 


Soit: 
d,5 =(v,8, +v,8, +v,8,)(vf+v,j+vk)+8,5=(50V)5+85 (24239) 
La "dérivée particulaire" peut alors prendre la forme condensée suivante: 


a, = 25+ (F°V)s (34.240) 
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Remarque: La composante en x de la dérivée particulaire est donc (nous retrouverons cela dans le 
chapitre de Génie Marin Et Météo!) : 


div, = Ov, +v,0,v, +v,0,v, +v,6,v, (34.241) 


ce que les spécialistes du domaine notent de manière générale pour toute composante : 


D ., 
" 8, +v,0, +v,0, +v,0, = 0, +VoV (34242) 


L'équation d'Euler de 1°'° forme: 
od,ÿ=-Ÿ:p+of (24243) 
devient compte tenu de la dérivée particulaire: 
e[as + (5 °Ÿ}F] = of -ÿ: P (34.244) 


ou encore (forme courante dans la littérature): 


ES 


V'(tov)=2x(Vxr)+5x(Vxg)+(goV)5+(FoV)# (34.246) 
Si nous posons ÿ = ÿ, nous avons: 
PPT = Vv = 25x(Vx5)+2(5eV)5 (24247 
Soit: 
(FeV)5 = 


y? -#x(Vxÿ) (34.248) 


Finalement, nous obtenons une nouvelle équation appelée "équation d'Euler de 2ème forme" et qui 
s'écrit: 


PV = pf-Vp-ÊVv +06x{Vxÿ)| (24.249) 


Bien que les deux équations d'Euler soient très importantes, il en existe une forme variée très utile en 
météorologie que nous allons de suite déterminer. 


Nous nous basons toujours sur l'écoulement d'un fluide incompressible et non visqueux, mais dont les 
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forces de volume dérivent cette fois-ci d'un potentiel # =-:{} (U étant un potentiel). 


Dans ce cas, nous recourons à l'équation d'Euler sous sa 1°" forme: 
od,ÿ=-V:p+of (34250) 


Puisque les forces volumiques f dérivent d'un potentiel U, nous avons: 


pd,5=-V:(p+oU) (34251) 


Nous rappelons la relation: 


Soit  xÿ un vecteur À, il vient: 
-ÿxA= Axÿ (34253) 
donc: 
DE (v x$) = (v xÿ) XP (34.254) 


donc nous pouvons aussi écrire: 


En reprenant la relation: 
l'équation: 


devient alors: 

pd,ÿ = e[e+(s-Ÿ)s] =: (p+oÙ) (34.258) 
et en utilisant: 
Ÿ y? + (Vxs)x (34.259) 
cette dernière devient: 


1 = = hi. à 
20$v+ 5 + Frs] =-V'(p+joUÙ) (34.260) 
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et puisque: 


2 
g.2 ME a 


nous pouvons finalement écrire: 


p8ÿ+ L 4 (Frs +: (p+ oU) = Ù 
(34.262) 


2 
GATE (rev +(Vxÿ)x5 = d 
2] 


Généralisons cette dernière relation en faisant apparaître d'éventuelles rotations. Pour cela, nous savons 
que ÿ = &xF donc: 
VXxp= VX (&xr) (34.263) 
En écrivant le produit vectoriel 4x 7 sous forme développée, nous avons: 


ÿx [(e,z = C2 +(ax- 0,2) + (e,y L a,x)] (34.264) 


Ce qui donne: 


_ 


d (æ,» : @,x)r + GA (æ,x En az)E + 2,(æ,z En CRE 


_ 


æ,z-ay)E- CA (a,x-az)i -8,(ay-ax)j 


Supposons que & soit un vecteur vitesse angulaire constant, nous avons alors: 


Vxyÿ=-af+ak+aj+tat+ar+aj-2{ai+ej+at)=-2& (24266) 


Définition: Nous disons qu'un "écoulement est tourbillonnaire" si: 
Vxÿz0 (24.267) 


partout ou en certains points. Nous définissons aussi de la relation antéprécédente la "vorticité" par 


Vxÿ (34.268) 


Exemple d'écoulement partiellement tourbillonnaire (en certains points): 
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A! 


Figure: 34.28 - Exemple d'un écoulement tourbillonnaire 


L'équation: 


- (V xÿ}xÿ = Û (34.269) 


s'écrit alors: 


2 
9,v +9 frEeul+28xs 5 (34.270) 
2 P 


Nous retrouvons dans cette équation, utilisée en météorologie, l'accélération de Coriolis que nous 
avions déterminée dans le chapitre de Mécanique Classique. 


Si l'écoulement s'effectue à vitesse constante 4,5 = Ô et n'est pas rotationnel (non turbulent) &xÿ =0, 


alors l'équation précédente se réduit à: 


h 


7: 


2 
ru +u|-6 (34.271) 


En dynamique classique du point matériel rigide, nous avons montré que dans le cas d'un potentiel 
gravitationnel Terrestre: 


z étant l'altitude d'un point du fluide par rapport à un niveau de référence z, . Si nous prenons z, pour 


le niveau du sol, l'avant-dernière relation devient donc dans le cas d'un écoulement dit alors 
"écoulement potentiel": 


'É ÉA =0 (34.273) 
2 P 
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Le terme entre crochets pour satisfaire cette relation doit être tel que: 


1 2 e 
27 + O0g+tp=c (34274) 


Nous retrouvons donc bien le théorème de Bernoulli, ce qui conforte notre modèle des fluides 
newtoniens selon le modèle de Navier-Stokes. 


2.4.2. FLUIDE COMPRESSIBLE 


Dans ce cas à, est une fonction de la pression p (cas des "fluides barotropes"). Nous considérons 
également que la viscosité est négligeable. Il vient alors: 


L'équation: 


+2&%XY=Û0 (34276) 


s'écrit alors: 


2.4.3. FLUIDE STATIQUE 
Dans le cas statique ÿ = 0 et x, = Ü l'équation: 
-_ # 4 VS rS à _ 
pav=-V'p+ 3 +H)VVov) - HV X(VXV) +0 f (34.278) 
devient simplement: 


Ÿ'? -pf= 0] (34.279) 


qui est "l'équation de la statique des fluides" ou la "loi fondamentale de l'hydrostatique". 


Remarque: Les viscosités disparaissant, la statique des fluides est la même pour les fluides visqueux 
ou non visqueux. 


2.4.4, NOMBRE DE REYNOLDS 
Considérons d'abord, pour simplifier, le cas incompressible. 


L'équation de continuité, ou de conservation de la masse, (cf. chapitre de Thermodynamique): 
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ce -Vo(o:v,)=0 (34.280) 


dé 


s'écrit alors dans ce cas particulier: 
dv dv 
=0 (34.281) 


dv, Y + 1 


MN 05, = 0 Vo = 
dx dy  dz 


Nous choisissons maintenant plusieurs grandeurs de références sans dimensions notées par un indice 


r telles que: 
0 x 1 A 1 Z ' £ : A 
x'=—,y =—,Z'= — D =—{'=— 
Ê 
£ £ L et . d (34.282) 

' L ' V : L  L Wi 1- À J _ A 
Vx = —,y, = —,y, =— Â nr _ » a + 
V, y, Y, LA Pr y 


De par ces définitions, nous avons par exemple: 
1 
dv, v, _% dv, 


dx) E &x 


(34.283) 


donc l'équation des déformations par unité de temps devient: 
v (av. dv, &v 
| , = 0 (34.284) 


+24 
8z' 


ov =} 
d I, | 9x' dy 
Mais nous avons également: 
dv _Gvdx dy vdz | 
— = ——+——+——© + — (34285) 
dt Ox dt dy dt Gz dt dt 
Restreignons-nous à l'étude d'une composante seulement: 
= Rd _ + _ D 4 A LE a 34.286) 
dt ôx dt y dt Oz di di 
En multipliant cette dernière relation par la densité & et par définition de la vitesse: 
Av, dx Av, dy dv, dz Av, Av, Av, x dv, r 
Eh = © M PF + (34.287) 
dé ôx dy dz dé 


Fu lux vtt & à 
Reprenons maintenant une des formulations possible de l'équation de Navier-Stokes démontrée plus 


(34.288) 


haut: 
il … ue =" 
2d,v, = -0,p +440, (V ov) + 4 o(V(v) +0f 


3 


En n'oubliant pas que pour un fluide incompressible nous avons: 
[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Voÿ=0 (34.289) 


l'équation de Navier-Stokes précédente, se réduit à: 


£ 


dv, iv, 8 d. FL 8 Te 9, +0f, (84290 
dt êx x &% * ET z&” 


Or, pour un fluide nous avions supposé plus haut que les tensions de cisaillement étaient données par: 
ds" CA (34.291) 


Les termes où apparaissent les coefficients de viscosité peuvent être réécrits tels que: 


h EE 
êx Ge 4 


dé x 


dv 22 Ps 2 (34.292) 


Ainsi par correspondance: 


dv, dv, dv, 
PT Pr 
ax dy œ FA ax 


re) 


+ 
x  & 


LL à PE 2 (5 0 Or }es (34.293) 


que nous pouvons écrire sous forme encore plus condensée en utilisant un peu abusivement la notation 
tensorielle: 


dv, __@ 0% 
<= -—+— + (34.294) 
dt x x, 8 


En introduisant les variables adimensionnelles: 


EN | 8T. A 
LA ÉLREA RRLET Pa Pr DV | Ge op fs. 
t, ôt 20 LE dr 


(34.295) 


= 

Maintenant, multiplions cette dernière relation par — et divisons-la par 2, des deux côtés de 
* 

l'égalité tel qu'elle devienne: 


fan, P,. |, L 2 d'. de 7, 
x FD” T&' £,v, dé av x "HE 8x; v, 


Au niveau dimensionnel, remarquons que nous avons: 


L, Pr 
8% v 


t, = 
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Finalement: 
| " | | B' 10% :, 
D, + y, + y, += + T0 +9f,| (34.298) 
” 8x' * dy” 8z' “| &' ôx' KR, x d | 


LA 


Cette équation différentielle exprimée en variables relatives et sans dimensions est appelée "équation 
de Navier-Stokes-Reynolds adimensionnelle" 


Le terme &,, appelé "nombre de Reynolds", représente au niveau symbolique le rapport des forces 
d'inerties sur les forces visqueuses: 


R = 8,2v, _ L,v, 
Ut le, 


(34.299) 


où {4 est la "viscosité cinématique relative”. 


La viscosité dynamique est donc un terme inversement proportionnel à la valeur du nombre de 
Reynolds. 


2.4.5. APPROXIMATION DE BOUSSINESQ 


Soit la relation déjà démontrée précédemment: 


0$v +V: 3 20 +2&4XY=0 (34300) 


le) 


En y remettant le terme contenant la viscosité: 


$v +7: 


2 
n ie + +28Xx9 - uv =0 (34301) 
e 


sans oublier qu'au niveau des notations (nous savons.…..c'est un peu embêtant): 
A'v=Viy=Vo(V 5 = V(Vor)-Vx(Vxÿ) (34.302) 
Si le potentiel est de type gravitationnel, il va de soi que: 
V'U=V'(g)=8 (34.303) 
Donc: 


2 
9$v ++ LV p+8+ 28Xxÿ-yu,V?v=0 (34304) 
2 


Si l'on peut considérer le contexte de l'expérience telle que la densité volumique est inférieure ou égale 
à celle de l'eau et que les vitesses sont petites, alors nous pouvons éliminer les termes de second degré, 
tel que la relation précédente s'écrive: 
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I > : = 
dv +2GXv+—V' p+g - 4 V°v= Ô (34.305) 
re) 


Nous nous plaçons dans le cadre d'un fluide faiblement turbulent, dans lequel la pression et la densité 
s'écrivent: 


P=PotP ,2=@ rs (34.306) 


où p',€2' représentent le terme d'accroissement turbulent par rapport aux valeurs statiques du fluide. 


Nous négligeons également les frottements sur les bords et donc la viscosité en supposant que l'effet des 
turbulences devient vite prépondérant sur la valeur du frottement. 


Donc, nous avons le système d'équations: 
D 2 La —- 
0$v +2@xXV+—V:p+£g=0 (34307 


qui peut s'écrire: 

D04P+ 02%X 5 +V:p+,08 =Ù (31308) 
et encore: 

p8+028x 5 +V:(p +p)+(9 +0)8=0 (34.309) 
ce qui s'écrit aussi: 
08,5+ 02@x5 +(Ÿ: p'+ p'&) - (Ÿ: HT 28) = 0 (34.310) 

Mais dans le cas statique: 
V'po+MB8=0 (34311) 
Il nous reste donc: 

PO + p2&Xx5+V p'+0'Z=0 (24312) 
En divisant le tout par €: 


aP+20xp+ 19. pu P 55 css 
re) 


mais encore une fois: 


8,5 +2@xX 5 + 1 Vop+ £ S=0 (24314) 
8% 8+% 


L'approximation de Boussinesq consistant à supposer que le fluide est incompressible et que le système 
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est à température constante et peu turbulent, nous avons: 


à > 0" 


Ce qui nous donne: 


Héron Ve eg 


© €0 


Cette équation s'appelle "équation de Boussinesq" et va nous permettre d'introduire la théorie du chaos 
dans le domaine de la météorologie et des fluides dans le cas particulier des cellules de convection. 


2.4.6. LOI DE STOKES 


La complexité de l'hydrodynamique est un terrain tout désigné pour l'application de l'analyse 
dimensionnelle dont nous avons parlé au tout début de notre étude de la mécanique analytique. 
L'exemple analysé ici montre clairement les possibilités, mais aussi les limites de la méthode. 


Nous envisageons un solide de forme quelconque plongé dans un fluide incompressible animé d'une 
vitesse uniforme à grande distance (le problème est équivalent à celui d'un solide qui se déplace à 
vitesse constante dans un fluide au repos). Nous cherchons à exprimer la force F qu'exerce le fluide sur 
l'obstacle, supposé immobile (et notamment dépourvu de tout mouvement de rotation). 


La solution analytique est trop complexe pour perdre son temps à résoudre ce genre de problème 
pratique. Il convient de recourir à l'analyse dimensionnelle. 


Les paramètres pertinents sont dans notre étude: 
- L la dimension linéaire de l'obstacle 

- v la vitesse du fluide à grande distance 

- © la masse du fluide 

- À le coefficient de viscosité du fluide 


Comme il se doit, tous ces paramètres sont des constantes, bien que la vitesse varie en direction et en 
norme au voisinage de l'obstacle: à grande distance, elle est uniforme et sa valeur v est bien un 
paramètre pertinent. 


Nous pourrions nous demander si la pression ne devrait pas compter au nombre de ces paramètres. Ce 
n'est pas le cas. La pression est conditionnée par la valeur de la vitesse et par celles des paramètres 
constants comme nous l'avons voyons dans le théorème de Bernoulli. Inutile donc de rajouter un terme 
redondant. 


Sans chercher l'unique combinaison sans dimension des quatre premières, nous appliquons la démarche 
systématique. Nous voulons déterminer À, B, C, D, tels que: 


F = Enr af ue 


Comme: 
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F=kg ms" v=ms! 


p=kg im H=kg ms" 


(34.318) 


Il vient: 
kgs = kg D Mt B3C-D BD (34,319) 
Le système de dimensionnalité s'écrit: 


C+D=1=C-1-D 
A+B-3C-D=1 (34.320) 
B+D=2=8B-2-D 


Ainsi: 
A=1-2+3C+D=2-D (34321 


Dès lors: 


et curieusement nous retrouvons ici ce que nous avions vu dans notre développement de 
l'approximation de Boussinesq: 


R = 8,Lv, _ L,v, 
: Hg He 


Donc la force exercée par le fluide s'écrit: 
_ 2r3n-D DA © 
F _ Êv Ê ÊÀ, (34.324) 


Dans la littérature, nous trouvons la notation: 


F = pv PC{(R,)| (34.325) 


où C dépend de À,. 


Les limites de la méthode analytique dimensionnelle (et même analytique tout court...) apparaît lorsque 
l'on confronte ce modèle à l'expérience (évidemment nous pourrions faire des modèles numériques de 
l'équation de Navier-Stokes-Reynolds pour l'ordinateur et ainsi l'honneur serait sauf): 
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ct) | 
7 t +17 7——— 
1 10 602 JO 108 oi 10 107 Re 


Figure: 34.29 - Illustration du paramètre C pour un cylindre dans différents régimes 


(Iw) 


Ce graphique correspond à l'écoulement autour d'un cylindre; la vitesse ÿ étant perpendiculaire à l'axe 
du cylindre. Les régimes sont signalés en chiffres romains: stationnaire (1), périodique laminaire (ID), 
turbulent avec superposition d'état périodique (IT), turbulent (IV). 


La courbe a deux caractéristiques remarquables: 


1. Elle a été obtenue en modifiant de manière indépendante les valeurs des quatre paramètres. Nous 
constatons que C ne dépend que du seul nombre sans dimension À, : c'est un succès de l'analyse 


dimensionnelle. 


2. Il est vain d'espérer trouver une fonction analytique simple qui reproduise la courbe expérimentale. Il 
faut donc aller voir de plus près les divers régimes correspondants à cette courbe complexe. 


La figure ci-dessous schématise l'écoulement d'un fluide visqueux autour d'un cylindre pour différentes 
valeurs du nombre de Reynolds: 


te) Re © 1% 
Figure: 34.30 - Écoulements autour d'un cylindre en fonction de différentes valeur du nombre de Reynolds 


Le régime correspondant à la figure (a) est dit "régime stationnaire". Nous pouvons parler d'un 
déplacement "quasi-statique" de la part du fluide où en chaque point l'accélération est négligeable. 
Nous devons donc nous attendre à ce que l'inertie du fluide n'intervienne pas dans l'expression de la 
force. Pour cela, il faut et il suffit que: 


: : 1 = mi X 39e 
lim CCR) C' = C'É (24.326) 
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où C est indépendant de À,. 


Nous avons donc: 
F=po20' 4 = C'yLu (34327 
Lve 


Le paramètre C' sans dimensions ne peut dépendre que de la géométrie de l'obstacle. Dans le cas où 
l'obstacle est sphérique (cas très important en physique avec L=R), C' a été déterminé 
expérimentalement comme valant 6x7 tel que: 


F = 67%Rv| (34.328) 


connue sous le nom de "loi de Stokes" ou "formule de Stokes". Attention... cette loi ne s'applique bien 
que pour les petites vitesses et des petites sphères. 


Dans le régime décrit par (b), deux tourbillons s'installent symétriquement derrière le cylindre. Quand 
À, augmente au-delà de 40, nous distinguons l'allée de "tourbillons de von Kärmän”. 


2.5: PRESSION HYDROSTATIQUE 


Nous avons précédemment démontré sans mal que: 
1 ne 
TORRES —c" (34.329) 


Si la vitesse du fluide est nulle: 


Ce qui donne sous forme différentielle: 


Si nous mesurons la pression du liquide à partir de sa face supérieure z, : 
£ z 
[4 =P= - fes =-(208-208)+c" (34.332) 
Z Z0 


Si nous prenons z, comme référence, nous pouvons poser que: 
d'où: 


Si nous nous trouvons dans le cas d'un récipient rempli d'un fluide en contact avec l'atmosphère, pour 
calculer la pression dans ce fluide à une hauteur h donnée, il faudrait prendre en considération la 
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pression atmosphérique Æ# qui "s'appuie" également sur le fluide. Ainsi, la "pression hydrostatique" est 


donnée par: 


Fe th 6"g) (643%) 


Conséquence: dans un liquide au repos, homogène, les équipotentielles gravifiques sont confondues 
avec les surface isobares. Sans quoi, il y aurait mouvement transversal. 


2.6. POUSSÉE D'ARCHIMÈDE 


La poussée d'Archimède, phénomène mondialement connu..., est souvent rebelle à l'intuition première. 
Au fait, nous avons trop tendance dans les écoles à poser la poussée d'Archimède comme un "principe" 
et ce à tort puisqu'une simple analyse mathématique suffit à la démontrer . 


Si nous isolons une portion Af arbitraire d'un fluide en équilibre statique, les conditions de cet 
équilibre s'écrivent nécessairement (sinon quoi le volume se dissocie et n'est plus en équilibre statique): 


P+ g Cr pds = Ô| (34.336) 


désigne le poids ( 5 = »#° 4 en première approximation...) de Af alors que le terme IG ‘p}ds 


décrit la résultante des forces de pression exercée sur la surface de AF. 


Chaque élément de surface dS subit donc une force: 


_ 


Fx=(# p)dS (34.337 


ns 
OU) 


où p est la pression qui s'exerce localement sur dS. Quant à x, il s'agit d'un vecteur unité dirigé 
normalement (à la perpendiculaire) à dS et vers l'intérieur de AS. La résultante de toutes ces forces se 
note historiquement de la façon suivante: 


Ê, = ICE (34.338) 


qui exprime donc, comme vous le devinez, la fameuse "poussée d'Archimède" que le reste du fluide 
exerce sur l'élément. L'intégrale porte sur toute la surface (cette surface est fermée, d'où l'intégrale 
curviligne correspondante) de l'élément AF. 


La condition d'équilibre impose donc que: 


Ê,=-P (34339) 


Nous comprenons aisément que Ë, soit dirigé vers le haut: sous l'effet du champ gravitationnel et donc 
p augmente avec la profondeur. 


Si nous remplaçons le fluide contenu dans le volume par un objet fluide ou solide quelconque mais qui 
occupe le même volume, la poussée d'Archimède n'est pas modifiée. À cause de la relation Ë, = -È 


nous avons coutume de dire qu'elle est équivalente au poids du fluide déplacé. 


Dans le cas où la direction et l'intensité dans le temps de £ sont uniformes et constantes nous pouvons 
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écrire: 


oint Le 1% ga =p'g'V (34340) 
d 


et nous retrouvons la relation de la "loi d'Archimède" bien connue de tous les écoliers: 


F, = p'g'V]| (34341) 


Il existe une autre possibilité pour arriver à cette démonstration qui demande moins d'outils 
mathématiques et qui est donc plus abordable: 


Considérons un cylindre de volume V plongé dans un liquide à la verticale. Les composantes 
horizontales des forces de pression s'annulent, mais la composante verticale au sommet du cylindre Æ 


(proche de la surface) est inférieure en intensité (sauf cause extérieure) à celle se trouvant à sa base À 
. Nous pouvons donc écrire: 


F=(B-R)' S=(L' 0 g-h'po'g) S=Ah Sp g=V'pog (34342) 
C'est un peu plus simple et ça tient en une ligne sans intégrales. 


Il convient de se rappeler que la poussée d'Archimède est une force qui s'applique à des fluides et donc 
aussi à des gaz. C'est ainsi grâce à la poussée d'Archimède qu'une montgolfière ou un dirigeable 
peuvent s'élever dans les airs (dans les deux cas, un gaz de masse volumique plus faible que l'air est 
utilisé, que ce soit de l'air chauffé ou de l'hélium). 


Il est aussi amusant, après démonstration de la loi des gaz parfaits (voir plus loin), de déterminer la 
pression que devrait avoir notre atmosphère pour avoir la même densité que l'eau et qu'un humain 
puisse ensuite flotter dans l'air. 


2.7. VITESSE DU SON DANS UN LIQUIDE 


Intéressons-nous un petit moment au calcul de la vitesse du son dans un liquide. Nous avons démontré 
dans le cas de notre étude des ondes sonores longitudinales du chapitre de Musique Mathématique que: 


En combinant il vient: 
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La fraction: 


c'est-à-dire le rapport entre une variation de pression et la variation relative de volume qu'elle entraîne 
reçoit le nom de "module d'élasticité volumique". Remarquez qu'il faut le signe - pour que B soit positif: 
quand la pression augmente, le volume diminue. 


Nous avons alors par exemple pour l'eau: 


= 1414 [ms] 


) 


(34.34 


La valeur mesurée étant de 1'441 Lo "a | . Il peut paraître surprenant que la vitesse du son dans un 


liquide, qui est beaucoup plus difficile à comprimer qu'un gaz soit seulement 5 fois plus grande que dans 
un gaz. La raison est que la densité d'un liquide est environ mille fois plus élevée que celle d'un gaz. 
L'une dans l'autre, les deux propriétés se compensent partiellement. 


3. GAZ 


Les solides ont une forme bien définie et sont difficiles à comprimer. Les liquides peuvent s'écouler 
librement et leur écoulement est limité par des surfaces autoformées. Les gaz se dilatent librement pour 
occuper le volume du récipient qui les contient, et ont une densité environ mille fois inférieure à celle 
des liquides et des solides. Ils conduisent peu la chaleur et l'électricité, sauf si nous les ionisons 
(formation d'un plasma). Les molécules d'un gaz neutre se déplacent suivant des trajectoires rectilignes 
qui changent de direction à chaque collision avec une autre molécule. Contrairement aux solides et aux 
liquides, les interactions entre molécules restent faibles. Les propriétés macroscopiques d'un gaz se 
déduisent donc directement des propriétés des molécules qui le composent (ou des atomes dans le cas 
d'un gaz monoatomique). 


3.1. TYPES DE GAZ 


En théorie des gaz (nous parlons souvent de "théorie cinétique des gaz") nous considérons toujours 
deux types de gaz neutres: 


3.1.1. GAZ PARFAIT 


Il s'agit d'un modèle dans lequel nous négligeons les interactions moléculaires du gaz, à l'exception des 
collisions, et dont le volume propre est négligeable devant le volume du récipient. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Lorsqu'un gaz est à faible pression, les interactions entre ses molécules sont faibles. Aïnsi, les propriétés 
d'un gaz réel à basse pression se rapprochent de celles d'un gaz parfait. Nous pouvons alors décrire le 
comportement du gaz par "l'équation d'état des gaz parfaits" que nous démontrons plus bas lors de notre 
étude du théorème du Viriel: 


PF = nRT (34.348) 


avec n le nombre de moles de gaz, P la pression du gaz, V le volume occupé par les n moles et T la 
température absolue du gaz. La constante R étant la constante des gaz parfaits. 


Cette équation montre que trivialement: 


- À température T constante (système "isotherme"), le volume d'une quantité fixée de gaz est 
inversement proportionnel à sa pression. C'est la "loi de Boyle-Mariotte": 


Volume 


Pression 


Figure: 34.31 - Illustration de la loi de Boyle-Mariotte 


- À pression P constante (système "isobare"), le volume d'une quantité fixée de gaz est proportionnel à 
la température absolue. C'est la "loi de Gay-Lussac" (dans le cas des gaz parfaits…): 


Température absolue 
Figure: 34.32 - Illustration de la loi de Gay-Lussac 


C'est cette relation qui est souvent utilisée dans les labos des petites classes pour montrer qu'avec une 
extrapolation de la droite mesurée, le volume devient théoriquement. nul à une température de 
-273.15 [°C]. Non sérieusement à partir d'une certaine température, il faut utiliser des modèles 
quantiques et de plus cette relation n'est valable vraiment que pour les gaz (ainsi, lorsque la vapeur 
d'eau devient liquide. ce n'est plus valable). 


- À volume V constant (système "isochore"), la pression d'une quantité fixée de gaz est proportionnelle 
à sa température absolue. C'est la "loi de Charles": 


P=c"T 
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Figure: 34.33 - Illustration de la loi de Charles 


Par la suite, Amedeo Avogadro, à qui l'on doit le vocabulaire de "molécule" affirme le concept 
moléculaire des gaz et conclut que des volumes égaux de gaz différents, pris dans les mêmes conditions 
de température et de pression, contiennent le même nombre de molécules. 


312; GAZ RÉEL 


L'équation d'état des gaz parfaits est approximative. Par exemple, un gaz parfait ne pourrait ni se 
liquéfier ni se solidifier, quels que soient le refroidissement et la compression auxquels il est soumis. Les 
gaz réels, surtout dans des conditions de pression et de température proches de la transition à l'état 
liquide, peuvent présenter des écarts considérables avec la loi des gaz parfaits! 


Il faut donc l'adapter aux cas réels. Pour cela, nous utilisons l'équation d'état de Van der Waals qui est 
particulièrement utile et bien connue. Elle peut être obtenue de manière qualitative une fois l'équation 
des gaz parfaits démontrée et est alors donnée par (voir plus bas comment nous l'obtenons): 


É + 7) (F-b)= RAT (34.349) 


pour une mole, a et b étant des paramètres adaptables déterminés par des mesures expérimentales 
effectuées sur le gaz concerné. Ce sont des paramètres qui varient d'un gaz à un autre. 


L'équation de Van der Waals peut également être interprétée au niveau microscopique. Les molécules 
interagissent les unes avec les autres. Cette interaction est fortement répulsive pour les molécules 
proches les unes des autres, devient légèrement attractive pour un éloignement moyen et disparaît 
lorsque l'éloignement est important. À pression élevée, la loi des gaz parfaits doit être rectifiée pour 
prendre en compte les forces attractives ou répulsives. 


3.2. THÉORÈME DU VIRIEL 


Nous allons ici aborder une étude des gaz parfaits via une méthode particulière. Elle permet d'obtenir 
un résultat intéressant et particulièrement pour l'astrophysique (cf. chapitre d'Astrophysique). Le 
théorème du Viriel permet également d'obtenir d'autres résultats très intéressants mais qui 
pédagogiquement sont un peu difficiles d'accès. Le lecteur qui serait intéressé par cette deuxième partie 
de résultats pourra directement se reporter un peu plus loin où les concepts de pression et de 
température cinétique sont traités. 


Par définition, "l'expression du Viriel" F, d'un point matériel est le scalaire: 


WF =fFfoñ| (34350) 


L'é 


Par définition, le "Viriel" F, d'un système composé de N points matériels est: 
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Soumis à une force centrale, le Viriel s'écrit (par les propriétés du produit scalaire): 
F, = > En (34.352) 


Le "théorème du Viriel" s'énonce ainsi: Pour un système en équilibre (!), l'énergie interne est égale à 
l'opposé de son demi-Viriel total lorsque toutes les particules sont repérées par rapport à son centre de 
masse. 


Démonstration: 


Soit la relation mathématique: 


Sa dérivée seconde: 
dr? = d,(2rd,r) = 2drd,n + 2rdèr = 2(dn) +2rd?r (34.354) 


En multipliant par ##, et en sommant sur i: 


Om = 25 [r (ar) + far] (34.355) 


Or: 
m;dèr, =, (34.356) 
et: 
d _ 2  d NA 9c7 
7 =V—(d,r) =v (34357) 
Donc: 


di mr° m2 Era DE] (34.358) 


Cette dernière expression est valable quelle que soit la position d'un système de coordonnées adopté. 
Cependant, il est intéressant de placer son origine au centre de masse du système car nous ne sommes 
plus dépendants de son mouvement. 


Si le système est en équilibre, les quantités macroscopiques qui la caractérisent ne sont pas dépendantes 
du temps. Nous en concluons alors que la somme de n'importe quelle quantité attachée à n'importe quel 
point matériel du système est en fait une quantité dudit système. 


Ainsi, D mar, est une quantité macroscopique indépendante du temps. Cela implique que: 


D mv * DdrE =0 (34.359) 


Ce qui s'écrit encore (nous multiplions par ! des deux côtés): 
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Nous avons donc finalement: 


1 
4, EC (34.361) 


Cette expression de l'énergie cinétique est connue sous le nom de "théorème de Viriel" et le membre de 
droite est donc appelé le "Viriel du système". 


OIC.Q.F.D. 


Nous noterons que: 


où Æ, est l'énergie cinétique totale associée à l'ensemble des points matériels du système. Nous 
l'appelons "l'énergie interne du système" et les thermodynamiciens la note souvent avec la lettre U. 
{E, } est l'énergie d'un point matériel quelconque du système. 


Il est possible de retrouver l'expression du Viriel à partir d'un système de particules (nuage en 
accrétion). Strictement, l'équilibre n'existe pas dans un tel cas. Néanmoins, nous pouvons admettre que 
si la contraction gravitationnelle est suffisamment lente alors ses différentes phases peuvent être 
considérées comme une succession d'états d'équilibre. 


Dans le cas d'une force centrale et dérivant d'un potentiel, nous pouvons écrire: 


0E 
F=-- +}? (34363) 
är 


et donc: 


dE | 
F:r=-r +? (34.364) 
dr 


Si l'énergie potentielle est de la forme k/r (ce qui est le cas pour le potentiel électrique et gravitationnel) 
alors il vient: 


F'r= £, (34.365) 


et il reste: 


E. = 7 (34.366) 


En résumé, le théorème du Viriel nous donne une relation entre les énergies cinétiques et potentielles 
totales. Pour être valable, le mobile doit décrire une trajectoire autour du centre de force central et 
rester indéfiniment dans un volume fini (état lié). Ce type de raisonnement est applicable à un très 
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grand nombre de phénomènes, depuis la structure de certaines galaxies jusqu'au dégagement d'énergie 
dans les explosions nucléaires en passant par l'étude du Soleil et le comportement des gaz réels. Il s'agit 
du premier résultat qui nous intéressait. 


Dans un système gazeux, l'énergie potentielle peut s'écrire comme la somme de l'énergie des forces 
agissant de l'extérieur plus celles qui sont internes même au gaz. Tel que: 


E, _>r °F, DE A+ EF or. (34.367) 


Or les forces internes peuvent s'écrire comme: 


Il ne faut pas dans cette somme prendre la force qu'exerce chacune des particules sur elle-même. Tel 
que: 


Fe > (34.369) 


Jui 


Ce qui nous donne: 
E,= > For Dr F + D Eu À (34370) 
Ja 


Dans la double somme, nous pouvons regrouper les termes deux à deux et utiliser le principe d'action- 
réaction tel que: 


Pour obtenir: 


Et: 
E = DO Ron +S Re cn (84374) 
Ji 


Le premier terme de droite fait intervenir les forces intérieures (interactions) entre les (paires de) 
particules et le deuxième terme de droite fait intervenir les forces extérieures. 


Considérons maintenant un gaz contenu dans un récipient. Ses molécules ne sont sujettes à des forces 
extérieures que lorsqu'elles heurtent une paroi et nous imaginons qu'en moyenne cette force est 
perpendiculaire à la paroi (chocs élastiques). 
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x Ala00) 


Figure: 34.34 - Gaz contenu dans un récipient 


Pour toutes les faces contenues dans les plans définis par les axes, nous avons toujours: 


Puisqu'en moyenne Ë est toujours perpendiculaire à 7; . 
Pour les autres faces (BCFE par exemple) nous avons Æ = -Æx, et donc: 
ÉoË =nÆcosæ=-af (34376) 


où nous appelons a la coordonnée selon Oy de l'extrémité de 7; (ne pas confondre avec l'accélération!). 
Dès lors pour chaque face: 


DX: of = aù =-aF=-P# =-PY (34377) 


Effectivement car la pression interne du système sur les parois est définie par: 


Par le théorème du Viriel, en ajoutant les contributions non nulles des faces BCFE, DEFG et ABED il 
vient: 


L'énergie cinétique moyenne totale pour N molécules est alors (nous reviendrons sur cette relation plus 
loin mais avec une autre approche): 
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ce que les thermodynamiciens notent souvent: 


U=n SRT 


où U est donc l'énergie interne du gaz et ddl le nombre de degrés de liberté des constituants. 


La relation antéprécédente, appelée "théorème d'équipartition de l'énergie", est importante car elle 
permet: 


1. Une interprétation microscopique de température T'et de déterminer l'énergie interne d'un gaz parfait 
monoatomique (et par extension d'autres gaz avec des degrés de liberté autres). 


2. De constater que le système de température en Celsius n'est pas adapté à la réalité physique. 
Effectivement, dans le système utilisant les Celsius, à 0 [°C] tout devrait être immobile (énergie 
cinétique nulle) or il est évident que ce n'est pas le cas pour toutes les substances. Donc il faut 
introduire une nouvelle température qui met en adéquation l'énergie cinétique mesurée et la 
température traditionnelle. Il s'agira de la "température absolue" mesurée en Kelvin [K] dont 
l'équivalence énergie cinétique/température mesurée est telle que le 0 [°C] correspond à 273.15 [K]. 


L'énergie interne est une contribution à l'énergie qui n'apparaît pas en mécanique classique. Du point de 
vue macroscopique, un récipient immobile qui contient un fluide ne possède pas d'énergie cinétique, 
alors que son énergie potentielle est constante. Nous pouvons l'ignorer en donnant la valeur zéro à cette 
constante. 


Du point de vue microscopique, les choses changent cependant! Effectivement, les atomes ou 
molécules du fluide sont en mouvement et interagissent. Il faut leur associer une énergie (l'énergie 
interne) qui est la somme des contributions relatives à chaque atome. 


Dès lors: 


1 1 = 1 “à — 
PF = 3 M - 322 À of = MKT + 522 À of, 


Je 


C'est "l'équation générale d'état d'un gaz réel", c'est-à-dire l'équation d'état qui tient compte des 
interactions entre molécules. Il est intéressant de remarquer que finalement cette relation peut nous 
permettre de calculer l'énergie du gaz même s'il n'y pas de parois! 


Si le gaz est parfait, il n'y a pas d'interactions entre les N molécules (par hypothèse) et alors nous avons 
"l'équation des gaz parfaits" suivante: 


PF = NXT 


Que nous retrouvons beaucoup plus fréquemment sous la forme: 


PF = ART 


si n est exprimé en moles avec R la constante des gaz parfaits. 


Si la température est constante, nous retrouvons la "loi de Boyle-Mariotte": 
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PF =c# (34.386) 


Pour arriver à l'équation des gaz parfaits, il est utile de rappeler que nous avons fait trois hypothèses: 


H1. Les molécules sont assimilées à des sphères dures dont le diamètre est négligeable devant la 
distance moyenne qui les sépare. C'est que ce que nous appelons "l'hypothèse structurale". 


H2. À la limite, et c'est ce que nous avons retenu, si nous considérons les molécules comme 
ponctuelles, la possibilité d'interaction entre les particules s'annule. Les seules interactions qui 
subsistent seront les chocs sur les parois du récipient qui contient le gaz. Ces chocs sont parfaitement 
élastiques de sorte que nous puissions appliquer les lois de conservation de la quantité de mouvement 
de l'énergie cinétique. C'est ce que nous appelons "l'hypothèse interactive limite" 


H35. Le gaz est étudié dans un état d'équilibre thermodynamique ce qui se traduit par l'homogénéité des 
variables intensives et extensives. C'est que ce que nous appelons "l'hypothèse du chaos moléculaire". 


Dans un cas particulier, si les interactions dérivent d'un potentiel central: 


_ dE.) 
F,- — "à, (34.387) 
dr. 
ÿ 
Il vient ainsi: 
ÔE, (r,) 
D = RS ms : (34.360) 
ôr; 


Si en outre l'énergie potentielle est du type (attention de ne pas confondre le paramètre k avec la 
constante de Boltzmann notée de la même manière!): 


l'a 
E,()=— (34.389) 
Fi 


nous avons: 
Fin; = -n£,(r;) (34.390) 
et dès lors: 


PF = NET + lg, (34.391) 
3 


où Æ, est l'énergie totale moyenne du système. 


Au fait, il faut bien prendre garde au fait que nous n'avons pas rigoureusement démontré l'équation des 
gaz parfaits. Effectivement, lorsque nous avions posé plus haut: 


1 2 


FR Ir (34.392) 
à 2 


€ 


Cela supposait implicitement que l'équation des gaz parfaits était déjà connue (...). 
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Cette approche de la cinétique des gaz est intéressante car utile en astrophysique. Cependant, ce n'est 
de loin pas la plus simple dans un cadre scolaire et pédagogiquement. Nous nous proposerons de revenir 
sur ces mêmes résultats via les concepts de pression et de température cinétique une fois l'équation de 
Van der Waals déterminée. 


En 1875, le savant néerlandais J.D. Van der Waals (1837-1923) essaya donc de remplacer l'équation 
des gaz parfaits par une relation qui tiendrait compte des forces intermoléculaires et de la taille des 
molécules. La première correction, et la plus évidente, à l'équation des gaz parfaits: 


PF = NT 


est de soustraire le volume des molécules de gaz du volume V. Nous pouvons le faire logiquement en 
remplaçant V par V-Nb où b est une constante très faible représentant bien évidemment le volume 
moyen par molécule (il existe des tables pour cela). Donc: 


__ ANT 
F-N.b 


où le terme 7.3 est communément appelé le "covolume". 


Pour tenir compte des forces intermoléculaires que nous avons négligées précédemment, nous pouvons 
tenter une approche approximative en sachant déjà que la force d'attraction de chaque molécule se fera 
sur N-1 molécules. Par conséquent, le numérateur de la force d'attraction contiendra (par la somme de 
tous les termes) trivialement si le gaz est isotrope et homogène un terme du type N(N-1) pour l'influence 
de toutes les molécules entre elles ce qui si N est très grand peut être approximé par }j£. 


Nous savons également qu'au numérateur, il y aura un terme de masse pour chaque particule. Si nous 
connaissons N/V alors il ne reste plus qu'à connaître la densité massique du gaz (mais ce n'est pas une 
variable extensive donc nous éviterons de la faire apparaître explicitement). Ainsi, le terme }72 peut 


s'écrire directement (W/ rÿ 


En suivant ce raisonnement, Van der Waals ajouta au terme de droite de l'équation ci-dessus un terme 
négatif proportionnel à la quantité (W/ rÿ . La présence de ce terme se traduit par un abaissement de 


la pression au fur et à mesure que croit la densité du gaz. La relation modifiée est ainsi: 


P 


Ilè 


ENT __ (NY 
V-N.b 


où a est une constante de proportionnalité. Nous pouvons réécrire cette relation sous la forme: 


P+a AY V-N.b)= ENT 
Je 


qui est appelée "équation d'état de Van der Waals" ou encore "équation de gaz réels de Van der Waals" 
(on retrouve dans la littérature plusieurs manières équivalentes d'écrire cette dernière relation). Elle est 
une excellente description de l'équation d'état dans un large domaine des variables P,V,T, les valeurs a 
et b étant caractéristiques de chaque gaz. Les constantes a et b sont déterminées expérimentalement 


comme nous en avons déjà fait mention. 
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Nous pouvons représenter un l'équation de Van der Waals dans un diagrmme P-V (donc à température 
constante). Dont voici un exemple avec le CO, (gaz carbonique/dioxyde de carbone): 


Pression (MPa) 


Pression (atm) 


7 481°C 
355 °C... 
Isotherme critique 


Figure: 34,35 - Diagramme P-V de Van der Waals 


Ce qui correspond à: 


ENT M 
—_—— — ff —— 
V-Nb y 


" 
I 


(34.397) 


La figure du bas montre le case général. On peut passer de l'état F (vapeur) à l'état I (liquide) en suivant 
un chemin passant per les états A et E (palier de liquéfaction), on observe alors une transition de phase. 
Si on suit un autre chemin, par exemple en utilisant l'isotherme GH (T >T,, chemin rouge), il n'y a pas 


de palier de liquéfaction, on passe de manière continue de l'état gazeux à l'état liquide: 
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courbes 1sothermes 


nl 
à 


| zone de liquéfaction 


Figure: 34.36 - Diagramme P-V de Van der Waals générique 


L'équation de Van der Waals peut être mise sous forme d'un développement du type Viriel en utilisant 
un développement de Taylor (Maclaurin): 


pe ANT -a[x) - ENT -a[*) - ENT ST (NE) 
CV-Nb \7} Vi-nb/v) \rv]) v(i-nb/r) v \kTv 


ENT Nb Nb? a ( N | . 
| + on © _—_— (34.398) 
V4 F 772 7  KLETY 
2 
Nid nt. te) 
V4 V4 772 F7  KK&TV 


ou en réorganisant les termes: 


&NT N 2N° 
P= —|1+ (e- æ) —+b7 +.) (34399) 
F 2 
Remarquons qu'il existe une température pour laquelle É + est nulle. Nous l'appelons 


"température de Boyle" du gaz: c'est la température à laquelle le gaz réel ressemble à un gaz parfait. Il 
est très délicat d'obtenir ces paramètres expérimentalement. 


3.3. PRESSION CINÉTIQUE 


Recherchons le nombre de molécules d'un gaz parfait toutes supposées animées d'une vitesse égale v 
qui viennent frapper une surface S pendant une durée dt. 
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Si le gaz étudié est dans un état d'équilibre thermodynamique, cela se traduira par l'homogénéité des 
variables intensives (hypothèse du chaos moléculaire). 


Il s'ensuit que la densité des particules est constante: 


Si nous admettons que les molécules sont en mouvement, nous supposerons qu'il y a isotropie des 
vitesses. En d'autres termes, puisque les vitesses peuvent vectoriellement être décrites dans un système 
de 3 axes orthogonaux (trois dimensions spatiales), il y a 6 directions possibles primaires au total (2 
directions par axe: en avant, en arrière...). 


Cela se traduit par l'équivalence entre les différentes directions. Il y a: 


Mn 2: 
(34.401) 


6 


particules ayant une vitesse v selon l'une des directions primaires. 


Donc pendant une durée dt, la surface S de la paroi n'est percutée que par une partie des molécules 
contenues dans le volume $.». 45. En effet, seul 1/6 des molécules contenues dans ce volume se 
dirigent effectivement vers la surface S. 


Figure: 34.37 - Une des parois de l'enceinte 


Le nombre de molécules qui viennent heurter la paroi pendant la durée dt est donc : 


ly -S-v-df (34.402) 
6 


Étudions maintenant la dynamique du choc d'une particule sur la paroi : 


La particule de masse m qui arrive sur la paroi avec la vitesse Ÿ, repart avec une vitesse —-Y, si le choc 


est parfaitement élastique. 


La variation de la quantité de mouvement de la particule est donc : 
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ÉProiécue = F; = à) = m((-5,)-5,)=-2mv6, (54.403) 


En vertu de la conservation de la quantité de mouvement, cette quantité de mouvement est transférée à 
la paroi : la variation de la quantité de mouvement subie par la paroi est l'opposé de celle de la 
particule: 


P paroi = -m($, s ñ) = 2mve, (34.404) 


La variation totale de la quantité de mouvement de toutes les particules qui viennent frapper la paroi 
pendant la durée dt vaut alors en module : 


dp = Cm) 2, -S-v-df (34.405) 


En appliquant le principe fondamental de la dynamique, nous pouvons passer à la force subie par la 
paroi pendant la percussion de ces molécules : 


donc: 
1 2 in 
F=-N, Smv (34.407) 
Or par définition de la pression et en prenant le module: 


ee 


— (34.408) 
Es 


nous avons alors la "pression cinétique" donnée par: 
l 
P= 3 M (34.409) 
La pression cinétique est donc la traduction de la fréquence des chocs sur la paroi. Plus les molécules 


sont nombreuses (terme en À}, ) et rapides (terme en v), plus le nombre de chocs augmente. Cela est 
conforme à l'expérience et à l'intuition. 


3.4. TEMPÉRATURE CINÉTIQUE 


En remplaçant #W, par le quotient N/V, l'équation précédente peut se mettre sous la forme : 


PF = = Mi (34.410) 


Si nous l'identifions avec l'équation d'état des gaz parfaits vue plus haut: 


PF =hRT (34411) 
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il vient : 


= Mi = ART (34.412) 


Or la quantité de matière n est égale au rapport du nombre de particules sur le nombre d'Avogadro: 
H=NINx (34413) 


ce qui permet de définir la "température cinétique" par : 


Nous pouvons alors introduire une constante qui nous est déjà connue appelée par Max Planck 
"constante de Boltzmann" et telle que: 


= 21.38.10 8 [J.K1] Gas 


Av. 


Remarque: Nous avions déjà fait mention de cette relation lors de notre présentation des constantes 
universelles dans le chapitre traitant des Principes de la mécanique. 


L'expression de température cinétique prend alors la forme : 


2 
Te") (34416) 


Cette relation montre que la température cinétique est le reflet de l'énergie cinétique des particules. 
D'une façon imagée, c'est l'image de la violence des chocs. 


Ainsi, l'énergie d'un gaz parfait se réduit à la somme des énergies cinétiques des particules qui le 
constituent: 


Les atomes d'un gaz parfait monoatomique sont assimilables à des points matériels. Leur énergie 
cinétique est une énergie cinétique de translation dont la valeur moyenne, par atome, s'écrit : 


. = Dr (34.418) 
2 2 


Dans l'espace des vitesses, toutes les directions sont équivalentes : il y a isotropie de la distribution des 
vitesses. En coordonnées cartésiennes, il vient : 


= +} +v2 (34.419) 


et par suite de l'isotropie: 
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d'où : 


ainsi, l'énergie cinétique moyenne par degré de liberté de translation est égale à: 


ler (34.422) 
2 


Le lecteur remarquera bien évidemment que nous obtenons ici les mêmes résultats et conclusions que 
lors de notre étude du théorème du Viriel à la différence que l'approche est ici plus simple et donc plus 
didactique. 


3.5. LIBRE PARCOURS MOYEN 


Nous allons voir maintenant un cas d'études très intéressant des gaz qui permet de mettre au clair 
beaucoup d'incompréhensions dans la vie de tous les jours (fumée dans les restaurants, chaleurs près 
d'un radiateur, ..). Cependant, les phénomènes sont en réalité plus complexes il faut aussi prendre en 
compte la diffusion, la convection, etc. 


Considérons une molécule, qui se déplace à la vitesse moyenne y . Sa sphère d'influence F balaie 
alors, pendant l'unité de temps de son déplacement, un volume donné par: 


Remarque: Dans le cas où l'on considère un atome ou une molécule comme une sphère d'influence, 
on parle souvent de "volume de Van der Waals" et du "rayon de Van der Waals" associé. 


Si l'unité de volume renferme n molécules (n a donc les unités d'une densité volumique), le nombre de 
chocs pendant l'unité de temps dans cette même unité de volume sera alors de: 


C=n7r2y (34.424) 


si les autres sphères d'influence étaient immobiles.. Donc pour tenir compte du mouvement des autres 
sphères d'influence, considérons la figure ci-dessous avec trois scénarios simplistes: 


Figure: 34.38 - 3 scénarios de collisions 


De gauche à droite nous avons: 
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1. La vitesse relative des molécules est 2.5 


2. La vitesse relative est nulle 


3. La vitesse relative vaut (Pythagore) Ne ET 


Les deux premiers cas sont quand même un peu extrêmes... Le troisième sera considéré comme 
représentant une moyenne et peut servir de nouvelle base au calcul précédent. 


Ainsi, en utilisant la vitesse relative du dernier scénario, le nombre de chocs pendant l'unité de temps 
dans l'unité de volume devient : 


C=nrr2-/25 (84425) 


Ainsi, entre deux chocs, une molécule parcourt une distance moyenne : 


À = (34.426) 


— 
C nxr° V2 
qu'il est d'usage de noter: 

À = 


v l _—. 
Cam 

C'est donc l'expression du libre parcours moyen en fonction de la densité moléculaire n (et non du 
nombre de moles!!!) et du rayon r de la sphère d'influence, paramètre intrinsèque du gaz considéré. 


Compte tenu de la relation: 
En 
FPF=NI—=rP-MT—2= 1 (34.428) 


où n est toujours la densité moléculaire (et non le nombre de moles!!!) nous obtenons: 


ET 
A = (34.429) 


x P 
Une application numérique donne pour l'élément aux conditions normales de température et de pression 


un libre parcours moyen qui vaut pour la majorité des molécules courantes plusieurs milliers de fois le 
diamètre d'une molécule de taille standard (le libre parcours moyen est donc de l'ordre du micromètre). 


En utilisant la relation de la vitesse moyenne la plus probable dans le cadre de l'hypothèse d'une 
distribution de Maxwell des vitesses (cf. chapitre de Mécanique Statistique) nous avons: 


2KkT 2RT 2 
v= — = | = 589 [ms 1] (34.430) 


pour une molécule de masse molaire de 30 [g] à température normale. Ce qui donne un nombre de 
collisions pour une mole de molécules: 
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= nrr 2/25 215.106 [collisions | 


Cette fréquence élevée de chocs explique, dans des conditions normales de température et de pression, 
la rapidité avec laquelle l'équilibre statistique s'établit au sein d'un gaz. 


À la température ambiante et pour un vide de 75.107! [P4], nous obtenons avec les mêmes valeurs : 
Az 1 [tn]. 


Les dimensions des récipients contenant les gaz étant toujours inférieures à cet ordre de grandeur, il 
apparaît que lorsque le vide est réalisé dans une enceinte, les chocs intermoléculaires sont négligeables 
vis-à-vis des chocs molécules-parois. 


4. PLASMAS 


Nous définissons le "plasma" comme un état de la matière dans lequel certaines liaisons électroniques 
ont été rompues, provoquant l'apparition d'électrons libres, chargés négativement et d'ions, chargés 
positivement. Les gaz faiblement ionisés appelés "plasmas" par abus de langage, possèdent les mêmes 
propriétés mécaniques (écoulements, ondes acoustiques, etc.) que les gaz neutres, en revanche leurs 
propriétés électromagnétiques (conductivité électrique, indice de réfraction) en diffèrent par suite de la 
présence d'électrons libres en leur sein. 


Remarque: Le plasma est aussi nommé "quatrième état de la matière" (après les états solide, liquide 
et gazeux et avant le cinquième état de la matière: le condensat de Bose-Einstein). 


Dans leur état normal, les gaz sont des isolants électriques. Cela tient au fait qu'ils ne contiennent pas 
de particules chargées libres, mais seulement des molécules neutres. Cependant, si nous leur appliquons 
des champs électriques assez intenses, ils deviennent conducteurs. Les phénomènes complexes qui se 
produisent alors portent le nom de décharges dans les gaz et sont dus à l'apparition d'électrons et d'ions 
libres. 


Le résultat d'une décharge dans un gaz est donc la production d'un gaz ionisé contenant par exemple 


une densité moyenne de : électrons, x, i0nS positifs et x. neutres (atomes ou molécules). En 
€ i û 
général, le gaz est macroscopiquement neutre. Nous avons alors: 


ou autrement exprimée, la neutralité s'écrit aussi: 
di + Gene = 0 


Cette neutralité est la conséquence des forces électrostatiques très intenses qui apparaissent dès que 


l'on a > _. La densité de particules est donc la première grandeur fondamentale. 


e À; 


Remarque: La neutralité n'est que globale. À une échelle plus fine, les électrons, plus mobiles que 
les ions, forment un nuage autour de chaque ion. 
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Le "degré d'ionisation" d'un gaz est défini par le rapport: 


ñ# 


& = 
#otA 


où ». St la densité de particules neutres et n celle des électrons (ou des ions positifs). La valeur du 
0 


degré d'ionisation dans les divers types de gaz ionisés varie en pratique depuis des valeurs très faibles, 
de l'ordre de 10-10 par exemple, jusqu'à 1. 


La deuxième grandeur fondamentale est la température. Lorsque l'on chauffe un gaz à une température 


T suffisamment élevée ( de l'ordre de 10€ ), l'énergie moyenne (voir théorème du Viriel): 


3 
es 
: 


de translation de ses molécules peut devenir du même ordre que leur énergie d'ionisation E.. Dans ces 


conditions, lorsque deux molécules entrent en collision, il peut y avoir ionisation de l'une d'entre elles. 


Si le gaz est en équilibre thermodynamique, l'ionisation par collision est contrebalancée par des 
processus de recombinaison entre électrons et ions et il en résulte que les trois variables œnetT ne 


sont pas indépendantes: l'ionisation est déterminée par la pression et la température, nous disons alors 
que le gaz est en "état d'équilibre d'ionisation thermique". 


À des températures plus élevées, les atomes du gaz peuvent d'ailleurs s'ioniser plusieurs fois. Dans de 
nombreux cas, l'ionisation est due à un champ électrique extérieur, et le gaz n'est pas en équilibre 
thermodynamique. Il atteindra souvent un état stationnaire que l'on pourra caractériser par les 
paramètres an, T (température des électrons), T (température des ions) et z (température des 


molécules). 


Les trois températures ainsi introduites sont définies par la condition que 3 LT 
2 2 


cinétique moyenne des particules d'espèce a, dans un repère où elles ont une vitesse moyenne nulle. 
L'écart entre TT €etr peut être important: par exemple, dans un tube à décharges typique, nous 
€ Û 


i 


représente l'énergie 


pourrons avoir: T «T2 300K et T 23. 10€ La forte valeur de r est due à l'action du champ 


électrique sur les électrons, et l'ionisation est alors produite par les collisions de ces électrons chauds sur 
les molécules neutres du gaz. 


En conclusion il n'y a que deux grandeurs de base permettant de caractériser un plasma: la densité et la 
température électronique. Nous allons maintenant nous pencher sur deux autres grandeurs importantes 
mais non fondamentales dans le sens où elles s'expriment à partir de la densité et de la température. 


4.1. FRÉQUENCE PLASMA 


Si dans un plasma initialement neutre, nous produisons une perturbation locale sous la forme d'un excès 
de charge électrique positive ou négative, celui-ci va tendre à revenir vers l'état d'équilibre de 
neutralité. Cependant, nous pouvons voir facilement que la perturbation initiale engendre en général 
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une oscillation pendulaire non amortie du plasma autour de son état d'équilibre. Considérons par 
exemple la situation représentée sur la figure ci-dessous. 


Figure: 34.39 - Oscillation électronique du plasma 


À l'instant initial la région au centre contient un déficit d'électrons et la région tout autour un excès 
d'électrons. Cela produit un champ électrique tendant à créer un mouvement des électrons dans le sens 
des flèches. Dans ce mouvement, ceux-ci acquerront une certaine énergie cinétique et ils pourront, au 
bout d'un certain temps, dépasser la position d'équilibre. Un trop grand nombre d'électrons ayant quitté 
la région externe, il y aura un défaut d'électrons dans cette région et un champ électrique tendant à les 
ramener vers elle. Au bout d'un certain temps, la situation initiale est reconstituée et le cycle 
recommence. Les vibrations ainsi produites sont appelées oscillations de plasma électroniques. 


Nous pouvons étudier quantitativement ce problème en posant les équations générales d'une oscillation 
de charge électronique et moyennant les hypothèses simplificatrices suivantes: 


H1. Les ions sont supposés immobiles étant donné qu'ils sont beaucoup plus lourds que les électrons, 


et leur quantité égale à . 
i0 


H2. L'agitation thermique est négligeable 

H3. Les collisions sont négligeables 

H4. Les oscillations sont de faible amplitude 

H5. Il n'y a pas de champ électrique ou magnétique imposé par des sources extérieures 


Maintenant, rappelons que nous avons démontré dans le chapitre d'Électrodynamique que (équation de 
conservation de la charge): 


on +Vof=0 (34436) 


dé 


et dans le chapitre d'Électrocinétique que: 


Dès lors, en adoptant les notations susmentionnées, il vient localement: 
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ün, 
dk 


+V o(x, 5 )= 0] (34.438) 


relation qui constitue "l'équation hydrodynamique des électrons". 


Remarque: Un plasma est certes en théorie globalement neutre, mais nous pouvons avoir en théorie 
localement un volume non neutre. C'est cette hypothèse qui nous permet de poser que la divergence 
du courant n'est pas nulle! 


Rappelons maintenant la force de Coulomb (cf. chapitre d'Électrostatique): 


où nous avons donc clairement négligé le terme de pression cinétique et le terme de collision 
(hypothèses 2 et 3) et négligé le champ magnétique lié à l'oscillation. 


Nous pouvons simplifier ces équations en utilisant l'hypothèse 4 sous la forme: 


PE) = R0 + rat) CO 


où - est une petite perturbation. 
#a(r,é) P P 


Supposons de plus que les quantités variables varient à la pulsation &, nous pouvons donc écrire: 


E(,0 = (net 


- ot (34.441) 
#a(r,é) _… #aw)'e ” 


Dès lors, l'équation hydrodynamique des électrons devient: 


On, = L (nn + | 
RE + Vo (ee) « 


= +Vo((xo +21) %) 


On Ma à » 
«< LiGo(xn %) 


+ Vo(rg %)+Vo(rs %)= 
Eu (34.442) 


na On (Fe tt ; 


æ 
= 1 +20 Ÿ o 


= +0 Vo = +20 V où = ions (ne +roVoë 


Soit au final: 
“ions +ngV0o% =0 (34443) 


De l'expression de la force de Coulomb nous déduisons également: 
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di= Le Ey (34.44) 
C2 


d'où nous tirons: 


à = — Édt = — EPe et dt = _ E(F)[ et de = - EE (34.445) 
£ (A 


£ £ 


Maïs nous avons d'autre part la loi de Gauss (cf. chapitre d'Électrodynamique): 


(CPE gr #e0Te +de) L Rae 


EF E 


VoËk= (34.446) 


en effet compte tenu de la condition de neutralité du plasma non perturbé, nous avons: 


(04 * #e0%e) = Ù FES 


Donc: 


Vo Male _ o (34.448) 
EQ 


De la relation démontrée précédemment: 


: Je x (34.449 
V, = —<{— E Fe ) 
- im, 


en remplaçant dans la relation suivante (aussi démontrée précédemment): 
any +908, =0 (34450) 
nous avons: 


# 2. 
CRE Te GE (34.451) 
am 


€ 


Finalement en remplaçant cette dernière expression dans la loi de Gauss, nous tirons: 
ss # : + + À g2 
VoË-"ee yoË_yofl1- "0% |_p (4452) 
æ Le 5 æ F2, 5 
Mais dans les oscillations de charges d'espace nous avons par définition : 
VoË #0 (34.453) 


Ce qui nous amène à: 
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2 
ee _189- 
Dm En Me E0 


2 
#e0%e (34.454) 


Finalement, nous avons la "fréquence plasma" ou encore "fréquence de Langmuir" donnée par: 


2042 | (4.455) 


fn = JE 
su ATÊm, En 


En physique, la fréquence plasma est ainsi la fréquence caractéristique des ondes de plasma, c'est- 
à-dire des oscillations des charges électriques présentes dans les milieux conducteurs, comme le métal 
ou les plasmas. À l'image de l'onde électromagnétique qui, quantifiée, est décrite par des photons, cette 
onde de plasma est quantifiée en "plasmons”. 


Les oscillations des charges électriques peuvent être comprises grâce au raisonnement suivant: si les 
électrons d'une zone du plasma sont déplacés, alors les ions de cette zone, n'ayant que peu bougé du fait 
de leur masse importante, vont exercer sur ces électrons une force de Coulomb attractive. Ceux-ci vont 
donc revenir vers leur position initiale, et ainsi de suite... 
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Notes personnelles: 
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Électrodynamique 


35. ÉLECTROSTATIQUE 


J usqu'ici nous nous sommes concentrés sur l'interaction gravitationnelle et la grandeur caractéristique 


de la matière, appelée "masse", qui lui est associée. Nous avons évoqué l'interaction électromagnétique, 
en analysant des phénomènes macroscopiques, comme le frottement, la cohésion, l'élasticité, les forces 
de contact, etc. Maintenant nous nous penchons sur les forces électroniques et la caractéristique de la 
matière, appelée "charge", qui leur est associée. L'interaction électromagnétique lie la matière, sous 
toutes ses formes observables. C'est elle qui fait tenir les électrons au noyau dans l'atome, qui fait tenir 
ensemble les atomes dans les molécules, les molécules dans les objets et même votre nez à votre visage 
(eh oui. nous tenons pas à grand-chose. lol). 


La "charge" produit la "force électrique" ou "force de Coulomb" et nous commençons seulement à 
comprendre cette force. La charge est une notion fondamentale, qui ne peut pas être décrite en termes 
de concepts plus simples et plus fondamentaux. Nous la connaissons par ses effets et malheureusement 
pas par ce qu'elle est (c'est idem pour la masse rappelons-le aussi). 


L'expérience a montré aussi que bien que la charge est comme la masse une propriété additive, elle 
comporte cependant aussi des valeurs négatives (et non exclusivement positive comme l'est a priori la 
masse). Ainsi, dans le langage actuel et comme l'expérience le confirme, deux charges identiques se 
repoussent et deux charges opposées s'attirent. 


Voyons maintenant la force qui est associée à la charge: 


1. FORCE ÉLECTRIQUE 


Il a expérimentalement été établi par Coulomb qu'une particule témoin subit une force d'une intensité 


Ê proportionnelle à sa charge q, lorsqu'elle est placée au voisinage d'une ou plusieurs charges 


électriques @,, dans un milieu de permittivité & (permittivité au champ électrique bien sûr...) donnée 
par (sous forme vectorielle et non relativiste): 


où x St le vecteur position d'une charge témoin. 
Ë 


En d'autres termes, deux corps chargés ponctuels s'attirent ou se repoussent selon une force 
directement proportionnelle à leur charge et inversement proportionnelle au carré de la distance qui les 
sépare. 


Dans le cas d'un système à deux particules séparées par une distance r, nous avons la même relation 
simplifiée et nous retrouvons la forme plus commune de la force électrique ou "force de Coulomb" telle 
qu'elle est donnée dans la plupart des ouvrages (sous forme scalaire et non relativiste): 


r-_l 930 


2) (252 


AE r 
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Remarques: 


R1. Fréquemment, cette dernière relation est définie sous le nom de "loi de Coulomb" dans la 
plupart des écoles et admise comme non démontrable. Au fait, il n'en est rien ! Cette relation peut 
se démontrer comme nous le verrons lors de l'étude de la physique quantique des champs (cf. 
chapitre de Physique Quantique Des Champs) en utilisant l'équation de Klein-Gordon dans le 
contexte d'un champ de potentiel à symétrie sphérique (démonstration effectuée par Yukawa). 


R2. Pour la forme relativiste de la loi de Coulomb, le lecteur se reportera au chapitre de Relativité 
Restreinte où il est démontré que (forme vectorielle): 


g'fi-w /c?) OF 


Em TE 
[1 — (v? fe? sin? ë]” AE 


La valeur de permittivité dans le vide est quant à elle donnée expérimentalement par: 
5, = 8.8541878:10 7 [CA * ] (35.4) 


et relativement au milieu considéré, nous définissons une permittivité relative #, qui permet plus 


facilement de déterminer les propriétés d'un matériau par rapport au champ électrique tel que: 


E=D'E 


(35.5) 


Il convient d'indiquer que certains auteurs définissent la permittivé du vide à partir de la vitesse de la 
lumière et de la perméabilité magnétique du vide (cf. chapitre de Magnétostatique). Dès lors, la valeur 
de la permittivité du vide est bien évidemment exacte par définition. Mais cela n'a de sens qu'une fois la 
théorie de Maxwell connue et celle-ci sera presentée et démontrée que plus tard dans le chapitre 
d'Électrodynamique (nous suivons les démarches dans l'ordre historique des découvertes scientifiques). 


Nous définissons également le rapport: 
É, "EE (656 


Zu 


appelé "constante diélectrique". 


Le facteur entre parenthèses dans: 


ne dépend que de la distribution des charges @, dans l'espace et de la permittivité # du milieu 
considéré. Puisque sa valeur varie d'un endroit à l'autre et dépend du vecteur position F de la charge 


témoin, il forme un ensemble de vecteurs, dont la propriété est celle d'une multitude de lignes de 
champs électriques d'où l'utilisation du terme "champ électrique". 
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L'ensemble de ces vecteurs porte donc le nom de "champ électrique" £ au point F° dans la 
distribution de charges €, : 
Eye LS É  G 7) 
7 ll (D 
Rn 2: 


Les ingénieurs utilisent souvent une autre notation qui permet de caractériser uniquement la géométrie 
du champ et ce indépendamment du milieu et introduisent le concept de "champ de déplacement": 


D =EË 


nous retrouverons ce vecteur dans le chapitre d'Électrodynamique lors de notre synthèse des équations 
de Maxwell. 


La force Coulombienne, agissant sur la charge témoin q, s'écrit alors de façon conventionnelle: 


F =g"Ë(F)) (59) 


2. POTENTIEL ÉLECTRIQUE 


Soient deux points A et B dans une région de l'espace où il existe un champ électrique et soit 


E(x,y,2) 


un chemin F reliant ces deux points. Alors, dans le cas particulier où la source d'un champ £ est une 


sphère ou un corps ponctuel et que nous posons une charge à son voisinage, nous avons pour le travail 
effectué par la force pour déplacer la charge du point À au point B: 


= 8 8 8 8 o 21 
aWizs=Fodr— F LE nd D 'E le 
Axe dr 
1 1 1 1 
“#f1).2i 
AE F3 ra AE rs Fr 


Par ailleurs, ce travail est comme nous le verrons plus loin, assimilable à l'énergie potentielle. Nous 
définissons ainsi la "différence de potentiel" ou simplement le "potentiel" par la relation: 


(35.10) 


Q@ [1 1 


=ÙU,-Ù0, (35.11) 
3 À 
4xE|rz ra 


et donc: 
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Remarques: 


R1. Le potentiel est souvent appelé "tension" par les électriciens, électrotechniciens ou autres 
ingénieurs. Parfois par abus de la langue anglophone le terme "voltage" est ensuite utilisé par 
référence à l'unité de mesure du potentiel qui est le "Volt" noté [V]. 


R2. La différence de potentiel peut aussi bien se faire entre deux bornes chargées de manières 
opposées (+,-) qu'entre deux bornes (+,neutre) ou encore (-,neutre). Ces deux derniers cas 
représentent typiquement la configuration utilisée par les trains, trams, l'orage et presque tous les 
appareils électroménagers. 


Démontrons maintenant dans le cadre le plus général qui soit que le champ vectoriel stationnaire 
dérive d'un champ de potentiel: 


Soit une charge Q repérée par rapport à un référentiel par le vecteur ro . Alors en chaque point de 
l'espace, il existe un champ £ tel que: 


| re =. fé 
E(r) = 2 | _SF F m7) (35.13) 
eu (4 | 
développons cette expression: 
x P 
, K'@ ni 
ER, 3,2) = ——" lr-r,| GG 


ler +(y “rl + (z “il ZX 


Si & est un champ de potentiel stationnaire alors, il doit exister un potentiel P(x,y,z) de ce champ 
qui satisfasse: 


—( z)= E, (x rl (xs E ER TIE (x Z) E,(x Z) (35.15) 
ZX, , = L ,Ÿ, 5 : ; 5; ,— >:Ÿ, = Ê :Ÿ, (29. 
& 6 ÿ si A sd Ÿ 


Regardons si le potentiel existe pour un champ de Coulomb. Nous devons alors avoir pour le champ 
en X: 


£'Q 


x T'G-7») (35.16) 
[x-r) +@-r) +(z-r2) P 


d'où: 


1 
D{x.y,z)=-K'O[Gx-r) +O@-r) +(2-r) 1? 4€ G517 
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et si nous effectuons le même développement pour chaque composante, nous obtenons également le 
même résultat. Donc le potentiel électrique est un champ scalaire et non vectoriel (le champ électrique 
est donc lui un champ vectoriel)! 


Le pontentiel P(x,y,z) est appelé dans le cas d'un champ de Coulomb "potentiel coulombien" et est 
par convention choisi tel que: 


D(x,y,z)=-U (35.18) 


Comme nous pouvons le constater par l'expression de P(x,y,z) antéprécédente, C est une constante 
arbitraire, qui impose dans le cas d'absence de charges que: 


U=0 (35.19) 
Ce qui nous donne finalement: 
üx dy dz 
Ce qui donne pour toutes les composantes: 
à 
ox 
= à 
E=-|—|'?27 (35.21) 
dy 
& 


que nous notons plus brièvement: 


… 


Ê=-V'U =-grad(U)| (25.22) 


Remarque: Les mêmes développements et résultats (et ceux qui vont suivre) sont applicables en ce 

qui concerne le champ de potentiel gravitationnel. Cependant, il est rare qu'ils soient effectués dans 
la littérature ou les écoles car l'être humain ne contrôle pas le champ gravitationnel avec une facilité 
et une intensité équivalente à celle du champ électrique... 


2.1. INDÉPENDANCE DU CHEMIN 


Démontrons maintenant que la différence de potentiel entre deux points À et B ne dépend pas du 


chemin F parcouru tel que nous l'avons fait pour le champ de potentiel gravitationnel dans le chapitre 
de Mécanique Classique. 


Soit F un chemin reliant deux points À et B et un champ Ë et faisons en sorte d'exprimer le champ en 


X, y et z par rapport à une seule variable t (qui n'a rien avoir avec le temps...) qui rendrait compte de sa 
variation lors d'un déplacement quelconque entre ces deux points: 
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Eodr =-{V:U(r()))odr (3523) 


avec donc À qui correspondrait à la valeur 4 du paramétrage et B à la valeur #3. 


Or, nous savons que (cf. chapitre de Calcul Différentiel et Intégral et Calcul Vectoriel): 


df San + Pay + Pas = 0, fdr+0, fdy+0,4=(V.flodr (3524) 


x 
Il vient alors: 


Éodr=-dUir(é)) (35.25) 


Dès lors: 


t 
-[ Écar= [au (rO)= vire) (s =U(r())-U(r(a)) 
T a 


——— 
AU 


(35.26) 


Cette dernière expression montre bien que U est indépendant du chemin T quelle que soit la manière 
dont nous paramétrons celui-ci. 


Le champ de Coulomb est donc un "champ conservatif". En effet, si nous considérons un chemin fermé 
T et soient À et B deux points confondus du chemin alors la différence de potentiel sera nulle. 


Signalons que parfois nous disons aussi que le champ gradient du potentiel est conservatif. 


2.2. ÉQUIPOTENTIELLES ET LIGNES DE CHAMP 


Nous pouvons maintenant à partir de ce que nous avons établi, définir les "équipotentielles" et les 
"lignes de champ". 


Soit un champ de Coulomb défini par rapport à un référentiel. Alors à chaque point (x,y,z) de l'espace, 
nous pouvons associer un vecteur champ électrique Et y ainsi qu'un potentiel électrique. 


Définition: Nous définissons les "lignes de champ" comme étant une famille de courbes pour lesquelles 
le vecteur ÊUx,y.2) est tangent et constant en chaque point et les "équipotentielles" comme étant des 


lignes pour lesquelles le potentiel U(x,y,z) est aussi constant. 


Dans ce cas, et c'est ce que nous allons démontrer, toutes les lignes de champ sont perpendiculaires à 
toutes les équipotentielles. 


Démonstration: 


Utilisons la propriété suivante de conservation du champ de Coulomb pour la démonstration: 
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AU = -f Êoar = U(B)-U(4)=0 (2527) 
L 


Comme nous sommes en présence d'un champ électrique, celui-ci dérive donc d'un potentiel comme 
nous le savons. Ceci implique que si le champ n'est pas nul le potentiel ne l'est également pas. Donc, 
dans l'intégrale curviligne: 


AU = -f ÉcdF (35.28) 
r 


un des termes est nul ! Ce n'est pas le champ électrique Ë puisqu'on est présence d'un, ce qui discrédite 


le potentiel U et comme la charge se déplace n'est pas nul non plus. Écrivons alors l'intégrale 


dr 
curviligne d'une autre manière: 
au 
D aU pr (35.29) 
AU =-$Eodr = -{E dr'cosæ=0&—=-EÆ'cosa-0e- =cosæ=0 
J J dr 
d'où: 
XX 
æœ=— (35.30) 
2 


nous pouvons donc conclure que les équipotentielles sont bien perpendiculaires aux lignes de champ 
électrique et inversement. C'est ce qu'il fallait démontrer. 


Voici des exemples de lignes de niveaux comprenant lignes de champ et lignes de potentiel obtenus à 
l'aide de Maple 4.00b (nous montrerons lors de notre étude des équations différentielles comment 
obtenir les fonctions mathématiques des lignes de champ): 


Figure: 35.1 - À gauche: une seule charge - À droite: deux charges de même signe 
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Figure: 35.2 - À gauche: deux charges de signes opposés - À droite: quatre charges de même signe 


Remarque: Mises à part les charges opposées, nous rappelons que les mêmes résultats sont 
applicables pour les masses avec le champ gravitationnel. 


Deux applications de ces résultats sont très importantes (pour lesquelles nous nous limiterons à l'étude 
des propriétés les plus importantes): 


1. La détermination des lignes de champ et des lignes équipotentielles pour un fil rectiligne infini tel que 
nous pouvons en approximation en considérer dans les circuits électriques ou les lignes hautes tensions 
aériennes (afin de déterminer l'influence des champs des fils avec leur environnement - cette étude fait 
partie du domaine de l'électrodynamique de l'ingénieur que nous appelons la CEM pour "Compatibilité 
Électromagnétique"). Les résultats pourront aussi être utilisés pour déterminer la "tension de pas" pour 
certains systèmes rectilignes qui détermine pour une distance donnée, le potentiel par mêtre pour lequel 
un mammifère peut être tué par électrochoc à proximité d'un tel fil. Une extension (sur laquelle je ne 
souhaite pas trop m'attarder bien que le sujet soit passionnant mais très chaud) est aussi l'influence d'un 
tel type de potentiel sur le fonctionnement du cerveau humain dans le cas de l'usage des téléphones 
portables (antennes émettrices d'un potentiel) ou d'habitations proches de lignes hautes tensions... 


Remarque: Nous déterminerons dans le chapitre de Magnétostatique la loi de Biot et Savart qui 
donne le champ magnétique pour un tel fil parcouru par une intensité de courant donnée. 


2. La détermination des lignes de champ et équipotentielles du dipôle électrique a une énorme 
importance en chimie. Nous verrons également quelle est la dynamique de celui-ci lorsqu'il est plongé 
dans un champ électrique uniforme et l'énergie d'interaction entre dipôles (comme c'est souvent le cas 
en chimie). 


2.2.1. FIL RECTILIGNE INFINI 


Soit: 


Nous avons: 
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en faisant usage du concept de densité linéique de charges telle que nous l'avons définie dans le 
chapitre Principes de la section de Mécanique, nous avons: 


Considérons une ligne infinie de section négligeable, et portant une charge linéique continue Y. Le but 


est donc de calculer le champ électrique et le potentiel en tout point M de l'espace extérieur à cette 
ligne afin de connaître les influences des charges de cette ligne sur son environnement en ne 
considérant que l'influence du champ électrique (si les charges étaient en mouvement il faudrait 
également prendre en compte l'influence du champ magnétique, ce que nous ferons dans le chapitre de 
Magnétostatique). 


Pour cela, la méthode consiste à découper la ligne en de petits éléments de ligne di, chacun de ces 
éléments portant une charge dq. Le champ créé par la charge en P au point M situé à distance x et de 
projection orthogonale H sur la ligne est: 


1 ydi_ 


Me Lo ET 7 x 


(35.34) 


L'astuce consiste maintenant à prendre le symétrique P" de P par rapport à H (la projection orthogonale 
de M sur le fil): 


Figure: 35.3 - Configuration de l'analyse du fil rectiligne infini 
Oo V O 


pour lequel nous avons identiquement: 


Le champ total est donc: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


1 ydi_ 1 ydl'_ 


dÉ(M) = dé, (M)+4dË, dt DR Pete at——7ûün (5.36) 
AE x AÂJE x' 

Or, nous avons: 

x=xa= di, = EM ÿ 2 PM 537 

PM ' 
Donc: 
dË(M) = _- Le EM ,PM - 12 pp) - 2 M7 (35.38) 
PM P'M| 4#Æ x AXE x 


Comme nous pouvons nous en douter, cette dernière relation montre bien que le champ est orthogonal 
à la ligne (au fil...). 


La norme de 4Ë(M) est: 


péoo|--Étpr-EE 


Cette relation comporte 3 variables dépendantes r,dl,x. La norme du champ total en un point est donc 
la somme des normes sur l'ensemble de la longueur du fil puisque tous les vecteurs 4Ë (M) ont même 


direction. 


Pour effectuer ce calcul, nous allons effectuer un changement de variable, et mettre r,dl,x en fonction 
de l'angle æ entre la ligne et le vecteur 537. Dans le triangle rectangle HMP: 


Æ Fr Æ, CS 
An&=——=— tang=—=— (3541) 
2 x P  z 
et: 
1+ sin? & 
1+tan? æ 2 sin? &+cos? æ Fr 
à = à = ; À ja = 7 00 & É ja=- ET A?cos 0) ; À ja = da 
tan sin sin sin © 
cos? æ 
(35.42) 
d'où: 
-…# 
Fr sin 
dE = Ga re nada (6549 
2RE sin & r 27Er 
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L'intégration est facile, mais il faut faire attention aux bornes. Nous devons intégrer sur une moitié de 
ligne, donc entre 0 et x/2: 


Ÿ 
E = > 7 ose (35.44) 
JEr 
et alors: 
E=- ÿ (3545) 
2REr 


Le potentiel se déduit aisément en prenant la primitive de E puisque: 


Et 
I 
| 


à 
ax 
à 
—|L'U (35.46) 

dy 

à 

dz 

Nous avons alors: 
- + M jo 17 
U=——Inf)+te" (35.47) 
RE 


La constante est indéterminée puisque lorsque r tend vers l'infini, U tendant vers zéro conduit à une 
constante infinie. Cette indétermination est due essentiellement à l'approximation de la ligne infinie. 


2.3. DIPÔLE ÉLECTRIQUE RIGIDE 


Une disposition des charges très intéressante est celle constituant un "dipôle" électrique appelé 
rigoureusement "dipôle électrique rigide" ou "dipôle électrostatique". Elle consiste en deux charges 
égales et opposées +q,-q séparées par une très petite distance. Nous allons chercher à déterminer le 
potentiel et le champ électrique en un point M de l'environnement du dipôle. 


Pour déterminer cela, considérons une charge 4, quelconque en un point 4 et un point M très éloigné 
de 4. Prenons un repère quelconque centré en O: 
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x 


Figure: 35.4 - Champ électrique en un point M très éloigné du dipôle 


Le potentiel créé au point M par la charge g, s'écrit: 


Dans le triangle O4, la distance 4 peut être écrite selon le théorème du cosinus: 


AM = JE +ri-2nrcos@ (35.49) 


Le potentiel devient: 


1 4; 

À = —EE—— (25.50) 

| AE fr +7? Dnrcos& 

ou encore: 
= 

AE LL _2ncos8 (35.51) 

Fr Fe — 

r r 


À très grande distance, r devient très supérieur à ;, la quantité: 


2 
9e 
r? r 


2r, cos & 


u = (35.52) 


tend alors vers zéro. Nous pouvons donc effectuer un développement de Maclaurin (cf. chapitre sur les 
Suites Et Séries) de (1+% 3 au voisinage de x = 0 . Pour ne pas alourdir le calcul, nous nous 
limiterons à l'ordre deux en r: 


(1+u) 7° nn Er LR Er, (35.53) 
2 2 2 8 


donc: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


2 
r La 


-1/2 2 
pa frefe-2 28) en (é Me). dé 2 65.54) 


En ne gardant que les termes du second ordre en r: 


1 SR RL cos8 ,35 sa (35.55) 
PE F à + 
Le potentiel devient: 
(M) = 1 g; 1 ,n cosg 35 cos & 
‘ AE r 2 r° Fr 2 Fr 


; (35.56) 
l ds 1 LE Re M 1 . Er = U} +U} + U? 
ARE r AE pr ARE r 2. à 
Nous avons gardé dans l'expression du potentiel trois termes. Le terme U? est le potentiel créé par une 


charge qui se trouverait en ©. Autrement dit, à l'ordre zéro, le potentiel créé par une charge située en un 
point proche de O est identique au potentiel créé par une charge qui se trouverait en ©. Les termes 
U?,U? sont des termes correctifs, à l'ordre un et à l'ordre deux respectivement. Nous remarquons que 


ces deux termes varient en 1/r°,1/r°, donc décroissants plus vite que le premier. Ces deux termes sont 
donc plus efficaces à plus petite distance. 


Nous voyons que les termes U},U? font intervenir la quantité g;,r,. Cette quantité est ce que nous 
définissons comme étant le "moment dipolaire" du dipôle électrostatique: 


Remarque: Le moment dipolaire est exprimé en Coulomb par mètre, mais par mesure de commodité 
(...) il est exprimé en Debye [D] par certains ingénieurs. 


Le potentiel créé à grande distance par une distribution discrète de charges s'obtient en sommant toutes 
les contributions individuelles: 


(M) = SU) =] US SE 3024) cs50 
_.. ner tt An nt Ÿ 4x r | 2 2 | 


Ce qui peut aussi s'écrire: 
UM) = OU, (M) + D CM) + D, (M) (35.59) 


Par définition, £, (A#) est le terme unipolaire ou monopolaire, (4) le terme dipolaire, &, (4#) 


quadripolaire. Si la distribution de charge est au total nulle, comme c'est le cas d'un atome ou d'une 
molécule non ionisée, seuls subsistent les contributions multipolaires. 


Revenons au cas particulier du dipôle: 
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Le terme monopolaire y est nul, puisque la somme des charges est nulle. Si nous négligeons les termes 
d'ordre supérieur au premier, il reste la contribution dipolaire. 


Les angles & et & du dipôle sont complémentaires, donc cos & = -cos 8, . Mais, comme 4, = -4, = q 
, le produit g; cos & est constant. 


Les deux charges du dipôle sont à une distance constante l'une de l'autre et à équidistance de l'origine 
O. Nous poserons que 7 = =. 


Le potentiel se réduit alors à: 


2gd cos 8 _l ga cos 8 


r? AZ r° 


(35.60) 


sn 
ÉRTT— 


où a est simplement la distance constante entre les deux charges. 


Il est d'usage dans le cas de l'étude du dipôle électrique d'écrire la relation précédente sous la forme: 


Rappelons maintenant que nous avons démontré au début de ce chapitre que: 


es 


Ê=-V:1J (35.63) 


et comme nous l'avons vu dans le chapitre de Calcul Vectoriel, le gradient en coordonnées sphériques 
nous amène à écrire: 


d'où: 


g in 
E, sh, = PT £, = 0] (35.65) 
27TEr FEr 


Pour déterminer l'équation des équipotentielles, rappelons que ces lignes (ou "surfaces" dans l'espace) 
s'obtiennent par la contrainte: 
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d'où: 


pcos8 pcos£ 
U=ÙU & =ÙU &r= = r cos 8 (35.67) 
° 47Er" ° AU, | 


avec: 


P = Jp l4reu, (35.68) 


Le champ électrique doit être par définition tangent aux lignes de champ, donc parallèle au 
déplacement élémentaire. 


EE (à E,rsin8df-Erd@ 
Exdr-0e1|E,|x|r48 =|£dr-Ersind# |=0 (25.69) 
E,] (rsan&df] |Erd8-EÆE,ar 


Puisque Æ, = 0, nous avons: 


E, dr E,r sin 84 
Exdr=0&]|E,|x|r48 =|-EÆrsin ag |=0 (35.70) 
E, r sin 84 $ E,rd8 -E, dr 


Donc finalement il ne reste plus que: 
E,rdO-E,dr=0< Erd89=E,dr (35.71) 
Qui est donc une équation différentielle qui s'intègre facilement: 


dr _E, ;,4- 105048 _,dsng 


&S Intr)=in(sin 8)+e* (2572 
r E, sin 9 sin 9 o c | | 


Ce qui équivaut à écrire: 


Le tracé des lignes de champ et des équipotentielles donne alors en coordonnées sphériques (ne pas 
oublier que la composante verticale est nulle par symétrie): 
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270 


Figure: 35.5 - Tracé des lignes de champ d'un dipôle électrique 


Bien que dans un dipôle électrique les deux charges soient égales et opposées, donnant une charge 
résultante nulle, le fait qu'elles soient légèrement déplacées est suffisant pour produire un champ 
électrique non identiquement nul. Dans les atomes, le centre de masse des électrons coïncide avec le 
noyau, et par conséquent le moment électrique dipolaire moyen de l'atome est nul. Mais si un champ 
extérieur est appliqué, le mouvement des électrons est distordu et le centre de masse des électrons est 
déplacé d'une distance x par rapport au noyau. L'atome est alors polarisé et devient un dipôle électrique 
de moment p. Ce moment étant proportionnel au champ extérieur £. 


Remarque: Les molécules par ailleurs peuvent avoir un moment électrique permanent. De telles 
molécules sont dites "molécules polaires". Par exemple, dans la molécule HCI l'électron de l'atome 
d'hydrogène passe plus de temps à se déplacer autour de l'atome de chlore qu'autour de l'atome 
d'hydrogène. Aussi, le centre des charges négatives ne coïncide-t-il pas avec le centre des charges 
positives et la molécule possède un moment dipolaire. Par contre, dans la molécule C©,, tous les 


atomes sont alignés, et le moment électrique dipolaire résultant est nul par raison de symétrie. 


Quand un dipôle électrique est placé dans un champ électrique, une force s'exerce sur chacune des 
charges du dipôle. La force résultante est: 


rs 


F=gË -gË =q\Ë8 -ÆË | (3574 


+ 


Considérons le cas particulier où le champ électrique est dirigé le long de l'axe des X et où le dipôle est 
orienté parallèlement à ce champ. Si nous considérons seulement les grandeurs: 


avec a étant la distance entre les deux charges, et par conséquent: 


re (35.76) 
dx dm 
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Ce résultat montre qu'un dipôle électrique orienté parallèlement au champ tend à se déplacer dans la 
direction dans laquelle le champ s'accroît (selon le gradient de celui-ci). Nous remarquons que si le 
champ électrique est uniforme, la force résultante sur le dipôle est nulle. 


L'énergie potentielle du dipôle est: 


ÊE. = C0 
E,=qU,-qU_=q{U0, 0 _)= [AT (35.77) 
a 


Si nous utilisons la relation: 


pour décrire le champ électrique uniforme et si & est l'angle entre le dipôle et le champ électrique, le 
dernier facteur -({/, -U j{a est juste la composante Æ, = Æcos8 du champ £ parallèle à &. Donc: 


E,=-qaE, (35.79) 
ou 


L'énergie potentielle est minimale pour 8= 0, ce qui montre que le dipôle est en équilibre quand il est 
orienté parallèlement au champ. 


Ces configurations d'un dipôle placé dans un champ électrique ont des applications très importantes. 
Par exemple, le champ électrique d'un ion en solution polarise les molécules du solvant qui entoure les 
ions et elles s'orientent comme sur la figure ci-dessous: 


LA PE 
DE DS 


Figure: - Exemple de ce qui se passe dans une solution avec un ion 


Dans un solvant à molécules polaires tel que l'eau, les ions d'un électrolyte en solution s'entourent d'un 
certain nombre de ces molécules en raison de l'interaction charge-dipôle. Ce phénomène est appelé la 
"solvation" de l'ion, précisément "hydratation" si le solvant est de l'eau. 


Ces molécules orientées deviennent plus ou moins solidaires de l'ion, augmentant sa masse effective et 
diminuant sa charge effective, qui est partiellement masquée par les molécules. L'effet net est que la 
mobilité de l'ion dans un champ extérieur est réduite. De même, lorsqu'un gaz ou un liquide, dont les 
molécules sont des dipôles permanents est placé dans un champ électrique, les molécules à la suite des 
couples dus au champ électrique, tendent à s'aligner avec leurs dipôles parallèles. Nous disons alors que 
la substance a été "polarisée". 
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Il peut donc être intéressant de déterminer le champ électrique vectoriel produit par un dipôle plutôt 
que le potentiel. Le champ électrostatique créé en un point M par le doublet s'obtient en effectuant la 
somme vectorielle des champs créés en ce point par des charges positive P et négative N, d'où: 


… es 


E=Æ%,+E£E __4 | PM _ NM |_ 4 r-ae,/2  r+aë,f2 
2 aelf [ef] Far Fe nf 


- ((r-S)r-eer - (+ 3 L + aë, ra] 


La distribution des charges étant invariante par rotation autour de l'axe Oz du doublet, la topographie 
est indépendante de l'angle azimutal # des coordonnées sphériques. Nous pouvons la représenter dans 


un plan méridien quelconque passant par l'axe NP. Le champ £ est donc donné par: 


BL ffr-Se rar fr sé ]F +2 | (35.82) 


Ayant: 
3 3/2 
… du Le 
F+—e, = Frs (35.83) 
2 2 
vectoriellement, nous avons: 
2 2 
D. F pee 2 2 & 3% 2 & : 
r+—e, — nr +rÀ +2 —=t+—=r +arn +— (35.84) 
. 2% SR” er 4 
FE 4 
E 


Le produit scalaire étant la multiplication des composantes une à une, nous avons: 
roëg, =", (35.85) 
d'où: 


2 æ 
=p+gfos + (35.86) 
oo 


Finalement: 


es 


+ 


Fr 4r? 


2 13/2 2 372 _ 3 322 
h d Frog d : - 
= rè +aroe. + — = ri 1+a— + + — (35.87) 
27 


Donc par un développement limité en série de Maclaurin comme nous l'avons fait au début: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


a roe æ Le 
= S& dame) 2 les) 
qu. r? 4r? 2 r 4r 


un F-Lé en. _ F+L ja (35.88) 
Aer 2 2 + 2 2 F 


FFoû,) 4, -p| 


(35.89) 


Il peut être pertinent aussi de calculer l'énergie d'interaction entre deux dipôles électriques. Si nous 
appelons 3, le moment dipolaire, nous pouvons écrire: 


. LG où,)'&, - À] 
4er” 


(35.90) 


Si nous désignons par ?, le moment du second dipôle et si nous utilisons la relation: 


… 


E,=-poË (35.91) 


nous trouvons que l'énergie d'interaction entre les deux dipôles est: 


._ [Got -5er] 
-ÿ,oË =- (EE PB Pa] (3507 


E12 = 1 Axer 


Nous pouvons tirer plusieurs conclusions importantes de ce résultat. L'énergie d'interaction £,,, est 
symétrique par rapport aux deux dipôles, car la permutation de ÿ, et ÿ, la laisse inchangée. C'est un 


résultat prévu. L'interaction entre deux dipôles n'est pas centrale car elle dépend des angles que le 
vecteur de position ou le vecteur unitaire #, fait avec ÿ, et p,. 


Un atome, une molécule ou un ion, dont le moment dipolaire est nul à l'état fondamental, acquièrent un 
moment dipolaire sous l'action du champ électrique appliqué comme nous l'avons vu puisque les 
charges de signes opposées sont sollicitées dans des sens opposés. Les barycentres des charges positives 
et négatives ne coïncidant plus, il apparaît un "moment dipolaire induit". Dans une approximation 
expérimentale linéaire valable pour des champs excitateurs faibles, ce moment dipolaire induit est 
proportionnel au champ appliqué £, ce que nous traduisons par (il s'agit au fait d'une approximation de 
la relation de Langevin-Debye que nous démontrerons plus tard): 


B=aË (35.9) 
La quantité & , dont la dimension physique est celle d'un volume, est la "polarisabilité" de l'édifice. 


L'interaction électrostatique dipôle-dipôle a été introduite par J.D. Van der Waals en 1873, dans le cas 
des molécules, afin d'interpréter les écarts réels par rapport aux gaz parfaits. 
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Les forces de Van der Waals sont répulsives lorsque la distance entre les molécules est très faible car 
elles s'opposent à l'interpénétration des nuages électroniques, ce que nous exprimons en introduisant 


leur volume (covolume). 


En revanche, elles sont attractives lorsque cette distance est suffisante. Nous attribuons cette attraction 
à trois types d'interaction mettant en cause des dipôles rigides ou induits: 


1. Les forces entre molécules polaires (dipôles rigides), dites de W. Keesom. 


2. Les forces entre une molécule polaire (dipôle rigide), et une molécule polarisable (dipôle induit) dites 


de Debye. 


3. Les forces moyennes entre les dipôles induits instantanés qui apparaissent même lorsque les 
molécules ne sont pas polaires, dites de F. London. 


Dans ces trois cas, l'énergie électrostatique est négative (attraction) et varie comme ;#. Pour le 
montrer, calculons l'énergie d'interaction entre deux dipôles rigides, de moments dipolaires 3, et p,: 


avec: 


et: 


Par conséquent: 


ES 


Ep31 = —-P19Æ2 (35.94) 


A = &@EË, (35.96) 


2 
sh _ 2 c® . 
Epa = GŒEË,0E, = -QEË; & e[ = (35.97) 


d'où: 


AxEr* 


c® 
r? 


(35.98) 


F=-V'E, = 


Ainsi, la dépendance radiale de la force est en ;-7. Cette décroissance très rapide de la force de Van 
der Waals avec la distance permet d'expliquer sa très courte portée et par conséquent son influence 
lorsque le milieu est suffisamment dense. 


Remarque: L'interaction entre molécules polaires, de type Keesom, est rendue très importante par 
la présence de l'atome d'hydrogène, car ce dernier, en raison de sa petite taille, interagit aussi avec 
les atomes des autres molécules. C'est elle qui est à l'origine de la "liaison hydrogène". 
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3. FLUX DU CHAMP ÉLECTRIQUE 


Soit j7 un champ vectoriel et S une surface appelée "surface de Gauss" dans l'espace. Si nous divisons 
cette surface en un nombre N de petites surfaces dS chacune traversée par un champ F et ayant un 
vecteur unitaire #, perpendiculaire (cas particulier) à leur surface, nous pouvons alors former la 
somme: 


Lorsque N tend vers l'infini et tous les dS vers zéro, nous obtenons pour cette somme: 


dy ee (35.100) 


La valeur de cette intégrale donne donc le flux ®, du champ 7 à travers la surface S délimitée par un 
domaine F et où: 


dS=# dS (35.101) 


Dans le cas du champ électrostatique, nous écrivons: 


Pr = F °dS (35.102) 


Cette expression définit le "flux électrique”. 


La question inévitable qui se pose alors est: quelle est sa signification physique ? Le flux d'un fluide est 
la quantité de fluide (notamment le volume) qui traverse une surface par seconde; il y alors écoulement 
de quelque chose. Quant au flux électrique, du point de vue classique, rien ne s'écoule, le champ 
électrique est déjà établi et il est statique, mais il traverse la surface. La valeur du champ électrique en 
tout point de l'espace est l'intensité du champ en ce point, tandis que le flux peut être considéré comme 
la quantité de champ qui traverse la surface S. Il y a une centaine d'années, les physiciens identifiaient 
le flux avec le nombre des lignes de champ traversant la surface. Mais le moins que nous puissions dire 
est que la vision simpliste que les lignes de champ ont une réalité distincte et que nous pouvons les 
compter est trompeuse. Nous verrons en mécanique quantique des champs que celle-ci soutient qu'un 
courant de photons virtuels est la nature même des interactions électromagnétiques. Malgré cela, les 
physiciens ne se sont pas pressés d'associer le flux des photons virtuels du 20ème siècle à l'image des 
lignes de champ continues du 19ème siècle. Quelle que soit sa nature, la notion de flux est puissante et 
de grande utilité pratique, aussi bien en électricité qu'en magnétisme. 


Comme nous le démontrerons dans le cadre des équations de Maxwell (cf. chapitre 
d'Electrodynamique), la résolution de cette intégrale est (c'est la "loi de Gauss" ou également dit 
"théorème de Gauss"): 
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3.1. CAPACITÉS 


Comme application directe du théorème de Gauss, très utile en électronique et pour les ingénieurs, 
considérons une grande feuille mince et plane, portant une charge surfacique homogène & et baignant 
dans un milieu de permittivité #. Dans la région proche de son centre, le champ résultant de tous les 
champs des charges est normal, uniforme, constant et s'éloigne de la feuille. Considérons une surface de 
Gauss en forme d'un cylindre limité par les bases $ = $', = S' et sa surface tubulaire $; et symétrique 


par rapport à la feuille. Elle enferme donc une charge #£. Il en résulte que: 


L | ARE 
PéodS =: S+E S+E S, = (35.104) 
E 


et comme E=Æ£ =Æ,et Æ, = 0, nous trouvons: 


ES+r shop sep RS QE LC 105 


€ 2E 2E 2E 


Finalement, le champ électrique d'une grande feuille chargée plane et mince est: 


Si nous mettons face à face deux plaques identiques mais avec des charges opposées, la somme 
algébrique donnera bien évidemment: 


T 
Æ=— (35.107) 


À l'exception des extrémités, où l'effet de bord est important, le champ global est partout la somme 
vectorielle des champs uniformes produits par les deux couches minces opposées. Nous appelons un tel 
système un "condensateur plan et parallèle". 


Figure: 35.7 - Exemple de condensateur plan et parallèle 


Le résultat est aussi remarquable, car il est indépendant de la distance d entre les plans. Le calcul du 
potentiel électrique y est donc simplifié. Soit: 


à ‘ ' 
AU--fRr- du =jAT|= 74 "2 (35.108) 
€ € E'S 


Ainsi, la capacité du condensateur plan et parallèle vaut donc: 


C'= (35.109) 


ee Le 


Œ 
d 
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Voyons un deuxième exemple scolaire qu'est le "condensateur cylindrique": 


Les armatures d'un condensateur cylindrique sont deux cylindres infinis (ou très grands relativement à 
leur diamètre) coaxiaux de rayon À, et R&,. Il s'agit donc du cas très important du câble coaxial (dont le 


diélectrique est souvent du polyéthylène) que l'on retrouve dans de nombreux laboratoires: 


Figure: 35.8 - Exemple de condensateur cylindrique 


Par le théorème de Gauss, nous savons que: 


ÊcS= 2 (35.110) 
E 


Et puisque le champ est colinéaire en tout point à la surface, il vient immédiatement en connaissant 
l'expression de la surface du cylindre (cf. chapitre Formes Géométriques): 


Or: 


Et donc, 


au=-[ 2 __f_ 2 De _— FO 
À 


8 [in(R,) En In(R;)] 00 = . æ 


Q 


= —*  _ (35111) 
2x -r dE 


Arier 2e 
l 


(35.112) 


Dre R 


2 © or ei : 
U AU Le (35.113) 
k 


Calculons aussi la capacité d'un condensateur sphérique qui correspond en première approximation à 
certains générateurs de Van Der Graaf que nous avons dans les labos de quelques écoles, de musées ou 
même de centres de recherche: 


Un "condensateur sphérique" est constitué de deux sphères concentriques de rayon À, et À; avec 


À <k. 
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Figure: 35.9 - Exemple de condensateur sphérique 


Nous avons maintenant immédiatement: 
ÉE-e (35.114) 
€ 


Et donc puisque le champ est colinéaire en tout point à la surface il vient immédiatement en 
connaissant l'expression de la surface d'une sphère: 


E- _ _. (35.115) 
AT-r.E 


Or: 


BE R R 
Das Cd 2 ue e Ë = + (2 (35.116) 
1 | Mn À 


1 


Nous avons alors: 


=! 
R À 


Donc, nous avons alors: 


M: 
C=4r. 8. 172 (35.118) 


Voilà pour les exemples classiques... 

Nous venons donc de voir que la capacité était définie par: 
O=C-U (35.119) 

soit en régime non continu (cf. chapitre d'Électrocinétique): 


g=C.u = 4 _;_ ou (35.120) 
dt dt 


Nous avons alors pour la puissance instantanée (cf. chapitre d'Électrocinétique): 


p=Âu.i=u.i ={ri-e)izr ei (35.121) 
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En supposant un condensateur idéal (qui ne dissipe pas d'énergie par effet Joule) il vient: 


: : 1 
Di UC ue NE 
dt dt dt 


Donc par intégration dans un intervalle de temps donné de 0 à t nous avons: 


1 
Ep — Su 


Cette énergie est donc toujours positive et est stockée sous forme électrostatique dans le condensateur. 


Remarque: Des expériences scientifiques nécessitant d'énormes énergies utilisent des milliers de 
condensateurs géants chargés sur le long terme pour accélérer des particules ou faire fonctionner 
des LASER mégajoules. Cependant on ne peut pas stocker le surplus d'énergie électrique des 
certaines centrales électriques, raison pour laquelle on utilise ce surplus pour remonter l'eau dans les 
barrages hydrauliques qui peuvent utiliser leur bassin comme réserve d'énergie potentielle pour 
produire un complément d'électricité au moment d'une pointe de consommation (transformation 
inverses). 


Dans le cadre d'un régime sinusoïdal, la puissance moyenne sera nulle. Nous pouvons généraliser ceci 
en admettant qu'un condensateur parfait ne dissipe aucune puissance par effet Joule. 


3.1.1. RIGIDITÉ DIÉLECTRIQUE 


La "rigidité diélectrique" d'un milieu isolant représente la valeur maximum du champ en [pm] 


que le milieu peut supporter avant le déclenchement d'un arc électrique (donc d'un court-circuit). Pour 
un condensateur utilisé en électronique, si nous dépassons cette valeur, nous observons la destruction 
de l'élément. Cette valeur maximale de la tension appliquée aux bornes, est appelée "tension de 
claquage" T7, du condensateur. Nous pouvons définir la rigidité du milieu comme étant: 


Ü 
h = —< 
d 


Exemple: 
Pour l'air, on trouve dans les tables la valeur: 
Hg — 30 [7 em” ] 


Lorsque nous parlons de rigidité diélectrique, nous parlons aussi du diélectrique qui est un isolant ou 
une substance qui ne conduit pas l'électricité et qui est polarisable par un champ électrique. Dans la 
plupart des cas, les propriétés du diélectrique sont dues à la polarisation de la substance. Lorsque le 
diélectrique (dans notre cas, l'air est le diélectrique) est placé dans un champ électrique, les électrons et 
les protons de ses atomes se réorientent et, dans certains cas, à l'échelle moléculaire, une polarisation 
est induite (comme nous l'avons vu lors de notre étude des dipôles). Cette polarisation engendre une 
différence de potentiel, ou tension, entre les deux bornes du diélectrique; celui-ci emmagasine alors de 
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l'énergie qui devient disponible lorsque le champ électrique est supprimé. L'efficacité d'un diélectrique 
est sa capacité relative à emmagasiner de l'énergie comparée à celle du vide. Elle s'exprime par la 
permittivité relative, déterminée par rapport à celle du vide. La force diélectrique est la capacité d'un 
diélectrique à résister aux champs électriques sans perdre ses propriétés isolantes. Un diélectrique 
efficace libère une grande partie de l'énergie qu'il a emmagasinée lorsque le champ électrique est 
inversé. 


4. ÉNERGIE POTENTIELLE ÉLECTROSTATIQUE 


Considérons deux charges 4,,g,. La première est supposée au repos et fixe; la deuxième est amenée de 
l'infini à une distance a de g, (le même raisonnement a été appliqué pour le champ gravitationnel dans 


le chapitre de Mécanique Classique). Supposons que les deux charges soient de même signe. Comme 
43 Ont tendance à se repousser mutuellement, il faut fournir une énergie potentielle Æ, pour 


approcher 4, (infiniment lentement) de 4,. Le travail dW fourni par la force électrostatique en un point 
quelconque est par définition: 


dW = Fdx (35.126) 


L'énergie potentielle du système est: 


car Fest résistant (d'où l'origine du signe "-"). 


Donc: 


dE, =-dW = -Fax = aa l'y (35.128) 
AXE x 


Nous obtenons alors simplement l'énergie potentielle en un point (donc le x au numérateur se simplifie 
avec un des x au dénominateur) au signe près: 


l 
E, = 4 | (35.129) 
AXE x 


Cette énergie potentielle peut donc être négative ou positive. 


Cela n'empêche pas que pour avoir la variation d'énergie potentielle, il faut intégrer la relation 
antéprécédente. 


Ainsi que la relation: 


F=-V"E, (35.130) 


Remarquons que l'avant-dernière relation peut aussi se mettre sous la forme: 


1 nr N) 4 
Ep = Ql = qi = Sa +gaU,) (35.131) 
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Remarque: Attention! Quand on fait de la physique, il faut voir de quelle énergie potentielle on 
parle. Là est tout le problème! Si vous prenez par exemple l'énergie potentielle due à la force de 
gravitation, elle peut prendre n'importe quelle valeur en fonction du point de référence. Si la 
référence est le niveau de la mer, un point situé sous le niveau de la mer aura une énergie 
potentielle négative, par contre si la référence est le centre de la Terre, il n'y aura que des énergies 
potentielles positives. C'est pour cela que nous écrivons plutôt l'énergie potentielle sous forme de 
différence de hauteur par rapport à une référence en mécanique. Pour l'énergie potentielle de 
l'électron, il faut savoir avec quoi il interagit. Si c'est avec une charge négative, le produit des 
charges est positif et donc l'énergie potentielle d'interaction sera positive, s'il interagit avec une 
charge positive, le produit des charges est négatif et l'énergie potentielle d'interaction électrostatique 
est négative. Bref, il faut bien savoir de quoi on parle. Les mots ont leur importance en physique 
aussi. 


En général, si l'énergie potentielle diminue avec la distance, la force est répulsive, si elle augmente 
avec la distance, la force est attractive. 
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Notes personnelles: 
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36. MAGNÉTOSTATIQUE 


L.. aimants sont connus depuis l'Antiquité (sans pour autant que l'on sache à l'époque qu'elle était 


l'origine de leurs propriétés) sous le nom de "magnétites", pierres noires trouvées à proximité de la ville de 
Magnesia (Turquie). C'est de cette pierre par ailleurs que provient le nom actuel de champ magnétique. 
Les Chinois furent les premiers à utiliser les propriétés des aimants différentes de celles des particules 
chargées, il y a plus de 1'000 ans, pour faire des boussoles. Elles étaient constituées d'une aiguille de 
magnétite posée sur de la paille flottant sur de l'eau contenue dans un récipient gradué. 


Au même titre que le champ électrique, une bonne/meilleure compréhension de l'origine de ce champ ne 
peut se faire que par l'intermédiaire de théories modernes comme la physique quantique ondulatoire ou la 
physique quantique des champs. Le lecteur débutant devra donc prendre son mal en patience avant d'avoir 
les connaissances nécessaires pour étudier ces théories. 


L'étude quantitative des interactions entre aimants et courants fut faite par les physiciens Biot et Savart à 
partir de 1820 seulement. Ils mesurèrent l'amplitude des oscillations d'une aiguille aimantée en fonction de 
sa distance à un courant rectiligne. Ils trouvèrent que la force agissant sur un pôle est dirigée 
perpendiculairement à la direction reliant ce pôle au conducteur et qu'elle varie en raison inverse de la 
distance. C'est le premier cas que nous allons étudier: 


Soit un déplacement de charges électriques produisant dans l'espace un champ vectoriel dont les effets 
sont mesurables et dont les propriétés diffèrent de celles du champ électrostatique. Nous en déduisons 
l'existence d'un nouveau champ vectoriel que nous appelons (temporairement) "champ magnétique" et que 
nous noterons À. 


Les unités physiques du champ magnétique découleront naturellement du moment où nous arrivons à 
relier ce champ magnétique à quelque chose de connu comme une Force (ce que nous verrons plus loin). 
C'est ce que nous verrons lors de notre étude la "Force de Laplace". 


Le cas d'étude le plus simple consistant en un fil rectiligne indéfini (exemple que nous pouvons aussi 
assimiler à un simple déplacement de charges sans nécessairement avoir un fil comme support) parcouru 
par un courant 1 (cf. chapitre d'Électrocinétique) montre que les lignes de champ magnétique sont des 
cercles ayant le fil pour axe. 
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Co 


Figure: 36.1 - Champ magnétique autour d'un fil rectiligne infini 


Remarque: Le sens de Ë se définit habituellement par l'intermédiaire de "l'observateur d'Ampère", 
c'est-à-dire un observateur qui serait placé le long du fil, de façon que le courant aille de ses pieds vers 
sa tête et qui regarderait le point M où nous évaluons le champ magnétique. £ est dirigé de la droite 
vers la gauche de cet observateur. 


Il aurait été expérimentalement établi par Biot et Savart en 1820 que la norme du champ magnétique £ à 

la distance r du fil est proportionnelle au courant I qui le parcourt et inversement proportionnel à r: 
B=k'ir" (26.1) 

Cette relation constitue traditionnellement la base de l'étude théorique du champ magnétique. 


Le coefficient de proportionnalité k dépend comme toujours des unités choisies. Pour l'ensemble de ces 
conséquences, il est avantageux d'écrire l'expression précédente sous une forme qui fasse apparaître la 
longueur du cercle de rayon r. Nous posons donc: 


k- 


(36.2) 
2 


et obtenons ainsi la valeur du champ magnétique à une distance r d'un fil conducteur parcouru par un 
courant constant: 


où { est une nouvelle constante que nous appelons "perméabilité magnétique du vide" (à nouveau au 
même titre que pour la permittivité électrique, il existe une "perméabilité magnétique relative") et dont la 
valeur sont données comme à l'habitude sur ce site avec les autes constantes dans le chapitre Principes de 
la section Mécanique. 
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Les unités de cette constante, bien que données dans le chapitre Principes de la section Mécanique, se 
déduiront aussi automatiquement dès le moment où nous aurons réussi à relier le champ magnétique avec 
un concept connu comme la Force (voir plus loin). C'est ce que nous verrons aussi lors de notre étude la 
"Force de Laplace". 


1. THÉORÈME D'AMPÈRE 


Il est intéressant de calculer la "circulation du champ magnétique" Æ dans le vide le long d'un contour F 
qui tourne une fois dans le sens positif autour du fil orienté dans le sens du courant (observateur 
d'Ampère): 


… = ‘“] = 
de [Br d8= À f'a8 = 41 
( 2:37 JO 


2? 

Il 
Clara 
Cut 

[a] 

2. 

Il 
Snna 
Co 

& 

Il 


Remarque: Le champ est colinéaire le long du contour comme nous l'avons vu précédemment d'où le 
fait que le produit scalaire puisse s'écrire comme simple produit de normes. 


Nous obtenons ainsi par définition la "loi d'Ampère" (ou appelée à tort "théorème d'Ampère" car ce 
résultat n'est pas démontrable... du moins à ma connaissance): 


où le courant 1 dans un système à forte symétrie peut être assimilé à une simple somme algébrique des 
courants enlacés par le chemin tel que: 


Attention!!! Ce n'est pas parce que la circulation du champ magnétique est nulle dans une région de 
l'espace que le champ magnétique y est nul en tout point! 


Remarques: 


R1. La loi d'Ampère permet de déterminer la quatrième équation de Maxwell que nous démontrerons 
dans le chapitre d'Électrodynamique. 


R2. La relation antéprécédente est parfois appelée à tort "théorème d'Ampère" alors qu'en réalité ce 
résultat n'est pas démontrable. Certains physiciens utilisent cependant la quatrième équation de 
Maxwell pour démontrer la relation antéprécédente mais alors c'est le serpent qui se mord la queue... 


L'expression que nous avons obtenue peut encore être simplifiée si nous introduisons un nouvel être 
physique appelé "intensité du champ magnétique" ou encore plus couramment "excitation magnétique" 
et qui est notée par la lettre Æ (qui est intrinséquement indépendant du milieu de propagation). 


Si nous considérons que nous sommes toujours dans le vide où il n'y a aucun dipôle magnétique alors 
nous le définissons dans le vide par: 
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B=6" À (367 


Dès lors, nous sommes souvent amenés à parler de "induction magnétique" pour & et de "champ 
magnétique" pour Æ# . Mais les deux sont allègrement confondus suivant les auteurs et surtout les 
contextes (de même que ce sera le cas dans ce site Internet). Lorsque nous avons affaire à des aimants qui 
ont une magnétisation intrinsèque de par les propriétés du matériau qui les compose, nous notons de 
manière distincte le champ magnétique extérieur par: 


qui est donc une forme plus générale de la relation précédente. Il est alors d'usage de définir la 
"susceptibilité magnétique" comme étant le rapport sans dimensions: 


Ainsi, la susceptibilité magnétique indique l'amplitude avec laquelle un matériau répond magnétiquement 
à la présence d'une excitation magnétique. Nous avons alors de par cette définition la relation entre 
perméabilité magnétique relative et susceptibilité magnétique: 


B-pi+M)-= 8 +24 )= 40014 LA = HA = HA (G610 


Soit: 


= —=l+4m 
4 


(36.11) 


| 4 


où {4 est appelé la "perméabilité magnétique absolue". 


Il est d'usage d'appeler les matériaux qui ont une susceptibilité magnétique positive de "matériaux 
paramagnétiques" (contribuant au augmente le champ magnétique) et ceux qui ont une susceptibilité 
magnétique négative de "matériaux diamagnétiques" (de s'opposer au champ magnétique). Nous verrons 
plus loin les modèles théorique de Langevin permettant d'expliquer quantitativement avec une 
relativement bonne approximation des deux phénomènes (dans les deux cas la susceptibilité magnétique a 
une valeur qui est très faible). 


Alors, finalement nous pouvons écrire la loi d'Ampère sous la forme: 


Ë odi =1 
ga 


(36.12) 


L'intérêt de la loi d'Ampère ainsi que du concept de circulation du champ magnétique paraît (peut 
paraître) ainsi plus évident. 
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Cette dernière relation à bien évidemment une grande utilité en physique théorique car elle nous permettra 
de déterminer d'autres résultats forts importants. Sinon, au niveau de la pratique, le physicien de 
laboratoire ou l'électricien/électrotechnicien sera souvent confronté à devoir utiliser pour de petites et 
moyennes expériences des électro-aimants, dont il pourrait souhaiter recalibrer les valeurs nominales, ou 
encore des solénoïdes. 


1.1. BOBINE SOLÉNOÏDALE INFINIE 


Une application aussi particulièrement importante en électronique et électrotechnique est celle du calcul 
du champ d'induction dans une bobine de fil parcourue par un courant que nous considérerons comme 
constant dans un premier temps. Il s'agit ni plus ni moins d'une bobine d'induction plus techniquement 
appelée une "inductance". Voyons de quoi il s'agit: 


Un solénoïde est une bobine formée par un fil conducteur enroulé en hélice et parcouru par un courant 
d'intensité I. Dans ce qui suit, nous supposons que le champ d'induction & d'un solénoïde est nul entre les 
spires et parallèle à l'axe du solénoïde. 


Considérons la figure suivante et intéressons-nous en approximation qu'à la partie interne du solénoïde en 
admettant que le champ extérieur est nul par la longueur infinie de celui-ci et la parfaite jointure des 
bobines….: 


RE OO000000 000000000000 OOC 000OC ne 


Figure: 36.2 - Solénoïde infini 


Appliquons la loi d'ampère au trajet rectangulaire abcd. Aïnsi: 
a ” è n 6 D ä " LD a . : 
ficd = f£cd ee + [Bo ss (36.13) 
2 a 


La première intégrale du membre de droite donne &.# où B est la grandeur de & à l'intérieur du 
solénoïde et h, la longueur du segment ab. Nous pouvons remarquer que le segment ab, même s'il est 
parallèle à l'axe du solénoïde, ne doit pas nécessairement coïncider avec lui. 


La deuxième et la quatrième intégrale sont nulles car, pour ces deux segments 8 et 4} sont partout 
perpendiculaires: étant donné que Éo4 est nul partout, les deux intégrales sont nulles. La troisième 
intégrale est également nulle puisque le segment calculé se trouve à l'extérieur du solénoïde où nous avons 
supposé que le champ magnétique de la bobine était idéal. 
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Ainsi, l'intégrale $5 cd pour tout le trajet rectangulaire est 8. } tel que: 
$éca =B'h=H4 "1 (3614 


mais le courant I est la somme des courants À, passant dans chacune des N spires contenues dans le 
chemin d'intégration. Mais en électronique, nous avons l'habitude de travailler avec la valeur n (nous 
choisissons la lettre minuscule par analogie avec la thermodynamique où les minuscules représentent des 
densités) qui est le nombre de spires par unité de longueur: 


n= Nik (36.15) 
Ainsi, nous avons: 
B'h={'i1=H'i' N—=B=4ln (36.16) 


Bien que cette relation ait été établie pour un solénoïde idéal infini, elle donne une grandeur assez précise 
(sans être exacte!) du champ d'induction magnétique pour les points d'intérieur situés près du centre d'un 
solénoïde réel. Cette relation révèle par ailleurs que le champ magnétique est en approximation 
indépendant du diamètre du solénoïde et qu'il est uniforme à travers la section de celui-ci. En laboratoire, 
un solénoïde est un dispositif pratique pour produire un champ d'induction uniforme de la même façon 
que le condensateur plan est utilisé pour produire un champ électrique uniforme. 


1.2. BOBINE TOROÏDALE 


La bobine toroïdale est un autre exemple important de l'application de la loi d'Ampère. Effectivement, 
nous retrouvons particulièrement ce type de configuration dans l'électronique de petite puissance 
(ordinateurs par exemple) où les inductances sont pour la plupart toroïdales ou dans la production 
d'énergie avec les fameux Tokomak qui de façon schématisée (très) se réduisent à des bobines 
toroïdales. 


Figure: 36.3 - Photo de quelques bobines toroïdales 


Pour des raisons de symétrie, il est clair que les lignes d'induction magnétique forment des cercles 
concentriques à l'intérieur de la bobine. Appliquons la loi d'Ampère au trajet d'intégration circulaire de 
rayon r: 


£écdr = 41 (3617) 


C'est-à-dire: 
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B'27r = {H1= {HN (36.18) 


Il s'ensuit que: 


g = 4 HA (36.19) 
27 r 


Ainsi, contrairement à B l'intérieur d'un solénoïde, B n'est pas constant à l'intérieur de la bobine toroïdale. 
1.3. ÉLECTRO-AIMANT 


Déterminons donc par exemple (important et intéressant) le champ magnétique dans l'entrefer de longueur 
Z, et de section #, d'un électro-aimant d'une longueur Z,, et de section $, comme représenté ci- 
dessous: 


Entrefer 


Armature en Fer 


Bobine excitatrice 
avec W spires 
parcourues par un 
courant Îp 


Figure: 36.4 - Exemple d'électro-aimant de laboratoire d'école 


La loi d'Ampère nous donne dans le vide: 


£5'a = Ho 2% (2620) 
Z 


dans le cas de l'électro-aimant, nous pouvons écrire que la circulation du champ est la somme de la 
circulation du champ de l'entrefer et de l'aimant lui-même: 


PA dl -Hz ‘LetA EL => =N'L (36.21) 
j P 


où N correspond au nombre de boucles de courant entourant l'aimant et qui permet la production du 
champ magnétique. 
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Nous avons par définition: 


B B 
Hn=—et H,=— (3622 
pe 2 
d'où: 
> B B 
$A à = He: Le + Ho b 2 1, +21 =N'] (8623) 
g Er Fa 


Si l'entrefer n'est pas trop grand ZA, >> Z, nous pouvons écrire: 


B,* By (36.24) 


alors: 
L Z N°1 N°1 
N'i,=8, |Æ+<+|48 - 1 _= £ _…. 
Ëre Le, + L, Lr L, (36.25) 
Er a Fe "o ya ‘ XQ 
d'où: 
B, ne . 
136.26) 
Fe + F.5R ( 
re 


La relation est la même pour un électro-aimant ayant deux bobines! Le lecteur remarqueron au passage 
que cette relation peut aussi servir expérimentalement dans le cas où nous cherchons à déterminer la 
valeur de la perméabilité magnétique relative du Fer quand tous les autres paramètres sont connus. 


1.3.1. FORCE D'UN AIMANT OÙ ÉLECTRO-AIMANT 


Si nous avons connaissance de la norme du champ magnétique B produit par un aimant à sa surface, nous 
pouvons calculer avec une certaine approximation la force nécessaire pour le décoller d'une surface en 
Fer. 


Pour cela, nous noterons F la force nécessaire pour faire décoller l'aimant à une distance d d'une surface 
de Fer. Nous supposerons la distance d suffisamment petite pour que l'on puisse accepter que dans tout le 
volume situé entre l'aimant et le Fer, le champ magnétique est constant. 


Ainsi, le travail fourni par la force F est (cf. chapitre de Mécanique Classique): 
W=F.d (3627) 


Ce travail s'est transformé en énergie du champ magnétique dans le volume créé entre l'aimant et le Fer. 
La densité volumique d'énergie due au champ magnétique dans l'air étant (cf. chapitre 
d'Electrodynamique): 
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1 
Up = cr BÈ (3628) 


Le volume de l'espace créé entre l'aimant et le Fer étant égal à F = $'.4 où S est la surface de l'aimant qui 
était collée au Fer. Nous avons alors l'équivalence dimensionnelle suivante: 


l 
F.d= LE) 54 (36.29) 
240 
Nous en déduisons la force de contact pour de petites valeurs de d: 


(36.30) 


où B est la valeur limite du champ magnétique qui amène notre matériau à se coller à l'aimant (de façon à 
ce qu'en soulevant l'aimant, le matériau associé suive). 


Si nous regardons un électro-aimant d'élévation de rayon 0.75 [m] capable de soulever 200 [kg]: 


Figure: 36.5 - Électro-aimant d'élévation 


B= = 0 20087] es 
| = | 7 [TT G639 


Il est possible d'utiliser aussi grossièrement le même calcul pour déterminer le champ magnétique de 
l'électro-aimant du jouet ludique suivant mondialement connu par les passionnés de physique: 


Nous avons alors: 
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Figure: 36.6 - Électro-aimant d'élévation ludique 
2. RELATION DE MAXWELL-AMPÈRE 


Soit j la densité de courant en un point quelconque de l'espace dans le cas d'une distribution à trois 
dimensions et soit S une surface fermée qui s'appuie sur un contour [' quelconque. Le courant I qui 
traverse L” est bien évidemment donné par: 


1 -pJ 8 (63) 

É 
D'après la loi d'Ampère, la circulation du champ magnétique le long de l'est égale à cette intégrale. Elle 
peut donc prendre ici, selon le choix du contour L', une infinité de valeurs variables de façon continue. 


D'autre part, le théorème de Stokes (cf. chapitre de Calcul Vectoriel) fournit que: 


Dodl =4VXBod8 
| Dites | 


d'où: 


et nous en ressortons finalement que: 


Nous pouvons faire une comparaison osée de ce résultat avec la relation ci-dessous (démontrée dans le 
chapitre d'Électrodynamique), par extension de la charge statique et de la charge dynamique: 


qui n'est autre que la première équation de Maxwell (cf. chapitre d'Électrodynamique). Dès lors, comme 
nous l'avons vu dans le chapitre d'Électrostatique, nous avons: 
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VER nATerA EN EAUEIR [SCIENCES.CH] 
1 OP 
El ——— 6637 
3 NI] r 2e 


Par analogie, l'idée est de poser (cette hypothèse se vérifie un peu plus bas par les résultats remarquables 
obtenus): 


_ Hg JOA7 
: Ur 


relation que nous pouvons écrire de manière plus élégante en supposant le courant non dépendant de la 
position de l'observateur dans l'espace et colinéaire au vecteur perpendiculaire à la surface traversée: 


10 y 
he or JOAF he S_ 1) | h 4 G639) 
47% 4x Tr | 


r? 


où [' représente le périmètre du fil dans lequel le courant I circule. 
3. LOI DE BIOT-SAVART 


Du dernier développement, nous tirons donc: 


45 - # ll 
4x r 


(36.40) 


Rappelez-vous qu'à la dernière étape de notre développement précédent (nous l'avons précisé 
implicitement) le chemin d'intégration est perpendiculaire au courant! Mais le champ magnétique ne peut 
pas être nul en tout point de la ligne du courant. Dès lors, nous sommes amenés à écrire ce qui est caché: 


= l'a l'ai 
dB =" ©: Si ec .sin (36.41) 
4'x'r 4x" r? 


La relation ci-dessus nous permet donc, par extension, d'écrire sous une forme plus générale: 


2 fé'l'sin(a) + HI TX 
BB; - _— 
4xrr 


Arr 


qui n'est autre que la "loi de Biot-Savart" souvent présentée en premier dans les classes scolaires comme 
début d'étude du magnétisme (à l'origine elle a été déterminée expérimentalement par Biot et Savart avec 
l'aide mathématique de Laplace). 


Cette dernière relation peut tout aussi bien s'écrire (forme très importante): 


Donc: 
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5-48 
477 


vXFr| (36.44) 


Nous retrouvons ici l'approximation non relativiste du champ magnétique tel que nous l'avons déterminé 
lors de notre étude de la relativité restreinte (cf. chapitre de Relativité Restreinte), où nous avons démontré 
que: 


_.37,32 
B= 2 CV) gx (36.45) 
c'e 47 [1- (ve )sin" 8] 


Une autre forme importante de l'expression du champ magnétique est: 


AE = Ho À LE = #&iJ'Sidtxr (36.46) 
47 r 47T r° 


Comme la densité de courant f est colinéaire à 4} , nous pouvons écrire: 


SH ISAUTXE y dx HW TX 


DB = —_—_—__— °° — 


4x r° 47 pr 4x r 


dW (36.47) 


Donc: 


Une remarque importante s'impose à notre niveau du discours: dans le cadre des études scolaires pré- 
universitaires, les formulations mathématiques des champs magnétique et électrique sont considérées 
comme des lois indémontrables d'où l'on tire plus tard les équations de Maxwell (de plus les 
développements ne sont pas des plus esthétiques et rigoureux). L'aspect totalement expérimental de 
relations aussi importantes peut donner une image négative de la physique théorique aux étudiants. Il 
convient dès lors de préciser que lors des études universitaires, nous avons une approche juste un peu 
moins pragmatique. 


Effectivement, nous postulons l'équation de Schrôdinger (cf. chapitre de Physique Quantique Ondulatoire) 
dont nous nous servons pour démontrer la formulation non relativiste de la loi de Coulomb à l'aide de la 
théorie de Yukawa (cf. chapitre de Physique Quantique Des Champs). Ensuite, pendant l'étude de la 
relativité restreinte (cf. chapitre de Relativité Restreinte), nous déterminons la forme relativiste de la loi 
de Coulomb. Ensuite, nous admettons l'existence du champ magnétique dont l'expression est donnée 
expérimentalement par la force de Lorentz (voir plus bas dans ce chapitre) et de par les propriétés des 
transformations de Lorentz et de la connaissance de l'expression relativiste de la loi de Coulomb, nous 
déterminons l'expression relativiste du champ magnétique. Ensuite, par approximation non relativiste, 
nous tombons sur la loi de Biot-Savart. Cette manière de procéder est beaucoup mieux accueillie par les 
étudiants mais pas nécessairement accessible à tous les niveaux. 


Revenons maintenant sur la loi de Biot-Savart. Un exemple important en astrophysique de la loi de Biot- 
Savart dans le cadre des jets de plasmas des disques d'accrétion sont les boucles de courant circulaires 
uniques (il faut y rajouter aussi la force de Laplace dans le cadre relativiste pour comprendre la 
dynamique de ces jets). 
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3.1. CHAMP MAGNÉTIQUE POUR UNE BOUCLE DE COURANT 


La figure ci-dessous en représente un bon exemple: 


di 


Figure: 36.7 - Champ magnétique pour une boucle de courant 


Nous avons donc une boucle circulaire de rayon R parcourue par un courant d'intensité I. L'objectif étant 
de calculer & en un point P de l'axe de cette boucle. 


Le vecteur 4} correspondant à un courant élémentaire au sommet de la boucle sort perpendiculairement 
du plan de la page. L'angle & entre ce vecteur et * est donc de x #2. Le plan formé par 4; et F est 
normal à la figure. Le vecteur 42 produit par ce courant élémentaire est normal à ce plan de par la forme 
de la loi de Biot-Savart. Il est donc dans le plan de la figure et à angle droit avec le vecteur 7 comme 
indiqué sur la figure. 


Décomposons 42 en deux parties: la première, dB, est le long de l'axe de la boucle et la seconde, 4Ë, est 
perpendiculaire à cet axe. Seule la composante dB, contribue à l'induction magnétique totale au point P. 
Il en est ainsi du fait que les composantes 48, de tous les courants élémentaires sont sur l'axe et qu'elles 


s'additionnent directement. Quant aux composantes 4Ë, , elles sont dirigées dans différentes directions 


perpendiculairement à cet axe de sorte que, par symétrie, leur contribution est nulle sur cet axe (prenez 
vraiment garde à ce cas particulier!). 


Nous obtenons: 
B= fa, (36.49) 


C'est une intégrale scalaire effectuée sur tous les courants élémentaires. Nous obtenons d'après la loi de 
Biot-Savart: 


_ Hoi dsinixrf2) 
Na 2 


dB 


(36.50) 
47T Fr 
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De plus, nous avons selon le schéma: 


dB, = dBcosæ (3651) 
En combinant ces relations, nous obtenons: 


dB, = - Hoi cos af (36.52) 
AT pr 


La figure révèle que ret Æ ne sont pas des variables indépendantes. Nous pouvons les exprimer en 
fonction de la nouvelle variable x, la distance entre le centre de la boucle et le point P. Les relations entre 
ces variables sont: 


En substituant ces valeurs dans l'expression de 48}, nous obtenons: 


dE, = 


; di 


HoiR 
ant +n PA (36.54) 


Nous remarquons que, pour tous les courants élémentaires, L,R,x ont respectivement les mêmes valeurs. 
L'intégration de cette différentielle donne: 


- HoiR - 
> [43 = . PAPE al = PARC PET _ 2(2° 2 d (36.55) 


Un point important de cette relation est en x = 0 où nous obtenons donc: 


pe ul 
2R 


Un autre cas d'application important de la loi de Biot-Savart consiste à reprendre l'exemple précédent, 
mais pour une forme continue plane quelconque et considérée comme ponctuelle et dont nous aimerions 
connaître la valeur du champ ailleurs que sur l'axe de symétrie. Les résultats seront très utiles lorsque nous 
étudierons la physique quantique corpusculaire et donc les propriétés magnétiques des métaux. 


3.2. CHAMP MAGNÉTIQUE POUR UN FIL INFINI 
Montrons aussi (c'est un exemple intéressant!) qu'à partir de la loi de Biot-Savart: 


# Jai sin 8 


dB = 
AT r? 


36.57) 


nous pouvons aussi obtenir pour un fil rectiligne infini la relation: 
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B= Hol (36.58) 
2xr 


que nous avions obtenue avec le théorème d'Ampère (ce qui montre l'équivalence entre les deux manières 
de calculer!). 


Choisissons pour le fil rectiligne infini ci-dessous x comme variable: 


rase : 
d> ie À 
1 É 8 1 
X1 X (sl X2 


Figure: 36.8 - Fil rectiligne infini 


Nous avons alors à partir de la figure ci-dessus: 
di = dx 
_2: © 
PNA : (36.59) 


AE — 
r Jr2+Rr2 


d'où: 
ap - 0 daxsin® _ Ho dx RH ,2 dx 
47 r° 47 r2? r 4x : RS (36.60) 
ix< +R“ )I2 
En intégrant: 
x 
bo nf 1 
B=-i| jar = IR — 
Æ : Ê 7 
A (x2+ 8212 R? | x? + R° 2 
À (36.61) 
AR 1 l 


(x2+RÈ|2 (x+Rrp 


Pour la suite, l'astuce consiste à utiliser la configuration suivante: 
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dË 
| 
4 
a — 
Î _— 
X] — 79 (ll n Fe. 
Î 
Figure: 36.9 - Morceau du fil 
Donc: 
Î Î 
X=— %=-— R=d (26.62 
275 1 > ( ) 
Ce qui nous donne: 
Î — 
B Ho 2 = 2 Hol : 36.63 
4r|,. Jam, dl 
Î 212 (1 2 2 Î 2 
— +4 —+d — +4 
4 4 4 
Après simplification: 
ge Hoi. M Hi 
1 1 1 
2 25 25 2\3 (36.64) 
Si SR 2 2ra[ 1e 


4 À À 
B = = —— 
= 27 
2 (36.65) 
27r4l ja 2 
72 
0 


3.3. DIPÔLE MAGNÉTIQUE 


Le dipôle magnétique a tout comme son homologue en électrostatique, une énorme importance dans 
l'étude des propriétés magnétiques des matériaux pour lesquelles il permet d'élaborer de bons modèles 
théoriques. 
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Avant de lire ce qui va suivre, nous conseillerions au lecteur (c'est même plus qu'un conseil) de lire 
absolument tout le développement du dipôle électrostatique rigide dans le chapitre d'Électrostatique. 
Effectivement, la plupart des calculs qui vont suivre comportent les mêmes raisonnements, 
développements et approximations mathématiques à quelques infimes nuances près. Nous n'avons dès lors 
pas souhaité refaire les mêmes calculs intermédiaires déjà présents lors du calcul du dipôle électrostatique 
(cependant, si vraiment il y a difficulté de la part du lecteur, nous sommes prêts à compléter... mais bon...) 


Le dipôle magnétique a une différence non négligeable relativement au cas pratique que nous nous 
imposons comme cadre d'étude. il n'y a pas 2 charges ! Effectivement, des charges au repos émettent en 
première approximation (c'est expérimental et. théorique) un champ magnétique intrinsèque beaucoup 
trop faible pour être considéré comme intéressant dans le cadre de l'étude des propriétés magnétiques des 
matériaux. Il convient cependant de préciser quelque chose d'intéressant (de sympa), les charges 
coulombiennes élémentaires sont parfois modélisées (à tort!) par les physiciens comme en rotation sur 
elles-mêmes (le "spin") et sont représentées comme une superposition de spires circulaires (tiens. une 
spire..) en infiniment petites ce qui fait qu'un observateur dans un référentiel au repos (au centre de la 
charge ) peut interpréter la charge coulombienne globale comme étant un courant en déplacement dans les 
différentes spires, induisant ainsi un champ magnétique intrinsèque (joli non !?). 


Bref, considérons une spire plane (tiens. encore une spire...), de forme quelconque, de centre O, 
parcourue par un courant permanent et constant 1 dont un des points de la spire est noté par P. Nous allons 
calculer le champ magnétique créé par cette spire en tout point M de l'espace, situé à grande distance r de 
la spire (précisément, à des distances grandes comparées à la taille de la spire). 


Remarque: Personnellement il y a certaines étapes du calcul que je trouve... comment dire. de très 
loin pas convaincantes.. mais bon... il y a tellement d'approximations que l'on est plus à ça près... 
hummm... 


Nous posons: 
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Nous allons donc utiliser la loi de Biot-Savart: 


+ HO Nr 
B=— dV (36.67 
1x Ÿ r° 
sous l'hypothèse que le point M est donc situé à très grande distance de la spire. Ce qui nous donne le droit 
d'écrire: 


La s (36.68) 
La 


É = Hoi 

BIMj= — 

(M) P 
Mais dl = 4 5 donc: 


Ê(M) & Hg dpoxr (36.69) 


Évaluons le terme >‘; pour des points M situés à grande distance de la spire (au dénominateur nous 
avons utilisé le théorème du cosinus comme lors de notre étude dipôle électrostatique rigide dans le 
chapitre d'Électrostatique): 


re r-à . r-p _F-B(., ro 
UP. de UT — sr 5 |lt3—— 
FO (r+g -2#5p] 3(,_,7°0 r r 
r? (36.70) 
# PP .,#0p_ 
E—-—+3 ü 
ER F 


où nous avons fait comme pour le dipôle électrostatique rigide un développement limité à l'ordre 1. 
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Remarque: La dernière approximation est très grossière dans le sens qu'il s'agit d'un choix astucieux 
des termes à négliger pour arriver à un résultat esthétique visuellement et permettant de définir le 
moment magnétique dipolaire (voir un peu plus loin)... 


En reportant cette expression dans la loi de Biot-Savart, nous obtenons: 


Hoi 
47° 


” | I 
BEM) = jpapnr-parxs + Épazraiae 1] (36.71) 


Évaluons séparément chaque terme intervenant dans la parenthèse: 
1. fabxs-|fasixa =(8(8)- Ê(B)ixa = Ôxa = 0 


puisque le vecteur # est indépendant du point P sur la spire et que nous faisons une intégration curviligne 
sur toute la spire, en revenant au point de départ. 


l 
2. --Da5x 6 
-Ÿ x 
De par les propriétés du produit vectoriel: 
l a Le , 
--pañxé--fôxaë (67 
r Fr 
Or puisque 4 Ê et À sont perpendiculaires et dans un même plan, nous avons &x 4 6 qui est la surface 


infinitésimale 4$' d'un rectangle et cela ne représente rien étant donné que l'abscisse est curviligne par 
rapport à ©. Effectivement: 


Figure: 36.10 - Représentation de la perpendicularité des deux vecteurs 
Donc, nous pouvons écrire: 
PXdP = dS"n = 24Sn = BXxd5=2dSn (36.73) 


où # est le vecteur normal au plan de la spire (vecteur de base de l'axe Z). Ce résultat est général, valable 
quelle que soit la surface. 
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D'où: 


l 1 1 l 25 
dx 5 =-Q 5x5 =-WQ2dSr = —-H2MhdS = — À (36.74 
-Ÿ Bxp PS ô -Ÿ u f A (6679 
3.badôxäiaoô--2xfapiscà) 
de par les propriétés du produit vectoriel (cf. chapitre de Calcul Vectoriel). 


Nous allons utiliser ces relations pour calculer l'intégrale inconnue du début. Si nous décomposons les 
vecteurs © et # dans la base (8,,8, | engendrant le plan de la spire, nous obtenons: 


dpito ide |A + Ale + del Qi + Mu3lë (86.75) 
puisque dé =Û0et 3 =0., 


Nous avons aussi: 


$auda = 4 (R)- #(R)| = 0 
(36.76) 
gemde, =" AR) - PR) 0 


D'où: 


pas uopi= u:) Pda + ET) Ad 88 = DAT: de +uë,ÿade, (36.77) 


Rappelons que: 


— 
PX dB = aS'R = SR © PE - 5 G678) 


Sous forme de composantes (seulement la troisième est non nulle puisque 4 3 =0 et #3 = 0 ), nous 


avons: 
s(AdA-män)=d8 (ir) 
d'où: 
Ad - Mda=2dS& ade=d$,%4dA =-d4S$ (3680) 


Ce qui nous amène à écrire: 


faô(top) . ui 84e +uapade : —uéfas +uë,fas (36.81) 
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Soit: 
1 (] — 3 
={ u4S as )=—S'(ue — Er } =—$ 3 0 |— Là 1 =S Le] (36.82) 
0 0 0 
Remarquons que cette dernière relation est égale à: 
O\ fæ« —l:u —U 


Sonxu=S|0|x|us |= S| 14 |=S| 4 (36.83) 
1) (a ( ( 


Donc au final: 
fapiz.p) = SAXE (36.84) 


En rassemblant ces résultats, nous obtenons pour le champ magnétique: 


B(M)= HI 28 > EL) (36.85) 
4xrr° [a 


Nous voyons donc apparaître une grandeur importante car décrivant complètement la spire vue depuis une 
grande distance, à savoir le "moment magnétique dipolaire local" ou plus simplement "moment dipolaire 
magnétique": 

= 1 S'A| (26.86) 
souvent noté aussi par un M stylisé par certains auteurs. Nous avons alors la relation antéprécédente qui 


peut s'écrire: 


Éaa) = #0 À 8, x | 2 #0 44 EL (g x8) (36.87) 
ar? lr Fr axl 3 


r Fr 
En faisant usage de la propriété suivante du double produit vectoriel (cf. chapitre de Calcul Vectoriel): 


“x xu)=(uou)fÿ -(uofglu=/fj-(uoul-u.(Woff| (36.88) 


Nous obtenons alors une autre forme de l'expression du champ magnétique approximatif créé par un 
dipôle: 
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(36.89) 
= À on -3m.(rer)+3 (tom )|s À [3 (50%) 
4x ra 4x 


C'est sous cette dernière forme que l'on retrouve le plus souvent l'expression du moment magnétique dans 
la littérature. 


À comparer (pour le fun) avec l'expression du champ électrique pour un dipôle électrique rigide: 


pr (&o )- & | 
vita 


et donc nous voyons qu'il y a correspondance parfaite. 


Nous sommes quand même arrivés à mettre cela sous une forme assez identique et esthétique après 
quelques approximations. 


Nous avons aussi: 
Aoü= I ||élcos 8 ={4cos0 (36.91) 


d'où: 


B(M) = # ; [rx cos 8 -À |] (36.92) 
4xr 

L'origine du champ magnétique d'un matériau quelconque doit être microscopique. En utilisant le modèle 

de Bohr de l'atome (cf. chapitre de Physique Quantique Corpusculaire), nous pouvons nous convaincre 

que les atomes (du moins certains) ont un moment magnétique dipolaire intrinsèque. Effectivement, le 

modèle de Bohr de l'atome d'Hydrogène consiste en un électron de charge 4 7 € en mouvement 

(circulaire) autour d'un noyau centre (un proton) avec une période T = 27%. 


Si nous regardons sur des échelles de temps longues par rapport à T, tout se passe comme s'il y avait un 
courant: 


Nous avons donc une sorte de spire circulaire, de rayon moyen la distance moyenne au proton, c'est à dire 
le rayon de Bohr >,. L'atome d'Hydrogène aurait donc un moment magnétique intrinsèque: 


= “. © 3. ” TR 
E = ISA = T° 23 = TL \maor2% = À 5] 3699 
2 2m 2 
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où à est le moment cinétique de l'électron et q/2m le "facteur gyromagnétique" (ce résultat est très 
important pour le modèle de Langevin du diamagnétisme). Ce raisonnement peut se généraliser aux autres 
atomes. En effet, un ensemble de charges en rotation autour d'un axe vont produire un moment 
magnétique proportionnel au moment cinétique total. Cela se produit même si la charge totale est nulle 
(matériau ou atome neutre): ce qui compte c'est l'existence (scalaire) d'un courant. 


Du coup, nous pouvons expliquer qualitativement les propriétés magnétiques des matériaux en fonction de 
l'orientation des moments magnétiques des atomes qui les composent: 


- Matériaux amagnétiques: ce sont les matériaux où les moments sont distribués aléatoirement, il n'y a pas 
de champ magnétique intrinsèque. 


- Matériaux diamagnétiques: ce sont les matériaux qui soumis à un champ magnétique, ont leur moments 
qui s'opposent à celui-ci et sont donc repoussés (très faiblement) par les aimants. Ils induisent donc un 
moment magnétique opposé à la direction du champ magnétique. 


- Matériaux paramagnétiques: ce sont les matériaux pour lesquels les moments peuvent s'orienter dans la 
direction d'un champ magnétique extérieur et pouvant donc être ainsi aimantés (attirés) momentanément. 
Ils induisent donc un moment magnétique dans la direction du champ magnétique. 


- Matériaux ferromagnétiques: ce sont les matériaux dont les moments sont déjà orientés dans une 
direction particulière, de façon permanente (aimants naturels). 


Remarque: La Terre est connue pour avoir un champ magnétique dipolaire, où le pôle Nord 
magnétique correspond au pôle Sud géographique (à un angle près). Au niveau macroscopique, 
l'explication de l'existence du champ magnétique observé sur les étoiles est encore aujourd'hui loin 
d'être satisfaisante. La théorie de "l'effet dynamo" essaie de rendre compte des champs observés par la 
présence de courants, essentiellement azimutaux, dans le coeur des astres. Plusieurs faits connus 
restent partiellement non éclaircis: 


- Les cycles magnétiques: le Soleil a un champ magnétique à grande échelle qui ressemble à celui de 
la Terre, approximativement dipolaire. Cependant, il y a une inversion de polarité tous les 11 ans (sur 
11 ans). Pour la Terre, on a pu mettre en évidence qu'il y avait eu une inversion il y a environ 700'000 
ans. 


- Non-alignement avec le moment cinétique de l'astre: s'il est de l'ordre d'une dizaine de degrés pour la 
Terre, il est perpendiculaire pour Neptune! 


4. LOI DE LORENTZ 


En électrostatique, nous avons calculé la force exercée par une ou un ensemble de charges au repos sur 
une charge immobile ou en mouvement. La force exercée s'écrivait alors de la manière suivante: 


F-9 Er) 


Dans le cas le plus général, où les charges agissantes sont en mouvement, la force qu'elles exercent sur 
une charge ponctuelle q placée en un point de l'espace est la somme de deux termes: l'un qui est 
indépendant de la vitesse ÿ de cette charge, l'autre qui en dépend. Voici comment s'écrit cette relation: 
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F=q(Ë+5x8) (696 


qui n'est autre que la "loi de Lorentz" ou "force de Lorentz". 


Pour démontrer cette relation, nous allons poser deux hypothèses, mais avant il est important d'informer le 
lecteur que cette démonstration nécessite des outils mathématiques non nécessairement évidents (il faut 
avoir lu le chapitre de Mécanique Analytique et de Physique Quantique Ondulatoire pour comprendre): 


H1. Soit une particule ponctuelle non-relativiste de masse m, de position x, = 1,2,3) et de vitesse 
3,@ = 1,2,3) ; nous supposons qu'elle est soumise à une force F et qu'elle satisfait les équations de 
Newton: 


mx = F(R V4) (86.97) 
avec les relations de commutations suivantes (cf. chapitre de Physique Quantique Ondulatoire): 


[x,x,]= 0 
(36.98) 
"1 x ,v;] =ihà, 


Il faut bien voir que la dernière relation est une hypothèse et qu'elle n'est pas équivalente aux règles de 
commutation que nous avons vues en physique quantique entre positions et impulsions! 


H2. Il existe des champs Æ(x,f) et B(%,£), ne dépendant pas des vitesses, tels que: 
F = qg(E+5x Ë) (36.99) 
et qui vérifient les équations de Maxwell (cf. chapitre d'Électrodynamique): 


TxE= _98 
&æ (36.100) 
VoB=0 


À un niveau classique, nous exprimons les hypothèses de commutation en utilisant la correspondance 
commutateurs-crochets de Poisson (cf. chapitre de Mécanique Analytique), soit: 


(x,x,) = 0 


- (36.101) 
mx À) = 


avec (rappel): 


Maintenant, nous définissons un potentiel vecteur 4 (cf. chapitre d'Électrodynamique) tel que: 


P; =; +tGA; (36.103) 
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alors l'hypothèse ({x;,?;}= à;) de commutation peut s'écrire pour à # j : 


(x%,2;} T À; GX; +gA;) … GX; + gA;)x == {x ; À;} (36.104) 
donc nous pouvons dire que À ne dépend que de * et t puisqu'il commute identiquement à ?;. 
De plus, nous savons que la mécanique classique admet une formulation lagrangienne (équivalente aux 


équations de Newton) pour laquelle les équations de la mécanique deviennent (cf. chapitre de Mécanique 
Analytique): 


- ôL 
Ÿ 4x 
(36.105) 
- ÎLE 
8x 


où L désigne le lagrangien du système. Dès lors, avec: 
P; “mx; tqA;(X,f) (36.106) 


nous pouvons intégrer la relation: 


et nous obtenons: 
le à = | 
L= 5) +gCx; ACX,£) — (X,£)) (86.108) 


Le signe "-" de la constante d'intégration du potentiel vecteur se justifie pour être en cohérence avec ce 
que nous avons vu en théorie de Jauge (cf. chapitre d'Electrodynamique),. 


La seconde équation de Lagrange p?; = #x; +gA;(%,f) nous donne alors: 


D. =nX. + À. = — 36.108 
P; 5 TA; &, (36.109) 
En développant un peu: 
 _ - | g£ 4 [1 .; D . 
mx, =p,-qA; et P;=—" Es +g(x; ACx,é) LD) (36.110) 
Hi. x &x,; &x;l2 


Pour l'ensemble des coordonnées, cela donne sous forme condensée et en utilisant les outils de l'analyse 
vectorielle: 


mx =q 


_ 84 = Se 4 
UE UE) (36.111) 
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Donc: 


ou autrement écrit: 


F = g(£+5x8) (36.113) 


Nous retrouvons donc bien l'expression de la force de Lorentz où Æ et 5 sont donnés par: 


comme nous l'avons vu en théorie de Jauges. Certes la démonstration est loin d'être évidente, mais elle est 
possible. 


Arrêtons-nous un instant sur l'expression de la force de Lorentz. Nous voyons avec cette relation, qu'une 
charge immobile (ou non) dans un champ électrique subira une force qui lui donnera l'impulsion 
nécessaire à faire varier son énergie cinétique (nulle ou non nulle au départ). Cette constatation n'est 
cependant pas valable pour le champ magnétique. Effectivement, lorsque nous plaçons une charge 
immobile dans un champ magnétique, cette dernière ne subira aucune force du champ magnétique et donc 
ne verra pas son énergie cinétique varier. Si la particule chargée a une vitesse initiale non nulle, il s'ensuit 
que le champ magnétique va changer les composantes du vecteur vitesse mais pas la norme. Ainsi, nous 
avons pour habitude de dire que: "le champ magnétique ne travaille pas" (dans le sens que le champ 
magnétique ne vas pas mettre en mouvement une particule chargée au repos ni changer la norme de sa 
vitesse). 


Voyons mathématiquement comment nous pouvons montrer que le champ magnétique ne travaille pas. 
Démonstration: 
Nous savons que pour une particule chargée plongée dans un champ magnétique, nous avons: 
PPT 11 
F=gvxB=ma=m— (36.115) 
£ 
d'où: 


g _ 
—=—.VXE (36116) 
ma 


Et exprimons la variation temporelle de l'énergie cinétique: 


d (2 ?) 2 É Fe) NET 
— E, =—| nv |=—| —-pmvov|=mv0— (36.117) 
dt dt \ 2 dt \ 2 dt 


et en substituant la dérivée de la vitesse par la relation antéprécédente, il vient: 
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= m5 o[L5xF)-450(5xF)= 9.00 (36.118) 
L | 


FxBlr 
L'énergie cinétique de la particule ne change donc effectivement pas à cause du champ magnétique. 


Maintenant, si nous nous intéressons uniquement au second terme de cette relation, nous pouvons arriver à 
démontrer la loi de Laplace: 


Nous avons: 
dF =d9 5xB=0 dV'5xB=p dl dS'ÿxE (26.119) 
où © est la densité volumique de charge. Si ÿ et 4} sont supposés parallèles nous pouvons écrire que: 
dF = p'v'dS' dix (36.120) 


Une densité de courant nous permet de calculer la vitesse d'entraînement des porteurs de charges dans un 
conducteur. Le nombre d'électrons de conduction dans un fil est égal à: 


n'A'l=p'A'i (36121) 


où n est le nombre d'électrons de conduction par unité de volume et À:Z le volume du fil (et donc A est 
l'aire de la section du conducteur). 


Une quantité de charges 4 = ©' A'? traverse un fil en un temps t donné par: 


Î 
£=— (36.122) 
V 
L'intensité I du courant étant définie par: 
‘ A'i 
Î -? np A'v (36.123) 
4 lv 
nous obtenons que: 
J 


V=— (36.124) 
re) 


dr = p'v'dS' dx (36.125) 
Nous pouvons maintenant tirer que: 
dF = J'dS" di x B (36.126) 


Enfin, nous trouvons que: 
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qui est la "loi de Laplace" ou "force de Laplace" et qui dérive donc de la loi de Lorentz. Nous en 
déduisons dans les unités du champ magnétique: 


2 ml. a] = Leg 52. at ]= [ke 6.8. cn 2 E el. Je [7] c629) 


où Test commumément une unité tolérée dans l'usage appelée le "Tesla” (qui contient implicitement donc 
l'unité du Coulomb qui est à l'origine du champ magnétique!). Connaissant maintenant efin explicitement 
l'unité du champ magnétique, nous pouvons déterminer les unités de la constante de perméabilité 
magnétique en repartant de: 


(36.129) 
Il vient alors pour les unités de la constante de perméabilité magnétique: 
[rm a] = [Nm Al y a] = Es 4? | =| kg 5? 47] (36.130) 


Ceci étant fait, voyons quelques cas importants d'application de la loi de Lorentz: 
4.1. EFFET HALL CLASSIQUE 


Précédemment, nous avons étudié l'action d'une induction magnétique sur un circuit filiforme en ayant 
pour but de trouver l'expression des forces magnétiques appliquées à la matière même de ce circuit. 


Portons maintenant notre attention sur les électrons de conductivité eux-mêmes, en nous plaçant dans le 
cas de la figure ci-dessous: 


Figure: 36.11 - Ruban métallique parcouru par un courant continu 


où un ruban métallique est parcouru par un courant continu }. Le vecteur densité de courant ÿ est 
constant et parallèle aux grands côtés PQ ou RS du ruban. 


Imaginons alors que le ruban soit plongé dans un champ magnétique uniforme perpendiculaire aux plans 
PQ et RS (selon l'axe Z). Les charges mobiles de densité volumique £ contenues dans un élément de 
volume dV sont donc soumises à la force magnétique: 
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df = po dV'5xB=JxB'dW (26.131) 


Cette force modifie les trajectoires des électrons mobiles et, au cours d'un régime transitoire, provoque 
leur accumulation sur le bord avant du ruban tandis qu'un excès de charges positives apparaît sur le bord 
arrière. 


Ce phénomène produit un champ électrique supplémentaire parallèle à RP qui exerce sur les charges 
mobiles du volume dV une force électrique: 


dF =p"dW'£ (36132) 


Les deux forces s'opposent donc l'une à l'autre et la force coulombienne tend à ramener les trajectoires 
électroniques dans leur position initiale. Un régime permanent s'établit peu à peu. 


Remarque: En fait, à chaque fois que nous parlons de régime permanent en physique, nous mentons un 
peu. Il s'agit au fait juste d'un équilibre stable et en général, le système oscille autour de sa position 
d'équilibre. Au bout d'un certain temps, un système comme le conducteur impliqué dans notre 
exemple montre des oscillations négligeables. La physique c'est aussi parfois qu'une question 
d'approximations… 


Quand ce régime est atteint, la densité de courant est à nouveau parallèle à PQ et les forces électriques et 
magnétiques ci-dessus sont vectoriellement opposées. Nous avons donc: 


E =-K&" (7 x Ë) (36.133) 
avec: 
= nl DAS UN 
K& = £ (36.134) 


Dans certains ouvrages, le produit vectoriel est explicité sous forme de ses composantes tel que: 


car les autres composantes sont nulles (la densité de courant est parallèle au ruban et le champ magnétique 
perpendiculaire). 


Or, comme nous l'avons démontré dans le chapitre d'Électrocinétique: 
J,{B=Y, (36.136) 

dès lors: 
£, =v,'B, (36137) 


Nous définissons alors le "coefficient de Hall" par: 
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À; peut être aussi bien utilisé à l'équilibre pour la mesure de J, que par extension si nous supposons 


v, =c* alors À; « #7 donc à la mesure de la densité de porteurs dans l'échantillon. 


LA 


Remarque: Nous parlons également de "résistance de Hall". Il s'agit simplement du rapport de la 
tension de Hall sur le courant circulant dans l'échantillon. Il ne faut cependant pas confondre la 
résistance de Hall avec À;;. Notons que la résistance de Hall varie linéairement avec le champ 


magnétique. 


Dans un semi-conducteur à deux dimensions, l'effet Hall est également mesurable. Par contre, à 
suffisamment basse température, nous observons une série de plateaux pour la résistance Hall en fonction 
du champ magnétique. Ces plateaux apparaissent à des valeurs précises de résistance, et ce, 
indépendamment de l'échantillon utilisé. Ceci fait l'objet de "l'effet Hall quantique" que nous n'étudierons 
pas dans ce chapitre. 


Sous forme scalaire la relation de "l'effet Hall", s'écrit: 


E=-K'/Jj'B'snæ| (26.129) 


Nous pouvons aussi l'exprimer en explicitant la différence de potentiel qui correspond par définition au 
champ électrique. 


Si l'est la largeur du ruban, nous avons: 

ÜU =Æ"1 (36.140) 
Si e est son épaisseur, le courant 1 qui le parcourt est: 

Î=e' TJ (36.141 


Compte tenu des positions relatives des divers vecteurs, la relation exprimant l'effet Hall équivaut donc à: 


— PART (36.142) 
Î e'i 


Plus esthétiquement et sous une forme traditionnelle, la tension de l'effet Hall est donnée par: 


Uy=ky'l'B'sana| (36.143) 


avec: 


x = = (36.144) 


qui est la "constante de Hall". Elle est inversement proportionnelle à la densité des porteurs libres et dans 
le cadre des métaux, elle est négative. 


Dans d'autres domaines d'étude comme celui des semi-conducteurs, nous écrivons la tension de Hall sous 
la forme traditionnelle: 
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De 2. 1.8. sn ae. sin = kg —E. sin @ 


2-8 gr € 


où q est la charge de l'électron et n la notation traditionnelle (sic!) de la densité de porteurs dans le cadre 
de l'étude des semi-conducteurs. 


Nous avons alors dans ce dernier domaine la constante de Hall qui est définie par: 


kg =-— 
ga 


Ce qui a fait cependant la renommée de l'effet Hall, outre le fait que ce résultat est énormément utilisé 
pour fabriquer des sondes de champs magnétiques de tous genres (car les sondes à effet Hall fonctionnent 
sans contact physique avec les aimants), c'est que pour certains types de semi-conducteurs cette constante 
de Hall est positive! !!! Ce qui signifierait avec les modèles standards que nous avons à notre disposition 
jusqu'à maintenant, qu'il y aurait des charges positives qui feraient office de courant... et à l'époque de la 
mise en place de cette expérience pour les semi-conducteurs, ceci était inexplicable. À l'époque de Hall 
cette expérience servit à vérifier si c'était des charges positives ou négatives qui se déplaçaient et Hall 
conclua en testant cela sur des métaux conducteurs que seulement l'électricité négative circule dans les fils 
conducteurs. 


Remarque: La sonde à effet Hall la plus connue par la population est le compteur de vitesse sur les 
vélos (odomèêtres) qui fonctionne sur la base de l'accrochage d'un petit aimant sur un des rayons d'une 
des roues et dont le passage devant la sonde à effet Hall produit un signal traité par l'électronique de 
l'odomètre. 


Or nous verrons plus tard qu'en utilisant la théorie quantique dans le cadre des semi-conducteurs ( 
ue) des charges positives peuvent pourtant sous certaines conditions apparaître et 
être à à l'origine d'un courant! 


4.2. RAYON DE LARMOR 


Un cas très intéressant d'étude de laboratoire est le mouvement d'une charge dans un champ magnétique 
uniforme. Pour cette étude, considérons une particule de masse m et de charge q placée dans un champ 


magnétique uniforme avec une vitesse initiale 


Nous avons selon la loi de Lorentz: 


Nous allons tirer parti du fait que la force magnétique est nulle dans la direction du champ magnétique. 


Nous allons donc décomposer la vitesse en deux composantes, l'une parallèle et l'autre perpendiculaire au 
champ magnétique tel que: 


var + Ê] 
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L'équation du mouvement s'écrit alors: 


dy, ” dÿ u. 
—+ =ÿ 2 = T5 xB (36.149) 
dt dé mm 


La trajectoire reste donc rectiligne uniforme dans la direction du champ magnétique! En d'autres termes, 
si la vitesse de la particule chargée était nulle initialement dans la direction du champ alors elle restera 


nulle! 


Prenons maintenant un repère cartésien dont l'axe Z est donné par la direction du champ magnétique tel 
que dv, l dt = 0. L'équation du mouvement ne s'écrit dès lors plus que sur deux composantes puisque: 


dv, dv, 
di dt “| (2 A v,B 
dv, - dv, = q x] £8 = 4 x[o | = 4 —v B Se de 
+ de. . Vy y x V, _ Y, (36.150) 
dv, Ô Vz B, Vz B 0 
dé 
d'où: 
dv, _qB. dv, __gB. . 
dt = FL _ es Vy dt = .: _ On Vy (36.151) 


Une solution très simple à ces deux équations différentielles est dans un cadre non relativiste: 
Vy = VoCOS(@É) OV, = -Vysin(@é) (36.152) 


où nous avons donc choisi une vitesse initiale suivant X. En intégrant, nous obtenons: 
n y 
x=“Léain(at) y=Tcos(@) (36.53) 
æ æ 


où les constantes d'intégration ont été choisies nulles (choix arbitraire). La trajectoire est donc un cercle 
de rayon: 


dite "pulsation gyro-synchrotron". Ce cercle est parcouru dans le sens conventionnel positif pour des 
charges négatives. 
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Remarque: Le mouvement n'est circulaire que si l'a particule, au départ, n'a donc pas de vitesse dans la 
direction du champ magnétique. Si elle en a une, elle la garde (le champ magnétique n'a pas d'action 
dans cette direction). 


Le problème d'une telle configuration pour construire un accélérateur, c'est que si nous augmentons 
l'énergie de la particule (en ajoutant un champ électrique synchronisé sur la pulsation gyro-synchrotron et 
colinéaire au mouvement), sa vitesse augmente mais le rayon de Larmor aussi. Or, le "cyclotron" qui est 
basé sur ce système a un rayon limité puisqu'il est difficile de maintenir un champ magnétique constant 
sur une grande surface. 


Plus difficile encore, dans le cas relativiste, la pulsation s'écrit alors avec le facteur de Fitzgerald-Lorentz 


(cf. chapitr tivité R } 


- 48 
vin 


a, 


Nous voyons alors qu'il faut ajuster la pulsation du champ électrique à la pulsation de rotation lorsque la 
vitesse augmente: l'accélérateur est maintenant un "synchrocyclotron". 


Pour résoudre le problème de l'augmentation du rayon, nous utilisons alors un "synchrotron" constitué 
d'un tube à vide unique comportant de sections droites contenant des cavités accélératrices et des sections 
courbes équipées d'aimants créant à chaque instant le champ magnétique adapté à la vitesse des particules. 
Cette technique, dont il est facile de parler mais très difficile à mettre en pratique, est la plus utilisée de 
nos jours. Le LHC du CERN fait partie de la famille des synchrotrons 


À partir de cette relation, il est inversement aisé d'avoir l'énergie cinétique de la particule: 


1 La. ÿ 
2 
E, - 570 =jn(£s :) = 


C'est sur la base de cette relation que fonctionnent les "spectromètres de masse de Dempster". C'est en 
utilisant cette technique que les chercheurs ont découvert dans les années 1920 que les atomes d'un même 
élément chimique n'ont pas nécessairement la même masse. Les différentes variétés d'atomes d'un même 
élément chimique, variétés qui diffèrent par leur masse, sont les isotopes (cf. 


j 


Le rayon de Larmor correspond à la distance la plus grande que peut parcourir une particule dans la 
direction transverse avant d'être déviée de sa trajectoire. Cela correspond donc à une sorte de distance de 
piégeage. À moins de recevoir de l'énergie cinétique supplémentaire, une particule chargée est ainsi 
piégée dans un champ magnétique. 


Il est intéressant de noter que plus l'énergie cinétique transverse d'une particule est élevée (grande masse 
ou grande vitesse transverse) et plus le rayon de Larmor est grand. Inversement, plus le champ 
magnétique est élevé et plus ce rayon est petit. 


Nous reviendrons sur ces notions dans le chapitre d'Électrodynamique, ou après avoir étudié les équations 
de Maxwell, nous ferons quelques développements pour les accélérateurs de type Bétatron. 
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Remarque: Le confinement du plasma dans un tokamak est basé sur cette propriété qu'ont les 
particules chargées de décrire une trajectoire en hélice autour d'une ligne de champ magnétique. D'où 
l'intérêt d'utiliser un tore. 


4.3. ÉNERGIE D'UN DIPOLE MAGNÉTIQUE 


Grâce au fait que nous ayons maintenant les unités du champ magnétique et celles de la constante de 
perméabilité magnétique, nous allons pouvoir déterminer par l'analyse dimensionnelle et par l'intuition 
l'énergie total d'un dipole magnétique statique (donc orienté!) ce qui va nous être très utile pour la théorie 
du paramagnétisme. Considérons pour cela un aimant rigide sous forme de cylindre de longueur L et de 
rayon négligeable pouvant être considéré comme un dipôle Nord/Sud (un "aimant droit") plongé dans un 
champ magnétique constant et homogène dans le plan perpendiculaire à l'axe de rotation du dipôle: 


es 


B 


Figure: 36.12 - Dipôle simple 


L'expérience montre que lorsque le dipôle est colinéaire avec le champ magnétique, celui-ci ne bouge 
plus. Il s'ensuit que le force sur une des extrémités dépend de façon proportionnelle au sinus de l'angle et 
du champ magnétique tel que: 


FœËBsing (6.158) 
Au niveau des unités, cela donne donc pour l'instant: 
Leg ms? Je Leg "I A" | (36.159) 
Il nous faudrait donc nous débarrasser des ampères en faisant déjà au minimum intervenir ce qui 


caractérise une dipôle magnétique et que nous avons déjà déterminé plus: son moment magnétique {4 ! 
Donc les unités sont pour rappel: 
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[4 mr? ] (36.160) 


Il semble alors assez naturel d'écrire pour aller un peu plus loin: 
FoœyBsing (26.161) 
Ce qui donne maintenant au niveau des unités: 
Leg ms? |] = E 2. m | (36.162) 


Nous avons alors une unité de longueur en trop. Il semble alors assez naturel d'introduire la longueur du 
dipôle tel que (la force devant logiquement être égale en tout point du dipôle donc il n'y a aucune raison 
d'introduire ici la moitié de la longueur!): 


F= 4 sin 9 = À Esin 6 (36.163) 


Maintenant pour en revenir à l'énergie du dipôle magnétique, nous considérons que celle-ci est nulle 
lorsque le dipôle est initialement dans une position perpendiculaire à celle du champ magnétique. En 
utilisant l'approximation habituelle comme quoi un déplacement infinitésimal d'une des deux extrémités 
est donné par: 


di = =de (36.164) 


Ainsi, le travail (énergie) élémentaire pour faire tourner le dipôle sera (nous multiplions par deux car il 
faut sommer les deux forces qui agissent sur chacun des pôles) en notant B la norme du champ 
magnétique: 


dE = 24 an e|zae- MB sin 848 (26.165) 


où nous voyons que la longueur du dipôle n'intervient plus. En réalité il ne faut pas oublier que c'est ans le 
moment magnétique dipolaire {; que nous avons la surface équivalente du dipole. 


Il vient alors par intégration pour un angle final donné: 


8 
E= 8 | inW0=-Bcos@f, =-jBcos8  (a6.166) 
#/2 


Soit: 


E=-jÿ08B]| (36.167) 
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Voyons maintenant un résultat classique et scolaire que nous pouvons obtenir de ce résultat et que nous 
retrouverons lors de notre étude du spin dans le chapitre de Physique Quantique Ondulatoire. 


Nous avons donc démontré plus haut qu'une particule chargée est déviée par une force donnée par la 
relation de la loi de Lorentz: 


F=gÿxE (56.168) 


Il s'ensuit que si le champ a seulement une composante constante en Z et la vitesse une composante 
seulement en X, cela va provoquer un mouvement hélicoïdal dans le plan perpendiculaire au champ 
comme nous l'avons déjà démontré plus haut lors de notre étude du rayon de Larmor. 


Considérons maintenant une particule chargé lancée à vitesse uniforme selon un axe X entre deux pôles 
d'aimants opposés qui génèrent un champ magnétique vertical hétérogène et intéressons-nous uniquement 
à la déflexion en Z de la trajectoire de la particule. 


Du point de vue de l'axe Z la particule peut être considérée comme en mouvement rectiligne 
uniformément accéléré (cf. chapitre de Mécanique Classique): 


l 
Z = 29 +W zé Hat (36.169) 


Puisque la position initiale en Z de la particule ce situe à mi-distance entre les deux pôles et que sa vitesse 
initiale en Z est nulle: 


Zn =0 
Vo,z = OÙ 


(36.170) 
Nous avons alors: 
Puisque le champ magnétique ne travaille pas et que cela implique que l'énergie cinétique reste constante, 


nous pouvons écrire que le temps est simplement le rapport de la distance parcoure par la particule sur le 
module de sa vitesse: 


2 2 
£ 1 2 Î 1 21 # CAT 
«(5 = Sarl EE à | = (36.172) 


Rappelons que nous venons de démontrer plus haut que l'énergie potentielle d'un dipôle magnétique était 
dans un champ constant et homogène: 


E=-jÿ08Ë (36173) 
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Il vient alors dans notre cas que: 


E=-,8, (86.174) 


Et comme nous pouvons associer une force à une énergie potentielle, il vient en supposant que le moment 
magnétique dipolaire reste constante selon Z et que le champ magnétique est quand même un peu 
inhomogène (vive le mélange des hypothèses. mais on fait de l'ingénierie physique ici!): 


0E 08 
EF =-— 2j, —==m.a (36175) 


(24 (5/4 


Et donc: 


_mÉ  _mb [# 88, | _ rl 8, 
|4E, * 4E ÙÜm &) 4ÆE & 
Donc nous voyons dans tout les cas que z peut prendre un spectre de valeur continu qui dépend du 
moment magnétique dipolaire de la particulaire. Or, comme nous le verrons dans le chapitre de Physique 
Quantique Ondulatoire lors de notre étude des opérateurs quantiques du moment cinétique orbital et de 
spin qu'un expérience dite de "Stern-Gerlach" a montré que tel n'était pas le cas pour des particules ou 
certains atomes pour lesquel la valeur z est clairement discrete, ce que la physique classique semble 
incapable d'expliquer. 


5. MODÈLE DE LANGEVIN DU DIAMAGNÉTISME 


Le but de ce modèle est de rendre compte d'un magnétisme négatif qui s'oppose donc à l'excitation 
magnétique. Ce modèle est grossier par rapport au modèle quantique maïs il est intéressant pour deux 
raisons majeures: la première c'est que cela donne déjà de quoi débuter au lecteur qui n'est pas encore 
familier avec la théorique quantique, la deuxième étant que c'est un modèle formateur (dans le sens 
scolaire du terme) car il montre comment des bricolages et approximations successives peuvent amener à 
quelque chose de relativement acceptable sur le point de vue pratique. 


Remarque: Cette théorie a bien sa place dans le chapitre de Magnétostatique car le champ d'excitation 
utilisé dans le modèle est supposé constant! 


Pour cela, nous considérerons le modèle classique de Langevin (le modèle quantique donnant le même 
résultat) où l'électron est considéré comme parcourant une orbite circulaire r et est alors assimilable à un 


courant électrique dans une boucle produisant une force électromotrice (cf. chapitre d'Électrocinétique): 
ab diB.S) d\ Ho AS) dH 2 dH 
ES ——_—CS —— = Hg — = QT — (36177) 
dt dt dé dt dé 


que nous pouvons assimiler à un champ électromoteur tel que (cf. chapitre d'Électrocinétique): 
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db diB. Si d\ Ho AS ç 44 2 dH 
E= —— = — —————— = <— — = — jh 77 — ne 
dt dt dt #0 dt #0 qu EP 
Il vient alors: 
or AH 
= (36.179) 
dé ce 


Nous avons en notant ##, la masse au repos de l'électron et 42 sa charge électrique: 


gsm ML io) 
£ 


d'où: 


Av=-de/07 jy _ _e07 # - Ho =" ;; (36.181) 
2m 2m = Me 


L'application d'une excitation magnétique extérieure aura pour effet de changer le moment magnétique 
dipolaire {# d'une quantité Àj4. Or, nous avons démontré plus haut que le moment magnétique dipolaire 
était donné par: 


qe 2 
= —r 
# 


ä v 

_f,2—- LAPS (36.182) 
2 

Il vient alors pour l'électron: 


(36.183) 


Â = — = 
ñ d 2 dr, 


2 2 
tr a. ver y) : 


Ensuite, l'idée très astucieuse et grossière (dans le sens approximatif du terme par rapport à l'expérience et 
au modèle quantique élaboré bien des années plus tard) est de prendre en considération le fait que 
l'électron sous forme classique peut être considéré comme un objet ponctuel pouvant se mouvoir dans 
toute une sphère de rayon R donné dans le cas d'un atome monoélectronique et non pas seulement dans un 
plan circulaire de rayon r perpendiculaire à la direction du champ d'excitation magnétique. 


Dans ce cas de figure, nous avons alors bien évidemment: 


x2+y2 +72 =R2 (36.184) 
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et nous allons considérer que les trois coordonnées sont des variables aléatoires indépendantes et 
identiquement distribuées (donc déjà là le modèle théorique est mis à mal mais c'est déjà mieux que 
rien). Dès lors, il vient que leur espérance est égale tel que: 


El x a +2?|=ÆElR°| (36.185) 


En utilisant la propriété de linéarité de l'espérance (cf. chapitre de Statistiques) et la notation à la 


physicien, cela s'écrit alors: 
EHEHE)E) cn 


et comme les coordonnées sont considérées commes des variables aléatoires identiquement distribuées, 
nous avons aussi: 


Il s'ensuit immédiatement que: 


fa 


ee os 


Et donc si nous nous intéressons uniquement au rayon moyen du disque contenant toutes les orbites 
perpendiculaires à la direction du champ d'excitation magnétique dirigé selon l'axe Z, il vient alors: 


(r + (y? ) = LR } (36.189) 


Donc au final pour un électron dans toutes les orbites possibles d'une sphère limitée: 


{A }= am}, = cuir), _ _ae (e }, (36.190) 


4 Ar, 6m 


où (R ) peut être calculé explicitement avec le modèle quantique (des fonctions d'onde pour être plus 
précis!). 


Pour un atome contenant Z électrons, nous ferons l'hypothèse grossière qu'une simple somme des effets 
est valable.….: 


du (R) > HA S 1x2 (36.191) 


VA 
Ag }= > - 
4) 6m, Em, = 


i=1 
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D'un point de vue macroscopique, le nombre d'atomes contenus dans une unité de volume sera le rapport 
de la masse volumique du matériau divisé par la masse atomique de l'élément considéré multiplié par le 
nombre d'Avogadro: 


8 
R=N4a— (36192) 
1 4 


Il vient alors par unité de volume: 


(A }= RES (pe }= HER SR } =-H Ya (86.193) 


€  j=1 6e i=] 


et c'est ce résultat qui est assimilé à la susceptibilité magnétique tel qu'on l'écrit sous la forme de la 
"relation de la susceptibilité diamagnétique de Langevin": 


Au niveau des unités, nous avons bien: 


da = 


Ca Ke Re 7 EEE 


[te] 
{Le 410 


C'est donc bien un coefficient sans unités. 


et c'est parce que cette valeur est négative que l'on assimile ce modèle au diamagnétisme (par définition). 
Le lecteur remarquera que si l'excitation magnétique est nulle, la susceptibilité l'est aussi. ce qui est un 
minimum attendu du modèle théorique. Par contre celui ne dépend pas de la température (l'influence de 
celle-ci est de toute façon presque négligeable). 


L'accord expérience/théorie est excellent pour les gaz nombes (à symétrique sphérique) de l'ordre de plus 
ou moins 10% d'erreur. Pour les éléments non sphériques l'erreur atteint souvent les 50% par rapport à la 
l'expérience. 


6. MODÈLE DE LANGE VIN DU PARAMAGNÉTISME 


Langevin tenta (avec plus ou moins de succès là aussi) d'expliquer le paramagnétisme avec les mêmes 
idées sous-jacentes mais toutefois en devant opter pour une approche mathématique totalement différente 
pour s'assurer d'un résultat final positif... (bricolage quand tu nous tiens). Ce que Langevin savait aussi 
c'est que le paramagnétisme dépendait fortement de la température selon les études expérimentales des 
matériaux ferromagnétiques, il fallait donc choisir une approche faisant ressortir la température et à 
l'époque il n'y avait pas 10'000 façons de faire cela! Il s'ensuit que ce modèle ouvre aussi la porte à la 
théorie du ferromagnétisme! 
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Comme point de départ à l'époque, on prenait naturellement la distribution de (Maxwell-)Boltzmann 
démontrée dans le chapitre de Mécanique Statistique qui décrit pour rappel la distribution des particules 
discernables qui n'interagissent pas avec aucune contrainte sur le nombre de particules par état... (à 
l'époque de Langevin il n'y avait que ce modèle à disposition.….). 


E 
ET)=expl-—| (36.196) 
JBCE,T) exp =) 


cette dernière écriture faisant, comme nous l'avons vu dans le chapitre de Mécanique Statistique, 
abstraction de la constante de normalisation pour en faire une vraie fonction de densité de probabilité 
(mais nous allons bien évidemment calculer cette constante un peu plus loin). 


Nous avons aussi démontré plus que l'énergie potentielle magnétique d'un dipôle était donnée par: 
E=-fj0B=-j#Bcos8 (36.197) 


Maintenant, rappelons que nous avons démonté dans le chapitre de Formes Géométriques qu'un élément 
de surface d'une sphère était donnée par: 


dS = R° sindd8d$ (6.198) 


Il vient alors (le lecteur peut se référer au schéma du chapitre susmentionné) que pour une couronne de la 
sphère définie par deux plans parallèles dont le milieu contient l'origine de la sphère est alors donné par 
(au besoin nous pouvons refaire un schéma): 


d$ = R? sin 8 2x = R? sin 848 (236.199) 


Pourquoi parlons-nous de cela? Eh bien parce qu'un partie du nombre total de dipôles magnétiques 
compris dans un intervalle d'angle 48 est comme nous le voyons ci-dessus proportionnel à un élément de 
surface puisque: 


48 = _æ (36.200) 


R° sin 8 
Nous avons alors ce nombre qui est donné par (à un facteur constant inconnu près): 


an œ KR? sin 88e ET = KR? sin 848626 (26.201) 


La proportion correspondante (donc c'est aussi une probabilité) par rapport à l'ensemble des angles, pour 
un angle donné, est alors donnée après normalisation par: 
ÆRÈ sin ge/rBc0s0 fkT 4 Bcos8 /kT 
PE) = 7 
KR? sin 964806 /RT 9 


sin 8e 


(36.202) 


——, 4 
_—, à 


dé #4Bcos8 /kT 48 


o 
o 
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Nous avons vu lors de notre étude du moment dipolaire magnétique que Æ# contribue donc au champ 
magnétique. Si nous avons une densité volumique de n dipôles magnétiques, nous aurons alors une 
contribution de l'ordre de xjÿ s'ils sont tous orientés dans la même direction. Mais si nous projetons le 


vecteur du moment magnétique sur la direction du champ magnétique, la contribution des dipôles s'écrira 
alors: 


n£ÿ CoS® (36.203) 


mais comme il y en a qui sont dans de nombreux directions différentes et faisons des angles divers et 
variés avec le champ, il nous faut alors prendre la moyenne telle que la contribution au champ magnétique 
soit proportionnelle à: 


# jf fc 08 8) (36.204) 


Et en utilisant simplement les propriétés des fonctions de densité statistiques, l'espérance de la 
contribution est alors donnée par: 


. x . 4,Bcos8 fkT 
, - sin de"? 

n {4 (cos 8} = n{f | cos Op(8jd8 = n{i | COS 0 ——û8 (36.205) 
; 0 [ sin dot4Bcos8fRT à 9 


et comme le dénominateur est juste une constante de normalisation, nous pouvons le sortir de la première 
intégrale: 


LÉ 
lcos sin geP 06 RT y 
0 


n 44 {cos 8} = 44 (36.206) 


sa deitE cossfkT 39 


—, à 


o 


Pour intégrer, faisons la petite simplification d'écriture: 


Cela nous donne: 


LÉ 
| cos 8sin CAT 
(l 


# £4 {cos 8}= #£iÿ (36.208) 


——, 


sin de” 958 8 


o 


et posons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


x=cos8 (36.209) 


Nous avons alors: 


dx . dx 
— =-sin9—=489-- 
48 ing 210 
Il vient alors: 
1 
| xe*ax 
n 44 6x} = ni4 À — (36.211) 
Î e**dx 


1 


La primitive au numérateur nous est connue car elle fait partie des primitives usuelles démontrées en 
détail dans le chapitre de Calcul Différentiel Et Intégral! L'intégrale au dénominateur est elle triviale: 


nj4 (x)= #44 ZT = AH = 7 L 
e ? —e 
Er dl 
F +1 
l , (36.212) 
ARMES el +e lg) 4er 
—_ = y 
RÉ ee? ##4 ue? 


La fonction: 
1 
L(yi= coth nu (36.213) 


est souvent appelée "fonction de Langevin" avec pour rappel: 


4 B 
=—— (36.214 
L LT ( ) 
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Figure: 36.13 - Tracé de la fonction de Langevin avec MapleV 4.00b 


La fonction de Langevin vaut 0 quand son paramètre vaut O et tend vers 1 quand son paramètre tend vers 
l'infini. Donc le système finit par saturer quand le champ magnétique augmente, ce qui correspond bien au 
comportement expérimental des matériaux paramagnétiques. Par contre l'augmentation de la température 
fait diminuer fait tendre donc la fonction de Langevin vers 0 et a pour effet d'annuler l'alignement des 
dipôles. 


Pour de petites valeurs du paramètre, la fonction peut être considérée comme linéaire comme nous le 
voyons sur la tracé ci-dessus. 


Pour simplifier l'expression, nous allons en calculer l'approximation de Taylor de la cotangente 
hyperbolique en utilisant détaillée dans le chapitre de Suites Et Séries lorsque l'argument de cotangente 
hyperbolique est pour rappel strictement inférieur à 1 en valeur absolue: 


coth(y} = Le (36.215) 
3 
Nous avons alors: 
y _HB 
Liyiz = —— 36.216) 
F = F ( 


n44 (x) = Ll(y) eng es ee 


Nous voyons que le facteur: 


[Tr #9 
3kT 
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(36.218) 


est sans dimensions. Effectivement: 


perf nf 8 45] Le nt at] fé] 


CCR CR 2 Li] 


Nous pouvons donc considérer qu'il s'agit de la susceptilité paramagnétique et noter la "relation de la 
susceptibilité paramagnétique de Langevin":: 


(36.220) 


plus connue sour le nom de "loi de Curie" et qui montre que la susceptibilité magnétique est inversement 
proportionnelle à la température (mais bon évidemment cette loi devient fausse aux basses températures et 
il faut alors dériver empirique la loi de Curie-Weiss). 
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Notes personnelles: 
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37. ÉLECTRODYNAMIQUE 


N allons dans ce chapitre dégager un ensemble d'équations qui peuvent résumer à elles seules 


l'ensemble de nos connaissances sur l'électrostatique et la magnétostatique. Ces équations, au nombre de 
quatre, se nomment "équations de Maxwell-Heaviside" (dénomination que nous abrégerons par abus de 
langage comme de nombreux autres ouvrages "équations de Maxwell") et vont nous permettre d'aborder 


la branche de la physique appelée "électrodynamique" et donc des ondes électromagnétiques. 


L'électrodynamique est un pilier de la révolution électronique! Sans cette théorie: pas de radio, pas de 
téléphones ou téléphones portables, pas d'ordinateurs, pas de satellites, pas d'électroménager, pas de 
moteur électrique, bref nous serions encore à l'état technologique de la fin du 19ème siècle. 


Remarque: Il est très important de bien comprendre ce qui va suivre! Certains des développements 
seront réutilisés dans les chapitres de Relativité Restreinte, de Physique Quantique Des Champs, etc. 
Par ailleurs, il faudrait que le lecteur lise en parallèle le chapitre de Relativité Restreinte pour mieux 
comprendre les tenants et aboutissants de certains résultats et la provenance de quelques outils 
mathématiques. 


Nous supposerons avant de nous attaquer aux modèles mathématiques que tout un chacun admet en ce 
début de 3ème millénaire que les rayons gamma, les ondes radio, les micro-ondes, la lumière visible (et 
non visible) sont des ondes électromagnétiques (E.M.) de fréquences différentes: 


kHz = kilohertz = 10* Hz 
GHz = gigahertz = 10°Hz 
THz  =térahertz = 102Hz 
PHz = petahertz = 10**Hz 
EHz = exahertz = 10#Hz 
Fréquences 
9 kHz 1 GHz 300 GHz 3 THz 30 PHz 30 EHz 
Ondes radio Micro-ondes Térahertz À Rayons x | Rayons 
\ Gamma 
Infrarouge Ultraviolet 
405 480 508 530 5771Hz 612 690 750 


rouge orange jaune vert cyan bleu violet 


Spectre visible 


Figure: 37.1 - Spectre électromagnétique (source: Le Figaro.fr) 


Avec un bon résumé des applications courantes des fréquences en ce début de 21ème siècle: 
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gus-marns — cle 


Radio 60 (grandes ondes) 
implants médicaux 1lD 


Radio PO {petites ondes) 


mawes 


= Apparel auttuf—— {) 


mére — PA] 


Radloamateur 
Radioamateur par satellite 


RTE 


Figure: 37.2 - Applications économiques courantes (source: Pour la Science) 


L'attribution des fréquences à l'industrie économique, civile et militaire étant le rôle de l'Union 
Internationale des Télécommunications. 


1. PREMIÈRE ÉQUATION DE MAXWELL 


Soit défini un champ de vecteurs £ dans l'espace. Considérons une surface S fermée dans ce champ. Alors 
à chaque point (x, y, z) appartenant à la surface correspond un vecteur du champ. 
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Dans ce cas le théorème d'Ostrogradsky (cf. chapitre de Calcul Vectoriel) donne: 


De = (piéoxlas = (FIVE WW (371) 
s F 


avec V étant le volume délimité par la surface (dite pour rappel: "surface de Gauss") fermée. 


Remarque: Le théorème d'Ostrogradsky est vérifié à condition qu'il n'existe pas de singularités dans le 
volume V. 


Rappelons avant de continuer que dans le cas du théorème d'Ostrogradsky le vecteur # est 
conventionnellement dirigé vers l'extérieur de la surface. 


Dans le cas particulier d'un champ électrique, nous obtenons des résultats très intéressants. En effet soit 
une charge Q repérée par rapport à un référentiel par le vecteur ro ; 


Alors, nous avons vu dans le chapitre d'Électrostatique qu'en chaque point de l'espace, il existe un champ 
ÆE tel que: 


F7 = K'@ Fr -F e Es 
E(F) F-2[ (F %) (37.2) 
d'où: 
A 
RE EE EE > (37.3) 


[x -ra) tr) GR) E [z=r, 


Comme nous pouvons le constater, le champ Æ possède une singularité en (7%,"m;"#) . Considérons 
une surface de Gauss telle que la charge Q se trouve à l'extérieur de cette surface. À l'intérieur du volume 
V délimité par la surface S le champ Æ ne possède alors pas de singularité. Nous pouvons donc calculer la 
divergence de Æ: 


: K'Q Ep 
TE 
rer tber)+@=R Tr rh to es 
0E ÉrO yen 
(32) = ———E RE 
? Cr) + Oo) +) LG 2) + Or) + rm) P 
8E, K'Q HAE AT 
a 


Lan) + Or) + Gr) LG -r) + Or) + Grp) P 


Il vient alors: 
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= 06 0Ë, 08: G£ 0-3 ON AT + 0-2) +6-n)] 
ant =60 8e Ex, Ep, 08 GK QTEK Q) Grp) +07) + Era) ] 
X & 


=0 
: 

ser Lé Gen) AC PO 

(37.4) 


Donc si nous calculons le flux à travers cette surface nous trouvons (voir le chapitre de Calcul Vectoriel 
pour la description détaillée de l'opérateur del représenté par le symbole Nabla): 


Pr = [9 °2) dd =0 y 


Le flux est nul! 


Dans le cas où la charge Q se trouve à l'intérieur de la surface de Gauss Ÿ « À n'est plus définie en 
(gFm:lx) nous avons alors: 


Pr = [I[(9<2) dV +, 76 


Avec > étant le flux de Æ sur une petite boule B entourant la charge ponctuelle Q. 


Dans ce cas: 
D, = [IT(-2) 0 y 
car la divergence est définie partout sur V-B. Il nous reste donc: 


Py = P, = PE od$ 
ni 


(37.8) 


Mais dans le cas d'une sphère, il est relativement facile de calculer: 


fé o dS 
5 


(37.9) 
Nous avons: 


b, ={f £ 48 ES = E {pas =£E S=4x'r CH £)-£ (37.10) 

5 5 5 AT, r° 
d'où la "première équation de Maxwell" ou "loi de Gauss" pour le champ électrique (ou "théorème de 
Gauss") avec une notation un peu condensée: 


(37.11) 


b, =$£ca$ -[ (VoËar =0'a eVoË-p0 er 
F 


où £2 est la densité de chage exprimée en coulombs par m°. À gauche nous avons donc la forme intégrale 
de l'équation de Maxwell et à droite sa forme différentielle. 
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Cette équation suggère donc que le flux du champ électrique traversant une surface close (d'où le cercle 
sur l'intégrale) est égal, à un facteur dimensionnel près, à la charge totale enfermée dans cette surface. 


Remarque: L'intégrale de la dernière relation est une intégrale curviligne (donc évaluée sur une 
courbe). Dans le domaine de l'électrodynamique les intégrales curvilignes s'appliquent très souvent sur 
des chemins ou surfaces fermées d'où l'indication d'un cercle superposé au symbole de l'intégrale 
portant alors le nom de "circulation du champ de vecteurs". 


Si nous exprimons maintenant cette équation en fonction du potentiel électrique pour lequel nous avons 
démontré dans le chapitre d'Électrostatique que: 


… 


Ê=-V'U=-grad(U) (37.12) 


nous obtenons: 


Nous pouvons noter la relation ci-dessus de façon plus esthétique en utilisant le laplacien scalaire (cf. 
chapitre de Calcul Vectoriel), tel que nous obtenions la relation: 


8 
Acg=-82| (37.14) 
ËQ 


appelée "équation de Maxwell-Poisson". 


2. DEUXIÈME ÉQUATION DE MAXWELL 


Dans le cas particulier d'un champ magnétique, nous obtenons également des résultats très intéressants. 


En effet soit un courant 1 repéré par rapport à un référentiel par le vecteur 7;. Alors en chaque point 7 de 
l'espace, nous avons vu dans le chapitre de Magnétostatique qu'il existe un champ À tel que: 


5 Æ9 fran) 
BF) ———— 
47 F-4[ (37.15) 
d'où: 


1 (z rs) 0-7) 
SE Lfx-n)-l-n)| 6716 
-n) +05) + Gen) ibv-rsl-,(x-rs) 


Bxps= ss 


Comme nous pouvons le constater, le champ 5 possède une singularité en (7%,”5,7). Considérons alors 
une surface de Gauss telle que le courant 1 se trouve à l'extérieur de cette surface. 
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À l'intérieur du volume V délimité par surface S le champ Ë ne possède alors pas de singularité. Nous 
pouvons donc calculer la divergence de 8 (cf. chapitre de Calcul Vectoriel): 


r-n) +0-r) +=)" 
. x=n) ton ten x] 
[x-r3) O6) +(z-r,)Ÿ P 
(37.17) 
D'où: 
+ à 98 
diviB\=VoB = SN IP TS (37.18) 


Si nous calculons le flux à travers cette surface, nous trouvons alors: 
D, = jo erer "0 719 


Le flux est nul! 


Dans le cas où le courant 1 se trouve à l'intérieur de la surface de Gauss Ÿ « À n'est plus défini en 
(rxp"x) nous avons alors: 


D, = IN B)a7 +, 20 


Avec ®, étant le flux de 5 sur une petite boule B' entourant partiellement le conducteur rectiligne 
transportant le courant I. Dans ce cas: 


[IT oB) dV=0 2 
car la divergence est définie partout sur V-B'. Il nous reste donc: 


Pa = Pu= Bo on 
ES 
Mais dans le cas d'une sphère, il est facile de calculer: 


Bo 29 
5 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Nous avons alors la loi de Gauss pour le champ magnétique: 


D, = {PA 0 a$ = dP8 :d8 : cos(g) = 0 
L' # 


(37.24) 
En effet, dans le cas du champ magnétique, 45 et 5 sont perpendiculaires donc: 


IT 
æ= ra cos(@) =0 (37.25) 


Remarque: D'où nous pouvons aussi déduire que Ê1£ ! 


Donc, soit donnée une surface de Gauss dans un champ magnétique, alors le flux du champ magnétique à 
travers cette surface vaut: 


+ _ 


D, =dphod$ = [[[(VoB)ar -08Ve8 =0 
s F 


(37.26) 


relation qui constitue la "deuxième équation de Maxwell". À gauche nous avons donc la forme intégrale 
de l'équation de Maxwell et à droite sa forme différentielle. 


Cette deuxième équation revient donc à dire qu'il n'existe aucun "monopôle magnétique" dans la nature, 
c'est-à-dire, qu'à tout pôle positif, nous devons retrouver un pôle négatif (à partir d'un aimant, les lignes du 
champ ne divergent pas). La deuxième équation vient toutefois rajouter l'idée (démontrée par Dirac) que 
s'il était possible de retrouver un monopôle dans la nature, il serait le point de source du champ 
magnétique. Nous verrons cela un peu plus loin dans le détail. 


3. TROISIÈME ÉQUATION DE MAXWELL 


Nous démontrerons dans le chapitre d'Électrocinétique (car il faut des notions que nous n'avons pas encore 
rencontrées), que la variation du flux du champ magnétique dans le temps à travers une boucle 
conductrice induit une tension dans cette boucle donnée par la “loi de Faraday" ou "loi de Lenz-Faraday": 


db 
L(E) = -—2 
dé 


(37.27) 
et nous avons déjà démontré dans le chapitre d'Électrostatique que: 
AU =-[ÉcdF--[Ear (29 


où la dernière égalité n'est valable que dans le cas particulier si le chemin parcouru est colinéaire au 
champ électrique. 
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Remarque: Nous verrons dans le chapitre d'Électrocinétique qu'il n'est pas tout à fait correct de noter 
le potentiel U comme ci-dessus car au fait, la loi de Faraday exprime la force électromotrice (potentiel 
électromoteur) e et ce potentiel est non conservatif contrairement au potentiel électrostatique de 
Coulomb (pour lequel l'intégrale sur un chemin fermé est nulle comme nous l'avons démontré dans le 
chapitre d'Électrostatique). 


Pour un élément 4} d'un circuit L' il vient: 


le changement de signe étant ici justifié par la loi de Lenz, selon laquelle le courant induit (et le flux 
magnétique qui lui est associé) a une orientation telle qu'il s'oppose à la variation de flux à travers le 
circuit. 


Si nous développons cette relation, en utilisant le théorème de Stokes (cf. chapitre de Calcul Vectoriel) qui 
est pour rappel: 


Prod=|(Vxfiods 30 
r 5 
Nous avons alors: 
vo=-Ê2 2 fEcar = [(9x EF) 48 (37.31) 
dé  : F 
F 5 


Où, comme nous le verrons dans le chapitre d'Électrocinétique, le champ électrique ci-dessus n'est pas le 
simple champ coulombien mais la somme d'un champ coulombien et d'un champ électromoteur (généré 
implicitement par la force de Biot-Savart). 


Nous avons alors: 


Et si l'élément de surface ne bouge pas dans l'espace et que seul le champ magnétique varie dans le temps, 
nous avons alors: 


Soit: 
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((ox8+ À) 45 O (37.34) 


s 


Une solution triviale est alors de dire que: 


SxE+ À 5 (37.35) 
[A 
Nous obtenons alors au final: 
db mL D 
U(f) = -—È = f É cal S VXxE = nu (37.36) 
dé se dé 


Ceci est la "troisième équation de Maxwell" ou "loi de Maxwell-Faraday"' dite parfois encore "loi 
d'induction". À gauche nous avons donc la forme intégrale de l'équation de Maxwell et à droite sa forme 
différentielle. 


La troisième équation affirme donc qu'une variation du champ magnétique produit un champ électrique 
dans une boucle conductrice. Nous disons alors que le terme avec la dérivée partielle du champ 
magnétique est le "terme de couplage magnétique". Cette équation est donc basée sur la théorie de 
Faraday. 


Souvent dans la littérature scientifique, le potentiel U(t) peut être simplement noté par un u minuscule. 


La loi de Faraday de l'induction est typiquement utilisée par de petits appareils portatifs comme le PEG ci- 
dessous (Personal Energy Generator) pour recharger des appareils électroniques portables: 


Figure: 37.3 - Photo d'un PEG (droite) avec un mobile 
3.1. BÊTATRON 


Parmi les nombreux exemples d'application de la troisième loi que nous verrons dans d'autres chapitres du 
site, il y en est un particulièrement sympathique car il fait penser à la physique moderne à grande échelle 
(même si dans la réalité on en est très loin). 
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À l'aide des équations de Maxwell et des relations démontrées dans le chapitre de Magnétostatique, nous 
pouvons faire une petite étude théorique non exhaustive du principe physique à la base d'un des plus 
vieux accélérateurs de particules non-linéaires. 


Une des premières méthodes non-linéaires qui vient à l'esprit consiste à accélérer une particule chargée via 
une induction magnétique. Ce type d'accélérateur est appelé un "bêtatron" (dans l'idée qu'il accélère les 
électrons aussi vite que lors de la radioactivité bêta...) et a été conceptualisé dans les années 1930. 


Le bêtatron est un accélérateur de particules qui consiste à injecter des électrons dans un tore sous vide (en 
blanc sur la photo ci-dessous) soumis à un champ magnétique qui sera considéré ici comme homogène 
entre les deux aimants (en rouges sur la photo ci-dessous) afin d'obtenir des rayonnements X ou gamma 
intenses utiles à certaines activités professionnelles (médecine, analyse de structures, etc.). Cet 
accélérateur est donc limité par l'intensité du champ magnétique qu'il peut produire ou supporter. 


RAR, 


Figure: 37.4 - Photo d'un bêtatron 


Pour cette étude théorique, nous allons d'abord utiliser le résultat démontré dans le chapitre de 
Magnétostatique lorsque nous avons abordé le rayon de Larmor: un électron en mouvement dans un 
champ magnétique aura une trajectoire circulaire qui sera perpendiculaire au champ magnétique. 


Ensuite, nous allons aussi avoir besoin de la troisième équation de Maxwell sous forme d'intégrale: 


ab ne = B 
(y =-—E = fE£Eod SVXxE = se (37.37) 
df£ dé 


qui - pour rappel - dit qu'une variation du champ magnétique produit un champ électrique dans une boucle 
conductrice (ou un mouvement de particules chargées qui peut être assimilé à une boucle conductrice!). 


Nous avons: 


et comme la trajectoire est donc circulaire dans le bêtatron comme nous l'avons démontré lors de notre 
étude du rayon de Larmor dans le chapitre de Magnétostatique, nous avons: 
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EL dt = [|Ælcos aa 
r F 


(37.39) 


Or comme le champ électrique est tangent à la trajectoire circulaire des électrons et que ces derniers vont 
dans le sens inverse de ce même champ (sens qui est donc constant en tout point de la trajectoire), nous 
avons puisque les électrons parcourent des cercles: 


{É oaï = [|Efcos act =HEljcos(mar-- Ella =-27R;|E| : 
r r 


Maïs nous avons aussi: 
d + ,$ à 1 = 
< ds ca | =-78? ©|F| 
Il vient alors: 
278, VE --78? SE] 
d'où: 


E B| (3743) 

1-2 21 

Nous souhaiterions calculer l'énergie cinétique que la particule chargée négativement acquiert après 
plusieurs tours. Celle-ci est alors égale au travail fourni par le champ électrique pour déplacer la charge 


sur la trajectoire circulaire (pour rappel le champ magnétique ne "travaille" pas). 


Comme nous l'avons montré dans le chapitre d'Électrostatique, nous avons dans le long d'un ligne de 
champ champ électrique (constant): 


AW =gEÆE.Ax (3742) 


Dès lors il vient lorsque la charge parcoure N fois la circonférence du bêtatron: 


AE =AW-=gE.Ax= Nr R,.q: lE]= 2x-R;-q. Al. 


2 dt n 
= art EE] 


Exemple: 


Considérons un champ magnétique sinusoïdal d'amplitude Æ; = 1 [T7] à une fréquence de f = 50 [ÆZ], 
soit une période T de 20 [ms]. Ce qui signifie qu'en 5 [ms] le champ magnétique passe d'un maximum à 
une valeur nulle. Considérons que nous avons un bêtatron avec une trajectoire circulaire de 1 [m] et que 
l'électron peut rester environ 480'000 tours sur cette trajectoire avec ce rayon précis sans trop dévier (soit 
l'équivalent d'à peu près 3'000 [km] parcourus). L'électron est injecté avec une énergie de 2 [MeV] dans le 
tore sous vide (ce qui est déjà très proche de la vitesse de la lumière!). 
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Calculons d'abord le rayon initial pour la trajectoire selon le rayon de Larmor relativiste. Pour cela, il nous 
faut d'abord la vitesse correspondant à l'énergie de 2 [MeV]: 


l 
E, = mc? — mpc° L (y — Dre? = | ———— -| mac” (37.46) 


5 


2 


Après quelques opérations algébriques élémentaires, nous trouvons: 
vn = 299'407'5092=9987%.e (2747) 


Dès lors le rayon de Larmor initial vaut: 


Mg VW 
R, = re = 0.007 [we] (27.48) 
#0 


Nous avons alors pendant toute la durée de l'accélération qui va amener l'électron à un rayon de Larmor de 
1 [m] un gain d'énergie cinétique de: 


(0) 


7" =4,82548632.10 11 [7] (749) 
(0.005 — 0} 


AE, = =N4R? 2. 3480 000. 1.6.1071.12. 


Ce qui correspond en électrons-volts à: 


4.82548632.10711 


ÀE 
La l0 


£ 


Ilè 


æ 300 [Me] (37:50) 


soit l'énergie qui était mesurée expérimentalement à l'époque. Cette énergie correspond aussi à une vitesse 
qui est très très proche de celle de la lumière. Ainsi, avec le même calcul que précédemment, nous 
obtenons: 


vo = 299"407"50929987%%.c (37:51) 


vitesse atteinte en quelques centièmes de seconde seulement! 


Remarque: Donc dans la réalité, la force centrifuge augmente au fur et à mesure que l'électron acquiert 
de l'énergie cinétique (et donc de la vitesse). Il faut compenser cette force en augmentant la force de 
Lorentz d'autant. 


4. QUATRIÈME ÉQUATION DE MAXWELL 


La 4ème équation de Maxwell est probablement la plus importante. Elle est une généralisation de la loi 
d'Ampère qui a déjà été présentée dans le chapitre de Magnétostatique et pour laquelle nous avions obtenu 


la circulation €’, du champ magnétique: 
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C3 Ed HE 75 


La troisième équation de Maxwell nous dit que la variation d'un champ magnétique donne lieu à un 
champ électrique. Nous pouvons donc supposer que la réciproque est vraie. 


Un endroit typique où l'on peut observer une variation d'un champ électrique est par exemple le 
condensateur (cf. chapitre d'Électrocinétique). 


Nous savons que: 


et que le champ électrique entre deux plans parallèles, de surface S, portant des charges (, = -Q , 
uniformément distribuées est donné par (cf. chapitre d'Électrostatique): 


E(x) = Es (37.54) 
Eû E' S 


où æ est la densité de charge surfacique. 


Ce résultat est indépendant de la distance D entre les plans. La première équation de Maxwell donne: 


9'D 
ES 


(37.55) 


à 
AU = RE = peu =|AU| = 
ES 


La capacité d'un condensateur étant définie par (cf. chapitre d'Électrostatique): 


Donc il vient: 


= = = —- (37.58) 
dt dé dt 


et en utilisant le fait que le potentiel électrostatique est le champ électrique multipliée par une distance qui 
sera prise dans le cas présence comme la distance D entre les deux plans du condensateur, nous avons: 


d(D'E) _ c.p.Æ - io (37.59) 
d£ dt d£ 


I=C. 
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Comme le champ électrique est variable, il est souvent d'usage de mettre un i minuscule pour le courrant 
variable (c'est une tradition que nous retrovuerons dans le chapitre d'Électrocinétique) et comme entre les 
deux plaques du condensateur il n'y a que du vide, nous parlons alors de "courant de déplacement", raison 
pour laquelle cette dernière relation est souvent notée sous la forme suivante: 


dE 
In =in = MS— (37.60) 
D =D = de 


En exprimant l'expression ci-dessus en utilisant la densité superficielle de courant, il vient: 


… 


f. —Ë, dE (37.61) 
JD ur 27. 


Si le champ électrique n'est pas homogène dans l'espace et dépend donc des coordonnées spatiales, nous 
devrons utiliser les dérivées partielles tel que: 


Îp =E, ë (37.62) 
D = ——— 9/.04 
lœ 


Le courant de déplacement engendre un champ magnétique calculable au moyen de la loi d'Ampère: 
_— . dË = d = = 
(PS Sc ={Hb'i "4 [fé Ms Fou 77 (37.63) 
Ê £ 


Dans tout phénomène où nous observons un déplacement de charge, nous pouvons supposer qu'il y a 
création d'un courant de déplacement qui se superpose au courant de conduction à cause des effets 
capacitifs dans la matière. Nous écrivons dès lors: 


 —  — d us = 
CB "$£ 4? =Ho' le Ho (1+2) A [fy °45 +4 07 (37.64) 


où nous avons (rappel du chapitre d'Électrostatique et de Magnétostatique): 
E=&'Eé, et H=/o' A, (37.65) 


D'autre part, le théorème de Stokes fournit que: 


d'où: 


dt 


et nous en ressortons finalement que: 


fBodi = JodŸ+y eZ Éd ŸxA =3+e 8 (37.68) 
J di & 
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Ceci est la "quatrième équation de Maxwell" ou "équation de Maxwell-Ampère". À gauche nous avons 
donc la forme intégrale de l'équation de Maxwell et à droite sa forme différentielle. 


Explication: La quatrième et dernière équation de Maxwell associe la création d'un champ magnétique à 
toute variation d'un champ électrique et/ou à la présence d'un courant électrique (la présence d'un courant 
électrique étant une condition suffisante mais pas nécessaire au vu du deuxième terme). Nous disons alors 
que le terme avec le dérivée partielle du champ électrique est le "terme de couplage électrique". 


Résumé: 


Nous avons donc les quatre équations de Maxwell suivantes appelées "formes locales des équations de 
Maxwell" sous forme de différentielles (lorsque les intégrales ne sont pas indiquées): 


(37.69) 


Dans le cas où #4,€, “1, c'est-à-dire dans le cas où nous ne travaillons pas dans le vide mais dans la 
matière, nous notons les équations locales de Maxwell sous la forme suivante: 


où D est (rappel) appelé "champ de déplacement" ou encore "induction électrique" et (rappel) À 
"excitation magnétique". 


Remarque: Attention! Æ est une réaction du vide au champ j). Cela s'explique par la constante de 
permittivité du vide mise dans l'intégrale (du moins c'est une façon de voir la chose...). 


Mais dans le vide et dans le cas où nous considérons une absence de charges, nous obtenons: 


Ce résultat est important, car il exprime la propagation possible d'un champ électrique et magnétique et ce 
même en l'absence de sources. Nous utiliserons ces équations pour déterminer les équations d'ondes 
électromagnétiques plus loin. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Remarque: Il est possible d'exprimer les équations de Maxwell sous forme relativiste (la relativité 
restreinte) mais. en réalité, comme nous l'avons déjà fait remarquer, les équations sont inchangées! 
En effet, les équations de Maxwell sont déjà relativistes. Ceci n'a rien d'étonnant, car les vecteurs des 
champs électrique et magnétique, les photons (cf. chapitre de Physique Quantique Des Champs), se 
propagent à la vitesse de la lumière. À cette vitesse, la relativité est reine et une théorie correcte ne 
pouvait être que relativiste. On peut toutefois exprimer les équations à l'aide des notations 
mathématiques tensorielles (voir plus loin notre démonstration du tenseur du champ 
électromagnétique). Sous cette forme les quatre équations deviennent incroyablement simples et 
compactes (une seule équation extrêmement courte). Formulés de cette manière, les champs 
électriques et magnétiques s'écrivent comme un champ unique appelé bien évidemment "champ 
électromagnétique". C'est un champ tensoriel comme nous le verrons plus loin. 


Signalons enfin aussi la forme intégrale des quatre équations de Maxwell dans le vide que nous avons 
obtenus: 


$ Bei - aff3 eaÿ + re ff EcaS 


, din de b, don le 
$ 
r 


4.1. MONOPÔLES MAGNÉTIQUES 


Remarquons qu'en optant pour le système de mesure naturel où & = 1, nous avons alors pour les équations 
de Maxwell dans le vide: 


puisque comme nous le démontrerons plus loin, dans le vide: 
_ 1 7 
€ 


Alors la transformation: 


ramène la seconde paire d'équations précédentes à la première! Cette symétrie des équations de Maxwell 
est appelée "dualité" et c'est un indice qui tend à montrer que les champs électrique et magnétique ne sont 
que les parties unifiées d'un tout. 


De plus, si nous introduisons le champ complexe suivant: 


E=ÆË+iB (2776) 


la dualité (en prenant la partie réelle seulement), s'écrit alors: 
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la paire d'équations de Maxwell indiquée précédemment se réduit alors à (nous utilisons la propriété de 
linéarité du produit vectoriel) une seule paire d'équations dont il ne faut pas oublier de ne prendre que la 
partie réelle: 


Cependant, cette symétrie ne s'étend pas aux équations de Maxwell avec sources exprimées dans le 
système naturel par: 


(37.79) 


VoB=0 


car cela se traduirait au mieux (n'oubliez pas de ne prendre que les coefficients réels pour le champ 
intéressé): 


es 


VoË=-p, Pre [#5] (37.80) 


mais une fois sur deux cela ne marche pas (faites la substitution de £ vous verrez que vous obtenez 
toujours une des équations sur la paire qui est conforme et l'autre pas). L'astuce consiste alors à séparer les 
deux densités en leur partie imaginaire et réelle respectives: 


Ep 7 Pa TE Ou 
+ 4 à 7 (G780 
JT Je TT Jo 


Nous obtenons alors (toujours sans oublier de ne prendre les parties réelles et sans oublier que nous 
sommes en unités naturelles): 


il suffit alors de poser &, = À, = 0. Ces équations sont certes, charmantes mais leur généralisation 
n'apporte rien de nouveau cependant car aucune charge magnétique exprimée par: 


appelée "monopôle magnétique" n'a été observée à ce jour. Dans un cadre expérimental, nous disons alors 
que £,.{ sont réels tel que nous ayons bien: 
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Ô (37.84) 


P 
Il 
x 
Il 


Suite à la proposition d'un lecteur, indiquons que Dirac aurait proposé une autre manière beaucoup plus 
élégante pour compléter empiriquement les 4 équations de Maxwell avec sources démontrées plus haut: 


VoË= VoB= yo, 
E 2Ë (37.86) 
Vite Pipe 
Fe” HJm Je TA à 


Alors évidemment quand l'on voit cela on se demande qu'elle est l'argumentation qui permet d'arriver à 
supposer que la symétrie doit être ainsi écrite?! En réalité c'est très simple et très astucieux (comme 
souvent...). Effectivement, si nous prenons la divergence du rotationnel du champ électrique, nous avons 
de par le fait que (cf. chapitre de Calcul Vectoriel) celle-ci est toujours nulle quelle que soit la fonction 
considérée: 


le résultat suivant: 


Il en découle alors: 


se Vo, |=0 (7.89) 
— ——— — /{| o | = 2/. 
à À JÎm 
et donc: 
En 05, =0 (37.90) 
[A 


Soit après simplification et réarrangement: 
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Donc c'est le fait de retomber sur une équation de continuité (de forme identique à l'équation de continuité 
en thermodynamique, en mécanique des fluides, de celle du champ électrique, de probabilité en 
mécanique quantique, etc.) qui aurait donc amené Dirac à compléter les 4 équations de Maxwell que nous 
avons écrites juste plus haut. 


5. ÉQUATION DE CONSERVATION DE LA CHARGE 


Nous avons donc démontré les quatre équations de Maxwell qui sont les fondements de 
l'électrodynamique classique. 


Les équations de Maxwell peuvent être divisées en deux groupes: 


- des "équations sans source": 


Tof=0eVxé=-02 (3792 
dé 
- des "équations avec sources" (dans le vide): 
+ à _P + à - 14E 
Vo == @tYxB= i+—— (379) 
& EoJ e? F7 


Dérivant la première équation avec sources par rapport au temps: 


d(VoË) : 4E 14 
a(Veë) = Ad = 1%Pe (37.94) 
dt dé & dt 
et prenant la divergence de la seconde, nous obtenons: 
5 (5 s + 14 4 
Vo[VXB|l=gVo;+ Vo (3795) 
( ) # J ec? dé 


La divergence d'un rotationnel est toujours nulle comme nous l'avons démontré dans le chapitre de Calcul 
Vectoriel et donc la dernière expression est nulle. Mais étant donné qu'un lecteur nous l'a demandé, nous 
détaillons ce résultat de façon plus explicite en simplifiant un peu: 


+ + 1 
VoVIX{(VoB]= Vo i+ © (3796) 
(Fev) (Fe) 4e Le 
OI, Yo Ë = 0 et donc: 
= +. 1 
Voÿ+t———©=0 (3797 
S, c'e ôt | 


Après simplification via l'introduction des unités naturelles, nous obtenons: 


Voi + Pb 26) 790 


dé 
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qui est appelée "équation de conservation de la charge" ou "équation de continuité" et qui dit qu'en deux 
instants voisins ++ dt, la variation dQ de la charge contenue dans une surface fermée délimitant un 
système ne peut être attribuée exclusivement qu'à un échange de charges avec l'extérieur. 


Cette équation est très importante, car elle implique lors de l'étude de la relativité restreinte, que la charge 
est une quantité invariante par translation. 


6. THÉORIE DE JAUGES 


Avant de commencer à lire ce sous-chapitre, il est de première importance pour le lecteur d'aller faire un 
petit tour dans la section d'Algèbre du site, dans laquelle se trouve un chapitre de Calcul Vectoriel où nous 
faisons un rappel des différents opérateurs vectoriels indispensables en physique et de leurs propriétés. 


Ce qui va suivre est très important car outre le fait que nous allons faire apparaître naturellement un 
nouveau champ (le potentiel-vecteur) qui est indispensable dans certaines équations de la physique 
quantique relativistes (voir chapitre du même nom) nous reprendrons cette démarche de jauges dans le 
chapitre de physique quantique ondulatoire où les conséquences sont beaucoup plus vastes! 


Soit la relation connue: 
VoB=0 (3799) 


Il existe de par les propriétés des opérateurs rotationnel et divergence (cf. chapitre de Calcul Vectoriel) un 
"potentiel vecteur" A(7,f) tel que: 


B=VYx Al (37.100) 


qui satisfait donc (la divergence du rotationnel d'un champ est toujours nulle car il s'agit d'une propriété 
mathématique): 


Vo(V x À) = 0| (37.101) 


Remarque: Le potentiel-vecteur est donc. un potentiel et un vecteur! De même que nous pouvons 
définir un potentiel U dont dérive À, nous pouvons définir un potentiel A(,f) pour le champ $. 
Mais pour des raisons techniques (provenant de l'expression des rotationnels de Æ et de 5 dans les 
équations de Maxwell), le potentiel A(F,f) n'est pas aussi simple que U et ne peut pas s'exprimer 
comme un simple scalaire: il faut utiliser un potentiel-vecteur. 


Si nous portons la relation Ë = x 4 dans l'équation de Maxwell Ÿ x £ = + nous obtenons: 
É 


Nous posons maintenant (la notation F n'a aucun rapport avec la force newtonienne!): 
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=VXFÆ#=0(0] (37103) 


et nous utilisons les propriétés mathématiques des opérateurs rotationnel et gradient pour écrire une 
nouvelle relation (le signe "-" est là par anticipation de ce qui suivra): 


F=-%# (37.104) 


où dès lors: 


Ê=-Vg-—| (37.105) 


où #(r,f) est un "potentiel scalaire". 


Remarques: 


R1. Le champ # semble obéir aux mêmes propriétés que le champ gravitationnel (loi de Newton- 
Poisson) mais ce n'est qu'une curiosité (les unités et les autres propriétés mathématiques n'étant pas 
équivalentes). 


R2. Le lecteur voit sans peine que si le potentiel vecteur est nul, nous retrouvons alors (cf. chapitre 
d'Electrostatique): 


Ê=-$g=-VU (37.106) 


ce qui renforce les hypothèses des développements précédents (et ce n'est pas tout...) 


De plus, les champs Æ et £ restent inchangés si nous effectuons dans les relations précédentes les 
remplacements suivants (les termes s'annulent trivialement): 


… 


pv -9 A 7-34 0w (87.107) 


où # est une fonction arbitraire de > et t. 


Nous appelons une telle transformation un "changement de jauge". La liberté sur le choix des potentiels 
permet de leur imposer une contrainte que nous appelons la "contrainte de Jauge". 


Il existe plusieurs manières de forger cette contrainte parmi lesquelles nous en distinguons deux: 


Ainsi nous utiliserons soit la "jauge de Lorenz" en imposant: 


ou soit la "jauge de Coulomb" en imposant: 
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ŸoA=01| (37.109) 


Remarque: Nous trouvons souvent dans la littérature, la dénomination "jauge de Lorentz" à la place de 
"jauge de Lorenz", car comme nous l'avons déjà démontré dans le chapitre de Relativité Restreinte, la 
jauge de Lorenz est invariante dans les transformations de Lorentz (ce qui constitue un avantage 
certain par rapport à la jauge de Coulomb!). 


Montrons qu'il est toujours possible d'imposer la jauge de Coulomb. Pour cela, étant donnés 4' et $ "il 
suffit de trouver # dans les équations: 


g—v'-9 AA -3+0w (37.110) 


tel que la relation (jauge de Coulomb): 


soit vérifiée. Ainsi, # doit vérifier: 


b 
b 

_ 
(er) 
S 
Ë 
D 


La relation: 


he 


Vo A'=Awl| (37.113) 


La LA 


est appelée "équation de Poisson du potentiel-vecteur". 


De même, pour montrer qu'il est toujours possible d'imposer la condition de Lorenz, il suffit de trouver 
# dans les équations précitées: 


' 2 2 
Pot #44 w+ - PT opt 
c< Cf c* Œ oc c* Œ oc 8 | 
7 | à (37.116) 
PT LL RL A à 
e? êf 2 ar? 


Soit en d'autres termes et de façon plus condensée: 
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Ulyr = — +0 À'- g(F,Ë£) (37.117) 
ec? dé 
où l'opérateur: 
1 4° 
Cl= ——-A| (37.118) 
c? &? 


est par définition appelé le "d'Alembertien" (nous le retrouverons souvent ce terme à partir de maintenant 
aussi bien en électrodynamique qu'en physique quantique) qui est donc aussi invariant par transformation 
Lorentz comme nous le verrons lors de notre étude de la relativité restreinte (cf. chapitre de Relativité 
Restreinte). 


En reportant les équations: 


B=-VxAe E--V6- 4 (37.119) 


dé 
dans les deux autres équations de Maxwell dans le vide: 
+ à _P + + - 14Ë 
VoE=—=e@tyxgp= +—— (37.120) 
& Ho c? êt 


nous obtenons, en faisant apparaître le laplacien d'un champ vectoriel A4 par une des propriétés des 
opérateurs vectoriels rotationnel, gradient et divergence (cf. chapitre de Calcul Vectoriel}: 


Vx(VxÀ) =V(Vo4)-A4 (37.121) 


les relations suivantes: 


la dernière relation étant appelée "jauge arbitraire". 


Pour la jauge de Lorenz, ces deux dernières équations se simplifient en (n'hésitez pas à nous contacter si 
vous ne voyez pas comment): 


que nous appelons "équations d'onde des potentiels électromagnétiques" en analogie avec les équations 
d'onde des champs électrique et magnétique que nous déterminerons plus loin. 


Pour la jauge de Coulomb, les mêmes équations se simplifient en: 
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L (37.124) 


Sachant que c?=1/ 4 nous pouvons aussi écrire les deux équations d'onde des potentiels 
électromagnétiques sous la forme: 


8 
Ü$= — = Hic° Po 


0 (37.125) 


OA - of 


Posons maintenant 4° = #/c (afin d'homogénéiser les unités) tel que nous définissions un "quadrivecteur 
potentiel" qui nous permet d'écrire vectoriellement les deux relations ci-dessus de manière unifiée: 


O4“ = (bic. 43) . (400-405) = 4 (c6,.5) (37.126) 


Remarque: Le fait que le d'Alembertien du quadrivecteur potentiel s'exprime à partir du quadrivecteur 
courant qui est contravariant (cf. chapitre de Relativité Restreinte) nous amène à poser que le 
quadrivecteur potentiel est lui-même contravariant! 


Relation que nous noterons sous une forme condensée de la manière suivante: 


equation (37.127) 


où ;* sera appelé "quadrivecteur courant". 


Remarque: Nous retrouverons ce quadrivecteur lors de notre détermination du tenseur du champ 
électromagnétique plus loin (à la différence que nous serons en unités naturelles mais cela ne change 
pas le fond...). 


Le quadrivecteur potentiel tel que défini nous amène à pouvoir écrire la (quadrivergence) jauge de Lorenz 
en faisant usage de la notation tensorielle: 


3 + 1ô#_ 14 
es TL 4,4, +4,4, +60 ,4 

186 (37.128) 
St AA + 4,4? + A = 44° + 4 A + 4,4? + 4, À = 0 

[es [es 


Ce qui permet finalement d'écrire la jauge de Lorenz sous forme covariante: 


8,4" =0| (37.129) 
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Ils see donc d'une équation de la forme de celle de Klein-Gordon pour une particule de masse nulle (« 
). Donc, nous pouvons dire dans un sens que l'invariance de 
jauge Éeconaenetique est reliée au fait que la masse du photon est nulle! 


: , 1 4 _ : 
Remarque: Il est utile de noter que le fait de poser — à = 4, (avec ou sans les unités naturelles où 
C Gé 


c=1)estune notation qui sera également adoptée lors de notre étude de l'équation de Dirac ( 
) ou encore en physique quantique de champs (mis à part 
qu'il y aura une partie imaginaire). 


Ces notations nous amènent enfin à pouvoir écrire: 
à, (E4') 8. (a) 
0,4" = {90 ,j =0 


Nous obtenons ainsi l'équation de continuité: 


équivalent (sous forme) tensoriel de (voir la démonstration juste plus haut dans le texte): 


Ep | 


Voi+ =0 
1% 


Pour résumer en gros...: 


Un certain nombre d'effets physiques se modélisent, selon les cas, par des champs qui peuvent être 
scalaires, vectoriels, spinoriels ou encore tensoriels que nous appelons donc des jauges. Un certain 
nombre de phénomènes physiques s'avèrent respecter des conditions dites de symétrie, vis-à-vis de ces 
jauges. Cette symétrie s'exprime par ce que nous appelons donc une invariance de jauge. 


Par exemple, le champ qui permet de modéliser le champ électromagnétique est comme nous l'avons vu, 
un champ de quadrivecteurs formé d'un potentiel scalaire # (dont le gradient est le champ électrique £) 
et d'un potentiel-vecteur 4 (dont le rotationnel est le champ magnétique 5). Ce champ quadrivectoriel 

qui permet de modéliser le champ électromagnétique est appelé une jauge. 


Il s'avère que nous obtenions donc exactement les mêmes effets physiques sur un système de particules 
chargées si nous remplaçons cette jauge par une autre jauge en lui rajoutant une contrainte de jauge 
(exemple typique entre la jauge de Lorenz ou de Coulomb vues plus haut). L'invariance des lois de la 
physique lors du passage d'une jauge à une autre étant une invariance de jauge. Dans le cas du champ 
électromagnétique, cette invariance de jauge s'avère exprimer la conservation de la charge électrique 
(comme nous l'avons montré). 


Mathématiquement, de tels changements de jauges s'avèrent être le résultat de l'action d'un groupe de 
symétrie de dimension infinie (transformant ces jauges les unes en les autres) que nous appelons le 
"groupe de jauge" de l'interaction considérée (ici l'interaction électromagnétique). 
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Pour le champ gravitationnel par exemple ( ), l'interaction 
gravitationnelle se modélise par un champ de tenseurs symétriques de rang 2 et avec une signature 
donnée. Ce champ de métrique est distribué sur une variété 4D modélisant l'espace-temps. C'est la jauge 
de l'interaction gravitationnelle. D'après la relativité générale (principe d'équivalence) nous ne changeons 
rien à l'interaction gravitationnelle si nous changeons le système de coordonnées spatio-temporelles dans 
lequel nous exprimons la métrique. Le passage d'une expression de la métrique à une autre en changeant 
de système de coordonnées est aussi un changement de jauge. L'invariance de jauge de la relativité 
générale exprime alors la possibilité de passer d'une jauge à une autre sans changer pour autant les 
géodésiques suivies par des particules tests tombant en chute libre dans le champ gravitationnel modélisé 
par le champ de métrique. 


L'invariance de jauge de la relativité générale est ce que nous appelons l'invariance par difféomorphisme 
(changement de système de coordonnées bijectif présentant un certain degré de régularité) et le groupe de 
jauge de la relativité générale est donc le groupe des difféomorphismes de 1R* (appelé le "groupe souple") 


Il convient de préciser aussi que le potentiel-vecteur 4 n'est peut-être pas si virtuel que ça. En effet, il est 
possible de modifier les trajectoires de particules chargées passant à l'extérieur du volume cylindrique où 
règne un champ magnétique À induit par un courant électrique (circulant dans l'enroulement d'un 


Qu 


solénoïde où ce champ & est "emprisonné". Il est donc possible d'influer sur la trajectoire de particules 
circulant dans une zone où le champ magnétique & est nul mais où son potentiel-vecteur 4 ne l'est pas. 


Par ailleurs, nous utiliserons les résultats obtenus ici lors de notre étude de la théorie de Yang-Mills dans 
la voie de l'unification électrofaible (voir le modèle standard dans le chapitre de Physique Quantique Des 
Champs). 


Remarque: L'expérience connue qui fait intervenir le potentiel-vecteur est celle d'Aharonov-Bohm ( 
). 
6.1. TENSEUR DU CHAMP ÉLECTROMAGNÉTIQUE 


Afin de déterminer le tenseur du champ électromagnétique supposons dans un premier temps que l'action 
( e Mécani( ) d'une particule chargée dans un champ électromagnétique serait 
donnée par (choix a priori empirique mais... vous verrez un peu plus loin): 


S = figdov-giat = ( Ldt 


Remarque: La notation $; reste réservée à l'action d'une particule libre ( 


). 


Le lagrangien pour une particule chargée dans un champ électromagnétique est donc la somme du 
lagrangien de la particule en interaction avec le champ électromagnétique Z additionné au lagrangien de 


la particule libre Æ, (cf. « ): 


L=l+l= nc? 1 -v* ie? + gAoŸ-a$ 
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Remarque: Il s'agit donc du lagrangien de l'interaction de la particule avec le champ additionné au 
lagrangien de la masse de la particule. Dès lors on voit qu'il manque encore le lagrangien du champ 
électromagnétique lui-même en l'absence de charges (appelé: lagrangien du champ libre) mais nous 
verrons cela plus loin. 


Ceci est donc (a priori) le lagrangien d'une particule chargée dans un champ électromagnétique. 
Nous allons démontrer que ce lagrangien est correct: 


Le moment généralisé est donc (cf. chapitre de Mécanique Analytique et de Relativité Restreinte): 


Pour vérifier que nous avons fait le bon choix de lagrangien au départ, nous allons obtenir les équations du 
mouvement et s'assurer qu'elles coïncident avec la force de Lorentz. Les équations de Lagrange sont, dans 
ce Cas: 


d d£ dE à MpV = Fl 3 + 
== | + GA -— | -mc-v fe? +gAov-aél 
dt av 6 dt|.f- vw je? ' gF\ : Lé 
(37.136) 
dé| .f1-v° je? 


fr es 


Or nous avons: 


et donc: 


… 


F=-gA+q\'|Aoÿl-gv'# (37.138) 
Mais nous avions fait remarquer lors de la définition du potentiel scalaire que Ë = -Ÿ : # d'où: 
F=gË+g|V'(40o$)-À) (27139) 


Nous devrions donc nécessairement avoir par analogie avec la force de Lorentz: 


Es _ 


V'(Aoÿl- A=5xB =5x{VxA| (37140) 


Il nous faut donc avant de poursuivre, vérifier que: 


Avec: 
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… 8AÂ, dA, À dA dAdx 8Ady dAdz 84 44 44 
DA = x + dy + dr > = VV, + CV, (37.142) 
x dy dz dt Ox dt dy dt Oz dt üx dy gz 


En composantes: 


… v,4,4, +v,8,4 +v,0,4 
d'A 
ri v,0,4, +v,4,4, +v,0,4 | (37.143) 
v,0,4 +v,0,4 +v,0,4 
Donc: 
2 gy,+ 2 4v, + 2 4v, 
4x 9x ôx 4,4 -8,4, 
Av, + Av, + A, |-Â-5x]0,4 -5,4 
dy dy dy 3,4, -8,4 
4, +2 4 + Er | / 
& "" gg? & °° 
v, 4,4, +v,4,4, +v.4,4 Vy ci, L 0,4, IV! 0,4 co | (37.144) 
v,8,4, +v,8,4, +v,8,4|=|v,(8,4 -8,4,1-v,(8,4, -à,4 | [+4 
VA + A, +V A | [8,4 -8,41-v,(8,4 -8,4 | 
v, 0, 4, +v,4,4, +v,0, 4 v,0,4, Ps 7 V,0,4, +v,0,4 
v,0,4, +v,0,4, +v,4,4/|=11,8,4 -v,4,4, - v,d,4, +v,9,4 [+ À 
V0 4 F0, +v0, 4 v:0,4, vd, 4 vd, 4 +v,0,4, 
et comme: 


v,0.,4, -V,0,4, VA V0, | 

V0 4 V0 À, V,03 4, + v,0,4, | + À 

VO A V0, À V0, 4 vd, 4, 

v,0,4, V4 - Pré +v04 | [8,4 + 84 + id 

V0 4 Vôrée Vire +04 + ré +v,8,4, + Dr | (7145) 
0,4, - Vôrd Dé +0,84, | | 84 +%8,4 +v,8,4 

vos, tu, F0 A 044, + v,0,4, +v,0,4 

v,0,4 Fr, 4 FrLA = v,0,4 +v,0,4, FR, 

v,0,4, La v,0,4, + v,0,4 v,9,4, + Vy 4,4, + V0 74 


Nous avons donc bien l'égalité: 
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LAC R FRA, +0,44, V0 +v,0,4, +v,0,4 
dy 4 + V,0 4, + V0, 4 1=1v,0,4, +v,9,4, +v,0,A | (37.146) 
v,8, 4 +v,4,4, +v,0,4 V0,4 +V,0,4, + v,8,4 


Ces développements confirment donc notre hypothèse initiale comme quoi l'action du champ peut s'écrire: 
Si = [L gÂoÿ - q fiat = fat (37.147) 


et qu'elle exprime l'interaction d'une particule chargée avec un champ (car on y retrouve la force de 
Lorentz!). 


Nous avons donc maintenant démontré que le "lagrangien de l'interaction courants-champs": 


= -mpe 1 -v" {0° +gAoÿ-g#l (37.148) 


dont nous avions supposé empiriquement la forme au début est donc finalement bien correcte! 


L'intégrale d'action s'écrivant alors: 
t 
E [me y ei +446 agl G149) 
H 
Introduisons la vitesse Ÿ de la particule sous la forme ÿ = dr / dt et l'intégrale s'écrit: 
ê 
s- [(me vi = jetdt + qÂodF - abat) (37.150) 
1 
Nous avons vu en relativité restreinte que: 
ds? = cat? - (dx? + dy? +d7?| (27151) 
et de même: 
ds? = cd |dx + dy" + d7° | (37.152) 
Les intervalles d'espace-temps sont des invariants tels que (cf. chapitre de Relativité Restreinte): 
c'dt-|ax° + dp°+ 2 = cd? - dx? + dy? +d2?| (37153) 
Si le référentiel O' n'est pas en mouvement (4x'= dy"= dz'"= 0), nous avons: 
ds =cdt? = ct? -|d8 + dy? +d7? | (37154) 


d'où: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


2 2 2 
+ + 
dE = y h a (37.155) 
€ c'dt 
ce qui s'écrit aussi: 

2 

ds _ 1-7 (37.156) 

Leg C 


Dès lors: 

LA L £ D 

S= [(mcv je dt + gÂ 0 dF - abat) - (mods +qAodF-qédt) (37157) 

1 

Faisons usage du quadrivecteur potentiel contravariant (voir plus haut): 
À = [£.4.4.4) -(£3) (37.158) 
€ [et 

et du quadrivecteur déplacement contravariant (cf. chapitre de Relativité Restreinte): 


dr = (cdt,dm ,dx, dx, ) =(cdt,dx) (37.159) 


L'expression de l'action d'une particule chargée dans un champ électromagnétique et dans une métrique de 
Minkowski 7; (cf. chapitre de Relativité Restreinte et Relativité Générale) se réduit finalement à 
l'expression condensée: 


Ê 


Ê 
S = [rrocds - qÂ (rar) = [racds - gA dx, | (37.160) 


Lo] 


avec donc: 

dx, = (cdt,-dx,-dy,-dz) (37.61) 
sans oublier que nous utilisons ici la métrique +,-,-,- (cf. chapitre de Relativité Restreinte et Relativité 
Générale). 


Remarquons que l'intégrale d'action en l'absence de champ magnétique et électrique s'écrit: 
£ 
S = “rc [ds (37.162) 
& 
ce qui correspond bien à ce que nous avons obtenu en relativité restreinte pour une particule libre ! 


D'après le principe de moindre action, l'intégrale d'action a une variation nulle pour le mouvement effectif 
de la particule, soit: 
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ê 1: 
ôS = | mpcôds +qôl À dx | =0 (37.163) 


Œ 


Remarque: De par l'égalité avec zéro, nous pouvons éliminer le signe moins devant l'intégrale. 


Utilisant l'expression de l'abscisse curviligne (cf. chapitres de Calcul tensoriel et de Relativité Générale): 
ds? = gjdx dx} (37.164) 


Pour la métrique de Minkowski, nous pouvons écrire (rappelons que dans la métrique euclidienne seuls 
les termes de la diagonale où i = ÿ sont non nuls): 


ds” =m,dx/ dr = dx,dt (37.165) 


Ainsi: 


A 


2 faxdr 2 faxar ds 


l'intégrale précédente s'écrit alors: 


é ,, 1 7 drôdn à | 
58 = ['rocéds + g5(A dx | = [rue +44 Gdx, +4 6Adx, (37.167) 


Cela donne en utilisant les composantes curvilignes (cf. chapitre de Calcul Tensoriel}: 
: | CS 
O8 = [loc +qA )6dx + fa 54 ax; (37.168) 


Intégrons par parties (cf. chapitre de Calcul Intégral Et Différentiel) la première intégrale: 


£ £ 
ÊS = (rer +q4 ) dx, C = [lee 8x + qd# 6x) +fa84 dx (37.169) 


Or, comme: 
6%|, =0—4x%| =0 et ô%|, =0— dx, =Ù (67170) 
Alors: 
$ 
6$ = [{-mcau' dx, - qdA 6x, +q64'dx;) (37.171) 
avec: 
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aÂ 


É= 6x" = 8" A'6x" et dA' = ra = "A dx (37.172) 
X X 


devient: 


68 = [(-mcdu' 8x, -g0" dax" 6x + q8' A'Extax,) 
# du? kR dif. k disk 
=f me[h ae] mL: (x ds) 67, +g8" A x a] 
. du’ & gif, i 4 si 
sé | rme[h as] - gd" À (x ds) Ôx, +40 À Te) (37.173) 
L du’ & gi fn ü 4 
| mé) À (2 )+ 48 A (us) 
ds 


Ôx;ds 


L du’ Ï 46 _ 9 di.,Æ 
“1 me[e]+(64 - À }u Jess 


Les quantités 9x, étant arbitraires, l'expression entre crochets est nulle: 
du? : | 
“ME (se) +q (8° 4" - 9“ À jui =0 (37.174) 
ds 


Notons: 


Fi = 5 A* — 4% All (37.175) 


Les quantités Fi contravariantes forment les composantes contravariantes de ce que nous appelons le 
"tenseur du champ électromagnétique" ou le "tenseur de Faraday" (d'où le F...) ou plus couramment le 
"tenseur de Maxwell". Nous disons alors que ##* est le "rotationnel du potentiel". 


Les "équations du mouvement d'une particule dans un champ électromagnétique" prennent ainsi la forme: 


è . 
mc LE - gF%u* =0| (37.176) 
s 


que certains physiciens appellent "géodésique corrigée par une force de Lorentz". 
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Remarque: Le tenseur du champ électromagnétique est invariant sous les transformations: 


À = A = Â-a (37177 
Effectivement: 
FX = gi (4 - 8'a) - 9" (4 - 8") 
= F#-5ifo+a too =r* 


(37.178) 


Dans une métrique de Minkowski 7; (nous allons avoir besoin du tenseur du champ électromagnétique 
dans le chapitre de Relativité Restreinte, d'où le choix de cette métrique), nous avons cependant: 


du | | 
mc 2 am (8 4-8" 4 ju = 0 (7179) 
5 


Ce qui donne: 


-g(8,4* - 8" A, ju“ =0 (27.180) 


Le terme à 34 - 6" A, est souvent noté F#* (même s'il n'est pas plus totalement contravariant). 


Il nous reste à déterminer les composantes du tenseur F* contravariant (tenseur qui a la propriété d'être 
antisymétrique tel que F#* = -r#). 


Commençons par le plus simple. Nous supposerons comme évident que: 
FT = 8,4 -8°"A =0 
F° =8,4 -8 A =0 
F° =8,4 -8 A =0 
FF =8,4 -& A =0 


(37.181) 


Ensuite, en se rappelant que Ë = Ÿ x 4: 


B, 0,4 4,4, 0,4 84 
B,|=10,4, - 0,4, | =]4:4 -d,4, | (37.182) 


B, 4,4, = 4,4, d4, E 9,4 


D'où (en choisissant la métrique Minkowski avec la signature +, -, -, -): 
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_ à à à 
FA =-R7 23,4 -à = =— A -—À=8B 
2 re + Er ( À ) ax À, dy Z 
à à à à 
FS=-pS m9 4-9 A = — À -—(- —À,-—A#=8B (37183) 
3 À —Qz y | A) dy 3 dz * ( / 
4 à à à 
Fm-Mnmg 4 -PA=— À -—(-ÀA)=— A4 -— À =8B 
: * — x dz ( A) dz 4 ax 7 
Ce qui nous donne pour l'instant: 
F0 Fous Fe Fe 0 ? ? ? 
Fu Fu Fu FB ? Ô a ‘2 pal 
A7 = 2 21 22 3|7 ; (7.184) 
F F F F 1 Û: =#, 
F9 FA F3 FS| |? -B8, B 0 


Remarque: En toute rigueur pour ne pas confondre le tenseur de Faraday F* = 4 4° - 3% 4 avec sa 
forme matricielle, nous devrions mettre le premier terme de l'égalité ci-dessus entre crochets aussi 
comme nous l'avons déjà précisé dans le chapitre de Calcul Tensoriel! 


Maintenant, étant connu que x, = cé et 4, = #/c les autres composantes du tenseur F s'écrivent compte 
tenu de: 


ERP (87.185) 
dé 
et donc: 
14,6. EE rise) 
c | dé € 


ainsi, avec les dérivées partielles contravariantes selon la métrique de Minkowski: 


où __p0 _a a_4 - L[ 04 d4 +6] _E, 
FA = pl 3 4-94 {+ à] (Se 

1[d4, à à 
FU = F1 =8 4 - A -( œ)- 1 #- 


RS I 0$ 44, -#)- 
FO = 23 4 -@ A le - %)- ee 


Ainsi, nous avons pour le tenseur du champ électromagnétique en composantes contravariantes avec et 
toujours avec la métrique de Minkowski de signature +, -, -, -: 
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o -& _E E 
F0 pol Fe Fou É à É 
F1 Fu Fu : ( —B, B, 


& _ . 
| a 2 23 (37.188) 
FT F* F% EF 


F2 F3l Fa F3 


a [He o [5 o [He 
Ca 


Ce qui fait que l'équation du mouvement est finalement: 
2 du . 


MC ns gÆ%u% =0| (37.189) 
5 


Mais comme nous le verrons dans le chapitre de Relativité Restreinte, le vrai tenseur du champ 


électromagnétique est défini par (toujours dans la métrique +, -, -, -): 
0 -Æ -E, -E, 
E Nu TS GA 
FF=cR% = |" . | gra 
c E, cB, 0 -cB. (37.190) 
E, -cB, B, ( 


afin que les transformées de Lorentz soient conformes. 
L'expression sous forme tensorielle du champ électromagnétique met bien en évidence l'unité du champ 
électromagnétique alors que généralement les champs électrique et magnétique sont considérés 


séparément en théorique classique. 


Mais comme en physique théorique nous travaillons souvent en unités naturelles (c'est un peu la norme...), 
nous avons alors: 


(37.191) 


et donc l'équation du mouvement: 


HA 
M —-gF#u" =0| (37.192) 


En notant maintenant les composantes de 1 à 4 au lieu de 0 à 3 (c'est plus facile pour les élèves de se 
repérer dans la matrice) et sans oublier que les dérivées partielles sont covariantes et en adoptant, à 
nouveau, les unités naturelles telles que Æ = & = 1 (in extenso & = 1 ), les deux équations de Maxwell avec 
sources s'écrivent: 
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le unités raturelles 


ES 


VoE- D SG oË-VoË-p, 
E 
” , _ (37.193) 
dE _umitésnaturelks ä n 
VXB-uE—= ui — VXB-— =; 
ar. æ ” 


En utilisant le tenseur du champ électromagnétique, il apparaît alors remarquablement que ces deux 
équations peuvent être écrites sous la forme de l'équation tensorielle condensée suivante: 


où ;” est le "quadrivecteur courant" défini par (en unités naturelles!): 


En utilisant la première définition du tenseur de Faraday (celle où les composantes du champ sont 


divisées par c) et en prenant pour connu (nous le démontrerons plus tard) que € = 1} NE f{ Nous avons 
dans le système SI: 


8,74 = oi" avec j={cep.j) (7.196) 


Comme nous allons de suite le voir, la partie temporelle de cette équation donne la divergence du champ 
électrique et la partie spatiale le rotationnel du champ magnétique. 


Remarque: Nous avions déjà rencontré (défini) ce quadrivecteur lors de notre étude de la jauge de 
Coulomb plus haut ainsi que lors de notre étude de la relativité restreinte (cf. chapitre de Relativité 
Restreinte). 


Effectivement: 
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AFF = OF" +0,77 +0,77 +0,F" = 8,F" +4,F" +0,F° +8,F" 
= 8,0+8,E,+0,8,+8,E, = ,E, +à,E,+ô,E, 
0,FH=ÿoË 


A FR = OF" +8,F7 +8,77 +0,F% = 0,F7 +0,77 +0,F° +0,F% 
= 4,(-E,)+8,0+4,(-8,)+4,(8,)= 0,8, -4,B, -8,E, 


G,F°# = 0,7" +8,77 +4,77 + 8,7" = a,F* +0,F% +8,F% +8,F* (7.197) 
= d(E,)+4,8, +0,0+0,(-8,) = 0,8, 4,8, GE, 


“+ di = 8,F* + 8,F% Fa 3,F% + 8,F* = 8,F* " 4,F# + 4,F% " 8,F* 
5 d,(-£,) - 4,(-B,) + d, (8,) + 4,0 : d,2; s 4,8, = 8,E, 
8 F2 


aa |PxB-8E 
à PF 44 


De même, les deux équations de Maxwell: 
= 0 (37.198) 


peuvent s'écrire sous la forme condensée tensorielle: 


8,F" +0,F"*+8,F# =0| (37.199) 


Effectivement: 


2,74 à à, F# +8,F# = 4,7% es 4,F? +8,F* mL -A +0,85, + 4,8, 
=: 4,8, +4,8, +8, 
——————————————————’ÎR————————————————————— 


VoË 
0,7% +0,F% +0,F% = 0,8, +0,(-E,) +0,(E,) = 8,8, -0,E, + 8,8, 


AFP +0,F% + 0,7" = 0,8, +8,(-E,)+0,(E,)= 8,8, -8,E,+8,B, (87.200) 

4,77 +8,77 +8,77 =0,8, +8,(-E,)+0,(E,) = 8,8, -0,E, +8,B, 

————————————————————ç———— 
4,F3+9,F31+9,F4 


AFA+8,F41+8,F12|/xE+8,É 
A F2 +0,F21+9,F13 


Finalement, toutes les équations de Maxwell, en adoptant les unités naturelles, se résument à: 
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OF'"=;" 
Ô,F" +8,F#+9,F# =0 


Nous pouvons aussi utiliser un pseudo-tenseur HR y Rens de rang 4 qui peut être vu comme une 
généralisation du tenseur de Levi-Civita (cf. ul 7 ie!) tel que nous puissions écrire: 


avec: 


1 si (V0) est une permutation pare de (1234) 
EF = 4-1] si (400) est une permutation impare de (1234) 


0 sinon 


Le lagrangien que nous avons déterminé plus haut n'est cependant pas complet. Effectivement, lorsque 
nous appliquons le principe variationnel, nous avons déjà vu de nombreuses fois dans les différents 
chapitres de ce site (mécanique classique, mécanique ondulatoire, magnétostatique, relativité restreinte, 
relativité générale, etc.) que nous pouvions obtenir les équations du mouvement (trajectoires) des sujets 
(corps) étudiés. Les équations obtenues contenaient aussi des paramètres qui expliquaient la source de ce 
mouvement (propriétés de la matière, vitesse, champ, etc.) comme cela a été le cas avant! 


Précédemment, nous avons appliqué le principe variationnel sur le lagrangien d'interaction charge-champ 
(magnétique + électrostatique) et avons obtenu l'équation du mouvement corrigée par la force de Laplace. 


Lorsque nous avons déterminé les équations du mouvement de la particule chargée à partir du principe de 
moindre action, nous avons fixé le champ électromagnétique (le champ est connu) et nous avons fait 
varier la trajectoire. Le principe variationnel, doit alors également nous permettre d'obtenir les équations 
du champ à partir de la démarche inverse: nous fixons la trajectoire de la particule (trajectoire connue) et 
nous faisons varier le champ électromagnétique (potentiel et tenseur). 


Nous devrions alors obtenir les équations de Maxwell qui, au même titre que l'on obtient ce qui fait le 
mouvement de la particule lorsque l'on fixe le champ dans le principe variationnel, nous donne 
l'information sur ce qui est la source du champ électrique et magnétique lorsque l'on fixe la trajectoire 
dans le principe variationnel (j'espère que vous avez suivi..). 


L'envie est alors très grande de reprendre simplement l'expression de l'action obtenue plus haut: 
S = [-rocas s qA'dx, 


et de lui appliquer une variation sur le champ après un petit changement dans la manière de l'écrire: 


Nous savons que les charges électriques bien qu'elles soient ponctuelles, sont considérées généralement 
comme une charge transportée par un courant réparti de façon continue dans l'espace. Soit © cette densité 
de charge, nous avons alors dg = £dW tel que: 
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S = [ -mpcds - A'(odW)dx (37.204) 


Considérons des charges électriques se déplaçant à la vitesse v et écrivons la quantité suivante (ne pas 
oublier que nous continuons à travailler en unités naturelles telles que dxy = cdt = d£l): 


dx dx; dx, 
dadx, = (odV)dx, = pdVädxo — on = L je = jd{à (37.205) 
d7y dt dt 
avec en unités naturelles: 4£2= dr dx; dx;dx4 = didxdydz 


Ainsi, nous avons: 
S = [-rn45 - À jdQ (37.206) 


Si nous appliquons le principe variationnel seulement sur le champ (constant en amplitude donc la source 
du champ est constante telle que à j; = 0 ) et que nous considérons donc le mouvement des charges 
connus, il est immédiat que le premier terme ci-dessus est nul. Nous avons alors: 


68=[6{4 j}jan-[s4 jan+4s;an-[s4 jan=[;644n-0 (7207 


pour que cette intégrale soit nulle, il faudrait que ;; soit nul... ce qui est plutôt gênant si nous souhaitons 


déterminer les caractéristiques d'une source qui alors n'existerait pas. Dès lors, nous remarquons qu'il 
manque quelque chose à notre lagrangien! 


L'idée est alors la suivante: nous connaissons une équation tensorielle qui fait intervenir la densité de 
courant qui est à ”* i = j” et qui implicitement contient les deux seules équations de Maxwell qui 


donnent des informations sur la source des champs électrique et magnétique respectifs (les deux autres 
donnant des propriétés des champs et non pas des sources) soient (toujours en unités naturelles): 


VoË=, 
= FR  _ (37.208) 
FD; 

dt 


Il est donc suffisant d'obtenir ces deux équations (donc l'équation tensorielle y relative) suite au principe 
variationnel pour avoir les propriétés de la source du champ. 


Ce qui signifie simplement que dans l'idéal, nous devrions (et nous attendons à) avoir : 
68=[(; -0,r*)5440=0 (37209 


où l'intégrale s'annule exactement lorsque 8,F #A=ÿ! 
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Il est alors tenant d'écrire quelque chose de la forme (remarquez que nous avons abaissé l'indice du 
potentiel À et monté celui de la densité de courant j dans la seconde intégrale ce qui ne change rien 
mathématiquement parlant au résultat) 


S=-[rods-[4/a40+[7774Q 7210) 


Nous pouvons nous aider de la propriété suivante des quantités du lagrangien pour déterminer l'expression 
"22?" manquante: elles sont toutes invariantes. En d'autres termes et pour rappel, leur pseudo-norme 
(scalaire) est égale par changement de référentiel Galiléen (cf. chapitre de Relativité Restreinte) telle que: 


ds = ds' 
Ai =4;,.J" 


La première relation est évidente, nous l'avons déjà démontrée de nombreuses fois. La deuxième l'est 
y 


peut-être moins alors donnons une petite indication (non générale) pour vérifier qu'elle soit correcte: À, j 


est le produit scalaire de j et de A. Si nous faisons subir la même (quadri)rotation aux deux vecteurs, 
puisque les transformations de Lorentz sont des rotations (cf. chapitre de Relativité Restreinte), l'angle 
entre j et À reste inchangé et donc le produit scalaire. 


Il nous faut donc ceci dit, trouver la quantité "???" comme étant un scalaire invariant faisant intervenir le 
tenseur de Faraday d'une manière ou d'une autre. 


Nous pouvons alors essayer directement avec la quantité suivante (sachant d'avance, grâce à nos 
précurseurs que c'est la bonne hypothèse): 


faisant intervenir le tenseur covariant F,, et contravariant F# de Faraday car nous savons que: 


1. C'est un scalaire invariant! Effectivement, écrivons #,,F # en termes de champs électrique et 
magnétique pour en comprendre la signification physique (en unités naturelles): 


0 Æ, Æ, Æ, | 0 -Æ, -E, -E, 
-E, O0 -B, B,|EÆ, O0 -B B, 
-E, B, O0 -B,|Æ, & O0 -B8, 
-E, -B, B, O0 |Æ -B, B, 0 CE 


lv 2v 3v dv 
= FE FU HE FPS +R FER 
=Ef-H° EF -H+ BE +B-EÎ+BI4+BT-E+B+E 


2805-88) 2{|5f-|rf) 
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Remarque: Si nous n'étions pas en unités naturelles, le résultat du calcul serait de la forme: 


por = << Ef -|f) (37.214) 


La quantité c? IA - JE f (ou Ef - |£ ff en unités naturelles) est donc un invariant du champ. 


Exemple: 


Dans un référentiel O, considérons une onde électromagnétique plane. Les modules du champ électrique 
et du champ magnétique sont reliés par Æ =£8 (voir plus loin la démonstration). L'invariant du champ 
considéré est donc nul. Dans un autre référentiel, avec la même structure du champ, nous aurons alors 
aussi Æ'=cB". 


2. Parce qu'un variationnel sur ce terme donne: 
2 
a #\ _ #v # HV (37915 
G(FP) =6(F,F#)= FGF +68, F = 268 FA (87.215) 
où l'on devine. qu'en creusant un peu, $F,, contient implicitement le terme,5 4". Nous voyons aussi 


qu'un facteur 2 apparaît tel qu'il nous faudra introduire une constante de normalisation &, ne serait-ce 
déjà aussi que pour l'homogénéité des unités de l'expression de l'action. 


Donc finalement essayons avec quelque chose du genre: 
2 
S=-[rpas-[4,jf20+af(r#) 4Q Groi6) 


À présent, pour chercher les équations du champ électromagnétique, nous considérons que les 
mouvements des charges sont connus et nous utilisons le principe de moindre action en faisant varier 
seulement les composantes du potentiel-vecteur et celles du tenseur du champ électromagnétique. 


Il en résulte que la variation de la première intégrale est nulle et qu'il reste: 


65=-[64,;40+af6{r" J aa 
(37.217) 
=-[54,j#40+ afs(r,r”)20= -[ 654,40 +2a[ Fr 68,40 


Substituons dans la seconde intégrale, les composantes F,, par leur expression implicite 


FPGF,, = F#0,604, -F#0,6A, (37218) 


Or nous savons que F,, est égal à —À,, puisque le tenseur de Faraday est antisymétrique: 
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FGF, =-F#0,64 -F#3,64, 


(37.219) 
Rien ne nous empêche de permuter les indices #;Y dans le premier membre à droite de l'égalité: 
FFF, = -F#8, 6A,-F"8,64,= -2F#0,64, (37.220) 


Donc finalement: 
68 =-[54,;40-4af F#a,54,4Q-0 «721 
Intéressons-nous à la seconde intégrale: 
hv m _Ô _—— 
[F0,6440-[r ar (64 )droddradre (37.222) 


En appliquant le théorème de Fubini (cf. chapitre de Calcul Différentiel Et Intégral) qui dit que l'on peut 
intégrer selon n'importe quel ordre les variables d'intégration (sous certaines conditions) on peut alors 
appliquer l'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral) de manière à écrire: 


[F#0,64,40-[r"64,45 -[a,F#64,4Q (6723) 
où dS représente la frontière-surface de l'hyper-volume 42 sur lequel on intégrait initialement et qui 


omet la variable prise en considération par le choix de l'indice supérieur v. 


Maintenant selon l'indice supérieur v concerné, les bornes du premier terme de l'égalité: 
[F* ÊA,4S (37.224) 


seront sur les composantes de temps ou les composantes d'espace. Si nous nous concentrons sur les bornes 
temporelles d'intégration, il s'agit des moments initiaux et finaux de l'action sur laquelle nous appliquons 
ce variationnel. 


Or aux extrémités temporelles, le variationnel du potentiel-vecteur ŸÀ, est nul (par définition) donc 
l'intégrale sur la composante de temps sera nulle. 


Maintenant sur les composantes spatiales, les bornes (spatiales) sont celles qui permettent d'intégrer la 
surface-frontière de l'hyper-volume au temps final. Si celui-ci est pris comme l'infini, le rayon de la 
surface-frontière sera infini et en tout point de cette surface, l'énergie transportée par le champ ainsi que 
l'amplitude des composantes du champ sera nulle (voir démonstration plus bas). 


Donc le variationnel de l'action s'écrit finalement: 


65=-[54,;"40+4af8,r" 54,40=[(40,F - j*)54,40=0 (67225) 
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Les variations du potentiel-vecteur étant arbitraires, l'intégrale précédente sera nulle si l'intégrande elle 
l'est, d'où la relation 


ce qui nous amène à: 
4c9,F# = j# (37.227) 


nous retrouvons donc les deux équations de Maxwell exprimant la source si et seulement si (en unités 
naturelles): 


Nous avons donc alors: 


Avec finalement pour "lagrangien total de l'interaction charge-champ" en unités naturelles: 


L=-mpûs - j À, + FFE (37.230) 
L=-mocds-ÿ A + EF | (37: 
= —Mpcds — j À, Dr es (37.231) 


Remarque: Nous reviendrons sur ce lagrangien avec une autre approche (très intéressante) dans le 
chapitre de Physique Quantique Des Champs. 


ou avec le système SI: 


7. ÉQUATIONS D'ONDE ÉLECTROMAGNÉTIQUE 


Maxwell supposa que l'onde électromagnétique était une combinaison des phénomènes qu'explicitent les 
troisième et quatrième équations. Si une onde électromagnétique est éloignée de sa source, nous pouvons 
alors négliger la densité superficielle de courant de la source comme ayant une influence nulle sur l'onde 
(nous disons alors que ce sont les équations de Maxwell sans source dont nous avons déjà fait mention 
plus haut). Alors, les troisième et quatrième équations de Maxwell s'écrivent: 
VxE = 08 et VxA = ns (37.232) 
dé dt 


Les champs d'excitation magnétique Z et électrique Æ étant perpendiculaires, plaçons-les de façon 
commode dans un système d'axes orthogonaux |? ,/,#| unitaires et euclidiens appartenant à R? en 
choisissant que: 
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Remarque: Attention! Il faut bien se rappeler que dans ce qui suit, H est la composante en z de À et E 
la composante en y de #. 


Les calculs (simples) de Ÿx£ et Ÿxf donnent, après simplification: 


Avant d'aller plus loin, un lecteur nous a demandé de développer les détails qui permettent d'arriver à 
l'égalité de gauche. Nous partons donc de: 


,)\ (E,) (8,E,-8,8,\) (-8,8, : 
VxË- 8, |x|#,|=18,E,-0,E, |- 0 + (37.235) 
a, | Vs, ] (a,8,-0,8,] | 6,8, 


car l'onde est plane et la composante du champ électrique étant en y, elle ne varie pas selon z. Nous avons 
alors: 


Ceci étant fait, si nous continuons, nous avons donc: 


dE 48 d?E 8°H 34 dE 8°H PE 
SR U —— et TE np (097-238) 
ax dé dx dxdé ax dé axé dé 


En identifiant les termes semblables, nous obtenons "l'équation de propagation" du champ électrique: 


dE. 1 4° _. 

ae ml. 
et procédant de manière identique: 

88 1 d°B — 

ET: nu PEEI (37.240) 


relations qui sont toutes deux de la forme d'une équation d'onde (cf. chapitre de Mécanique Ondulatoire) 
du type (rappel) équation de Poisson (plus particulièrement il s'agit d'une équation de d'Alembert): 
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my (734) 


où nous avons: 
: 1 1 L + DE ee 
EEE [As V ‘m | et A = "A, [V:s"A ‘ | (37.242) 
La vitesse de propagation de l'onde électromagnétique dans le vide est donc: 


qm du 0970010] us 


L'E, d4r10" 8854210 Lo 


les unités ainsi que les valeurs numériques concordent.. 


La vitesse de propagation de l'onde électromagnétique dans la matière est donc: 


(37.244) 


v<c car l'expérience montre que nous ne pouvons dépasser la vitesse de la lumière, ce qui est un des 
postulats de la relativité restreinte et générale. 


Donc, nous pouvons finalement écrire: 


2 2 2 2 
PE _ dE É 4 | -0 


a a leaf à 
’ ; 2 ; (37.245) 
ET 8x° c° dt? x’ 


soit en utilisant le d'Alembertien en une dimension: 


CIE =0 
(37.246) 
C8 = 0 


À défaut d'avoir trouvé l'expression directe de E(x,û et B(x;t), nous venons d'obtenir des équations 
différentielles ne contenant qu'un seul de ces champs. Nous appelons ces équations respectivement 
"équation d'onde pour le champ électrique" et "équation d'onde pour le champ d'induction magnétique”. 


Elles ont la même forme et admettent une solution du même type. Une solution évidente et particulière 
(nous laissons le soin au lecteur de faire cette vérification) de ces équations différentielles est la fonction 
trigonométrique sinus: 


Ext) = Ë sin(lx - &) 


B(x,5) = À sin(kx - @) 


en n'oubliant pas la relation entre la pulsation & , la vitesse de propagation c et le nombre d'onde k que 
nous avions démontrée dans le chapitre de Mécanique Ondulatoire! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Une solution plus générale est la somme des solutions triviales (cf. chapitre de Calcul Différentiel Et 
Intégral): 


Ext) = Ë sin(lx — @f) + Écos(ix — at) 


a a (37.248) 
B(x,t) = B sin(kx — @f) + 5 cos(kx — @f) 


Mais nous avons vu lors de notre étude des phaseurs (cf. chapitre de Mécanique Ondulatoire) que cette 
solution réelle n'est qu'un cas particulier d'une solution plus générale et se trouvant dans le corps des 
complexes. Donc finalement, nous pouvons écrire: 


Ex. à) = Ég/(rTa) 


B(x,1) = Be) (37.249) 


ce qui constitue l'onde plane monochromatique qui est le type d'onde le plus simple à manipuler en 
physique. 

En trois dimensions, la solution est par extension: 

(F !) = Es -a(Ex) 


Ë (F, :) : Ë er -@(E}) 


cit 


(37.250) 


Remarque: L'onde monochromatique ne peut pas représenter une réalité physique. En effet, si nous 
calculons l'énergie électrique associée à tout l'espace, nous obtenons pour celle-ci une énergie infinie 
(car elle n'a ni début, ni fin!) ce qui n'est pas réaliste. 


Or, l'équation des ondes est linéaire (solution est toujours la somme d'autres solutions). Donc ceci 
implique qu'une superposition d'ondes de fréquences différentes (nombre d'onde et pulsation aussi alors!) 
est également solution. Ainsi, en variant le vecteur d'onde (et implicitement via sa norme, la pulsation, la 
fréquence et la période) nous balayons également l'ensemble des directions de propagation possibles. 


Écrit mathématiquement cela donne, pour le champ électrique: 
#0 H040 À 
EF.) = [ [ [ EG TE PE (37251) 
—(0 —(0 —(0 
et rien ne nous empêche de sortir un coefficient de l'amplitude initiale du champ tel que: 
+0 +00 400 


E(F.8) = _— [ [ [ ER) TEE (37252) 
et nous retrouvons donc ici une relation très similaire à celle d'une transformée de Fourier inverse (cf. 
chapitre sur les Suites Et Séries) ce qui est remarquable! Alors l'astuce consiste maintenant à poser 

£ =0 car la relation précédente n'est alors pas qu'une simple analogie avec la transformée de Fourier, c'est 
une transformée de Fourier! 


Nous pouvons donc relier le champ réel Æ{F,0) au champ Ë, (à): 
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Ko +40 +0 
Ë(F,0) = ru [ { [Aer ar 
G —0 —00 —0 
nn Le ’ | (37.253) 
RD = | [ [ECO ar 
( 7 —<0 —(0 —C0 
Ces deux relations étant souvent condensées sous la forme: 
À, 1 À vin for 3 
Ë(F,0) Cu dk 
(37.254) 


Ë (&) = —%Jîûr, 0e? Pr 


(2x ru 


Le champ réel est donc à l'instant initial la transformée de Fourier inverse du champ Æj{&). Le terme 


Ë, (&) représente donc la composante spectrale liée au vecteur d'onde particulier # du champ réel. Cette 
solution générale de l'équation des ondes s'appelle un "paquet d'ondes" 


Rappels: 

R1.Identiquement à la mécanique ondulatoire (cf. chapitre de Mécanique Ondulatoire), les coefficients 

& (pulsation) et k (nombre d'onde) sont exigés pour exprimer la variation du sinus par des radians et pour 
lui donner une direction et une pulsation. 

R2. La périodicité dans le temps de la fonction sinus impose: 


sin(äx-@(t+7))=sin((&x-@t-27) (37255) 


d'où la définition de la période de l'onde: 


R3. La périodicité dans l'espace permet de définir de façon identique la longueur d'onde de la fonction 
comme: 


— (37.257) 
La 


Nous constatons donc que l'onde plane se déplace selon x en parcourant une distance 4 en un temps T. La 
vitesse de l'onde électromagnétique est alors: 


En introduisant: 
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E(x,5) = Ê sin(x — @t) = Ésin[&(x-ct)] 
B(x,t) = Bsin(tx - @t) = Bsin[k(x -ct)] 


(37.259) 


dans . = + nous obtenons le résultat remarquable pour l'onde plane oscillatoire: 
x É 


7.1. ÉQUATION DE HELMHOLTZ 


Maintenant, examinons en détail une autre solution de la forme: 
E,(x,8) = Egcos(æt+@) (37.261) 


où cette fois-ci, nous faisons explicitement mention des coordonnées afin d'éviter toute confusion. 


Remarque: La solution particulière avec le cosinus est plus appréciée par les enseignants que celle 
avec le sinus, car elle permet comme nous allons le voir, une écriture condensée avec les phaseurs (cf. 
chapitre de Mécanique Ondulatoire). 


Si nous utilisons la notion de phaseur, nous pouvons réécrire cette solution sous la forme: 
E,(xt)= Boos(a+o)=n(ne 9) green )= mé) (3726) 
Donc: 
PE, (x,t) R(£,*) 
#7 
dans l'équation d'onde: 


@E,(xt) 1 0E,(x6) 
at” HE & 


nous obtenons: 


2 
PE, (x,f) 


. 2 ._e. A ia 37.26 
dr HE R(£,e } (37.265) 
qui n'est autre que "l'équation de Helmholtz" (pour l'électrodynamique) à une dimension. Il s'agit bêtement 
de l'équation d'onde écrite d'une manière traditionnelle particulière que nous retrouvons dans de nombreux 
autres domaines de la physique. 
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7.2. ÉNERGIE VÉHICULÉE 


Il est relativement intuitif que toute onde électromagnétique transporte donc de l'énergie. Exprimons la 
valeur de cette énergie. 


La direction de propagation d'une onde électromagnétique étant celle du vecteur Æ x 8, nous définissons 
alors le vecteur de Poynting $ comme: 


EXB| (37266) 


J 


sm 


dont la valeur s'exprime en joules par seconde et par unité de surface: | 


La norme du vecteur de Poynting représente donc la puissance instantanée qui est transportée par l'onde 
électromagnétique à travers une surface unitaire, perpendiculaire (nous insistons sur le "perpendiculaire") 
à sa direction de propagation. Dès lors, nous pouvons aussi écrire le vecteur de Poynting sous la forme 
(attention à ne pas confondre l'énergie et le champ électrique qui sont représentés par la même lettre): 


pe el pléxEhs = piéxEius = a fiÈx Pas (7267 
dd É 


où # est comme à l'habitude le vecteur unitaire perpendiculaire à 45 (cette dernière relation nous sera 
utile pour étudier une petite propriété du rayonnement synchrotron). 


Pour une onde électromagnétique plane, la norme du vecteur de Poynting vaut: 


L EG BD SAC) ÊB fn a) = 2° 
Ho Fo ne 


S(x,5) ‘sin (àx-@) (27.268) 


Cette grandeur varie en fonction du temps et du lieu. En un endroit donné, sa valeur moyenne est la valeur 
moyenne du sin? (..) pendant une période T: 


Rappel: 


LT: _if1 17 | +2 11 k.. | Cd 
7b sin (@'£) dt= ff 4 D cos(2@ oder 77 5(5 sin(2@ o| 75 (37.269) 


û 


Donc: 


La valeur moyenne du vecteur de Poynting d'une onde électromagnétique plane est une constante. quine 
dépend ni de la position et du temps. 
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Remarque: Nous pouvons faire une analogie osée et amusante avec l'électronique en faisant une 
analyse dimensionnelle du produit 44 ‘€ ci-dessus. Nous avons: 


pour démontrer l'énergie contenue dans une unité de volume les physiciens pragmatiques feraient une 
analyse dimensionnelle. Évitons cela et intéressons-nous toujours au cas particulier de l'onde plane: 


Basons-nous sur l'énergie électrique d'une capacité plane idéale productrice d'ondes électromagnétiques 
planes avec un rendement de 100%: 


Ve À 


DD 


d'où nous tirons que: 


L à 
Uy =— 5" (37.274) 


24 
et l'énergie totale transportée par l'onde électromagnétique dans ce cas particulier est donc: 
1 


A = ef +1 pr ,f- 


Uys = 1,82 + 1 
2 24 24€ Li 


Donc la densité d'énergie électrique d'une onde électromagnétique est égale à sa densité d'énergie 
magnétique. 


De par ce résultat, nous sommes amenés à définir "l'intensité I (moyenne) d'une onde électromagnétique" 
par la valeur moyenne de son vecteur de Poynting: 


I1=$| (37276) 


C'est donc la puissance moyenne que transporte l'onde par unité de surface. Or, nous avons démontré plus 
haut l'expression moyenne du vecteur de Poynting, ce qui nous amène à écrire: 
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Maintenant, utilisant la relation entre énergie et quantité de mouvement (cf. chapitre de Physique 
Quantique Ondulatoire): 


Or si la direction de £x 8 est perpendiculaire au front d'onde et est donc confondue avec la direction de 
propagation de l'onde son module est: 
Î A2 Pa 


JExB|=É Ê=-É=cË (37280) 
[es 


Nous avons donc pour la densité de quantité de mouvement: 


Comme la quantité de mouvement doit avoir la direction de la propagation, nous pouvons écrire sous 
forme vectorielle: 


Si une onde électromagnétique possède de la quantité de mouvement, elle possède aussi une densité de 
moment cinétique. Le moment cinétique par unité de volume est alors: 


b=Fxp=#æx(Ex8)- sFx(Exé) (37.283) 


Ainsi, une onde électromagnétique transporte de la quantité de mouvement et du moment cinétique aussi 
bien que de l'énergie!!! 


Ce résultat n'est pas surprenant. Une interaction électromagnétique entre deux charges électriques 
implique un échange d'énergie et de quantité de mouvement entre les charges. Cela s'effectue par 

l'intermédiaire du champ électromagnétique qui transporte une densité d'énergie et de quantité de 

mouvement échangées. 


7.3. ÉMISSIONS 


Pour prévoir la forme et les propriétés du rayonnement émis par des antennes ou autres sources, il faudrait 
rigoureusement faire appel à des ordinateurs et aux modèles numériques correspondants au problème à 
étudier. Formellement, la résolution des équations de Maxwell dans des systèmes macroscopiques est 
assez difficile et prend du temps. De plus, ceci est plutôt le travail de l'ingénieur qui cherche une 
exploitation pratique à partir de théories fondamentales. Le physicien théoricien s'intéresse aux 
fondements de l'Univers et aux systèmes isolés et parfaits. 
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Cependant, nous souhaiterions exposer la théorie de la diffraction et pour cela, nous devons faire un 
crochet théorique via une approximation des propriétés du rayonnement d'une source ponctuelle sphérique 
dans le vide. 


L'onde dans le cas d'une source ponctuelle sphérique se propage sphériquement dans l'espace (nous 
parlons alors "d'onde sphérique") et le vecteur de Poynting est radial. 


Les vecteurs Æ(r,f) et B(r,f) sont localement contenus dans le plan tangent à la sphère de rayon r (c'est 
logique!) comme le montre la figure ci-dessous: 


direction de propagation 


gent à la sphère 


Figure: 37.5 - Représentation de la propagation par rapport au plan tangent à la sphère 


Pour que le flux d'énergie soit constant, l'intensité de l'onde doit diminuer avec la distance. En effet, la 
conservation de l'énergie impose qu'à travers une sphère de rayon ” l'énergie E, rayonnée par unité de 
temps (écrite avec un "E" droit afin de ne pas confondre avec la notation du champ électrique) soit égale à 
celle qui traverse la sphère de rayon 7; : 


dE 
— = j'4mS = — = L'Arr? (37.284) 


Ceci implique naturellement: 


LS = (37266) 


et en utilisant la propriété de perpendicularité du champ électrique et magnétique pour une onde plane: 


à 2 
-F] : LES le =2- E | | = :] (37.287) 
2 
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ce qui implique: 


# 
An A ñ Añ É 
Êtr)r, = Étrrr, == É(r)r=c" = É(r)=—— (37.288) 
2 2 1 1 r 


Nous pouvons faire de même pour la composante du champ magnétique. 


Donc l'intensité 1 d'une onde électromagnétique sphérique se propageant dans le vide diminue en 1/r° 
puisque: 


ele gps À 1e BC 1e À 
2 2472 24 r 2 Ho r°  . 
(37.289) 
. te Êtr = 0ÿ 62 
2_1. de 1 _1.. À 
Î=-cHgË(r) 72477754 2 247 


et l'amplitude des champs électrique et magnétique diminue en 1/r. Par extension (information importante 
pour les téléphones portables), au vu des résultats démontrés précédemment, l'énergie transportée diminue 
donc en 1/r? puisque: 


| Pas 
ug =—'E"E" et uy=— 8" (37290) 
”. 
Il est facilement compréhensible maintenant d'appréhender pourquoi les physiciens utilisent 
systématiquement la fréquence pour caractériser une onde, car l'amplitude n'est pas constante dans le vide 
alors que la fréquence est une sorte de signature de l'émetteur qui ne se perd pas à travers l'espace vide!!! 


8. RAYONNEMENT SYNCHROTRON 


Considérons une charge en mouvement uniforme rectiligne. Les champs électrique et magnétique d'une 
telle charge ont été étudiés dans les chapitres précédents. Nous avons également démontré plus haut que 
le champ magnétique est dans cette configuration, toujours perpendiculaire au champ électrique. La 
première conséquence est que le champ électrique est radial et le champ magnétique transversal. 


Donc si nous entourons la particule en mouvement d'une surface sphérique fermée imaginaire, nous avons 
alors trivialement (voir la définition du vecteur de Poynting): 


_ r c'e Ex BE \oñdS = 0 (37.291) 


puisqu'effectivement, en tout point de la surface, £ en est perpendiculaire, 5 tangent, donc £ x 5 tangent 
aussi et donc l'angle entre £x 8 et * est égal à un angle droit donc le produit scalaire est nul. 


Donc en conclusion le flux total d'énergie rayonnée est nul pour une charge en mouvement rectiligne 
uniforme. Autrement dit, une charge en mouvement rectiligne uniforme, ne rayonne pas d'énergie 
électromagnétique mais transporte avec elle l'énergie du champ électromagnétique (nous voilà rassuré!). 
Ceci est confirmé par les observations expérimentales. 
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Cependant, la situation est très différente pour une charge en mouvement accéléré. Le champ électrique 
d'une charge accélérée n'est plus radial et ne possède plus la symétrie par rapport à la charge qu'il possède 
lorsque le mouvement est uniforme (nous allons le démontrer). Conséquence... une charge électrique 
accélérée rayonne de l'énergie électromagnétique et donc voit son énergie cinétique diminuer ! 


Une conclusion importante est qu'il faut, pour maintenir une charge en mouvement accéléré, fournir de 
l'énergie pour compenser celle perdue par rayonnement. Si la particule au lieu d'être accélérée est 
décélérée (c'est typiquement ce que nous cherchons à faire en radioprotection) à nouveau la particule va 
émettre de la même manière le même rayonnement (nous allons aussi le démontrer). C'est ce qui se 
produit, par exemple, lorsqu'une charge, telle qu'un électron ou un proton, heurte une cible à grande 
vitesse. Une fraction substantielle de son énergie totale s'en va sous forme d'un rayonnement appelé 
"rayonnement de freinage" ou plus communément "bremsstrahlung" (de l'allemand Bremsung: freinage; 
et Strahlung: rayonnement). 


Les équations que nous allons déterminer restent valables pour n'importe quel type de mouvement 
accéléré relativiste ou non. Par exemple, une particule chargée se déplaçant sur une orbite circulaire est 
soumise à une accélération centripète et émet donc du rayonnement. Par conséquent, lorsqu'un ion est 
accéléré dans un accélérateur cyclique, comme un cyclotron, un bétatron ou un synchrotron, une fraction 
de l'énergie qui lui est fournie est perdue sous forme de rayonnement électromagnétique, cet effet étant 
relativement plus important dans les accélérateurs cycliques que dans les accélérateurs linéaires. 


Quand les charges atteignent des énergies très élevées, comme cela se produit dans les synchrotrons où 
l'accélération est grande (heureusement pour nous car cela va nous permettre de faire une petite 
approximation fort utile...) les pertes dues au rayonnement, appelé "rayonnement synchrotron", 
deviennent importantes et constituent une limitation sérieuse dans la construction d'accélérateurs 
cycliques de très haute énergie mais restent cependant infiniment utiles à l'industrie de pointe. 


Une autre considération importante se rapporte à la structure atomique. Selon le modèle atomique de 
Rutherford ( ue ( ulaire), nous imaginons l'atome comme formé 
d'un noyau central chargé positivement, les électrons chargés négativement décrivant autour de lui des 
orbites fermées. Mais ceci implique, que les électrons se déplacent suivant un mouvement ayant une 
accélération et, si nous appliquons les idées développées jusqu'à maintenant, tous les atomes devraient 
rayonner continuellement de l'énergie (même en l'absence de source d'énergie extérieure comme le Soleil). 
Par suite de cette perte d'énergie, les orbites électroniques devraient se contracter, amenant à une 
réduction correspondante de la taille de tous les corps. Heureusement pour nous, cela ne s'observe pas (la 
matière ne s'effondre pas sur elle-même) mais cela nous amène donc à supposer dans le cadre du modèle 
de Rutherford que les mouvements des électrons dans les atomes est gouverné par certains principes 
supplémentaires que nous n'avons pas encore envisagés. C'est ce qui nous amènera à créer le modèle de 
Bohr de l'atome (cf. ue ( ire) mais qui aura, lui aussi comme nous 
le verrons, d'autres défauts. 


Pour déterminer l'énergie émise par une charge en mouvement accéléré nous allons devoir faire usage 
d'outils mathématiques qui ne sont plus du même niveau que ceux utilisés précédemment. Il est donc 
conseillé que le lecteur ait un bon bagage mathématique. Par ailleurs, exceptionnellement nous ferons 
usage de logiciels de calculs pour certains points du développement. 


Considérons tout d'abord la figure suivante: 
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M (point d'observation) 


Figure: 37.6 - Scénario à considérer pour l'étude du rayonnement synchrotron 


Lorsque la distribution de charges £17,£"i et la distribution de courant TiF,£'\se trouvent au point À, le 


point M reçoit l'onde électromagnétique émise par les charges et le courant lorsqu'ils étaient au point À 
c'est-à-dire à l'instant t (à cause de la vitesse limite de la propagation du champ dans l'espace). Le retard 
temporel est la durée de propagation depuis le point À vers le point M, soit: 


no ON 3500 
€ 
Donc: 
t=t + hs tt =$ — jy FO (37.293) 
€ 

Soit: 

L RFC) (37.294) 

€ 


Les potentiels scalaires et vectoriels associés respectivement au champ électrique et magnétiqeu au point 
de coordonnée vectorielle À au temps t ont au vu des résultats obtenus dans les deux chapitres précédents 
les expressions suivantes: 


UIR £\= 1 TT 

mat ET | 
.. HE av 295) 
AIR, 

D au Er D F-A 


où nous devons par contre de suite démontrer en détail que le potentiel vecteur associé au champ 
magnétique s'exprime bien ainsi! 


Remarque: Nous allons faire usage de ces deux relations de potentiel dans notre étude du champ 
rayonné car leur forme mathématique similaire nous permettra, du moins nous l'espérons..., de 
simplifier les développements. 
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Ces deux relations nous sont déjà partiellement familières, la première qui exprime le potentiel électrique 
(retardé) a été démontrée dans le chapitre d'EÉlectrostatique dans le cadre non relativiste (donc nos calculs 
risquent de ne pas être corrects si nous tombons sur un résultat qui dépend de la vitesse ! … nous verrons 
bien). 


Concernant la deuxième relation qui exprime le potentiel-vecteur retardé, nous avons vu plus haut que 
Ë = x 4 était toujours juste au gradient d'une fonction additive près pour 4 (de par les propriétés des 
opérateurs vectoriels différentiels) tel que: 


B=VxA=Vx| A+ V'wy = Vx A+ V XV y (37.296) 
0 


et que À soit sous forme relativiste ou non, nous avions: 


VXE = 4} + HET (37.297) 
! 


Rappelons aussi (cf. chapitre de Magnétostatique) que: 


a5 = JE gp e HT XF 
47 r 47 |Ff 


(37.298) 


Il s'ensuit que si nous posons: 


= fill 7209 


que nous retrouvons la loi de Biot-Savart puisque si et seulement si Ÿ ne dépend pas de r alors (trivial): 
VX fill = fAlXx 7 7300) 
Nous obtenons donc bien: 


= 3 [40 Jar 


D — =Vx TS: fifF = iv: fifFlixs = 
4x ff 


FÉ FF (37.301) 


Bien que cette forme du potentiel vecteur ne donne que la loi de Biot-Savart sous forme non relativiste, 
comme elle satisfait toujours: 
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elle est quand même valable dans le cadre relativiste car cette équation de Maxwell ne dépend pas de la 
vitesse. De plus, si nos résultats dans l'étude du rayonnement synchrotron nous donnent à la fin une 
expression indépendante de la vitesse, nous aurons encore une fois confirmé cet état de fait. 

8.1. POTENTIELS DE LIÉNARD-WIECHERT 


Soit le cas où une particule de masse m et de charge q parcourt une trajectoire L'. Par rapport à un point 
origine O, sa coordonnée vectorielle est ©P ={£), son vecteur vitesse sera noté: 


Ÿ =d,h(® (37.303) 
et son accélération: 
ä =d?h(€) (37.304) 


Si la charge ponctuelle q se situe à l'origine O, nous avons vu dans le chapitre de Calcul Différentiel Et 
Intégral que la fonction de Dirac nous donne: 


+ 


[a6Goax =g (37.305) 


ainsi que si la charge ponctuelle q se situe à une abscisse x,, nous avions: 


h 5( )d ses, 
XX X = 37.306 
[* û 0x" x ( ) 


Ce qui vient d'être dit pour un espace à une dimension peut aussi être appliqué à un espace à trois 
dimensions comme nous l'avions vu et nous écrivons alors: 


g(r,t)=qôir -h(@)| (37.307) 
Si nous choisissons pour unités pour la fonction de Dirac des [##*], alors nous pouvons écrire: 
p(r,5) = gôir -h@)| (37.308) 


où q est alors la charge totale au point F. 


Pour la distribution de la densité de courant, nous avons de même toujours en choisissant les mêmes unités 
que pour la fonction de Dirac: 


T(F,8) = g8iF-ht)id hs) = g6iF-h(t)\5 (27.300) 


Dès lors au point M, les potentiels au temps t ont pour expression: 
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1  46iR-hGNIar 


ÂTE, [FR -F| 


arts À aôlR-ht)ir'ar (37.310) 
ou Dee ET — 


C'est une formulation bien utile (un détour) qui va nous permettre de résoudre notre problème. 


Pour cela, lorsque la charge se trouve au point À au temps t', nous posons: 


… 


k'=h(" v'=v() à'=a(t) (37311) 


Nous allons utiliser un long artifice afin de résoudre l'intégrale du potentiel électrique (qui est donc une 
intégrale multiple en coordonnées cartésiennes)! 


Celui-ci commence en multipliant le facteur sous l'intégrande de U(R,:) par: 
af td JR |" ) (37.312) 
cela ne modifie pas l'intégrale puisque: 
f'=t- |R- Fe” Si i+ IR-FÎe" =0 (72313) 
et que (cf. chapitre de Calcul Différentiel Et Intégral): 
8(0) =1 (37314) 


Nous disposons alors de l'expression suivante dans laquelle apparaît le temps f: 


mate 
a 


ER TA R-F 
[7 » _ ) 0) dxdydrat (7.315) 
EM) | 


Lt 4 Meg _…. F-rO)] | 
RE e sea 14 —— [éxdydrdt 


ce que nous avons le droit d'écrire car la deuxième intégrale ne dépend pas explicitement de f. 


Bon maintenant si nous essayons de résoudre cette intégrale, nous allons y passer notre vie. pour rien. Il 
va falloir être astucieux. 


Avant de rechercher une solution de cette intégrale, nous devons d'abord traiter le cas plus général de 
l'intégrale suivante: 


ORALE AC RAR ICRA Z2)ERAE771)777 72000) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Soit écrit de manière plus condensée: 


: ÉSAS AE AÉFACEMCEAC: 77 ee 0 
qu'il est facile de rapprocher avec l'intégrale antéprécédente: 
f =|R-7 | 


EE ee 
E fvfafsfs ]5 ÂTE, JR-F6| AE, f 


fi ]= SR -4,€)) 


[ 

[A] 

6[.f; ]=6(8, -x,() 
[A] 

[A] 


(37.318) 
Ô| F: [= OCR, —- 4,67) 


s[# cafe RON 


€ 


où nous nous sommes donc arrangés pour que 1; 2 3/4 ne dépendent respectivement (explicitement) 
que de x, y,zet f!. 


Nous souhaitons maintenant faire le changement de variables: 
XD, Y {1:21 7, (739) 


Nous rappelons que dans des changements de variables dans les intégrales multiples (voir le Jacobien dans 
le chapitre de Calcul Différentiel Et Intégral), nous avons, en passant des coordonnées cartésiennes aux 
coordonnées curvilignes les relations suivantes: 


8(x,y,z) 


Î = [F(x,y,2)dxdy de = [Gururs) ne) Ê dr drz (37.320) 


D 


où pour rappel: 
n=n(2),2), M ="Ûx,y,2), "= r3(2x,y,Z) (37.321) 


et où: 


(x, y,z) 


Bron) (37.322) 


n'est pas une valeur absolue mais le déterminant d'une matrice! 


Or, dans notre cas traité, rappelons que nous avons tous les f. qui sont nuls et donc: 
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et au cas où pendant les développements un des f; ne le serait plus pour des raisons encore non 


déterminées, nous aurions: 
[À] 400 =0 (37.324) 


L'intégrale multiple devient alors: 


8(x,y,z,4 1 


dfdfdf4 " 
een PO) 


f,=0 


1=felf. 2.8, AN8i ll 41841614) 


où le terme entre accolades est pris à f; = 0 par nécessité de la construction des développements 
précédents préparant l'artifice mathématique! 


Et rappelons encore une fois (!!) la propriété des fonctions de Dirac: 


[eté(nar=[e0)], 67:26) 


Nous avons alors immédiatement la simplification: 


8(x,y,z,t') 


LT DO0 eme: 
L-2..4] A fi,f2f3, fa) 2.0 


(37.327) 


où: 


O(2x,y,2,1") 
A ff2.f3 fa) 


(37.328) 


est donc le Jacobien de la transformation de l'artifice... 


Il est évident que par construction du Jacobien, nous avons: 


à : : = 
8(x,y,z) | (r F2 r;) = |det( | [det( D =1 (37.329) 
8(nsrrs) O(x,y,2) 
Dès lors il vient: 
O(x,y,z) L Ann) (37.330) 
arr) O(x, y,z) | 


Pour l'intégrale 1 nous avons alors: 
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1=g[A.f.f.#l 


(37.331) 


1 
(f1.f2,f3 fa) 
O(x,y,z,6') 


Calculons donc maintenant notre Jacobien...: 


1 


Dh Oxfr fs Of 
£ 6) 6) 6] 6] 
[det(J)| À = [det vh Os 0vfs Ov (37.332) 
GE Ouf GS Of 


Oh Oh dk Ouf 
En revenant au cas traité, À—h({') a donc pour composantes: 


fi=R-kC)=x-h, 
fa=R,-h()=y-h, 


f:=R-RG)=z-4, (37.333) 
R-F(E XD +(F-y) +(Z 2) 
nr OO), Ne ++ a 
[a C 
Ainsi, nous avons le calcul des éléments de l'inverse du Jacobien: 
X —-x hs 
d,f=1 fa = 0 fs = 0 Gf4 = D _ 4,1 
clR-F« )| 
y 
0,f, =0 d,%=1 8,%=0 8,f =-— 
det( NT" =ldet| ” / / / IR-F] | 6733 
Z—Zz 
8. = 0 fa = 0 Gh=1 fh=-1— 1 
clR-Fc) 


Of = }, Op fa = —h, Of = —}, Opfs =] 


Bon maintenant que nous avons les composantes de la matrice Jacobienne, il ne nous reste qu'à calculer 
son déterminant. Donc soit nous utilisons la relation générale du calcul de déterminant démontrée dans le 
chapitre d'Algèbre Linéaire, soit nous utilisons Maple. Alors histoire de gagner un peu de temps faisons- 
le avec Maple 4.00b: 


>with(linalg): 
> A:= matrix(4,4,[1,0,0,a,0,1,0,b,0,0,1,c,d,e,f,1]); 
où: 
F0 0. 
re 0 1 0 à . 
= 0 0 1e (37.335) 
d æ TJ | 
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avec: 
X —-x 
EE ——— © 
clR-r)] 1j 
la 1 
5 c[R-Fe | et e= KL (37.336) 
Z-Z f=h 
EE ==> 
ro) 


Continuons avec Maple 4.00b: 
>det (A); 
Ce qui donne: 
1-cf-eb-da=1-(fc+eb+da) (37337) 


L'inverse du Jacobien a alors pour expression: 


ëJ À x st F=y : AE 
RE A 
| | Er 1 | = ee 1 à 5) 
: . | _ | (87.338) 
” R(X-x)+4,(F-y) +4, (7-2) L h o[R-F() _|_ s'o(R-F() 
c|R-Ft)| cR-r(«)] 


clR-r6)| 
où nous avons utilisé le produit scalaire dans la dernière relation afin de condenser l'expression. 


-1 


Idet{7)[" = 


Soit: 
L 1 
det{J)] = — 
| | L_?" : (A — FE )) (37.339) 
ce JR-r6)] 


L'intégrale multiple: 


1 
INSERT EE 
D | (87.340) 
> Ÿs LA f=0 
où pour rappel: 
1 
ARR Es er (37.341) 


soit autrement écrit: 
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AAA | 7 


: 47E, |( X x 
2 
y (37.342) 
Z Z 


mais suite à notre changement de système de coordonnées nous avons pour rappel: 


el ff] 


HA 
>= ener ia reel 1] 


(37.343) 


Or, rappelons encore une fois que: 
[eté(ar=[ot)]n 67329 


Donc il faut prendre g en 1 = 3 = fa = f4 = OI II vient: 


[eg 


de-ne-ery(-EO) 


Ce qui permet d'écrire: 


APR AE ET el F4] 


(37.346) 


Il en est de même pour: 


fer D? = ——} 
y : (A — FE )) (37.347) 
Fo] 
qui s'écrit alors: 
1 
Idet{N)T" = — 
1 | : (R-# 1 (37.348) 
R-h\| 


Finalement la résolution de l'intégrale I s'écrit: 
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1 


1=g[f, pee RES = g[Â,h,/./a| R F) 
TT be LOL RER 
le. 
__i 4 1 1 
À D _L i D_L! D_L! 
ni ail CA à “JR-# à, 
FA | 


On accède ainsi enfin aux expressions des potentiels. 


- Le potentiel scalaire s'écrit: 


- Le potentiel-vecteur s'écrit: 


g6(R-hE))5'aV a gere h')5' 


AR, 9 = À 


ps ro “4 1 dxdydz (37.351) 


IR) 


Compte tenu de l'intégrale qui est quasiment la même que pour le potentiel scalaire excepté le terme ÿ", 
nous arrivons en faisant les mêmes développements que précédemment à l'expression: 


En résumé, les potentiels pris à l'instant (retard temporel de propagation): 


R— FE 
ee SO) (37.353) 
| 43 
ont pour expressions: 
* 1 
U(R,f) = — 
S (37.354) 
AR, 1 = He? 
AZ 5 


ces potentiels sont appelés "potentiels de Liénard-Wiechert" avec: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


V 
à Fe] (37.355) 
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Notes personnelles: 
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38. ÉLECTROCINÉTIQUE 


L. développement de l'électrodynamique a permis à une grande partie de l'humanité de modifier 


considérablement sa qualité de vie. Nous savons à peu près tous aujourd'hui ce que nous lui devons: 
lumière, frigo, radio, télévision, ordinateurs, voitures, trams, trains, avions, robots, et d'autres choses 
merveilleuses et parfois moins aussi. 


Avant de commencer à étudier l'électrocinétique (les ingénieurs parlent "d'électronique" ou 
"d'électrotechnique") nous allons définir les deux lois (le terme est mal choisi puisque la première est 
démontrée dans le chapitre d'Électrostatique et la seconde dans le chapitre d'Électrodynamique mais bon... 
conformons-nous à la tradition...) fondamentales de l'étude de l'électrocinétique et la terminologie de base 
des circuits ou installations électriques (les cas pratiques étant étudiés dans le chapitre de Génie 
Électrique). Même si certains éléments au début ne seront peut-être pas compris de suite par le lecteur, 
ceux-ci deviendront triviaux au fur et à mesure de l'avancement de sa lecture. 


Définitions: 


D1. Un circuit électrique est constitué d'un ensemble de dispositifs appelés "dipôles", reliés entre eux par 
un fil conducteur. 


D2. Un "noeud" d'un circuit est une interconnexion où arrivent 3 fils ou plus. 
D3. Une "branche" est un tronçon de circuit situé entre deux noeuds. 
D4. Enfin, une "maille" est un ensemble de branches formant une boucle fermée. 
Remarque: Un dipôle s'insère dans un circuit par l'intermédiaire de deux pôles, l'un par où s'effectue 


l'entrée du courant (borne +), l'autre la sortie (borne moins) selon la convention des physiciens (celle 
des électriciens est l'inverse...). 


Le dipôle est caractérisé par la réponse du courant I à une différence de potentiel U entre ses bornes: c'est 
à dire par la courbe caractéristique: 


I= ff) (G81 


Nous verrons que dans tout conducteur, la présence d'une résistivité (voir plus loin) entraîne une chute de 
tension et, en toute rigueur, il en va de même pour les fils. Mais ceux-ci étant mis en série avec d'autres 
dipôles, nous négligeons en général dans les petits circuits la résistance des fils devant celle des dipôles 
présents. Donc, les fils situés entre deux dipôles d'un circuit seront supposés équipotentiels (le potentiel 
est le même sur les deux bornes). 


1. LOIS DE KIRCHHOFF 


Les lois de Kirchhoff en électrocinétique (à ne pas confondre avec celles de la thermodynamique et de 
l'optique) expriment les propriétés physiques de la charge et du champ électrique et sont donc au nombre 
de deux (une loi pour chaque). 
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Elles vont nous permettre sans faire appel à l'artillerie mathématique implicitement cachée derrière 
d'obtenir simplement des résultats forts pertinents. 


1.1. LOI DES MAILLES 


La loi des mailles (implicitement il s'agit simplement de la conservation de l'énergie) exprime le fait que 
lorsqu'une charge parcourt un circuit fermé (chemin fermé), l'énergie qu'elle perd en traversant une partie 
du circuit est égale à l'énergie qu'elle gagne dans l'autre partie. Ainsi, la somme algébrique des potentiels 
le long d'une maille est nulle telle que: 


S'U=0 
maille 


Pour cela, il faut choisir arbitrairement un sens de parcours de la maille et convenir que les tensions dont 
la flèche pointe dans le sens du parcours sont comptées comme positives et les autres comme négatives. 


Remarque: Cette loi exprime tout simplement le fait que le champ électrique (Coulombien) est un 
champ conservatif comme nous l'avons vu dans le chapitre d'Électrostatique. 


1.2. LOI DES NOEUDS 


La loi des noeuds (implicitement il s'agit simplement de la conservation du courant) exprime la 
conservation de la charge qui signifie que la somme des courants sortant d'un noeud (un noeud peut être 
vu comme un séparateur de lignes de champ - in extenso des volumes rattachés par une même surface) est 
égale à la somme des courants entrants. Autrement dit, la somme algébrique des courants est nulle en tout 
noeud d'un circuit tel que: 


S 1=0 


Pour cela, il faut choisir un signe pour les courants entrants et le signe contraire pour les courants sortants 
(comme nous le faisons en thermodynamique avec la masse). 


Remarque: Cette loi exprime tout simplement l'équation de conservation de la charge (ou de continuité 
de la charge) que nous avons démontrée aussi dans le chapitre d'Electrodynamique. 


2. MODÈLE DE DRUDE 


Le modèle de Drude de la conduction électrique va nous permettre d'introduire les concepts élémentaires 
de l'électrocinétique. Dans un premier temps, nous allons définir dans ce qui va suivre les concepts de 
courant, de densité de courant et ensuite de résistance. 


Un conducteur électrique (nous ne parlons pas de semi-conducteurs ou supraconducteurs à ce niveau du 
discours) peut être vu de manière très simplifiée comme un tuyau de section $' contenant un gaz 
d'électrons formé de n charges élémentaires q par unité de volume. 
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En l'absence de champ électrique, chaque électron possède une vitesse moyenne vectorielle nulle car il 
reste au voisinage de l'atome. Sous l'action d'un champ électrique Æ homogène et constant (cas du courant 
continu donc!), certains électrons sont déplacés dans une direction privilégiée, jusqu'à ce qu'ils entrent en 
collision avec un autre atome (aspect classique) où ils reprennent une vitesse moyenne de dérive nulle et 
ainsi de suite. 


C'est le modèle le plus ancien et le plus élémentaire du courant électrique. Les bases en furent jetées par 
Drude en 1902, peu après la découverte de l'électron par Thomson (1897). D'où le nom de "modèle de 
Drude". 


Insuffisant pour concevoir et a fortiori développer les composants qui forment depuis la fin du 20ème 
siècle l'essentiel des éléments actifs utilisés en électronique, le modèle des boules de billard présente 
néanmoins des intérêts considérables: 


- C'est un auxiliaire utile pour donner à notre esprit une image de phénomènes dont nous n'avons en fait 
aucune perception directe, puisqu'ils se déroulent dans l'infiniment petit. 


- Les résultats, pour l'ingénieur, de théories plus exactes, comme la théorie des bandes d'énergie en 
particulier, se laissent formuler au moyen des mêmes concepts que ceux qui apparaissant dans le modèle 
Boules de billard. Citons parmi ceux-ci le nombre volumique et la mobilité des électrons. 


- Tout primitif qu'il soit, ce modèle conduit à une interprétation phénoménologique intéressante des lois 
fondamentales telles que la loi d'Ohm ou la loi de Joule. Il lie les phénomènes microscopiques à certaines 
grandeurs observables. 


Son nom l'indique, ce modèle assimile les électrons à de minuscules boules de billard. Ces particules sont 
donc des objets classiques, simplement régis par la loi de Newton et les lois de Maxwell. Cette conception 
corpusculaire de l'électron n'est d'ailleurs pas totalement opposée aux résultats de la mécanique quantique, 
dans laquelle un paquet d'ondes, peut toujours être interprété comme une particule, avec sa masse et sa 
vitesse (voir le théorème d'Ehrenfest dans le chapitre de Physique Quantique Ondulatoire). 


Dans un millimètre cube de cuivre, nous admettrons que le nombre d'électrons est tellement élevé qu'il 
n'est donc alors pas question de les traiter individuellement, ce qui serait d'ailleurs sans intérêt. C'est le 
comportement moyen des électrons qu'il convient d'étudier. Deux types d'interactions conditionnent ce 
comportement, ce sont: 


- l'interaction des électrons avec la matière dans laquelle ils évoluent, et dont ils font partie; 
- l'interaction des électrons avec les champs électromagnétiques appliqués de l'extérieur. 


La distance À parcourue par un électron est appelée "libre parcours moyen de l'électron de conduction" et 
si T est l'intervalle de temps entre deux collisions successives alors nous avons trivialement: 


A=V'T 


Le temps de collision est une variable aléatoire. Tous paramètres physiques restants constants, cette 
variable aléatoire est stationnaire, sa valeur moyenne porte le nom de "temps de collision moyen". 


Nous supposons que: 
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la vitesse moyenne, est créée par l'accélération du champ électrique: 


(g°£) 


F . 
a=—=— (38.6) 
De He 


Nous obtenons alors la " vitesse moyenne de dérive" ou "vitesse d'entraînement" des électrons (drift 
velocity) donnée par: 


Cette relation est nommée ainsi, car leur vitesse initiale est due à l'agitation thermique entretenue de 
l'environnement extérieur et correspond à la vitesse thermique dont nous avons déterminé l'expression lors 
de notre étude de la distribution de Maxwell-Boltzmann dans le chapitre de Mécanique Statistique (nous 
en calculerons les valeurs un peu plus bas dans le présent texte). 


Nous admettons donc, dans le cadre du modèle Boules de billard, que les électrons se comportent comme 
les atomes d'un gaz parfait. C'est une hypothèse grossière mais suffisante pour l'instant! 


La vitesse moyenne est supposée identique pour tous les électrons libres lorsque le champ électrique 
appliqué est supposé uniforme, stationnaire, et dirigé selon un seul axe. Elle permet de définir "l'intensité" 
I du courant électrique dans le conducteur. 


Définition: Le "courant" ou "intensité" 1 mesure la charge 4 = #'4 qui traverse la section droite S d'un 
conducteur par unité de temps dt et est donc donné selon ce qui a été montré juste avant par: 


dt 


Une tranche de conducteur, de volume 4} = $': dZ contient donc la charge: 
dQ = a = p,SdL (89) 


Elle traverse la section S en un temps dt, tel que: 


di, =vdf (38.10) 
Le courant s'écrit alors: 
à 
1-8 -p "SV (38.11) 
dt 


Si J'est vu comme le flux d'une "densité de courant" J à travers la surface S, nous avons alors: 


I1=$J'dS=J"S 
5 


(38.12) 


la densité de courant étant supposée constante sur chaque point de la surface. 


Nous avons donc: 
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1=p, Sv=J"S 


et après simplification: 

J=p,'v 
qui est donc l'expression de la "densité de courant" dans le conducteur. 
Comme nous connaissons l'expression de la vitesse, nous pouvons écrire: 


x 2 US 


Le] 


J E 


En nous définissons la "conductivité" par: 


PAT nt 
jm tt et 


m ma 


où cette fois n désigne non pas le nombre d'électrons, mais le nombre volumique d'électrons! Par 
définition, la "résistance" est l'inverse de la conductivité. 


Nous remarquons que la conductivité contient le produit du nombre volumique des électrons par leur 
mobilité. Il faut par conséquent que l'une au moins de ces grandeurs ait une valeur élevée pour qu'un 
matériau présente une haute conductivité. 


La mobilité est plus grande dans les semi-conducteurs que dans les métaux. Cette caractéristique est 
cependant complètement masquée par le rapport des nombres volumiques des électrons: n est 1'000'000 à 
100'000"000 fois plus faible dans les semi-conducteurs que dans les métaux, ce qui explique la 
conductivité supérieure de ces derniers. 


Selon la relation: 


PAT nt 
one ot À À 
FR LC) 


démontrée juste plus haut, la conductivité dépendrait du champ électrique, par l'intermédiaire du temps de 
collision. En effet, plus le champ électrique croît, plus la vitesse des électrons augmente. La distance entre 
les points de chocs possibles restant la même, le temps de collision, et par conséquent la conductivité, 
devraient diminuer (et donc la résistance augmenter!). 


Or, l'indépendance de la conductivité (et respectivement de la résistance) avec le champ électrique est un 
fait expérimental établi avec précision dans tous les conducteurs habituels dans des conditions normales 
d'utilisations civiles. 


L'origine de cette contradiction réside dans la différence considérable des ordres de grandeur de la vitesse 
thermique donnée par la distribution de Maxwell-Boltzmann ( ): 


rs JT 
LV >= ev >= [— 
Le 
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et la vitesse moyenne de dérive vue plus haut: 


avec le temps de libre parcours moyen qui sera obtenu à l'aide de l'expression: 


1: 2 
PL AREA MR 


mi Le: 


(38.20) 


Nous avons vu dans le chapitre de Mécanique Statistique que pour un électron à température ambiante: 


F7 
<vy > 1.2-10 | (8.21) 
5 


Et calculons la vitesse de dérive pour le cuivre avec dans ce métal particulier les valeurs suivantes: 
e=581.107 [Q']et#=116.10 [m$] (Gs22) 


Ce qui nous permet d'obtenir la valeur: 


TM = 
PE = 179.107 [s] (3823) 


T = 


et donc: 


RE < t 9 Le LT HE (38.24) 


En prenant Æ = 0.32 [F. mr! ], ce qui est à considérer comme une valeur élevée puisque ce champ produit 
une densité de courant de: 


2 
FL pets 10 [A m?]-186 [A mm?] (38.25) 
FR 
nous avons finalement: 
.E 
= (TE) 379.10 21.10 [ms] (38.26) 


Le) 


Par conséquent, même dans un fort champ électrique industriel, la vitesse de dérive est négligeable par 
rapport à la vitesse thermique. 


Comme la vitesse thermique ne dépend que très peu du champ électrique, il s'avère qu'en pratique la 
vitesse des électrons est indépendante du champ électrique. En d'autres termes, l'établissement d'un 
courant, même intense, n'a qu'une incidence absolument négligeable sur la vitesse des électrons! 
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Remarque: Dans la très grande majorité des cas, les dimensions des conducteurs sont grandes, 
comparées à la distance moyenne parcourue par un électron entre deux chocs consécutifs. Le 
comportement des électrons à la surface du conducteur revêt alors une importance secondaire. C'est la 
raison pour laquelle le milieu conducteur est souvent, implicitement, considéré comme infini. Les 
transistors FET et MOST constituent à cet égard une exception importante. Le courant y circule dans 
une couche suffisamment mince pour que la mobilité des électrons soit affectée par la diffusion des 
électrons aux surfaces délimitant cette couche. 


Cependant, un point important à constater est le calcul du libre parcours moyen des électrons dans le 
modèle classique de Drude. Nous avons effectivement: 


Î=vy T=E2 [ue] 


qui est donc très supérieur, d'au moins un ordre de grandeur (facteur 10), aux distances interatomiques. Il 
en résulte que les collisions successives sur les atomes du réseau ne sont pas responsables de la loi d'Ohm 
(que nous allons voir maintenant) contrairement à une des hypothèses de départ du modèle de Drude mais 
que ce sont les impuretés et les défauts du matériau qui en sont responsables! Nous verrons aussi un peu 
plus loin qu'avec le modèle théorique des bandes d'énergie le libre parcours moyen est au fait nettement 
plus grand encore! 


Attention!!! Cette relation peut faire penser que puisque le libre parcours moyen est proportionnel à la 
vitesse thermique et donc proportionnel à la racine carrée de la température, alors la résistance diminue 
avec la température. Mais en fait il n'en est rien! Le modèle de Drude est trop simpliste car en réalité c'est 
l'inverse qui a lieu pour les conducteurs (la résistance augmente avec la température parce que l'intervalle 
de temps ? entre deux collisions diminue plus vite que la vitesse augmente). Et puis il y a aussi le 
problème inverse... à température presque nulle le libre parcours moyen serait presque nul or les 
supraconducteurs nous montrent bien qu'il n'en est rien! Bref, sans relation explicite en fonction de la 
température nous sommes dans l'obscurité la plus totale! 


La seule chose que nous savons faire c'est admettre qu'à un & facteur constant près (positif ou négatif), 
une variation de la température implique une variation relative de la résistance selon: 


BR AT 
À 
soit: 
R- 
X =aœiT-T) 
À 


d'où la relation connue dans les petites classes: 


R= Rli+aiT-T)] 


Enfin, précisons que la quatrième équation de Maxwell ( ue) peut alors s'écrire 
au vu des résultats obtenus ci-dessus: 
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qui fait alors apparaître explicitement le coefficient de conductivité. 
3. LOI D'OHM 


À partir de la relation démontrée précédemment: 


et en prenant la définition de la "conductivité" par: 


1: r | 
para Tr nd te 


(38.33) 


D mn 
Il vient finalement: 


qui est la "loi locale d'Ohm". Nous la retrouverons sous forme différentielle dans le chapitre de 
Mécanique Statistique et nous verrons qu'elle appartient au fait à la famille des lois de diffusion! 


Remarque: Puisque la conductivité est nécessairement un scalaire, l'écriture vectorielle de la 

loi d'Ohm implique que les lignes de champ électrostatiques indiquent également le chemin pris par 
les charges électriques. Par ailleurs, comme la conductivité est un scalaire nécessairement positif dans 
le modèle classique, ceci implique que le courant a la même direction que le champ électrique. 


Si nous multiplions l'égalité sous forme scalaire à droite et à gauche par L nous obtenons: 
ÿ 
(38.35) 
Donc nous avons: 


1=G'U ou U ee, (38.36) 
G 


Nous définissons l'inverse de la conductivité comme la "résistance électrique" définie par: 
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Remarque: Il est important de remarquer que la résistance électrique est proportionnelle à la longueur 
de l'élément résistif et inversement proportionnel à sa surface de section. Par exemple dans les câbles 
hautes tensions la résistance est donnée en Ohm par kilomètre, ce qui permet ensuite de calculer la 
puissance perdue par kilomètre et donc aussi l'argent perdu par perte Joule. 


Dès lors, nous pouvons écrire la loi d'Ohm sous sa forme la plus communément connue: 


où donc (attention!!!) le potentiel U représente la différence de potentiel sur la longueur de l'élément 
résistif (appelé également "dipôle résistif") comme nous le voyons dans les développements et non pas le 
potentiel total extérieur! 


Remarque: Cette relation n'est valable que pour des conducteurs idéaux dans des conditions normales 
de températures et de pression et pour lesquels le modèle de Drude s'applique. Donc les semi- 
conducteurs et supraconducteurs en sont exclus. 


Puisque U est le potentiel de l'élément résistif, nous faisons alors souvent référence dans le domaine de 
l'électrotechnique à la "chute de potentiel" (effectivement, au-delà de l'élément résistif le potentiel n'est 
plus le même qu'au point qui précède ce même élément résistif). 


Pour les câbles en cuivre typiques d'usage non industriel, il existe une table américaine très utile dans la 
pratique donnant avec une relativement bonne tolérance la résistivité en fonction du diamètre et le courant 
maximal admissible. Voici un échantillon de cette table: 


Diamètre du fil | Résistance en Courant max. Courant max. 
en mm (avec | Q par mêtre théoriquement admissible à théoriquement 
isolant) l'air libre en Ampères || admissible en Ampères 


— . D. 
Ca 2 | 
Codes AWG (source: Wikipédia) 


Tableau: 38.1 - 


où AWG signifie "American Wire Gauge" et correspond à une petite jauge qu'on peut acheter pour 
rapidement déterminer le diamètre d'un câble à l'aide de la table ci-dessus sans avoir un pied à coulisse: 
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& 
Ÿ 
En) 
E 
ri 
Le 
2 


% STANDARD $ 
VIRE GAUGE 


3.1. RÉSISTANCES ÉQUIVALENTES 


Nous pouvons maintenant nous intéresser sur toute la longueur d'une ligne de champ électrique parcourue 
colinéairement par un courant I supposé constant en tout point (c'est une approximation donc...) à la 
résistance totale si n éléments résistifs À, sont mis les uns à côtés des autres linéairement. 


La réponse est relativement simple puisque si nous notons L/,, le potentiel à la première extrémité de 
l'élément résistif et L/, l'autre extrémité, nous avons alors (le lecteur remarquera que l'usage de la loi des 


mailles dans la relation suivante se fait logiquement sans même avoir nécessairement connaissance de 
celle-ci): 


U'=(U -0)+@ -0,) +... -0,) = Ri+RI+. +R, 


c'est-à-dire un résultat analogue à celui obtenu par une résistance unique dont la valeur est donnée 
approximativement par (si le courant est constant sur toute la ligne) la "résistance équivalente de 
résistances en série": 


qui est la somme arithmétique des résistances individuelles. 


Considérons maintenant n résistances en parallèles toutes sous une tension U (de par la loi des mailles) et 
alimentées par un courant I. Le courant se sépare alors en n courants: 


Fe 


À 


Dans chacune des n branches. En vertu de la loi des noeuds, nous avons: 


Lei Le 
il À À, 


c'est-à-dire que l'ensemble des résistances mises en parallèle est analogue à une "résistance équivalente de 
résistances en parallèle": 
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donnée donc par la moyenne harmonique (cf. chapitre de Statistiques)! 


Le fait de brancher des appareils en parallèle permet donc d'avoir toujours la même tension aux bornes de 
ceux-ci. C'est ainsi que sont disposées par ailleurs les prises électriques dans une installation domestique! 


3.2. CAPACITÉS ÉQUIVALENTES 


Nous pouvons de même, appliquer le même type de raisonnement aux capacités. Rappelons que nous 
avons défini dans le chapitre d'Electrostatique, la capacité comme étant donnée par: 


ne 


(38.44) 
U 


Considérons, au même titre que les résistances, n condensateurs de capacités €; mis en série les uns 
derrière les autres. Nous portons aux potentiels £, et EL, les deux extrémités de la chaîne et nous 


apportons la charge Q sur l'ensemble du système. Le potentiel (tension) total aux bornes de la chaîne de 
condensateurs s'écrit alors simplement: 


US Pl E À MC =) RUE 66 1#,. + CEE = -2:%+.+£.0 


où nous retrouvons une moyenne harmonique. 


Considérons maintenant n condensateurs de capacités C; mis en parallèle avec le même potentiel U. La 
charge électrique de chacun d'entre eux est alors imposée (de par la loi des mailles) par la relation: 


Q, = CU (3847) 


La charge électrique totale est simplement: 


Êe Yo . vŸ c (38.48) 
il 


i=] 


ce qui correspond à une "capacité équivalente de capacités en parallèle": 


# 
il 


qui est la somme arithmétique des capacités individuelles. 
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4. FORCE ÉLECTROMOTRICE 


Soit une portion AB d'un circuit, parcourue par un courant permanent I allant de À vers B. L'existence de 
ce courant implique que le potentiel en À est supérieur (différent) en valeur absolue à celui en B (en valeur 
absolue). Cette différence de potentiel se traduit par l'existence du champ électrostatique £ produisant 
une force de Coulomb: 


… 


F=QË (38.50) 
capable d'accélérer une charge q. 


Ainsi, soit: 


la puissance nécessaire pour communiquer une vitesse v à une particule de charge q quelconque. Sachant 
que dans ce conducteur il y a &, porteurs de charge par unité de volume, la puissance totale P mise en jeu 
dans le brin AB parcouru par un courant I est: 


B B 3 
P= [rar - [apres - fafre vas - [af 2, 4" E via 
(38.52) 


3 2 3 
ARE LS (Es 0) = PAU = IUT 
4 À 4 


c'est-à-dire: 
(38.53) 
OÙ: 
mt, -0, 20 (6854 


Cette puissance est donc la "puissance électrique" disponible entre À et B, du simple fait qu'il y circule un 
courant 1. 


Si nous considérons dans ce circuit AB une partie résistive pour laquelle nous mesurons une différence de 
potentiel: 


U=R.I (3855) 
alors la puissance disponible à l'intérieur de celui-ci est donnée par la "puissance joule": 
P J 
EP, =R'F| G856) 


Ainsi, parmi cette puissance disponible, une certaine partie est dissipée sous forme de chaleur (effet Joule) 
dans un dipôle passif tel que la résistance. Évidemment c'est cette puissance que nous facture notre 
compagnie d'électricité et connaître l'énergie consommée, il suffit de multiplier la puissance de l'appareil 
que l'on utilise par la durée de fonctionnement. 
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Cependant, quelque chose cloche dans nos développements précédents si nous y regardons de plus près. 
Effectivement, si nous appliquons le raisonnement à un circuit fermé, c'est-à-dire si nous regardons la 
puissance totale fournie entre À et À par la force de Coulomb, nous obtenons (bien évidemment puisque le 
champ électrostatique coulombien est conservatif): 


A 
P=L' (88 = (Ua -Ua)= 1:00 


c'est-à-dire une puissance nulle?! Eh oui! Cela signifie qu'il ne peut y avoir de courant en régime 
permanent dans une boucle fermée et lorsque qu'il y a un courant, alors cela implique que la force de 
Coulomb n'est pas responsable du mouvement global des porteurs de charge dans un conducteur!! 


Dès lors, le courant dans un conducteur peut être compris avec l'analogie de la rivière circulant dans son 
lit. Pour qu'il y ait un écoulement, il faut que l'eau s'écoule d'une région plus élevée vers une région plus 
basse (d'un potentiel gravitationnel plus haut vers un autre plus bas). Ainsi, le mouvement de l'eau d'un 
point élevé vers un point plus bas est bien dû à la simple force de gravitation. Mais si nous voulons 
constituer un circuit fermé, alors il faut fournir de l'énergie (grâce à une pompe) pour amener l'eau à une 
plus grande hauteur et le cycle peut alors recommencer. 


C'est exactement ce qui se passe dans un circuit électrique. Si nous voulons qu'un courant permanent 
circule, 1l faut qu'une autre force que la force électrostatique permette aux charges de fermer le chemin 
(c'est un raisonnement purement mathématique) ! C'est à ce titre que nous devons faire intervenir une 
source d'énergie "artificielle" externe tel que le "générateur électrique" qui est alors l'équivalent de la 
pompe hydraulique pour l'eau. 


Le générateur doit alors nous imposer comme propriété physique que lorsque son circuit est ouvert 
(courant I étant alors nul) une "différence de potentiel" D.D.P. se maintienne entre ses bornes impliquant 


nécessairement la présence d'une autre force compensant l'attraction coulombienne du conducteur. Aïnsi, 
la force totale s'exerçant sur une charge q s'écrit dès lors: 


avec Ë, étant le champ électrostatique et Æ,, le "champ électromoteur". À l'équilibre et en l'absence de 
courant, nous devons avoir: 


es 


Ë.+E,, =Ù 


Cela signifie que la D.D.P. aux bornes d'un générateur ouvert vaut alors: 


Nous appelons et notons: 
8 er _ 
27 [Ed Un is #0 


(un peu maladroitement) la "force électromotrice" FEM propre du générateur. 
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Puisque, à l'intérieur du générateur, nous avons: 


es 


Ë. = -Ë,, #0 


à circuit ouvert, cela signifie qu'un générateur est un conducteur non-équipotentiel (ou à "champ non 
conservatif"). 


A l'équilibre, mais en présence d'un courant 1 (générateur branché dans un circuit fermé), les porteurs de 
charge responsables de ce courant subissent une force supplémentaire, due aux collisions se produisant à 
l'intérieur du conducteur. Pour un générateur idéal, ces collisions sont négligeables et nous obtenons: 


EP | 


En revanche, pour un générateur non idéal, de telles collisions se produisent et se traduisent par l'existence 
d'une résistance interne r (très faible pour les générateurs à l'état neufl). Ainsi, la vraie force 
électromotrice est donnée par: 


(Us-Uite=r'I=U,-U,=r'Îl-e 


La résistance interne du générateur introduit donc une chute de tension proportionnelle au courant fourni, 
ce qui fait qu'il délivre un potentiel inférieur à celui donné par sa FEM. 


Cette dernière relation est parfois notée sous la forme suivante: 
ÜUp-Ua=e-r.1i 
et souvent avec l'écriture: 
ÜU=£-r.i 


ce que l'on mesure avec un voltmètre est cependant la FEM puisque les générateurs ont une résistance 
interne admise comme infinie et impliquent donc un courant I quasi nul. 


Les générateurs diffèrent selon la source d'énergie utilisée et la méthode de conversion de celle-ci en 
énergie électrique (autrement dit, selon la nature de Ë,,). Nous pouvons ainsi produire de l'énergie 
électrique à partie d'une pile (énergie chimique), d'un générateur électrostatique (énergie mécanique), 
d'une dynamo (énergie mécanique), d'une pile solaire (énergie du rayonnement) ou d'un thermocouple 
(énergie chaleur). 


Reprenons le calcul fait précédemment mais appliquons-le cette fois-ci à l'ensemble du circuit. Soit alors V 
le volume total occupé par le conducteur formant le circuit et # la force s'exerçant sur les charges 
mobiles q et donc responsable de leur mouvement. 


La puissance totale P qui doit être fournie en régime permanent est alors: 


P= [aAdr - f dr, Ads - f de lé g afin av as 
eut eut cut 


= À ques 2 
cycuit q 


= =fe 


aireuit q 


F dl 
ÿ 
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où: 


e= FE, 7 = $ Eu di 


creait 4 ciruë 
est la FEM totale du circuit. L'intégrale portant sur l'ensemble du circuit, la FEM totale est donc la somme 


des FEM présentes le long du circuit (s'il y en a). Si celles-ci sont localisées dans des dipôles, l'expression 
devient: 


so. 
k 


où les 2, sont les valeurs algébriques des différentes FEM: 
1.2, > 0 correspond à un "générateur" (production d'énergie électrique) 
2. e, < Ü correspond à un "récepteur" (consommation d'énergie électrique) 


Nous avons aussi pour la puissance électrique: 


et la puissance joule: 


2 
B=RÈ=R| sé | 
R+r 


Un moteur convertit de l'énergie électrique en énergie mécanique et correspond donc à un récepteur de 
FEM: nous disons également, qu'il possède une "force contre-électromotrice" ou FCEM. 


4.1. LOI DE FARADAY 


Maintenant que nous avons démontré la nécessité de la force électromotrice, nous allons pouvoir 
démontrer la provenance de la "loi de Faraday" ainsi que la "loi de Lenz" dont nous avions fait usage en 
électrodynamique pour démontrer la troisième équation de Maxwell. La détermination de la loi de 
Faraday va également nous permettre de définir le concept d'inductance et d'étudier ses propriétés. 


Faisons la même démarche que Faraday et posons-nous la question suivante: Comment créé-t-on un 
courant? 


Un courant est un déplacement de charges dans un matériau conducteur. Ces charges sont mises en 
mouvement grâce à une D.D.P. qui est maintenue par une FEM. Ainsi, une pile, en convertissant son 
énergie chimique pendant un instant dt fournit donc une puissance P modifiant l'énergie cinétique des dQ 
porteurs de charge produisant ainsi un courant I. 


Soit #, la puissance nécessaire pour communiquer une vitesse Ÿ à une particule de charge q. Sachant que 


dans un conducteur, il y a n porteurs de charge par unité de volume, la puissance totale P que doit fournir 
le générateur (idéal) est alors (voir plus haut): 
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P=7.e (38.72) 


Nous posons donc que la FEM idéale d'un circuit est: 


__ç F'd gp Fodl 


8 = 


F 
Î eut q crxeuit q 


Or, la force de Coulomb est incapable de produire une FEM comme nous l'avons démontré tout à l'heure. 
Pour créer un courant continu dans un circuit fermé, il faut donc un champ électromoteur dont la 
circulation le long du circuit ne soit pas nulle. L'expérience de Faraday montre donc que c'est l'existence 
du champ magnétique qui permet l'apparition du courant (!!!!). Cela signifie que la force de Lorentz doit 
être responsable de l'apparition d'une FEM, c'est-à-dire: 


glE+5xBlodi : _ 
e= f "à fiE+vxBjodl (38.74) 
aret q éruit 
Donc: 
e= b (É+5xB) dl = f Ë di + b (SX Blodi = 0+ f (5xBlodt _—— 
aret aveit cet areuit 


Les propriétés du produit vectoriel (cf chapitre de Calcul Vectoriel) nous donnant: 
(XXÿ)oZ = -(XXZ)oÿ (38.76) 


nous pouvons écrire: 


e= f I5xBiodl =- f (Fxaf ie = f (sxdl)o5=- 1 f (ñxd \oË Ge 
| EE 


cireuit ciruit cet Ê axu 


Une petite remarque s'impose à ce niveau du discours. Si Ÿ est bien le vecteur vitesse des charges q il ne 
peut être celui qui est colinéaire à 4} car sinon nous aurions: 


vdtx dl =0 (38.78) 


et donc e serait nul et ceci n'est pas possible car contredirait tous les développements faits jusqu'à 
présent ! Au fait, Ÿ est la vitesse de l'ensemble du circuit qui entraîne avec lui l'ensemble des charges à la 
même vitesse ! 


Ainsi, pendant un temps dt, le circuit se déplace d'une distance: 
dr = Vat (38.79) 
vecteur qui est perpendiculaire à 4} . Dès lors: 
dF xd? (38.80) 


est la surface (voir les propriétés du produit vectoriel dans le chapitre de Calcul Vectoriel) décrite par le 
déplacement de l'élément 4? sur la distance 47 tel que: 
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dF xd = d£ 


Nous avons alors: 


ed Itxafioñ=-— à Fod°$ 


creut cveut 


Nous reconnaissons l'expression du flux (dit "flux coupé") à travers la surface élémentaire 4?F. Ce qui 
nous amène à écrire (il y a un petit peu d'intuition - bon sens - avec la manipulation des différentielles 
mais bon c'est aussi ça la physique...): 


e=-— Bod°'$ =-— $ d'æ, --—4 é$ db, "es 


areuit cet eut di 


Nous venons de démontrer la "loi de Faraday" dans le cas d'un circuit rigide plongé dans un champ 
magnétique varable. Nous avons vu apparaître naturellement l'expression du flux coupé. En fait, la seule 
chose qui compte, c'est l'existence d'un mouvement d'ensemble du tout ou d'une partie du circuit (revoir la 
démonstration pour s'en convaincre). Ainsi, l'expression de la FEM induite: 


BE =—-—— 
dé 


reste valable pour un circuit déformé et/ou déplacé dans un champ magnétique statique. Cette 
démonstration s'est faite à partir de la force de Lorentz et est donc a priori indépendante du référentiel 
choisi! 


4.1.1. LOI DE LENZ 


L'énoncé de la loi de Lenz est le suivant: L'induction produit des effets qui s'opposent aux causes qui lui 
ont donné naissance. 


Cette loi est, comme la règle du flux maximum, déjà contenue dans les équations et n'apporte rien de plus, 
hormis une intuition des phénomènes physiques. En l'occurrence, la loi de Lenz n'est que l'expression du 
signe "-" contenu dans la loi de Faraday. 


Exemple: 


Si nous approchons un circuit du pôle nord d'un aimant, le flux augmente et donc la FEM induite est 
négative. Le courant induit sera alors négatif et produira lui-même un champ magnétique induit opposé à 
celui de l'aimant. Deux conséquences: 


1. L'augmentation du flux à travers le circuit est amoindrie. 


2. Il apparaît une force de Laplace (cf ue) À = J: di x Ë négative, s'opposant à 
l'approche de l'aimant. 


Ce signe "-" dans la loi de Faraday (la loi de Lenz) décrit le fait que dans des conditions normales, 1l n'y a 
pas d'emballement possible (exemple: courant ne faisant qu'augmenter). 


C'est la raison pour laquelle la loi de Lorenz est souvent appelée "loi de Lenz-Faraday". 
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4.2. INDUCTANCE 


Nous avons donc: 


(38.85) 


b= [Bod 
[ o 


Or la loi de Biot-Savart nous donne (cf. chapitre de Magnétostatique): 


dB - Ho, à _. & fab = 1 Gad _ =2 (886) 
è Ar ir 


Dès lors: 


d'xF| 2 dxF) 
D= [4 lea 1 [| lodf| 6x7 
s(4r L'or axsli r 
que nous écrivons historiquement sous forme condensée de la manière suivante: 


D=ZL:1]| (38.88) 


où L est le "coefficient d'auto-induction" ou "auto-inductance" (ou "self”), exprimé en "Henry" [H]. Il ne 
dépend que des propriétés géométriques du circuit et est nécessairement positif. 


Avec les lois que nous avons énoncées jusqu'à présent, nous sommes en mesure d'étudier certains régimes 
variables. En effet, tous les raisonnements basés sur la notion d'un champ (électrique ou magnétique) 
constant au cours du temps peuvent aisément être appliqués à des systèmes physiques variables (champs 
dépendant du temps), pourvu que cette variabilité s'effectue sur des échelles de temps longues par rapport 
au temps caractéristique d'ajustement du champ. Voici tout de suite un exemple concret: 


La plupart des lois de la magnétostatique supposent un courant permanent, c'est-à-dire le même dans tout 
le circuit. Lorsque nous fermons un interrupteur, un signal électromagnétique se propage dans tout le 
circuit et c'est ainsi que peut s'établir un courant permanent: cela prend un temps de l'ordre de l/c où I est 
la taille du circuit et c la vitesse de la lumière. Si nous avons maintenant un générateur de tension 
sinusoïdale de période T (c'est juste un exemple... pris au hasard...), alors nous pourrons malgré tout 
utiliser les relations déduites de la magnétostatique si: 


Tællc (38.89) 


Ainsi, bien que le courant soit variable, la création d'un champ magnétique obéira à la loi de Biot-Savart 
tant que le critère ci-dessus reste satisfait. Ce type de régime variable est appelé "régime quasi statique" 
dans le sens qu'il est transitoire. 


Donc, puisque nous avons: 


e = Pi et D=Z:] (3890) 
dé 


Nous avons alors si et seulement si le courant est variable dans le circuit: 
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_ 4e _ Le Le (38.91) 
dt dt dt 


L étant constant pour un circuit rigide. La self ("inductance" en français) crée donc une force 
électromotrice inverse de celle générée par le courant à ses bornes. Cette force électromotrice a donc un 
sens inverse à celle du générateur électrique. 


Remarque: Nous voyons bien dans la relation obtenue, qu'en régime stationnaire, si le courant est 
constant, alors la force électromotrice est nulle et la self se comporte alors comme une simple 
équipotentielle! 


Il convient de donner maintenant un exemple important et simple à la fois de la loi de Lenz en l'appliquant 
au calcul de l'inductance d'un solénoïde de rayon r (l'inductance d'un solénoïde torique à section circulaire 
ayant déjà été mise en évidence dans le chapitre de Magnétostatique). Nous avons vu dans le chapitre de 
Magnétostatique que le champ magnétique dans un solénoïde était donné par: 


B = {ÿ De (38.92) 


où pour rappel N est le nombre de spires et l est la longueur du solénoïde. Nous avons vu plus haut que la 
loi de Faraday était donnée par: 


circuit 
et dans le cas d'une spire nous allons parcourir N fois le chemin de l'intégrale. Il vient alors: 


e= N'a = Le (38.94) 
dt dt 


Nous avons vu plus haut que le flux du champ magnétique était donné par (si le champ est 
perpendiculaire à la surface traversée): 


P=B.S (3895) 


Dès lors: 


IN SN 
o=8.5= fu 2e) SR (38.96) 


Remarque: Attention!! Le flux dans un solénoïde n'est pas égal au flux dans une spire multiplié par le 
nombre de spires. 


Le taux de variation du flux magnétique se trouve par dérivation, soit: 
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2 2 3 
a - HER. 7) Ed EN à G897) 
£ £ 


Soit dans le cas de spires circulaires: 


a ee, —_ fe 06) 
di Î dt Î di 


La force électromotrice engendrée est ainsi: 


dD di (ip 277.7 | di 
dt dt E di 


(38.99) 


et donc par correspondance: 


L = 


3,3 2,2 
LE. 472.107 — (38.100) 


Calculons maintenant la puissance reçue par une bobine. Nous avons démontré plus haut que nous avons 
toujours dans notre cas d'étude et si nous modélisons l'inductance comme un dipôle non idéal: 


p=Aui=ui=(ri-e)i=r.i-ei (38.101) 


où les lettres en minuscules indiquent que nous sommes en régime non constant: 


: à as) vu 
p=ri-e.i -r#-(14): RL pete PP 
dt dt dt 


Contrairement au développement que nous avions fait dans le chapitre d'Électrostatique pour le même 
calcul en ce qui concerne la capacité, nous n'avons pas négligé ici la dissipation d'énergie par effet Joule. 
Mais il faut savoir que dans la majorité des cas ce terme est aussi négligé! 


Donc par intégration dans un intervalle de temps donné de 0 à t nous avons pour le deuxième terme: 
LL 
ÆE; = = Li (38.103) 
2 
Soit explicitement dans le cas d'un solénoïde circulaire: 


N?r2 2 


1 1 3” (38.104) 


E =-1z-|4r.107 
2 2 


Lorsque i décroit, la bobine restitue cette énergie. Nous ne pouvons donc pas stocker de l'énergie dans une 
bobine isolée contrairement à un condensateur. 
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Dans le cadre d'un régime sinusoïdal, la puissance moyenne sera nulle. Nous pouvons généraliser ceci en 
admettant qu'une inductance parfaite ne dissipe aucune puissance par effet Joule. 


5. EFFET DE PEAU 


L'effet de peau ou effet pelliculaire (ou plus rarement effet Kelvin) est un phénomène électromagnétique 
qui fait que, à fréquence élevée, le courant a tendance à ne circuler qu'en surface des conducteurs. Ce 
phénomène d'origine électromagnétique existe pour tous les conducteurs parcourus par des courants 
alternatifs. Il provoque la décroissance de la densité de courant à mesure que l'on s'éloigne de la périphérie 
du conducteur. Il en résulte une augmentation de la résistance du conducteur. 


Cet effet peut être utilisé pour alléger le poids des lignes de transmission à haute fréquence en utilisant des 
conducteurs tubulaires, ou même des tuyaux, sans perte de courant. Il sert aussi dans le blindage 
électromagnétique des fils coaxiaux en les entourant d'un mince étui métallique qui garde les courants 
induits par les hautes fréquences ambiantes sur l'extérieur du câble. 


Ce que nous souhaiterions déterminer maintenant, c'est l'atténuation du champ électrique (ou un 
coefficient d'atténuation) dans la matière d'un câble conducteur cylindrique plein en fonction de la 
distance de son axe de symétrie longitudinal à sa surface extérieure. 


Pour cela, nous reprenons la quatrième équation de Maxwell sous la forme donnée précédemment: 


et que nous supposons travailler avec un conducteur n'ayant pas d'effet capacitif (donc pas de courant de 
déplacement) à l'opposé du cas général démontré dans le chapitre d'Électrodynamique, cette dernière se 
réduit alors à: 


PxA=l 9x5 0Ë 
HA 
et si nous l'associons à la troisième équation de Maxwell ( | ique) qui est pour 
rappel: 
VE 
æ 


Nous avons alors en utilisant le théorème de Schwarz (cf. chapitre de Calcul Différentiel Et Intégral): 


PxiVx£)=-2i0x)-- 10€ 
of æ 


Or nous avons démontré dans le chapitre de Calcul Vectoriel qu'en toute généralité le rotationnel du 
rotationnel d'un champ vectoriel est égal au gradient de la divergence de ce champ moins son laplacien 
vectoriel: 


is … En 


PxiVxfi=ViVofi-Af 


Or comme la divergence du champ électrique est nulle à travers la section d'un conducteur nous avons: 
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Vxi(VxE)=V(VoË)-AE-- 
d'où: 
AË = 10 € (38.111) 
4 


Ce qui donne explicitement pour une composante (par exemple en z): 


LT (38.112 
= 36.112) 
dé 
Plaçons-nous dans le cas important d'un régime harmonique: 
E, (z,t) = ÆEj(z)cos(kz-@) (38.113) 


et utilisons temporairement la notation en phaseurs: 


E, (z,û = 17 4 Luis = Eee ®t (38.114) 
Nous avons alors 
: 
2E, : OlÆpe | + 
2e 2 
& Gz (38.115) 
0E : 
z = ioE ee if 
Of 


Nous obtenons alors l'équation différentielle suivante à une variable: 


2 ikz 
9'e ; 
——= moque (8.116) 
& 
Soit: 
k=-oau (G8.117 
et donc: 


&=+.fi@0u (38.118) 


en se rappelant (cf. chapitre Nombres) que: 
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il vient: 
k= + Vo - +(1-i) — (38.120) 
Dès lors: 
E, (z,t)= (2j re tot = RES it = Fra Fe griot (8.121) 
Donc: 


[, (oox 
+ fE {+ fee ra) (38.122 


E,(zt)=E&e \ 2 e 


Nous devons rejeter pour des raisons physiques (conservation de l'énergie) la solution: 
&=+.fi@0u (38.123) 


Il nous reste donc: 


que les physiciens notent: 


| 


{ 3 ) 
"st 38.125 
AT (38.125) 


car Ÿ se mesure en mètres (coefficient qui est nul si le champ électrique est constant) et est assimilé au 
"coefficient d'atténuation" que nous nous étions fixé de déterminer au début: 


Ê = 27 = 2e (38.126) 


Pour un conducteur en cuivre, nous avons selon Wikipédia les valeurs ci-dessous. 


E (2.0 = Be 


Tableau: 38.2 - Coefficient d'atténuation 
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6. SEMI-CONDUCTEURS 


Le défaut principal du modèle de Drude vu précédemment est de considérer l'électron comme une 
particule classique. Un ensemble de telles particules n'est évidemment pas soumis aux distributions 
quantiques et donc à une relation explicite de la température. 


De plus, si nous observons notre modèle de Drude, il est difficile de dire quoi que ce soit à propos de la 
résistivité en fonction de la température. 


Au fait, nous retenons en général quatre dates à la source du développement de cette théorie des semi- 
conducteurs: 


- En 1833, Michael Faraday fait état de la conductivité d'un matériau qui augmente avec la température. 


- En 1839, Antoine Becquerel découvre que sous illumination une tension électrique apparaît à la jonction 
de certains matériaux (et liquides). C'est l'effet photovoltaïque, qui donnera naissance beaucoup plus tard 
(vers 1950) aux cellules solaires. 


- En 1873, Willoughby Smith montre que la conductivité de certaines substances augmente lorsque qu'on 
les illumine. C'est la photoconductivité. 


- Enfin, en 1874 Karl Ferdinand Braun découvre le phénomène de redressement électrique lorsqu'une 
pointe métallique est déposée sur certains conducteurs, c'est-à-dire que le courant électrique passe dans un 
sens lorsque le potentiel électrique appliqué à la pointe est positif mais non lorsqu'il est négatif! 


Bien que ces découvertes fussent totalement incomprises et surtout non reconnues comme étant les 
différentes expressions d'un même phénomène physique (la semi-conductivité), les applications pratiques 
furent immédiates et menèrent à la deuxième révolution industrielle qui est celle de la microélectronique! 


Ce type de difficulté (parmi de nombreuses autres...) s'efface en grande partie avec le modèle de l'électron 
libre dans un puits de potentiel, imaginé par Sommerfeld en 1928. Dans ce modèle les électrons, soumis 
au principe de Pauli, suivent la distribution en énergie de Fermi-Dirac (cf 

), alors que dans le modèle de Drude ils suivaient la loi de Maxwell-Boltzmann. 


Il en découle deux résultats importants: 


- Seule une fraction des électrons est susceptible de voir son énergie varier sous l'effet d'une action 
extérieure (température, champ électrique, etc.) 


- Même au zéro absolu, l'énergie cinétique des électrons n'est pas nulle. 


Le modèle de Sommerfeld fournit une base pour l'édification de théories plus spécifiques et est à la base 
du domaine de la "physique du solide" selon certaines sources. Ce n'est donc pas un modèle achevé 
traitant d'un problème précis comme la conduction électrique ou l'émission thermoélectronique. Cette base 
est la distribution en énergie des électrons, obtenue par le produit de deux fonctions: la densité des états et 
la distribution de Fermi-Dirac. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 2281/4839 


Malgré les améliorations qu'il apporte, ce modèle ne donne cependant pas une description satisfaisante des 
propriétés électroniques des solides dans tous les cas. Ses limitations proviennent du fait qu'il ne tient pas 
compte implicitement de la structure réelle des matériaux et des interactions entre électrons. Ce modèle ne 
permettra donc jamais d'expliquer objectivement pourquoi tel cristal est conducteur, et tel autre isolant ou 
semi-conducteur (par exemple le diamant et le silicium ont la même structure cristalline et configuration 
électronique mais à partir d'une certaine température l'un devient conducteur et l'autre reste isolant!). 


La théorie des semi-conducteurs, appelée plus souvent "théorie des bandes" pour des raisons que nous 
verrons plus loin, est aussi un exemple fameux de l'application des résultats de la physique quantique 
ondulatoire (voir chapitre du même nom) et de la statistique quantique ( 


). 


Pour son étude, nous nous concentrerons ici sur le modèle scolaire qualitatif le plus simple qui est celui 
basé sur un semi-conducteur cristallin avec un réseau parfaitement périodique et à bandes paraboliques 
(nous préciserons cela à nouveau plus loin). 


Le lecteur un peu critique verra que les développements qui vont suivre ne sont cependant pas purement 
quantiques (1l y a même des développements utilisant la mécanique classique qui sont limites acceptables 
suivant le point de vue)... donc l'approche est un peu grossière mais elle permet d'avoir une idée 
qualitative des phénomènes dans les semi-conducteurs. C'est une des raisons pour laquelle ce modèle est 
appelé "modèle semi-classique des bandes paraboliques". 


Au fur et à mesure des années nous compléterons les développements qui vont suivre pour au final tenter 
d'avoir toute la démarche détaillée. D'ici là 1l faudra être patient. 


Nous ferons abstraction des concepts qui ne sont pas absolument nécessaires à l'introduction du modèle 
pour présenter ici uniquement l'essentiel qui suffit à l'ingénieur dans son travail quotidien. 


Pour commencer la partie mathématique de l'étude des semi-conducteurs, nous considérerons un cristal 
soumis à une différence de potentiel. Un électron de conduction du cristal sera donc soumis d'une part à 


une force interne À résultant du champ cristallin, et d'autre part à une force d'origine externe À, résultant 
du champ électrique appliqué au cristal. 


Les hypothèses du modèle sont: 


H1. Il existe à la surface des métaux une barrière de potentiel empêchant les électrons de quitter la 
matière. 


H2. À l'intérieur de la matière, les électrons sont soumis à un potentiel constant! 
H3. Les électrons sont indépendants (pas d'interactions entre eux). 

H4. Les électrons obéissent aux lois de la mécanique quantique et classique. 
HS. Les électrons obéissent aux lois de l'électrodynamique de Maxwell. 

H6. Les bandes d'énergie forme un spectre continu de niveaux d'énergie. 


La première hypothèse repose sur l'observation élémentaire suivante: les électrons se déplaçant dans un 
métal ne franchissent pas, à température ambiante tout au moins, les surfaces limitant l'échantillon. 
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La deuxième hypothèse paraît assez brutale. C'est elle qui bannit du modèle la notion de structure de la 
matière. Elle sera remplacée dans le modèle des bandes d'énergie par un potentiel périodique rendant 
compte de l'influence des noyaux chargés positivement. Cette hypothèse traduit le fait que les électrons 
sont considérés comme libres dans le puits de potentiel. 


La barrière de potentiel possède une largeur finie, c'est-à-dire que le passage du potentiel régnant à 
l'intérieur de la matière au potentiel régnant à l'extérieur se fait sur quelques distances interatomiques. 
Mais les dimensions de l'échantillon étant en pratique toujours très grandes vis-à-vis d'une distance 
interatomique, on peut considérer la barrière de potentiel comme infiniment abrupte, ce qui simplifie les 
calculs. 


Remarque: Nous admettrons pour simplifier les calculs que les électrons se déplacent dans une seule 
direction (celle du champ électrique) ce qui évitera de se balader avec des vecteurs. 


L'équation de la dynamique s'écrit alors naturellement pour cet électron: 


Nous écrivons alors (rien ne nous interdit de le faire) que l'électron dans le cristal répond à la sollicitation 
de la force externe À, comme une quasi-particule de masse #*, dans le vide: 


C'est l'étude de ce dernier terme qui va nous intéresser. Pour cela rappelons que dans le cadre de l'étude 
détaillée de la propagation de l'électron libre dans le vide, où nous négligeons les effets de son spin, nous 
avons démontré qu'il doit obligatoirement être décrit selon l'équation de Schrôdinger par un paquet d'onde 
(cf ) centré sur un état &y sinon quoi son énergie serait 


infinie. 


On peut cependant se poser la question. de ce qui nous amène à le considérer comme libre... Eh bien 
c'est l'expérience qui montre que lorsque nous appliquons un certain potentiel seuil, un courant commence 
à apparaître dans les semi-conducteurs. 


Nous avons démontré (toujours dans le cadre de la propagation de la particule libre sans spin dans le 


chapitre de Physique Quantique Ondulatoire) que le paquet d'onde peut alors être vu dans sa solution 
mathématique comme une onde plane (libre) se déplaçant à la vitesse de phase: 


% 


Va = — 
g 
ki 


que nous noterons pour la suite afin de simplifier les notations: 


æ 
V=— 
& 
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Or, dans le réseau cristallin, la vitesse de phase peut varier, en fonction de l'endroit du réseau où se trouve 
l'électron à cause de la forme géométrique du potentiel dans le cristal. Il nous faut donc utiliser la vitesse 
de phase instantanée: 


Rappelons que nous avons aussi en toute généralité l'énergie totale donnée par: 


æ 
E=hv=h—=he@ (38132) 
237 


Il vient alors: 


Le terme: 
—= (38.134) 
dk 


n'est de loin pas simple dans le cas d'un cristal (c'est même un cauchemar...). 


Évidemment pour une particule libre (c£ chapitre de Physique Quantique Ondulatoire), rappelons qu'il 
s'agit de: 


=—— (38.135) 


dE dk) KXx 
Drm 


Mais pour une particule dans un champ de potentiel ayant une géométrie complexe l'énergie E commence 
à avoir une expression dépendante de k en fonction des zones qui peut devenir très complexe (voir les 
exemples du chapitre de Physique Quantique Ondulatoire). D'où la justification de l'utilisation de la 
dérivée. 


L'accélération au sens classique de cet électron est alors donnée par: 


(38.136) 


dv _1d/fdE\) 1 d dE 
dt hat\dt) hat dt 
Nous avons aussi (cf. chapitre de Mécanique Classique): 

dE = Fodt=Foÿdt (38.137) 


donc: 
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dE 4 
— =À#0oY (38.138) 
dé 


d'où: 


a ld d£ 14;: «A lai: 1dE 
== —(For)=-— Fo——| (38139) 
dt hdk dt hdk k dk À dk 


La dérivée de À par rapport à £ dans la relation précédente s'annulera car la force découle du potentiel 


appliqué sur le semi-conducteur seulement et non pas du vecteur d'onde de l'électron lui-même! Il nous 
reste alors: 


Puisque ici E est uniquement l'énergie totale provenant du potentiel soumis de l'extérieur, alors la force 
F est la force externe Ë générée par l'application de ce même potentiel. Nous avons alors: 


et: 
2 … 
1 d°Æ (38.142) 
Il vient alors par égalisation: 


d?E (8.143) 


Puisque l'énergie de l'électron peut avoir une forme mathématique compliquée conformément aux cas 
applicatifs vus dans le chapitre de Physique Quantique Ondulatoire, exprimons Æ (&) sous forme de 
développement limité de Taylor (cf. chapitre de Suites et Séries) d'une fonction à trois variables au 
deuxième ordre en laissant tomber les termes d'interactions et en en ne prenant pas les termes de premier 
degré: 


EE) = EEK, k,k)= 


1 E 2, 10E 2, 10E > (8.144) 
En ho)teR PAE  7e G) 
x0 ? y 0? 2| a x x 2] a y y 2| a? E E 


Au fait cette approximation grossière mais toutefois acceptable dans pas mal de cas pratiques tient au fait 
que l'expérience montre que les surfaces d'énergie en fonction de k ont en approximation une forme 
parabolique dans certains cristaux semi-conducteurs. 
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Dans les conducteurs, l'approximation de la relation précédente n'est prise qu'au premier terme. 


Une autre manière de le voir est que pour un électron libre, nous avons pour rappel, en une dimension, la 
courbe de dispersion (cf. chapitre de Physique Quantique Ondulatoire): 


qui est bien une parabole en fonction de k. Effectivement, si nous prenons notre développement de Taylor 
en une dimension il nous reste: 


1 &E : 
EQ)= E@&)= E(o)+=—© (Eh) (38.146) 
2l & 
et comme nous avons déterminé avant que: 
x2 
Fee d?E (8.147) 
dk? 


Il vient: 
E&)= ÆE( LT EG NB a Li ENT 
58% 2! &? 0) = E& 21m, 0) (38.148) 


Si l'électron est libre la courbe de dispersion nous impose d'avoir (sans présence de potentiel): 
E(k)=0 (38.149) 
qui est alors considérée comme "l'énergie du minimum" #3, Il nous reste alors: 


Ca 2 
&,— ko) (8.150) 


2m, 


E(k) = 


et en prenant #£,n = Ô nous retombons sur courbe de dispersion d'une particule libre (ce qui justifie donc le 


fait d'avoir posé Æ{k&) = 0 pour un électron libre): 


k? 


2m, 


ED= 2 Gs151 


Ce qui montre que l'approximation n'est pas trop fausse. et justifie le fait que dans certains ouvrages la 
relation précédente (série de Taylor) décrit une particule dite "quasi-libre". 


Mais revenons-en à: 


x? 
(&—ko)? (38.152) 


2m, 
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E(&)= E(ko)+ 


Et puisque le paquet d'onde est centré autour de &; normalisons-la comme valant 0 (ce qui équivaut à 


centrer les valeurs du vecteur d'onde). Nous avons alors: 


2 
À 
k? (8153) 


2m, 


k° 
#72 


E(E)= E(0)+- 


k?=E + 


C3 


Ce qui est intéressant avec ces développements, c'est que nous sommes partis d'un électron libre sous 
forme de paquet d'onde et grâce au développement de Taylor nous nous retrouvons avec une expression 
extrêmement simple de l'énergie d'un électron quasi-libre. 


Il en sort que pour un électron quasi-libre, sans interactions et sans prendre en compte les effets de spin 
nous avons: 


Nous remarquons alors une chose fort sympathique! C'est que notre électron quasi-libre a un nombre 
d'onde qui ressemble en tout point à celui d'une particule coincée dans un puits de potentiel à parois 
rectilignes (voir la démonstration dans le chapitre de Physique Quantique Ondulatoire). 


Nous souhaiterons maintenant calculer à l'aide de l'expression de k (n'ayant pas directement celle de E car 
trop complexe) la densité d'états (in extenso d'électrons) dans le volume donné par le puits rectangulaire 
correspondant. 


Nous avons démontré dans le chapitre de Physique Quantique Ondulatoire que pour le puits de potentiel à 
barrières rectangulaires: 


JT 
k=n— (38.155) 
£ 


si nous imposions un nombre entier de demi-longueur d'onde. Si nous imposons un nombre entier de 
longueur d'onde (conditions de Born-von Karman afin qu'après une translation du réseau périodique du 
cristal nous retrouvions les mêmes propriétés) pour que la solution soit physiquement acceptable, nous 
avons alors: 


ce qui implique bien évidemment deux fois moins d'états. 


Par extension, pour l'espace, nous avons alors dans le cas tridimensionnel: 


27 27 27 
K,=n,——k, 7, —,k =n,—" G8157) 
hs L, L 
avec: 
2 
E _TR 2, 2,2 A > 
LALTEL — nl? À, +, FA, = Û A, +, +#, (38.158) 
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et OÙ #, y = 2,3, 


Le résultat est très similaire à celui du puits de potentiel rectangulaire à une dimension mais nous avons 
maintenant des conditions aux bords particulières afin d'avoir une correspondance avec l'expérience et 
trois nombres quantiques principaux au lieu d'un seul. De plus, chaque combinaison de ces trois nombres 
correspond à une fonction d'onde (état) différente. De plus, ces nombres sont indépendants (aucune 
condition imposée). 


Nous avons alors le premier niveau où tous les n sont unitaires: 


(27) 
KKK = ——— 
ROLE 


(38.159) 


Si nous acceptons pour simplifier que le puits a des arêtes de longueurs égales (semi-conducteur à réseau 
cristallin cubique), nous avons alors: 


3 
2 
£kK, = 7 =(2x/ LŸ (38.160) 


Représentons l'espace des k pour un tel réseau cubique et pour différents multiples de #,,%, ,2, : 


Figure: 38.2 - Espace des k pour un réseau cristallin cubique 


Donc tous les états quantifiés ne peuvent prendre que des valeurs espacées de 277} Z dans l'espace des k 
ce qui signifie que par volume élémentaire il n'y a qu'un seul vecteur d'onde possible et donc qu'un seul 
état associé. Effectivement, faites un dessin par-dessus la figure ci-dessus si vous voulez et vous verrez (!) 
mais ne vous fiez pas aux gros points noirs qui sont là uniquement pour montrer les extrémités des 
volumes élémentaires et qui ne correspondent pas tous à des états possibles! 


Ainsi, dans un volume sphérique de rayon k de l'espace des k. Nous avons un nombre précis (limite 
supérieure) de volume élémentaires (états): 
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. k° re 2 


N(k)= 3 = | GS 


kk, k ( 2774 Lÿ 67 


où dans la littérature il est d'usage (tradition) de ne conserver que la forme de la deuxième égalité dans les 
développements. Cette relation nous a été pour rappel utile dans le chapitre de Thermodynamique pour 
déterminer le modèle de Debye-Einstein de la capacité thermique à volume constant des solides 
cristallins! 


La densité de modes dans un volume V sera alors donné par (relation utilisée dans le chapitre de 
Thermodynamique pour exprimer la capacité calorifique à volume constant des solides): 


Remarque: La sphère de rayon k, contenant les niveaux à un électron qui sont occupés est appelée 
parfois "sphère de Fermi". La valeur du rayon est alors notée #£r et appelée "vecteur d'onde de 
Fermi". La surface de la sphère de Fermi, qui sépare les niveaux occupés de ceux qui ne le sont pas 
comme nous le verrons plus tard est appelée "surface de Fermi". 


En considérant maintenant le spin (ben oui tant qu'on y est...) nous multiplions par 2 puisqu'il y a deux 
états de spin possible par état: 


3 3 
W(k) = pui is 3 FE ee, (38.163) 
3(2x) 37 


(relation que nous retrouverons dans le chapitre de Physique Nucléaire lors de notre étude du modèle de 
noyau nucléaire sous forme de goutte liquide) et en y injectant: 


&= (E-E)2 (38.164) 
nous avons alors: 
7T 312 4 312 
MCE) 2 2.3 (( -2)% | Ê (2) (E-H)°É 
k (2? La 
(38.165) 
: de 312 3j 
(+) ( - E) WF 


La densité volumique d'états (quasi-)libres sera obtenue en dérivant cette dernière relation par le volume: 
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4 
— 3/2 
aNCE) 3 ee) de. 
EM = ————© = E-E (38.166) 
PE)= —, en (r (8-Æ) 


Et si nous souhaitons la densité d'états (quasi-)libres (de vibration) par unité d'énergie et de volume il va 
nous falloir en plus dériver par rapport à l'énergie: 


4 
dO(E). 3 (2m d,, L 52. 


Ce qui donne: 


(38.168) 


Ce résultat ne dépendant pas du volume, il est inchangé lorsque celui-ci tend vers l'infini! Donc il est 
valable pour tout point du cristal semi-conducteur si celui-ci est parfait. 


Ce que nous trouvons également parfois sous les formes (un peu malheureuses...) suivantes dans certains 
ouvrages: 


1 Du 312 
DE)z— || VE 
” > à . 
4 (38.169) 
D(E)= (2mm,)"°(E-5)" 


et 1l y aussi ceux qui ne prennent en compte le spin que plus tard... ce qui donne une forme identique à 
celle des trois relations précédentes mais à diviser par 2. 


6.1. DENSITÉ STATISTIQUE NON-DÉGÉNERÉE DES PORTEURS NÉGATIFS 


Bref, cependant cette relation a un défaut (encore un...)! Effectivement, nous avons vu dans le chapitre de 
Mécanique Statistique lors de notre étude de la statistique quantique que dans un système où même le 
spectre d'énergie est considéré comme continu, il est impossible de ne pas prendre en compte la 
dégénérescence des différents niveaux d'énergie. Nous avions démontré alors que pour une population de 
fermions, à une énergie (ou température) donnée le pourcentage de niveaux dégénérés occupés est donné 
par la fonction de Fermi-Dirac: 


Jro(E,T,{i = 


EXP (EE) +1 ne 


et que la fonction retournait donc une valeur comprise entre 0 au minimum et 1 au maximum. 


Cette fonction donne donc pour une température T fixée la probabilité qu'un électron occupe un état 
d'énergie E. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Ce qui fait que notre relation D(E) surestime la valeur réelle de densité d'états (quasi-)libres occupés pour 
une énergie (ou température) donnée. Ce qui fait que pour avoir une meilleure approximation nous 
écrivions en toute logique la densité volumique d'états (quasi-)libres par unité d'énergie: 


1 


- 38.171 
EXP (ZE) Hi | 


Cependant, dans la pratique, nous allons chercher à calculer la densité volumique d'états (quasi-)libres 
dans un spectre (intervalle) d'énergie. Il vient alors avec la correction ajoutée précédemment: 
dO(E) _ 1 


3/2 1/2 
. (x) (E-&) 
_ 2 _ (38.172 
e 27 \ A EXp e #)u | 
&T 


1 2m, ils 1/2 
vos (Se) (6-2) 


Soit: 


= —| —< ————— 245 
2 _ 38.173 
2m R exp(£ “)u t 
XT 


Il vient alors immédiatement que la densité volumique d'états (d'électrons) (quasi-)libres à une température 
donnée (conditions normales de température pour les applications civiles) en prenant en compte tous les 
états (niveaux continus) d'énergie possibles est alors: 


312 4co LS dis 
e(E) = LE) [ _E=&)" 


Prendre Æ, comme borne inférieure nous évite, comme nous allons le voir explicitement un peu plus bas, 
de nous retrouver avec une racine négative. ce qui serait fort gênant! 


De plus, nous pouvons sans erreur appréciable reporter la limite de l'intégrale à l'infini car 
Jfrn — 0 quand E est importante. 


Malheureusement, cette intégrale n'est en général pas soluble analytiquement. Il va donc falloir recourir à 
des approximations. 


Nous allons commencer par faire l'hypothèse que nous sommes dans le régime classique du gaz 
d'électrons. C'est-à-dire que le terme: 


ce qui implique: 
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E-u>XT (38176) 


Dès lors, nous avons aussi l'approximation: 


= _E-H 
E- y : E-y TAPUT ZE (38.177) 
EXp Pr +1 exp TT 


En d'autres termes l'énergie E doit être bien supérieure au potentiel chimique { (assimilé souvent 
malheureusement et à ma connaissance à tort dans la littérature sur les semi-conducteurs au niveau de 
Fermi Æ- ). Les physiciens notent alors cette énergie Æ+ pour la distinguer et l'appellent "énergie 


minimale de la bande de conduction" (qui correspond à l'énergie minimale d'un électron quasi-libre pour 
satisfaire cette condition). 


Dès lors, nous changeons aussi la notation pour la densité de charge: 


PE) — 8e (Æ) (38.178) 


Remarque: Malheureusement, comme précisé dans le paragraphe précédent (!) dans beaucoup 
d'ouvrages de qualité sur les semi-conducteurs, le potentiel chimique # , qui est pour rappel une 
notion purement thermodynamique impliquant une hypothèse d'interactions, est remplacée par le 
concept d'énergie de Fermi £# et pourtant ce n'est pas la même chose! Les deux énergies ne 
coïncident que dans le cas où la température T est nulle! 


Donc nous devons considérer le terme de "niveau de Fermi", comme n'étant rien d'autre qu'un 
synonyme de "potentiel chimique" dans le contexte des semi-conducteurs. 


Nous avons alors: 


2\#) à ET 
1 RC Be)? fusdE 
Tale T#E ME (38.179) 
2m \ &. 
3/2 +0 
1 (2, 4 1/2 E 
 CÉOOGRE. 


E: 
Où fywr est la fonction de Maxwell-Boltzmann (cf chapitre de Mécanique Statistique) donnée pour 


rappel par: 


E- 4 
ET, ji) = — — 38.18 
Jus A) ex 7 | (38.180) 
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Et correspond donc bien à un comportement non quantique (soit un gaz d'électrons non-dégénéré!) car 
lorsque: 


E-uH>%XT (38.181) 
nous avons: 
JustE,T,H) &K1 (38.182) 


et donc les états d'énergie ne sont de loin pas tous occupés par les électrons (il n'y a donc pas 
dégénérescence). 


Nous sommes donc bien dans une situation où la physique classique prédomine sur la physique quantique. 
C'est la raison pour laquelle dans cette approximation (de Maxwell-Boltzmann) nous disons alors que nous 


avons affaire à un "semi-conducteur non-dégénéré" car les électrons ne sont pas entassés dans les niveaux 
les plus bas disponibles. 


Pour pouvoir continuer, nous faisons un changement de variable en posant: 


d'où: 
dx=—dàd#f et E=x IT+E 38.184 
[M (38. € ) 


Il vient alors: 


+0 +0 
[ VE — Eh exp (Res L VET [ * Exp CRE Jar 


FA kT 


= (#7)? _ (- )] 12,1} 
( 


Nous faisons une intégration par parties: 


dx (38.186) 
Vx 


nous faisons ensuite un changement de variable en posant: 


u = x == à- 2/xdu = Dudu (38187) 
x 


2/x 


Ce qui donne: 
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Ho — Ko y? +0 
1 x 1 e 118 
de [ —_—— Qudu = Je Fu (38.188) 
Ô 


Nous avons déjà calculé cette intégrale dans le chapitre de Statistiques. Il vient: 
NA 


L D 
[ x dx = Je # du DEA (38.189) 


Nous avons alors finalement: 


312 
Pet = (+) exp [#) (ET)? exp (- s ” 


2m \r kT &T)2 
1 (mr (ur 1 (2mkTY  (u-Bs . 
_ EX es | mms ‘2 Ex 38. ) 
eV # Pl ur Jo 2x2 y PU Tr cs, 


_ (rekT 7 (ie 
= me EXP 
27h ET 


Où pour rappel, #2, est la masse de la quasi-particule (et non la masse de l'électron pour rappel!). Donc 
après intégration tout se passe comme si tous les électrons étaient concentrés sur le niveau d'énergie 
Æ£# avec un nombre de places disponibles correspondant à: 


312 
{mr (38.191) 


Ce que nous notons traditionnellement (et de manière un peu malheureuse. car 1l n'est pas évident de se 
rappeler qu'il s'agit d'une densité): 


H—EËe 
M, = Mar | Pr | (38.192) 


Ou encore: 


HE 
NN, = M, ex 38.193 
ñ C 1 LT | ( ) 


Où nous avons environ à température ambiante (c'est le paramètre de la masse effective qui varie entre les 
deux) les valeurs suivantes d'états (quasi-)libres respectives pour le Silicium: 


312 
àT 
Ne LÉ | 227.10 [om] Gs194) 
À 


Et pour le Germanium: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


312 
&T 
Me = (2 | 10 [om |] (38.195) 


2 


Alors qu'il y a environ une densité d'atomes de 4.3: 102 [em ] et environ 10% [em ] électrons pour 


ces deux éléments. 


Cela signifie qu'il y a donc un rapport de 1/100000 entre la densité d'électrons totale et le nombre 
d'électrons quasi-libres. 


Nous remarquons cependant également que ce modèle théorique ne prend pas en compte la structure 
électronique (numéro atomique) du matériau étudié. 


Ainsi, nous voyons que les variations des densités d'électrons quasi-libres en fonction de la température 
(dans la gamme de validité de la température...) sont essentiellement de type exponentiel croissant ou 
décroissant. 


À partir de la densité des électrons libres (attention il faut bien se rappeler que ce sont uniquement les 
électrons quasi-libres qui se baladent dans nos équations mathématiques jusqu'à maintenant) dans le cristal 
semi-conducteur, nous pouvons en déduire l'énergie du niveau de Fermi (plus rigoureusement il s'agit du 
potentiel chimique!): 


— £ W, — E, W, —E 
N,=Me (Fe) = De exp € à) = re (38.196) 
C 


d'où: 


N 
4= En +kTin (a) (38.197) 
Ve 


Et puisque Ÿ, z M, nous avons toujours à cause du logarithme qui est négatif, l'énergie de Fermi (plus 


rigoureusement il s'agit du potentiel chimique!) qui est inférieure ou égale à l'énergie des électrons quasi- 
libres: 


HSE (38.198) 


Ou en d'autres termes, les électrons (quasi-)libres ont une énergie supérieure à l'énergie de Fermi 
(potentiel chimique...) ce qui est conforme à l'approximation du gaz non dégénéré faite plus haut. Cela 
donne une condition d'importance capitale pour que les porteurs négatifs puissent être les générateurs de 
la conduction dans le matériau. 


Ainsi, lorsque nous nous plaçons à une température différente du zéro absolu, les états électroniques ne 
sont pas tous dégénérés: 1l y a étalement des états occupés au voisinage de ce qui constitue par définition 
l'énergie de Fermi (cf. chapitre de Mécanique Statistique et Physique Quantique Ondulatoire), effet 
d'autant plus accentué que la température est élevée. 
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6.2. DENSITÉ STATISTIQUE NON-DÉGÉNERÉE DES PORTEURS POSITIFS 


Avant toute chose, il faut savoir que dans l'état actuel de nos connaissances les "trous" n'émergent pas des 
équations mais sont une construction empirique qui permet de faire correspondre la théorie et l'expérience 
(charges positives de l'effet Hall par exemple). Il s'agit donc d'un artifice pour faire une théorie simple 
d'une question intraitable rigoureusement à notre époque par la physique quantique. 


Personnellement, je considère les trous de la même manière que les points de Lagrange en astronomie: 
Même s'il n'y a aucun corps en ces points de Lagrange cela n'empêche pas un satellite de se mettre en 
orbite (quasi-stable) autour de ceux-ci (possibilité que nous n'avons pas démontrée dans le chapitre 
d'Astronomie) comme s'il y avait une masse! Par ailleurs des expériences auraient montré au début des 
années 2000 que des points de Lagrange apparaissent au niveau de l'atome dans certaines conditions 
idéales et simplifiées! 


Ceci dit, 1l faut se rappeler qu'un trou n'est pas un électron qui manque! C'est une idiotie (selon moi...) que 
l'on voit dans certains ouvrages spécialisés. 


Au risque de se répéter un peu souvent, rappelons que pour une température T fixée la probabilité qu'un 
électron occupe un état d'énergie E est donnée par: 


EXp (EE) +1 


Ce qui fait que pour avoir une meilleure approximation, nous écrivions en toute logique la densité 
volumique d'états occupés par unité d'énergie: 


Jro(E,T, ii = 


D(Æ)= il 5 


Te (ER) —— 
27h ep(É EE )#1 


Ce qui nous a amené finalement à la relation suivante de la densité volumique d'états de charges négatives 
où la présence d'une masse dans la relation indique que les états occupés le sont par des quasi-particules 


telle que: 
3/2 
&T — E 
N, =2 _. 5 EXP _— 
27h &T 


Mais qu'en est-il de la probabilité qu'un électron n'occupe pas pour une température T fixée un état 
d'énergie E et trivialement donnée par la différence: 


JET, Hi) =1- J,(E,T, Hi) = 1- fm(E,T, Hi) 


où le n en indice est là pour indiquer que la distribution concerne les porteurs "négatifs" (distribution 
donnée comme nous l'avons démontré juste précédemment par la distribution de Maxwell-Boltzmann qui 
découle d'une approximation de la loi de Fermi-Dirac). 
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Eh bien nous allons constater que les équations nous conduisent à la possibilité d'associer aussi à ces états 
non occupés une densité volumique d'états avec une masse effective donnée. Nous verrons aussi plus tard 
qu'il sera possible d'associer à ces états non occupés une charge électrique positive et égale et à celle de 
l'électron, d'où le p en indice dans le relation précédente et signifiant "positif". 


Nous avons donc pour ces porteurs positifs: 


1 (SE) 1 
JET D) = ———— û°7 — > — — — — — 
E- y E- y E- ji 
EXP +1 exp +1 exp +1 
&T &T &T 
(38.203) 
EX —_— EX — —_—— 
| T | | er } “UV xr 1 


esp(É EE) exp( TA) exp[ #E) ep(#E)#1 
&T &T &T &T 


faisons maintenant une approximation similaire à celle utilisée pour les porteurs négatifs, c'est-à-dire que: 


Jo (E,T,H) 1 (38.204) 


pour imposer un régime semi-classique et donc les états d'énergie ne sont de loin pas tous occupés par les 
trous (il n'y a donc pas dégénérescence). 


Cette restriction impose: 
4- E 
Expl—— | 1 (38205) 
#( IT | 
Soit écrit de la même manière que pour les porteurs négatifs: 
E- 
exp|- a æ1 (38206) 
si 


Soit contrairement aux porteurs négatifs cela impose: 
E-u& KT (38.207) 


en d'autres termes l'énergie doit être bien inférieure au niveau de Fermi (potentiel chimique). Les 
physiciens notent alors cette énergie #7 pour la distinguer et l'appellent "énergie maximale de la bande de 
valence" (qui correspond à l'énergie maximale d'un trou quasi-libre pour satisfaire cette condition). 


Remarque: Le lecteur pourra observer que les conditions susmentionnées imposent aussi que E est soit 
très petit en valeur absolue, soit négatif. Ce qui nous donne déjà une piste pour les bornes d'intégration 
à venir. 


Nous avons alors: 
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1 1 LE 
PET EE 5 exp(-#e) _—. 
EXP E à +1 exr(# = su “ 


Dès lors, nous avons aussi l'approximation: 
4 E 
J CET, {à = Exp|-——— | (38209) 
d &T 


Nous sommes donc bien dans une situation où la physique classique prédomine sur la physique quantique. 
C'est la raison pour laquelle dans cette approximation nous disons que nous avons alors affaire à un "semi- 
conducteur non-dégénéré" car les trous ne sont pas entassés dans les niveaux les plus hauts disponibles. 


Nous avons alors: 


27 
3/2 E 
1 (2m, if 1/2 E 
5(%) e()1e-2"e( 7) 


où le lecteur aura pu observé que les bornes d'intégration ont été choisies conformément à la remarque 
que nous avions faite juste précédemment et que les termes dans la racine carrée ont été permuté afin de 
ne pas y avoir de valeur négative. 


E= 1 (2m, sabr £ 1/2 H—E de 
ABS x|-2 J( EE) ep 


(38.210) 


Pour pouvoir continuer, nous faisons un changement de variable en posant: 
&T 


(8211) 
d'où: 
HA et E=-x. #T+EÆ, (38212) 
&T 


Il vient alors: 


Ey 
[ VE -Ee( 2er] #9 | Le # a KT 
—0 T +0 2Q _ 
0 (38.213) 
312 Ey 1/2 =x 
(&T) (#.) [ dx 


Nous faisons une intégration par parties: 


0 
J x = [21 + 


Ho 


À 


1 : ge ° e 
—dx=- | ——4dx (G8214) 
Ph Re LT 
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nous faisons ensuite un changement de variable en posant: 


u = x == àr- 2/xdu = 2udu (38215) 
X 


2/x 


Ce qui donne: 
0e 0, 
[ — dudu = [ “du (38216) 


Nous avons déjà calculé cette intégrale dans le chapitre de Statistiques. Il vient (puisque la fonction est 
paire nous utilisons la propriété démontrée dans le chapitre de Calcul Différentiel Et Intégral): 


0 ee à 
- er VIT 
[ x 28 dx =- [ 


+o 0 


Nous avons alors finalement: 


m = 1 2m, ds FA 3/2 E, \ x 
Sy (Æ) are 1 ET EXp E— (XTŸ “exp | 


2 
312 312 
2. XT Ey — Din. KT — 
- (2) es y=H|Nr _ 1 | Me | a (# à (38.218) 


où pour rappel, #2, est la masse de la quasi-particule (et non la masse du trou pour rappel!). Donc après 
intégration tout se passe comme si tous les trous étaient concentrés sur le niveau d'énergie #7 avec un 
nombre de places disponibles correspondant à: 


312 
a[e) (38.219) 


Ce que nous notons traditionnellement (et de manière un peu malheureuse... car 1l n'est pas évident de se 
rappeler qu'il s'agit d'une densité): 


ou Encore: 


By = 4 
N, = Ny es LT (38.221) 


où nous avons environ à température ambiante (c'est le paramètre de la masse effective qui varie entre les 
deux) les valeurs suivantes d'états (quasi-)libres respective pour le Silicium: 
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3/2 

kT 

M (2e) 211.109 [em ®] 6822) 
7T: 


et pour le Germanium: 


HET 312 
Ny = (22) æ0.5.109 [om] (33.223 


6.3. BANDES D'ÉNERGIE 


Les développements précédents pour les porteurs négatifs et positifs nous ont montré que dans le cadre de 
l'approximation d'un gaz de fermions non dégénéré, l'énergie des porteurs négatifs doit se trouver bien au- 
dessus du niveau de Fermi (potentiel chimique) et l'énergie des porteurs positifs bien en-dessous. 


C'est donc comme s'il y avait un intervalle d'énergie interdit ou ni électrons, ni trous n'ont droit de se 
situer! Cet intervalle d'énergie est traditionnellement appelé "bande d'énergie interdite" ou plus 
simplement "bande interdite" et abrégée B.I. 


L'intervalle d'énergie interdit est quant à lui souvent appelé "gap" et est noté Æ, . 


Voyons ceci sous forme schématique grossière en prenant garde au fait que ce schéma est donc quelque 
peu trompeur car il donne l'impression que la bande de conduction ou de valence occupe tout un bloc, 
alors qu'en réalité la bande de valence est constituée par la dernière couche complètement remplie, la 
bande d'énergie permise qui la suit étant appelée "bande de conduction". 


RSSK 
_— Bandes de 
conduction 
L+ 


À + Bande de 
conduction 
£ NS Ep 
Bande 
E, = 6[e7] interdite 
Le Ey Bande de 
valence 
Bandes de 
valence 
el, Le 
Isolant Semi-conducteur Conducteur 


Figure: 38.3 - Représentation des structures de bandes dans différents métaux 


De plus, sachant que la chimie moléculaire permet de démontrer que des structures sont composées de 
multiples bandes (en fonction du premier et deuxième nombre quantique) il vient alors les définitions 
rigoureuses suivantes: 
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D1. La "bande de conduction" (notée BC) d'une structure solide est la bande de plus basse énergie 
partiellement occupée ou vide (sachant que d'autres bandes se situent au-dessus en termes énergétiques 
mais ne se rempliront que sous des températures élevées et n'existent que par une description théorique 
lorsqu'elles sont vides). 


D2. La "bande de valence" (notée BV) d'une structure solide est la bande de plus haute énergie saturée, 
c'est-à-dire dont tous les états sont occupés (sachant qu'il peut y avoir en-dessous de la couche supérieure 
de la BV de multiples bandes en termes énergétiques et toutes saturées). 


Nous avons également l'association schématique traditionnelle des bandes de conduction et de valence 
avec la fonction de Fermi-Dirac (qui comme déjà mentionné en toute rigueur devrait être le potentiel 
chimique à température non nulle!) représentée sous forme simplifiée par: 


Figure: 38.4 - Association structure de bande avec fonction de Fermi-Dirac 


Mais au fait cette représentation, que nous retrouvons un peu partout dans certains ouvrages est 
relativement erronée. puisqu'en faisant une approximation semi-classique par la loi de Maxwell- 
Boltzmann il n'est plus question en toute rigueur de représenter la distribution sous forme de loi de Fermi- 
Dirac comme l'aura remarqué le lecteur attentif! Comme quoi il faut faire attention car la représentation 
traditionnelle de fn dans le modèle semi-classique indiquerait qu'il y aurait des états occupés dans la 
bande interdite alors que si nous représentions la fonction de Maxwell-Boltzmann, nous verrions deux 
fonctions distinctes au-dessus et en-dessous de la bande interdite!!! 


Et il faut se rappeler (!) que la figure ci-dessus (même si elle est assez fausse) représente 
conceptuellement un semi-conducteur non dégénéré suite aux approximations semi-classiques que nous 
avons faites dans nos développements en utilisant le modèle d'un gaz non dégénéré (approximation de 
Maxwell-Boltzmann) et qui imposait théoriquement: 


Ep D H%Ey (38.224) 
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que de nombreux auteurs écrivent (à nouveau c'est malheureux mais c'est ainsi...): 


ES Er Ey (38225) 


Donc il vient une autre définition possible du semi-conducteur non dégénéré: c'est celui où le niveau de 
Fermi (le potentiel chimique!) se situe dans la bande interdite et ce cas correspond au fonctionnement de 
la majorité des composants microélectroniques. 


Remarque: Rappelons (cf. chapitre de Mécanique Statistique) que la statistique de Maxwell- 
Boltzmann a été bâtie en supposant l'absence d'interaction entre les particules concernées. De plus, 
cette statistique est construite dans le cadre de la mécanique classique et ne s'applique donc que 
lorsque les effets quantiques sont négligeables, par exemple à des températures suffisamment hautes! 


Voici quelques valeurs expérimentales pour des semi-conducteurs courants: 


Tableau: 38.3 - Valeurs de quelques gaps 


nous comprenons alors de suite au vu de ces chiffres pourquoi le diamant, à structure cristalline et 
atomique quasi-identique, est isolant alors que le Silicium devient lui conducteur! 


Ce qui est intéressant pour les chercheurs, c'est de combiner des matériaux afin de jouer avec la largeur de 
£, en fonction des besoins! 


Par ailleurs, nous pouvons aussi conclure hâtivement.. que ce qui différencie isolants et semi-conducteurs 
c'est la largeur de leur bande interdite. 


Remarquons aussi que l'énergie nécessaire à un électron pour passer de la bande de valence à la bande de 
conduction peut lui être fournie par un rayonnement. Dans le cas d'une absorption de lumière, l'énergie 
kv d'un photon peut être suffisante pour cela tant que: 


hv2E, (38.226) 


À basse température, un tel processus est capable de rendre le matériau conducteur (technologie des 
télescopes spatiaux à basse température). Cette propriété est appelée la "photoconductivité". 


Enfin, rappelons les deux relations obtenus plus haut: 
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Le produit de ces deux densités possède une propriété très intéressante. Nous pouvons en effet remarquer 
qu'il est indépendant de la position du niveau de Fermi et appelé "densité intrinsèque": 


3/2 3/2 
#-p= (er) ex(£ Ec ] (2) er(# « 
rh &T rh &T 


2 
342 
L “È E 
27h? &T k&T kT 


Par exemple, quelques valeurs de la racine carrée de la densité intrinsèque à 300 [K] sont données dans la 
table ci-dessous: 


Tableau: 38.4 - Valeurs de densités intrinsèques 


Nous remarquons aussi que la densité critique est fortement dépendant de la température. Ces valeurs de 
densités sont bien évidemment idéalisées, dans la réalité ces valeurs sont bien inférieures à cause des 
imperfections (impuretés résiduelles, défauts de cristallisation...) qui perturbent localement la périodicité 
du potentiel et, de ce fait, introduisent des niveaux énergétiques qui peuvent être accessibles aux électrons. 
Par opposition avec les niveaux correspondant au matériau pur, nous parlerons de "niveaux extrinsèques". 


6.4. LOI D'OHM 


Nous avons démontré dans le cadre du modèle de Drude que la conductivité était donnée par: 
o= TT Gg29) 


où n est pour rappel la densité de porteurs dans le matériau. Nous avons également démontré que le 
courant est inversement proportionnel à la conductivité selon la relation: 


Dans le cadre des développements faits plus haut nous avons vu que la densité n des porteurs était donnée 
respectivement par les relations suivantes à un potentiel constant (hypothèse du modèle): 


312 312 
mkT 4- Ep mkT Ep 
= (2) | kT |] Ne (2) | "5 Dons 
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où les masses relatives #1, des quasi-particules (porteur négatif ou porteur positif) ne sont pas 


nécessairement égales! Ainsi, nous avons donc la résistance qui peut être approchée par une relation de la 
forme: 


B 
R=A — 
exr(à) 


et nous vérifions aisément cette dépendance en représentant graphiquement: 
B 
In(R) =1In(A) = 


soit In(R) en fonction de 1/T (la résistance ne dépend donc que de la température en théorie. à tension 
constante). 


La vraie complexité tient au fait que beaucoup de termes sont dépendants de la température (le niveau de 
Fermi, le temps de libre parcours moyen, etc.) et du potentiel appliqué ce qui fait que dans la réalité les 
courbes obtenues ne sont de loin pas conformes à la théorie…….! 


Une application numérique montre que les densités de porteurs À, et À, augmentent donc très 


rapidement déjà à partir de la température ambiante! Ce qui est conforme à l'expérience avec les semi- 
conducteurs non-dégénérés car nous aurons alors la conductivité qui augmente tout aussi fortement ce qui 
implique une baisse rapide de la résistance! 


La grande sensibilité de la conductivité de certains solides aux variations de température est à l'origine de 
nombreuses applications, tant pour les métaux conducteurs que pour les semi-conducteurs. C'est ce que 
nous appelons des "thermistances". 


Enfin, indiquons que dans le cas du Silicium, nous avons £, = 1.12 [e F] alors que l'énergie cinétique dû 


à l'agitation thermique (cf. ch les ieux Continus) est donnée à température 
ambiante par: 


Or, nous avons vu précédemment que seuls les électrons dont l'énergie était voisine de celle du niveau de 
Fermi pouvaient participer à la conduction. Leur énergie cinétique valant alors: 


EË 


LA 


F = me = 1.12 [eW] 


où v# est la "vitesse de Fermi". 


En égalisant les deux dernières relations: 


Il y a donc un rapport d'un facteur de 30 entre les deux énergies, soit en prenant la racine carrée, un 
rapport 5 entre les vitesses. Nous avons donc: 
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VF Æ Vrÿ 


Or, nous avons déjà vu lors de notre étude du modèle de Drude que la vitesse thermique nous amenait à 
un libre parcours moyen supérieur d'un ordre de grandeur (facteur 10) des distances interatomiques. Et ici 
nous avons donc un facteur 5 en plus!!!! Soit plus de 50 distances interatomiques! Le libre parcours 
moyen | d'un électron de conduction est donc beaucoup plus grand que celui que nous avions déterminé à 
partir du modèle classique de Drude. Ainsi, le libre parcours moyen ne semble pas dû aux collisions avec 
les ions du réseau mais elle est imputable aux imperfections du réseau: défauts de structure, atomes 
étrangers. 


Un semi-conducteur parfait (pur), soit sans imperfections, tel que nous l'avons traité théoriquement jusqu'à 
maintenant est appelé un "semi-conducteur intrinsèque": il ne comporte donc aucune impureté et son 
comportement électrique ne dépend que de la structure du matériau. Ce comportement correspond à un 
semi-conducteur parfait, c'est-à-dire sans défaut structurel ou impureté chimique. Un semi-conducteur réel 
n'est jamais parfaitement intrinsèque, mais peut parfois en être proche comme le silicium monocristallin 
pur. 


Dans un semi-conducteur intrinsèque, les porteurs de charge ne sont créés que par excitation thermique. 
Le nombre d'électrons dans la bande de conduction est alors égal au nombre de trous dans la bande de 
valence comme nous l'a montré notre modèle théorique. 


Il faut savoir qu'en réalité ces semi-conducteurs ne conduisent pas, ou très peu, le courant, excepté si nous 
les portons à haute température. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Notes personnelles: 
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39. OPTIQUE GÉOMÉTRIQUE 


LL. est l'étude de la fraction de l'énergie rayonnante sensible à la rétine, c'est-à-dire la 


"lumière" ou dit de manière plus générale: les "ondes électromagnétiques" (cf. chapitre 
d'Electrodynamique) et ce dans une large bande de fréquence qui ne se limite pas (suivant les cas 
étudiés) à la lumière visible! 


Nous avons choisi sur ce site de scinder l'étude de l'optique en trois parties: la photométrie (voir plus 
bas), l'optique géométrique (le présent chapitre) et l'optique ondulatoire (prochain chapitre). 


1. La "photométrie”" s'occupe de la partie des définitions des grandeurs relatives aux propriétés 
énergétiques des ondes électromagnétiques relativement à la sensibilité visuelle. 


2. "L'optique géométrique" où nous décrivons la propagation de la lumière dans les milieux transparents 
sans faire intervenir la nature même de la lumière. Il s'agit d'une partie de la physique présentant 
l'avantage de ne pas demander d'outils mathématiques compliqués, mais de beaucoup de bon sens 
géométrique. 


3. "L'optique ondulatoire" où les phénomènes lumineux sont interprétés en tenant compte de la nature 
de la lumière. Celle-ci est considérée comme une onde électromagnétique d'une longueur d'onde 
donnée définissant sa couleur (grandeur subjective comme nous le verrons plus loin). 


Dans certaines expériences, nous devons cependant considérer la lumière comme un phénomène 
corpusculaire (cf. chapitre de Physique Quantique Ondulatoire) nous la supposons alors constituée de 
particules, les "photons", dont l'énergie est proportionnelle à la fréquence lumineuse selon la loi de 
Planck (pas celle de la thermodynamique... l'autre). 


Pour des raisons de cohérence, comme nous en avons déjà fait mention, nous avons choisi de mettre la 
photométrie dans le chapitre d'Optique Géométrique (ici même donc...). 


Avant de commencer à étudier l'aspect mathématique de l'optique géométrique, il nous a semblé 
judicieux d'éclaircir certaines zones floues du domaine de l'optique qui sont rarement bien précisées 
voire même pas traitées du tout dans les ouvrages sur le sujet. Ainsi, nous allons d'abord présenter ce 
qu'est une source ou une absence de lumière et ensuite comment les couleurs sont vues et traitées par 
l'être humain. 


1. SOURCES ET OMBRES 


L'expérience nous enseigne que dans un milieu homogène et transparent la lumière se propage en ligne 
droite et que celle-ci provient toujours de "sources lumineuses": 


Certains objets sont lumineux par eux-mêmes (Soleil, flammes). Les autres objets ne sont généralement 
pas visibles dans l'obscurité (absence de lumière) mais s'ils sont éclairés ils renvoient tout ou partie de la 
lumière dans toutes les directions (voir le chapitre d'Électrodynamique et de physique quantique 
corpusculaire) et se comportent donc dès lors comme des sources lumineuses. 


Nous définissons: 
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D1. Une "source ponctuelle" comme étant un seul "point lumineux" 


D2. Une "source étendue" comme un ensemble de sources ponctuelles 
D3. Un "rayon lumineux" comme toute droite suivant laquelle se propage la lumière 
D4. Un "faisceau lumineux" comme un ensemble de rayons lumineux 


D5. Le "diamètre apparent" comme étant l'angle, généralement petit, sous lequel nous voyons une des 
dimensions de l'objet (angle exprimé en radians). 


La lumière traverse le vide sans subir d'altération. C'est ainsi que la lumière du Soleil, avant d'atteindre 
la limite de l'atmosphère terrestre, traverse d'immenses espaces vides sans subir de transformations. 


Sur Terre, entre un objet lumineux et l'oeil qui voit cet objet, la lumière traverse une certaine épaisseur 
d'air. L'objet demeure visible dans d'autres gaz, ou bien à travers une lame de verre, de mica, de 
cellophane..., ou bien encore à travers une couche d'eau, d'alcool, de glycérine. de tels corps 
constituent des "milieux transparents". 


La plupart des corps ne se laissent pas traverser par la lumière. Placés entre l'oeil et un objet lumineux, 
ils suppriment la vision de cet objet: nous disons alors qu'ils sont "corps opaques". 


En fait, aucune substance n'est parfaitement transparente et la propagation dans un milieu transparent 
s'accompagne toujours d'un affaiblissement. Ce phénomène d'absorption dépend de la nature du milieu 
et augmente avec l'épaisseur de substance traversée. C'est ainsi que l'eau, même très pure, est opaque 
sous une épaisseur d'une centaine de mêtres. Aussi les grands fonds marins ne reçoivent-ils jamais de 
lumière solaire. 


Il arrive que certains corps, dits "corps translucides", laissent filtrer de la lumière sans permettre à l'oeil 
d'identifier l'objet lumineux qui l'émet. Tels sont le verre dépoli, le verre strié, la porcelaine mince, le 
papier huilé. 


Dans un espace sombre, l'oeil situé hors du trajet de la lumière, aperçoit ce trajet grâce aux fines 
particules solides (poussières, fumée de tabac, brouillard...) en suspension dans l'air. Ces particules 
éclairées diffusent la lumière qu'elles reçoivent, devenant autant de points lumineux qui matérialisent le 
volume traversé par la lumière. L'observation familière montre que ces volumes lumineux paraissent 
toujours limités par des lignes droites. 


Nous pouvons dès lors appliquer le théorème des rapports de Thalès à certains phénomènes lumineux. 
Ainsi, imaginons l'expérience suivante: 


Nous réalisons des sources de dimensions assez faibles pour que nous puissions les considérer comme 
des sources ponctuelles (c'est-à-dire des points lumineux). 


Soit S une telle source ponctuelle de lumière. Considérons le volume que la source S illumine à travers 
une ouverture dans un diaphragme se situant dans la trajectoire de la lumière à la distance d. Si nous 
notons AB le diamètre circulaire de cette ouverture du diaphragme K et que nous coupons la trajectoire 
lumineuse par un écran E, parallèle à K et à distance D de la source, nous observerions que la partie 
éclairée se limite à un cercle A'B". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Si nous pouvions mesurer les diamètres AB et A'B' des deux cercles, ainsi que leurs distances d et D à la 
source, nous trouverions qu'ils satisfont au théorème des rapports de Thalès et ainsi que: 
A'B'_ 
AB 


& | 


C'est également la preuve que le volume lumineux est effectivement limité par des droites issues de S et 
s'appuyant sur le bord de l'ouverture du diaphragme. 


Ces faits d'observation et d'expérience élémentaires suggèrent l'hypothèse suivante: 


Dans un milieu transparent homogène (rappelons qu'un milieu est homogène quand tous ses éléments 
de volume possèdent les mêmes propriétés), la lumière provenant d'un point lumineux se propage 
suivant des lignes droites issues de ce point. Ces droites sont appelées des "rayons lumineux". 


Si nous revenons à la figure précédente, l'ensemble des rayons lumineux contenus dans le cône défini 
par la source S et le diaphragme K constitue un "faisceau lumineux". 


1. La lumière se propageant ici à partir de S, nous disons que les rayons "divergent" ou encore que le 
faisceau est un "faisceau divergent". 


2. Quand une source ponctuelle est à l'infini (comme l'est pratiquement une étoile, par exemple), les 
rayons qui en partent sont parallèles et les faisceaux qu'ils forment sont appelés "faisceaux parallèles", 
ou encore "faisceaux cylindriques". 


3. À l'aide d'une lentille convergente (une loupe, par exemple), nous verrons qu'il est possible de 
changer les directions de rayons issus d'une source ponctuelle et de les faire concourir en un point S". 
Un tel ensemble de rayons constitue alors un "faisceau convergent". 


Un faisceau lumineux très étroit prend le nom de "pinceau lumineux". Par exemple, les rayons allant 
d'un point lumineux à l'oeil forment toujours un pinceau lumineux très délié, parce que la distance du 
point observé à l'oeil est nécessairement grande, comparée au diamètre de la pupille. 


Si nous revenons à notre expérience avec le diaphragme: si nous diminuons l'ouverture de ce dernier 
qui limite un pinceau de rayons lumineux, nous observons (lorsque le diamètre est réduit à moins de 
quelques dixièmes de millimètre) que la trace du pinceau sur un écran E, au lieu de s'amenuiser, 
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s'agrandit au contraire, preuve que la lumière parvient maintenant en des points situés hors du cône 
SA'B. 


Tout se passe comme si la très petite ouverture AB devenait elle-même une source ponctuelle: nous 
disons que la lumière se "diffracte". Nous reviendrons plus tard sur cette propriété de la lumière car il 
s'agit d'une étude mathématique assez élaborée ( ) et donc complexe à 
manipuler mais cependant fort intéressante. 


Considérons maintenant une source ponctuelle de lumière. Entre la source et un écran E, interposons 
un corps opaque de forme quelconque. Conformément à l'hypothèse de la propagation rectiligne, nous 
observons un "cône d'ombre" limité par les rayons qui s'appuient sur le contour du corps interposé. 


La région non éclairée du corps opaque est "l'ombre propre", celle qui correspond sur l'écran est 
"l'ombre portée”. 


Si la source de lumière est étendue, l'ombre portée et l'ombre propre n'ont plus leurs contours nettement 
délimités. Leurs bords s'entourent d'une zone intermédiaire que l'on appelle la "pénombre". 


2. COULEUR 


Définition: Nous nommons "couleur" la perception d'une excitation lumineuse suite à un processus 
neurophotochimique par l'oeil d'une ou plusieurs fréquences d'ondes lumineuses avec une (ou des) 
amplitude(s) donnée(s). 


Remarque: Il importe de ne jamais confondre "couleur", notion perceptive, et "longueur d'onde”, 
notion physique. Ainsi, l'oeil humain est le plus souvent incapable de distinguer un jaune 
monochromatique théorique (une seule longueur d'onde) d'une composition correspondante de vert 
et de rouge. Cette illusion permet d'afficher du jaune sur nos écrans d'ordinateur, et, plus 
généralement n'importe quelle couleur. 


De par le fait que la partie sensible de la rétine de l'oeil humain est composée d'éléments appelés 
"cônes" sensibles chacun à un petit intervalle correspondant respectivement au rouge (via la molécule 
d'erythrolabe), au vert (via la molécule de chlorolabe) et au bleu (via la molécule de cyanolabe), nous 
pouvons créer n'importe quelle couleur en additionnant ces trois couleurs de base appelées "couleurs 
fondamentales additives" (ou "couleurs primaires additives"). Cela s'appelle la "synthèse additive" des 
couleurs. 


L'association française de normalisation (AFNOR) a défini au 20ème siècle le principe de trivariance 
visuelle de la manière suivante: Un rayonnement de couleurs quelconques peut être produit 
visuellement à l'identique par le mélange algébrique, en proportions définies de manière unique, des 
flux lumineux de trois rayonnements qui peuvent être arbitrairement choisis, sous réserve qu'aucun 
d'entre eux ne puisse être reproduit par un mélange des deux autres. 


Dans ce qui suit, nous noterons le rouge (R), le vert (V), le bleu (B), le blanc (W), le noir (N). 
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Couleur Longueur d'onde [nm] Fréquence [THz] 
rouge | 625-740 — 480-405 
orange | - 590-625 + 510-480 
jaune || 565-590 - 530-510 
vert D 520-565 - 580-530 
cyan [} 500-520 — 600-580 
bleu | — 446-500 — 690-600 
violet I 


- 380-446 790-690 
[ablea Valeurs de auelaues longueurs d'onde et c 
Il est clair que vu les fréquences du spectre visible ce ne sera pas demain qu'avec les matériaux connus 
au début du 21ème siècle que nous allons construire des antennes ou paraboles capables d'émettre à de 
telles fréquences! Déjà que 120 [GHz] c'est un exploit alors 500 [THz] demain. 


Il faut savoir que jusqu'en 1800 on ne savait pas si les couleurs se limitaient ou non à celles visibles par 
l'oeil humain. Ce fut avec l'apparition des thermomètres à mercure suffisamment sensibles et précis, que 
l'astronome Herschel en plaça un devant un spectre lumineux et trouva qu'en le promenant d'une bande 
de couleur à l'autre, du violet au rouge, la température s'élevait. À sa grande surprise, elle continua de 
s'élever lorsqu'il laissa accidentellement le thermomètre à un deux centimètres au-delà de la zone de la 
lumière rouge. Herschel avait détecté une lumière invisible à l'oeil humain, qualifiée plus tard de 
rayonnement infrarouge. 


Un exemple magistral et pédagogique de ce que l'on peut voir dans les différents spectres est la 
nébuleuse du Crabe qui est un rémanent de supernova résultant de l'explosion d'une supernova 
historique (SN 1054) observée par plusieurs astronomes chinois de la dynastie Song de juillet 1054 à 


avril 1056: 
7. 
"92 
% 


Remarque: Les cônes L de la rétine sont sensibles aux ondes longues (700 [nm]), donc les rouges. 
Les cônes M, sensibles aux ondes moyennes (545 [nm]), donc les verts. Les cônes S, sensibles aux 
ondes courtes (440 [nm]), donc les bleus. Quant au choix de cette gamme précise du spectre 
électromagnétique par la Nature, il suffit de regarder le spectre d'absorption de l'eau pour voir que 
ça tombe pile dans une fenêtre où l'eau absorbe très peu. Du coup, nous pouvons voir loin même 
par temps humide. 


En pointant trois faisceaux lumineux (R, V et B) au même endroit, nous pouvons obtenir (au fait il 
serait plus rigoureux de dire "percevoir" car ceci est propre seulement à certains mammifères 
trichromates) de la lumière blanche. Nous disons alors que le blanc (dans le sens humain du terme) est 
la somme des trois couleurs fondamentales additives (rappelons qu'au fait le blanc est rigoureusement la 
somme de toutes les couleurs du spectre - donc que le blanc est constitué d'un spectre lumineux 
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continu). Toutes les couleurs imaginables sont obtenues en variant l'intensité de chacun des trois 
faisceaux. Le noir est obtenu quand nous n'envoyons aucune lumière du tout. 


Par exemple, si nous additionnons (dans le sens théorique du terme: avec des composants de couleurs 
infiniment petits et transparents...) juste du rouge et du vert, nous obtenons du jaune (J), si nous 
additionnons du rouge et du bleu, nous obtenons du Magenta (M), si nous additionnons du vert et du 
bleu, on obtient du Cyan (C). Nous pouvons donc résumer cela par les équations suivantes: 


RF=R+V =J 
RB=R+B=-M 
VB=V+B=C 


Ces trois couleurs (J, M, C) obtenues en additionnant deux couleurs fondamentales additives sont 
appelées "couleurs secondaires additives". 


Schéma de la synthèse additive: 


Jaune 
Rouge Vert 
Blanc 
Magenta Cyan 


Bleu 


L'existence de ces trois types de pigments dans les photorécepteurs des cônes sert de base 
physiologique au "modèle trichromatique" ou de "trivariance visuelle”. 


Définition: Une couleur est dite "couleur complémentaire" d'une autre si elles donnent du blanc quand 
on les additionne. Par exemple, le jaune est la couleur complémentaire du bleu: 


J+B=(R+PN+B=W 


À l'opposé de la synthèse additive, il existe la "synthèse soustractive des couleurs": c'est celle dont nous 
parlons quand nous enlevons de la couleur à une couleur de base. C'est par exemple le cas de l'encre ou 
des filtres colorés (dans le sens où il y a un support de base dont il faut traiter la couleur). 


Pour comprendre de quoi il s'agit, posons un filtre rouge sur un rétroprojecteur. La lumière projetée sera 
rouge. Nous remarquons donc que le filtre a enlevé de la couleur à la lumière blanche: W est devenu R 
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mais comme W = RVB, cela veut dire que le filtre rouge a enlevé les couleurs VB à la lumière blanche 
du rétroprojecteur. Avec le même raisonnement, nous comprenons qu'un filtre V soustrait les couleurs 
RB et un filtre B soustrait RV. 


Si nous empilons deux filtres de couleurs fondamentales différentes: par exemple, un filtre R et un filtre 
V, nous n'obtiendrons rien du tout, autrement dit, du N. En effet, le filtre R ne laisse passer que la 
lumière rouge et le filtre V soustrait cette couleur (ainsi que le B). Il ne reste donc plus aucune couleur, 
autrement dit du N. 


Nous remarquons donc que les filtres R, V et B ne permettent pas de synthétiser différentes couleurs 
par soustraction puisque nous obtenons du noir dès que nous en superposons deux différents. Ce qui est 
très embêtant lorsque le support concerné est du papier et que l'objectif est d'imprimer quelque chose 
de coloré. 


Il est donc plus utile d'utiliser les filtres jaunes, magenta et cyan (J, M, et C) des couleurs additives 
secondaires. En effet, un filtre J laisse passer du jaune, c'est-à-dire RV. Il ne soustrait donc que le B à la 
lumière blanche d'origine. Selon le même principe, un filtre M soustrait V et un filtre C soustrait R. 


Nous remarquons alors que la superposition de deux filtres de ces couleurs secondaires donne une 
nouvelle couleur sur un support existant. Nous pouvons ainsi synthétiser n'importe quelle couleur en 
variant l'intensité de chacun des trois filtres (J, M et C) que nous superposons (sur le rétroprojecteur ou 
le papier par exemple). Nous appelons ces trois couleurs les "couleurs fondamentales soustractives". 


Schéma de la synthèse soustractive: 


Rouge 
Jaune Magenta 
Noir 
Vert Bleu 


Cyan 


Exemples: 


E1. Un écran de télévision ou d'ordinateur fonctionne sur le principe de la synthèse additive des 
couleurs. En effet, en regardant l'écran à la loupe, on peut se rendre compte qu'il est rempli de petits 
groupes de trois luminophores (zone brillante quand on l'excite) R, V et B. Ces luminophores sont 
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tellement proches que quand ils s'allument ensemble, ils donnent l'impression de se confondre et on 
perçoit uniquement la synthèse additive des trois pixels. Par exemple, sur un écran de télévision 
entièrement rouge, seuls les luminophores rouges brillent. Par contre, si l'écran vire au jaune, cela veut 
dire que les luminophores verts brillent en même temps que les rouges. 


E2. À l'opposé de la télévision, nous trouvons les procédés d'imprimerie qui fonctionnent en synthèse 
soustractive. En effet, la feuille est blanche et il faut lui enlever des couleurs pour obtenir celle que 
nous désirons. La technique est la même que celle des filtres: les encres contiennent des pigments qui 
filtrent certaines couleurs. En utilisant des encres J, M et C, nous pouvons obtenir toutes les couleurs 
du spectre visible. Toutefois, les pigments ne sont pas parfaits et le noir est très difficile à obtenir 
(surcharge d'encre et teinte plutôt brun foncée). Nous avons donc recours au noir comme quatrième 
couleur. Ce système s'appelle “l'impression en quadrichromie". Il est utilisé par exemple par la plupart 
des imprimantes couleurs et dans les rotatives de journaux. 


Il est intéressant maintenant de s'intéresser aux phénomènes qui superposent les deux concepts (si nous 
pouvons dire). Ainsi, un système qui projette de la couleur selon le système RVB additif ou soustractif 
peut lui-même être éclairé par un système équivalent. Il en résulte ainsi une superposition d'effets. 


Ainsi, quand nous parlons de la couleur des objets, nous nous référons normalement à l'aspect qu'ils ont 
quand ils sont éclairés par de la lumière blanche. 


Exemple: 


Une tomate rouge, absorbe une partie de la lumière blanche W (VB) et diffuse le reste (R). C'est pour 
cela qu'elle nous apparaît rouge quand on l'éclaire avec de la lumière blanche. Un citron, lui, apparaît 
jaune car il absorbe le bleu de la lumière blanche W et diffuse le reste (RV).... Mais qu'en est-il d'une 
tomate éclairée par une lumière bleue? À quoi ressemble le citron si nous l'éclairons en rouge? 


Nous pouvons répondre en raisonnant comme suit: comme la tomate absorbe VB et donc 
intrinsèquement le bleu (B), il ne reste donc rien. Elle apparaît alors noire. Quant au citron, comme il 
absorbe le bleu (B) et diffuse la lumière R+V alors si nous l'éclairons seulement avec du rouge R il ne 
diffusera que du rouge et apparaîtra donc rouge. 


3. PHOTOMÉTRIE 


La matière est capable d'émettre, de transmettre et/ou d'absorber de l'énergie électromagnétique. 
Plusieurs facteurs caractérisent ce rayonnement tels que: sa gamme spectrale, son intensité, sa direction 
ainsi que certaines propriétés intrinsèques à la matière. La photométrie se propose de rechercher les 
grandeurs qui lui sont spécifiques ainsi que les lois qui les régissent. 


Nous reconnaissons deux types de photométrie: la "photométrie énergétique" et la "photométrie 
visuelle". Dans ce qui va suivre, nous nous en tiendrons principalement à la photométrie énergétique. 


Au préalable, nous devons spécifier les conditions dans lesquelles nous allons définir les nouvelles 
grandeurs. Nous admettrons donc les hypothèses suivantes: 


H1. Le rayonnement se propage dans un milieu transparent pour toutes les intensités, les longueurs 
d'onde et leur polarisation. 


H2. La propagation s'effectue suivant des angles solides ( ). Nous écartons 
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ainsi la propagation selon des rayons parallèles. 


H3. La surface élémentaire dS d'étude est suffisamment petite pour que les rayonnements de ses points 
soient identiques mais pas trop petits pour éviter des phénomènes comme la diffraction. 


3.1. FLUX ÉNERGÉTIQUE 


Définition: Le "flux énergétique" d'une source de rayonnement est la puissance qu'elle rayonne. Le 
flux se mesure en Watts [W] (soit des joules par seconde [J/s]) et il découle dès lors que pour une 
source qui rayonne une énergie (non nécessairement constante), nous avons: 


= dE, () (39.4) 


dé 


Dans certains domaines professionnels le flux énergétique s'exprime en unités photométriques comme 
étant le "Lumen" noté [Im] ou en unités photoniques comme un nombre de photons par seconde: [51]. 


Raison pour laquelle, lorsque vous achetez des écrans ou lampes dans certains magasins, les unités ne 
sont pas les mêmes d'une marque à l'autre. 


3.1.1. LOI DE BEER-LAMBERT 


Si l'absorption et la diffusion d'un milieu peuvent être considérées comme proportionnelles à 
l'épaisseur dz de matière traversée, la variation de flux pourra s'écrire: 


dP=-ub;dz (39.5) 


dans cette expression , est le flux incident et x: [#71] est le "coefficient d'atténuation linéique" qui 
est fonction de la fréquence du rayonnement. 


Nous aurons donc une simple équation différentielle (cf. chapitre de Calcul Différentiel Et Intégral}: 


. = - uidz — D(z)= De * (39.6) 


û 


qui est la "loi de Beer-Lambert" (qui peut aussi s'exprimer à partir de l'intensité lumineuse que nous 
définirons de suite après). 


Ordres de grandeur: Atmosphère 4, = 107 [re]; éme = 410 [m7], Verre (BK7) 
Hossym = 0.2 [m7], … 


Remarque: La variation du coefficient d'absorption atmosphérique avec la longueur d'onde permet 
notamment d'expliquer la couleur bleue du ciel. 


Il existe de nombreuses autres formulations de la loi de Beer-Lambert dont une assez utilisée en 
physique nucléaire (voir chapitre du même nom) dans le cadre de la radioprotection. Voyons de quoi il 
s'agit: 


Considérons un flux & de particules frappant perpendiculairement la surface d'un matériau d'épaisseur 
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dz et de densité atomique N ([atomes { m° ]). Si nous considérons les particules frappant une surface S, 


ces dernières peuvent théoriquement rencontrer ÿÿ . 5.47 atomes cibles dans cette couche. Le nombre 
de particules interagissant sera proportionnel à l'intensité fois ce nombre, et nous avons: 


dP.S=-e Pp WS-.dz (597) 


Remarques: 


R1. & est la constante de proportionnalité et est nommée "section efficace microscopique". Ces 
unités sont souvent exprimées en "barn" (1 [barn |] = 10% [#]). 


R2. La densité atomique N est égale à (0° N,)/M,. où © est la densité en ig/m, Ns, le 
nombre d'Avogadro 6.022:10% [atomes {moie] et M,,, la masse molaire de la cible exprimée en 
[£g / male]. 


Si nous admettons maintenant que les centres de diffusion sont les électrons et non pas les atomes 
cibles, alors il faut remplacer N par M, où #, = N'Z avec Z étant le nombre d'électrons interagissant 


par atome cible. D'où: 


D = Pexpi-oN, 'zi= exp Pr: 


moi. 


‘MN 
ro: 2-Érte.| (39.8) 


En identifiant avec la première formulation de la loi de Beer-Lambert, nous voyons que ## joue le 
même rôle que: 


“NW 
u= oz 2 La et qg =: "mi (39.9) 


moi. 


Et dans l'hypothèse où l'électron constitue une "sphère d'action" présentant une surface frontale xr?, 
r, étant le rayon de cette sphère, alors: 


3.2. INTENSITÉ LUMINEUSE 


Pour décrire le flux énergétique d'une source, il faut commencer par le mesurer. Le capteur utilisé 
(thermocouple, bolomètre, cellule photoélectrique, oeil ou autres) ne peut recevoir qu'une partie: celle 
qui arrive dans l'angle solide 4£2 défini par sa section. 
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Définition: "L'intensité lumineuse" ou "intensité énergétique" 1 d'une source ponctuelle est le flux 
rayonné dans l'unité d'angle solide £3 centré autour d'une direction À d'émission: 


1-32 
d£sè 

L'intensité lumineuse est exprimée dans certains domaines professionnels en unités photométriques en 

"Candela" [Cd] ou en unités photoniques en [s”1] (rappelons que les stéradians n'ont pas d'unité au 

même titre que les radians). Raison pour laquelle, lorsque vous achetez des écrans ou lampes dans 

certains magasins, les unités ne sont pas les mêmes d'une marque à l'autre. 


Remarques: Une source est dite "source anisotrope" ou "source directionnelle" si son intensité varie 
avec la direction d'observation. 


Par comparaison (car cela aide), une unité de Candela est équivalent à l'intensité d'une source dans une 
direction donnée, qui émet un rayonnement monochromatique de fréquence 540.1012 [Hz] (ce qui 
correspond approximativement à la fréquence à laquelle l'oeil est le plus sensible), et dont le flux 
lumineux (ou intensité) dans cette direction est 1/683 [W] par stéradian. 


3.3. ÉMITTANCE ÉNERGÉTIQUE 


Définition: "L'émittance énergétique”, "excitance" ou encore "éclairement" M d'une source est le flux 


énergétique rayonné (puissance) par unité de surface dS en [W/m°] dans toutes les directions de 
l'espace extérieur à la source et dépend des propriétés physico-chimiques de la surface émettrice: 
M - db 
ds 


Elle est souvent assimilée dans le vocabulaire courant à la "luminosité" d'une source de lumière ce qui 
porte parfois à confusion avec le concept d'intensité lumineuse. 


L'émittance énergétique est exprimée dans de nombreux domaines professionnels en unités 
photométriques appelée "Lux" [1x] ou encore en unités photoniques [##?s?] ou pire encore. en 
[im/m?]. Par exemple quand vous achetez une voiture, les feux de croisement sont indiqués comme 
valant environ 20 [/x]. 


Attention à ne pas confondre l'émittance énergétique avec le flux énergétique!!! 


Si la source est ponctuelle et son rayonnement isotrope, sa direction n'est pas à prendre en 
considération. Dans le cas de ladite sphère de rayon r, l'émittance a alors pour expression: 


Dans le cas précédent de la sphère, un élément dS de la surface sphérique reçoit perpendiculairement le 
rayonnement. En toute généralité, une surface élémentaire peut être inclinée par rapport à la direction 
du rayonnement avec un angle 8. Ainsi, nous devons projeter la surface sur la perpendiculaire du 
rayonnement en utilisant les raisonnements élémentaires de la trigonométrie: 
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dD=MadScosg (39.15) 


C'est cette projection qui explique les saisons sur la Terre: la surface balayée par l'émittance à peu près 
constante et isotrope du soleil (considéré comme une source ponctuelle) est maximale à l'équateur 
(surface perpendiculaire) et donc implique un flux supérieur par rapport à ce que reçoit une latitude 
supérieure ou inférieure pour laquelle la projection perpendiculaire de la surface concernée est plus 
petite que celle à l'équateur pour une émittance identique. 


Remarques: 


R1. L'émittance énergétique n'est calculée que dans le demi-espace extérieur avant (celui d'où nous 
regardons la source), car seule la moitié de l'énergie échangée par les points de la surface dS est 
émise sous forme de rayonnement. L'autre moitié est échangée avec les atomes situés dans le corps. 


R2. L'émittance est habituellement aussi parfois notée F ou encore E. Il faudra prendre garde 
cependant à ne pas confondre l'émittance M avec la magnitude (notée de la même manière) que 
nous définissons en astrophysique. 


3.4. LUMINANCE ÉNERGÉTIQUE 


Soit une source non ponctuelle dont l'émittance énergétique M est connue en tout point. Un élément 
dS de la surface de ce genre de source sera par définition de l'intensité pas nécessairement isotrope et 
donc plus lumineux (puissant) lorsque l'on l'observe colinéairement au vecteur 4F. 


L'intensité énergétique 1 qu'il rayonne dans une direction, formant un angle 8, avec la normale à la 
surface d'émission est toujours inférieure à celle rayonnée dans la direction du vecteur 45. Ainsi par 


simple application des règles trigonométriques, nous obtenons la définition de la "luminance" (ou 
"radiance"): 


di _ d 


L(9) = — = ———— 
dScosg dSdficos 8 


(39.16) 


exprimée dans certains domaines, en unités photométriques en "Nits" [C4 : #?] ou en unités 


photoniques en [#25] 


Remarque: Lorsque nous ne nous préoccupons que de la lumière visible, la luminance d'une source 
est quelquefois appelée "brillance" ou "éclat" (attention ceci n'est pas le cas lorsque l'on traite de 
l'éclat comme il est vu en astrophysique). 


Nous pouvons aussi écrire: 
1(8) = JE cos&dS (39.17) 


qui nous donne l'intensité énergétique que rayonne une source de luminance L dans une direction 
donnée. 
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Jean-Henri Lambert (1728-1777) a observé que l'intensité énergétique de certaines sources (parmi 
toutes les types de sources imaginables...) anisotropes diminue comme le cosinus de l'angle 8, autour 
de la direction perpendiculaire à la surface de la source: 


I(8) = Zs cos® (39.18) 


Cette variation de l'intensité est observée lorsque nous mesurons l'énergie thermique rayonnée par un 
orifice percé dans un four (ce qui nous ramène au corps noir), isolé thermiquement et dont la 
température interne est supérieure à la température externe. Dans ce contexte, l'orifice est appelé un 
"émetteur Lambert" et ne balaye un espace que de 2x7 stéradians. 


Remarque: Une source qui obéit à cette loi est dite "source orthotrope”. 


3.4.1. LOI DE LAMBERT 


Une source obéit à la loi de Lambert si sa luminance énergétique est la même dans toutes les directions, 
c'est-à-dire que son intensité est isotrope et donc indépendante de l'angle 8. 


Nous avons alors: 


d D 
Î=—=1}, (3919) 

d Çè 
Calculons l'émittance d'un émetteur Lambert: 
Nous avons donc par définition même de la propriété d'un émetteur Lambert: 


di  _d(ijcos) 
dScos(®#)  dScosg S 


(39.20) 


L(8) = 
et nous avons: 
(sn Fos "4 cosé#"d6è (39.21) 
z = 
Or nous avons démontré dans le chapitre de Trigonométrie, qu'un angle solide élémentaire était donné 
par: 


d$à=27rsin 948 (39.22) 


Ce qui nous amène à écrire en utilisant les relations démontrées dans le chapitre de Trigonométrie: 


x #2 a #2 a #2 #2 
D= [ McossdQ= | cos. 2rsin 86 = 1527 | cos Osin 848 = 2x 
(I ( ( ( 


#2 
F ef 
= Al —-|--||=2x 
0 2 2 
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sing, 


a #2 1 
= 7 | sin 2648 = RA(-500e 2 | 
( 


L'émittance valant: 


MS ue fo 


=— 7 = {1137 (39.24) 
SOS 


Ce résultat est important pour l'étude du rayonnement du corps noir, puisque la valeur de la luminance 
mesurée par un capteur permet de déduire l'émittance M, donc le flux énergétique de la source: 


D=S Lz (3925) 


Remarque: Nous parlons de la "luminance" d'une source et de "l'éclairement" d'un objet (par une 
source). 


3.9. LOI DE KIRCHHOFF 


Tout corps irradié par une source énergétique voit le flux énergétique incident se répartir selon trois 
termes intuitifs: 


P=d,+d,+d, (39.26) 
où: 
- D, = 9° est le flux énergétique géométrique réfléchi ou diffusé 
- D, = Tr: est le flux énergétique qui traverse le corps sans interactions (transparence intégrale) 
- ®, = a: est absorbé et transformé sous d'autres formes d'énergie 


Les trois coefficients appelés respectivement "facteur de réflexion" & , "facteur de transmission" T et 
"facteur d'absorption" &, dépendent de la longueur d'onde 4 de la lumière incidente et de la 
température du corps récepteur. 


Pour chaque objet, nous avons bien évidemment: 
D+T+æ=1l (3927) 


qui est l'expression de la "loi de Kirchhoff simple" (contrairement à la version différentielle) en 
photométrie. 


Remarque: En physique, nous retrouvons souvent des énoncés de conservation sous la 
dénomination "loi de Kirchhoff" comme en électrocinétique par exemple. 


3.6. DÉCOMPOSITION SPECTRALE 


De ce qui vient d'être dit, il découle que toutes les grandeurs définies précédemment peuvent être 
rapportées à leur décomposition spectrale en longueur d'onde. Ceci résulte du principe de superposition: 
tout rayonnement peut être traité comme la superposition de rayonnements monochromatiques. 


Ainsi, nous définissons: 
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D=-f(dA 1=[I()d4 L=[L()dA M=[M(AA (055 


et de même: 


a=fatt}dA p=fotdA T-fradA (220) 


Remarque: Les unités du flux spectral (ou "décomposé"), intensité spectrale (ou "décomposée"), 
luminance spectrale (ou "décomposée") ou émittance spectrale (ou "décomposée") ainsi que les 
facteurs d'absorption spectrale (ou "décomposée"), de réflexion spectrale (ou "décomposée") et de 
transmission spectrale (ou "décomposée") ne sont bien sûr pas équivalentes à leur expression 
intégrée au niveau dimensionnel. 


Nous aurons un grand besoin de la densité de l'émittance lors de l'étude du corps noir dans le chapitre 
de Thermodynamique de la section de Mécanique. Rappelez-vous uniquement que nous avons en 
unités S.I. sur le principe de décomposition (et inversement superposition) spectrale: 


FF FF 
M | MA) | (39.30) 
2 Fr 


Remarque: Nous avons vu en thermodynamique que les paramètres définis ci-dessus, étant 
dépendants de la longueur d'onde, sont également dépendants de la température qui émet ces 
mêmes ondes. 


4. LOI DE RÉFRACTION 


Pierre de Fermat proposa que les rayons lumineux (ondes électromagnétiques) répondaient à un 
principe très général selon lequel le chemin emprunté par la lumière pour se rendre d'un point donné à 
un autre était celui pour lequel le temps de parcours était minimum (en fait un extremum qui peut être 
un minimum ou un maximum). Cette proposition, appelée "principe de Fermat", à la base de l'optique 
géométrique s'appuie sur le principe de moindre action (principe que nous avons déjà introduit dans le 
chapitre de Mécanique Analytique) ce que nous démontrerons plus loin. 


Avant de commencer les développements, donnons quelques définitions importantes donc certaines 
sont basées sur la figure ci-dessous: 
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rayon incident 
avec angle 
d'incidence à 


rayon partiellement 
ou totalement 
réfléchi avec angle 
de réflexion r, 


Milieu 1 de propagation 
Mülieu 2 réfringent 


interface/pian d'incidence 


Fe 


ou totalement 
réfracté avec angle 


ll 
rayon partiellement 
i 
Ll 
ll 
i de réfraction r. 


Figure: 39.5 - Vocabulaire pour l'étude de l'optique géométrique 
Définitions: 
D1. Un "milieu réfringent" est un milieu qui cause la déviation d'un rayon lumineux incident. 


D2. Le "rayon incident" est le rayon lumineux qui se propageant dans un milieu 1, passe totalement ou 
partiellement dans un milieu réfringent 2, le reste étant absorbé ou partiellement réfléchi. 


D3. "L'angle d'incidence", parfois noté i, est l'angle par lequel le rayon incident pénètre dans le milieu 
réfringent. 


D4. Le "rayon partiellement ou totalement réfléchi" est la partie du rayon lumineux qui ayant rencontré 
l'interface séparant le milieu de propagation du milieu réfringent, continue son parcours dans le milieu 
de propagation. 


D5. "L'angle de réflexion", parfois noté r, ou simplement r s'il n'y a pas de confusion possible, est 


l'angle par lequel le rayon est réfléchi par rapport au plan représentant l'interface entre le milieu de 
propagation et lui-même. Nous démontrerons que les angles incidents et réfléchis sont égaux en valeurs 
absolues. 


D6. Le "rayon partiellement ou totalement réfracté" est la partie du rayon lumineux qui ayant rencontré 
l'interface séparant le milieu de propagation du milieu réfringent, continue son parcours dans le milieu 
réfringent. 


D7. "L'angle de réfraction", parfois noté r, ou simplement r s'il n'y a pas de confusion possible, est 


l'angle par lequel le rayon est réfracté par rapport au plan représentant l'interface entre le milieu de 
propagation et le milieu réfringent. Les angles incidents et réfractés sont liés par une relation que nous 
démontrerons plus loin. 


D8. "L'indice de réfraction absolu" d'un milieu à une longueur d'onde 4 donnée (et donc de fréquence 
v) mesure le facteur de réduction de la vitesse de phase de la lumière dans le milieu par rapport au vide 
(la plus grande qui soit) et est donné en toute généralité par la "loi de Cauchy" (la seule démonstration 
mathématique que j'ai eu entre les mains à ce jour partait des équations de Maxwell et tenait sur 
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environ 3 pages A4, mais elle était basée sur tellement de bricolages successifs que l'on va passer outre 
et admettre qu'elle ne peut être établie qu'expérimentalement): 


B BP 
A3 = A+— = A+—- (39.31) 
À € 
où À et B sont des constantes établies expérimentalement. Nous pouvons remarquer à travers la loi de 
Cauchy que l'indice de réfraction absolu diminue lorsque la longueur d'onde augmente (in extenso 


lorsque la fréquence diminue). 


Tous les matériaux possèdent un indice de réfraction absolu, d'une valeur positive et supérieure à 1. 
Plus un milieu est dense, plus la vitesse de phase de la lumière est ralentie, plus l'indice de réfraction 
absolu est élevé. 


Considérons (voir figure ci-dessous) maintenant deux milieux Àf, et Af,, d'indices de réfraction 
respectifs n et m (implicitement dépendant de la longueur d'onde) et dont la surface de contact est 
plane. Prenons deux points A et B situés respectivement dans le milieu d'indice n (le point À) et dans le 
milieu d'indice m (le point B). 


Considérons le chemin de la lumière allant de À à B. Le principe de Fermat nous enseigne que le 
chemin emprunté par la lumière est tel que le temps mis pour le parcourir est minimum. Nous nous 
proposons dans un premier temps d'appliquer une méthode classique pour calculer le chemin du rayon 
lumineux et dans un second temps, nous montrerons que le principe de Fermat peut être énoncé comme 
un principe variationnel. 


Choisissons un repère qui simplifie le problème: faisons passer l'axe des abscisses par le plan de contact 
des deux milieux et l'axe des ordonnées par le point B. Dans un tel repère, les points A et B ont les 
coordonnées suivantes: A(x,,y 4), B(0, y2). 


Appelons Af(x,0), le point où le rayon lumineux traverse la surface de contact entre les deux milieux. 
Le temps T mis pas la lumière pour aller de À à B est alors: 


- AM, MB _ 2° AM re MB 


Va ? F (39.32) 


T 
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où: 


= 2 et = 39.33 
Vu TR Vy — (3° 23) 
ñ Lcd: 


sont les vitesses de phase de la lumière dans les milieux 4f, et 4f, . 


Nous pouvons observer sur la figure ci-dessus que les rayons incidents sont réfractés de l'autre côté de 
l'axe perpendiculaire à l'interface. Ceci est une caractéristique type des matériaux ayant un indice de 
réfraction absolu positif. Mais il est possible physiquement de construire depuis les années 1990 des 
"métamatériaux" composites artificiels à indice de réfraction absolu négatif. 


L'écriture des deux relations précédentes: 


se justifie par le fait que nous pouvons nous permettre de faire l'hypothèse que la vitesse de phase de la 
lumière ne croît pas en traversant un corps dense mais se voit divisée par un facteur donné dépendant 
du milieu qu'elle traverse. Pour s'en convaincre, il suffit d'imaginer un cas absurde où la lumière 
traverserait sans perte de vitesse un corps de densité infinie! 


En développant les valeurs de AM et MB nous obtenons la dépendance suivante de T en fonction de la 
position x de M: 


(er) 
CO 
(er) 
U1 


| D Pr MES 
ren = 2 V6a7® +ya ," ÿx YB (39 


€ 


Selon le principe de Fermat, le chemin emprunté par la lumière est celui pour lequel T est minimum. 
L'extremum de T(x) est atteint lorsque sa dérivée par rapport à x est nulle. 


Notons que: 


(x x4)  _ (7 %4) | —sin(i) et = = sin(r) (39.37) 
GA For ME 


où pour rappel, r est "l'angle de réfraction" (à ne pas confondre avec "l'angle de réflexion"!) et i "l'angle 
d'incidence" 


de la lumière allant de À à B. 
La condition d'un temps extremum mis par la lumière s'exprime alors: 


aT 


A... : M. 
— =Û0S --sinf6) +—sinftr) = 0 (39.38) 
€ E 
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D'où nous tirons la relation, connue sous le nom de "loi de Snell-Descartes" (qui n'est plus une loi 
puisque démontrée): 


n'sin() =»'sin(r)| (39.39) 


Il suffit que les angles d'incidence et de réfraction remplissent cette condition pour que le chemin 
parcouru par la lumière soit effectivement celui qui prend le moins de temps. 


Nous notons plus fréquemment la loi de Snell-Descartes en physique de la manière suivante: 


PEL # _ sin(r) 
” #, sin) 


où #,, est "l'indice de réfraction relatif" du milieu 2 par rapport au milieu 1 qui ont respectivement leur 
propre "indice de réfraction absolu" #,,#,. Ainsi, nous voyons bien à travers cette relation que l'angle 
incident est en valeur absolue obligatoirement égal à l'angle réfléchi. 


Remarques: 


R1. Nous verrons lors de notre étude de l'optique ondulatoire que nous pouvons retrouver 
(démontrer) cette même relation mais sans les hypothèses de bases de l'optique géométrique. Dès 
lors, cette dernière relation est appelée "relation de Descartes-Snellius" ou plus simplement "loi de 
Snell". 


R2. Quand nous parlons de l'indice de réfraction relatif d'un milieu m sans faire référence à un autre 
milieu, le milieu implicite est le vide. 


R3. Certains matériaux n'ont pas un indice de réfraction absolu isotrope: il dépend alors de la 
direction de propagation et l'état de polarisation de la lumière. Cette propriété porte le nom de 
"biréfringence”. 


Étudions maintenant la relation entre l'indice de réfraction relatif et la vitesse de phase de la lumière 
dans les différents milieux qu'elle traverse: 


Un rayon lumineux relie deux points 4 et À, situés de part et d'autre de S. Ce rayon n'est pas 


représenté dans la figure. Ne sont tracés que trajets situés de part et d'autre du rayon qui réalise 
l'extremum (nous nous basons sur l'étude du trajet maximum maintenant). Par hypothèse, ils sont 
extrêmement proches, si bien que la distance PQ est très faible: 


PQ << A4, (3941) 


Nous admettons qu'ils correspondent au même temps de parcours. 
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normale à S 


V1 


(1) 
Encident Ai 


A2 Gigané 


Figure: 39.6 - Figure permettant de mettre en relation vitesse de phase et indice de réfraction 


Puisque les deux trajets sont très proches, nous pouvons admettre l'égalité des distances 43, et 40 


d'une part, P4 et B,4, de l'autre. Ainsi, par hypothèse: 


Mais, sous la même hypothèse: 


PB, = PQ cos(xr{ 2 - 4) = POsin(&) 
QB, = PO cos(x! 2-8) = POsin(@) 
(39.43) 


si bien que: 


sin& _sin(r) V2 


- — (39.44) 
sing sinfG) y 


La "loi de la réfraction" s'énonce finalement en général: 


(39.45) 


Quant à l'angle de réflexion, comme nous l'avons déjà précisé, celui-ci reste donc égal à l'angle 
d'incidence si la surface de réflexion est parfaitement régulière et plate. 
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Remarque: Si nous considérons l'écriture suivante: 


sin() = 72 sin(r) 


et le cas où x, > *#, (par exemple passage de l'eau vers l'air). Alors, pour des valeurs proches de 1, 


c'est-à-dire pour des incidences rasantes (rayon incident proche de la surface), la loi de Snell- 
Descartes donne une valeur supérieure à 1. Nous sortons alors du domaine de validité de la loi. Cela 
correspond à des situations où il n'y a pas de réfraction mais uniquement de la réflexion, nous 
parlons alors de "réflexion totale". 


Le principe de Fermat présente donc d'évidentes similitudes avec le principe de moindre action en cela 
qu'il consiste en un principe du minimum. Bien qu'une description rigoureuse de la lumière nécessite 
l'introduction de la physique quantique, il est toutefois possible de l'appréhender par le biais de la 
mécanique analytique et de lui appliquer, sous certaines conditions, le principe de moindre action. Nous 
allons montrer que nous retrouvons ainsi le principe de Fermat. 


Les calculs que nous allons présenter, introduisent de nombreuses hypothèses hasardeuses mais en tout 
état de cause, ce procédé doit être considéré comme une approximation. À noter que le principe de 
Fermat procède lui aussi d'une même approximation que nous pouvons qualifier de "limite classique". 


Imaginons que la lumière est composée de "grains" matériels. Il faut alors admettre que ces grains 
obéissent à des propriétés physiques plutôt singulières: leur masse est nulle puisque selon la description 
classique, les rayons lumineux ne sont pas déviés par le champ gravitationnel. Cette absence de masse 
les rend donc insensibles au champ gravitationnel terrestre (attention ! nous sommes dans une 
description classique"). 


Écrivons l'action pour l'un de ces grains de lumière: 

S = [7 — W\dt 
Or, en supposant que le seul champ de potentiel V présent est celui qui dérive du champ gravitationnel 
et que nous admettons la lumière comme y étant insensible (nous savons en relativité générale que cela 
est faux mais nous avons précisé tout à l'heure que nous ferions des approximations!), il s'ensuit que 
l'action de la lumière peut s'écrire: 


5 = [fa 


Or, aucune force ne s'applique sur la lumière, par conséquent l'énergie cinétique T est une constante du 
mouvement. Appliquons le principe variationnel de moindre action: 


58 =-0- S(f7at) = T'ôfat 


D'où nous tirons: 
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ôf& = 0 


Cette équation signifie que le temps mis par la lumière le long de sa trajectoire est minimum (ou plus 
généralement, est un extremum). Nous retrouvons le principe de Fermat. Nous avons donc montré, qu'à 
la limite classique et sous certaines hypothèses, le principe de Fermat découle directement du principe 
de moindre action. 


4.1. EFFET TCHERENKOV (CERENKOV) 


Nous avons vu dans les paragraphes précédents l'hypothèse (relativement intuitive) que la vitesse de 
phase de propagation de la lumière dans un milieu d'indice de réfraction absolu n n'était pas égale à c 
mais toujours inférieure en écrivant cela: 


L'effet Tcherenkov est (basiquement) un phénomène similaire à une onde de choc (en acoustique), 
produisant un flash de lumière, et qui a lieu sur le trajet d'une particule chargée se déplaçant dans un 
milieu avec une vitesse de phase supérieure à la vitesse de la lumière du milieu (l'explication rigoureuse 
sort du cadre d'étude de ce site de par sa complexité de traitement!). 


Effectivement, rappelons d'abord que nous avons vu dans le chapitre d'Électrodynamique que toute 
particule chargée en mouvement émettait une radiation électromagnétique. Ensuite, nous avons vu dans 
les paragraphes précédents que la vitesse de la lumière dans un milieu donné dépendait de l'indice de 
réfraction absolu de ce milieu (hypothèse qui se vérifie par la justesse expérimentale des 
développements théoriques qui en découlent). 


Remarques: 


R1. C'est cet effet qui provoque la luminosité bleue de l'eau entourant le coeur d'un réacteur 
nucléaire. 


R2. Parfois certains se demandent pourquoi les particules chargées peuvent aller plus vite que la 
lumière dans un milieu autre que le vide. C'est simple au fait: même si les deux particules 
rencontrent à peu près les mêmes obstacles et difficultés à se propager le photon ne peut être 
accéléré par une impulsion alors qu'une particule chargée peut se voir être accélérée par un 
phénomène donné dans un milieu donné. 


Nous avons donc deux données de bases. La vitesse de la particule chargée qui peut s'écrire sous la 
forme suivante avec les notations relativistes: 


v= fc 


et la vitesse de phase de la lumière dans un milieu avec un indice de réfraction absolu donné: 
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Il est facile de voir que pour obtenir v > v, il faut avoir: 


[es 
£c>— (39.54) 
À 


Soit: 
B>1l/A2 (39.55) 


Certains auteurs préfèrent comparer la distance parcourue par la lumière par rapport à celle parcourue 
par la particule. Il vient ainsi: 


Et donc pour que la particule parcoure des distances égales à celles de la lumière dans le même temps 
il faut que 8 = 1/#. Au-delà, apparaît l'effet Tcherenkov. 


5. FORMULES DE DESCARTES 


Nous avons discuté précédemment certains phénomènes qui se produisent lorsqu'un front d'onde passe 
d'un milieu à un autre dans lequel la propagation est différente. Non seulement nous avons analysé ce 
que devient le front d'onde, mais encore nous avons introduit le concept de "rayon" qui est 
particulièrement utile pour les constructions géométriques. Nous nous proposons maintenant 
d'approfondir les phénomènes de réfraction et de réflexion d'un point de vue géométrique en utilisant le 
concept de rayon comme l'outil permettant de décrire les processus qui prennent place aux surfaces de 
discontinuité de la propagation. Nous admettrons également que les processus se limitent à des 
réflexions et réfractions, aucune autre modification n'affectant les surfaces d'onde. 


Ce traitement géométrique est correct tant que les surfaces et les discontinuités rencontrées par l'onde 
au cours de sa propagation sont très grandes devant la longueur d'onde. Tant que cette condition est 
remplie, le traitement s'applique aussi bien aux ondes lumineuses, acoustiques (en particulier 
ultrasonores - très hautes fréquences), sismiques, etc. 


Nous commençons par considérer la réflexion des ondes sur une surface sphérique. Nous devons 
d'abord établir certaines définitions. Le centre de courbure C (cf. chapitre de Géométrie Différentielle) 
est le centre de la surface sphérique de la figure ci-dessous et le sommet O est le pôle de la calotte 
sphérique. 


Définition: La droite passant par O et C est appelée "axe optique". 


Si nous prenons O pour origine des coordonnées, toutes les quantités mesurées à droite de O seront 
prises comme positives, toutes celles à gauche comme négatives!!! 
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Figure: 39.7 - Représentation du concept d'axe optique 


Supposons que le point P soit une source d'ondes sphériques. Le rayon 54 donne par réflexion le 
rayon A et, comme les angles d'incidence et de réflexion sont égaux par rapport à la perpendiculaire 


AC de la surface (comme nous l'avons déjà fait remarquer lors de notre étude de la réfraction), nous 
voyons sur la figure que: 


É=84+ae a = B+& (39.57 
d'où: 
at 25 (69.56) 


En admettant que les angles &, ,&, et £ sont très petits, c'est-à-dire que les rayons sont "para-axiaux" 


et que la source est très distante ou que le détecteur est très petit par rapport à la source, nous pouvons 
écrire avec une bonne approximation avec un développement de Maclaurin (cf. chapitre sur les Suites 
Et Séries) pour de petits angles: 


@ = ten(a) = AP À 
: BP p 
AB h 
& Stan(&)=—Z=— (39.59) 
B 4 
AB _k 
Ê Etant) = — = — 
CO pr 


En substituant ces valeurs approximatives de &,&, et £ dans & + &, = 28, nous obtenons: 


(39.60) 


qui est la “formule de Descartes pour la réflexion sur une surface sphérique concave". Elle implique, 
dans l'approximation utilisée pour l'établir, que pour tous les rayons incidents passant par P passeront 
par Q après réflexion sur la surface. Nous pouvons alors dire que Q est "l'image de l'objet" P. 
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Dans le cas particulier où le rayon incident est parallèle à l'axe optique, ce qui équivaut à placer l'objet 
à une très grande distance de la lentille, nous avons ? = ® . La formule de Descartes pour la réflexion 
sur une surface sphérique concave devient alors: 


est appelée "distance focale". Nous obtenons aussi le rapport r / 2 si nous faisons tendre q vers l'infini. 


La relation obtenue précédemment est également valable pour une surface convexe. Effectivement, il 
suffit de tirer les traits représentant les rayons lumineux au-delà de la surface concave pour voir que 
l'objet d'étude est le même à une symétrie près: 


Surface convexe 


Figure: 39.8 - Principe de l'extension à une surface convexe 


La seule différence entre la surface concave et convexe tient au fait que dans le cas de la surface 
convexe, l'image de l'objet réfléchi apparaît comme s'il semblait être derrière la surface (à l'équivalent 
du point P). Ceci nous amène à définir la terminologie suivante: 


Définitions: 


D1. Une "image virtuelle" est un terme utilisé en optique pour désigner toute image qui se forme avant 
la face de sortie d'un instrument d'optique (dans le sens de parcours de la lumière) et ne peut donc pas 
être visualisée sur un écran. Pour une lentille mince convergente un objet placé entre le foyer objet et le 
centre optique de la lentille donnera une image virtuelle. C'est notamment le cas d'un système optique 
utilisé comme loupe, qui permet d'obtenir une image agrandie de l'objet observé à travers la lentille. 


D2. Une "image réelle" est un terme utilisé en optique pour désigner toute image qui se forme après la 
face de sortie d'un instrument d'optique (dans le sens de parcours de la lumière). Pour une lentille mince 
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convergente un objet placé après le foyer objet de la lentille donnera une image réelle. 


Remarque: Si l'ouverture du miroir est grande, de telle sorte qu'il reçoive des rayons fortement 
inclinés la formule de Descartes que nous avons précédemment déterminée n'est plus, nous le 
savons, une bonne approximation. Il n'y a plus dans ce cas une image ponctuelle bien définie d'un 
"point objet", mais un nombre infini d'entre elles: en conséquence l'image d'un objet de grandes 
dimensions apparaît floue puisque les images se superposent. Cet effet porte le nom "d'aberration de 
sphéricité" et la partie de l'axe optique qui contient l'ensemble des images réfléchies s'appelle alors 
la "caustique par réflexion". L'aberration de sphéricité ne peut pas être éliminée, mais un dessin 
approprié de la surface permet de la supprimer pour certaines positions sur l'axe optique appelées 
"stigmatiques". Par exemple, dans notre cas d'étude précédent, il est évident (par construction 
géométrique) que si nous posons P en C, alors le point C devient alors le point stigmatique. Nous 
disons alors qu'il est le point "rigoureusement stigmatique". 


Par contre, pour le miroir parabolique tous les rayons convergent vers le foyer du miroir où est 
concentrée l'énergie lumineuse reçue par le miroir. Réciproquement, nous plaçons le filament d'une 
lampe au foyer d'un miroir parabolique pour obtenir des projecteurs de grande portée (typhique des 
phares ne possédant pas de lentille de Fresnel). Nous donnons aussi une forme parabolique aux 
antennes de réception des ondes hertziennes. Pour la télévision diffusée par des satellites comme on 
travaille en ondes centimétriques (fréquence de quelques GHZ) une distance focale de l'ordre du mètre 
est convenable pour l'antenne (in extenso cela s'applique aux télescopes et radiotélescopes). 


stigmatisme d'un muroir sphérique stigmatisme rigoureux d'un miroir parabolique 


L'idée pour démontrer que le foyer de la parabole est le point stigmatique rigoureux est la suivante: 


Reprenons le schéma que nous avons utilisé lors de notre étude des coniques dans le chapitre de 
Géométrie Analytique: 
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Figure: 39.10 - Schéma général des propriétés de la parabole 


Nous y avons rajouté le point Æ qui est la projection orthogonale du point M (point d'incidence du 
rayon lumineux) ainsi que la tangente à la parabole au point M. Si nous arrivons à démontrer que la 
tangente à M est la médiatrice du segment F4;, alors nous démontrons également que l'angle 


d'incidence et de réflexion sont bien égaux. 
Prenons l'équation: 
y -2hx =0 (39.63) 


d'une parabole de paramètre h (cf. chapitre de Géométrie Analytique) rapportée à un repère principal 
(,7). Le foyer a donc pour coordonnées F(#/2,0) et la directrice a pour équation: 


x+h{f2=10 (39.64) 


Nous obtenons l'équation de la tangente en Af, par la dérivée en ce même point (attention. 
rappelez-vous de l'orientation particulière de la parabole!): 


= (7 %) 
OM) Yo) 


5] -2 -2- 2 G- Li=0-X 2-0 (39.65) 
Ce qui s'écrit encore: 
kx-hx My +78 = 0 hx -hx-yé + y = 0 (39.66) 
et en sachant que: 
2 =2hxm (39.67) 
nous obtenons donc l'équation de la tangente: 


hxy — x = ÿE + ÿoy = xs — hx - 2h + Yoy = ny = A(x+ 2x9) = 0 (39.68) 


Un des vecteurs directeurs de la tangente est donc alors (cf. chapitre de Géométrie Analytique): 
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P= y +pf (39.69) 


où dans le cas d'une parabole, p est égal à h. 


D'autre part, nous avons (cela se vérifie facilement en posant x, = Ü): 
37e h cu TH 37. h me Lo 
MF = I — Yo) a à (39.70) 


Nous avons donc le produit scalaire: 


comme les vecteurs 347 et Afx ont même norme d'après la définition de la parabole, nous en 
déduisons que le vecteur » (directeur de la tangente) dirige la bissectrice de l'angle des vecteurs 345 et 
M4 et donc par extension que la tangente à M est bien la médiatrice de F4. 


Avant d'étudier le grandissement des lentilles convexes sphériques, intéressons nous de manière 
générale à la définition de ce qu'est un grandissement. Considérons d'abord la figure suivante: 


Figure: 39.11 - Principe de base du grandissement 


où pour rappel le centre de courbure C (cf. chapitre de Géométrie Différentielle) est le centre de 
courbure de la surface sphérique de la figure ci-dessous et le sommet O est le pôle de la calotte 
sphérique. 


Ainsi, le "grandissement" M d'un système optique quelconque est défini comme le rapport de la 
grandeur de l'image ab à celle de l'objet réel AB, c'est-à-dire: 


Nous voyons d'après la figure ci-dessus que: 
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AB _ AB 
PAUTA D 
. à (39.73) 
tan g = 2. dà 
Oa g 
Nous avons donc, en tant compte de ce que & = & : 
tan & 
SE PR (39.74) 
tan 6, qg AB 
d'où: 
M = LE à (39.75) 
AË p 


Faisons maintenant une étude équivalente à celle effectuée précédemment, ayant les mêmes propriétés 
de symétrie et les défauts, mais sur les "dioptres sphériques" (résultats intéressants pour ce qui est de 
l'étude de l'oeil). Les résultats vont être utiles avant d'aborder la lentille convexe sphérique (la loupe 
traditionnelle). 


Nous allons donc considérer la réfraction au passage d'une surface sphérique séparant deux milieux 
d'indices de réfraction absolus x, et #, (voir figure ci-dessous). 


Figure: 39.12 - Concept de dioptre sphérique 


où pour rappel le centre de courbure C (cf. chapitre de Géométrie Différentielle) est le centre de la 
surface sphérique de la figure ci-dessous et le sommet O est le pôle de la calotte sphérique. 


Les éléments géométriques fondamentaux sont les mêmes que ceux définis pour les surfaces 
sphériques. Nous considérons donc dans un premier temps un dioptre concave et observant que la 
"distance objet" est située à l'opposé des autres points, nous devons opter pour une convention de signe 
pour mettre cette observation en évidence dans les équations. Ainsi, q sera défini comme une valeur 
négative. 


Un rayon incident tel que PA est réfracté suivant AQ et coupe donc l'axe optique en Q. Nous observons 
sur la figure que: 
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B=8&+tae B=8 -&, (39.76) 
Nous avons d'après la loi de Snell-Descartes: 


#] #3 


sin& sinê 


et nous admettrons comme pour les surfaces sphériques que les rayons sont peu inclinés. Dans ces 
conditions les angles 4,8, ,&, et £ sont très petits et nous pouvons écrire à l'aide des 


développements en série de Maclaurin (cf. chapitre Suites et Séries): 
sin = & et ang = 4 (39.77) 

de sorte que la loi de Snell-Descartes s'écrit: 
A($-&)=#2(8+%) (3978) 


D'après la figure, nous pouvons faire les approximations: 


(39.79) 


de sorte qu'en substituant dans l'approximation de la loi de Snell-Descartes nous trouvons après 
simplification élémentaire: 


d'où pour une surface concave: 


(39.81) 


? g r 


qui constitue la "formule de Descartes pour la réfraction au passage d'une surface sphérique" où q est 
donc un nombre négatif (puisque à gauche de l'origine O). 


Bien que la dernière relation ait été démontrée dans le cas d'une surface concave, elle reste valable 
pour une surface convexe en tenant compte alors de ce que r est négatif à son tour et dès lors: 


c: Ed: ur 
M EP PE OR à (39.82) 
2 4 Fr 


où q est toujours négatif (puisque à gauche de l'origine O). 
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Le "foyer objet" Æ, appelé également "premier point focal" d'une surface sphérique réfringente est la 


position d'un point objet de l'axe optique tel que les rayons réfractés soient parallèles à l'axe optique, ce 
qui revient à former l'image du point à l'infini, où 4 = ®. 


La distance de l'objet à la surface sphérique est appelée alors "distance focale objet", et nous la 
désignons par f, . En posant p = f, et 4 = ©. Nous avons alors pour le cas concave: 


Le) L_}}; (39.83) 
h Fr 


La distance focale f, est positive et le système dit "convergent" quand le foyer objet est réel, placé 
devant la surface sphérique. Quand le foyer objet est virtuel la distance focale f, est négative et le 
système est dit "divergent". 


De même, si les rayons incidents sont parallèles à l'axe optique, ce qui revient à avoir un objet très 
éloigné de la surface sphérique ? = ©, les rayons réfractés passent par un point Æ de l'axe optique 


appelé "foyer image" ou "second point focal" (avec à nouveau les mêmes problèmes de stigmatisme). 


Dans ce cas la distance de la surface sphérique à l'image est appelée "distance focale image" et nous la 
désignons par f,. En posant ? = ® et 4 = f} nous avons alors pour le cas concave: 


a 7% ñ 
= > jf = J r (39.84) 
#1 #5 


Maintenant intéressons-nous au type de surfaces réfléchissantes et réfractantes que nous attendons: les 
lentilles! 


Une lentille est donc par définition un milieu transparent limité par deux surfaces courbes 
(généralement sphériques), bien que l'une des faces d'une lentille puisse être plane. Une onde incidente 
subit donc deux réfractions à la traversée de la lentille. Admettons pour simplifier que les milieux de 
part et d'autre de la lentille soient identiques et leur indice de réfraction absolu égal à 1 (l'air ou le vide 
par exemple). Nous ne considérerons également que des lentilles minces, c'est-à-dire dont l'épaisseur 
est très petite devant les rayons de courbure: 
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Figure: 39.13 - Représentation d'une lentille 


L'axe optique est la droite déterminée par les deux centres C,C,. Nous cherchons à déterminer une 
relation qui lie la position de P et Q à partir de paramètres physiques facilement mesurables! 


Nous considérerons pour l'analyse que l'image formée après réfraction sur la première surface est l'objet 
pour la réfraction sur la seconde surface. 


Considérons le rayon incident PA passant par P. Au passage de la première surface, le rayon incident 
est réfracté suivant le rayon AB et continue virtuellement jusqu'à Q' conformément au comportement 
d'une surface sphérique convexe. Il nous faut donc appliquer la relation démontrée plus haut pour le 
dioptre convexe: 


4,22 7274 
À 4 Fi 


(39.85) 


En B le rayon subit une deuxième réfraction et devient le rayon BQ conformément au comportement 
d'une surface sphérique concave. Nous pouvons imaginer que le rayon incident en B provient d'un point 
P' virtuel (non représentable sur la figure ci-dessus) se trouvant sur l'axe optique et plongé dans le 
matériau virtuellement étendu vers la droite de la lentille (c'est le côté difficile de cette démonstration... 
il faut se l'imaginer!). 


Il nous faut donc appliquer la relation démontrée plus haut pour le dioptre concave mais en prenant 
garde cette fois-ci à l'ordre des indices de réfraction absolus (piège subtil!) et en imaginant que le point: 


7 #2 
——+— =——— (39,86) 


Comme nous considérons que la lentille est entourée d'air (indice de réfraction unitaire), nous avons 
alors: 
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1 A  _n—]l # —}# ; 
RAR RE he =2" (3987 
A 4 Fr] P2 43 r2 


Nous allons faire maintenant l'hypothèse que l'épaisseur de la lentille tend vers zéro. En d'autres termes 
que ses deux rayons de courbure tendent vers l'infini. Nous avons alors: 


1 ñn _n-]l : 
no Aa>%e [1,2 2,1 (6 
#1 2122 _ A & 2 & 


23 42 F3 r, + 


En identifiant terme à terme et en se rappelant que ce qui est à gauche de l'origine est négatif, nous 
avons alors: 


P2 = (39.89) 


tout en faisant subtilement abstraction des deux autres termes... (on comprend aisément pourquoi cette 
démonstration est souvent omise dans la littérature.…). 


Dès lors, les deux relations antéprécédentes deviennent: 


1 #A  n—]l A 1 1- x 
— = —— — + — = — (39.90) 


A 4 ri di 42 F2 


En sommant il vient au final: 


et qui est souvent notée sous la forme suivante, appelée "première formule de Descartes pour les 
lentilles minces" ou "équation des lentilles minces": 


Tout en prenant bien garde à réadapter la schématique: 
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Figure: 39.14 - Lentille mince épurée avec la notation traditionnelle 


En écrivant cette équation, il convient d'appliquer à ,,r, la convention des signes que nous avons 
fixée, c'est-à-dire que les rayons sont positifs pour une surface concave et négatifs pour une surface 
convexe, vue du côté sur lequel la lumière vient frapper la lentille. Ainsi, si les deux rayons sont les 
mêmes, nous avons: 


L.,1 1 1 2 
—+—2 (x ft =(#—1)— (39.93) 
P 4 Fr (-r Fr 


Le terme à droite de l'équation des lentilles minces est une constante propre uniquement aux 
caractéristiques physiques de la lentille qu'il d'usage d'appeller "puissance dioptrique" et dont l'unité est 
le "dioptre" et de noter: 


1 1 
—+—Z= 7)| (39.94) 


Le point © dans la figure précédente, est choisi de façon à coïncider avec le "centre optique" de la 
lentille. Le centre optique a pour propriété d'être un point tel que tout rayon passant par lui sort 
parallèlement à la direction du rayon incident!! C'est une propriété importante car tout point d'un objet 
se situant d'un côté de la lentille (peu importe lequel par symétrie) va émettre de la lumière dont 
certains rayons vont passer par le centre optique. Ce qui permet donc d'avoir des triangles semblables à 
gauche et à droite de l'axe de symétrie de la lentille et d'appliquer Thalès (cf. chapitre de Géométrie 
Euclidienne) pour calculer le grandissement. 


Pour montrer qu'un tel point existe, considérons, dans la lentille ci-dessous (à symétrie horizontale et 
verticale): 
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Figure: 39.15 - Figure représentant la propriété du centre optique d'une lentille 


Considérons les deux rayons de courbure parallèles C4 =,4,€, = -r, générateurs des dioptres 
(éléments de la lentille sphérique mince) choisis tels que les plans tangents correspondants 7 et 7; sont 


par construction aussi parallèles. 


Pour le rayon &; 4, dont la direction est telle qu'il se réfracte suivant 4 4, , le rayon émergent est 
AR, et parallèle à 4A, de par la symétrie horizontale de la lentille. Ainsi, les triangles C;4Q et 
C,4,Q étant semblables quels que soient les "rayons générateurs", nous voyons ainsi que la position du 


centre optique © est satisfaite par la relation: 


rs 
Le 
us 
l 


et existe donc indépendamment des rayons générateurs. 


Comme dans le cas d'un simple dioptre, le "foyer objet" Æ,, ou "premier point focal d'une lentille" est la 
position de l'objet pour laquelle les rayons émergent parallèlement à l'axe optique (4 = © ) après avoir 
traversé la lentille. La distance de la lentille au foyer objet est alors appelée "distance focale objet" 
nous la désignons dans la pratique souvent par la lettre f. 
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En posant alors p = f et 4 = dans l'équation des lentilles minces sphériques: 


nous obtenons la distance focale objet sous la forme: 


l 1 1 

—=(n-D|—-- 

Î ñ À 
De même dans le cas d'un simple dioptre, le "foyer image" Æ, ou "deuxième point focal d'une lentille" 
est l'endroit où convergent les rayons lumineux après avoir traversé la lentille mais qui étaient avant la 
lentille parallèles entre eux et avec l'axe optique ( 2 = © ). Ainsi, étant donné la symétrie centrale des 


lentilles minces sphériques il suffit de façon imaginaire d'inverse la photo précédente pour visualiser le 
concept: 


La distance de la lentille au foyer image est alors appelée "distance focale image" nous la désignons 
dans la pratique par la même lettre f car par symétrie de la lentille mince, de la lentille, en posant 
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g=f et p = nous avons: 


. #1) LL (39.97) 
Î ñ À 


Par conséquent, dans une lentille mince les deux foyers sont placés symétriquement de chaque côté! 


Donc comme dans les deux l'inverse de la focale est égale à la puissance dioptrique (indépendant de p 
et q) rien ne nous empêche alors d'écrire l'équation des lentilles minces comme on l'a retrouve souvent 
dans les livres scolaires: 


1 1 1 
: af 1)20 (39.98) 


Sous cette forme on l'appelle alors "l'équation des opticiens" ou encore "équation des lunetiers". Sous la 
forme simple suivante qui ne fait pas apparaître les propriétés physique de la lentille (et qui est souvent 
la relation vue dans les petites classes raison pour laquelle il semblerait qu'elle ait un nom différent): 


on l'appelle "équation de conjugaison" ou "deuxième formule de Descartes pour les lentilles minces". 


Par ailleurs, si la distance focale est positive, et donc respectivement la puissance dioptrique aussi, alors 
la lentille est dite "lentille convergente": 


ñn >0 ñ =® m0 
r <Û r <Û #0 
ÿ h|> rl 


Figure: 39.18 - Exemples de lentilles convergentes (biconvexe, plan-convexe, convexe ménisque) 


si la distance focale est négativ, et donc respectivement la puissance dioptrique aussi, elle est dite 
"lentille divergente": 
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ñ <0 ñ =® cie, 
r >0 r >0 3 
h|<}| 


Figure: 39.19 - Exemples de lentilles divergentes (biconcave, plan-concave, concave ménisque) 


Revenons maintenant sur la définition du grandissement pour tout système optique qui était 
naturellement pour rappel le rapport de la grandeur de l'image (réelle ou virtuelle) ab à celle de l'objet 
réel AB, c'est-à-dire: 


ab 
M = —— (39.100) 
AB 


Donc dans le cas d'une lentille sphérique mince symétrique dont les rayons passent par le centre 
optique nous obtenons et qui décrivent des triangles semblables de chaque côté de l'axe de symétrie de 
la lentille mince sphérique nous avons alors en appliquant Thalès: 


(39.101) 


> fe 


Soit le même résultat que celui obtenu déjà plus haut. 
Exemple: 


Les deux faces d'une lentille biconvexe ont un rayon de 3 [cm]. L'indice du matériau la lentille est de 
1.52. Un objet de 1.80 [m] de hauteur est placé à 14 [m] de la lentille (peut importe que cela soit à 
gauche ou à droite de la lentille puisqu'elle est supposée biconvexe et donc symétrique). Alors la 
puissance dioptrique de la lentille est d'abord: 


1 : 
D={n-1) = = _us2-0°-052 22 3.47 [re 1] (39.102) 
n nn) r 0.3 


Ce qui est déjà bien une valeur positive et donne donc une focale (image ou objet peu importe de par la 
symétrie de la lentille mince sphérique!) d'environ 28.84 centimètres (donc il vaut mieux avoir une 
appareil photo avec un téléobjectif dans le cas présent). Nous remarquons, au vu de la valeur de la 
focale (foyer), que l'objet se trouve au-delà de la focale. La position de l'image sera donnée par: 


1,121 ,1234 39.103) 
P 4 14 g 


Soit: 
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g=0.2942 (39.104) 


Donc l'image se trouve à environ 29.42 centimètres elle est aussi au-delà de la focale et sera par 
définition appelée "image réelle" inversée. Le grandissement sera lui de: 


M = —- ET Æ0.021 (39.105) 
La grandeur de l'image réelle inversée sera donc en q de: 


kh=0021.18=00378 (22.106) 


Soit environ 3.78 centimètres. 
Remarque: À nouveau, les problèmes d'aberrations sont aussi existants pour les lentilles. 


À toutes fins utiles, indiquons la figure suivante: 


Figure: 39.20 - Lentille plan-courbe pleine 


et donc une lentille plan-courbe pleine, comme un miroir parabolique, a la propriété de rendre parallèles 
les rayons partis de son foyer; elle produit par réfraction l'effet que le miroir parabolique produit par 
réflexion. 


Fresnel inventa une lentille que l'on voit dans de nombreux phares et qui permet d'obtenir le même 
résultat avec moins de matière: 
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Figure: 39.21 - Lentille de Fresnel (réelle dans le coin en bas à gauche et schémas de principe à droite) 
Faisons un peu de biologie pour clore: 


Le cristallin de l'oeil pouvant se déformer sous l'effet de certains muscles, constitue une lentille à focale 
variable permettant d'accommoder la vision des objets à distance variable. La distance du centre 
optique à la rétine étant fixe, le seul moyen de voir clairement des objets situés à des distances 
différentes est de modifier la distance focale. Dans son état ordinaire, le cristallin a une configuration 
assez plate, avec un grand rayon de courbure (il a alors une grande distance focale). 


L'oeil a pour rôle de focaliser la lumière provenant d'un objet à l'infini (environ 25 centimètres pour un 
humain moyen...) sur la rétine. Mais tous les yeux ne font pas cela correctement et le "punctum 
remotum" (distance maximale de vision distincte sans accommodation) est parfois à une distance finie, 
même parfois inférieure à cinq mètres (entraînant probablement une fatigue des yeux). 


Si l'objet s'approche, les muscles se contractent, le cristallin gonfle et sa distance focale diminue de 
façon que l'image se forme toujours sur sa rétine. Le point le plus proche qui peut être vu clairement 
avec le maximum d'accommodation est appelé le "punctum proximum". Cette distance évolue 
beaucoup avec l'âge: elle est de dix centimètres pour un enfant de dix ans, de cent centimètres pour une 
personne de soixante ans (c'est la presbytie). 


6. PRISME 


En optique, le prisme est un des composants les plus importants. On le retrouve en chimie, en physique 
de la matière condensée, en astrophysique, en optoélectronique et encore dans beaucoup d'autres 
appareils courants de la vie de tous les jours (comme les lentilles). Il s'agit probablement du premier 
outil façonné par l'homme pour faire de la "spectroscopie" (analysie du spectre) après l'arc-en-ciel (qui 
lui est un phénomène naturel de la spectroscopie). 


Nous allons dans les paragraphes qui suivent déterminer les relations les plus importantes à connaître 
relativement aux prismes et utiles à l'ingénieur et au physicien. 
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Nous nous intéressons aux rayons lumineux entrant par une face et sortant par une autre ayant subi 
deux réfractions (nous n'étudierons pas les réflexions). 


Voici la représentation type d'un prisme en optique géométrique avec le rayon incident S et sortant S'et 
les deux normales N, N "aux arêtes du sommet d'ouverture &. Plus les divers angles d'incidence et de 
réfraction: 


Figure: 39.22 - Représentation générique du prisme 


Nous savons que la somme des angles d'un quadrilatère (toujours décomposable en deux triangles dont 
la somme des angles est #7) vaut 27. Donc dans le quadrilatère délimité par les sommets 1234. Nous 
avons la somme: 


a+2. + 8= 2x = B=m-& (2.107) 


Maintenant que la situation est posée passons à la partie optique. 
Nous avons quatre relations fondamentales à démontrer pour le prisme. 


D'abord, nous avons au point d'incidence I et I" la loi de Descartes qui nous permet d'écrire: 
TT | : 
anG)=—sn(r)= #1 sin() (39.108) 
ñ# 


Comme l'indice de réfraction absolu de l'air est de 1 alors nous avons simplement en I: 
sin() =#sn(r) (39.109) 


Dans la même idée en 1" nous avons: 
LP Lu à | 
an(r'=—sinG)=—sinf@") (39.110) 
#2 mi 


Donc: 


ainG)=2sin(r") (39.111) 
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Nous avons aussi la relation: 


K=r+r+6=r+r+7-@ (39.112) 
Soit: 
&=r+r" (39.113) 
L'angle de déviation D est facile à déterminer. Il suffit de prendre le quadrilatère central: 
27x=i+i+6+(7-D)=D=-7rHi+i+SB=-7+i+i + (7-2) (39.114) 
Donc: 
D=i+i-æ (39.115) 


Nous avons donc les 4 relations fondamentales du prisme: 


ainG) = #2sin(r) 
ainG'") =#msin(r") éaie 
a=r+r 


D=iki'-e& 


Connaïissant i et i' et l'indice de réfraction relatif m nous pouvons alors déterminer tous les paramètres. 
L'idéal serait encore de pouvoir se débarrasser de la connaissance expérimentale de i'. 
Nous avons donc: 

j'= arcsin(resin(r")) (39.117) 


Or: 


. fsin(s 
Pare B-r=n-(r-@-r=@-r= aan ) (39.118) 
Le) 


Ainsi, il vient: 


. | . . fan 
i'= arcsin (me sin(r ) = arcsin {r sin La- arcsin (#0) (39.119) 


mn 


Donc: 


| . . . fin) 
D =i+arcsin $#sin| &- arcsin — æ| (39.120) 
M 


Puisqu'il est avéré que l'indice m d'un milieu varie avec la longueur d'onde suivant la loi de Cauchy, on 
comprend aisément que le prisme est capable de disperser la lumière blanche. 


Enfin, si i est petit : 
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VOA erAN ER EPRIEIR [SCIENCES.CH] 
DZ arcsin {r sin La arcsin (20)} — & 
mm 


etsiiet & sont petits, nous avons au premier ordre en développement de Maclaurin: 


: î 

D = scan {minf a À ]|-a- arcsin(ma—i)- &Œ = arcsin (ma) [#4 

mi 
= ma-a= am] 

Donc : 


D= aœim-T 


soit en introduisant explicitement la loi de Cauchy: 
B 
Daaim;-l\=a||A4+—- 1-1 
À 


Un arc-en-ciel est un phénomène optique et météorologique qui rend visible le spectre continu de la 
lumière quand le soleil brille pendant la pluie et que l'observateur contemple le ciel dans une direction 
opposée à celle du soleil. C'est un arc coloré avec le rouge à l'extérieur et le violet à l'intérieur. 


7. ARC-EN-CIEL 


L'arc-en-ciel est provoqué par la dispersion de la lumière du soleil par des gouttes de pluie 
approximativement sphériques. La lumière est d'abord réfractée en pénétrant la surface de la goutte, 
subit ensuite une réflexion partielle à l'arrière de cette goutte et est réfractée à nouveau en sortant. 
L'effet global est que la lumière entrante est principalement réfractée vers l'arrière sous un angle 
d'environ 40-42°, indépendamment de la taille de la goutte. La valeur précise de l'angle de réfraction 
dépend de la longueur d'onde (la couleur) des composantes de la lumière. Dans le cas de l'entrée dans 
un milieu plus réfringent, l'angle de réfraction de la lumière bleue est inférieur à celui de la lumière 
rouge (phénomène mis en évidence dans les prismes). Ainsi, après réflexion à l'interface eau-air, la 
lumière bleue sort d'une goutte au-dessus de la lumière rouge (voir figure ci-contre). L'observateur étant 
fixe, il voit la lumière issue de différentes gouttes d'eau avec des angles différents par rapport à la 
lumière du soleil. Le rouge apparait donc plus haut dans le ciel que le bleu. 


Parfois, un second arc-en-ciel moins lumineux peut être aperçu au-dessus de l'arc primaire. Il est 
provoqué par une double réflexion de la lumière du soleil à l'intérieur des gouttes de pluie et apparaît 
sous un angle de 50-53° dans la direction opposée au Soleil. En raison de la réflexion supplémentaire, 
les couleurs de ce second arc sont inversées par rapport à l'arc primaire, avec le bleu à l'extérieur et le 
rouge à l'intérieur, et l'arc est moins lumineux. C'est la raison pour laquelle il est plus difficile à 
observer. Un troisième arc-en-ciel peut être présent au voisinage du second, et inversé par rapport à 
celui-ci (donc identique au premier). Il est cependant nettement moins lumineux et observable 
uniquement dans des conditions exceptionnelles. En pratique, il n'est pas très facile à distinguer des arcs 
surnuméraires associés à l'arc secondaire. Il correspond aux rayons lumineux ayant subi cinq réflexions 
dans les gouttes d'eau. Deux arcs inversés l'un par rapport à l'autre peuvent également être observés 
dans la direction opposée, à environ 45° du Soleil (donc dans la direction de celui-ci), mais ceci est 
particulièrement difficile du fait de la proximité du Soleil. Les rares observations de ces deux arcs font 
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mention de morceaux d'arcs visibles par intermittence. Ces deux arcs correspondent aux rayons 
lumineux ayant subi trois et quatre réflexions dans les gouttes d'eau. Comme ils sont situés face au 
Soleil, ce ne sont pas les mêmes gouttes d'eau qui y contribuent. En pratique, les configurations 
favorables à leur observation sont nettement moins nombreuses que celles qui sont favorables à 
l'observation de l'arc secondaire, en particulier en raison de leur proximité du Soleil. 


Pour étudier le phénomène considérons d'abord la goutte sphérique ci-dessous avec un rayon de 
lumière incident (une réfraction, deux réflexions) dont nous avons représenté la composante rouge et 
violet (les angles y sont approximatifs) ainsi que les indices de réfraction de l'eau et de l'air: 


Goutte d'eau supposée sphérique 


ae el 
Ferme 
| Sat PT à 
| 77 
: A 
| ‘7 

nine "0 0) NÉ RTL 
: FN à 
Fo | FAR 

| ‘#1 

ñ, (4) , 7 
Le 
’ 


Arc-en-ciel | 


Sol 


Nous cherchons à déterminer l'angle entre le rayon lumineux entrant (faisceau considéré comme 
contenant toutes les composantes de la lumière visible) supposé monochromatique et le rayon lumineux 
sortant (à l'opposé du Soleil: antisolaire). Aïnsi, la différence d'angle pour deux couleurs, nous donnera 
l'angle par lequel nous devons changer notre regard pour observer deux couleurs différentes dans l'arc- 
en-ciel. 


Remarque: Il n'y a pas de sens selon moi de calculer l'angle que doit faire le regard avec le sol 
(supposé plan) pour observer un arc-en-ciel comme le font certains ouvrages. Effectivement, de 
toute manière si nous dirigeons notre regard vers un arc-en-ciel nous le verrons de toute façon sur 
une grande étendue d'angle par rapport au sol. La seule chose qui a vraiment du sens, c'est donc la 
différence d'angle entre deux couleurs monochromatiques. 


Pour cette étude, nous allons considérer la figure approximative suivante: 
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Figure: 39.24 - Chemin parcouru par la lumière dans la goutte d'eau 


Avec la loi de Snell-Descartes nous avons dans un premier temps: 


sin(a) _%e 


sin(f) 2, 


= A(À) (39.125) 


Ce qui nous intéresse ici est donc l'angle de réflexion apparent 25, que nous noterons D (attention! 
certains auteurs choisissent la convention D = x 25 ). Pour le déterminer, nous partons de la relation 
suivante du triangle ABE: 


(a 8)+0+(7- $)=7 (39.126) 


Il vient alors: 


D'où: 
20=48$-—-2æ=2 (39.128) 


Ce que nous noterons finalement: 


et comme: 


# | . 
sin( 8) = sin(a) <= — 8 = arcsin É sn) (39.130) 
ñ ñ 


é CJ 
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Il vient: 


£ 


: #; . 
Din, ,n,,@)= 4 arcsin (ee nt) —2&| (39.131) 
x 


ce qui est parfois noté un peu abusivement: 
Din, ,n,,@) = 4arcsin(xsin(a)i—-2æ (29.122) 


Si nous faisons une application pratique, nous avons pour le rouge 750 [nm] avec par exemple un angle 
d'incidence de 30° dans la goutte d'eau: 


Dés, = D(1.00.1.22,) = arcs msn(z) -2(7)20506-207 (39.133) 
6 132 (Le 6 


et pour le violet 400 [nm] avec le même angle d'incidence de 30° dans la goutte d'eau: 


Dés, = D(1.00,134, 7) = arcs sn(z) a(Fjsoa-nres (39.134) 
6 134 (6 6 


Soit une différence d'angle d'environ 2.4°. 


Enfin, nous pourrions nous intéresser à l'angle & pour lequel l'angle D est maximum (ce qui correspond 
à l'arc-en-ciel le plus visible en termes de taille dans la réalité). Nous partons alors de: 


fia)=-2a@+4arcan(zsin(æ)) (39.135) 
et nous cherchons les solutions de: 
f'Kæ)=0 (39.136) 
avec &e[0,x7/2]etxe]0, 1. 
Rappelons que nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que: 


1 


atcsin'ixi= 


Nous avons alors: 


d'où: 
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2n cos(&) 


nn es | 
V1 x? sin? (a) 


& 4n° cos? (a = 1- x? + x»? 


De là nous tirons: 


4x? cos’ (ci) : 
1- x sin?(a 


4x? cos? (@) : 
1-x#?[1-cos?(@)| L 
(39.139) 
3° 


l 
cos (d) & cos’ æ= 


J-#° 


[cos a|= (39.140) 
Nr 
c'est-à-dire: 
f1- x? 
cos & = (39.141) 


3n 


car nous cherchons les solutions avec æ € [0,774 2] et que le cosinus est positif sur cet intervalle. 


Ainsi: 


pm = ACCOS | 


Il vient alors pour n valant -0.746: 


Œpmux = ACCOS | 


N'ES] 


— A 
NET 


| (39.142) 


| z 1.029z 60° (39.143) 


x 


ce qui correspond relativement bien à la réalité (l'angle avec lequel nous levons la tête pour voir l'arc- 


en-ciel le plus visible/large). 


La déviation correspondante est alors de: 


DS déran [2 nt) cond [a 7466 Ë) . 2 =0.715z 40.97° (39.144) 
# 


€ 


et s'appelle "angle de l'arc-en-ciel". 


Ainsi, les rayons lumineux perçus par l'observateur et dans lesquels le rouge (bord externe de l'arc- 


en-ciel) domine correspondent à l'ensemble des rayons issus du mur de pluie et faisant un angle 
d'environ 40° avec la direction des rayons solaires (voir figure ci-dessous). Les rayons lumineux 


constituant chaque couleur de l'arc-en-ciel forment alors des cônes de sommet les yeux de l'observateur 


et d'axe le rayon solaire passant par les yeux de l'observateur: 
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Soleil 
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ae 


Invisible car 
sous la Terre | \_- 


<40°) 


Vers le point 
antisolaire 


Figure: 39.25 - Figure représentant la génération de l'arc-en-ciel (source: ENS Culture-Sciences) 
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Notes personnelles: 
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40. OPTIQUE ONDULATOIRE 


D. ce chapitre seront dégagés certains éléments qui ont conduit au développement de la 


mécanique quantique. Effectivement, la mécanique quantique est née, en premier lieu, d'une étude 
attentive de la nature de la lumière. Bien que cette science nouvelle se soit développée au début du 
20ème siècle, les considérations qui l'ont guidée alors sont incontestablement le résultat de 25 siècles de 
maturation. Au fond, c'est à une longue histoire de la lumière pleine de controverses à laquelle la 
mécanique quantique apporte enfin au 20ème siècle une magistrale conclusion. 


1. PRINCIPE D'HUYGENS 


Huygens visualisait la propagation de la lumière comme résultant d'un processus de génération 
d'ondelettes sphériques en chaque point atteint par un front d'onde, ondelettes dont la somme donnaîit le 
champ en propagation. En traçant la tangente aux fronts d'onde des ondelettes à un instant donné, on 
obtenait le front d'onde de l'onde totale à ce même instant. 


Nous rappelons qu'une surface d'onde ou "front d'onde" (cf. chapitre de Mécanique Ondulatoire) est le 
lieu des points du milieu atteints par le mouvement ondulatoire au même instant. La perturbation a 
donc même phase en tout point d'une surface d'onde. Pour une onde plane, par exemple, la perturbation 
s'exprime par (nous l'avons démontré dans le chapitre de Mécanique Ondulatoire): 


FECX-V'E) (40.1) 
ou dans une formulation plus générale: 
fŒ&oF-v) (402) 


qui donne donc l'expression de la propagation de la perturbation pour laquelle la "surface d'onde" est le 
lieu des points où la phase £ :#-# a même valeur à un instant donné. La surface d'onde est donnée en 


conséquence par l'équation: 
Loñ-w=c (403) 


Huygens, a donné une méthode imagée de représentation du passage d'une surface d'onde à une autre 
dans le cas où l'onde est supposée résulter du mouvement des particules constituant le milieu matériel. 
Ainsi, si nous considérons la surface d'onde S ci-dessous: 
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Figure: 40.1 - Représentation d'une surface d'onde selon Huyghens 


Quand le mouvement ondulatoire atteint cette surface, chaque particule a,b,c,... de la surface devient à 
son tour une source d'ondes, émettant des ondes secondaires (indiquées par les petits demi-cercles) qui 
atteignent la couche suivante de particules du milieu. Ces particules sont mises en mouvement et 
forment la nouvelle surface d'onde S et ainsi de suite. Ainsi, Huygens avait une conception 
ondulatoire de la lumière, mais il ne considérait pas la nature périodique de l'onde, ce qui ne lui 
permettait pas d'introduire la notion de couleur de la lumière; de plus, selon son principe, une onde se 
propageant en sens inverse à celui de l'onde incidente devrait aussi se manifester, ce qui n'est pas le cas 
dans un matériau homogène. 


L'intuition d'Huygens est cependant proche de la réalité, comme le montrera Fresnel dans sa théorie de 
la diffraction. Il faudra cependant attendre Kirchhoff, qui introduira un facteur d'inclinaison (oblicité) 
dans la théorie, pour obtenir une explication de l'absence d'onde se propageant vers l'arrière (le temps 
venu nous rédigerons les développements y relatifs). 


1.1. LOI DE MALUS 


Comme tous les "points correspondants" {4,b,e,...},{a',b',c'...},….sont équidistants, par le principe 


d'Huygens, la "loi de Malus" (la première donc et pas celle obtenue lors de l'étude de la polarisation de 
la lumière comme nous le verrons plus loin) affirme que l'intervalle de temps entre les points 
correspondants de deux surfaces d'onde est le même pour tout couple de points correspondants. 


Conséquences (se référer en même temps à la figure ci-dessous): 


Figure: 40.2 - Configuration d'expérience de pensée pour l'étude de la loi de Malus 
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Si nous notons les vitesses de propagation des rayons incidents R,, R, par v, et respectivement v., nous 


avons 
bi = aa = aa, =v,M (404) 


- Lorsque l'onde se propage dans un milieu homogène, les rayons lumineux doivent être rectilignes et 
les surfaces d'onde rester parallèles. 


- Lorsque l'onde change de milieu, les distances entre deux paires de points correspondants varient d'un 
milieu à l'autre, si les vitesses de propagation sont différentes. 


Cette loi permet de retrouver la loi de Descartes-Snellius que nous avons déjà démontrée dans le 
chapitre d'Optique Géométrique, ce qui assure a priori que le principe d'Huygens reste valide dans le 
cadre de l'optique géométrique. 


Démonstration: 


Selon la figure ci-dessus, nous avons: 
M= 12m 13m 12 (405) 


en divisant chaque terme par 4,b, , nous obtenons: 


7. 
sinû, _sinô; _sinbô, 


(40.6) 
" " Le 


et nous retrouvons donc bien la loi de Descartes-Snellius telle que nous l'avions obtenue dans le 
chapitre d'Optique Géométrique: 


sainô, _Y 
sinés v 
D 


en notant au passage que sur le schéma, nous avons aussi 8, = 8" . 


2. DIFFRACTION DE FRAUNHOFER 


Du point de vue de l'optique géométrique, un faisceau lumineux est un cylindre de section E qui 
rassemble un grand nombre de rayons parallèles. Il est donc supposé rectiligne lorsqu'il est défini dans 
un milieu homogène. 


L'émittance énergétique M{ [W3#”?] du faisceau ne varie que si une lentille (ou un autre dispositif) fait 
varier sa section x ou si le milieu absorbe de l'énergie. 


Le faisceau lumineux "éclate" quand un obstacle ne laisse passer qu'une partie X de sa section. 
Le principe d'Huygens montre que ce sont les bords de l'obstacle qui engendrent cette diffraction. 


Le phénomène est général mais n'est bien observable que si le rapport Z{E est très grand. L étant la 
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longueur des bords. Cette condition est nécessaire pour que l'intensité de la partie non diffractée du 
faisceau ne masque pas l'effet. 


Définitions: 


D1. Nous parlons de "diffraction de Fraunhofer" lorsque, comme supposé précédemment, les rayons 
lumineux incidents sont parallèles et le phénomène observé à relativement grande distance de l'écran. 


D2. Nous parlons de "diffraction de Fresnel" lorsque les rayons incidents forment un faisceau 
divergent, en provenance d'une source ponctuelle ou si nous observons le phénomène à faible distance. 


Considérons un cas générique et le plus répandu dans les laboratoires de physique qui est la diffraction 
par une fente rectangulaire étroite: 


Pour cela, nous considérons que le faisceau incident, perpendiculaire à la fente, présente un front 
d'onde électromagnétique plane et périodique, et donné par: 


F(x,f) = sin(lx —wf) (40.8) 
où pour rappel, sa longueur d'onde est donnée par: 
A=2x/k (409) 


2.1. CAS D'UNE FENTE RECTANGULAIRE 


La largeur e de la fente est orientée selon l'axe y, sa hauteur h (paramètre que l'on ne peut pas 
représenter dans la figure puisqu'il s'agit d'une vue du dessus) est supposée très grande afin de pouvoir 
négliger l'effet des extrémités. 


Suivant le principe d'Huygens, le front de l'onde plane, délimité par la fente, constitue une multitude de 
sources 4f(x,f), de largeur dy, qui émettent, en phase, des ondelettes sphériques décrites par leur 
vecteur champ associé: 


[> 


df (x,f) = =—dysin(kx -wf) (40.10) 


8 
Considérons maintenant un point d'observation P, à une distance R de la source (assimilée à la fente). 
Nous avons vu lors de l'étude des sources d'émission de type sphérique (cf. chapitre 
d'Electrodynamique) que leur amplitude diminuaïit de manière inversement proportionnelle à la distance 
telle que: 


ñ 


df (x,£) = À dsin(tx — at) (40.11) 


e' 


Or, les ondelettes, chacune suivant le point de la fente auquel elle est assimilée, ne vont pas toutes 
parcourir la même distance R mais une distance propre r. Cependant, si R est suffisamment éloigné de 
la fente, nous nous permettrons d'approximer: 


#“ 
oE (40.12) 


e'r 
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ER 
e'À 


reste encore le terme périodique sin{&x -wf) où nous posons x = > . Or, nous avons pour valeurs 
extrémales: 


À sin 6 £r£<ÆR+ sin ê (40.13) 


Ces valeurs extrêmales correspondant respectivement, à l'avance et au retard des fonctions d'onde 
décrivant la propagation des ondelettes aux extrémités de la fente. 


Effectivement, il suffit de voir la figure ci-dessous, en considérant donc 8 :& # et ainsi: 


CET 


Onde incidente plane 


retard = ysin 8 
(40.14) 


Ainsi, en plaçant l'origine de la coordonnée y au milieu de la fente, nous avons: 


DD nr oder ER y noel (015 
e' À e'k 
Donc les différentes ondelettes sont déphasées et produisent ainsi des interférences. 


Définition: En mécanique ondulatoire, on parle "d'interférences" lorsque deux ondes de même type se 
chevauchent. Ce phénomène se rencontre souvent en optique avec les ondes lumineuses, mais il 
apparaît également avec les ondes sonores. 


L'onde diffractée dans la direction de 8, est alors donnée par la somme de toutes les contributions: 


% el2 F5 el 
fx ê = me (l sin(&(R + ysin 8) -wf)dy = — Il sin((&R -w£)+kysin8)dy (40.16) 
e'R e'R à; 


Sachant que (relations trigonométriques explicitées suite à la demande d'un lecteur): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


VO IA erANEREEUEIR [SCIENCES.CH] 


e12 e/2 
f sin(a+by)dy = (l (cos(a)sin(y) + sin(a) cos(by)) dy 

—<12 212 
e IE, cosfa)cos(by) sin(a)sin(by) “ 

= cos(a) || sin (by |dy + sin(a) Il cos (by) dy = - —%—%©° + — At 
12 12 b on 

| e | 
2sin(a) sin | b— 
à 2 
b 


Nous avons donc: 


2sin(£R - wf)sin| &sin = 


f e!2 ? 
xt =—— | sin((tR -wf) + kysin 6) dy = =— 
ne e'R jh dé V eR ksin 8 
(40.18) 
Fi sin 67 ;[Rsne) 
u R ek sin Ê sin(£R — cé) _R : | sin(iR — cf) 
— sin 
2 À 


Nous avions démontré dans le chapitre d'Électrodynamique que l'énergie (in extenso l'intensité) d'une 
onde électromagnétique était donnée (dans le vide) par la valeur scalaire moyenne du vecteur de 
Poynting: 


(40.19) 


Nous avons donc en considérant que le champ magnétique et électrique sont proportionnels au terme: 


. [ æ . 
sin] —sin à 
À (40.20) 


Te 


— sin ê 
À 
le résultat suivant: 
2 
. [7 8 ; 
—_.. — | TT | —[sin(zl siné) 
SERA =S|———"|] (40.21) 
7m . xl sin 4 
EL 


qui est l'émittance lumineuse émise dans la direction & et où nous avons posé: 


L'= (40.22) 


w|S 


Si nous introduisons le sinus cardinal que nous avons déjà rencontré lors de notre étude des 
transformées de Fourier dans le chapitre sur les Suites et Séries nous avons alors l'écriture de la relation 
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précédente qui se trouve nettement condensée: 


S'œSi-sinc? (al sin@)| (40.23) 


Dont nous pouvons avoir une forme générique tracée avec Maple en utilisant: 
>Gamma:=3;plot((sin(Gamma*x)/(Gamma*x))"2, x=-Pi..Pi); 


Donc nous pouvons obtenir le même résultat en prenant le module au carré de la transformée de 
Fourier d'un signal monochromatique au travers d'une fenêtre rectangulaire. Ainsi, il semble possible 
d'étudier les phénomènes de diffraction en utilisant la transformée de Fourier et ce domaine se nomme 
"l'optique de Fourier". 


Voici une représentation graphique du rapport 5} FA pour différentes valeurs du rapport L = 2/1: 


Figure: 40.3 - Représentation des franges de diffraction 


De part et d'autre de la frange centrale, il y en a d'autres, plus étroites et disposées symétriquement. 
Leur intensité diminue très rapidement selon le terme prépondérant au dénominateur: 


FE ; 1 De OU 
5 (rl sin 8 re sin’ 8 
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0.08r g—_ Hauteur du pic 
central = 1 


Dont voici une image réelle: 


Entre les franges, se trouvent des zones d'obscurité qui sont le siège d'interférences destructives. Leur 
position est donnée par la condition: 


sin T sin 8 =0—= T sin 8 = AT 
À À 
sauf pour # = 0 = 8= 0 où l'on observe un maximum ! 


Nous observons donc des franges sombres dans les directions: 


x 


À , 
Ê, = æcsin () VneN 
e 


Ainsi, la largeur angulaire de la frange centrale est le double de la valeur angulaire obtenue pour le 
premier minimum: 


eg 


1: 
À, = 2R arcsin (è 
Nous obtenons la largeur des pics suivants, comme suit: 
Deux minima successifs satisfont donc les conditions: 


sainô, = Li sin 0," EUR 
€ € 
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Ainsi: 


RE | AE a p +6 
sin®, —sin 6, = Ê om ur) at (40.29) 
e 2 2 2 2 


En posant: 


(8,4 +60%)/2%6 (40.30) 


+1 


il vient dès lors: 


À 
A = 2arcsin (40.31) 
2ecosé 


Puisque l'émittance énergétique diminue très rapidement, seules les premières franges (pour lesquelles 
cos 8 # 1 ) sont observables. Il reste: 


À L 
£, = 2Rarcsin| — 2 (403) 
2e 2 


Les positions des maxima sont quant à elles données par la condition: 


Te mæ . 
sin sn[ no] sin] —sin 8 
a _ d sn[ no] Ad À 


8 a8l % LE sin 8 
7 


— ein in Æane) “inf Lane) ane] 
mæ sin 6 
(40.33) 
> _ sin #cos| sin 8 | cos 8-sin| sin 8 [cos 8 
mæ sin 4 À À À 
= cos| sin 6 NT T sin 8 ue 
À Te sin 


cot 8 


sin 8 


> cos TE sin 6 os an Tin 
À 7æe À 


Te 
= tan sin = —sin6 
À 
Posons: 
Te . 
p=—siné8 (40.34) 
À 
La résolution numérique de: 
tan g=® (40.25) 


donne (en radians): 


g=+{0,4.49,7.72,10.9,14.1,...) (40.36) 
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Les positions des maxima successifs sont alors: 


b=0—8=0 


Ÿ= 4.49 = 8= arcain E à Z arcsin (5?) Un 


etc... 


Nous aurions facilement pu obtenir une approximation convenable de ce résultat, en considérant que 
l'intensité est maximale lorsque: 


É | 
sin| —sin ê 
À £ sin TP in 6 => sin né = 1— sin 0 = (2» Fa (40.38) 
À À À 2 


Te . 
— sin 
À 
Ce qui nous amène à écrire: 


8 


mix 


(Cr + DA 
= arcsin| ————| avec 5e N° (40.29) 
. 2e 


Remarque: Un résultat remarquable de l'expérience de Fraunhofer est qu'elle remet en question la 
vision corpusculaire de la lumière telle que nous l'avions au 19ème siècle. 


Effectivement, beaucoup d'expériences telle que la projection de l'ombre d'un objet sur un mur 
semblait bien montrer que la lumière était tel un corpuscule ne traversant pas la matière et étant 
stoppée net par tout obstacle que ce soit en son centre ou en ses bords (il faut attirer votre attention 
sur les "bords" en particulier). 


Or, l'expérience de Fraunhofer ainsi qu'en particulier celle de Fresnel en ce qui concerne les bords 
(nous la verrons plus loin car elle est mathématiquement plus délicate à aborder), montrent bien que 
la lumière semble pouvoir se comporter non pas comme un simple corpuscule mais bien comme une 
onde (à partir du principe de d'Huygens que nous avons utilisé pour nos développements) tel que 
nous l'ont montré les développements précédents qui expliquent parfaitement bien les résultats 
expérimentaux des diffractions de Fraunhofer. 


Mais alors pourquoi garder le modèle corpusculaire de la lumière? Tout simplement pour d'autres 
résultats expérimentaux et théoriques parmi lesquels les plus connus sont l'effet photo-électrique ou 
la diffraction Compton (cf. chapitre de Physique Nucléaire) qui s'expliquent théoriquement à 
merveille si ce n'est parfaitement avec un modèle corpusculaire de la lumière (et certaines autres 
particules de dimension, charge, spin, etc. donné). 


Au fait, comme nous le verrons dans le chapitre de Physique Quantique Ondulatoire, c'est le 
physicien De Broglie qui va mettre définitivement un terme à cette dualité paradoxale en reliant à 
l'aide des outils de la mécanique relativiste et physique quantique ondulatoire les deux aspects 
mathématiquement. 
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2.1.1. POUVOIR DE RÉSOLUTION 


Selon le critère du physicien anglais Lord Rayleigh: le "pouvoir de résolution" (ou "pouvoir séparateur 
angulaire") d'une fente, est l'angle «,,, entre deux rayons lumineux de longueur d'onde ,, issus de 


deux sources ponctuelles £ ,$, , éloignées, dont les figures de diffractions sont séparées telles que le 


premier zéro de la figure de diffraction se trouve à la place du maximum de l'autre: 


ñ 52 


Figure: 40.5 - Illustration du principe de pouvoir de résolution 


Ce concept est énormément utilisé en photographie, astronomie, radioastronomie, etc. Il convient donc 
d'y porter une attention toute particulière! 


Or, nous avons vu que les minimas étaient donnés par: 


: AÀ 
sing, =— (40.40) 
e 


Et si nous prenons le cas où # = 1, nous retrouvons la relation disponible dans de nombreux ouvrages 
sans démonstration: 
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8Z=an&g = 


= (40.41) 


Donc le pouvoir séparateur angulaire est proportionnel au rapport de la longueur d'onde à l'épaisseur de 
la fente. Évidemment dans la pratique le but est d'avoir une valeur d'angle &,, la plus grande possible 


(sinon les objets de confondent et l'image est floue). 


Pour augmenter le pouvoir de résolution, il faut donc soit travailler à une longueur 
d'onde plus courte soit augmenter l'épaisseur de la fente de l'instrument et comme la longueur d'onde est 
souvent imposée par le sujet d'expérience, il est naturel de vouloir de faire varier e. 


Si la lumière qui passe à travers une fente forme une image sur un écran, et que l'image est observée au 
microscope par exemple, il est impossible, quel que soit le grandissement du microscope, d'observer 
plus de détails dans l'image qu'il n'est permis par le pouvoir de résolution de la fente. Il faut tenir 
compte de ces considérations dans la conception des instruments d'optique. 


2.2. CAS D'UN RÉSEAU DE FENTES RECTANGULAIRES 


Considérons maintenant un réseau de N fentes étroites de largeur # = À, de hauteur Æ :& # et distantes 
de d. Un unique faisceau incident éclaire toutes les fentes. 


Remarque: L'étude de ce modèle va nous permettre de comprendre en partie comment fonctionne 
le prisme et le fonctionnement des goniomètres utilisés en astronomie pour l'analyse du spectre ainsi 
que la diffraction par rayons X par un réseau d'atomes (donc l'importance est non négligeable). 


Soit le schéma suivant: 


vers l'écran à À = 0o0 


d sin 8 


Figure: 40.6 - Principe de base du réseau de diffraction à fentes rectangulaires 


Nous voyons sur le schéma ci-dessus que pour certaines directions &, la distance 4 sin & est telle que 
des interférences constructives ou destructives se réalisent. 


Posons que le réseau est placé dans le plan YZ et que la direction du faisceau se fait selon l'axe X. 
Plaçons-nous en un point d'observation P situé dans le plan XY. Selon les propriétés des ondes 


électromagnétiques (cf. chapitre d'Électrodynamique), le vecteur champ électrique Ë de l'onde émise 
par la i-ème fente est perpendiculaire à la direction d'observation et peut s'exprimer par: 
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Ë( 
À 


E, (6, R,f) = sin(t R-@'f) (40.42) 


et nous avons aussi vu plus haut que: 


: JTE . 
A sin | —sin 89 
FRE) = mr. - œt) (4043) 
R xt 


— sin # 
À 


d'où par anologie entre ces deux relations, nous identifions que: 


. É . | 
sin EL 
Ë (8) = ÿ > (40.44) 


— sin 8 
À 
et il vient alors: 
. He 
: A sin] — sin 4 
(@ sin(t R-œrt)= #2 - sin(tR — @f) 
À & 7e . 
rai: 8 
(40.45) 
. FO NS 7Te 
a — sin # sin] — sin 9 
£a À sa | sin | k : | | 
= À } i,6=ÛÙ À = Ê(a-É,, À 
À Æ 7e . 7e . 
— sin 8 — sin # 
À À 


Dans une direction & quelconque, les ondes issues de deux fentes adjacentes sont déphasées de 4 sin 8 
(où d est la valeur du pas entre 2 fentes) et au point P d'observation, le champ électrique résultant est 
donné par la somme des contributions de chaque fente avec son ;#*** décalage propre. D'où: 


(8,81) = Ÿ E,(8,8,9) = Ÿ Ë (8)sin (EUR + (i - Da sin 8) - at) 
= = (40.46) 


x 
= ET sin | (LR -œtit+kG-Ddsin£| 
I 
Nous voyons donc que chaque onde est déphasée de: 
Ag = kd sin 9 = Ta sing =c* (40.47) 


Nous pouvons maintenant représenter Æ(#,R,f) en utilisant les phaseurs (cf. chapitre de Mécanique 
Ondulatoire) dans l'espace des phases tel que: 


E(8.R,t) = Fi PE Mu z ÊS 2-2 çMucue (40.48) 
J=l J=l 
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Ce qui donne graphiquement pour le deuxième terme contenant la variable de sommation j pour une 
distance R fixe: 


Figure: 40.7 - Représentation de la sommation des termes 


Nous voyons que les Ë mis bout à bout forment un polygone régulier, inscrit dans un cercle de rayon: 
(40.49) 


La norme du champ électrique résultant étant égale à la corde définie par l'angle: 


g= SAP (40.50) 


il 


nous aurons: 


sin nTà sin 4 
Ë, 


. fo L 
= 20sn (?]-2< — = (40.51) 
stat À i 
d 2 sin E | sn[Fasné) 


L'énergie lumineuse (in extenso l'intensité) émise dans la direction & étant proportionnelle au carré du 
champ électrique (cf. chapitre d'Electrodynamique), nous avons alors pour les interférences 
destructives ou constructives: 


[5 ane] 
S(8,N,d) = À (8 (40.52) 


sa| asie) 


Nous substituons maintenant £(8) par l'expression trouvée lors de notre étude plus haut de la 
diffraction par une seule fente: 
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pe c[ereer) 
(40.53) 


Mis xl sin 8 


Ainsi, nous obtenons pour l'addition des effets d'interférences et de diffraction: 


“(5 ésn]] el “(5 21 
S(8,N,d) = $(8) (40.54) 
sn| 


Ta sin à 


sa| Ta sin d — © ain 8 


Bien que cette relation semble compliquée, tous ses paramètres n'ont pas la même importance pratique. 


En effet considérons la fonction: 


; 2 
_[sn@x)| _ À (40.55) 
B 


sin(x) 
Le terme A présente des maxima lorsque: 
Mu “A/2+mMmRe xx “ATON+mMIIN (40.56) 
et des valeurs nulles si: 
Nr MR x = MAIN avec meN (40.57) 


Bien que le terme B fasse diverger la relation pour x = # #, la règle de l'Hospital (cf. chapitre de Calcul 
Différentiel Et Intégral) nous donne que: 


x | sin( MVx) | [is sin(ÂVx) | “(ie d, d, sin(M) Ÿ 


2 
lim ne) =(N) (40.58) 
sin(x) *Mz sin(x) + Mx a, sin) sin(x) xMx 


cos(x) 


Il en résulte que pour x=##7 et donc des valeurs nulles de A et de B, la fonction # présente des 
énormes pics de hauteur y: = N°. 


Vu leur grande amplitude, les pics principaux sont ceux que l'on observe expérimentalement le plus 
facilement. Ainsi, la position angulaire des maxima de la fonction # est donnée par: 


)= 0 x. iomnr = AA,AEZ (40.59) 


“in sin(x pis princpaux 


PES pNCGAUX 


La valeur de n, qualifie le "numéro d'ordre du maximum d'interférence". 


Appliquons ses résultats à la relation d'interférence: 
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ain | x Fa sin 9 
S(8,N,d) = S(8) (40.60) 


sin É sin e 
À 


Le pic d'ordre n est centré sur la valeur équivalente & qui annule le numérateur et le dénominateur de 
cette fraction tel que: 


2 


FH: À 
ere =m' > sing = MEME Æ (40.61) 


d'où: 


à À 
sind, =#2—| (40.62) 
à 


Ainsi, un réseau dont nous connaissons la valeur d du pas peut être utilisé pour mesurer la longueur 
d'onde 4 d'une lumière incidente inconnue. 


Cependant, si la lumière incidente est polychromatique (typiquement pour les observations 
astronomiques), la relation précédente nous donne pour une longueur d'onde donnée la position des 
franges d'interférences. Ainsi, un astronome faisant passer de la lumière polychromatique de son 
télescope par un réseau diffraction peut faire une analyse spectroscopique de la lumière. 


La relation nous donne également que pour des valeurs fixes de m et d, plus À est grand, plus l'angle & 
l'est aussi dans un intervalle compris entre [0,x7/2]. Ainsi, les raies spectrales résultant de l'incidence 
d'un faisceau polychromatique montrent un spectre allant du violet (faible longueur d'onde donc petit 
angle) au rouge (grande longueur d'onde donc grand angle). 


Au moyen d'un goniomètre, nous mesurons les angles 4, des pics principaux d'ordre m, pour le plus 


grand nombre possible de valeurs de m. Nous en déduisons À de la pente du graphique: 


Asin &, 
An 


À = d (40.63) 


: | Re a : 0, ; 
Le pied du pic est situé à 4, + AS, en un endroit où le numérateur sin (£a sin ) s'annule pour la 
première fois après le passage du pic. 


Puisque l'argument de cette fonction augmente de #x# entre deux pics successifs (parmi tous les pics 
principaux et secondaires), il vaut #7: (#') à l'endroit du pic d'ordre m (pic principal donc) et doit 
parcourir # radians supplémentaires pour atteindre le pied du pic. 


Le numérateur vaut donc: 


1]4 
nd sin (8, +A8,)=m'nrtr=(matDr— sn(à, +28,)-[n+;] (40.64) 
# 


La distance angulaire A8, entre le sommet et le pied du pic principal est donc donnée par: 
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1 


LI 
ang, +A8,)i-sin(&, | [nés —— (40.65) 
ñ ñ à 


Mais dès le premier ordre, nous avons &, A9, . La différence des deux sinus donne (cf. chapitre de 


Trigonométrie): 


sin(8, + A8, )-sin(9, )= EE =] 


= un(e} ro, [ 28 A s 2 sin (é jee, 


(40.66) 


Un développement de Maclaurin (cf. chapitre des Suites Et Séries) de sin{@&) donne lorsque l'on prend 
le premier terme du développement sin(&) = &: 


A8 
2sin (jee 8,)= A8, cos(&,) (40.67) 


mais nous avons aussi la relation remarquable &55 8, i= fl — sin? | a: D'où la largeur angulaire d'un 


pic d'ordre m: 


SA 1 


24 
ndcos(&) nd f-cin (8) 


@, = 2A8, = 


DCE EE 


24 
RRRROCŒoUUCÇC 40.68) 
dt sin? (8) 


Or: 
À | 
ang, =m—<dsiné, =mA (40.69) 
Donc: 
1 24 
Bu ©) (0,70) 
# Jd?-imA) 


Il est clair que deux raies superposées seront vues comme distinctes si elles sont séparées d'une distance 
angulaire égale à leur largeur angulaire. L'expression: 


sin &, = _. (40.71) 
d 


établit qu'à deux positions angulaires correspondent deux longueurs d'onde. Nous pouvons donc donner 
la séparation de deux raies par À À = À, - À au lieu de À9 = 8, -&. 


Ainsi de: 


®, = 2A8, =<® 


"nd cos(,) 
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(40.72) 


nous tirons: 


cos(8,)A8, = Me (40.73) 
# d 
Mais: 
sin 4, = = — — = Asin(g,) (40.74) 
d d 
Lorsque À 8, et &, sont petits, nous avons: 


Asin(g,)=cos(8,)A8, (40.75) 


Ce qui nous amène à écrire par substitution: 


(40.76) 


Le pouvoir de résolution R d'un réseau représente sa capacité de séparer deux raies spectrales de 
longueurs d'onde 4 et 4+ AA voisines tel que: 


=m'A| (40.77) 


Nous voyons que le pouvoir de résolution augmente proportionnellement à l'ordre de diffraction. 


2.3. FENTES DE YOUNG 


Selon le principe de la dualité onde-corpuscule, la lumière se comporte à la fois comme une onde et 
comme un corpuscule (particule matérielle). C'est la résolution de problèmes comme ceux du corps noir 
(cf. chapitre de Thermodynamique), de l'effet photoélectrique (cf. chapitre de Physique Nucléaire) ou 
encore celui de l'effet Compton (cf. chapitre de Physique Nucléaire) qui a révélé l'existence de cette 
dualité. 


Mais nous allons nous maintenant étudier la manière la plus flagrante mettant en évidence l'aspect 
ondulatoire de la matière à l'échelle atomique à l'aide de l'expérience des fentes de Young. Nous allons 
aborder celle-ci de manière simplifiée comme un cas particulier du réseau de fentes rectangulaires mais 
ayant l'avantage de mettre expérimentalement en évidence de manière aisée le comportement dual et 
probabiliste de la matière à l'échelle atomique. 


Soit une source de lumière S, qui rayonne une onde monochromatique Y de longueur d'onde 4 à 
travers deux fentes Æ et F, percées dans un obstacle opaque à la lumière, comme le montre la figure 
ci-dessous: 
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Figure: 40.8 - Mise en place de l'expérience des fentes de Young 


Remarque: L'intérêt du dispositif est qu'il permet de produire deux sources de lumières cohérentes. 
C'est-à-dire deux sources dont la différence de phase est constante tout au long de l'expérience. 


Nous disposons un écran d'observation E en un point H tel que la distance: 
OH=DxÆF,=a (40.78) 
où a serait typiquement de l'ordre du millimètre et D du mètre. 


L'onde Y donnera après son passage à travers les fentes Æ et F, , comme nous l'avons déjà vu, 
naissance à deux ondes "filles" #, (r,£)et Y,(x,£) de même pulsation & qui emprunteront 


respectivement les chemins >; et r; et qui iront interférer au point M de l'écran E. 


Si l'interférence en M est constructive, ce point sera alors situé sur une frange brillante et si 
l'interférence en M est destructive, il sera sur une frange obscure. Pour observer cela, écrivons d'abord 
l'onde résultante au point M : 


Vis = Pifñé)+ For,t) (40.79) 


dans laquelle nous avons en termes de phaseurs (cf. chapitre de Mécanique Ondulatoire): 


(nt) = arret) et p,(m,1)= 4olrr- at) (40.80) 


où À est l'amplitude, k est le vecteur d'onde et t représente la variable temps comme nous l'avons déjà 
étudié en détail dans le chapitre de Mécanique Ondulatoire. 


Maintenant, faisons un changement de variable (histoire de ne pas avoir à trimbaler de longues 
exponentielles): 


Pi (nt) = 4° et Y (r,6)= AP (4081) 
Remarque: Nous verrons plus loin qu'au fait 2, = et 2, =7r, 


Pour le calcul de l'intensité au point M, nous allons prendre la norme complexe (module) de ,; ce qui 


s'écrit donc comme le produit du complexe et de son conjugué: 
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£= lEu]= Poe Par =Li+ 2) Pi +) (40.82) 


Remarque: Ce calcul est très important, car l'analogie avec la physique quantique ondulatoire est 
très forte à ce niveau et similaire au calcul de l'amplitude de probabilité (cf. chapitre de Physique 
Quantique Ondulatoire). 


Donc: 

1= A? (3 1 Cas +) = A? É +272) Po ee | + 1 

= 42 [24e 720) 4 PL 4 [2+cos{k(2 — Dy}}+cos(#(D, - D ))] (40.83) 

= 4[2+2cos(&(2 -D,))] 
L'intensité est donc maximale si et seulement si: 

cos(t(Z - D)) =] (40.84) 
Donc que: 
K(A-D,)=2n7—D-D,=nA (40.85) 

avec # e N. Ce qui donne: 


2 -D, = (x -@t)-(»# -æ@t)=" —P =AÀ (40.86) 
Remarque: C'est ici que trivialement nous voyons que 21 = et D, =; 


L'intensité est donc nulle si et seulement si: 
COS (t(A - D, ) =—1 (40.87) 
Donc que: 
1 1 
k(A -D)=2 nt r=D-D, = n+> À (40.88) 
avec # e N. Ce qui donne: 
1 | 
ñn-= GP: (40.89) 


Maintenant, il nous faut calculer  —-; en fonction de z pour savoir ce que nous observons sur l'écran 
E. 


Considérons pour cela le schéma suivant: 
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Source A 
lumineuse 


Figure: 40.9 - Agrandissement et situation particulière de l'expérience de Young 
où AP=n et EP=r. 
Nous avons sur notre schéma: 
m=D2+PK (4090) 


Or, PK =3Z7-aj2 donc nous avons: 


2 2 
f=n4(:-5) nr =D 14-55) (40.91) 
2 D° > 


Comme z et a sont petits devant D et en utilisant l'approximation: 
£ 
Ji+esz Frs (40.92) 


si & est petit devant 1. Nous avons alors: 


1 a : 1 d À 1 ä . 
n =2 1455) = D 14 (5) -D+(z-$) (40.93) 
D? 2 20? 2 2D 2 


De même: 


l aŸ l a Ÿ 1 aŸ 
F5 = 0 14 (+5) ef (+5) ]ro+2 (+5) (40.94) 


Donc en soustrayant ces deux relations: 
ñ —# z2 (40.95) 
SE 
D 


Donc finalement en utilisant la relation: 
ñn-2=AÀ (40.96) 


il vient: 
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Z=- 


(40.97) 
& 


Ainsi, la distance entre deux maximums consécutifs est: 
. AD 
Éfox = — (40.98) 
a 


et est appelée "interfrange"”. 


Pour les franges d'intensité nulle il vient immédiatement: 


| = 
=-|x+—|—— (40.99) 
2} a 


Cette relation révèle que l'intensité I présente des minima (franges obscures) et maxima (franges 
brillantes) distribués selon la direction z de manière périodique. Cela ne nous étonne pas plus que cela 
pour l'instant car cela découle du cas plus général étudié plus haut. 


ANVUVA 
Figure: 40.10 - Représentation imagée du résultat de l'expérience de Young 


Il convient cependant de préciser que les calculs précédents montrent que l'intensité des franges est 
partout égale. Or nous observons expérimentalement (voir la figure ci-dessus) que leur intensité 
diminue lorsqu'on s'éloigne du centre de l'écran. Comme nous l'avons déjà vu, deux phénomènes sont à 
l'origine de cette observation: 


Premièrement, les fentes ont une certaine largeur, ce qui implique un phénomène de diffraction. En 
effet, une lumière envoyée sur un petit trou n'en ressort pas de façon isotrope. Cela se traduit par le fait 
que la lumière est majoritairement dirigée vers l'avant. Cet effet se répercute sur la figure observée 
après les fentes de Young: l'intensité des franges décroît au fur et à mesure que l'on s'éloigne du centre. 


Le second phénomène à prendre en compte est le fait que les ondes émises en À et F, sont des ondes 
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sphériques, c'est-à-dire que leur amplitude décroît au fur-et-à-mesure qu'elles avancent. Ainsi 
l'amplitude de À et Æ, ne sera pas la même au point M. 


Donc nos calculs restent approximatifs par rapport à l'étude que nous avions faite du réseau de fentes 
rectangulaires mais c'est ainsi que l'expérience des fentes de Young est présentée dans les écoles et cela 
suffit à mettre en évidence le résultat principal. 


L'expérience originelle de Thomas Young peut donc être interprétée en utilisant les simples lois de 
Fresnel comme nous l'avons fait avec le réseau de fentes. Ce qui met en évidence le caractère 
ondulatoire de la lumière. Mais cette expérience a par la suite été raffinée, notamment faisant en sorte 
que la source S émette un quantum à la fois. Par exemple, on peut à l'heure actuelle émettre des 
photons ou des électrons ou encore des atomes un par un. Ceux-ci sont détectés un par un sur l'écran 
placé après les fentes de Young. Nous observons alors que ces impacts forment petit à petit la figure 
d'interférences. Selon des lois classiques concernant les trajectoires de ces corpuscules, il est impossible 
d'interpréter ce phénomène!!! D'où l'intérêt de l'étude théorique et expérimentale des fentes de Young. 


De gauche à droite et de haut en bas, voici les motifs obtenus en accumulant 10, 300, 2'000 et 6000 
électrons avec un flux de 10 électrons/seconde. L'accumulation des électrons finit par constituer des 
franges d'interférence ce qui est assez déroutant a priori! 


Nous reviendrons sur ce phénomène crucial dans le chapitre de Physique Quantique Ondulatoire pour 
en dire un peu plus. 


3. POLARISATION DE LA LUMIÈRE 


Ce n'est qu'au 19ème siècle que l'on découvrit la polarisation de la lumière (nous allons de suite 
expliquer de quoi il s'agit). Cependant, à l'époque de Newton, on connaissait déjà un phénomène dû à la 
polarisation: l'existence de cristaux dits "cristaux biréfringents" (tel le spath d'Islande) qui ont la 
propriété de réfracter un seul rayon en deux rayons distincts (aujourd'hui nous savons que les deux 
rayons réfractés par un tel cristal sont polarisés). 


Pour comprendre ce qu'est la "polarisation de la lumière", revenons au cas d'une onde se propageant sur 
une corde (cf. chapitre de Mécanique Ondulatoire). Une telle onde peut le faire dans un plan vertical 
(droite) aussi bien que dans un plan horizontal (gauche) ou dans tous les plans intermédiaires: 
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Figure: 40.12 - Représentation imagée du concept de polarisation de la lumière 


Dans les deux cas, nous disons que l'onde est "polarisée linéairement", ce qui signifie que les 
oscillations se font uniquement et toujours dans le même plan, appelé "plan de polarisation". Une telle 
onde peut passer à travers une fente verticale si elle est polarisée verticalement, une onde polarisée 
horizontalement ne le pourra pas. 


Rappel: nous avons vu dans le chapitre d'Électrodynamique que pour les ondes électromagnétiques, le 
champ électrique & oscille (du moins pour la solution standard des équations de Maxwell) et est 
orthogonal à la direction de propagation. 


Le vecteur champ électrique £ d'une onde peut être décomposé en deux composantes perpendiculaires 
l'une à l'autre, | He Ë, \ si l'onde se propage dans la direction z et transportant chacune la moitié de 


l'intensité de l'onde. Ces deux composantes changent à tout moment lorsque & varie. Le résultat à tout 
instant est un champ horizontal total et un champ vertical total. 


© 2001 bocswCs Manenmyrte (D) 


Figure: 40.13 - Illustration de la décomposition du champ 


Si # tourne autour de la direction de propagation avec son extrémité décrivant un cercle, nous disons 
alors que l'onde est "polarisée circulairement": 
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&£ reste alors constant en module mais tourne tout en progressant, effectuant un tour complet pour 
chaque parcours égal à une longueur d'onde. 


Remarque: La lumière n'est pas forcément polarisée ! Chaque atome émet un train d'ondes qui dure 
moins d'un cent-millionième de seconde (ces trains d'ondes sont parfaitement expliqués par la 
propagation de la particule libre en physique quantique avec les transformées de Fourier), et toutes 
ces ondes n'ont aucune corrélation de phase ou d'orientation. Le champ résultant en une position 
donnée de l'espace, est la somme géométrique de tous ces trains d'ondes: il change constamment. 


Ainsi, la lumière naturelle est un mélange aléatoire et très rapidement variable d'ondes linéairement 
polarisées dans toutes les directions. En regardant vers la source, nous observons un champ ÿ, 
résultant qui oscille dans une certaine direction durant une fraction de période puis saute brusquement à 
une nouvelle direction aléatoire tout en restant perpendiculaire à la direction de propagation: 


Cette introduction ayant été faite, passons à quelque chose d'un peu plus formel: 


Nous avions donc vu en électrodynamique qu'une onde plane progressive monochromatique (même si 
physiquement elle n'existe pas.) se propageant dans le vide était composée d'un champ £ et d'un 
champ magnétique 3 et était caractérisée par sa pulsation & , son amplitude en champ électrique £& et 
en champ magnétique $ et sa direction de propagation donnée par un vecteur unitaire #,,#,,4, au 


choix selon l'orientation du repère choisi. 


Nous avons vu également que ces ondes possèdent des propriétés structurelles remarquables, en 
particulier : 
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- f et & sont transverses, c'est-à-dire que leur direction est en tout point et à tout instant orthogonale à 
la direction de propagation (théorème de Malus). Ceci, permettant de définir un plan d'onde, plan 
généré par les deux directions de & et ÿ. 


- Les normes de ces deux vecteurs sont reliées par 8 = £;-, où € est la vitesse de la lumière dans le 


vide (c'est ce rapport immense entre le champ magnétique et le champ électrique d'une onde 
électromagnétique qui fait que les développements présentés plus loin se font de préférence par rapport 
à la composante & de l'onde). 


- Enfin, ces deux vecteurs sont orthogonaux entre eux, et le trièdre (£, B,&,) est un trièdre orthogonal 


direct. 
Ces trois propriétés se résument par la relation: 


# ,XE 


B= (40.100) 


€ 


où nous avons choisi le repère tel que l'onde se propage selon la direction %,. De plus, nous avions 


montré que le champ électrique est une fonction d'onde trigonométrique donnée à l'arbitraire de phase 
près par: 


JE] = Écos(a -& +) ou JE] = Ésin (er -& +@) (40.101) 


Plaçons-nous maintenant dans une base (x, y, z). L'expression la plus générale du champ électrique 
d'une onde plane progressive monochromatique se propageant selon #, peut être décomposée selon 


deux composantes: 


| 


Écos(8)cos(at-k +) Ê, cos(at-iz+@) 


# 


| Êsin(8)cos(æ -iz+@) =|z 


Et 
I 


cos(æt-Az+ç,)| (40.102) 
0 


0y 


CRTC 


La norme du champ étant dès lors donnée par: 


JEO]= LÉ cos? (8)cos’ (at -1 + )+ Ésin? (8)cos(@ +) (40.105) 
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Si g = &, (ce qui est le cas le plus souvent) nous avons alors: 


|E| = Êcos(æ-lz+p)£<Ë (40.104) 
En choisissant une autre origine des temps, nous pouvons toujours nous ramener à écrire: 


Ê, cos(at -&) 
E=|£É, cos(@t-z-@)| (40.105) 
( 


avec pP= R -. 


Remarque: Le choix d'écrire ® plutôt que +4 nous sera utile plus tard pour l'utilisation des 
relations trigonométriques remarquables et nous permettra de trouver l'équation d'une ellipse 
(patience. ce n'est plus très loin). 


En utilisant les phaseurs (cf. chapitre de Mécanique Ondulatoire) ces dernières relations peuvent se 
ramener à: 


Ë, gt) 
x 
Ê=p|£8 dt" | (40106) 


0y 
(] 


Mais la polarisation la plus générale est décrite par un vecteur complexe normalisé à l'unité dans un 
espace à deux dimensions de composantes: 


À = cos 8e Li =sin 8e (40.107) 
avec af - PI =]. 
Cependant, pour décrire ce champ, et donc l'ensemble de l'onde, il est commode de se placer dans le 
plan z = 0 et de décrire l'évolution du vecteur &£ dans ce plan. C'est ce que nous allons faire par la 


suite. Ceci revient en fait à choisir une origine des coordonnées selon z. Dans ce cas, nous pouvons 
écrire: 


(40.108) 


3.1. POLARISATION LINÉAIRE 


Définition: Nous disons qu'une onde est "polarisée linéairement" lorsque g=0 ou 877%. 


Dans le premier cas (@= 0— g = @,), nous avons: 
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(40.109) 


Dès lors, nous avons £;,, £,, qui ont des valeurs comprises respectivement entre 


[-Éx +Es| ; [-É +&, | Ê 


Remarque: Relativement à un diagramme que nous verrons plus loin il convient de prendre en 
compte que lorsqu'une composante est positive l'autre l'est aussi et inversement. 


Nous avons dès lors à chaque instant: 


E, =E,, cos(æt)| £ E 
œ= (40.110) 
HE cos(at)| Æ, E, 


ce qui signifie que le champ garde une direction fixe. D'où le fait que nous parlions d'onde polarisée 
linéairement. 


Si P = nous avons alors: 


Ë, cos(at -&) Ë, cos(at -&)  . 
” . x ch on 
E=|É,cos(&-k-n)|=|-É,cos(at-&)|=8| À | («on 
0 0 -Ë,,e 


Dès lors, nous avons £,,, &,, qui ont des valeurs comprises aussi entre [-Éc +Es| [. +Æ, >| ; 


Remarque: Relativement à un diagramme que nous verrons plus loin il convient de prendre en 
compte que lorsqu'une composante est positive l'autre est négative et inversement. 


Nous avons dès lors à chaque instant: 


' o cos (ar) ë, = #r (40.112) 
E, = — 0 cos(æ) E, y 


ce qui signifie aussi que le champ garde une direction fixe. D'où le fait que nous parlions également 
d'onde polarisée linéairement. 


3.2. POLARISATION ELLIPTIQUE 


Si est quelconque, et en nous plaçant en z = Ü , nous avons: 


E 
LE = cos(@t) et = cos(aticosp+sin(æf)sin æ (40.112) 
E, Foy 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


d'où: 
E, E 
sin(@f)sin g=-cos{æ)cosg="-Ecos@ (410.114) 
Le £5y 0x 


De plus, nous pouvons écrire: 


“ = cos(@i) © Er sing=cos(@f)sing (40.115) 
Ë,, 0x 


En portant chacune des 2 relations précédentes au carré: 


Ë, 
Ë 


2 2 
E 
sin* (@f)sin? @= | | - 227 À cos @+ _ cos? @ 


p —“0x 0x . 
(40.116) 


2 
E, sin @= cos’ (æ }sin® æ 
E 


et en sommant, nous éliminons le temps et obtenons: 


2 


| E E, E E 
sin? @= | 2 TE cos p+| (40.117) 
0y Oy “—0x Ex 


Nous remarquons que si & = Ü,#= 7 nous retrouvons: 


2 2 2 
on oh E&, _ = Cd =0— E, _ E (40.118) 
£, £ Ex Ex Ey Ex 


Ceci dit, ceci est l'équation d'une ellipse: 
y + 2 + (—2 cos \ xy + (-sin? g) =0 (40.119) 


En tout point similaire à la forme générale des coniques que nous avons dans le chapitre de 
Géométrique Analytique: 


ay? + 8x? +yxy +ôx+Eey+É=0 (40.120) 


Dans ce cas, l'extrémité de & décrit donc une ellipse et nous parlons dès lors naturellement de 
"polarisation elliptique". 


Suivant la valeur de ®, cette ellipse peut être parcourue dans un sens ou dans l'autre. Pour déterminer 
ce sens, dérivons l'expression du champ et plaçons-nous à + = Q toujours dans le même plan d'onde en 
z=0: 
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-Ê, asin(at-k&) ( 


d,Ë-|£É asin(æ-l-p)|-|-Éœsinæ| (40121) 
0 0 
Ainsi: 


- Si 0 <g< x/2 l'ellipse est parcourue dans le sens direct (inverse des aiguilles d'une montre) comme 
le montre la figure plus loin. Nous disons alors que la polarisation est "elliptique gauche directe". 


- Six{2< @<x l'ellipse est parcourue dans le sens direct aussi (inverse des aiguilles d'une montre) 
comme le montre la figure plus loin. Nous disons alors que la polarisation est "elliptique droite directe". 


-Six<æ< 37/2 l'ellipse est parcourue dans le sens horaire (sens des aiguilles d'une montre). Nous 
disons alors que la polarisation est "elliptique droite indirecte". 


- Si 37/2 < g< 2x l'ellipse est parcourue dans le sens horaire (sens des aiguilles d'une montre) comme 
le montre la figure plus loin. Nous disons alors que la polarisation est "elliptique gauche indirecte". 


3.3. POLARISATION CIRCULAIRE 


Si: 
@=x{2,@=3712 (40.122) 
et: 
Le = Ës = £, (40.123) 
nous avons alors l'équation de l'ellipse qui se réduit à: 


E+E = 


Or.» (40.124) 

qui est l'équation d'un cercle de rayon £;,,, le sens étant toujours donné par le signe du sinus: 
- Si g=zx/2 il s'agit d'une polarisation circulaire gauche 

- Si g= 37/2 il s'agit d'une polarisation circulaire droite 


… Voir la figure plus bas pour un schéma. 


3.4. POLARISATION NATURELLE 


Nous pouvons considérer l'émission d'une source comme une succession d'ondes planes progressives 
monochromatiques dont l'expression sera donc: 
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12 cos(@ -kz) 
ÊE=| É,cos(æ-&-g)| (40125) 
0 


Ces trains d'ondes sont donc dans un état de polarisation particulier. Cependant, cet état varie 
aléatoirement d'un train d'onde à l'autre, et ceci en un temps très court par rapport au temps 
d'intégration des détecteurs. Ceux-ci ne verront donc pas de polarisation particulière, et le champ £ 
n'aura pas de direction particulière. 


Nous parlons dès lors de "lumière non polarisée". Si nous superposons cette lumière à une onde 
polarisée, nous obtenons ce que nous appelons une "polarisation partielle". 


Finalement, nous pouvons résumer tout ce que nous avons vu jusqu'à maintenant par la figure suivante 
où nous avons: 


- La polarisation linéaire @= 0,@=7,@= 27 

- La polarisation linéaire partielle (n'est pas représentée) 

- La polarisation elliptique directe gauche 0 < g< x/2 ou droite x{2 <g@<x 

- La polarisation elliptique indirecte droite x < g <3x/2 ou gauche 37/2 <g@ <2x 
- La polarisation elliptique partielle (n'est pas représentée) 


- La polarisation circulaire gauche & = 77/2 ou droite & = 37/2 


- La polarisation circulaire partielle (n'est pas représentée) 


2e 


F9 (2r gp =2# 


Figure: 40.16 - Représentations des différentes polarisations 


Nous pouvons représenter cela de manière animée avec Maple (nous n'avons pas mis le *.gif ci-dessous 
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afin de ne pas trop charger le document...) et les commandes suivantes: 


> restart; 

> with (plots): 

> Ex:=1;Ey:=1;phi:=Pi/4;k:=1;omega:=1; 

> animate3d([x,a*Ex*cos(omega*t-k*x),a*Ey*cos(omega*t- 
k*x-phi)],a=0..1,x=-10..10,t-0..2*Pi,frames-15,grid=[35,35],style-patchnogrid,axes-boxed); 


Figure: 40.17 - Animation d'une onde polarisée avec Maple 


Il est bien entendu possible de modifier les paramètres. Par exemple, #= 7/2 donne une polarisation 
circulaire, # = zx donne une polarisation rectiligne comme nous l'avons montré plus haut. 


3.5. LOI DE MALUS 


Pour polariser de la lumière, le physicien fera usage de polariseurs. Nous n'entrerons pas ici (car ce n'est 
pas dans le cadre de l'optique ondulatoire) dans les détails des propriétés atomiques ou moléculaires de 
la matière qui sont la cause de la polarisation de la lumière transmise. 


Pour nos besoins, nous allons nous restreindre à un polariseur qui polarise une lumière incidente de 
manière linéaire selon l'axe x (la composante Æ, étant dès lors nulle). Il vient dès lors: 


E, Êcos (8) te Êcos(8) sn 
ËE-|£#,|1-%| Éan(a)ett# eg 0 (40.126) 
E 0 


tq 


Or, nous avons vu dans le chapitre traitant des équations de Maxwell (chapitre d'Électrodynamique) 
que: 


(40.127) 
2H 240 
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Dès lors, il vient pour l'intensité maximale (telle que S(*-#} 2 1 ): 


Ê? cos? (8) Ê? 


24490 24490 


cos? (8) = 4, cos’ (8)| (40.128) 


relation qui constitue la non moins fameuse "loi de Malus". 


Pour étudier de façon quantitative la polarisation, nous allons nous servir d'un ensemble 
polariseur/analyseur. Nous faisons d'abord passer la lumière dans un polariseur dont l'axe fait un angle 
& avec l'axe x, puis dans un second polariseur, appelé "analyseur", dont l'axe fait un angle & avec le 
même axe (voir figure ci-dessous) avec: 


A=(cos@,sinæ) (40.129) 


dont la norme est égale à l'unité ! 


analyseur 


polariseur 


Le 


Figure: 40.18 - Exemple simplifié d'un analyseur 


À la sortie de l'analyseur, le champ électrique £$: s'obtient en projetant la lumière polarisée linéairement 
(g = 0) obtenue à la sortie du polaroïd: 


E, Écos(8)cos(æt) 
E- E, | Ésin(8)cos(at) | = Ê: Bcos(æt) avec 5 =(cos8sin8) (40.130) 
E, 0 


sur # (ce qui signifie: projection-produit scalaire, pour obtenir un vecteur on multiplie par le vecteur 


sur lequel on projette): 


(40.131) 
” [&0 cos(æ)cos(8- &)] A 


Nous en déduisons la loi de Malus pour l'intensité: 
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l'= Icos (8-æ)| (40.132) 


dans le cas particulier de la polarisation linéaire bien sûr. Nous réutiliserons ce résultat en cryptographie 
quantique (cf. chapitre de Cryptographie). 


4, COHÉRENCE ET INTERFÉRENCE 


Nous allons maintenant voir quelles sont les conditions nécessaires à ce que des ondes planes 
interférent entre elles. Ces développements permettent de comprendre bien des choses sur la vision du 
monde qui nous entoure via notre oeil (surtout pourquoi l'ensemble des ondes reçues par nos rétines ne 
se mélangent pas et donc les couleurs non plus!). 


Considérons deux ondes planes Y, et Z; de pulsations &, et &, , de vecteurs d'onde À, et £, se 
propageant toutes deux parallèlement à l'axe Oz. 


Nous notons 44 et 4, les amplitudes complexes des deux ondes et nous nous intéressons à l'intensité 
moyenne observée en un point O pris comme origine des coordonnées: 


——+À 


— À, 


Plans d'onde de l'onde 1 
Plans d'onde de l'onde 2 


Figure: 40.19 - Représentation des ondes planes 


Nous posons: 


et nous SUPPOserons: 
= -m «2% (40.134) 
Au point O les amplitudes complexes s'écrivent 


= 4h * ei " | mn: |e2 ai 


id (40.135) 
1 1 1 
da = We =tale te 
où & et &, représentent les phases de y4 et 4%. 


Calculons maintenant l'intensité instantanée au point O qui sera notée J(t). Comme l'intensité moyenne 
L'est proportionnelle au carré de l'amplitude, nous supposerons qu'il en sera de même pour l'intensité 
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instantanée. Ce qui nous amène à calculer la somme des parties réelles des amplitudes des deux ondes: 
2 _ 
JO =(RU)+RG2)) = RG) + RG) +2RGGIR GE) (40.136) 


Ce qui s'écrit en se rappelant que (cf. chapitre sur les Nombres): 


RGD= S(w+P) (40.137) 
Soit: 
R(IR (YA) = (4 +ÿ (us +B)= (ui +%)(u +) 
= (us UP + Pivé HIDE) = (bite + i02)+ (Pit +0) (40.138) 
= SRGAUS)+ RAP) 


Et nous avons alors: 
JE = RAY +R) +2R(GIR (GE) = RG) + REY +R) +R) (40.139) 
Il en découle la somme de quatre termes: 
70 =IWif cos? (at -4) 
+|wf cos? (a -8) 
+lgius [cos [(æ +æ)é- (84 +8 )] 
+lgqya|cos [ (@ - a +(4-8 )] 


(40.140) 


Pour calculer l'intensité moyenne, nous allons choisir une approche expérimentale. L'intensité moyenne 
sur le temps de pose T du détecteur (électronique ou biologique) sera donc donnée par: 


1f 
1= Jo ={JE@} G014 


Test donc la somme des moyennes des quatre termes intervenant dans J(t). En lumière visible (cas de 
notre oeil), les fréquences sont de l'ordre de 10° [Æz] et les temps de pose des détecteurs varient entre 


la milliseconde et la seconde. T contient alors typiquement 10!2 périodes de y4 et #s,!! 


Examinons l'effet sur la valeur moyenne de chacun des termes de J(t) en rappelant d'abord la relation 
(cf. chapitre de Mécanique Ondulatoire): 


1. Nous avons en utilisant les intégrales usuelles démontrées dans le chapitre de Calcul Différentiel Et 
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Intégral, la valorisation suivante de l'intégrande sur un grand nombre de périodes: 


AT. n27-8 2 n2r-8 
bif Bi 
L=— x | ka Ê cos? (@t- 4 \dt = —— { cos? (x)dx = | cos? (x) dx 
x @ 9 *T2TÂ _g 
2 n27-8 2 n2r-8 
= lil [ cos? (oér= ML — [ dx +sin(x)} cos(x) 4 
#27 © 2 & 
2 
_ luil 


= Be [' #27-4 \-{-4 ]+i ain(x27 — 4 }cos(#27- 4 )- sinf—-4 )cos(-4)i)] 
7m | 2 


es | 


_mÉT: : Las lLMÉË : 
5 M Sn (sint- & }cos(—-& )- sin(—& )cos( a |-L un An | 


(40.143) 


Calcul que l'on note traditionnellement et très abusivement sous la forme condensée suivante: 


23 22% 
= ff co(ar- a)ar BL feu (a ga Mi, Mi. vo 


Nous pouvons estimer que sur un grand nombre de périodes (temps d'ouverture du détecteur), c'est 
cette moyenne qui sera mesurée (en l'occurrence c'est celle-ci!). 


2. Nous avons de même: 


WT We, ke 
Le 7 Jhaf co (a@t-8 ja = cos (at-@)d= re (40.145) 


OO —— 


avec la même remarque que précédemment en ce qui concerne le détecteur! 


3. Pour le troisième terme c'est un peu différent: 


Wuel f | 


B = fhavalos[ (es +ae-( (4+&) ) Jet = cos [(@ +æ)t- (4+8&) ) ls 


AA 
27 


- sl 


J cos((æ +æ})cos(4 +8 )at + [ sin ((@, + Mé)sin(& +41 
0 (a) 


(40.146) 


cos(& +6) 


27 


24% 
cos({(æ@, + &)f)dt+sin(& +8) [ sin ((@, +&}é) a 


Û 


_ live 
27 


Le Le 


24 
cos(2aé)dt+sin(4 +) | sn (224! 
(e] 


(4 +&) 


Or, la moyenne d'un cosinus et d'un sinus sur une période est nulle. Donc si le détecteur fait une mesure 
sur un temps d'exposition supérieur à 1/2&,, soit sur un grand nombre de périodes, nous aurons: 
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ETA T | T - 
L, = cos(& +8,) [ cos (2@hé )dt +sin (& +8,) [ sin (2@f) dt 
“7 0 0 (40.147) 


_ lave) 
27 


[cos(4+8,) 0+sin(& +&)-0]=0 


4. Pour le quatrième terme c'est encore différent dans l'approximation expérimentale. Effectivement: 


L 1 27 _ : _bwlT _ _ 
Î4 °x [ Rive cos[ (@ a) +(4 8) jé = [ cos[(@ aX+(a 8) Jat 
7, 27 ÿ 


_ lvl [ ((æ - as _ a Ts s — 6) dt 
de cos((@, -æmhé)cos(4 -&) [sin((e æ})sin(4 -&) 
| | 0 . û - (40.148) 
ME (4 — 8) [ cos((as - a })di-sin (8 8) [ sin (a - a 
0 (e] 
2# 2# 
= lle (a +6) [ cos(Oat)dt- sin(& +&) [ sn (a) 
0 0 


Or, 5æ & 2a. Donc le détecteur n'a pas le temps de mesurer l'intensité moyenne sur une période 


entière en première approximation puisque: 
T = Ci (40.149) 
arr) 
et que cette valeur est beaucoup beaucoup plus grande dans le spectre du visible que le temps 
d'ouverture/échantillonnage de l'oeil qui est lui de 0.1 [s]. 


Ainsi, nous noterons la moyenne du quatrième terme par: 


2% 
r? - Hiva Jcos[(@-ax+(a-&)lé-lavsl(cos[sæ+(a-&)]), 
| | 


= fps] 


L'intensité moyenne vaut donc dans un cadre expérimental: 


2 
= Mi lai +f@lBe] 0150 


2 


ou: 


1=h+L+2f(DJAL) (0152) 


Si les pulsations & ,æ, sont égales (ou pratiquement égales), c'est alors l'interférence entre deux ondes 


planes monochromatiques. L'intensité moyenne s'écrit alors: 
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I=1+L+2/4L/D=A+L+2/2 {cos(a -&)} 


T 
= +2 +212 = fc0s(4 — 8, kit = +2 +222 cos(& —& ) 
(a 


(40.153) 


L'intensité mutuelle est non nulle et nous disons alors qu'il y a cohérence. Dans le cas contraire, si les 
deux pulsations sont très différentes, la moyenne f{t) est nulle et nous avons alors: 


1 = À +i + 244 2 FT) = À + (40.154) 


Le terme d'interférences a disparu, l'intensité moyenne est la somme des intensités moyennes des deux 
ondes. Nous disons dans ce cas que les deux ondes sont incohérentes entre elles. 


Quand nous savons que l'oeil interprète l'intensité pour former les perceptions des objets nous 
comprenons pourquoi deux objets de deux couleurs différentes ne forment pas une perception 
correspondant à un mélange des deux couleurs car même si dans le spectre du visible, les pulsations 
sont presque égales, leur déphasage en un point donné de l'espace est rarement nul tel que: 


I=È +1, +2 HrE cos(0)= A +1, +2 He (40.155) 
Il n'y a donc pas interférence et nous avons en réalité: 
I1=E +1, +2 He cos(& -4)= À +1 (40.156) 


et ce d'autant plus que le déphasage n'est pas constant dans le temps et que la moyenne de déphasages 
fait que le troisième terme s'annule. On ne peut donc pas interférer de manière simple des ondes planes 
de sources différentes. Par contre, lorsque la source est identique nous retrouvons ce que font nos 
écrans avec les trois couleurs primaires RVB. 


Lorsque &, -& est un multiple de 277, I est maximale (interférence constructive). Lorsque &, —-& est 
de la forme (2k& +17, I est minimale. Nous avons alors une interférence destructive. 


Remarque: Lors de la composition de plusieurs ondes, nous pouvons toujours considérer qu'il y a 
interférence. Toutefois, nous appelons "conditions d'interférences" des conditions d'observation de 
ces interférences, in extenso des conditions pour que le résultat de leur composition soit 
suffisamment stable pour être observé. Il est d'usage de parler de visibilité, ce qui restreint à la seule 
observation par l'oeil (humain). 


Nous avons vu pour l'oeil que la fréquence temps d'échantillonnage est de 10 [s”1] . Sachant que la 
lumière visible à une fréquence de f = 10! fs”! ], la fréquence doit donc être stabilisée par la source 
pendant: 


ce qui matériellement est impossible sauf à ce que la source soit la même. Nous en déduisons que pour 
que des interférences soient visibles à l'oeil, les sources doivent être synchrones à mieux que 1975 ce 
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qui en pratique amène à ne considérer que des sources absolument synchronisées sur une source 
unique. 


Dans le modèle précédent, nous avons par ailleurs négligé le fait qu'une onde réelle est limitée dans le 
temps. Un photon est représenté par un paquet d'onde limité. Soit T sa durée, il aura une longueur 

, =ce.T dans le vide ou dans l'air que nous appelons "longueur de cohérence temporelle". 

Un rayonnement donné est donc une superposition d'une succession de trains d'ondes dont la longueur 
moyenne est À, , les trains d'ondes successifs n'ont pas de relation de phases entre eux: ils ne peuvent 


pas interférer. 
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Notes personnelles: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Atomistique 


La physique atomique est la partie de la physique qui s'occupe des états quantifiés d'énergie de la 
matière corpusculaire et ondulatoire et des échanges d'énergies au sein de l'atome (Larousse). 


41. PHYSIQUE QUANTIQUE CORPUSCULAIRE 


V oici venu le moment de nous plonger dans les eaux obscures et impénétrables de la physique 


atomique. 


Il va de soi que ne nous parcourrons les théories de la physique atomique que dans les grandes lignes. 
Nous passerons ainsi sur beaucoup de détails mathématiques qui auront déjà été démontrés et vérifiés 
dans d'autres chapitres du site. 


La physique atomique comme vous le savez déjà certainement est le monde de l'infiniment petit (points 
de dimension nulle). C'est un monde, vous le verrez, assez particulier où les lois classiques, celles qui 
gouvernent notre quotidien macroscopique, ne s'appliquent pas. 


Ainsi, au début du 20ème siècle nous savions uniquement que les atomes étaient formés au plus simple 
par un noyau central et des électrons en orbite. 


L'électron, la première particule subatomique (plus petite que l'atome) à nous être révélée, fut mis en 
évidence par des expériences sur les courants électriques dans les solides, les liquides et les gaz. Au 
19ème siècle, les physiciens n'avaient aucune idée de ce qu'était la charge, si elle était continue ou 
particulaire. Aujourd'hui, nous savons que la charge est une propriété de la matière et que la charge 
totale dans un système est toujours un multiple d'une charge élémentaire correspondant à la charge d'un 
électron (ou d'un proton). 


Michael Faraday suggéra par des expériences d'électrolyse que l'électricité était composée de particules 
de charge e et qu'une mole de ces charges (voir la section de Chimie pour la définition de la mole) était 
équivalente à une charge de 1 Faraday soit 96485 [CT]. Comme le nombre d'Avogadro n'était pas connu 
à l'époque, il n'était pas possible de déterminer e. Cependant, une mole d'une substance monovalente 
pouvant transporter 1 [F] de charge, il devait s'ensuivre qu'une demi-mole de la même substance devait 
transporter 1/2 [F] et ainsi de suite jusqu'à la plus petite unité de charge e, qui devait être transportée 
par la plus petite unité de masse m, correspondant à la masse d'un seul atome de cette substance. En 
1881, Helmholtz affirma que si on acceptait l'hypothèse que les substances élémentaires étaient 
composées d'atomes, nous devions logiquement en déduire que l'électricité, tant positive que négative, 
devait être divisée en portions finies qui devaient se comporter comme des atomes d'électricité. Stoney 
nomma cette unité fondamentale de charge "électron". La valeur élémentaire de charge se nomme 
aujourd'hui prosaïquement le "quantum de charge". 


Toutes les charges subatomiques connues aujourd'hui qu'elles soient positives ou négatives, transportent 
une charge nette qui est un multiple entier de e. Les quarks ont eux une charge fractionnaire mais ils 
n'apparaissent pas comme entités isolées. Il existe également des charges fractionnaires dans l'effet Hall 
quantique mais cela est une toute autre histoire. 


Encore aujourd'hui, les meilleurs physiciens disent ne pas vraiment savoir ce qu'est un électron et même 
un atome. Au fait, on ne sait toujours pas ce qu'est vraiment la matière. 
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Les scientifiques ont tenté l'élaboration de plusieurs modèles pour expliquer les observations obtenues 
de résultats expérimentaux du monde microscopique. Ainsi, il y a eu dans l'ordre les modèles de Dalton, 
Thomson, Rutherford, Bohr, Sommerfeld et Schrüdinger (ce dernier incluant les contributions majeures 
de Heisenberg, De Broglie, Pauli, Dirac et Einstein pour les plus fameux). 


On peut situer la naissance de la physique quantique corpusculaire ou "physique des quanta" 
(‘quantum voulant dire "quantité fixe") en 1900, année où Max Planck présentant son célèbre article 
sur le rayonnement du corps noir (cf. chapitre de Thermodynamique) à une réunion de la société 
allemande de physique et l'incapacité de la physique classique (mécanique, thermodynamique, 
électromagnétisme) tenta d'expliquer certains comportement de la matière au niveau microscopique, 
c'est-à-dire certains phénomènes où interviennent des particules de faibles masses localisées dans de 
très petites régions de l'espace. 


n 0 €" 
DE *QUANTM " ? 
qui EST RELATIF . 
AUX QUANTA ? qua 


no. 
GÉAMPEUÉ auTiFiées ? 


Pour parvenir à donner une interprétation cohérente de ces expériences, il a été nécessaire d'introduire 
des concepts radicalement différents de ceux de la physique classique. Par exemple, on a dû 
abandonner la notion de trajectoire, la quantification de l'énergie (loi de Planck) et considérer que les 
particules microscopiques ont parfois un comportement semblable à une onde. L'ensemble de ces 
nouveaux concepts a donné naissance à une nouvelle physique, la "physique quantique", qui s'est 
développée rapidement puisqu'en 1927, déjà, les fondements de la théorie sont achevés. Par son 
abandon des concepts-clés de la mécanique classique, on peut dire que la physique quantique constitue 
une véritable révolution (on l'appelle par ailleurs la "2ème révolution", la première étant la théorie de la 
relativité) dans notre façon d'interpréter les mesures expérimentales. Avec la relativité introduite par 
Einstein, la physique quantique est un des piliers de l'édifice théorique de la physique contemporaine du 
21ème siècle. 


Tout comme la relativité contient la mécanique classique comme cas limite (les lois relativistes 
approchent les lois classiques lorsque la vitesse d'une particule est suffisamment faible par rapport à 
celle de la lumière), la nouvelle physique quantique contient comme cas limites les lois classiques de la 
mécanique statistique voire même de l'électromagnétisme. 


Remarque: Nous verrons que la constante fondamentale qui caractérise la physique quantique 
(comme la vitesse de la lumière caractérise la relativité) est la constante de Planck. 
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1. MODÈLE DE DALTON 


En 1803, John Dalton fit l'hypothèse que la matière est composée d'atomes de différentes masses et qui 
se combinent en respectant des proportions massiques simples (cependant l'idée d'atome n'était pas 
nouvelle, elle datait de bien bien plus tôt!). C'est cette théorie que Dalton proposa qui est la pierre 
d'angle de la science physique moderne. En 1808, l'oeuvre de Dalton intitulée "Un nouveau système de 
philosophie chimique" fut publié. Dans ce livre, il dressa la liste des masses atomiques d'un certain 
nombre d'éléments connus par rapport à la masse de l'hydrogène. Ses masses "U.M.A" (cf. chapitre de 
Physique Nucléaire) n'étaient pas entièrement correctes, mais elles forment la base de la table 
périodique moderne des éléments. Dalton arriva à sa théorie atomique par une étude des propriétés 
physiques de l'air atmosphérique et des autres gaz. 


Dalton supposa que l'atome était une sphère: 


Figure: 41.1 - L'approche idéale de Dalton 
Ainsi, il put faire une première estimation de la taille des atomes: 


En effet, soit © la densité typique, ##, la masse atomique et R le rayon (valeur inconnue) d'un 


élément dont nous cherchons à déterminer la dimension de l'atome. Nous avons alors très simplement: 


pre =m SR=3 3, Ma Gi 
3 4 0'x7 


Connaissant #, et ©, nous obtenons R = 1:10" [#4]. 


2. MODÈLE DE THOMSON 


Thomson est à l'origine de la découverte de l'électron par ses expérimentations sur les flux de particules 
(électrons) créés par des rayons cathodiques. Théoricien et expérimentateur, Thomson avança en 1898 
la "théorie du pain aux raisins" sur la structure atomique, dans laquelle les électrons sont considérés 
comme des raisins négatifs enfoncés dans un pain de matière positive. Son modèle de l'atome est 
représenté par la figure ci-dessous: 


Figure: 41.2 - L'approche gourmande de Thomson 


Or, nous savons (les physiciens du 19ème le savaient aussi) qu'aucun arrangement de charges 
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électriques statiques n'est stable si ces charges sont sous l'influence de la force de Coulomb: 


e l Q, in. xl ‘(12 
Ras 9 "2... )) 
{2-7 


que nous avions étudiée en détails dans le chapitre d'Électrostatique. Il faut donc que les particules qui 
constituent l'atome soient en mouvement ce qui nous amène à mettre en place un autre modèle: le 
"modèle de Rutherford" suivant: 


3. MODÈLE DE RUTHERFORD 


Rutherford assimila donc intuitivement par cette observation théorique, peu d'années après la 
découverte de Thomson, l'atome à un système planétaire. Représenté comme ci-dessous: 


Figure: 41.3 - L'approche planétaire de Rutherford 


Il appliqua les résultats que nous avons obtenus en astronomie (cf. chapitre d'Astronomie) lors de 
l'étude des orbites képlériennes à l'atome et obtint donc des trajectoires coniques pour la rotation de 
l'électron autour du noyau tel que: 


l+ecos8 
où e est l'excentricité (rapport du petit axe # = cfa < 1) et p le paramètre focal (» = k? ja) d'une 
ellipse (cf. chapitre de Géométrique Analytique) et où: 


ds 2EK? 


Remarques: 


R1. Il faudra se rappeler lorsque nous aborderons plus loin le modèle de Bohr que dans le modèle 
de Rutherford, r peut prendre n'importe quelle valeur théoriquement! 


R2. Nous verrons lors de notre étude de la diffusion de Rutherford (cf. chapitre de Physique 
Nucléaire) que Rutherford détermina la taille de l'atome d'or comme valant À & 3:10-“[»]. Nous 


avons donc un facteur 10000 avec le modèle de Dalton (c'est dire...). 


Or, nous avons vu en électromagnétisme que les équations de déplacement de Maxwell (cf. chapitre 


d'Électrodynamique): 
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d on + = 
U(g =-—E=fE£Eod SVXE=-— (415) 
dt dé 
et: 
QBoaï a ffrod + uret [jFodS & VxA 7 +0 (41.6) 
j 4 


décrivent qu'un électron en mouvement (accélération) émet de l'énergie sous forme de rayonnement 
électromagnétique que nous appelons en physique le "bremstrahlung”" expliqué par les potentiels de 
Liénard-Wiechert (cf. chapitre d'Électrodynamique). 


Rutherford et Thomson se trouvèrent donc confronté au dilemme suivant: 


Si l'électron émet de l'énergie sous forme de rayonnement électromagnétique, il perd donc de l'énergie 
cinétique (vitesse) et finira donc nécessairement un jour ou l'autre (sauf intervention extérieure) par 
tomber sur le noyau (illustration du phénomène dans la figure ci-dessous). Or la matière nous 
environnant est stable. 


Sù 


Figure: 41.4 - Illustration simpliste du bremstrahlung 
Ils rejetèrent donc leur modèle et Bohr intervint à ce moment-là... 
4. MODÈLE DE BOHR 


En 1913, Niels Bohr, qui a participé aux travaux de Rutherford sur la diffusion des particules & 
(noyaux de 2 protons, 2 neutrons libres d'électrons), reprend le modèle de Rutherford mais y inclut trois 
postulats fondamentaux: 


4.1. POSTULATS DE BOHR 


P1. L'électron n'émet pas de rayonnement lorsqu'il se trouve sur certaines orbites dites "orbites 
stationnaires". Cette affirmation est contraire aux théories de l'électrodynamique. Donc ceci implique 
que toutes les orbites ne sont pas autorisées et constitue une véritable révolution dans l'approche de la 


physique. 
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P2. Sur toute orbite stable la quantité de mouvement p intégrée sur le chemin r est un multiple entier de 
la constante de Planck h (postulat découlant du premier) conformément à la quantification des 
échanges d'énergie établis par la relation de Planck. Ce postulat est parfois appelé "hypothèse 
quantique de Planck". 


P3. La relation expérimentale (loi) de Planck: 


E =hv| (417) 


est valable pour l'émission ou l'absorption d'une radiation lors de la transition d'un électron d'un état 
énergétique Æ, ver un état Æ, (postulat qui solidifie le premier postulat). 


Au fait, nous trouvons ici un concept révolutionnaire et indémontrable (aujourd'hui et à notre 
connaissance) qui consiste à quantifier certaines propriétés de la physique. 


Continuons donc notre analyse: 


4.2. QUANTIFICATION 


Soit M la masse du noyau central de charge électrique +e et m la masse de l'électron en "orbite". Nous 
faisons l'hypothèse que Af >> »# et que la masse centrale est immobile (ce qui est évidemment faux 
dans la réalité). 


Nous assimilons le mouvement circulaire de l'électron autour du noyau à celui d'un oscillateur 
harmonique (masse reliée à un ressort exerçant une force opposée proportionnelle à une constante de 
rappel &, afin de retenir l'objet lié). 

Si l'oscillation a lieu dans un plan, son équation différentielle est (cf. chapitre de Mécanique Classique): 


LR (41.8) 
dË dË 


Une solution (particulière) de cette équation (cf. chapitre de Calcul Différentiel Et Intégral) est: 
x = Asin(@f) (419) 
L'énergie cinétique du système étant donnée dès lors par: 
2 
d 1 | 

E = ;() = GA" ap cos” (@f) (41.10) 
et l'énergie potentielle du système par (cf. chapitre de Mécanique Ondulatoire): 

1 

E,=_-kx = Ga A° sin? (af) (41.11) 


Si nous notons v la fréquence d'oscillation du mouvement oscillatoire, nous avons alors bien 
évidemment (cf. chapitre de Mécanique Ondulatoire): 


& = 2AV (41.12) 
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L'énergie totale du système s'écrit finalement après sommation et simplification (trigonométrie 
élémentaire): 


E=27mA°v (4113) 


Nous admettons maintenant que l'électron lié ne peut occuper que certains niveaux d'énergie (premier 
postulat) selon la loi de Planck: 


ÆE=nE=nhv (41.14) 


Ce qui nous donne lorsque nous incluons la loi de Planck dans l'avant-dernière relation: 


A =n 


: (41.15) 
27 mv 
Nous remarquons ici que puisque l'énergie de l'électron est quantifiée l'amplitude de son mouvement 
l'est également. 


Soit à présent l'intégrale de chemin suivante (attention la notation ambiguë entre la fréquence et la 
vitesse peut porter à confusion) dite également "intégrale d'action" (il s'agit au fait du moment 
cinétique): 


Par =prrvar = gr à =prrv'dt (41.16) 


et compte tenu de l'expression de la vitesse obtenue auparavant: 
par = gra a cos? (@t}dt = mA @ cos” (@t)dt (4117) 


Sur une période de révolution, nous avons: 


Tr 


gicos’ (at)dt = Per (@hf)dt (41.18) 
Étant donné que (cf. chapitre de Trigonométrie): 


(41.19) 


cos? (hé) = at l RE 


L'intégration devient: 


T 


T 
ss (at)dt = fe + cos(2@f)]dt = 1 + sea | (41.20) 


comme æ = 27/7 (cf. chapitre de Mécanique Ondulatoire) nous avons: 


T 


er (a t}dt = + = (2er) 0] = ST (41.21) 
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Nous obtenons donc finalement: 


par - smAteiT (41.22) 


Compte tenu que 4? = x . &, = 27v ainsi que y = 1/7: 
27 my 
Î 2 2 1 #i 2 1 : 
dr = = mA TT = mn] —— |47 y = = 7h (41.23 
\ Sd 2 Fa fr) k v É | 


Finalement: 


grar = xh| (41.24) 


Cette condition imposée par Bohr (2ème postulat) résulte de la quantification des échanges d'énergie 
(loi de Planck). Ce qui a pour conséquence d'imposer des niveaux stationnaires d'énergie que l'électron 
peut occuper autour du noyau. 


Pour une orbite circulaire (rappelez-vous bien que nous considérons pour l'instant une orbite 
circulaire!) de rayon r le moment cinétique (oui l'intégrale d'action n'est au fait que le moment 
cinétique) sur la longueur de l'orbitale est donc: 


pal = pv Dr = nh = mvr nn =xh (41.25) 
FT 


ou bien en utilisant la notation traditionnelle du moment cinétique: 


b = avr = x#h| (41.26) 


Le moment cinétique est donc quantifié! 


4.3. MODÈLE DES ATOMES HYDROGÉNOÏDES SANS ENTRAÎNEMENT 


Nous entendons par l'étude des "atomes hydrogénoïdes sans entraînement" le fait de considérer des 
atomes avec un unique électron de masse m en rotation autour d'un noyau central de charge Z 2 et de 
masse M tel que Àf >>» (donc le noyau est supposé fixe). 


Calculons les rayons des orbites stationnaires: 


Sur son orbite stationnaire, l'électron est en équilibre car il y a un antagonisme exact entre la force 
coulombienne et la force centrifuge. Ceci doit se traduire par l'égalité des forces suivante: 


2 2 ENS 
Ze AC r) 


Le 2 , 
>Mm—= =m@"r (41.27) 
AE r r 


r 


Nous posons à partir de maintenant (afin d'alléger l'écriture) que: 


1 
x = (41.28) 
ÂTE, 
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Ce qui nous permet d'écrire la relation: 


2 


Lcd) 


ar =X (41.29) 


En recourant à la condition de quantification de Bohr et en élevant au carré: 


À #k? 
mor =nh=n—e &@r'=7? (41.30) 
27 mi 
En divisant les deux dernières relations l'une par l'autre: 
x h° 
dr _ 4m 
nr Su (41.31) 
pe e 
k = 
ma 
nous obtenons: 
23,2 2 
r = LL = x? Eh (41.32) 
k Ar m£e* rmLle 


compte tenu de l'expression de k. 


Le rayon des orbites autorisées pour l'électron est donc: 


rm£e? 


(41.33) 


avec #e N *et cette relation est communément appelée le "rayon de Bohr" pour # = Z =1. 
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Les orbites d'un atome selon ce modèle ressemblent donc à: 


Figure: 41.5 - Le modèle planaire de Bohr 


L'énergie de l'atome hydrogénoïde sans entraînement est donnée par la mécanique classique (cas d'une 
force centrale), somme de l'énergie cinétique et potentielle électrostatique: 


2 


E, = ler -kÆ (4139 
2 Fr 
Avec: 
Ze? 2 
> =Mm@r (4135) 
AE r 
il vient: 
2 2 2 2 
E, = Loin ee mn 2e 2 LL 36) 
2 Fr 2 pr Fr à + 


En y introduisant l'expression du rayon quantifié obtenu précédemment: 


__ 1,Ze 1 Ze  _ ml'et 
em à 
rm£e? 


Nous trouvons donc que l'énergie totale de l'atome considéré est quantifiée et négative (ce qui 
correspond à des états stables car il faut un apport de l'énergie pour les défaire) telle que: 


x __ 1 me 
tot 
° n° 8° 


(41.38) 
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Entre deux niveaux, le passage d'un électron du niveau #, vers un niveau #, (nous préciserons 


comment lors de l'étude de l'effet photoélectrique plus loin) se traduit par l'émission d'une raie de 
fréquence donnée par l'expression de l'hypothèse de quantification de Planck: 
#2 xl _ 

EE, _ Ë,, 5 hVam 
En fait, si nous admettons avec Bohr que les énergies d'un électron sur son orbite sont données par 
l'inverse du carré du nombre entier, la différence d'énergie entre deux orbites caractérisées par de 
grandes valeurs de ces nombres entiers tend vers zéro lorsque les nombres entiers tendent vers l'infini. 
Nous retrouvons alors un semblant de variation continue pour les énergies échangées par un atome 
avec le champ électromagnétique et la notion de trajectoire d'un électron prend alors à nouveau du 
sens. 


En faisant appel à l'expression complète de l'énergie totale, nous trouvons alors la fréquence 
correspondante à la raie émise: 


VE NE 
8h [x # 


_ 72 
Vaaxl £ 


la longueur d'onde émise s'en déduit aisément: 


d 
À 


4 
met (1 1) mg (121 


T0 100 3 
8h c HA #3 M 7% 


= 71 


La constante R;; (notée aussi À, selon les situations) est appelée la "constante de Rydberg". 


Un électron qui occupe une orbite n est dans un "état stationnaire" si son énergie ne varie pas. En 
revanche, une transition directe #, — x, (x, < x,) s'accompagne de l'émission d'un photon dont 


l'énergie est donnée par le calcul de la fréquence comme nous allons le démontrer. 


"L'énergie d'ionisation" est l'énergie qu'il faut fournir pour éloigner l'électron à l'infini de son orbite. 
Ainsi pour l'état fondamental de l'hydrogène, il faudrait poser #, = 1 et x, = +. 


Le résultat obtenu par Bohr pour l'expression de la fréquence en fonction des niveaux d'énergie de 
l'électron est un résultat formidable car le chimiste Balmer avait en 1885 (28 ans auparavant) découvert 
expérimentalement que le spectre des raies de l'hydrogène suivait aussi cette loi. 


Balmer avait remarqué que les raies spectrales étaient extrêmement fines. Cela laissait supposer que 
l'énergie n'était pas émise par les atomes d'une manière continue mais seulement à certaines fréquences 
bien précises. En outre, cette finesse des raies explique la précision avec laquelle il avait pu déterminer 
la constante de Rydberg. 


Les chimistes avaient également constaté que chaque élément atomique possédait son propre spectre. Il 
était dès lors clair que toute théorie atomique devrait rendre compte de ces 2 caractéristiques et c'est ce 
que fit brillamment le modèle de Bohr à l'aide des postulats des niveaux d'énergies. 


Nous définissons les séries suivantes du spectre de l'atome d'hydrogène: 
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- Pour la série avec x, = 1 et #, = 2,3,4,... on obtient le résultat des mesures effectuées (le spectre) par 
Lyman en 1906 dans l'UV. 


- Pour la série avec x, = 2 et #, = 3,4,5,... on obtient le résultat des mesures effectuées (le spectre) 
par Balmer en 1885 dans le visible. 


- Pour la série avec x, = 3 et #, = 4,5,6... on obtient le résultat des mesures effectuées (le spectre) par 
Paschen en 1908 dans l'infrarouge. 


- Pour la série avec #, = 4 et x, = 5,6, 7... on obtient le résultat des mesures effectuées (le spectre) par 
Brackett en 1928 dans l'infrarouge. 


- Pour la série avec x, =5 et #, = 6,7,8... on obtient le résultat des mesures effectuées (le spectre) par 
Pfund en 1924 dans l'infrarouge. 


+ 


LE 


", 1. Lyman series: ni, = 1, n3 = 2,3,4,... 
2. Balmer series: on, = 2, n3 = 3, 4,.. 


“fi 3. Paschen series: n, = 3,n3 = 4, ui 
5 4. Brackett series: n; = 4, n3 = 5,6,... 
L<l: 5. Pfund series: M = j,ns = 6,7,... 
£||É 
2115 
É & 
5 
È 
1 
[ 
[ 


- 13.60 


Figure: 41.6 - Quelques séries spectrales 


Les quatre raies principales de la "série de Balmer" (visible) sont les plus connues: 
À [A]: H,, = 6563, H, = 4861, 4, = 4341, 4, 24102 (4142) 


Cependant une petite différence subsistait entre la constante de Rydberg théorique et pratique (connue 
avec très grande précision). Ceci va conduire à complexifier le modèle: 
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4.4. MODÈLE DES ATOMES HYDROGÉNOÏDES AVEC ENTRAÎNEMENT 


Le noyau de l'atome possède une masse M que nous avons supposée immobile par simplification. En 
réalité l'ensemble noyau (M) et électron (m) tourne autour d'un centre de masse commun 
(évidemment!). 


Hypothèses: 
H1. L'atome hydrogénoïde est considéré comme un système isolé. 


H2. Le noyau et l'électron gravitent chacun sur une orbite circulaire autour d'un centre commun: le 
"centre de masse" (cf. chapitre de Mécanique Classique). 


H35. Ils ont même vitesse angulaire. 


L'atome hydrogénoïde étant un système isolé, le mouvement du centre de masse est soit en mouvement 
rectiligne et uniforme soit au repos. Il est donc licite d'y placer un système de repère inertiel. 


M CM 


Figure: 41.7 - Mise en situation de l'atome hydrogénoïde 


La définition du centre de masse dans un système de laboratoire est donnée par le théorème du centre 
de masse (cf. chapitre de Mécanique Classique): 


mA + 
FAR 4145) 


re Ne, 


L'étude présente sera effectuée par rapport au centre de masse, la relation précédente devient donc (cf. 
chapitre de Mécanique Classique): 


Mr, + mr, = 0 (41.44) 


De la relation précédente, en prenant la norme et la valeur absolue, il vient que: 


La distance entre le noyau et l'électron demeurant constante et égalant > = 7,, +7, nous écrivons: 


FA 22) M + on 
r=—r tr = 1 + — PE e La (41.46) 
(ei) 


Nous en déduisons trivialement que: 
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FR 


M 
= r et ry = r (41.47) 
+3 M + 


En appliquant la loi de la dynamique, nous écrivons que la somme des forces sollicitantes 
(électrostatique et centrifuge) de l'électron (uniquement) s'équilibre telle que: 


Ze? 
LE = mr. (41.48) 
r° s 


que nous pouvons écrire en isolant g : 


à kZe° kZe? 1 kZe? 
al Fr mi gr” (41.49) 
Lea Fr 
m + M m + M 


Nous retrouvons l'expression de la masse réduite bien connue dans un système à deux corps: 


: mi L._m 
41.50 
m+M Ru 
M 


Attaquons-nous maintenant à la détermination de l'énergie totale de l'atome: 


L'énergie cinétique de l'atome est la somme des énergies cinétiques du noyau (N) et de l'électron (e) 
telle que: 


E = mt + M (41.51) 


Comme v = &r avec comme hypothèse que la pulsation est identique pour le noyau et l'électron: 
2 


E,= mr? + Mrè) (41.52) 


Avec les relations des différents rayons déterminées précédemment: 


ar? M° me er? ln? + Mn? 
E = a ——— + M —"——| = — 
2 (en + MY (re + pi 2 (nm + MY 
(41.53) 
ar? #4 | 
2 Es + MY (a pl-4Ë 


et connaissant l'expression du carré de la pulsation: 


2 
= F 2 (41.54) 
E,= {4 sai _ Ze . 
F. 2. .t 


Par ailleurs, de l'avant-dernier développement nous tirons une relation dont nous allons faire usage plus 


loin: 
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CRE 2 
hr dit +Mry|= 4 


mr? 


= (ri + Mr = jar? (41.55) 


L'énergie potentielle de l'électron par rapport au centre de masse étant donnée par (cf. chapitre 
d'Électrostatique): 


E. =- (41.56) 


Par rapport au centre de masse, le moment cinétique total est la somme des moments cinétiques de 
l'électron à, et du noyau à,, (rappelons que le moment cinétique est aussi souvent noté par la lettre L). 


b, = 2, tb =m,r, + Mr = @or2 + Mr) (41.58) 
La parenthèse de la dernière égalité a déjà fait l'objet d'un calcul précédemment et nous avons donc: 
by = H@r? (41.59) 
c'est ici que Bobhr introduit sa condition de quantification: 
D, = H@r? =xh (41.60) 


or, nous connaissons l'expression détaillée du carré de la pulsation: 


kZe° 
be, = or = 4| - | =}7h? (4161) 
ur 


Le rayon quantifié a donc pour expression: 


2 
E. À 


= (41.62) 
AuiZe 


L'énergie totale de l'atome devient finalement: 


x L_k Ze __1uZ'et __1mZ'e| 1 | 
M 2er msn nel m| 
rue M 


Soit de manière condensée: 
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1 


1 
En, =-—hcz"Ry (41.64) 
À F7 
1+ — 
M 


À partir de cette dernière relation, nous pouvons déterminer facilement l'expression (comment nous 
l'avons déjà fait) des longueurs d'ondes émises par une désexcitation de l'électron d'une orbite #, à x, 


.Calculons au même titre que nous l'avons fait pour le modèle sans entrainement, l'expression de la 
longueur d'onde émise lors du passage d'un niveau à l'autre. Nous faisons alors des développements 
identiques: 


#2 xl _ _ 
y _ £, = RVaa a (41.65) 


Il vient alors: 


l l 1 Er 
Von = fetes = (41.66) 


#1] #2 li 
la longueur d'onde émise s'en déduit aisément: 
l'zr, / | (41.67) 
À + MA # 


Remarque: Il convient bien évidemment de rendre compte que ce modèle est plus précis que le 
précédent. 


4.5. HYPOTHÈSE DU NEUTRON 


Les résultats de spectroscopie sont connus avec très grande précision, par conséquent les constantes de 
Rydberg également (car dépendante de la masse de l'élément atomique étudié). 


Les deux raies bleues mesurées de la série de Balmer de l'hydrogène noté H (4,, = 4861.3 [4] composé 


d'un proton et d'un électron) et du deutérium D (isotope de l'hydrogène composé d'un neutron en plus) 
présentent une différence de longueur d'onde de A4 = 1.32 [4] Angstrôm. 


La longueur d'onde appartenant à la série de Balmer s'exprime dès lors (avec la correction du centre de 
masse vue précédemment) comme: 


1 1 1 D 
8 (z z]r4- 1 1 + (41.68) 
LE: 


Cette dernière expression écrite successivement pour l'hydrogène et le deutérium mène à: 
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F2 F2 
A» =|l….l'fit+t—Ttlet 4, =|...l'11+——]| (4169) 


où nous rappelons que la masse de l'électron nous est connue! Ce qui est intéressant c'est que ces deux 
éléments ont des propriétés chimiques identiques (hydrogène et deutérium) mais des raies différentes. 
Les scientifiques de l'époque se demandaient pourquoi et après que le modèle de Bohr de l'atome 
hydrogénoïde avec entraînement soit à leur disposition ils ont pu conclure que cette différence dans les 
raies venait de la différence de la masse du noyau de l'atome. 


Encore fallait-il déterminer cette différence de masse et expliquer sa provenance! 


Nous avons donc: 


24 _ = Âo He) (a) Re 
Âg 


A L 1-2] 1+1836.5 | 
(41.70) 
= Mu 
M M M 
nn 1 js Un ssh) 
An 1+18365 48613 My M 


ce qui montra aux scientifiques de l'époque que le noyau de deutérium est formé de 2 particules de 
masse équivalente à celle du proton. Donc par déduction logique, ce noyau se doit d'être composé d'un 
proton (ce que l'on sait évidemment!) et d'une particule neutre. 


Cette hypothèse est celle du "neutron", qui fut découvert ultérieurement de manière expérimentale en 
1932 par Chadwick. 


5. MODÈLE DE SOMMERFELD ET WILSON 


Pour élaborer leur modèle, Sommerfeld et Wilson firent appel à la dynamique classique pour généraliser 
le modèle de Bohr à des orbites de type képlérien (donc non uniquement circulaires mais elliptiques 
dans le cas général). 


Comme nous l'avons vu plus haut, dans le cas d'un système à deux corps sollicités par une force 
centrale, l'énergie totale du système est (nous négligeons l'énergie potentielle gravitationnelle): 


2 
2] =}%nÆ£ (41.71) 
FRT 


Pour trouver l'expression de la trajectoire de la masse m, nous allons procéder exactement de la même 
manière que celle utilisée en astronomie (cf. chapitre d'Astronomie) pour déterminer les orbites 
képlériennes. 


Ainsi, nous avons démontré dans le chapitre d'Astronomie que: 


2 . 
r(8) = —À | (41.72) 
l+ecos 8 
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avec: 
, d8Ÿ 
Fr —— 
_K? | x] et 
d Li Gr 


Il va sans dire que dans notre cas, ilne s'agit plus d'un potentiel gravitationnel mais électrique. Ce qui 
nous amène à écrire pour notre problème: 


Encore nous reste-t-il à trouver l'expression de K sous forme quantifiée (selon les postulats de Bohr). 
Attaquons-nous d'abord à déterminer l'expression du paramètre focal p de la trajectoire: 


Dans notre problème actuel, l'énergie cinétique et potentielle exprimées en coordonnées polaires 
donnent (cf. chapitre de Calcul Vectoriel): 


NT ; Ze? 
Es EL +r28?) et En” k—— (41.75) 
L'énergie totale de l'atome est donc donnée par: 
2 
E, = à +r18) 2e (41.76) 
g 


De façon identique à celle de Bohr, Sommerfeld et Wilson appliquèrent la même forme de 
quantification pour le rayon-vecteur et l'étendirent à la quantification pour l'angle azimutal. 


Soit les moments cinétiques: 
b = ÿr,dr = x,h et b, = ÿr,d8 =,h (41.77) 


Les quantités de mouvement s'obtiennent par dérivation du lagrangien par rapport aux coordonnées 
généralisées puisque (cf. chapitre de Mécanique Analytique): 


2 
P; - “bn +726 ]-n 
r 


dr ôr 
: (41.78) 
PELLE dti tee = »nr°8 
48 àa812 (2 


La quantification sur l'angle est immédiate, puisque », est une constante du mouvement. 
Effectivement, le lagrangien L étant indépendant de 8 (mais pas de 9), l'invariance du moment 
cinétique se traduit par l'équation de Lagrange: 


Fetes =0e p, =c* (41.79) 


dt 88 
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Ce qui nous donne: 


ÿr,d8 - P, 48 =p,2r=n,h—>p,=n,h (4180) 


avec x, € N° étant le "nombre quantique azimutal", pour rappeler qu'il est lié à la quantification de 
l'angle polaire. 


De cette dernière relation nous obtenons aussi: 


- h 
pe 2h = mr?8 & de = he (41.81) 
dt er 


Revenons maintenant à: 


: 48 
: = 
p= LS (41.82) 
Li KkZe° 
ma 
ce qui nous donne: 
24h | 
_. 2 
Fr 2 k : : 
: = à (41.83) 
PU ue "ire 
mi 


Attaquons-nous maintenant à déterminer l'excentricité e de la trajectoire (à ne pas confondre avec la 
notation de la charge électrique si possible!). 


Ce qui nous donne: 


o= he 2gere hs 2 Euh [25h 
Ps Ze \m m° mk°Z?e*t (4184) 
m? 


Pour déterminer la quantification du moment cinétique par rapport à la variable radiale, nous allons 
nous servir d'une substitution: 


Pp,dr - rardr =x,h (41.85) 


En notant simplement r' la dérivée 4r j 48, l'intégrale s'écrit: 


23 à 


2x 
drrrdr - [mr dE = p, [de (41.86) 
Fr 


où nous avons utilisé 8 = p, {{#r*) comme nous l'avons déjà démontré. 
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En reportant: 


P 
r(D = (4187) 
@) l+ecos 8 


dans l'intégrale du moment cinétique radial, nous obtenons (simple à obtenir): 


1 
b, =x,h = | - ir. (41.88) 
1-2 


d'où nous déduisons compte tenu de p, = x,h que: 


#,h = | 


1 
———— —]|x,h (41.89) 
J1-e L 


ce qui nous amène à: 


: 1 
2 
#3 TA, (41.90) 
#8 
et donc: 
1- 1 à 2E,, ni 
PR, À FR eg (41.91) 
#4 


Après quelques simplifications élémentaires nous obtenons finalement: 


: - mZ°e* 


EE, = | (4192) 
8h (mn +2) 


où #,, appelé également "nombre quantique radial" peut lui être nul! Car c'est le cas si > =0 , c'est- 
à-dire si la trajectoire est un cercle (cas particulier de Bohr). 


Nous introduisons alors un entier n appelé "nombre quantique principal" tel que: 


ZA +tAn,| (41.93) 


avec xe N°: 


Sommerfeld et Wilson montrent par-là que les orbitales du modèle de Bohr doivent pouvoir être 
déterminées par ces deux nouveaux nombres quantiques: 


Exemple: 


Pour # = 2 nous avons deux sous-orbitales possibles: 
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HDi n -{ 


el 
2 =2+0 


La valeur x, = 0 est impossible par définition car cela signifierait que le petit axe est nul (ellipse 


dégénérée en une droite) et l'électron ne peut traverser le noyau (dans le modèle classique en tout cas). 
Donc la plus petite valeur entière de #, possible est 1. 


Il y a donc alors n orbites donnant le même terme spectral. Autrement dit, il y a n fois la même 
quantification d'énergie. Nous disons également que le niveau d'énergie (total) Æ, est "n fois dégénéré". 


L'idée de Sommerfeld était de rendre compte de la richesse des spectres observés. De ce point de vue, 
les résultats sont décevants: la quantification de tous les degrés de liberté fait bien apparaître plus 
d'états (il faut maintenant deux nombres quantiques pour spécifier complètement l'état, alors que le 
modèle de Bohr n'en considère qu'un) mais le degré supplémentaire ne fait qu'introduire une 
dégénérescence en énergie. 


Pour résumer ce modèle, il y a donc exactement le même nombre de niveaux d'énergie et donc le même 
nombre de transitions d'états énergétiques possibles que celui de Bohr. Du point de vue spectral, la 
théorie de Sommerfeld-Wilson n'apporte rien de plus que celle de Bohr mis à part que les orbites sont 
elliptiques et n'explique donc pas l'étendue des spectres observés. 


Au fait, l'idée à partir de maintenant va être de reprendre le même modèle en y ajoutant les corrections 
relativistes. Le travail va nécessairement être plus long mais Ô combien fructueux! 


6. MODÈLE RELATIVISTE DE SOMMERFELD 


Cependant, le modèle de Sommerfeld et Wilson peut être considéré comme incomplet si nous ne 
prenons pas en compte les variations de paramètres qu'engendrent les résultats de la théorie de la 
relativité restreinte (( itré Ca viste). 


Remarque: Le chapitre Physique Quantique Relativiste est réservé uniquement à l'étude de la 
physique quantique probabiliste basée sur la version relativiste de l'équation de Schrôdinger (donc 
en toute rigueur le chapitre de Physique Quantique Relativiste devrait se nommer "Physique 
Quantique Relativiste Ondulatoire"). Raison pour laquelle il nous a semblé plus judicieux de mettre 
un modèle corpusculaire, déterministe et relativiste (à l'opposé d'un modèle ondulatoire, probabiliste 
et relativiste) comme celui que nous allons étudier maintenant dans le chapitre de Physique 
Quantique Corpusculaire. 
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Effectivement, comme nous l'avons démontré dans le développement du modèle de Bohr, l'énergie 
cinétique de l'électron est donnée par: 


: 1. 2m 
En =—Hmv = 37 (4195) 
2 8an°h 
ce qui nous donne: 
Ze? | 
v= (41.96) 
25h 


Pour l'hydrogène et le niveau # = 1, nous trouvons v = 2.19:109 [#:::1] et comme facteur de 
Michelson-Morley (cf. chapitre de Relativité Restreinte): 


(VT-Fi) = 1.00002667 (41.97) 


avec: 
B=vie (41.98) 

Ce que le lecteur pourra vérifier avec la version française de MS Excel: 

=1/RACINE(1-(1*(1.60217656E-19)2/(2*8.854187E-12*1*6.62068E-34))"2/(299792458)/2) 


Certes, la variation est faible mais les valeurs de spectrométrie étaient tellement précises qu'il fallait 
introduire la relativité restreinte pour prendre en compte ces infimes variations et ainsi valider la théorie 
par l'expérience. 


Remarque: Comme nous pouvons le voir facilement, la relation montre que plus la particule est 
éloignée du noyau (n grand) plus sa vitesse est faible. Ce résultat a été confirmé expérimentalement 
en remplaçant l'électron artificiellement par un muon et les scientifiques ont ainsi remarqué que la 
durée de vie de ce dernier augmentait faiblement en fonction de la valeur de n. 


Déterminons dans l'ordre des choses, l'expression des conditions de quantification avec les facteurs 
relativistes. Avant de commencer, il est important de comprendre que nous considérons le noyau 
comme fixe et comme référentiel de notre système. Ainsi, par rapport à ce référentiel la masse de 
l'électron subit une variation relativiste mais non le potentiel électrique (il faudrait prendre en compte la 
variation de ce dernier si et seulement si le référentiel était l'électron lui-même). 


En dynamique relativiste (cf. chapitre de Relativité Restreinte), nous avons démontré que l'énergie 
cinétique (sous forme de notation Lagrangienne avec "T"' au lieu de Æ,) s'exprime sous la forme: 


T=mc -mc? = mc (1-.f-#) (41.99) 


L'énergie potentielle (sous forme de notation Lagrangienne avec "V" au lieu de Æ,,) ne subissant pas de 


variation relativiste, nous avons toujours: 
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W=-X" (41100) 


Le lagrangien est donc: 


L=T-V = mc? h- +42 (41.101) 


Fr 

En travaillant en coordonnées polaires, dans lesquelles la vitesse a pour expression: 
vw =#2+r28? (41.102) 

Dès lors: 


2 , 22 
+ 
B= (vice) = _ 2 ê (41.103) 
€ 


Les conditions de quantification de Sommerfeld étant: 
b, “gp, dr =n,h 
-Ÿ P,d8=n,h 
(41.104) 


À présent, nous devons rechercher des expressions relativistes pour p, et p,. 


Commençons par p, : 


d£ à Ze? 
= 2(1—-,/1-82)+&— | (41.105) 
pre Le A-6?) 2 
avec: 


1 
8= = 2+r26?) (41.106) 


Soit: 


near eme lemtléo-e 


dr 
ce 14 2 13 F2 2F 
=———y—=— + r282 —_— 
ET c? ôr c? si ES c2 


(41.107) 
à 

_ 1-82 -_- 
A EE 

Ce qui donne: 


2F Lies mr 
nef} (1-6) :]|(-{ he << (41108) 
21175) 3c2 (1-82)2 
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Comme: 
2 
—k— =Û0 (41109) 
Fr 


nous avons finalement: 


Ar 


pre 
(#3 


(41.110) 


La première condition de quantification s'écrit donc: 


ee Ÿp,dr a ÿ—— à =, h (41.111) 


EP 


Pour p,: 


toujours avec: 


11 


Ê=— 


( :2 +r26?) (41.113) 


G 


Soit: 


a UE ns FUN LEE 


38 
À | j à 7 (41.114) 
pig = ge (je page) =-27 
sé ) 36° c* rl ) c? 
Ce qui donne: 
1 1  2r28 mr? 
me 2028) er |- T (41115) 
(1-8): 
Comme: 
2 
DRE (41.116) 
Fr 
nous avons finalement: 
mr? 8 
Poe —T (41117) 


Es 
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La seconde condition de quantification s'écrit donc: 


D PT i-# rd8 =n,h) (41.118) 


En résumé, les conditions de quantification de l'atome relativiste de Sommerfeld sont: 
mr mr? 8 
è, = D — dr =n,h tb, -ÿ— 48 “29h (41.119) 
(-82)3 (-81)5 


Nous pourrions, en voyant les deux résultats ci-dessus, conclure un peu trop rapidement en pensant 
qu'il aurait suffi finalement de multiplier les deux conditions de quantification par le facteur de 
Michelson-Morley relativement à la transformation relativiste de la masse. Or, un tel raccourci est 
complètement faux et tout sauf rigoureux ! Effectivement, si vous appliquez un tel raisonnement, il 
suffirait alors de prendre l'expression de l'énergie totale du modèle non relativiste de Sommerfeld- 
Wilson et d'introduire partout où la masse se situe le facteur de Michelson-Morley. Pourtant, le résultat 
final n'a absolument rien de commun avec le résultat que nous allons obtenir plus loin. Il faut donc 
toujours être prudent et travailler comme le mathématicien sans brûler les étapes ! 


L'énergie totale relativiste de l'atome (somme de l'énergie cinétique, de l'énergie de masse et de l'énergie 
potentielle du champ électrique pour l'ensemble de l'atome) est donnée par: 


mme? Ze 


Eng —— —. (41.120) 
(473 


Effectivement, en utilisant la notation du chapitre de Relativité Restreinte: 


2 2 2 2 
Est = En + En + Evot = + 0e? + RE | | 00) 2 | Gr 


€ 
= E r r f, : Fa r 


Or, dans le cadre de l'étude de la physique quantique corpusculaire, il est (malheureusement) d'usage de 
noter la masse au repos avec le symbole de la masse relativiste tel que: 


M = (41.122) 


Donc: 
FRAC 
Et = tk — | (41123) 


Il nous faut exprimer cette énergie totale en fonction des conditions de quantification. Il y a un long 
travail mathématique à effectuer mais indispensable pour arriver au résultat de notre étude. 


Soit le calcul de l'expression: 
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2 

Po +p 2 (41.124) 
2 r 

F 


avec: 


mr? 8 _Omr 
Pa ——75 et Pr TT (41.125) 
(WE (82) 
En élevant au carré: 
2A 2 2 2 2 2 
mr 28 Ps mr mm? F2 
Pe n 


a ls 41.126) 
ee À OLA CPR 


Donc: 
2 2 ,2 92 2 :2 2f;2 2fA 2,2 
PR PE APN LS A 
r2 1-8 1-8 1-62 1-82 


Nous ajoutons des deux côtés de l'égalité »#° «2 (dans l'idée d'y inclure l'énergie de masse comme vous 
allez le voir quelques lignes plus loin), ce qui donne: 


v? 
1 2 2 m°? —c? 
m°ce2+—+p; =m €? + ; = n° ç2+—€ 
1-6 1-6 (41.128) 
m'c?(1-82)+m°8e2 m°e? 
1-82? 1-8? 
En multipliant des deux côtés par 2 il vient: 
| p? : mt 
CRM tp, |me—— (41129) 
Fe 1-8 
En extrayant la racine carrée: 
(41.130) 


(41.131) 


Maintenant, il nous reste à déterminer les expressions de x, et x, en fonction de p, et p,. 
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L'intégrale de quantification de l'angle azimutal est immédiate: 


mr? 9 22 mr28 mr?9 1 27rmr8 
Be D =—7"1,h (41132) 


by =Q— 548 = Rene re 
(1-87)3 (-#)3  (-493 (-#°)3 


Soit: 


mar? 8 


(-#)5 


=Pa=nh (41.133) 


L'intégrale de quantification du rayon-vecteur nécessite un développement plus conséquent: 


mr 
—— 7 dr =n, À (41.134) 


(1-4°)3 
Ensuite, viennent de longs et joyeux développements mathématiques: 


En reprenant l'expression de l'énergie totale: 


(41.135) 


Nous obtenons: 


(41.136) 


En élevant au carré et en faisant quelques transformations: 


2 2 
&Z e? 


(41.137) 


- En ,K22e +98 ke — m2 ç2 Ps 


c? c?r? ce pr r? 


2 
= (me) HE 49 Bo KZe _Pe 


c?r? cr r? 
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En travaillant sur le terme entre parenthèses, on le posera égal à À tel que 


E, 
A= A y? c2 (41.138) 
Le 


En ajoutant et en retranchant 2 Æ,,»# et en décomposant le terme -»#7°c? en m°e?-2m"e? et 
ensuite en les regroupant: 


À _ =, 
c? 


+2E,,m-2E,,m +[m ce -2m°e2] 


2 
fe 2 + T [2 Eee -2m° Ca 


(41.139) 
EE -2E,m° +m°c* 1 _ 
CNRS RS + [28 -2m° c°] - 
2 
CE eme) 


Nous posons en vue de la simplification des calculs (pour alléger le nombre de termes à manipuler) 


E'=EÆ,,-mx? (41140) 


Nous obtenons ainsi: 


£"? 
A=— +2mÆ8" (41.141) 
ce? 


En mettant #:° «2 en évidence, nous avons: 


m C 


A=m° ce? 2 ) (41.142) 


En ajoutant et en retranchant 1 dans la parenthèse 


2 
s-me|| # Es] ns 2) —1] (41.143) 
Le) ce RC 


En travaillant, à présent, sur les trois derniers termes 


2 
2 2 
RZ?e* +9 Bot kZe Ps (41.144 
etrè e? pr rè 


Comme £,, = E'+mc? nous avons: 


Ze (E'+mc?) 72e 


2 4 2 
k Z'e?( Æ'+mc? 2 
HZ" _Po _2k26 (tm) Rte" Po is 
re? c?r2 Fr pr c? c?r? r? 
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En posant: 
Ze?E' 
BE =Xx . +kmzZe? (41.146) 
€ 
Et en posant également: 
PAT 
C=-"——-nÎ (41147) 
€? 


puisque p, =,h. 


Sommerfeld introduit alors ce qu'il appelle une "constante de structure fine" & définie par la relation: 


e? 
Œ=—| (41.148) 
Re 


valant: 


ææ1/137 (41.149) 


Remarque: La constante de structure fine est une des constantes les plus importantes de la 
physique. D'abord parce qu'elle est sans dimensions, et secundo parce qu'elle est à ce jour la mieux 
connue (au niveau de la précision) de toutes les constantes et tertio, parce qu'elle ne dépend que de 
termes qui semblent être des constantes fondamentales. Les physiciens et astrophysiciens cherchent 
donc à observer si la valeur de cette constante varie au cours du temps, ce qui impliquerait 
immédiatement qu'une au moins des constantes implicites n'est pas atemporelle. 


Compte tenu de la constante de structure fine, nous écrivons: 


e* k? 72 
C'=27? = h° -xih° =Z@h-nih=-nir 1- 5 (41.150) 
c?h #4 
En résumé: 
P,=+ [28,0 (41.151) 
r r? 
Avec: 
= +2mE "= =} e[f2) ‘| 
2 Û 
E = IE x mZe L (41.152) 
€ 
272 2 
c=-nrf-F7a 
#4 
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Nous aboutissons donc à l'intégrale suivante: 


: 25.6 
Ÿr, dr =ÿ —"— dr - -Ÿ A =n,h (41155) 
(1-67)3 


Le théorème des résidus (cf. chapitre d'Analyse Complexe) appliqué à l'intégrale précédente donne 
pour expression: 


28 C 
fA+— + dr-2mi (41.154) 


- 
Nous voyons trivialement qu'il y a un pôle à l'origine » =0 . 


Nous allons calculer le résidu en ce point en passant à la limite pour >» = 0. Nous posons pour cela: 


f{r)= La ,28 " LC (41.155) 
r  r? 


En passant à la limite construite sur la base du théorème des résidus: 
lim r fr) = lim Ar? +2Br+C =NC (41156) 
7-0 +0 

Le résidu correspondant au pôle > =0 est donc: 


Fe" JC (41.157) 


Nous voyons également qu'il y a un second résidu à l'infini 7 = et pour le calculer, nous effectuons à 
nouveau un changement de variable. Nous posons (conformément à la méthode que nous avons vue 
dans le chapitre d'Analyse Complexe): 


Z _— > d PRE dr + (41.158) 
r pe Ci 


L'intégrale s'écrit alors: 


ÿ A++ ar = ÿ AE | 1. Ya 1428, PE (41.159) 
A 
Pour trouver le résidu, nous allons faire un développement en série de Laurent de: 


A | 


z+— Ca (41.160) 
22 A 


autour de ce pôle de valeur nulle. Pour ce faire, nous posons: 


2B C, . 
u=—z+—z? (41161) 
A A 
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Nous connaissons le développement de Taylor de l'expression résultante de ce changement de variable: 


Ha = au ui +--. (41.162) 


Appliqué au radical, nous obtenons: 
2 
+ 2 R7a CRE si) CPC +--. (41.163) 
A A 21 À A Fe A 


Il vient alors automatiquement la série de Laurent (chouette!): 


2 
VA p.22, G "4 Vas, c, «V4/28,,0 _ 
z? 27? Qz2 À 
VA _VAB1 re , VA (487 Le ttes] “aies 
2 A > 24 ‘az 4 À Æ 


rest 


où nous voyons immédiatement que le pôle est d'ordre 2. 
Lu _ 1 
Le second résidu est le coefficient en —: 
PB === (41.165) 


Effectivement, nous avons simplement appliqué la relation démontrée dans le chapitre d'Analyse 
Complexe: 


k-1 
1 4 x l î ne. 
R -Dl=—=hira | (41.166) 
es[g(z), ] SE NET Te Di d: _ (2)] 


pour déterminer le résidu se trouvant dans la série de Laurent avec l'ordre du pôle k valant donc 2. 


En final, nous aboutissons à: 


ÿ a+ TE dr = =2mio nr 2n(e-+ h (41.167) 


Avec: 


272 272 
rnfk Re nn es 


BE 
Pour le calcul de —— nous avons: 


Va 
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KZeE", kZe° 2p! 2 
_— LI E" Ro 2 ,tZe 
Den PE T3 | IE re nu) rE] 
mac? mc? 
(41.169) 
kZeE", &Z e? 
- me” c 
| 
1- [+ À) 
mc? 


Dès lors, l'intégrale curviligne a pour expression: 


LEE &kZe? 
= 2 
| #4 À 1 #7 = = A ————— (41.170) 
am se 
) 


Après simplification: 
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La &Z e? 


_# . a? 


x? 1 12 
| RE 


2RrkZe'E". 2rkzZe e? 


#4 


3 E 
D me “x h À = PZæe, 
Ch 
T3 
mc 
27rkZeE", LE 
mc h ch nas 
= x, =2,% #2 -k272a? 
Ch 
a UT 
mc 
2 
E' (41.171) 
1-f+) 
(2rk2e@E 2rk2e on, + fe -6Z1@ ET 
mo ch 


Nous élevons au carré: 
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1-|1+ # 
mn, C? æ? 
| —— 
kz| E 4] (n,+ h-67&) 
mc? 
1 \2 
1- 14 2 
mel cm cu 
2 2 
E' 2 _1272 m2 
En (n, + ré k2Z a) 
1 k272@ 
 —— 
E" + | 2 _}272 2 
(+) (x, ”. HZ) (41.172) 
1 Fa à 
=] + 


(+ E | (e, + RZa) 
mac? 


" 
£E'Ÿ ee 72@ 
EE 
PE (n, +5 -#71æ) 


2 


E' AT 
1+ —— = À — 7 
(r, + hi 271) 
Donc: 
a — (41.173) 
me? ( + 2 
n, +fni = c) 
d'où: 
k272a° 7 
PT ETS TS D 7 LUE PE 
(re, +, n2 HZ? at) (x + fr -kiZ?a) 
(41.174) 


Nous posons # = x, +,: 


En travaillant sur le dénominateur (, +, fai -k272 a): 
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2 
2, +2, 1-[#e) (41.175) 


7e 


En ajoutant et en retranchant x, : 


(41.176) 
Donc: 
1 
2 
272 2 
ÆE'= -pnmc? 41 - D (41.177) 
ou encore: 
_1 
2 
2 
ez[] 
E'=-mc241-|1+ : 7 (41.178) 
3 
À 
Ou encore: 


2 
Æ'=-;nmc?|1- 1-#2[5] (41.179) 
À 


1 


2 
ne 


Nous considérons dans le terme | - | le radical qui s'écrit encore: 
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FT HE 


Soit le développement en série ( + x) 


FT {Hal 
{el 


Comme «l, nous pouvons négliger les termes au-delà de l'ordre 2 tel que: 


ê 
+ ES | [5 7. 
ê 


vif) {= (41.184) 


CE 


=] +2 a + _. —--. (cf. chapitre sur les Suites Et Séries) 


alors: 


_fézaŸ Le] +... (41181) 


Donc: 


kza\ kza\ 4. (14182) 


Le terme suivant s'écrit alors: 


En travaillant maintenant sur le terme entre les crochets et en considérant uniquement le carré sans 
tenir compte de son signe négatif (!): 


3 
2 -2 
kz & 
fie -[£s) oi. 1 Ur ue (41.185) 
# 9 2n| *, 
2 
1 &Za 
2{ #, 
Soit le développement en série de Taylor de (1 + x)” =1-2x+3x2-... (cf. chapitre sur les Suites Et 


Séries) alors 
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# 
> his a] (41.186) 


#4 


pie) LL | kza) 


En négligeant les termes au-delà de l'ordre 2: 


[ue] | 1 fee) (41.187) 
_1 
2 2 
#4 |kZ « (41.188) 
ñn | #, 


Nous entreprenons le développement en série de Taylor du terme entre les accolades: 


kZ a 
+ 


1 
(1+ x) 7 sat È Er +--. (41.189) 


En négligeant les termes au-delà de l'ordre 2: 


(41.190) 


En développant le carré du troisième terme, il vient: 


CÉCIGIE IR E) ES 


Soit: 


2 2 27? 
_1[&a ru kKZa| |, 3|[&a (41.192) 
2U x x | », al x 


L'énergie totale de l'atome devient: 
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ne QI ol 
ROIS 

ref se) fu) ] 

pers [#1 


Finalement, nous obtenons pour l'expression de l'énergie: 


. _ mok2720 k&ZaYŸ[» 3 
Es | | 17 6419) 
° 2x? # #4 4 


Nous pouvons donner une autre expression pour l'énergie de l'atome hydrogénoïde puisque: 


2e 


2 
k = (4 L'et æ=—- 41.195 
+ D hoc Ac 


L'expression de l'énergie totale de l'atome hydrogénoïde devient: 


1 (are 1, 2e | 


M T2 — 
167% h*c* 
E = - Eg . 1+ AE he il (41.196) 


x, 
. 2x? A 


Soit: 


2,4 
E, =- — - #8 I ion 
8 Ep 4°?#° ae res #? 


Dans la littérature, nous trouvons d'autres expressions pour l'énergie totale qui sont plus intéressantes 
que les précédentes (car plus traditionnelles). Ainsi, en considérant que # =x, +x,, il vient: 
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_ Mc°k°2?@ 14 ka #,+7%, _3|[_ rack? æ ie kEaŸ 
is 2x? # 3 4 2x? # 


(41.198) 


# 


Si nous cherchons une expression en fonction de la constante de Rydberg À, (voir plus haut): 


| 4 2,92 2,92 
E,=- sî gahc 1+ Z?e ñn _3 __Kyg, 14 _ ñn _3 
” SAC # 4shc?n2|x, 4 x? 4er |n, 4 
—ÿ— 


FA 
(41.199) 


Donc l'expression de l'énergie totale relativiste de l'atome hydrogénoïde la plus condensée que nous 
puissions trouver dans la littérature et que nous adopterons dans le présent site est: 


. _. mek2Z2a kaY [1 », 
EE, =" {1+l | [+214] (41.200) 
2x? ñ# 4 x, 


La relation ci-dessus révèle bien l'existence d'une structure fine puisque les caractéristiques x, et », 


de l'orbite de l'électron apparaissent séparément dans un rapport et non plus uniquement sous la forme 
d'une somme comme dans le premier modèle de Sommerfeld et Wilson. 


Mais en toute rigueur, nous devrions du fait de l'entraînement du noyau: 


PAPA Zet [n 3 
EE, = -————{lt5————|— -— (41.201) 
säis 8e h?n? 4 h2c2n? #, 4 
ou: 
292 
E en ET UE La (41.202) 
— #? 4 kex|4 à, 


Dans laquelle la constante de Rydberg a pour expression: 


4 
Ry = — (41203) 
SEpA € 


Cependant comme la masse du noyau est 1840 fois plus lourde que celle de l'électron, nous pouvons 
admettre en première approximation que: 


Fe y 
U=—2=m, (41.204) 
mt, 
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6.1. MOMENT MAGNÉTIQUE DIPOLAIRE QUANTIQUE 


À l'époque du développement du modèle de Sommerfeld, certains physiciens s'attachent à étudier une 
autre propriété de l'atome. Ils observèrent que sous l'application du champ magnétique, les raies se 
doublaient. Pour expliquer cela, ils eurent l'idée géniale et extrêmement simple d'expliquer ce 
phénomène par le moment magnétique de l'électron. 


Remarque: Nous verrons en physique quantique ondulatoire, qu'au fait, même en l'absence de 
champ magnétique une mesure très fine des raies montre qu'elles sont toutes doubles et ce à cause 
du couplage spin-orbite. Dès lors, une interprétation correcte est de dire qu'il y doublement du 
dédoublement des raies sous l'application du champ magnétique. 


Ainsi, soit l'expression de la norme du moment magnétique dipolaire (cf. chapitre de Magnétostatique): 
£ =S"À (41205) 


le moment magnétique est donc égal à la surface entourée par l'orbite de l'électron multipliée par le 
courant de l'électron (perpendiculaire au vecteur unitaire de la surface) sur sa ligne d'orbite soit: 


(41.206) 


277, 
T=—— (41207) 


est la période du mouvement. 

Nous avons vu que la somme des moments cinétiques étant égale à: 
b=n'h=m'r'v, (41208) 

donc le rapport moment magnétique/moment cinétique donne: 


 _ e e e'h ee 
—=— =—"h=——'n= *x (41.209) 
HO D 5 


Le rapport & j 2m est appelé le "rapport gyromagnétique orbital" et la quantité: 
Hp =9.2740154" 10% [J'T] (41.210) 


est appelée "magnéton de Bohr”. 


Remarque: Il est important de se souvenir des quelques développements et définitions qui viennent 
d'être faits lorsque nous développerons l'équation de Pauli en Physique Quantique Relativiste. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Fréquemment nous notons la relation ci-dessus ainsi: 


e'} 
—"h=m'h] (412101) 


HT, 


où #1, est appelé "nombre quantique magnétique”. 


Sachant que le nombre quantique principal est décomposé par les nombres quantiques radiaux et 
azimutaux, il y a alors autant de moments magnétiques qu'il y a de géométries différentes d'orbites pour 
une valeur donnée du nombre quantique principal. Au fait, il y en a même le double si nous considérons 
que l'électron peut tourner dans le même sens ou dans le sens inverse des aiguilles d'une montre (le 
moment magnétique étant une grandeur vectorielle). 


Maintenant, prenons les deux exemples: 


= li 
n=l=2,+a =l+t0etr=2=7, +7 = Det (41.212) 


pour lequel nous posons maintenant #, = ? , nombre que nous appelons "nombre quantique de moment 
cinétique orbital" et ayant des valeurs comprises entre: 0 <j <#m-—1. 


Qu'avons-nous finalement ? 


1. Lorsque »# = 1, nous avons } = { et comme #= 1 n'a qu'une seule sous-couche, alors lors de 
l'application d'un champ magnétique nous n'avons toujours qu'une et une seule raie de visible. 


Figure: 41.9 - Décomposition d'une orbitale très basse. 


2. Lorsque # = 2, nous avons j = 0 et ? = 1 et comme »7= 2 a deux sous-couches. Lorsque aucun 
champ magnétique n'est appliqué, les raies des deux sous-couches sont superposées donc indiscernables 
(on n'en voit qu'une seule). Mais lorsqu'un champ magnétique est appliqué les deux sous-couches se 
distinguent de par le moment magnétique et dès lors nous avons deux raies mais au total il en existe 
théoriquement 3 (une sans champ, et deux avec champ). 
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I [ ] | L 
m,=- 1 | m,=0 m,=+] 


Figure: 41.10 - Décomposition de l'orbitale supérieure 


Aïnsi, nous avons: 


—1< my £ +] (41.213) 


O<Z<(#-1)| (41.214) 


L'énergie potentielle d'un moment magnétique {4 placé dans un champ magnétique B vaut: 
E=44'B'cosœ=m'h'B'cosæ (41.215) 


Donc finalement pour chaque orbitale d'électron soumise à un champ magnétique nous avons: 


E=E£E +m'h'B'cos&| (41216) 


toujours avec —{ £ m3, £ +}. 


L'observation du spectre d'un atome dans un champ magnétique a pour effet d'ajouter des raies de par 
l'énergie potentielle du moment magnétique. C'est ce que nous appelons "l'effet Zeeman" car c'est ce 
dernier qui a mesuré ces raies pour la première fois (avant la théorie). 


6.2 SPIN 


Diverses constatations expérimentales ont conduit à attribuer à l'électron un moment cinétique et 
magnétique propre (dédoublement des raies Zeeman elles-mêmes !!!). 


Il a effectivement été expérimentalement mesuré que le moment magnétique résultant était juste égal à 
la valeur du magnéton de Bohr. Il est alors tentant d'attribuer ce moment magnétique à l'électron et 
émettre l'hypothèse que ce dernier viendrait peut-être du fait qu'il tourne sur lui-même (moment 
cinétique intrinsèque): il posséderait donc un "spin" égal au magnéton de Bohr et ce dernier pouvant 
prendre des valeurs négatives ou positives. Nous parlons alors de "nombre quantique de spin" et ce 
dernier donne le nombre de différentes valeurs que peut prendre le spin. 


Cependant, cette vision classique d'une rotation propre (moment cinétique intrinsèque) de la particule 
est en fait trop naïve et par la même erronée. 


En effet, dans un premier temps, si la particule est ponctuelle, la notion de rotation propre autour de 
son axe est tout simplement dénuée de sens physique. Rappelons que puisque par définition, l'axe de 
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rotation d'un objet est le lieu de points de cet objet qui restent immobiles, alors si la particule est 
ponctuelle, son axe propre est sur la particule, donc celle-ci est immobile. 


Dans un deuxième temps, si la particule n'est pas ponctuelle, alors la notion possède un sens, mais on se 
heurte dans ce cas à une autre difficulté. Supposons par exemple que la particule soit un électron, 
modélisé comme étant un corps sphérique de rayon a. Nous obtenons une estimation du rayon a en 
écrivant que l'énergie de masse de l'électron est de l'ordre de grandeur de son énergie potentielle 
électrostatique (cf. chapitre d'Electrostatique), soit : 
2 cu e° re 
MC = DAE—— (41.217) 
ATEna ATEp Mc 


La valeur numérique de ce "rayon classique de l'électron" est 4 = 107! [»:] en prenant sa masse au 


repos. 


Si nous attribuons alors à cet électron un moment cinétique égal à ;/2 (qui a les unités d'un moment 
cinétique), nous obtenons pour un point de l'équateur une vitesse v vérifiant : 


2rEnhc° 


eg 


(41.218) 


À hk 
MAV= — DV= ——=z 
2 2m 


La valeur numérique de la vitesse vaut alors y» z 6.100 [#{ s] … donc la vitesse de rotation propre 


serait supérieure à la vitesse de la lumière dans le vide, ce qui pose bien évidemment des problèmes 
avec la théorie de la relativité restreinte (cf. chapitre de Relativité Restreinte). 


Nous ne pouvons donc avec les outils mathématiques de la physique quantique corpusculaire formaliser 
rigoureusement la notion de spin, mais nous y reviendrons dans le chapitre de physique quantique 
relativiste (équation de Pauli) et nous montrerons que le spin est au fait quelque chose de beaucoup 
plus subtil qu'une simple rotation. 


Mais revenons à notre vision classique en attendant. Donc, lorsque nous observons un dédoublement 
des raies de Zeeman, nous supposons que cela est dû au spin s de l'électron qui peut prendre deux 
orientations (sens vectoriels) différentes. 


Il a donc été mesuré que le moment magnétique propre de l'électron est égal à la valeur du magnéton de 
Bohr soit: 


e 
É = Hp =—"h (41219) 
2m 


Si nous posons (ce que les physiciens aiment bien faire) & = 1,## = 1 nous avons: 


1 me 
4 (41.220) 


(ceci juste afin d'obtenir une similitude avec à = #'°h..) 


Cette valeur est constante mais peut être négative ou positive en fonction du sens de rotation propre de 
l'électron relativement à l'observateur (le moment cinétique ayant une orientation vectorielle). Ainsi: 
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s=T+ 


Ce résultat, de la plus haute importance, nous amène aussi à la conclusion que chaque nombre 
quantique magnétique est dégénéré deux fois par le nombre quantique de spin! Ainsi, comme nous le 
verrons un peu plus loin dans des exemples concrets (avec schémas à l'appui), chaque nombre 
quantique principal n est dit "dégénéré" un nombre 2? de fois: 


6.3. PRINCIPE D'EXCLUSION DE PAULI 


Suite au fait que l'état d'un électron atomique peut être caractérisé avec au moins les 4 nombres 
quantiques suivants dont nous avons démontré la provenance: 


#,l,7,m, 


ou sous forme étendue suivante: 


2,84, 7,,1, M, S 


Wolfgang Pauli, a alors posé pour expliquer certaines régularités dans les propriétés atomiques un 
principe d'exclusion nommé aujourd'hui "principe d'exclusion de Pauli" et qui s'énonce de la manière 
suivante: Dans un atome, deux électrons ne peuvent avoir le même quadruplet #,/,##,,#, ordonné de 


nombres quantiques. 


Remarques: 


R1. Nous notons parfois selon les situations ##, = s (pour ce que cela change...). 


R2. Nous savons par la physique quantique ondulatoire que le principe d'exclusion s'applique aux 
particules qui sont des "fermions". Ce sont les particules (élémentaires ou composées) qui ont un 
spin demi-entier, comme le proton, le neutron et le neutrino. Ce principe ne s'applique pas au 
groupe de particules dites "bosons", qui ont un spin nul ou entier. 


Il est possible à partir de ce principe, d'établir une sorte de catalogue des éléments atomiques à partir 
des possibilités de remplissage des orbitales, supposées disposées en couches, améliorant ainsi la 
classification de Mendeleïev. 


Les étudiants les voient fréquemment pour la première fois dans les écoles lors de leurs cours de 
chimie. Ils les utilisent la plupart du temps, sans savoir ce qu'ils représentent vraiment. 


7. COUCHES ÉLECTRONIQUES 


Au cours des années 1920, Bohr, Stoner et d'autres conçurent un modèle de la structure électronique 
des atomes qui permet de comprendre le tableau périodique des éléments. Le travail de Moseley a 
permis de déterminer le nombre de protons dans le noyau et, comme l'atome est neutre, c'est aussi le 
nombre des électrons orbitaux. Il n'est pas simple de déterminer la structure atomique et dans cette 
analyse, les physiciens ont été aidés par les expériences menées par les chimistes. 
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Ainsi, selon les chimistes les électrons occupent des couches et des sous-couches autour du noyau par 
ordre d'énergie croissante selon des règles associées à leurs nombres quantiques que nous avons 
déterminés précédemment. Ainsi, la "configuration électronique" est l'arrangement des électrons dans 
un atome, une molécule ou un autre corps. Précisément, c'est la position des électrons dans une orbitale 
atomique, moléculaire ou d'autres formes d'orbitales électroniques. 


Remarque: Rigoureusement ce concept de "couche" comme nous pouvons nous l'imaginer 
visuellement n'a aucun sens si l'on se réfère aux résultats de la mécanique quantique (cf. 

+). C'est la raison pour laquelle le débat qui consiste à savoir 
comment remplir les couches est stérile car il n'existe pas rigoureusement sans une grossière 
approximation de règle générale. 


Chaque couche correspond à une valeur spécifique du "nombre quantique principal" n et 
traditionnellement les couches sont désignées (cette tradition devrait être abandonnée... mais comme 
toutes les traditions elle a la peau dure...) par les lettres majuscules K, L, M, N, O... correspondant aux 
nombres 1, 2, 3, 4, 5...que peut prendre le nombre quantique principal. 


Le "nombre quantique secondaire/azimutal" noté conventionnellement par la lettre ! correspond aux 
états de dégénérescence que peuvent prendre les couches pour une valeur donnée de n tel que: 


Pour la couche K (x = 1) nous avons une unique sous-couche comme: 


et ainsi pour la couche L (x = 2 ) nous avons deux sous-couches: 
(2, = 1x, =1]=p[r, =2,2 =0]=s 
et ainsi pour M (# = 3) avons trois sous-couches: 
[2 = =2]md,[n, =2,n, =1]m= px, =3,n =0]=s 
et ainsi de suite... 
Les chimistes ont pour habitude de noter les premières sous-couches par les lettres latines: 
s (sharp), p (principal), d (diffuse), f (fondamental)... 
Qui sont l'équivalent alphabétique du nombre quantique secondaire 1. 


Le "nombre quantique magnétique" #, désigne donc la position de l'orbitale dans l'espace (au fait, il 


représente le vecteur directeur perpendiculaire à la surface de l'orbite décrite par l'électron). 


Ce dernier nombre prend, nous l'avons démontré, le double de la valeur qu'il y a de sous-couches par 
couche (effet Zeeman: doublement des raies) et puisque: 


—1 Lim < +} 


Le "nombre quantique de spin" ##, désigne le nombre de différentes valeurs que peut prendre le 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


moment magnétique de l'électron sur une orbitale donnée. Évidemment, il ne peut prendre que deux 
valeurs qui correspondent au sens de rotation propre de l'électron par rapport à l'observateur et produit 
un dédoublement du doublement des raies (dédoublement Zeeman): 


s=+— (41.228) 


Définitions: 
D1. Une "couche électronique" est un groupe d'états qui ont le même nombre quantique principal n. 


D2. Une "sous-couche" est un groupe plus petit d'états qui sont caractérisés par les nombres quantiques 
den et I. 


D3. Une "orbitale" est précisée par les trois nombres quantique #,{,#4 et elle peut contenir deux 
électrons l'un de spin haut et l'autre de spin bas. 


D4. Un "état" est défini par les quatre nombres quantiques #,2,#2,,#, et contient un seul électron 
comme l'exige le principe d'exclusion. 


Résumons sous forme de schémas à ce que nous avons vu jusqu'à maintenant: 


Prenons l'exemple: 


Figure: 41.11 - Décomposition d'une orbitale basse avec spin 
Ainsi, le principe d'exclusion de Pauli permet qu'il y ait deux électrons sur la couche K. 


Prenons l'exemple: 
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m,=-1 | 
m,=—+ | [m.=+! | 
— } 


@L-1-H)021-1+1) QUE) (210 


(2, 0,0, —-+) (2, 0,0, ++) 


Figure: 41.12 - Décomposition d'une orbitale directement au-dessus 


Ainsi, le principe d'exclusion de Pauli permet qu'il y ait 8 électrons sur la couche L. 


Et ainsi de suite. 


Sous forme d'atomes schématisés selon le modèle de Bohr, cela donne: 


—.— —. 
LL . 
… + = — + Ta 
mn | ' 
© a ' t 
: : g 
EE ue + ee, ; * L', . 
> .. . 
H He Li Be 
ee =: 7 à ré = 
a — . gi x . | 
é +. À \ 8 "TT à » 
& ni ! @ ! ! ' 
il 8: 8 
*.ÿ" ; .. 3 | " * D . * æ 
* * : : | 
_ , S-— + # so" 
C N 0 F Ne 


Figure: 41.13 - Forme courante dans les livres de chimie du modèle relativiste de Sommerfeld avec spin 


Sous une notation conforme à celle des chimistes, les configurations fondamentales de quelques 


éléments s'écrivent: 
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Elément Symbole Numéro atomique Configuration électronique 
Hydrogène H il ls 

Hélium He 2 12. 

Lithium Li 3 152.25 

Béryllium Be 4 152,25? 

Bore B 5 152.2522p 
Carbone C 6 152.2s522p? 

Azote N 7 1s2,2522p 
Oxygène O 8 Ls2.2522pt 

Fluor F 9 Ls2.2522p 

Néon Ne 10 Ls2.2522p6 
Sodium Na 11 Ls2.2522p0.3s 
Magnésium Mg 12 1s2,2522p6,352, 
Aluminium AI 13 152.2522p6,3523p. 
Silicium Si 14 152.2522p6.3573p#. 
Phosphore P 15 152.2522p6.3523p. 
Soufre S 16 Ls2.2522p6.3523pt. 
Chlore CI 17 152.2522p6.3s23p. 
Argon Ar 18 1s2.2522p6 3s23pt. 


Figure: 41.14 -Forme tabulée de quelques éléments selon la notation des chimistes 


Qui est une forme condensée du tableau équivalant suivant: 
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K L M N 

n: 1 2 3 4 
Z Elément | s s p ÉpUC s pdf 
1 Hydrogène H 1 
2 Hélium He pi 
3 Lithium Li 2 I 
4 Béryllium Be 2 2 
5 Bore B 2 FE) | 
6 Carbone C 2 2 2 
7 Azote N 2 PÈRE 
8 Oxygène O 2 24 
9 Fluor F 2 20 55 
10 Néon Ne 2 2 6 
11 Sodium Na 2 200 Il 
12 Magnésium Mg 2 2 6 2 
13 Aluminium AI 2 2 6 21 
14 Silicium Si 2 2: 6 p JE ) 
15 Phosphore P 2 2:06 DES 
16 Soufre NS 2 2 6 2 4 
17 Chlore CI 2 26 23 
18 Argon Ar 2 2 6 2 6 
19 Potassium K 2 210 2 6 ] 
20 Calcium Ca 2 2: 6 2 0. 2 
21 Scandium Sc 2 2 6 261 2 
22 Titanium Ti 2 2:06 LOUE 2 
23 Vanadium V 2 2010 2-0 3 2 
24 Chrome Cr 2 2: 0 2 6 4 l 
25 Manganèse Mn 2 2 2 0 209 2 
26 Fer Fe 2 2000 2 66 2 
27 Cobalt Co 2 2: 6 2=6 7 2 
28 Nickel Ni 2 2:76 2 68 2 
29 Cuivre Cu 2 2:06 2 6 10 ] 
30 Zinc Zn 2 25 6 2 6 10 2 
31 Gallium Ga 2 2:00 2 6 10 0 
32 Germanium Ge 2 26 2 6 10 22 
33 Arsenic As 2 2 6 2 6 10 253 


Figure: 41.15 -Forme extensive. du tableau précédent 


Cependant, bien que le modèle relativiste de Sommerfeld soit d'une précision et d'une cohérence 
redoutable par rapport aux observations expérimentales, il n'explique pas certains phénomènes 
importants que nous observons à l'échelle de l'atome. Ainsi, ce modèle est dans l'incapacité d'expliquer 
la désintégration des éléments, le comportement dual (complémentaire) de la matière entre onde et 
corpuscule, l'annihilation entre matière et antimatière et encore bien d'autres. 


Ce sont des développements beaucoup plus complexes et à la fois compatibles avec ce que nous avons 
vu qui vont être développés dans le chapitre suivant traitant de la Physique Quantique Ondulatoire 
permettant d'expliquer de manière parfaitement satisfaisante nombre de phénomènes qui étaient 
inexpliqués à l'échelle du nanomètre. 
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Notes personnelles: 
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42. PHYSIQUE QUANTIQUE ONDULATOIRE 


Fr de l'ancienne théorie des quanta (cf. chapitre de Physique Quantique Corpusculaire), la physique 


quantique ondulatoire appelée aussi "mécanique quantique" constitue le pilier d'un ensemble de théories 
physiques que nous regroupons sous l'appellation générale de "physique quantique". 


Cette dénomination s'oppose à celle de la physique classique, celle-ci échouant dans sa description du 
monde microscopique (atomes et particules) ainsi que dans celle de certaines propriétés du rayonnement 
électromagnétique (voir typiquement les expériences des fentes de Young dans le chapitre d'Optique 
Ondulatoire) ou des semi-conducteurs (voir typiquement l'Effet Hall dans le chapitre d'Électrocinétique). 


Remarque: L'extension relativiste pertinente de la physique quantique est la physique quantique 
relativiste (voir chapitre du même nom). 


La physique quantique a repris et développé l'idée de dualité onde-corpuscule introduite par De Broglie 
consistant à considérer toutes les particules (et même les atomes) de matière non pas seulement comme 
des corpuscules ponctuels, mais aussi comme des ondes, possédant une certaine étendue spatiale (cf. 
chapitre de Physique Quantique Corpusculaire). Ces deux aspects onde/corpuscule des particules 
('quanton"), mutuellement exclusifs, ne peuvent être observés simultanément. Si nous observons une 
propriété ondulatoire, l'aspect corpusculaire disparaît et réciproquement. 


À ce jour, aucune contradiction n'a pu être décelée entre les prédictions de la physique quantique et les 
tests expérimentaux associés. Ce succès a hélas un prix: la théorie repose sur un formalisme 
mathématique assez abstrait, qui rend son abord assez difficile (heureusement tant qu'on ne traite pas du 
spin on peut se passer du formalisme matriciel de Heisenberg pour se concentrer sur le formalise de 
l'équation d'onde de Schrüdinger qui est beaucoup plus simple et qui jusqu'à un certain niveau permet de 
se faire une représentation mentale de ce qui se passe). 


Ce qui est plus difficile encore c'est qu'il est très compliqué, voire impossible, de présenter ce domaine de 
la physique de manière pédagogique linéaire. Ceci a pour conséquence que bon nombre d'ouvrages à son 
sujet (dont le présent texte ne saurait être exclu), qu'ils s'adressent à des spécialistes ou non, voient leur 

explications ou textes soumis à de nombreuses critiques d'interprétations, de relecture et de compléments. 


Pour en sortir il est favorable de prendre pour base le "principe d'objectivité" dû à Werner Heïsenberg qui 
est à la base de la "physique quantique standard": existe seulement ce qui est expérimentalement 
observable. Il faut aussi s'aligner sur la conviction de Max Born de reconsturuire la physique quantique 
corpusculaire qui est objectivement un pot-pourri de règles quantiques et de physique classique pour céder 
la place à une nouvelle théorie cohérente basée uniquement sur quelques postulats (Max Born s'inspirait 
de l'élégance des théories d'Albert Einstein qui ne faisaient usage que de quelques postulats bien définis). 
Wolfgang Pauli lui aussi estimait qu'il était indispensable de cessser d'émettre des hypothèses ad hoc 
arbitraires chaque fois que des expériences produisaient des données en désaccord avec la théorie. 
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Le principe de dualité est admis par la majorité des physiciens, mais non la totalité. Un électron est-il 
présent à plusieurs endroits? Pour que cela soit recevable, il faut une expérience qui le trouve à plusieurs 
endroits, ce qui est impossible donc nous ne sommes pas tenu de répondre à la question! Dire qu'il est à 
plusieurs endroits avant que nous l'observions n'est pas recevable en physique: principe d'objectivité. 
D'une manière générale, nous allons donc aussi renoncer à la notion de trajectoire et de mouvement, ce qui 
va permettre, de lever la contradiction du freinage par rayonnement (cf. ue): car 
il n'y a plus de mouvement au sens classique. Les notions de vitesse et d'accélération perdent tout sens à 
cette échelle! 


Une minorité de physiciens nie ce principe et ont fondé une physique quantique non-standard avec des 
grandeurs classiques ce qui explique que l'on puisse trouver surtout dans les revues de vulgarisation des 
exposés qui s'écartent de la physique quantique standard (celle de la majorité des physiciens). Cette 
version non-standard donne les mêmes prévisions pour toute expérience réalisable, c'est donc un modèle 
possible. 


En conclusion la physique quantique est une théorie considérée par la majorité actuelle des physiciens 
comme inachevée et dans laquelle beaucoup de points demeurent encore assez obscurs. 


Avant de nous attaquer à la partie mathématique, nous tenons à souligner que nous allons nous limiter 
uniquement aux développements théoriques effectués entre 1910 et environ 1935 (au-delà la complexité 
des théories nécessite trop de pages pour un site Internet généraliste comme Sciences.ch). 


1. POSTULATS 


Contrairement à la majorité des ouvrages sur le sujet, nous sommes pédagogiquement (et non pas 
techniquement!) très peu convaincus quant à l'impact de la présentation des postulats de la physique 
quantique au début de son étude dans les classes. Nous nous permettons d'exposer nos raisons (expérience 
faite): 


1. Ils peuvent se déduire de raisonnements mathématiques simples et logiques (algèbre élémentaire et 
probabilités) fondés sur les postulats de la physique quantique corpusculaire et du principe de 
complémentarité et découlent donc d'une évolution de cette dernière. Même si rigoureusement la 
démarche est fausse au moins, elle est pédagogique! 


2. Ces postulats sont indigestes, voire incompréhensibles si la physique quantique (son formalisme et son 
vocabulaire) n'a pas été d'abord appréhendée par un certain nombre d'exercices ou d'un usage régulier. 


Nous pouvons alors considérer que les seuls éléments non démontrables théoriquement (à notre 
connaissance) qui auraient leur place au rang de postulat seraient: le principe de complémentarité de De 
Broglie (nous en parlerons plus tard), la relation de Planck-Einstein (déjà vue dans un chapitre précédent) 
et la mesure d'une observable. 


Néanmoins..., dans l'objectif de respecter la tradition, et surtout de respecter la méthodologie scientifique, 
nous avons choisi de quand même présenter ces postulats en début de ce chapitre mais sans trop insister 
dessus. Nous conseillons cependant vivement au lecteur non averti, de lire ceux-ci sans trop chercher à les 
comprendre mais simplement de penser à y revenir régulièrement pendant la lecture du chapitre. Dès lors, 
tout deviendra probablement plus limpide et la lumière sera... 
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Remarques: Nous verrons des cas pratiques, dans ce chapitre même, de la théorie quantique pour un 
usage ultérieur en physique quantique des champs et physique nucléaire. Nous conseillons cependant 
au lecteur de lire en même temps les chapitres d'Informatique Quantique, de Chimie Quantique et de 
Chimie Moléculaire qui semblerait-il aident plus que grandement à la compréhension de certains 
passages un peu trop théoriques présentés ici. 


1.1. 1ER POSTULAT: ÉTAT QUANTIQUE 


L'état d'un système quantique classique est spécifié par les coordonnées généralisées (cf. chapitre de 
Mécanique Analytique) 1&,42,..1 et est complètement décrit par une fonction différentiable et finie 
partout notée en toute généralité: 


YWidi,G2s....#l (421) 


dite "fonction d'état" ou "fonction d'onde", dont le module au carré (multiplication de la fonction par sa 
conjuguée) doit donner la densité de probabilité de trouver instantanément le système dans la 


configuration 14,4... au temps t (si le système est dépendant du temps): 


P(Q,92,..t)" [pi ira... t Il dhdg:..dq, (422) 


ce que nous justifierons plus loin! 


Remarques: 


R1. Le fait que nous parlions "d'onde" au lieu de "particule" vient du postulat génial et ma foi assez 
logique de De Broglie que nous appelons "postulat de complémentarité" (que nous détaillerons plus 
loin aussi) et qui associe à toute particule de matière, une onde et réciproquement. 


R2. Le fait que nous traitions des probabilités et que celles-ci soient proportionnelles au carré du 
module de la fonction d'onde vient des principes d'incertitudes de Heïisenberg que nous démontrerons 
plus loin et principalement de l'expérience des fentes de Young avec des électrons (cf. chapitre 
d'Optique Ondulatoire). 


En corollaire, la particule étant nécessairement située quelque part dans l'espace entier, nous avons la 
condition de normalisation que l'intégrale sur tout l'espace vaut: 


ff ay =1 «2 
à un facteur de phase près. En d'autres termes Ÿ doit être normée, ce que nous appelons 


traditionnellement la "condition de normalisation de De Broglie" (bien qu'a posteriori le concept 
provienne de Max Born). 
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Remarques: 


R1. Notons que même normée, F est déterminée à un facteur de phase près. De plus, il est préférable 
que soit différentiable, car des opérateurs différentiels agissent sur elle pour obtenir des prévisions 
théoriques sur des propriétés mesurables, et finie pour qu'elle soit normalisable.… 


R2. Lorsque l'intégrale donnée plus haut permet d'obtenir une quantité finie, nous disons qu'elle est de 
"carré sommable". Dans le cas contraire, il faut la normaliser pour que le modèle théorique 
corresponde à la réalité! Nous y reviendrons aussi plus en détails (avec démonstrations!). 


Rapelons qu'un "facteur de phase" est un facteur complexe constant de module unitaire. Nous pouvons 
l'écrire (selon ce que nous avons étudié dans le chapitre des Nombres lors de notre étude des nombres 
complexes) £*, où & est un angle quelconque, appelé la "phase" ( ap ). 
Nous démontrerons aussi plus loin en toute rigueur pourquoi celui-ci n'a aucune influence. 


Nous pouvons exprimer ce postulat de manière un peu plus formelle, car comme nous le verrons dans 
plusieurs exemples, la fonction d'onde est souvent un polynôme complexe qui peut dès lors s'exprimer 
dans l'espace de Hilbert des polynômes. Cela donne dès lors dans le langage du formalisme bra-ket de 
Dirac (voir plus loin les détails) la définition suivante: 


Le vecteur d'état "ket" représenté par |? (#)} appartenant à l'espace vectoriel # (espace de Hilbert) définit 
l'état du système quantique à l'instant t. Ce vecteur d'état possède toutes les propriétés mathématiques 
requises par la physique quantique et en particulier le produit scalaire du vecteur |T(£)} par son vecteur 


dual (conjugué complexe) "bra" LAO] doit satisfaire le produit scalaire fonctionnel: 
(PET }=1 


Remarque: La notation bra-ket a été introduite par Paul Dirac pour faciliter (du moins c'est censé...) 
l'écriture des équations de la physique quantique, mais aussi pour souligner l'aspect vectoriel possible 
de l'objet représentant un état quantique. Ce qui est donc spécifique à la physique quantique est que les 
vecteurs ne sont pas dessinés avec des flèches mais avec des ket et des bras (cela vaut mieux qu'un 
pied....), mais cela n'est qu'une question de notation et n'apporte aucune nouveauté mathématique. Par 
ailleurs, il ne faut pas imaginer que nous écrivions explicitement dans les calculs ces vecteurs sous 
forme de colonnes (pensez aux nombres complexes... il est rare que nous les écrivions sous forme 
vectorielle)! 


Pour résumer ces derniers paragraphes, les deux relations: 
{PE TE)}=1 
et: 
fief ar =1 


sont donc équivalentes! 
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1.2. 2ÈME POSTULAT: ÉVOLUTION TEMPORELLE D'UN ÉTAT QUANTIQUE 


Si le système n'est pas perturbé, l'évolution (supposée non relativiste!) de son état est gouvernée par 
l'équation d'évolution de Schrôdinger (dépendante du temps donc): 


Cette relation signifie simplement que c'est l'opérateur "énergie totale" ou "hamiltonien" H du système, 
qui est responsable de l'évolution du système dans le temps. En effet, la forme de l'équation montre qu'en 
appliquant l'hamiltonien à la fonction d'onde % du système, nous obtenons sa dérivée par rapport au 
temps c'est-à-dire comment elle varie dans le temps. 


Remarque: Nous démontrerons plus loin cette relation (ce ne sera pas trivial malheureusement mais 
c'est possible et donc cela élimine le besoin de la définir en tant que postulat). 


Dans cette dernière relation, H est l'opérateur, l'hamiltonien (énergie totale) du système que nous 
démontrerons comme valant dans un cas particulier et simple: 


h? - n # }? à _ 
H=EstE,e ru MAC T2) 2 ES) + (q:42...t) (428) 
k 


Dans le cas où le potentiel F’{g,,4:....) est indépendant du temps (correspondant à un système conservatif 


en mécanique classique), il existe (nous le verrons dans des exemples) un ensemble de solutions 
particulières indépendantes du temps et satisfaisant (relation dont nous démontrerons la provenance): 


AY (D: 1 EYr, (di: 1 (429) 


où #14 ,4:....| est appelée une "fonction propre" (en analogie avec les vecteurs propres vus dans le 


chapitre d'Algèbre Linéaire) de l'hamiltonien/opérateur H avec valeur propre/observable £,. 

Ces solutions particulières décrivent alors des états spéciaux appelés "états stationnaires" (puisque 
indépendants du temps...), dont nous démontrerons plus tard les propriétés et l'origine du nom, et qui 
forment une base orthogonale. 


L'équation aux valeurs propres précédente est souvent appelée "équation de Schrôdinger indépendante du 
temps". Elle définit les états stationnaires et n'a un sens bien évidemment que si le système est 
conservatif. 
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C'est surtout l'équation de Schrüdinger indépendante du temps qui concerne la chimie quantique et la 
chimie moléculaire (sujets que nous traitons dans la section de Chimie du site en détails). Nous cherchons 
en effet à obtenir les fonctions d'onde décrivant les états stationnaires, et surtout l'état de la plus basse 
énergie, "l'état fondamental", des atomes et des molécules. Les transitions observées en spectroscopie 
s'effectuant entre ces états stationnaires (nous le démontrerons plus loin), leur détermination est donc un 
prérequis pour l'étude de la spectroscopie. Cependant, il faut bien se rappeler que c'est l'équation 
d'évolution de Schrüdinger, qui est (dans un premier temps...) l'équation fondamentale de la physique 
quantique ondulatoire non relativiste: elle joue le même rôle que l'équation de Newton en mécanique 
classique, soit celui d'une équation du mouvement (voir la démonstration du théorème d'Ehrenfest plus 
bas). 


Remarque: Au fait, nous verrons (cf. chapi ) que l'équation 
d'évolution de Schrüdinger n'est qu'un cas particulier de ce que nous appelons "l'équation de Klein- 
Gordon libre" qui elle-même est un cas particulier de l'équation de "Klein-Gordon généralisée", elle- 
même étant un modèle limité par rapport à "l'équation de Dirac linéarisée" … bref on n'a pas fini... 


1.3. 3ÈME POSTULAT: OBSERVABLES ET OPÉRATEURS 


À chaque propriété physique mesurable (une observable) d'un système notée par exemple: 
1 ge ; Per l 


où 4, sont les coordonnées généralisées et ?, les moments généralisés conformément aux notations 


adoptées dans le chapitre de Mécanique Analytique, correspond un opérateur linéaire (donc cela peut être 
aussi une matrice!), appelé "opérateur hermitique", noté fréquemment avec un chapeau tel que pour 
l'exemple choisi celui-ci sera noté: 


(ar, rx) 


qui intervient toujours dans le calcul théorique d'une propriété physiquement mesurable (voir le chapitre 
d'Algèbre Linéaire pour avoir un rappel de ce qu'est une matrice hermitique). 


Autrement dit (mais ceci est plus en relation avec le postula qui va suivre): Une valeur observable est 
représentée par un opérateur qunatique qui opère sur la fonction d'onde pour prédire la valeur de la mesure 
de l'observable. 


Pour faire simple... un opérateur hermitique en physique quantique est une expression mathématique telle 
que si on prend son conjugué complexe (ou sa matrice adjointe si l'expression mathématique est une 
matrice) alors le calcul théorique de la valeur mesurable est toujours donné par la même expression. 


% Exemples: 


Voici les plus connus dont nous démontrerons l'origine dans le présent chapitre et celui de Physique 
Quantique Relativiste: 


E1. Coordonnées: 


Qu > 
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dont nous verrons un exemple pratique avec le théorème d'Ehrenfest dans le présent chapitre. 


E2. Quantité de mouvement: 

Pr > x = —ihô, (42.13) 
dont nous verrons aussi plusieurs exemples pratiques (dont un avec le théorème d'Ehrenfest). 
Ces deux derniers exemples sont parfois référés sous le nom de "principe de correspondance". 
E3. Moment cinétique: 


b, — b,= XPy 7 PxY (42.14) 


E4. Les matrices de Pauli (qui correspondent comme nous le verrons bien plus loin aux opérateurs de 


spin): 
no fo fo #7 ft 01 
6 14 4 ol es 012 lo 1 7 


E4. L'opérateur d'énergie d'évolution d'un état quantique: 


E- Ë= IR (42.16) 


Remarques: 

R1. Cela peut sembler tomber du ciel..., mais nous verrons que cela vient tout seul lorsque nous ferons 
les développements plus loin de quelques exemples bien concrets ou lors de la lecture du chapitre 
d'Informatique Quantique. 


R2. Dans le cadre de ce site, nous notons indifféremment, les opérateurs et les observables sans 
circonflexes (c'est au lecteur de savoir sur quoi nous travaillons sans se mélanger les pinceaux...). 


Nous verrons par ailleurs que certains opérateurs ne sont pas commutatifs et qu'ils obéissent à ce que nous 
appelons des "relations d'anticommutation" (qui sont à l'origine des principes d'incertitudes de 
Heisenberg). 

% Exemple (que nous démontrerons plus loin!): 


[de Pil [de Prl © GePi — Pride = RÔg (42.17) 


nous disons alors que les composantes des deux observables position et quantité de mouvement sont 
""conjuguéés canoniquement". 


Nous verrons par ailleurs à l'aide d'un cas pratique que deux observables A, B dont les opérateurs 
respectifs commutent tel que: 


[. ] = 0 (4218) 
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possèdent une base de vecteurs propres commune. Nous disons alors qu'ils sont simultanément mesurables 
(la détermination précise de l'une n'empêche pas celle de l'autre) avec précision (dans le cas contraire nous 
avons une incertitude. de Heisenberg). Les deux grandeurs À, B peuvent alors être appelées "observables 
compatibles" (O.C). Ceci signifie alors que les deux opérateurs doivent avoir les mêmes fonctions propres 
(donc ils ne sont compatibles que si les opérateurs associés admettent des fonctions propres communes). 


L'ensemble des O.C. attachées à un système physique constituent un "ensemble complet d'observables 
compatibles" (ECOC). 


1.4. 4ÈME POSTULAT: MESURE D'UNE PROPRIÉTÉ 


La conséquence du postulat précédent est que la mesure de € donne donc toujours une valeur propre de 
l'opérateur hermitique associé, {. En d'autres termes, les seules valeurs observables de la propriété © 


sont les valeurs propres (notées par exemple: o) de l'opérateur f ! 


# 


0 & = 9k & (42.19) 
OPÉTAEU  jèmefonctionpropre  k-ème valeur propre  k-ème fonction propre 


Les vecteurs propres et les valeurs propres d'un opérateur ont une signification spéciale: les valeurs 
propres sont les valeurs pouvant résulter d'une mesure idéale de cette propriété, les vecteurs propres étant 
les états quantiques du système lors de cette mesure. 


C'est à cause de ce postulat qu'il est important de s'assurer que toute propriété physique soit représentée 
par un opérateur hermitique. En d'autres termes, l'hermiticité de { assure que ses valeurs propres (donc 
notées par exemple: o) sont réelles. 


Faisons la démonstration d'abord avec les notatins algébriques habituelles et ensuite avec une autre 
approche en utilisant la notation de Dirac. 


Démonstration: 


Puisqu'un opérateur est associé à une fonction propre et une valeur valeur propre par la relation (cf. 
chapitre d'Algèbre Linéaire): 


En utilisant la propriété démontrée lors de notre étude des nombres complexes dans le chapitre Nombres 
comme quoi le conjugué complexe du produit de deux nombres complexes est égal au produit des deux 
nombres conjugués, nous avons: 


Si nous multiplions la dernière relation par le conjugé complexe de &, et intégrons sur tout l'espace, nous 
avons: 


[a Ôgar = 0ÿ [ .g.dW (42.22) 
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et de même avec la relation antéprécédente: 


[a Ôg ar = dy [ BAdV (42.23) 


Comme par définition £ est hermitique (donc égal à son propre conjugé complexe), les deux côtés gauche 
des deux relations précédentes sont égaux. Nous avons alors: 


[Aa = & [amer (42.24) 
Il vient alors: 
(0x — Se Il Bad = 0 (4225) 
et comme l'intégrale est physiquement de carré sommable et donc non nulle, cela impose que: 
Ox —Ox = 0 (42.26) 
et donc: 
Oÿ = Gx (42.27) 


et cela n'est possible que si la valeur propre est réelle. 
Maintenant, avec la notation de Dirac et avec une approche un tout petit peu différente: 


Puisqu'un opérateur est associé à une fonction propre et une valeur valeur propre par la relation (cf. 
chapitre d'Algèbre Linéaire): 


Ol&)=ealæ&) (4220) 
Nous avons alors si la fonction propre est normée en notation de Dirac: 
x =(@l0lm) (422) 


Et si l'opérateur { est bien un opérateur hermitique (donc égal à son conjugé complexe s'il s'agit d'une 
fonction et égal à la transposée complexe s'il s'agit d'une matrice), nous avons: 


% = (A Êla}= (a jôt [a )=(@ CIPSE œ (4230) 
Donc si l'opérateur est bien hermitique nous avons: 
Ok =0x (42.31) 


et ceci ne peut être satisfait que si les valeurs propres sont réelles. 
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[IC.Q.F.D 


Ainsi, les valeurs propres d'opérateur hermitiques sont toujours des nombres réels (heureusement.…). 
1.5. 5ÈME POSTULAT: MOYENNE D'UNE PROPRIÉTÉ 


Ce postulat est le moins intuitif et le plus difficile à démontrer (nous le démontrerons par l'exemple lors 
de l'étude du théorème d'Ehrenfest). Son énoncé est le suivant: 


La valeur moyenne (espérance) d'une propriété physique {? , quand le système se trouve dans l'état décrit 
par la fonction normalisée % est donnée par (attention à ne pas confondre la notation de la moyenne d'un 
opérateur avec celle du conjugué complexe d'une valeur propre!!!): 


(o)=0=[rôvar = (vélr\| 222) 


Une expression équivalente et que je trouve compliquée est la suivante: la probabilité de trouver la valeur 
propre 2, (de l'opérateur {5 majoritairement hermitique ), lors d'une mesure de la propriété € effectuée 
au temps t sur un système quantique préparé dans l'état décrit par la fonction %', est donnée par le carré du 
module de la projection de la fonction % sur la fonction propre & associée à la valeur propre 2, (et son 
opérateur): 


Plo,.f 


(42.33) 


F 


gi=kalr) 


où la "projection" (ou "représentative") est définie par: 


(a. |?}= [arar (42.34) 


l'indice k étant ici pour indiquer qu'il peut y avoir pour certains opérateurs plusieurs valeurs et vecteurs 
propres. 


Remarque: Nous reviendrons sur ce formalisme et ces relations plus tard. Cependant, plusieurs 
exemples pratiques sont proposés dans le présent chapitre et celui d'Informatique Quantique ainsi 
qu'un seul et bel exemple à la fin du chapitre de Chimie Quantique (pour le rayon moyen et le moment 
cinétique moyen). 


Par exemple, à une dimension et pour un système dépendant du temps, nous aurons en utilisant les 
opérateurs présentés dans le postulat précédent (mais sur lesques nous reviendrons en détails): 


{x} = (TiTax = Î Pr Yax = {x PYax 


(p}= [PS Vax = [P(h0, | Par = hf P as de 


(E)= (TÉYAr= | Tiina, (Far = hf D dx 
, , FA 


Dont nous verrons des cas pratiques dans les chapitres déjà mentionnés! 
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2. PRINCIPES D'INCERTITUDES CLASSIQUES 


Avant de s'attaquer directement à la physique quantique et à ses outils mathématiques (et pseudo- 
démonstrations des cinq postulats), nous devons d'abord introduire un exemple classique simple dans 
lequel apparaît un type particulier de phénomènes: la présence intrinsèque de l'incertitude dans toute 
mesure. 


Cette étude sous forme classique et fondamentalement pas très rigoureuse, nous aidera à mieux 
appréhender l'incertitude quantique (nous l'espérons) que nous étudierons et déterminerons plus tard et qui 
elle n'est pas d'origine expérimentale! Cependant il s'agit vraiment d'une des approches utilisées par 
Heisenberg lui-même! 


Imaginons que nous souhaiterions mesurer au moyen d'un microscope l'abscisse x d'une particule et les 
composantes de sa quantité de mouvement ? . Pour que la mesure de x soit possible, il faut qu'un faisceau 


de lumière monochromatique (pour simplifier) parallèle à ©, vienne éclairer la particule, et donc qu'au 
moins un photon vienne frapper la particule et parvienne à l'oeil de l'observateur: 


Objectif 
| Photgn diffusé 


Figure: 42.1 - Microscope de Heisenberg 


Une fois x mesurée, nous pouvons imaginer n'importe quel procédé pour mesurer la quantité de 
mouvement. 


Un certain nombre de physiciens appellent cette configuration qui permet d'introduire de manière 
pédagogique les incertitudes le "microscope de Heïisenberg". 


Posons & comme étant l'angle que fait la direction du photon après le choc, avec ©,. Supposons pour 
alléger les calculs que la particule ait une masse assez élevée pour que nous puissions négliger le 
changement d'énergie du photon. Nous voyons qu'après le choc, les composantes de la quantité de 
mouvement du photon diffusé selon ©, et ©, sont: 


kv . kv 
— sin Œ,—CcosÆ (1236) 
C c 


Effectivement, rappelons que les relations entre les ondes électromagnétiques, l'équivalence masse- 
énergie et la quantité de mouvement (cf. chapitre de Relativité Restreinte) sont les suivantes: 


kv kv  kv 
E = mc° RD ME > p=MV=ME=— 
c c 
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Il s'ensuit que la particule, elle verra sa quantité de mouvement altérée. Les composantes de sa variation 
sont alors (ne pas oublier qu'initialement elle était nulle en z) celles de la variation du photon selon: 


kv kv 
—(l-sind),-—cosæ (4228) 
€ € 


entre sa quantité de mouvement initiale et finale. 


La seule information que nous possédons sur l'angle &', c'est que ce dernier est , en valeur absolue, 
inférieur ou égal à l'angle d'ouverture u de l'objectif du microscope (restriction technique). 


Donc cela implique que: 
sin ae sinu cosu <fcosal<sin (4239) 
2.1. PREMIÈRE RELATION D'INCERTITUDE CLASSIQUE 


Quand nous aurons mesuré la quantité de mouvement Z à la fin de l'expérience, nous avons vu qu'il 
faudra donc effectuer les corrections: 


kv kv 
—(1-sin&),-—cosæ (4240) 
€ € 
de la quantité de mouvement du photon pour savoir la vraie valeur de % de la particule juste avant le 


début de la mesure. 


Dans ces corrections, il y a une partie inconnue qui correspond à des erreurs de mesure sur », et ?, du 
photon. Il est possible d'établir que l'erreur maximale de p,et Âp, sur la quantité de mouvement initiale 
est donnée par la composante x de la "première relation d'incertitude d'impulsion classique": 


hv . 
Ép, = —sinxl| (4241) 
€ 


puisque nous avons {sin 4] < sinx . Il s'agit donc de l'erreur au pire en quelque sorte! 


2.2. DEUXIÈME RELATION D'INCERTITUDE CLASSIQUE 


Voyons maintenant ce qu'il en est de la mesure de la position de la particule. 


Rappelons maintenant que (cf. chapitre d'Optique Ondulatoire) pour une fente rectangulaire nous avons en 
posant # = 1: 


. À 
sin # =— (4242) 
e 


où &# (en optique ondulatoire) est l'angle permettant de distinguer clairement deux minimas de diffraction 


(et donc clairement un objet émettant un rayonnement identique entre deux points). Inversement, du point 
de vue de la diffraction, l'ouverture e est donc donnée par: 
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À 


sin 9 


e = 


La valeur de e peut aussi être vue comme le champ de vision (projection orthogonale de la fente sur l'axe 
X) de largeur x = & de la particule. Dès lors: 


À 


sin # 


X = 


(42.44) 


Au même titre que l'erreur maximale sur la quantité de mouvement est donnée par la condition 
sin a] < sinx , nous pouvons aussi écrire |sin 8] < sin , ce qui nous amène à écrire que: 


x si u 42 45) 
sin ti 
Si nous multiplions: 
hv . He. 
Êp, = —sinu = —sinx 
€ À 
et : 
À 
x =— (4246) 
sin té 


nous obtenons la "deuxième relation d'incertitude classique" également appelée "l'incertitude spatiale 
classique": 


Ax£p, = h| (42.47) 


qui représente donc l'erreur maximale expérimentale d'un microscope à faible ouverture rectangulaire (que 
de conditions!). Beaucoup d'ouvrages de physique quantique montrent que nous retrouvons exactement la 
même expression dans beaucoup de situations. 


Remarque: Le lecteur vérifiera sans peine que cette relation appliquée pour un objet macroscopique 
(de l'ordre du centimètre) dont la position serait mesurable avec une précision de l'ordre du 
micromètre donne une incertitude ridiculement faible sur la quantité de mouvement et donc la vitesse. 
Par contre, la même relation appliquée pour la masse d'une particule telle que l'électron avec une 
précision de mesure de la position supposée du dixième de nanomètre donnera une incertitude sur la 
vitesse de l'ordre 1'000 [m/s]...!! 


Ainsi, si nous essayons de situer une particule avec une précision de plus en plus grande, sa quantité 
de mouvement atteint des valeurs extrêmes. À un certain point, la quantité de mouvement peut être si 
grande que l'énergie correspondante est suffisante pour produire une paire de particule-antiparticule. 
En d'autres termes, si nous essayons de confiner une particule dans une boîte de plus en plus petite, 
d'une part, nous connaissons de moins en moins sa quantité de mouvement et à partir d'un certain 
seuil, nous ne savons même pas combien de particules il y a dans la boîte! 
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Cependant (!), nous verrons lors de l'étude des commutateurs appliqués à la théorie de la physique 
quantique, que la vraie relation d'incertitude (dont la valeur diffère de celle ci-dessus) apparaît tout 
naturellement uniquement à partir de propriétés mathématiques et de la définition de la quantité de 
mouvement. 


Plus généralement, pour une particule dans un volume à dimensions (x, y, z), un état classique est 
caractérisé par les 6 quantités (x,y,Z,P,,P,,P.) dans l'espace de phases (espace de phases qui est donc 
de dimension 6) et l'état quantique occupe le "cube" de volume: 


(AxAp, )(2yAp, 2e 2p,) = (02.48) 


Ce qui est remarquable dans cette approche simpliste c'est que la constante de Planck émerge 
naturellement comme l'unité de mesure universelle minimale d'incertitude de la physique expérimentale 
au travers du dualisme onde-corpuscule! Heisenberg écrivit que ce résultat établit l'échec final de la 
causalité en physique quantique. 


2.3. TROISIÈME RELATION D'INCERTITUDE CLASSIQUE 


En relativité restreinte, nous avons vu que x, y, z, ct constituent les composantes d'un quadrivecteur 
d'espace-temps ainsi que ?,,2,,P.,#/€ celles d'un vecteur d'énergie-impulsion. 


Il est donc naturel de compléter les trois relations spatiales du type ÂxÂp, = k par extension: 


xp, > dxâp, =h 
Y—P, > dyBp,=h 
Z—p, > AzÂp,=h (4249) 
———————+————— 
ct A epafE} 


rm 


Nous obtenons ainsi grossièrement la "troisième relation d'incertitude classique" appelée également 
"incertitude temporelle classique": 


At.AE = BR] (42,50) 


Cependant (!), nous verrons lors de l'étude des commutateurs appliqués à la théorie de la physique 
quantique, que cette relation d'incertitude (dont la valeur diffère de celle ci-dessus) apparaît aussi tout 
naturellement à partir des seules propriétés mathématiques et de la définition de la quantité de 
mouvement. 


Remarque: Nous reviendrons plus tard sur les implications de cette incertitude temporelle dont les 
implications sont à la base de la cosmologie quantique (et de la création de notre Univers) et de la 
théorie quantique des champs en particulier en ce qui concerne le potentiel de Yukawa (cf. chapitre de 
Physique Quantique Des Champs). 
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Les incertitudes classiques établies vont nous permettre de mieux comprendre les incertitudes sous leur 
forme quantique réelle. Pour cela, parmi d'autres, il va nous falloir faire usage de l'artillerie mathématique 
nécessaire. Cependant, dans un souci de clarté, nous avons souhaité présenter la physique quantique 
ondulatoire de la manière la plus simple et la moins formelle possible. Cette présentation peut porter le 
lecteur à de nombreux contresens et il doit donc rester prudent tant qu'il n'en a pas vu la démonstration 
rigoureuse ! 


3. ALGÈBRE QUANTIQUE 


Sous ce terme peu courant et non officiel "d'algèbre quantique" (donc à ne pas en abuser!) nous souhaitons 
introduire et rappeler au lecteur des outils " mathématiques qui vont nous être très utiles pour résoudre 
certaines équations de la physique quantique. Il est donc de première importance de comprendre (ou 
d'avoir compris, en ce qui concerne les rappels) au mieux ce qui va suivre! 


Remarque: Les puristes risquent de grimper aux rideaux en lisant … 


3.1. OPÉRATEURS LINÉAIRES FONCTIONNELS 


Définition: Les "opérateurs linéaires" sont des êtres mathématiques agissant sur des fonctions ou vecteurs 


(cf. chapitre « ) 


Les fonctions sur lesquelles peuvent opérer ces opérateurs peuvent être des fonctions d'une seule variable 
x, soit f(x), ou des trois coordonnées d'un point x, y, z soit {{x, y, z) ou écrites encore plus brièvement f (x). 


Nous serons amenés à écrire des intégrales de ces fonctions, qui sont le plus souvent étendues à tout 
l'espace. Dans le cas d'une fonction des trois coordonnées spatiales d'un point, nous adopterons la notation 
suivante: 


[f (dd°x = [EF (x, y,z)dxdydz 


Ces notations, indispensables pour l'allègement des expressions que nous rencontrerons en physique 
quantique étant établies, nous en revenons à nos opérateurs. 


Partant d'une fonction f, si nous savons lui associer une fonction g de même nature, c'est-à-dire dépendante 
des mêmes variables, nous pouvons dire que g est le résultat de l'action d'un opérateur & sur feet écrire 
cela symboliquement comme un produit simple: 


ga 


Mais nous introduisons tout de suite une restriction fondamentale: seuls nous intéressent les opérateurs 
linéaires (comme en algèbre linéaire quoi...), c'est-à-dire par exemple tels que: 


a rh alex le A)rA lo p] 


quels que soient les coefficients À, et À... 


Une catégorie très simple d'opérateurs est constituée par les nombres (scalaires réels ou complexes). Aïnsi 
dans la relation : 


LeNT 
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*X est une fonction qui dépend linéairement de f, au travers d'un opérateur linéaire que nous écrivons À, 
À étant un nombre (typiquement l'opérateur de position en physique quantique). 


Il y a deux cas particuliers importants: 


1. Opérateur zéro: À = 0 où x = 0’ .f = Ô sera une fonction bien évidemment nulle partout... 


2. Opérateur unité (ou identité): À = 1 où x = l'.f = 1 (ce qui est tout aussi simple...) 


Remarque: L'opérateur "Nabla” est également un opérateur linéaire fonctionnel (nous le verrons un 
peu plus loin) qui en physique quantique se retrouve dans l'opérateur d'énergie. 


Nous vérifions sans peine pour les opérateurs fonctionnels que ces derniers sont (voir les chapitres de 
Théorie des Ensembles et Algèbre Linéaire au besoin): 

- commutatifs par rapport à l'addition 

- associatifs par rapport à l'addition et la multiplication 


- distributifs par rapport à l'addition à gauche et à droite 


Jusqu'à présent, rien ne distingue l'algèbre des opérateurs de celle des nombres. Mais il y a cependant deux 
propriétés qu'il faut toujours avoir en tête pour ne pas commettre des erreurs quand nous faisons du calcul 
d'opérateurs: 


1. Deux opérateurs ne commutent pas en général par rapport à la multiplication (comme en algèbre 
linéaire), c'est-à-dire qu'en général soient deux opérateurs fonctionnels & et £: 


a'£Sé f'& (4255) 


2. Si nous rencontrons une expression telle que &,'#8 +8: «,, nous n'avons donc pas le droit d'effectuer 
en général, la mise en facteur (il s'agit donc d'une structure particulière de groupe qui est non-commutatif)! 


Exemple: 


Un exemple simple et important, car utile pour la suite (très proche d'un cas pratique que nous verrons 
plus loin), de deux opérateurs qui ne commutent pas avec une fonction d'une seule variable est le suivant 
(où f est quelconque). Considérons l'opérateur d/dx agissant sur xf(x): 


2 {x f)=1f+x—f (4256) 
dx 
en simplifiant par f : 
d d 
—_x=]l+x— (42.57) 
dx dx 


Donc nous avons ci-dessus un exemple de deux opérateurs qui ne commutent pas puisque: 
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Remarques: 


R1. Si un opérateur peut commuter n'importe comment avec un autre opérateur, c'est que ce dernier 
est un nombre (cela rejoint le concept de mesure dont nous avons fait mention dans les postulats). 


R2. Lorsqu'un état (une fonction mathématique au sens formel) est inchangé par un opérateur, l'état est 
alors appelé "état propre" ou "vecteur propre" du système (nous verrons des exemples pratiques plus 
loin). L'état est alors parfaitement mesurable et est assimilé à l'observable classique. 


+ Exemple (d'opérateur): 


Partons de l'équation de Schrüdinger tridimensionnelle (que nous démontrerons plus loin) à admettre pour 
l'instant: 


dy 4 JT 87m 


8x? dy? 87° ph? (Eu ” E4)Y =0 (42:59) 


ou bien écrite autrement (c'est plus esthétique...) avec le laplacien d'un champ scalaire %? = A (cf. 
chapitre de Calcul Vectoriel): 


2 2m 
AT +7 (Eu —E,})Y=AY TS W)F=0 (42.60) 
ou encore: 
2 


Fi GE — Epx)Ÿ = AY (4261) 


autrement encore..: 


2m 


rl (Eos — Eyr)=— À (4262) 


Alors l'opérateur énergie totale (l'hamiltonien H en d'autres termes.) s'exprime comme: 


p2 
E,, = .. A+E,, (4263) 
ou en notation lagrangienne: 
2 
H=-—— A +ÿF| (42.64) 
2m 
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Remarque: Nous retrouvons ici naturellement la deuxième expression donnée dans le deuxième 
postulat mais la notation V pour l'énergie potentielle peut porter à confusion avec le potentiel 
électrique. 


D'autre part, nous savons que: 


Les deux dernières expressions doivent être identiques. La seule possibilité pour satisfaire à ces égalités 
est de poser: 


qui sont les "opérateurs hermitiques de la quantité de mouvement" en physique quantique (exprimés en 
coordonnées cartésiennes) et dont il faudra se rappeler tout au long de ce chapitre! 


Remarque: Nous retrouvons ici naturellement un des opérateurs cités dans le troisième postulat. 


Nous pouvons vérifier la légitimité de ces opérateurs en les réinjectant dans l'expression de l'énergie 


cinétique: 
2 24+p+pi! . : u 
ee De | PA ES PP D PP 
2m 2m 2m ôx dy œ 


? 2 2 ï 2 2 2 e 
1 PU PAS DANS PEL Le CNRS (42.67) 
2m 8x? &° 8z° 2m 87 dy? 


Par ailleurs, il est aisé de vérifier que ce développement reste juste si nous prenons le conjugué complexe 
de l'opérateur de la quantité de mouvement. 


Ainsi, l'opérateur d'énergie totale (l'hamiltonien) est, lui aussi, bien hermitique! Ce résultat est très 
important pour vérifier par exemple des calculs en utilisant la propriété d'orthogonalité des fonctions 
propres que nous verrons plus loin. 


3.1.1. OPÉRATEURS ADJOINTS ET HERMITIQUES 
Remarque: La lecture des lignes qui vont suivre pourrait s'avérer assez abstraite. Cependant, si vous ne 


comprenez pas grand-chose ce n'est pas bien grave car souvent tout devient évident pendant l'étude et 
les développements d'exemples concrets qui seront donnés plus loin. 


Considérons les deux intégrales étendues à tout l'espace (à l'intérieur de l'intégrale il s'agit d'une 
multiplication de fonctions et d'opérateurs) sans chercher à comprendre leur utilité pour l'instant: 
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= fF@: dax et Ÿ = [78 Pdx (42.68) 


où rappelons que la notation Z est le conjugué complexe de z. Il faut savoir que dans ces deux intégrales, 
Cet Ê représentent des opérateurs. 


Nous constatons dans les développements de la physique quantique que ces deux intégrales sont égales 
(donc donnant des valeures réelles) et qu'il y a entre les opérateurs €Cet £ une correspondance 


biunivoque, nous disons que £ est "l'adjoint" de EC (la transposée de la conjuguée) ou qu'il est 
q 


"hermitique" (les deux termes sont d'usage) et nous écrivons: 


si les deux intégrales précédentes sont respectées. 


De cette définition, nous déduisons l'identité importante suivante: 


(42.70) 


[Ata: rax - [ [ra fax | 


Exemple: 


Considérons: 


Alors par intégration par parties: 


LE à? = (à 
| fiay)idxr= T7(£ Jé- (f yl+o)- f y(-wi)- (2 7) rar 
Le Le dx . dx 
(42.72) 


+0 d + FT à +0 — —— Ro 
=- | (Se 7}e x = Î (-L/ x = f vla f dx = F EN A | 7lalflax 


—0 — — — 


Remarque: Nous démontrerons, plus loin, la relation ci-dessus dans un exemple concret mais 
particulier de la physique quantique des champs (chapitre suivant) et nous y reviendrons de manière 
plus rigoureuse dans notre présentation du formalisme de Dirac dans le chapitre de Physique 
Quantique Relativiste. 


L'opérateur adjoint a plusieurs propriétés, dont les seules qui vont nous intéresser dans ce chapitre sont: 


t . a. , : ne a 
P1. (a) = & qu'il est inutile de démontrer, car cette relation découle de la définition même de 


l'opérateur adjoint. 


P2. À étant envisagé comme un nombre complexe (opérateur particulier) nous avons alors 41 = 4.Ce 
que nous avons vérifié juste avant par l'exemple avec l'opérateur de quantité de mouvement! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Une catégorie extrêmement importante d'opérateurs est donc constituée par les "opérateurs hermitiques 
self-adjoints", ou plus simplement "opérateurs hermitiques" égaux par définition à leurs adjoints: 


aæ=a (4273) 
puisque ce sont les seuls qui émergent dans les développements de la physique quantique ondulatoire. 


Nous remarquons aussi que si nous prenons un opérateur hermitique (comme celui de la quantité de 
mouvement pour faire simple par exemple...) et que nous multiplions celui par le nombre imaginaire 
unitaire pur i alors il devient antihermitique, c'est-à-dire: non-hermitique. 


Remarque: Les termes "hermitique" ou "hermitien" sont équivalents et rappelez-vous que ces 
opérateurs peuvent être aussi des matrices! 


Un opérateur quelconque, soit &, peut se décomposer d'une façon unique en parties hermitique et 
antihermitique, c'est-à-dire que nous pouvons écrire: 


é=+if (4274) 
où &, £ sont donc hermitiques . 
Démonstration: 
Si: 

El=a-i8 (4275) 


car il s'agit d'un simple nombre complexe, alors: 
1 t l Î os 
æ= ; +é }8=-(é-é ) 4276) 


La somme de l'opérateur et de son adjoint est donc un opérateur hermitique (la somme ou la soustraction 
entre opérateurs hermitiques, reste donc hermitique). 


En général, il est trivial que le produit de deux opérateurs hermitiques (æ: 8) n'est pas nécessairement 


un opérateur hermitique, car nous vérifions que la condition pour laquelle le produit de deux opérateurs 
hermitiques soit lui-même hermitique, est que les deux opérateurs "commutent" (voir ce qui suit). 


3.1.2. COMMUTATEURS ET ANTICOMMUTATEURS 
Définitions: 
D1. Le "commutateur" de deux opérateurs & et £, s'écrit: 


[a, #1= &8- Sa =[æ,81| (4277) 


D2. "L'anticommutateur" de deux opérateurs & et À, s'écrit: 
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(SCIENCES. CH] 
[a&, #1, = af + Ba| (42.78) 


qui s'écrit générallement aussi sous la forme suivante: 


(a, 8} = aB+ 6 (42.79) 


Remarques: 


R1. Comme le commutateur est beaucoup plus fréquent dans les développements que 
l'anticommutateur, s'il n'y a pas de confusion possible, nous le notons donc simplement [&, #1]. 


R2. Des exemples concrets et triviaux de ces commutateurs dans le cadre de notre étude de la 
physique quantique ondulatoire seront présentés dans le texte qui suit. 


Citons quelques propriétés évidentes des commutateurs (celles que nous utiliserons le plus): 


La, 81= 6, a] 
[Aa + 2,6] A[a,6]+Æ4[&,6] (42.80) 
La, A6 + LÉ] Ala, 4T+ Ale, &] 


où 4,4, sont des nombre quelconques (les démonstrations sont faites - au besoin - pendant le 
développement d'exemples pratiques). 


Cherchons l'adjoint de [&, 6]: 


La. Al = (a8- 8)! = (flat ai 8) (201) 


d'où un résultat très simple: 


La, 81 =[8!,al] «282 


ce qui pourra se vérifier aisément avec l'exemple pratique que nous ferons juste quelques lignes en- 
dessous. 


La relation suivante est très utile dans la pratique (triviale, mais comme d'habitude au besoin nous 
pouvons rajouter la démonstration): 


[aa ,81= ala,, #1+[æ,6læ, (42.85) 


nous avons de même: 


[& 44] 4l& 4]+[a, 418 (4284 


Nous démontrerons plus loin dans un cas concret, que si deux opérateurs ne commutent pas, alors il est 
impossible d'avoir un état ayant une valeur précise et unique pour les deux opérateurs à la fois (en 
physique quantique il existe une configuration d'expérience où le premier opérateur représente la quantité 
de mouvement et le second la coordonnée spatiale). Ce résultat implique que les opérateurs sont souvent 
nommés des "observables". 
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Attardons-nous un moment sur un exemple concret des commutateurs et dont un des résultats est 
fondamental! 


Nous avons démontré plus haut les relations: 


Considérons la relation (simple différentielle mathématique habituelle): 
à â . 
—[xyÿ{x)] = x— YA x) +YAÂxX) (42.86) 
ax ax 


Si nous divisons par #{x) des deux côtés de l'égalité et qu'ensuite nous multiplions par */i, nous 
obtenons: 


ce qui nous donne: 
P,X =XP,-iR XP, —P,X=ih (4288) 


donc il vient que le commutateur de x et », est égal à 5h et donc que les quantités ne commutent pas. 
Nous avons donc la "relation d'anticommutation" suivante: 


[x,2,]=5ih| (42.89) 
(cycl.) 


Ce que nous retrouvons souvent dans la littérature sous la forme (avec le symbole de Kronecker): 
[# 2 | =iRO y (42.90) 


Ainsi (en nous basant sur le deuxième postulat), les deux observables x et »,, dont les opérateurs ne 


commutent pas, ne possèdent pas une base de vecteurs propres commune. Ils ne sont donc pas 
simultanément mesurables avec précision et constituent donc une incertitude d'Heisenberg! 


Remarques: 


R1. L'abréviation (cycl.) signifiant que l'on peut permuter circulairement les lettres (x, y, z) et que le 
résultat reste le même. 


R2. Bien que ce résultat puisse paraître étonnant, il n'en est pas moins extrêmement correct puisque 
découlant d'un raisonnement mathématique. Nous ne pouvons pas faire plus simple et rigoureux. 


Considérons donc maintenant aussi la relation: 
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à 4 
— LD (x)] = »— 4x) (4291) 
8x 8x 


et en procédant de la même manière que précédemment, nous obtenons: 


[y,2,1=0[ (42.92) 


(cycl.) 
Les deux relations: 
[x,p,]=ih et[y,p,]=0 (4293) 


peuvent se résumer à: 


[re Pi] [ge Pi © GPi — Pire IR Og 


en utilisant les coordonnées et moments généralisés et sont remarquables sous plusieurs angles: 


- Premièrement, parce qu'à partir de considérations purement théoriques et mathématiques nous 
retrouvons également en physique quantique une incertitude équivalente (mais pas égale!) à celle obtenue 
lors de notre étude des principes d'incertitudes de Heïisenberg (qui rappelons-le avaient été obtenues à 
partir d'un cas pratique classique). 


Effectivement, si nous prenons le module du commutateur de gauche, nous avons alors la "relation 


d'incertitude spatiale de Heisenberg": 
x, 2,1 =h (42.95) 


qui rappelons-le, peut également s'écrire sous la forme: 


À 
Lx,v,]=— (42.96) 
Fr 


La constante de Planck étant extrêmement petite, cela explique que cet effet est impossible à détecter à 
notre échelle macroscopique. Par contre, la masse des électrons étant extrêmement petite aussi, la fraction 
ci-dessus devient notable pour un électron et l'effet de cette incertitude est important! 


Enfin, par commutation des composantes du quadrivecteur impulsion (cf. chapitre de Relativité 
Restreinte), nous avons la "relation d'incertitude temporelle de Heisenberg": 


[4 EÏ=%| «297 


Une conséquence fantastique découle de l'incertitude sur le temps et l'énergie et de la relativité. 
Imaginons-nous le vide le plus total (vide quantique) et supposons que nous regardions ce qui se passe en 
un point de l'espace donné pendant un temps très court. Alors le principe d'incertitude temporelle nous dit 
que l'énergie de cet état (le vide!) est très imprécise. Or la relativité dit que l'énergie, c'est aussi de la 
masse (et aussi un champ), donc des particules. Donc, pendant ce temps très court des particules peuvent 
apparaître spontanément du vide ! Nous les appelons des "particules virtuelles" car elles disparaissent très 
vite et sont engendrées par les "fluctuations quantiques du vide". 
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Cette variation est suffisamment faible pour que nous puissions la mesurer aujourd'hui avec nos 
instruments. Cependant, nous en observons les effets seulement dans les grands collisionneurs de 
particules de la planète. 


- Deuxièmement, ces relations sont remarquables parce que l'incertitude est une valeur complexe. Ce qui 
amène à considérer que le corps des complexes est inhérent à la structure réaliste de notre environnement 
(espace-temps) au niveau du monde quantique. Le monde quantique est donc un monde d'incertitude 
complexe. Et cette probabilité ne semble pas être une conséquence de notre imprécision ou de notre 
ignorance mais semble bien être une propriété intrinsèque de la nature. 


Remarque: Les relations et propriétés de commutation et d'anticommutation seront indispensables 
pour développer la théorie quantifiée du moment cinétique et du spin. 


3.2. REPRÉSENTATIVES 


Introduisons maintenant les notations quantiques contemporaines, que nous considérons pour l'instant 
comme des abréviations d'intégrales portant sur des fonctions d'ondes, nous écrirons (dans le but futur de 
calculer des densités de probabilités): 


(4 2)= [8 tax et {wla|7}= [Fa Pax 


car il s'agit d'un produit scalaire fonctionnel complexe ( 


Avec cette notation, la relation que nous avions présentée plus haut lors de notre étude des opérateurs: 


[Ft dax -[f7 (a! wax | 
devient (c'est plus léger déjà... mais moins pédagogique): 


@lalr}=(rla lu 


Cela dit, l'ensemble E des fonctions Ÿ qui nous intéressent en physique quantique ondulatoire constitue 
un espace linéaire fonctionnel. Effectivement, en physique quantique, les équations différentielles que 
nous devons résoudre (équation de Schrôdinger) pour décrire le comportement d'une particule, sont telles 
que la solution générale peut être très souvent décomposée en la somme des solutions particulières (nous 
démontrerons cela!). En mathématiques, nous disons alors que les états sont linéaires, c'est-à-dire que 
toute combinaison d'états est encore un état. 


LEA 


Ainsi, l'état d'une particule est, comme nous le démontrerons plus tard, représenté par un "état quantique" 
ou un "vecteur d'état" noté |T} qui correspond aussi à une fonction mathématique la décrivant 
complètement. 


Par exemple, si [Ÿ,} et | T,} sont deux états possibles, alors: 


(P1)+ 182) 


est également un état possible pour le système (de par la propriété des espaces linéaires fonctionnels). 
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Revenons maintenant à notre espace linéaire fonctionnel (ou "espace linéaire des états"). Le fait que 
l'ensemble E des fonctions # qui nous intéressent constitue un espace linéaire fonctionnel signifie que si 
We Æ,4€ Æ, nous avons aussi: 


(Ayw+y7)eEÆ (42102) 
quels que soient les coefficients 4 et Æ (cf. chapitre de Calcul Vectoriel). 


Si les fonctions #’ constituent un espace, il est alors naturel de chercher à les rapporter à une base 
orthonormée. Ainsi, une suite de fonctions (qui sont les fonctions propres) & € Æ constituera une base 
orthonormée si nous avons (forme de relation démontrée en calcul tensoriel): 


(a le, = à; (42.103) 
où nous le rappelons, ä; est le symbole de Kronecker (cf. chapitre de Calcul Tensoriel). 


Définition: La base est dite "base complète" si bien évidemment toute fonction #€ Æ peut se développer 
en série des fonctions propres & telle que: 


7 > aa (42.104) 
è 


où c; est un nombre quelconque (c'est en partie ici qu'il faut revenir aux quatrième et cinquième postulats 
de la physique quantique ondulatoire). 


Calculons maintenant le produit scalaire fonctionnel (cf. chapitre d'Analyse Fonctionnelle): 
fe "Wax = (e, ) … fe D amdx = D'afrade> c EC; (42105) 
E E E 
Cette dernière relation montre que nous avons identiquement (nous changeons la notation des indices): 


c; ={glw) (42106) 


Ainsi, dans une base orthonormée complète & , une fonction # sera bien décrite par la donnée des 
coefficients c;. Nous aurons souvent intérêt à les mettre sous le format de la matrice représentative de 
# dans la base & : 


(42.107) 


Considérons maintenant un opérateur & tel que: 


tæw=a DXT: (42.108 
i 
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Mais nous pouvons également écrire (remarquez l'apostrophe dans la relation!): 


> du DRE ‘a 1 @ (42109) 
Multiplions cette dernière relation par &; et calculons le produit scalaire fonctionnel: 
[& ‘vas [& | 2e c;' qdx = 2: [ ‘a'adx= 2 (e, lala) 724 (42.110) 
À comparer avec (obtenu plus haut): 
(e;|w) - x (42.111) 


En notant À;, la "matrice représentative" de & dans la base & , nous pouvons d'après la relation: 


Qlalz)=(rlaflu} 21) 


écrire finalement: 


(g, lala}= 4, ={a læl|e,} = Aÿ (42.113) 
3.3. VALEURS ET FONCTIONS PROPRES 


Soit un opérateur & (hermitique ou non). Le nombre a est dit "valeur propre de l'opérateur" de &, s'il 
existe une fonction # non identiquement nulle telle que (pour un rappel de notions similaires voir le 
chapitre d'Algèbre Linéaire): 


&'Pra'P (12114) 


& est alors une "fonction propre" (en analogie avec les "vecteurs propres") de &, associée à la valeur 
propre de a. Notons que a peut très bien être nul (vous comprendrez mieux cela au moment où nous 
passerons à l'étude de cas concrets). 


En des termes plus physiques, cela revient à dire que lorsqu'un état (une fonction mathématique au sens 


formel telle que ©) est inchangé par un opérateur, l'état est alors appelé "état propre" ou "vecteur propre" 
du système. 


Soit l'ensemble Æ, des fonctions propres associées à a et un espace linéaire fonctionnel, que nous 


nommerons le "sous-espace propre associé" à a. Le nombre de dimensions de Æ, s'appelle 
"multiplicité" (ou "ordre de dégénérescence") de la valeur propre a, et nous le notons g. 


Soit maintenant a une valeur propre simple, ou non dégénérée, £ = 1. Cela veut dire qu'il y a une seule 
fonction propre associée à a, à un coefficient multiplicatif non nul près. 


Si £ = 2 (valeur propre double), nous pouvons trouver deux fonctions propres non proportionnelles (non 
liées) associées à a, etc. 


Exemple: 
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Voyons un exemple particulier d'une fonction propre avec une valeur propre autre que le cas classique de 
l'énergie. 


Soit: 


Œ'F =a'# (42115) 
avec & = AE (opérateur que nous avons déjà vu précédemment) et a une valeur propre. 
X 


L'équation devient: 


nn =a%Ÿ (42.116) 
4x 


qui se vérifie aisément si: 


&2x 
y=98| (42117) 


qui est bien une fonction propre de l'opérateur susmentionné et qui nous sera des plus utiles dans ce qui va 
suivre. 


3.3.1. ORTHOGONALITÉ DES FONCTIONS PROPRES 


Deux fonctions (vecteurs) propres ® et #' associées à deux valeurs propres différentes d'un même 
opérateur hermitique & sont orthogonales, c'est-à-dire que: 


{g@lg'}=0 (42.118) 
Démonstration: 


Partons cette fois-ci d'abord avec la notation de Dirac avec deux fonctions propres et deux valeurs propres 
associées: 


œ'o-a' 


æ" g' = a" @' 
(42.119) 


aveca'“a. 


Nous multiplions respectivement les deux relations précédentes par #' ët ®, et nous intégrons pour 
obtenir le produit scalaire fonctionnel: 


a) (glde)=a(gle) 


o (gkie}=a' (ele) 
(42.120) 


Rappelons pour continuer que nous avons démontré que: 
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{ylaælz)=érlallgi «2121 


donc si l'opérateur & est autoadjoint (ce qui est le cas de l'hamiltonien comme nous l'avons montré), c'est- 
à-dire que æ = at, nous avons: 


Glalr)={(rlaW) «12 


Dès lors, en retranchant de la relation (1) le complexe conjugué de la relation (2), a étant supposé réel (ou 
un entier.….), NOUS avons: 


(p'lale)-(plalg"} = a {(ele)-a (ele _—.. 
! 1 ' Il L où 25) 
(glalg)-{glalp)-0-a{(plg)-a'(olp}-(a-a)(ple) 
ce qui montre bien que: 
{g@lg}=0 (42124) 
puisque a'“a. 


Faisons maintenant la même démonstration avec l'écritue algébrique classique et une approche un peut 
différente. Nous partons de: 


O [pan-afper 
| . (42.125 
(2) | Pag'dV = a | Rp'àV 
Et comme nous avons démontré plus haut que: 


Î p'agav - Î Palg'dV (42126) 


donc si l'opérateur & est autoadjoint (ce qui est le cas de l'hamiltonien comme nous l'avons montré), c'est- 
à-dire que æ = at, nous avons: 


[S'agar = [axg'ar (42.127) 


Il vient alors que les deux relations (1) et (2) sont égales (ne pas oublier que la valeur propre est réelle!). 
Tel que nous puissions écrire: 


al g'aiv = 4" { Z'dW (42.128) 
Nous pouvons alors écrire: 


(a-a'}[ p'ouv = Ô (42.129) 
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Et donc si les valeures propres ne sont pas égales il est forcé que ce soit l'intégrale qui soit nulle (le produit 
scalaire fonctionnel) et donc que les deux fonctions propres sont orthogonales. 


OIC.Q.F.D 


La même démonstration, mais avec la notation traditionnelle et plus pédagogique donne: 


AY = ET) 
(42.130) 
Si nous multiplions la première équation à gauche par Ÿ; , et la seconde équation par Ÿ) , et que nous 


intégrons sur la totalité de l'espace, nous obtenons les deux expressions suivantes (correspondant donc 
aux valeurs moyennes): 


© ko ko 
[ P24 Pidrdyar = | V,E Pidrdydz = E, | V,Vidrdyaz 

ni Fes (42.131) 
DA Podrdyaz = | VE V,drdydr = E, | VV ,dxdpaz 


—<© —<o 


B—$ à 


Si nous prenons le cas de fonctions réelles, nous pouvons écrire: 


+o ko 

['P24 Pidrdydz = E, | V, Pidrayaz 

Je den (42.132) 
[EH Poaxdpdz = E, | V,Y,dxdpaz 


—© —© 


L'opérateur H étant hermitique (autoadjoint) comme nous l'avons démontré plus haut, nous avons: 
Ko +0 
['EA Poaxdpes = | V,H Yidxdydz (2133) 
—© —( 
et comme £;,#,,Ÿ; sont admis comme étant des fonctions réelles, nous avons aussi: 
ko +0 +0 
E, | Pi Podrdpdr = E, | VV dxdpaz = E, | V,idrdydz (42131) 
—© —© —© 
Donc: 


ko Re RES 
[EH Piardpar - | VA V,drdydr = & | V,Vidrdpdr-E, | PPoardé (2135) 
—© —© 


—© —© 


S'écrit: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


+o co co +o 
[ELA Yiardpar - | V,HYidrdvar = E | V,Vidrdvar-E, | Vida (42156) 


—<o© —<o —<o —o 


Il vient alors: 


Ho 
(A2) | Pod = 0 (2137) 


—© 
ce qui montre bien que Ÿ,,Ÿ; sont orthogonales selon la définition du produit scalaire fonctionnel. 


3.4. FORMALISME DE DIRAC 


Dirac a conçu un formalisme général très pratique, mondialement utilisé par les physiciens, dont nous 
allons donner les éléments essentiels. Les notations utilisées ont d'ailleurs été déjà partiellement 
introduites dans ce qui a précédé. 


Nous utiliserons le formalisme de Dirac pour deux points, le premier étant de mieux comprendre ce qui a 
été vu jusqu'à maintenant lors de l'introduction aux opérateurs fonctionnels, le second étant d'introduire 
une notation et une méthode de résolution que l'on retrouve dans certains ouvrages. Par ailleurs, sur ce site 
par simplification d'écriture, nous utiliserons parfois ce formalisme. 


3.4.1. KETS ET BRAS 


Nous considérons un espace vectoriel Æ, à n dimensions où n peut très bien être infini (espace de Hilbert) 
. Un vecteur est défini par n composantes x; & = 1,2,...,#) que nous pouvons ranger en colonne pour 
former une matrice-colonne: 


(42.138) 


Nous dirons que cette matrice décrit le "vecteur droit" ou le "ket" |x} (cela doit vous rappeler les 
représentatives"). Il est possible d'associer à la matrice colonne la matrice adjointe (transposée 


conjuguée): 


A %..2% (42.139) 


où les x, sont les complexes conjugués des x,. Nous dirons que la matrice ligne adjointe décrit le 


"vecteur gauche" ou le "bra" {xl (cela doit également vous rappeler les "représentatives"). 


L'addition et la multiplication par un nombre 4 vont de soi. Notons que si |y}= 4|x}, nous avons 


trivialement {y|= 4 {x|. 


Avec deux vecteurs de composantes x; et y,, nous pouvons former la quantité suivante, dite "produit 
scalaire hermitique": 
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== |}: 7 
A0. [=D XY (42140) 
Los i 


nous convenons de l'écrire {xl y}. Notons que: 


{x|y}={y]x) («2.141 
le produit scalaire hermitique n'est donc pas simplement commutatif! 


Le produit {x|y} dépend linéairement de {x| et de |y}. Réciproquement si un nombre Q dépend 


linéairement d'un ket |x}, il existe un bra («| tel que: 

Q={alx}) (4214) 
En physique quantique, {xl y} est appelé "l'amplitude" d'être dans l'état x si le système est dans l'état y. Ce 
produit scalaire hermitique sera interprété comme la probabilité que le système physique se projette dans 
l'état x s'il est dans l'état y. 
Une base orthonormée de l'espace étudié est constituée par n vecteurs l} tels que: 

6lj}= 6 «2143) 


où rappelons-le, ; est le symbole de Kronecker (cf. chapitre de Calcul Tensoriel). 


Tout vecteur [x} de Æ, peut se développer sur cette base selon (cf. chapitre de Calcul Vectoriel}: 
x}= > x F) «2149 
1 


où les x; sont les composantes de x} dans la base choisie. Nous vérifions vraiment aisément que (déjà 
vu maintes fois dans le chapitre de Calcul Vectoriel): 


x =G]x) (42145) 
Si un ket |y} dépend linéairement d'un ket |x}, nous écrivons symboliquement: 
lv}=eælx}) (42.146) 


où & est un opérateur linéaire. Soit donc un opérateur linéaire défini par la relation précédente et un bra 
{u|, le produit scalaire hermitique: 


&|y}= &u|[æ1x}]} =Q (42.147) 
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est un nombre Q qui dépend linéairement de É32 D'après ce qui a été vu plus haut, il existe un bra {vl tel 


que © = {v|x}. {v| dépend visiblement de {| de manière linéaire. Nous convenons de poser: 

{v|={ulæ (42148) 
À l'aide de cette convention, nous pouvons écrire: 

&[er)]}-[éle]lr}- let) cu) 

Si |[y}= æ|x}, {>| dépend linéairement de {x|. Par définition, nous écrirons: 

{y|={xla (42150) 
où æ! est l'opérateur adjoint de &. 
Formons avec un bra {| le produit scalaire hermitique: 

Gly}=ulalx) «151 
et nous pouvons écrire (nous l'avons démontré précédemment): 
tal» m{ylu)=(x la! lu) (42.152) 


d'où la relation de première importance que nous avons déjà rencontrée plusieurs fois sans en avoir 


expliqué vraiment l'origine: 
{xlailu}= {ulafx) (42.153) 


Nous rappelons simplement avec cette relation qu'un opérateur hermitique est un opérateur égal à son 
adjoint. 


Grâce au formalisme de Dirac, ce qui était avant des définitions abstraites est devenu maintenant des 
évidences démontrées. 


Pour résumer: 
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(alak,)=(alala) 


[g} + AG | } 


i 


Da(alala) 


a = (al) 


Tableau: 42.1 - Comparaison formalisme classique/Dirac avec ce qui a été vu jusqu'à maintenant 


Remarque: À nouveau, un excellent exemple pratique d'application du formalisme de Dirac est 
proposé dans le chapitre d'Informatique Quantique (voir section d'Informatique Théorique). 


4. MODÈLE DE SCHRÔDINGER 


Des expériences (effet Compton, effet photoélectrique, fentes de Young, optique géométrique/ondulatoire, 
etc.) ont montré que les ondes pouvaient, dans certaines situations être traitées comme des corpuscules (et 
inversement). Ce sont ces observations qui amenèrent Niels Bohr à à énoncer son "principe de 
complémentarité" qui dit que suivant les expériences effectuées, il faut considérer la matière soit comme 
une onde, soit comme des corpuscules. Ces deux aspects se complétant l'un et l'autre. 


4.1. ONDE ASSOCIÉE DE DE BROGLIE 


Le physicien français Louis Victor De Broglie suggère, en 1924, que réciproquement, les particules 
(électrons, protons, et autres ainsi que même les atomes et les molécules) pourraient aussi, dans certains 
cas, montrer des propriétés d'ondes au même titre que la lumière! De Broglie émit alors l'idée qu'il existait 
entre la longueur d'onde associée fictive d'une particule de matière et sa quantité de mouvement, une 
relation similaire à celle d'un photon, soit (v est la notation pour la fréquence pour rappel...): 


œ 
Es =hv=h —=hœ@=m'e (12154) 
27 


donc nous pouvons écrire en utilisant la relation établie dans la chapitre de Mécanique Ondulatoire: 


où le rapport: 
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ñ 

P 

De Broglie émit donc dès lors l'hypothèse suivante: Pour un corpuscule de masse m et de vitesse v nous 
avons: 


où À est appelé "longueur d'onde associée de De Broglie". 


La matière en mouvement aurait donc une longueur d'onde associée. C'est une longueur d'onde 
extrêmement petite pour des masses de l'ordre du kilogramme. Si la vitesse est par exemple de l'ordre de 


1 [rs] alors À 1074 [x]. 


Comme nous l'avons vu, les phénomènes d'interférence et de diffraction sont importants seulement 
lorsque la taille des objets ou fentes n'est pas beaucoup plus grande que la longueur d'onde. Il est donc 
impossible de détecter les propriétés ondulatoires des objets de tous les jours. Il n'en est pas de même pour 
les particules élémentaires, les électrons en particulier. 


Les électrons peuvent donc avoir des longueurs d'onde de l'ordre de 10 Ÿ [#] ce qui correspond à 


l'espacement des atomes d'un cristal. C.J. Davisson et L.H. Germer exécutèrent une expérience cruciale: 
ils diffusèrent des électrons sur la surface d'un cristal et au début 1927 observèrent que les électrons 
éjectés étaient distribués en pics réguliers. Lorsqu'ils interprétèrent ces pics comme des pics de diffraction, 
ils trouvèrent que la longueur d'onde de l'électron diffracté était exactement celle prédite par De Broglie. 


Mais alors qu'est-ce qu'un électron?? Les illustrations qui montrent un électron comme une minuscule 
sphère chargée négativement ne sont que des images commodes, mais inexactes. En fait, nous devons 
utiliser le modèle corpusculaire ou ondulatoire, celui qui fonctionne le mieux selon la situation de façon à 
pouvoir comprendre ce qui se produit. Mais il ne faut pas en conclure qu'un électron est une onde ou une 
particule. Nous devrions plutôt dire qu'un électron est "l'ensemble de ses propriétés mesurables". Certains 
physiciens emploient encore l'expression "quanton" pour décrire tout système se comportant soit comme 
une onde soit comme une particule. 


De Broglie put alors suggérer que chaque orbite électronique quantifiée (selon le postulat de quantification 
de Bohr) est alors une onde stationnaire et qu'un électron ne pouvait occuper que les orbites pouvant 
accepter un nombre entier de longueurs d'onde de son onde associée fictive. S'il n'y avait pas de 
coïncidence exacte, il ne pouvait y avoir d'onde stationnaire, et donc pas d'orbite stationnaire non plus. 


Dès lors, comme pour les modes résonnants d'une corde (ondes stationnaires), seules les ondes dont la 
circonférence de l'orbite circulaire contient un nombre entier de À existent, soit (l'amplitude sera calculée 
par des techniques particulières que nouvs verrons plus loin): 


277, = nÀ avec ne N° 
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n=? + n=3 n = 4 
À, ‘ 
L c 
À 
3 Re 
A à 
Figure: 42.2 - Approche de l'aspect ondulatoire des orbites par De Broglie 
En remplaçant À par k /"mv, nous obtenons: 
#h #h 
277, = — > MVr, = — (42.158) 
Av 27 


Ce qui est bien la condition quantique proposée par Bohr. Les orbites et Les états d'énergie quantifiés du 
modèle de Bohr, sont dus à la nature ondulatoire de l'électron et au fait que seules des ondes stationnaires 
résonantes persistent. Ceci suppose que la dualité onde-corpuscule est à la base de la structure de l'atome. 


La notion ondulatoire de la particule permit ensuite au physicien Erwin Schrôdinger de développer une 
équation dite "équation d'onde" pour décrire les propriétés ondulatoires des particules. 


Petit interlude sympathique. puisque connue l'onde associée de De Broglie et étant donné le résultat vu 
lors de notre étude du théorème du Viriel dans le chapitre de Mécanique Des Milieux Continus, nous 
pouvons mettre en relation: 


ñ 
À = —— 
P 
Ainsi, nous pouvons pour un fluide (liquide), obtenir la valeur de "l'onde thermique associée de De 


Broglie". Ce qui nous donne: 


Nous reviendrons sur cette relation lors de notre étude des superfluides dans le chapitre de Mécanique Des 
Milieux Continus. 


4.2. ÉQUATION CLASSIQUE DE SCHRÔDINGER 


Le physicien Peter Debye trouva le modèle de De Broglie tiré par les cheveux. Il argumenta que la 
physique des ondes, n'importe lesquelles, depuis les ondes sonores jusqu'aux ondes électromagnétiques, 
même les ondes se propageant sur une corde exige une équation qui les décrive. Or, il n'y avait pas 
d'équation d'onde la modèle atomique de De Broglie (pour la simple raison que ce dernier n'avait jamais 
essayé et Einstein non plus). Le physicien Erwin Schrôdinger prit alors sur lui de trouver l'équation qui 
manquait et le fit avec brio. 


Rappelons la forme unidimensionnelle de l'équation d'onde (cf. chapitre de Mécanique Ondulatoire): 
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1) 872,0 _ 1 f(x) (42161) 
TO Op gi. 
x v dé 


Pour simplifier, cherchons une solution particulière de la forme (voir le chapitre de Mécanique 
Ondulatoire ou le chapitre d'Électrodynamique pour l'analogie): 


@) f{xD = EG)'sintorn (2162 


Tr) St l'amplitude du champ associé à la particule. Il est important de remarquer que la partie 


périodique ne contient pas de paramètres de déplacement (comme c'est le cas en électrodynamique par 
exemple) car la fonction se doit de décrire des solutions "statiques" (attention à ne pas prendre ce terme à 
la lettre). 


Pour des raisons historiques cette amplitude est couramment appelée "fonction d'onde" bien que cette 
appellation soit trompeuse. Il serait peut-être meilleur de l'appeler simplement "amplitude du champ 
associé à la matière". 

C'est la recherche de l'expression de cette fonction qui va nous amener lors de l'étude d'un cas particulier 
(bien plus loin dans le texte) à l'expression bien connue de l'énergie d'ionisation d'un électron de nombre 


quantique n donné et pour son atome de numéro atomique N donné. 


Si nous introduisons (2) dans (1), nous obtenons: 


star 7 - So sister 


2 
dY(x) _ _@ 8"Y(x) __(27v) 
D Ge (2) 
(3) 2Ÿ (42.163) 
PY(x) (2r<] PYG _ 4m, 
—, = - Fix) = 
8x? c? G) 8x? 7. D) 
4 47 
_ +— Y(x) 0 
Nous avons aussi: 
El 1 pr j (4Ÿ -E,-E (42.164) 
2 2'm 2m |A 


d'où: 
(4) 1 = 2m'E - 2e" (Ex - En) (42.165) 
= — - 


si nous introduisons (4) dans (3) nous obtenons alors "l'équation de Schrüdinger unidimensionnelle 
classique" (en l'absence de champ magnétique): 
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ay : 87 m(£, u Ex) 
8x° h° 


Y(x) = 0 


Remarque: L'énergie potentielle pourrait aussi bien être gravitationnelle, qu'électrique ou les deux 
combinées (donc de nature quelconque). Mais la gravitation est tellement faible à cette échelle par 
rapport aux forces électrostatiques qu'elle est négligée. 


Nous pouvons réécrire l'équation précédente en la généralisant à un système à trois dimensions. Ce qui 


nous donne finalement: 
Din 
AY +27 Eur — ET =0 


où À n'est pour rappel que le laplacien d'un champ scalaire (. dE 
4 & 4 
= — + — + — 
8°x dy d?z 
Remarques: 


R1. Cette équation n'est pas un invariant de Lorentz étant donné qu'elle a été établie à partir de 
l'expression classique de l'énergie (et non relativiste). 


R2. La fonction d'onde plane que nous avons prise au départ n'a pas une signification physique étant 
donné qu'elle transporte une énergie infinie. Une meilleure solution est de considérer un paquet 
d'ondes. Toutefois, les paquets d'onde généralement employés sont constitués d'une superposition 
d'ondes planes. Dès lors, en étudiant ses effets sur une des ondes planes, nous pouvons accepter les 
conclusions physiques que nous pouvons en déduire. 


Si simple que cela puisse paraître, il fallut toute l'habileté et l'expérience de Schrôdinger pour être le 
premier à écrire cette équation d'onde et ce fut le fondement sur lequel il construisit l'édifice 
mathématique de la physique quantique ondulatoire dans les mois qui suivirent. Mais d'abord il lui fallait 
prouver que c'était bien l'équation d'onde recherchée en l'appliquant à l'atome d'hydrogène ( 

ue). Son modèle élimina tous les bricolages successifs et empiriques de la physique 
quantique corpusculaire. 


Certains physiciens jugèrent le modèle de Schrôdinger comme de la folie pure (en particulier Sommerfeld) 
tout en changeant d'avis peu de temps après... tellement le modèle était efficace et remplaçait 
avantageusement le modèle matriciel horriblement abstrait de Heisenberg (à grand malheur de ce dernier) 
sur lequel même Pauli avait échoué pour les résultats expérimentaux de l'atome d'hydrogène. Peu de 
temps après Max Born décrivit le modèle ondulatoire comme la forme la plus profonde des lois 
quantiques ce qui évidemment ne fit pas tellement plaisir à son proche ami Heisenberg.… 
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Cependant le modèle de Heisenberg décrivait des particules alors que Schrôdigner décrit des ondes. 
L'avantage d'avoir deux formalismes différents - mais équivalents - en physique quantique devint vite 
évident. Pour la plupart des problèmes que rencontrent les physiciens, la mécanique ondulatoire offre la 
voie la plus facile vers la solution. Toutefois, pour d'autres, comme ceux qui impliqent le spin, c'est la 
démarche matricielle de Heisenberg qui prouve sa valeur. 


4.2.1. HAMILTONIEN DE SCHRÔDINGER 


L'équation de Schrôdinger peut également s'écrire sous la forme (après quelques petites mises en facteurs 
élémentaires) suivante: 


Y=E,Y 


tot 


x? 
Es . À 
Nous écrivons cela en physique quantique sous la forme: 


H'Y=E, Y 


où H est donc l'hamiltonien du système (ou énergie totale) et constitue un opérateur fonctionnel et 
l'énergie totale, la valeur propre. 


L'équation de Schrôdinger est donc une équation aux dérivées partielles du second ordre, linéaire 
homogène. Quelle que soit l'énergie totale, elle admet des solutions (ouf!), mais nous montrons qu'en 
général ces solutions croissent très rapidement (croissance de type exponentiel) quand nous nous 
éloignons à l'infini dans certaines directions et sont donc physiquement inacceptables. Il n'y a que des 
valeurs particulières de l'énergie totale qui donnent lieu à des solutions physiquement acceptables et en 
général, l'ensemble de ces valeurs comprend des valeurs discrètes (fonctions trigonométriques à la source) 
qui sont les "niveaux liés" du système (parce que leur fonction propre décroît rapidement à l'infini) et un 
continuum de valeurs qui sont les "niveaux non liés" (leur fonction propre restant finie à l'infini). Plus 
précisément, si W est la borne inférieure des valeurs de l'énergie potentielle à l'infini, les niveaux liés se 
situent au-dessous de W, alors que les valeurs supérieures à W constituent le continuum des niveaux non 
liés. 


Par exemple, dans l'étude de l'oscillateur harmonique (un des cas pratiques les plus difficiles au niveau du 
formalisme) que nous ferons plus loin, nous avons: 


avec # = +. Il n'existe donc que des niveaux liés. 


Dans l'atome d'hydrogène: 


pat 


AEpr 


avec # = 0. Les niveaux liés seront négatifs, et toutes les valeurs positives de l'énergie seront des niveaux 
non liés. 
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Ceci ayant été dit, voyons également comme exemple (très important) la manière de déterminer 
l'hamiltonien H de l'équation de Schrôdinger d'une particule chargée non relativiste dans un champ 
électromagnétique. 


Nous avons vu dans le chapitre de Mécanique Analytique que le lagrangien était défini par la soustraction 
de l'énergie cinétique et potentielle selon la relation: 


ZL=T-YW (42.173) 


Nous avons dans le chapitre d'Électrodynamique que le lagrangien de l'interaction champ-courant 
relativiste était donné par: 


L=p+l=-mpc div /e? +gAoÿ-qgé (42174) 
où pour rappel # est le potentiel vecteur du champ électrique (donc dont le gradient est le champ 
électrique £)et 4 le potentiel vecteur du champ magnétique (dont le rotationnel est le champ 
magnétique £ ). 
Si nous rajoutons un champ électrique (et donc un potentiel électrostatique U) en plus du champ 
électromagnétique le lagrangien s'écrit alors (puisque le potentiel se soustrait selon la définition du 


lagrangien!): 


L=b+h = pc 24/1 lc -qgU+qAoÿ-qg# (42.175) 


Dans l'approximation classique (non relativiste) nous savons que nous avons (cf. chapitre de Relativité 
Restreinte): 


L= pc? += — 4: U+gAoÿ-a# (42.176) 


Comme nous nous restreignons au cas non relativiste, nous pouvons éliminer le terme constant d'énergie 
de la masse au repos tel que: 


l + 
L = S0v-4 -U+gAov-q@ (42.177) 


Toujours dans le chapitre de Mécanique Analytique, nous avons démontré que l'hamiltonien était donné 
par: 


H=Zèn-E (42.178) 
è 
Nous avons donc: 
. 1 2 + 
He LPS PV +g-ÜU-gAoVv+q$ (42179) 
| 


De plus, nous avons vu dans le chapitre de Mécanique Analytique que: 
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Il vient donc que: 


a f1 + = 
pe ge (pmoé- a U+a405-46)= mn +44 (42.181) 


Finalement: 
A =movl+gÂo5 mot + a U-4Â05 +99 (42.182) 
Soit après simplification: 
l 2 l 
sub né Li +g U+g#= 50" +g U+W (42183) 


H contient donc l'énergie cinétique et l'énergie potentielle totale. Il n'y a pas de terme magnétique car la 
force de Laplace, comme nous l'avons démontré dans le chapitre de Magnétostatique, ne travaille pas (y'en 
a qui ont de la chance...). H est bien l'énergie totale du système classique, cependant la relation précédente 
n'est pas vraiment adaptée au formalisme de Hamilton car les moments conjugués n'apparaissent pas. Mais 
il est très simple de les introduire à partir du résultat obtenu précédemment qui était: 


P:= 0, + gÂ — Y, _Pi=44 (42.184) 
donc: 
2 2 
H = moe 0 +7 = pro E TA open el ur (42.185) 
2 2 F0 2%) 


Si nous passons en physique quantique, nous devons remplacer les 2; par leurs opérateurs respectifs: 
P; =—ih0, (42.186) 


dont nous avons démontré l'origine plus haut. Ainsi, nous avons: 


2 
— Gear. U+ÿ (42.187) 
2779 


qui doit s'écrire dans le cas général (comme nous ne savons pas si le potentiel vecteur commute avec la 
quantité de mouvement, pour ne pas perdre en généralité nous allors supposer qu'il anticommute): 


si = pi _a(r:4+4r) 


2 y2 
- a dr (42.188) 
2 2#ÿ 23 


Ce que l'on note traditionnellement sous la forme (sic!): 
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2 7,2 
L =D. PE}, at |. (42.189) 
2#g 


279 279 


On retrouve très souvent cette dernière relation sous la forme simplifiée suivante dans la littérature en 
absence de potentiel U et en explicitant V: 


À = e) p-dqA Ê +g$ (42.190) 
29 


Remarque: Dans le chapitre de Physique Quantique Relativiste nous démontrerons la forme relativiste 
de cet hamiltonien associée à l'équation de Klein-Gordon généralisée ou encore celui de Dirac qui 
inclut le spin. 


Heureusement, nous ne traiterons pas d'exemples où il faudra trouver des solutions à l'équation de 
Schrüdinger avec un tel hamiltonien sur ce site. 


Dans les cas scolaires quand on aborde toutefois des prémisses d'application.., on annule soit le potentiel 
vecteur (donc la particule n'est pas plongée dans un champ magnétique), soit le potentiel scalaire (donc la 
particule n'est pas plongée dans un champ électrique). De plus quand on choisit l'un des champs comme 
étant non nul, on s'arrage à prendre le cas où il est constant et en une seule dimension. Ainsi, si on veut 
un champ électrique constant selon un seul axe (par exemple l'axe X), on prendra comme potentiel 
scalaire: 


d(x.f)= ÆH-x (42.191) 


puisque son gradient donnera bien une constante selon X. Dans le cas d'un champ magnétique constant 
selon un seul axe (par exemple l'axe Z), on s'arrangera pour prendre le potentiel vecteur: 


—Y 
£ 
= 0! ; | (42192) 
2 
(8) 


dont le rotationnel donne bien un champ magnétique constant selon Z. 
4.2.2, CONDITION DE NORMALISATION DE DE BROGLIE 


En général, dans un état dynamique donné, la particule (s'il s'agit d'un système à une particule) décrite par 
la résolution de l'équation de Schrôdinger pour des paramètres bien définis est mal localisée, car x, y, z 
sont mal déterminés de par même le principe d'incertitude de Heisenberg. Il y a donc lieu de définir une 
probabilité dP de trouver la particule dans l'élément de volume dxdydz entourant un point (x, y, z), d'où 
l'existence d'une fonction de distribution des coordonnées £(x,y,z) telle que: 


dP = (x, y,z)dxdydz (412193) 


où £(x,y,Z) est donc une quantité essentiellement positive ou nulle (probabilités obligent!) qui doit 
s'exprimer à l'aide de la fonction de Schrüdinger Ÿ(x,y,z). Nous avons d'ailleurs de tels exemples très 
détaillés dans le présent chapitre et à la fin de celui de Chimie Quantique. 
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Des analogies avec la physique ondulatoire classique, plus précisément avec l'électrodynamique, ont 
conduit à admettre que comme la densité volumique d'énergie d'une onde électromagnétique est 
proportionnelle au carré de son amplitude (cf. chapitre d'Électrodynamique), la densité volumique de 
probabilité devait être proportionnelle au carré de l'intensité du champ associé tel que: 


PU2,7,2) = | P(x, y, D 42.194) 
où nous utilisons le module de la fonction de Schrôdinger comme analogie de l'amplitude et où la 


constante est un nombre réel. Dans le cadre de la physique quantique, il est beaucoup plus fréquent de 
trouver cette dernière relation sous la forme évidente suivante: 


x», 2f Y(x,y,2) 
O2,Y,2) = Ds a a 
[IE G,v,2)f dre Te »,2)f drdyaz 


qui met mieux en évidence la normalisation nécessaire de la fonction de Schrôüdinger. 


= [xD 15) 


Enfin, il est important de noter que les physiciens ont pour habitude pendant les développements de garder 
la même notation pour la fonction de Schrüdinger non normalisée que celle normalisée (ce qui peut prêter 
à confusion) telle que: 


2 
F(2x,y,2) 


\Pex, »,2)f = eee 
[I EG»,2)| dxdydz 


où |Y{x, y.z : représente alors la probabilité de trouver la particule en un certain point de l'espace. 
>}, P P P P P 


(42.196) 


Il est évident alors qu'avec cette manière de noter les choses nous avons alors sur tout l'espace: 


[fe cr, 2axapee = [[[ 18 (x. »,2)° dxdydz =1 | (42.197) 


comme déjà mentionné lors de notre présentation du premier postulat. 


Nous pouvons maintenant considérer la signification physique qui peut-être attachée à l'intensité du 
champ associé à la matière. Comme ce champ décrit le mouvement d'une particule, nous pouvons dire que 
les régions de l'espace dans lesquelles la particule a le plus de chance de se trouver sont celles dans 


lesquelles |Y{x, y, 2 est maximum. 


Indiquons aussi que la relation antéprécédente s'écrit en utilisant la notation ket-bra, que nous introduirons 
un peu plus tard, de la manière très raffinée (et très courante...) suivante: 


2 
| gY = a IX (42.198) 
RETA CPE 
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ou suivante (c'est simplement la racine carrée de la précédente): 


y 
Den (42.199) 
(71) 


où le module au dénominateur disparaît puisque, pour rappel, l'intégrale est un nombre réel. Il ne faut par 
ailleurs jamais oublier que les physiciens, pour la grande majorité, notent de manière identique la fonction 
de Schrôdinger non normalisée et normalisée comme nous le rappelle cette dernière relation. 


Comme nous l'avons déjà dit, nous verrons de nombreux exemples détaillés de cette normalisation dans ce 
chapitre avec des espaces unidimensionnels et dans le cadre de volumes dans le chapitre de Chimie 
Quantique. 


Indiquons encore une chose en ce qui concerne la normalisation. Si vous observez l'expression de 
l'hamiltonien des équations de Schrôüdinger vues jusqu'à présent, alors si À est une constante réelle ou 
complexe nous avons toujours: 


H(A4Y)=4A(Y) (42200) 


Si nous posons que est une solution de l'équation de Schrôüdinger, nous voyons alors que ÀT est aussi 
solution de l'équation. En effet, nous obtenons: 


H(AY)= A4H(Y)=4EY%Y=E(AY) (42201) 
En prenant en compte le fait que la fonction ÀT est normalisée, nous obtenons alors: 
[AS dx =1= Af[Ief ax=1= af 21 u220) 
d'où (certains livres se restreignent à ces solutions pour des raisons pédagogiques): 
A=+t1lou ÀÂ=+# (42203) 
ou rigoureusement nous avons plus généralement: 
A=e# (42204) 


où & est un nombre réel. C'est ce que nous appelons "l'arbitraire de phase" dont nous avions déjà fait 
mention au début de ce chapitre sans démonstration. 


Ces solutions sont normalisées et correspondent à la même valeur d'énergie E ainsi qu'à la même densité 
de probabilité. Ceci montre qu'il n'est pas utile de chercher la signification d'une valeur négative de (si 


nous prenons le cas particulier pédagogique À = -1), car pl est réel et n'est pas négatif. Seul Le carré 
P P pedagogiq P 8 


d'une fonction d'onde, qui correspond à la densité de probabilité, est significatif d'un point de vue 
physique. 
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4.2.3. ÉTATS LIÉS ET NON LIÉS 


Supposons que T(x,y,z) décroisse assez rapidement à l'infini, de telle sorte que l'intégrale: 


+ 
fire, Y,Z) l'ardyaz (42.205) 


— 


converge. Il est alors possible de profiter de l'arbitraire régnant sur la fonction d'onde (le fait que T et 
Æ'T décrivent le même état) pour rendre cette intégrale égale à l'unité. Nous disons alors que # est une 
"fonction d'état de champ normée": 


+o 
[I G.>.2)l'dxdaz =1 (42.206) 


— 


Notons qu'il règne encore un arbitraire sur Ÿ par un nombre complexe de module 1, £# , sans que la 
condition de normalisation soit altérée. Nous appelons cela "l'arbitraire de phase" et en verrons un 
exemple plus tard. 


Un tel état dynamique est dit "état lié" ou "niveau lié", parce que la particule se manifeste dans une région 
limitée de l'espace à cause d'un potentiel. Lorsque, par exemple, l'atome d'hydrogène est situé sur un 
niveau fondamental, il est dans un état lié. Nous savons qu'il n'y a aucune chance de trouver l'électron à 
plus de quelques angstrôms du proton, traité comme infiniment lourd et placé à l'origine comme nous 
l'avons vu lors de l'étude du modèle de Bohr. Voici une bonne vision schématique de la chose (état lié): 


PROTON ÉLECTRON 


DISTANCE (EN ANGSTRÔM) 


_ ÉNERGIE 
(EN ÉLECTRONVOLTS) 


————————. 


Figure: 42.3 - Représentation imagée d'un état lié (source: Pour la Science) 


Un exemple d'état par défaut non lié est la particule libre qui peut se propager indéfiniment dans toutes les 
directions de l'espace (au fait pour ce dernier exemple c'est un peu plus compliqué... mais nous le 
traiterons plus loin). 
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Remarque: Il est bon de noter que ces concepts d'états liés ont des analogues classiques. Aïnsi, les 
niveaux liés de l'atome d'hydrogène correspondent aux orbites elliptiques, les niveaux non liés 
(énergie positive) correspondent aux orbites hyperboliques. 


4.3. ÉQUATION D'ÉVOLUTION CLASSIQUE DE SCHRÔDINGER 


Nous savons qu'en mécanique classique l'état dynamique d'un système évolue, en général, dans le temps. 
Cela veut dire que la position et la quantité de mouvement (par exemple) sont fonction du temps. Pour un 
système d'hamiltonien donné, la connaissance de l'état dynamique initial permet de prévoir exactement 
l'évolution ultérieure de ce système du fait des propriétés bien connues des équations de Hamilton. 


En physique quantique, les états dynamiques évolueront, en général, dans le temps. La fonction d'onde 
décrivant un état dynamique ne sera alors pas seulement fonction des coordonnées des particules 
constituant le système, mais elle dépendra donc aussi du temps et s'écrira: 


Yix,y,z,f) 


Il est tout naturel d'admettre, ne serait-ce que par analogie avec la mécanique classique, que pour un 
système donné, d'hamiltonien connu, la connaissance de l'état dynamique initial à l'instant £#, , permet de 


prévoir quel sera l'état dynamique du système à un instant ultérieur £ > #,. 


Notons en passant que cela revient à dire qu'un ensemble initialement "pur" reste un ensemble pur au 
cours de l'évolution ultérieure des systèmes qui le constituent sans action extérieure. Cela cesserait donc 
d'être vrai si tous les systèmes de l'ensemble n'avaient pas exactement le même hamiltonien. 


Indiquons qu'il existe deux approches possibles pour déterminer les fonctions dépendantes du temps: 


- La première, courante dans de nombreux domaines d'application de la physique quantique, consiste à 
utiliser un "opérateur d'évolution" et permet de faire apparaître de manière explicite l'équation d'évolution 
de Schrüdinger. Nous commencerons par celle-ci même si c'est la plus compliquée ou abstraite. 


- La deuxième, très utilisée à des fins pédagogiques, permet d'obtenir les fonctions dépendantes du temps 
par l'intermédiaire de la technique de séparation des variables des équations différentielles mais nécessite 
d'admettre l'équation d'évolution de Schrüdinger comme un postulat. 


4.3.1. OPÉRATEUR D'ÉVOLUTION 


Soit F(£) la fonction d'onde normée décrivant l'état dynamique du système à l'instant t (nous n'écrivons 
pas les autres variables dont dépend Ÿ par souci de simplification, à savoir les coordonnées spatiales des 
particules du système). D'après ce qui précède, si T(£,) est connue, Ÿ(£) l'est aussi. Nous avons une 
correspondance: 


FOOT) 


et nous admettrons qu'elle est linéaire! Il existe donc un opérateur T(£,4,), appelé "opérateur 
d'évolution", tel que: 


PO = Th) Et) 
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La fonction F(£ +f) dépend linéairement de Ÿ(£). Il en est alors de même de: 


Péri Pr) 


dé 
Il existe donc un opérateur linéaire K, tel que: 
8Y . 
— =iKY (42211) 
dé 


le nombre complexe i venant simplement du fait que nous devinons intuitivement que le résultat sera une 
fonction d'onde complexe. 


Ce qui a aussi amené les physiciens à poser cette dernière égalité ainsi étaient les résultats connus de 
l'équation d'onde décrivant un état dynamique d'après l'idée de De Broglie. Nous allons donc tout de suite 
montrer que poser l'égalité ainsi est justifié. 


Nous devons déterminer K puisque la connaissance de l'hamiltonien H commande l'évolution du système, 
K doit donc dépendre de H. Pour préciser la loi qui lie K à H, nous examinerons un cas particulier, celui 
de la particule libre (dont nous ferons une étude détaillée plus loin). Dans ce cas, H s'identifie à l'énergie 
cinétique uniquement. 


D'après les idées de De Broglie, il est naturel d'admettre que la fonction d'onde décrivant un état 
dynamique dans lequel la quantité de mouvement est bien déterminée, soit k& (relation démontrée 
pendant l'étude de la particule libre), et où l'énergie totale est donc également bien déterminée, soit: 
E=h@ (42212) 
est une onde plane de la forme classique: 
Y(x,y,z,0) =ertet) (12213) 


où k est le vecteur d'onde de l'onde et X = (x,y,Z) ses coordonnées spatiales. 


Nous voyons alors très bien à l'arbitraire de phase près (pris comme étant négatif) que: 


Mais nous avons la relation entre opérateur hamiltonien et valeur propre suivante: 
HY=EY (42215) 


Les deux équations précédentes conduisent à écrire: 


9Y A 
— =—% (42216) 
dŒ 

En comparant cette dernière relation avec: 
7 
— =iKY (42217) 
dé 
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nous sommes amenés à poser: 


à 

LS IKY (42219) 

dé 
dans laquelle K est remplacé par son expression: 

K = se (42.220) 
devient alors: 
— = AY] (42.221) 
dé 


Cette équation constitue "l'équation d'évolution classique de Schrôdinger" qui permet d'étudier des 
systèmes évoluant avec le temps, notamment les processus impliquant l'absorption et l'émission de 
rayonnement et la diffusion du rayonnement par les atomes. 


En particulier, pour une particule sans spin soumise à une énergie potentielle #,,,, en maintenant toujours 
que la relation entre K et H est générale, l'équation d'évolution s'écrit alors: 


où les termes entre parenthèses correspondent donc à l'expression de l'hamiltonien. 


Il convient maintenant de résoudre l'équation différentielle d'évolution de Schrüdinger. Pour cela, nous 
allons nous servir de la condition de normalisation de De Broglie. 


Rappelons que cette condition s'écrit: 


+ 
[IE G.>.2)l'dxdpaz =] (42223) 


— 


et généralisons à une étude multidimensionnelle et temporelle de cette condition telle que (selon les 
propriétés des complexes): 


[EC a da = [EGa) TC. gd =1 (2221) 


Cette intégrale sur tout le domaine de définition n'est certainement pas égale à l'unité si nous 
n'introduisons pas une fonction de normalisation assimilée à une observable que nous noterons X et telle 
que nous ayons bien sur tout le domaine de définition: 
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[FCDXY (ag | (42.225) 


D'après cette condition, cette intégrale doit nécessairement rester constante en fonction du temps et de fait 
égale à l'unité. 


Calculons d'abord la dérivée par rapport au temps de l'intégrale de normalisation et X. Nous avons donc 
nécessairement: 


CT -d2y ve 12 
a [C0 VC. g)ag - RTC a] Vends + [real . reo|é . 
= [ÉEDTE.g)dg + (PCA) É EC. g)d = 0 


et utilisons l'équation d'évolution de Schrôüdinger: 


ce qui nous donne pour notre intégrale après substitution: 

F2 700|v cos + (TG) É Ava] -0 

[ECO EC a) - [HYY Ca] - 0 ci 

[PH AV(E, gg - [HP (E.a)P (gag = 0 
Démontrons maintenant que nous pouvons écrire: 

[FCDRT(E,g)dg - [HE (QT (a )da = [Ta HT (Es a)dg - [FA HT (Egg (42229) 
Cela revient à démontrer que H peut agir identiquement "en arrière" tel que: 
[TETE g)da = [FE DH T(g)dg (2250 


H pouvant être (ou contenir si vous préférez) un opérateur (différentiel par exemple). 


Cette relation est démontrable si et seulement si # est une fonction décroissante vers l'infini et dont la 
dérivée tende vers zéro vers l'infini! 


Prouvons cela sur un cas particulier (mais fréquent en physique) et pour voir comment cela peut se faire, 
considérons dans H, un terme particulier de la forme suivante : 


# OR OS E U2230 


ce qui nous conduit à écrire: 
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[PEDAY(E.g)àg = [P(.e) 


dg (42.232) 


à 
— gi, 
TE (6,4) 


Par intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral) sur le terme l'opérateur 
différentiel: 


+ 8 . fé T0, 
| FES g'E(E,g) da = Po)f eg Ta) - | pa PGgf) gY(.qdg (42233) 


—0 


Or, puisque Ÿ est une fonction décroissante vers l'infini par hypothèse (physiquement nécessaire!), nous 
aurons le premier terme qui sera toujours nul. Il nous reste ainsi: 


(EF) gPag= | (23) eve (42.234) 


9g "] & ee 


es) 


+ 
LAARPTEÉEE 


Donc cela ne fait aucune différence de considérer que l'opérateur différencie tout ce qui est à droite ou tout 
ce qui est à gauche, dans la mesure où il est bien entendu que ce dernier cas implique un changement de 
signe. Il est d'usage d'appeler ce résultat parfois la "condition d'hermicité"….. 


Donc nous pouvons bien nous permettre d'écrire: 
[FEAT (E.)da _ [FEOHT(,g)dg = 0 (42.235) 
ce qui nous amène également à écrire: 
[FA HF (ag)da =0 (2236) 
Ceci ne peut être satisfait uniquement que si : 


H=}AH (42.237) 


et dans le domaine mathématique traitant des opérateurs nous avons vu que nous devions noter cette 
égalité: 


Ce qui nous amène à: 
[FCaxx" — H)Ÿ(,q)dg = 0 (42239) 
soit en utilisant la notation des représentatives (ket-bra): 
(g|4T-H|P$=0 (42240) 


Pour revenir à la résolution de: 
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LAS = HY (42241) 
dé 


il est évident qu'une solution possible est alors: 


Lx 49 242 
PG,g) = YO.ge + | (42242) 


qui est donc constituée d'une partie purement spatiale (indépendante du temps) et d'une exponentielle 
complexe dépendante du temps. Vérifions: 


it 
it ——# 


nero ae) EU, F DE 0 


dk 
(42.243) 


ÈE x 
= ihY(0, o(- Jæ” = Y(0,g)He À = HY(E,q) 
C'est ce qu'il fallait démontrer (...). 


Remarquons également qu'une fois les solutions purement spatiales déterminées, les solutions 
dépendantes du temps et de l'espace s'obtiennent aisément. 


De même, grâce à la relation ZT = Z que nous avons démontrée avant, nous pouvons écrire: 
_ _ LÀ" RE 
Bg)= PO) (2249 
Finalement, la relation: 
[Fox P.g)dg =1 (42245) 
devient: 
: Ex À 7 . nc 
[F(0.9)e K ÆXY(0,ghef dg = [70.24 (0,g)dg 1 PE) 
avec "l'opérateur de Heisenberg" défini par: 


LA it it 


X(O =eT" Xer RER FE (42247) 


Remarque: Il se peut très bien que X soit parfois une simple constante (nous en verrons un exemple 
plus bas). 
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4.3.2. SÉPARATION DES VARIABLES 


Voyons également une manipulation mathématique intéressante et un peu similaire à la précédente de 
l'équation d'évolution de Schrôdinger. Cette manipulation va nous permettre de voir que la séparation des 
variables fonctionne très bien avec l'équation d'évolution et qu'elle va nous permettre de retomber sur un 
résultat obtenu précédemment (c'est toujours bien pédagogiquement de voir plusieurs approches). 


Nous avons donc dans un cas particulier: 

., 2Y ” 

ih— = Es ——À|% (42248) 

Réécrite sous forme traditionnelle (selon la littérature) et à une dimension, pour un potentiel constant dans 
le temps, cette relation s'écrit alors: 


_ROP(x,2)  h° SY(xi) 
i & 2m x 


+ÜU(x) Y(x,f) (42249) 


Supposons maintenant que la fonction d'onde puisse se séparer en deux fonctions dont elle est le produit 
telles que: 


F(xé)=fOT(x) (2250) 


Nous aurions alors: 


(42.251) 


OT(x,5) _ (6) PY(x.f) ay F@ 
à à = Y (x) e ee 


Ce qui injecté dans l'équation d'évolution unidimensionnelle donne: 


ELOPP PRE 


i 


FO +U(D ED F(E) (42.252) 
ce qui donne après simplification: 


h 1 &()  R 1 &Y(r 


+U(x) (42.253) 
if) & 2m Yx) x @ 


Le terme de gauche ne dépend que de t, celui de droite que de x. Puisqu'ils sont égaux, ils sont 
nécessairement égaux aussi à une constante près qui a la dimension d'une énergie (U(x) est une énergie 
potentielle pour rappel). 


Donc pour le terme de gauche: 


70 = H =in(f(#)) = = +c% (42.254) 


alors: 
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à mi 48 - 
JO=é"e R 24e à (9 


et pour le terme de droite: 


2 
LR 1 ne +U(x) (42.256) 
2m Y{x) 4x 
qui peut s'écrire: 
k ay 
—- @) +U(x) Y(x) = HY(x) (42.257) 
2m dx 
après factorisation: 
SP Y(x) 


2m 
——— + rl -U(x)] (x) =0 (42.258) 


Soit avec les notations du site: 


K 
Es = a LE ET (42.259) 


nous retrouvons donc l'équation de Schrôdinger classique unidimensionnelle ce qui est pas mal du tout 
comme résultat! 


Maintenant, puisque nous avions posé: 
F(x8)= FOT(%) (42260) 
alors nous avons finalement: 


Ft 


ji 
V(xt)= Le Er) (42260 


ce que nous pouvons écrire sous les notations des paragraphes précédents: 


mu (42.262) 
Pg)= P(O,ghe À 


Nous trouvons également cette dernière relation sous plusieurs formes différentes dans la littérature dont 
voici trois échantillons: 


si 
Yx.é)= Yxe À 
_.#t 
PL) = 0e F5 (42.263) 


4 
Yixt)= axe À 
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4.3.3. COMBINAISON LINÉAIRE DES ÉTATS 


Il faut remarquer avant que nous passions à un autre sujet quelque chose de très important que nous avions 
juste mentionné dans le deuxième postulat! 


Effectivement, toute équation de la forme suivante vue précédemment: 
A 


3 
g (He À (42.264) 


est donc solution de l'équation évolutive de Schrôdinger et comme dans les systèmes quantiques 
l'hamiltonien peut prendre (ou être associé à) plusieurs valeurs propres discrètes notées traditionnellement 
Æ,, nous avons alors, comme mentionné au début de ce chapitre, par le principe de combinaison linéaire 
des équations différentielles la solution générale suivante: 


Ko Et 
YH= D Ye À (42265) 


n=l 


dont nous aurons plusieurs exemples pratiques (de la discrétisation des états d'énergie et que ceux-ci sont 
en nombre infini) dans le présent chapitre et celui de Chimie Quantique. 


Si nous écrivons la constante de normalisation de Ÿ,,(x) de la relation précédente, nous avons alors: 


+0 {En 
VGH= DAT, (x)e À (42266) 
= 


Cette dernière relation s'écrirait sous la forme ket-bra traditionnelle suivante: 


1 Et + 

[Pi=D AY, (de À =5'c,ly,) (42267) 
n=l n=l 

où le coefficient constant £,, est assimilé à 4, (avouez que c'est plus simple non?). 


Nous disons alors que l'état | F} est une combinaison linéaire d'états élémentaires. | Ÿ'} représente donc 
aussi une particule d'onde comme étant simultanément en plusieurs sous-états différents. 


Il est intéressant de remarquer que chaque solution: 


ES ) 968 
AT (de h (42.268) 


décrit un "état stationnaire". Voyons (enfin!) rigoureusement de quoi il s'agit. 


En effet, nous avons: 


AY,Ge À] 21448, À | 24%, U2260) 
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qui est donc indépendant du temps d'où l'origine du nom "état stationnaire" (nous avions promis d'en 
définir l'origine en début de chapitre. donc voilà qui est fait!). 


Les fonctions étant normalisées nous avons donc: 


[IR dx = [FYex = (4%, 5 av, Jés- ZZ AA, | T:%,ax (42.270) 


Les calculs nous ont montré plus haut (nous avions fait la démonstration de deux manières différentes) 
que les fonctions propres ont les propriétés suivantes: 


[Ta P,ax =] (42.271) 
quand & = »# et: 
JE, ?,&- O (42272) 


quand # # #. C'est cette propriété qui nous avait amené dans le troisième postulat à parler de "base 
orthogonale des fonctions propres stationnaires". 


Continuons notre calcul qui peut s'écrire en utilisant le symbole de Kronecker (cf. chapitre de Calcul 
Tensoriel): 


[IR dx = Z2 4.4,[ 9, %,dx = Z LA 4 din = 244 — zf =1 (42273 


Nous pouvons alors interpréter le terme | À, f comme le poids de la fonction propre T; dans l'état 


quantique k, la probabilité d'être en fait dans l'état propre Ÿ; vaut alors | À, î et la normalisation impose 


alors: 
214 f =] (42.274) 
k 


Retenons donc qu'un état quantique quelconque peut toujours être interprété comme étant une 
combinaison linéaire d'états propres. Le coefficient 4 d'une fonction/état propre Ÿ, est alors associé à 


une probabilité |4, f . 


C'est ce résultat mathématique, super important!, qui est à l'origine du paradoxe du chat de Schrüdinger 
(parmi d'autres...) et de nombreux débats. 


Pour clore ce petit sujet, remarquons une chose: 


Si les coefficients À, ne sont pas les coefficients déjà normalisés, mais non normalisés, les physiciens 
notent alors leur normalisation ainsi: 
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l4,| mis (227) 


car très souvent ils utilisent la même notation pour le coefficient normalisé et le non normalisé dans leurs 
développements. 


L'écriture de la dernière relation se justifie aisément car rappelons que nous devons avoir: 
2 
>, |4, | =1 (42.276) 
n 


et nous avons effectivement après réarrangement: 


se note souvent dans certains ouvrages spécialisés: 


fa 


Pie 


2 (42.279) 
ZFl 
nl 


qui donne donc toujours la probabilité de trouver l'état n à la position x. 
4.3.4, ÉQUATION DE CONTINUITÉ 


Considérons maintenant l'exemple important de l'équation d'évolution pour une particule libre, c'est-à-dire 
avec Ë,4 = 0. Nous avons donc: 


La probabilité de trouver la particule dans un volume V est comme nous l'avons vu, donnée par: 
- : nm « ” 2 
leF.0ar = | RE) 7 (42281) 
ÿ ÿ 


d'où: 
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_ Lie 5), ire î) 
e ae dr {ec tu — 


En tenant compte de l'équation d'évolution de la particule libre, le second terme de l'égalité s'écrit: 


TEL ) (42.282) 


o) p6F,nar = (BV VIDE VF = (Vo (42283) 
dé 2m 


où nous avons posé: 


- — (PP Y)-C DT) 2289 


D'après le théorème d'Ostrogradsky (cf. chapitre de Calcul Vectoriel), il vient donc: 
à  _ + à 
E71 aies - f OS (42.285) 


où l'intégrale de droite est effectuée sur la surface S qui limite le volume V. La relation précédente 
exprime donc bien que la variation par unité de temps de la probabilité de trouver la particule dans V est 
égale au flux traversant la surface S et le vecteur ; peut être interprété comme une densité de courant de 
probabilité qui satisfait l'équation de continuité telle que nous l'avons déterminée en thermodynamique: 


i [ee =- [Se = LÉ 26.0|er = [[-Ÿ<5] dF (42.286) 


d'où: 


En physique quantique, il y aurait donc conservation du flux de particules: Il n'y a ni création ni 
disparition de particule, alors que dans la nature (les observations expérimentales) nous observons 
pourtant de tels phénomènes... il y a donc contradiction entre l'expérience et la théorie ce qui invalide nos 
développements. 


Par contre, cette équation exprime la conservation de la probabilité aussi! Donc de la propriété d'existence 
de la particule et des caractéristiques qu'elle transporte. Par exemple, si nous multiplions cette dernière 
relation par la charge de la particule, nous exprimons alors la continuité du courant. 


4.4. IMPLICATIONS ET APPLICATIONS 


Les différents définitions et outils qui ont été vus précédemment, vont nous permettre d'étudier certains 
cas fondamentaux qui débouchent sur des résultats splendides. 


Dans un premier temps, nous allons voir comment traiter le cas de la particule libre (état non lié) et quels 
sont les problèmes que pose cette configuration simple. 
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Ensuite, nous allons résoudre l'équation de Schrôdinger avec une particule sans spin dans un puits de 
potentiel à parois rectilignes et montrer que nous retrouverons avec le formalisme de la physique 
quantique les mêmes résultats que le modèle de Bobhr (plus généralisé même!). 


Après quoi, nous allons introduire l'étude de l'oscillateur harmonique en repassant au préalable brièvement 
sur la résolution de l'équation de Schrôüdinger d'une particule libre. Cet exemple constitue une forme 
d'introduction quantique à l'étude théorique de systèmes atomiques. C'est dans cet exemple, que nous 
utiliserons toute la puissance des opérateurs linéaires fonctionnels. Il sera donc important de ne pas brûler 
les étapes lors de sa lecture. 


Il nous faudra également étudier un autre phénomène fameux, l'effet tunnel! Évidemment, nous avons 
décidé de faire une introduction d'un cas particulier afin que le lecteur puisse voir le raisonnement qui a 
amené à la découverte de ce phénomène épatant (mais logique). Encore une fois, cet exemple appuiera la 
validité de la théorie quantique et démontrant la valeur des constantes de désintégration des isotopes 
nucléaires! 

En ce qui concerne les cas relativistes, avec ou sans spin nous renvoyons le lecteur au chapitre de 
Physique Quantique Relativiste et en ce qui concerne le modèle atomique simple, nous le renvoyons au 
chapitre de Chimie Quantique. 

Enjoy! 

4.4.1. PARTICULE LIBRE 

Curieusement la résolution de l'équation de Schrôdinger pour une particule libre (où le potentiel est nul) 
est le cas simple. le plus complexe... mathématiquement parlant car les bornes d'intégration de la 
normalisation sont infinies. 


Voyons cela: 


Rappelons d'abord que nous avons démontré de manière simplifiée dans le chapitre de Suites et Séries que 
la transformée de Fourier d'une fonction f et son inverse étaient données par: 


= l En - il RS 
FD Or 102 Er EE dE (2200) 
(2x) (27) 
Soit sous forme unidimensionnelle: 


ds TE eds f(x)= IF Era (42.289) 


Procédons maintenant au changement de variable qui relie le nombre d'onde k à la quantité de mouvement 
(relation introduite au début de ce chapitre): 


Ce qui nous donne: 
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14 næ 
F(&)= = [te Fax 1 (= IFR h dp (42.291) 


Revenons maintenant à l'équation de Schrôüdinger d'évolution: 


Ÿ (42.292) 


Si la particule est libre, il n'y a pas de potentiel et à une dimension nous avons alors: 


OT _hk à 


Y (42293) 


“& 2m 


Cette équation différentielle admet des solutions en ondes planes monochromatiques du type (cf. chapitre 
d'Electrodynamique): 


Yx.i)= ANR at) (42204) 


avec bien évidemment la petite nuance que nous avons à utiliser la relation (sinon ça ne joue pas par 
contre!): 


= À = (42.296) 
La courbe de l'énergie E en fonction du vecteur d'onde k est parfois appelée "courbe de dispersion" et c'est 
une parabole (puisque k est au carré) pour une particule libre! 


Bien évidemment, la densité de probabilité de cette solution vaut: 
CILTEL ET NU RE 77 


mais cela ne peut pas correspondre à la réalité car nous ne pouvons pas normaliser la probabilité sur des 
distances infinies! Une onde plane monochromatique de module constant dans tout l'espace n'étant pas de 
carré sommable: elle ne peut donc pas représenter un état physique d'une particule libre. 


Au fait la solution vient du fait que la vraie solution utilise le principe de superposition de toutes les ondes 
monochromatiques de toutes les fréquences tel que: 
Ni (Ex ax E 
Pix.) = [ AG LE (0.208) 
—© 


et nous retrouvons donc ici une relation très similaire à une transformée de Fourier inverse (cf. chapitre 
Suites Et Séries). Une telle superposition d'ondes planes est appelée: "paquet d'ondes unidimensionnel". 
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Ce que nous pouvons réécrire: 


+0 : he, +0 iPx 7, Rs il x PA 
Pat)= [| A&eŸe 2 dk= | A(p)e Fe 28 ap = | AP} Fe Fap (42209) 
—© © 0 


Or, nous voyons de suite que nous ne pourrons pas non plus normaliser suivant: 


+0 2 do. 
[ISfax= [ FAO TEHdx (2200) 


—© —co 


Dès lors, il n'y a plus de solution générale. Il faut donner une enveloppe porteuse aux ondes imposant une 
normalisation possible. Cette enveloppe porteuse peut être un Dirac ou une Gaussienne ou d'autres 
fonctions de distributions plus ou moins complexes. Ensuite les physiciens doivent utiliser une propriété 
des transformées de Fourier qui font naturellement apparaître les incertitudes de Heïsenberg. Ainsi, ces 
dernières sont une condition à la normalisation des particules libres utilisant les transformées de Fourier. 


À ce jour, nous n'avons pas de démonstration pédagogique et simple à proposer sur ce dernier point. Cela 
viendra peut-être plus tard. 


Par contre, nous pouvons prendre comme solution triviale les modes propres de la particule tel que: 
h{kr-ax) 


= 2 (42.301) 


Effectivement: 


MO pi 7. he") 


= - — — i 
& 2m FA 2m 8x? 
> ge) _ _ À ,2,2 (&-@) > -g=- _h 2 (42.302) 
2m 2m 
2 
= = h ,2 — FM 
2m 2h 


C'est ce que nous utiliserons comme situation lors de notre étude plus bas de l'oscillateur harmonique. 


Avant d'étudier le cas particulier du paquet d'ondes quasi-monochromatiques, nous allons rappeler 
quelques résultats concernant la somme de deux ondes planes. 


Commençons par sommer deux ondes planes monochromatiques de fréquences voisines: 
PGt)= ACT AÔ et D (x,8) = Aer) (42.303) 
avec: 
A =-ÂSe M = +AS (42304) 
et: 


k = k& -Ak et £, =k&j+Ak (42305) 
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À noter que nous imposons donc: 


de: — & ] 
42.306 
et E (42.306) 


(J 


L'onde résultante a pour expression: 


YVx,s) . YF, Ex: + YF, (x,é) — AAA 49 + el (x @pf) } 


= Afcos(& x - @é) +isin(&x- @é)+cos(kox — @f) +isin(kx — @é)) 
nai cos((&n — À) x — (æ — A @)é) +i sin((& — Aix -(% _ A@)t) + 
(cost +Ab)x (a +A@)f)+isin((& +Ab)x-(@ +A@f) 


: cos((&s — Ak)x-— (a —- Aœ@)é) +cos((k& +Ak)x — (ap + A@)£) + 
_ isin((ko — Ak)x- (a — A@)£)+i sin((ko + Ak)x — (a +Aæ)é) 
Soit en utilisant les relations trigonométriques remarquables (cf. chapitre de Trigonométrie): 
Pixii= A(2 cos (tx — Gi) cos(Âkx — À @)+ 2 sin(kox — Gé) cos(Alx — A &)) 
= 2Acos(Âx — À @f) (cos (&x- hé) +isin(kx — &bf)) (42.308) 
= 2 Acos(Alx- Aœt)e/ (rat) Lg rat) 


qui est une onde plane se propageant selon x avec la pulsation &, et le vecteur d'onde moyen #;, et donc 
à la vitesse de phase: 


hi Em 

2 per 
_ %o _ 2m _ Mo _  h _NE2m _ |E (42309) 
dé & k& 2m 2m Dyn om 


Le terme en cosinus s'interprète alors comme l'amplitude lentement variable de cette onde plane. 


Remarquons un point assez important!: La vitesse de phase n'est pas conforme à la vitesse que nous 
obtenons en utilisant l'énergie cinétique d'une particule libre. Effectivement: 


1 2E 
E, = mi &v= EE (42310) 
2 A 


Dès lors la vitesse de phase ne représente pas la vitesse dans le sens classique habituel mais se l'onde se 
déplaçant à la vitesse de groupe: 


,_A@ _do_ af) n% M Ÿ 3 [ZE «sn 
d 2m M A LA 


où nous retrouvons donc la formulation classique de la vitesse à partir de l'énergie cinétique (pas mal...)! 
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Nous pouvons représenter aisément tout cela avec Maple 4.00b: 


>restart:with(plots): 

>lambda[0]:=1; T[0]:=1; k[0]:=2*Pi/lambda[0]|; w[0]:=2*Pi/T[0]; 

> delta_k:=k[0]/8: k[1]:=k[0]-delta_k; k[2]:=k[0]+delta_k; 

delta_w:=w[0]/10: w[1]:=w[0]-delta_w; w[21:=w[0]+delta_w; 

> Pl:=animate(cos(k[1]*x-w[1]*t)+cos(k[2]*x-w[2]*t), x=0..1*2*Pi/delta_k, t-0..2*Pi/delta_w, 
numpoints=200, frames=15, color=red): 

> P2:=animate({2*cos(-1/2*k[1]*x+1/2*w[1]*t+1/2*k[21*x-1/2*w[21*t, -2*cos(-1/2*k[1]*x+1/2*w[1 Ft 
+1/2*k[2]*x-1/2*w[21*t)}, x=0..1*2*Pi/delta_k, t-0..2*Pi/delta_w, numpoints=100, frames-15, 
color-blue): 

> display(P1,P2); 


Ce qui donne: 


Figure: 42.4 - Représentation du concept de vitesse de phase et vitesse de groupe 


À la différence de l'onde plane harmonique, cette onde n'a pas un module constant: son module est nul 
dans certaines zones. Par contre, elle s'étend toujours sur une distance infinie, donc a une norme (somme 
de la probabilité sur tout l'espace) infinie. Elle ne possède donc pas de sens physique. 


L'étude précédente peut être étendue en sommant un nombre N de plus en plus grand d'ondes planes au 
voisinage de &, et &n. Une telle superposition conduit à une fonction de plus en plus localisée dans 


certaines zones de l'espace (en particulier vers x = 0 par exemple pour £ = 0 ), la distance entre ces zones 
augmentant proportionnellement avec N. A la limite 4 —+4, alors seule la zone vers x = 0 demeure, 
les autres étant rejetées à l'infini. Le passage à cette limite À —+0 s'effectue en remplaçant la somme 
discrète sur les ondes planes par une sommation continue c'est-à-dire par une intégrale de la forme: 


+6k/2 PR 
Y(x,t)= É Fe AE (42312) 


avec: 


avec donc: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


l'a 
F(&)= A et . (42.314) 


Un tel paquet est donc appelé "paquet d'ondes quasi-monochromatiques". 
Cette expression peut se réécrire: 


+6k/2 . 
Yéx,i) = A er) (42,315) 


Il importe de comprendre que & est une fonction de k, donnée par l'équation de dispersion. Nous allons 
faire le calcul de cette expression en utilisant le fait que 5k/k, «1. 


Êk{k 1 implique que 5&/ & 1. Il est possible d'effectuer un développement limité au voisinage de 


 : 
o& 
e=0,+&-2)[2) +.=@,+v,@&-k,) (42316) 
ôk k=k, 


où v, est la vitesse de groupe. Alors: 
lot = (Eh +h)x- [a +v &- k) |: = kx- é+(x-v f)(&- kg) (42317) 
Posons y = &£-—k;: 
: (Rx) +6ki2 xv y - 
Y(x,t) = Ae | eV y (42.318) 


Calculons l'intégrale: 


Hk!2 ; A Rat) ch 
Y(x,£) = Agora) | NO y Re |, (42.319) 
-6k2 i(x=v.5) 
—6ki2 
avec: 
Œ=xX—V,É (42320) 
Soit: 
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À ja? 4 : 
PAxt)= "ls 2-9 2 ga auf) 


i(x — vf) 


A COS (a) +35 sitl (a®) — COS (a®) +i sin É = eUx-@f) 
i(x— vf) 2 2 2 2 

A sin(a)+isnfa®) Fe auf) 

i(x— vf) 2 » 


sin fa, &) af -v,9 & (42.321) 

9 gt 2 / jura L 9 4 0€ _ ra) 

(x — vf) CES 

| Ok 
sa[a-v,0$) Hi 

= AG TM) — 4 Sksinc C _ À) gx) 

(x—vé) ms 
= Petra) 


Le dernier terme s'interprête à nouveau comme une onde plane se déplaçant à la vitesse de phase: 


L'amplitude de cette onde plane est donnée par une fonction de type sinus cardinal. À £ = 0, cette fonction 
sinc n'a des valeurs importantes que dans la zone: 


Il s'agit donc d'une fonction bien localisée. En conséquence, F est une fonction de carré sommable. Le 
calcul donne: 


[BP = ox uw: 


La fonction peut donc être normalisée en posant donc: 


Nous avons donc réussi à obtenir une fonction satisfaisant à la fois l'équation de Schrôüdinger et la 
condition de normalisation, grâce à l'emploi d'une somme infinie d'ondes harmoniques. L'exemple que 
nous avons traité n'est qu'un cas particulier. D'autres types de paquets d'ondes peuvent être obtenus en 
prenant d'autres distributions pour les amplitudes des ondes planes qui composent le paquet (nous avons 
supposé ici qu'elles avaient toutes la même amplitude). Dès lors, la vitesse de groupe est associée 
classiquement à la vitesse de la particule de masse m et d'impulsion p. 
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Ainsi, le paquet d'ondes se déplace globalement à la vitesse de groupe, qui s'identifie à la vitesse donnée 
par la mécanique classique. 


Les relations d'incertitude ont déjà été introduites au début de ce chapitre de deux manières différentes. 
Mais dans l'exemple du paquet d'ondes étudié au paragraphe précédent, nous avons vu que la fonction est 
localisée dans une zone d'extension (largeur à mi-hauteur): 


Üx= 2 
Ôk 
Nous avons donc la relation: 
Ôx. Êk = 27 


Nous retrouvons ici une expression de type incertitude. Le coefficient numérique pourrait être légèrement 
différent suivant la définition choisie pour #x et S$&, ou le type de paquet. Il pourrait en particulier être 
nettement plus grand dans certains cas. Nous avons donc en fait une inégalité du type: 


Ôx-ôk227 


En physique quantique, ces inégalités s'expriment en fonction de l'impulsion p, reliées à k par ? = À&. 
Nous avons donc: 


Ôx ôp,2zh 


Ainsi, plus la quantité de mouvement (implicitement la longueur d'ondre) d'un paquet d'ondes est définie 
avec précision, moins il a de composantes et plus il est étalé, ce qui augmente d'autant l'incertitude relative 
à sa position et respectivement plus sa position est bien connue moins sa longueur d'onde le sera. 


Il ne s'agit donc pas d'incertitudes au sens de la mesure, et qui seraient limitées par les appareils de 
mesure, mais d'une propriété fondamentale intrinsèque, liée à la représentation quantique d'une particule 
selon le modèle mathématique proposé. Le modèle de l'atome de Bohr est donc à rejeter pour les niveaux 
d'énergie qui sont proches de cette égalité. 


4.4.2. PUITS DE POTENTIEL A PAROIS RECTILIGNES 


Prenons pour premier exemple, très important pour le chapitre de Physique Nucléaire et pour les 
spécialistes des semi-conducteurs, la résolution sous forme classique du puits de potentiel à parois 
rectilignes, également appelé "puits rectangulaire" (cet exemple est vraiment très important, prenez 
vraiment votre temps afin de le comprendre et de le maîtriser au mieux). 


C'est l'exemple le plus simple d'une fonction £,, (x), nulle à l'intérieur du puits et infiniment grande sur 
les parois, distantes d'une longueur L. 


Remarque: Lorsque &} = « nous disons que les parois sont parfaitement réfléchissantes. 


Nous supposons une particule piégée dans ce puits. Elle ne peut s'en échapper puisque les parois (c'est-à- 
dire le potentiel U) ont une hauteur infinie. Mais à l'intérieur, elle est libre de se déplacer sans faire 
d'interaction avec les parois. 
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Cette configuration se traduit par les conditions aux limites où l'énergie potentielle électrostatique est 
notée U : 


U=0s0<x<£Z 
ÜU' = si x<Qoux>£ 
(42.330) 


Il existe deux manières d'aborder problème. Voyons les deux types de traitements car le premier permet 
d'avoir une approche simpliste alors que le deuxième permet d'avoir une approche plus générale qui nous 
sera utile par la suite lors de notre étude de l'effet Tunnel: 


1ère approche 
L'équation de Schrôdinger (classique): 


y dY EY 87m 
—— + + + Û 


dé OO d (Eu £ 


pot 


E =0 (42331) 


a donc une solution simple respectant les conditions initiales en une dimension, du type: 
Y=Y,sain(tx) (42.332) 


dont la dérivée seconde est: 


Introduits dans l'équation de Schrôdinger, nous obtenons après quelques simplifications d'algèbre 
élémentaire: 


JÈ 
| _ (Ex _ Eva) : . (&, nu En) (42.334) 


2 
& 3 


Donc finalement la solution s'écrit: 
Pen ——————. 7x, (42335) 


à propos de laquelle il faut appliquer les conditions aux limites (la solution en cosinus est en tout point 
similaire). 


Si nous voulons pouvoir, par la suite, faire un parallèle avec un (ou des) électron(s) piégé(s) dans le puits 
du potentiel du noyau de l'atome (qui n'est par rectangulaire lui!), nous sommes amenés aux 
considérations suivantes: 


La stabilité des atomes suggère l'existence d'une onde stationnaire électronique dans le puits. De plus, 
l'observation montre que seuls certains niveaux d'énergie semblent autorisés dans ce dernier. 
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Si nous faisons une similitude avec les cordes vibrantes, la fonction d'onde de l'électron doit être telle que: 


1. Pour x =0 et x = Z il doit y avoir un noeud de vibration. Donc: P(0) = F(£) = 0 
2. La fonction d'onde T doit présenter un nombre entier de demi-longueur d'onde sur la longueur L 
3. Dans la boîte L = 0 donc Æ#,; = 0 


4. Si aux extrémités (x = 0 et x =Z) F = 0 alors l'argument du sinus vaut #7 Tne N * 


Donc nous devons avoir: 


x=2= DOME Eu) Len x (42.336) 


d'où puisque l'énergie potentielle est nulle: 


PR à Ph > 
E, = ah = —# 
OmL23e 4 2mL. 


L'énergie totale de la particule s'échelonne donc sur une suite discrète de valeurs, les seules permises. La 
valeur de L est quant à elle déterminée à l'aide du modèle de Bohr ou de Sommerfeld en fonction des cas 
(cf. chapitre Physique Quantique Corpusculaire). 


L'énergie totale de la particule ci-dessus est composée des "valeurs propres" de l'énergie dans le puits de 
potentiel. 


Donc l'équation de Schrôüdinger permet de faire abstraction du 3ème postulat de Bohr dans le sens où elle 
explicite directement la notion de quantification des niveaux par des valeurs entières (discrètes) solutions 


des conditions aux limites d'un puits de potentiel considéré comme parfait. 


Les fonctions d'onde correspondantes dans le puits où À =0 = £,,, = 0 sont donc: 


2 
F=Y,sin 8, x] =Y,sn er (42.338) 


Soit après simplification: 


. (7 
LA van (T x) (42.339) 


C'est l'expression d'une des solutions de l'équation pour le puits de potentiel rectangulaire idéal. Aïnsi, il 
existe une suite discrète de fonctions d'onde solutions. Ce sont les "fonctions propres" de la particule. 


La constante Ÿ, dans cette expression est déterminée par la normalisation de De Broglie (dont nous 
avions parlé au début de ce chapitre), c'est-à-dire par la condition: 


Le ‘ AITX 
[il dx =% Fe Ce} =] (42340) 
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Nous trouvons alors (calcul d'intégration normalement élémentaire): 


Certains physiciens ont pour habitude de noter cela sous forme complexe en ne considérant bien 
évidemment que la partie réelle de l'expression suivante (nous utilisons la "formule d'Euler" vue lors de 
l'introduction aux complexes dans le chapitre des Nombres): 


avec: 
AIT 

&,= — (42.344) 
ri 


Nous disons alors que nous avons des "conditions de quantification" sur k imposées par les conditions aux 
limites. 


Cette notation est parfois utile et nous l'utiliserons lors de l'étude de l'effet tunnel dans le chapitre de 
Physique Nucléaire. 


Nous pouvons déduire de l'expression obtenue, les propriétés principales des fonctions d'onde décrivant 
les états stationnaires de la particule dans une boîte: 


1. La figure ci-dessous représente des fonctions Ÿ’, et des densités de probabilités LA pour les premiers 


niveaux d'énergie Æ, : 
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(a) n 


n 


Li 


Figure: 42.5 - Représentation des fonctions d'onde et densité pour quelques niveaux d'énergie 


Nous remarquons que (évidemment nous pourrions analyser ceci de façon analytique et non graphique si 
nous le désirions), en plus des points x =0 et x =£,%, a (n-1) zéros situés en: 


= 2x, =mlin avecm=1,2,.,#-1 (42345) 


Ces points, où la fonction d'onde et la densité de probabilité sont nulles, sont appelés points nodaux" ou 
simplement "noeuds" de la fonction d'onde. Le nombre de noeuds augmente quand n augmente, c'est-à- 


dire quand l'on passe à des états de plus en plus excités. La fonction d'onde Ÿ, de l'état fondamental à n = 
1 et donc avec: 


2 


E=E= = (42.346) 
#72 


n'a pas de noeud, celle du premier état excité Y: d'énergie: 
E=E,=4Æ, (42347) 
a un point nodal, celle du deuxième état excité F'; a deux points nodaux, etc. 


La variation des propriétés nodales des fonctions d'onde quand n varie traduit l'orthogonalité des états 
stationnaires d'énergie différente. En effet, nous vérifions aisément que (F, | Ÿ,,} est nul quand »+ # x: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


SCIENCES. CH 
: : 
ALES FF (D Y, (max = cp (=) sin (he 
=: fe [ee De |- ” É “pe las _. 


1 { À [ere De). je æ ll 
= — À —— sin _—» ———— 
L\Ge-#)7T Ce +m)3T F2 


SX 


(u 


où nosu avons utilisé une des relations trigonométriques remarquables démontrées dans le chapitre de 
Trigonométrie. 


2. Comme nous pouvons le voir sur la figure précédente, la densité de probabilité associée à tout état 
stationnaire de la particule est symétrique par rapport au point médian x = Z/{2 


Nous anticipons donc que la valeur moyenne de x sera exactement égale à L/2 dans un tel état. En effet 
nous avons vu dans le chapitre de Statistiques que l'espérance (moyenne) d'un événement de probabilité P 
(x) est définie par: 

+o 


E(x) = [rxPGax (42.349) 


LA 
où x, E(X) et P(x) n'ont pas d'unités (attention nous allons faire une analyse dimensionnelle). 


Or, en physique quantique E(X) et x sont des grandeurs dimensionnelles identiques. Ce qui signifie que les 
dimensions de P(x) doivent annuler celles de dx. Aïnsi, nous devinons suite à l'étude des conditions de 
normalisation de De Broglie que: 

P(n =[Ÿ, (nf 2.350) 


est une probabilité linéique de présence de la particule. 


Le domaine d'intégration étant [0; L] nous avons finalement: 


F 1 1 
Ex) = [Tr (@f dx = *o[ x sin? (ER - sfr (Le 


at Er ÿ Er 
SNS D 
4e tel] 
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3. Également sans démonstration car ce résultat est trop évident (si jamais il ne l'est pas pour vous dites-le 
et nous ajouterons le développement comme pour tout autre chose dans ce site d'ailleurs), la quantité de 
mouvement le long de x est nulle: p, = 0 


4. Nous pouvons par ailleurs vérifier sans trop de peine que ce que nous avons vu lors de l'énoncé du 2ème 
postulat se vérifie bien dans cet exemple. C'est-à-dire que les fonctions propres de l'onde sont reliées à 
l'opérateur hamiltonien via les valeurs propres de l'énergie: 


À 
E pot > AIT=E,T 
rt 
ef 
2 14 
hoc y 
2 2mE 


_K & Be Fe) _ hr? Ês Fe) 
2m (NE UE )] one (NET UE )] 355 
D sin ñ = À sin Z 
. | (=) fs (=) 
= — —sin| —— ||= sin| —— 
F2 L r? £ 


= 


voilà. pour la première approche du problème. Voyons maintenant la deuxième: 
2ème approche 


Nous avons donc l'équation de Schrôüdinger dans le cas unidimensionnel: 


PY rm — 
DS AE Bi En)? =0 (42.354) 


Dans les régions situées en dehors de la boîte où le potentiel est infini, nous avons: 


PY gr 
+ TE —æo)Y=0 (42.355) 
x k 
Soit: 
LA 
—>=0Y (42.356) 
êx 


ce qui donne: 
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Ainsi, les fonctions d'onde sont nulles dans les régions où le potentiel est infini. 


Considérons maintenant le cas du puits où puisque le potentiel électrostatique est nul, l'équation de 
Schrüdinger se réduit à: 


PY rm 
FES der mu E, , Ÿ = 0 (42.358) 


C'est donc une équation différentielle linéaire d'ordre 2 avec des coefficients constants, équation qu'il est 
relativement aisé de résoudre dans le cas général (cf. chapitre de Calcul Différentiel Et Intégral). Soit 
l'équation: 


y'+py+qy=0 (42359) 
En nous aidant des résultats obtenus lors du traitement de la solution particulière, supposons que la 
fonction y qui satisfait cette équation différentielle soit de la forme y =e**. Nous avons alors: 


Ke + pKe® +ge® =0 ou K?+pK+g=0 (42.360) 


pourvu, bien sûr, que 2** - 0. Cette dernière relation est donc l'équation quadratique auxiliaire de 
l'équation différentielle (polynôme caractéristique). Elle a deux solutions/racines (c'est une simple 
résolution d'un polynôme du deuxième degré) que nous noterons dans le cas général #,,#; . Ce qui 
signifie que: 


Le k k 7 
k29%7 +pk ge +a = 0 €t Ke 2Ÿ +pk;e 2 +ge ? =0 (42361) 
est satisfait pour les deux racines. Si nous faisons la somme puisque les deux sont égales à la même 
constante: 


Le Le Le 
(x22 + Ke F + pK + K,e DETTE +e ») =0 (42362) 


Ainsi, il est immédiat que la solution générale de y est du type: 


Kx Ka 


y = Ae Ÿ +Be (42.363) 


où le lecteur devrait normalement sans peine pouvoir vérifier que l'ajout des constantes À et B ne change 
en rien les développements des paragraphes précédents. 


Dans le cas qui nous occupe: 


87m 


h? 


F'+ E, Ÿ = 0 (42.364) 


L'équation quadratique est: 
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8 
ps 


2 


k° =0—Kk7=-2mE,h? (2365) 


soit: 


k = R'Ru = + ss (42.366) 
k k 


Donc finalement la solution générale est de la forme: 
2mE 2mE. 
Y = Aexp : = ] + Bexp È  — « (42.367) 


Posons maintenant: 


Nous avons alors: 
Y = AeŸ+Be % = Acos8+idsin8+Bcos8—iB sin 8 7. 
= A'cos 8 +B'sin 8 
avec: 
A'= A+B et B'=i(A-B) (42370) 


Il faut maintenant déterminer A' et B' en utilisant les conditions aux limites. Ainsi, en x=0 et x=L nous 
devrions avoir T = 0 et nous avons pour x=0: 


2 E, 2mE, 
ve de (AE pan) à (42.371) 


Le coefficient A' doit donc être nul. Et en x=L nous devrions avoir: 


2 E V2 E 
Y = A'cos À De + B'sin NP; 
h h 
2 E, 1/2 E 
0e (ÈE Jer[ | 


(42.372) 


+ : 
x = B'sin 


ME). 


Mais dans ce cas, B' doit être différent de zéro. En effet, s'il était nul, la fonction d'onde serait nulle dans 
tout le puits ce qui est contraire à la réalité physique du problème. Il faut donc que ce soit le sinus qui soit 
nul, ou encore que son argument soit égal à un multiple d'un nombre entier non nul d'angle # tel que: 
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Donc: 


(42.374) 


Nous retrouvons donc exactement le même résultat que la méthode précédente. 


Il reste à déterminer B et la méthode est exactement identique à la première méthode de résolution que 
nous avons vue plus haut. Ainsi, nous avons bien: 


Ce qui est important surtout dans cette méthode, c'est de se souvenir pour plus tard de la forme générale de 
la solution: 

Y = AeË + Bo (42.376) 
4.4.3. ÉNERGIE DE FERMI 
L'énergie de Fermi, Æ;, est un concept en physique quantique qui désigne l'énergie du plus haut état 
quantique occupé dans un système idéalisé où toutes les couches se remplissent successivement et sans 


discontinuités, c'est-à-dire en pratique lorsqu'un système est au zéro absolu: 0 [K] (cf. chapitre de 
Mécanique Statistiques). 


Le mur de potentiel rectiligne est un excellent moyen pédagogique d'introduire pratiquement le niveau 
d'énergie de Fermi pour ensuitre l'étendre à d'autres cas particuliers. 


Rappelons donc que nous venons d'obtenir de deux manières différentes: 
TR 2 Th 2 
E,, = ht = — #1 
2mPI4 2mL 


Alors l'énergie totale de tout un système composé de N particules pouvant prendre toutes le même état 
fondamental n = 1 et violant donc le principe de Pauli sera: 


Es =|——|\N (42378) 


Mais si nous appliquons le principe d'exclusion de Pauli des électrons (fermions), chaque niveau ne peut 
alors dans ce modèle (qui ne contient pas de sous-couches ou autres subtilités) prendre que deux états 
(oppostions de spin). Dès lors, chaque le niveau fondamental ne peut être occupé que par deux états et il 
en est de même de chaque niveau. L'énergie totale est alors: 


2 2 hi Ch? N/2 
2 2 
Ex =2) En=2) —%n =— Yan (42379) 
ur n=i 2 ME pe 
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En utilisant la somme des carrées démontrée dans le chapitre de Suites Et Séries et en notant comme il est 
d'usage: 


Nous avons alors: 


FRA E. = (etes be 0) Te NS U2385 
ME ni "E 6 ME 3 2m 


L'énergie moyenne par particule est alors: 


Er (42.384) 


4.4.4. OSCILLATEUR HARMONIQUE 


L'étude de l'oscillateur harmonique correspondant à celle d'une fonction d'onde coincée dans un puits de 
potentiel parabolique. Ce qui est assimilable grosso modo aux atomes où les parois du puits de potentiel 
ne sont naturellement pas rectangulaires et infinies. L'étude qui va suivre est donc ce qui est le plus 
proche de ce qui est disponible dans la Nature au niveau atomique. 


Dans le cas d'une particule libre en déplacement rectiligne, nous avons vu que l'énergie potentielle est 
nulle £,; = Ô et l'équation de Schrôdinger devient alors: 


2 ‘ : 
— - + Ce = *Y=0 (42.385) 
ZX 


Cependant, pour une particule libre (en l'absence de champ de potentiel) l'énergie totale est donc égale à 
l'énergie cinétique: 
2 


2 
my= 2? (42.386) 
2° 


Mais nous avons: 
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- £, hr "V 


æ 
Eh v=h —=h@=mc Sp=m'c=——==—=h"}À (42387) 
27 c c 


Le rapport: 


k 
À = — (42388) 
2 


étant la longueur d'onde associée de De Broglie. En introduisant le nombre d'onde # = 2xf À (cf. chapitre 
de Mécanique Ondulatoire), nous avons: 


P=hk (42.389) 


appelée "relation de De Broglie”. Finalement: 


2 Ni 
8 -P' (Ré) 


= = (42.390) 
PE Dom 2m 
Dès lors, l'équation de Schrüdinger peut s'écrire: 
ay 
— +K2Y=0 (42391) 
êx 


Nous voyons par substitution directe que cette équation différentielle admet pour solutions les fonctions 
d'onde: 


(x) = 4% et Y,(x) = Be (42392) 


Ces deux différentes solutions représentent le déplacement d'une même particule une fois dans la direction 
+x et l'autre dans -x. Si 4 = 8 =1 nous avons: 


PGO = PP =e 8 21 (42303) 


Le fait que ce résultat soit égal à l'unité, signifie que la probabilité de trouver la particule est la même en 
tout point. En d'autres termes, Y(x) = e** décrit une situation dans laquelle l'incertitude sur la position 


est totale. Ce résultat est en accord avec le principe d'incertitude puisque T(x) = e*® décrit une particule 


dont nous connaissons avec précision la quantité mouvement 2 = À' Æ: c'est-à-dire que £ = 0, ce qui 
implique Âx — ©. 


Dans le chapitre de Calcul Différentiel Et Intégral nous avons montré que la solution la plus générale 
d'une équation différentielle est la somme de ces solutions. Autrement dit dans notre exemple: 


Y(x) = A4eŸ + Be Ÿ (42.394) 


avec: 
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Au fait, nous pouvons remarquer que si #,,; “ Ü alors le résultat est le même à la différence près que 


= V2: (Étot 7 Epot | (42.396) 


k 


nous aurons: 


Lorsque la particule qui nous intéresse se trouve dans un puits de potentiel décrit par la fonction (parabole) 


En ( x) = 


nous parlons alors "d'oscillateur harmonique”. 


Ce système est très important car l'hamiltonien de l'équation intervient dans tous les problèmes mettant en 
jeu des oscillations telles que vibrations moléculaires et cristallines (cf. chapitre de Chimie Quantique). 


Prenons d'abord comme exemple l'oscillateur harmonique classique qui consiste en un corps assujetti à se 
déplacer le long d'un axe et soumis à une force de rappel proportionnelle à la distance à un point situé sur 
cet axe. 


L'équation de ce corps est régie par l'équation de la dynamique: 
d?x 
m'—+kx=0 (42398) 


Nous avons vu en mécanique classique que la solution générale de cette équation est: 


X=Xn'Cos(@'f+@) (42.399) 


E 
æ=,|— (42400) 
m 


L'énergie totale du système étant l'hamiltonien classique, nous écrivons: 


avec comme pulsation: 


p° 
H=E, jm (S + —k: x(é)? + x(£)? (42.401) 


Il s'ensuit au vu de l'expression de l'énergie potentielle que la constante que nous avions dans la relation 
de départ qui définissait la puits de potentiel parabolique: 


1 
E,,(x) . ‘c“:x? (42.402) 


est simplement k et dès lors: 
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2 


1 
Epor (xs > @T mx (42.403) 


mais que nous noterons pour la suite et par tradition sous la forme suivante: 


E 


LE 
= mx (42.404) 
pof 2 


Maintenant revenons à notre cadre quantique. De ce point de vue nous avons pour hamiltonien (ou énergie 
totale): 


+8 = 4 2 (42405) 
où donc pour rappel suite à ce que nous venons de voir: 
ct = .m (42406) 
En utilisant ce que nous définissons comme une "écriture réduite", nous écrivons: 


H = à (p: - 0°) (42.407) 


où les opérateurs quantité de mouvements et positions réduits sont respectivement: 


te 


D ne 


X (42.408) 
m'h: @, an 


te 

et où nous avons remplacé la constante par æ, = fe” identiquement à l'oscillateur harmonique classique 
A 

(cf. chapitre de Mécanique Classique). 


Il est plus ou moins facile d'obtenir la relation de commutation: 


ce 1 | 
[Q,PT=)——[x,p] (42409) 
m hk@, 


Démonstration: 


Rappelez-vous de la relation ci-dessous que nous avons vue lors de notre étude des opérateurs linéaires 
fonctionnels au début de ce chapitre: 


Étudions les propriétés des commutateurs avec la quantité de mouvement. Nous avons démontré 
également plus haut la relation ci-dessous: 
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d d 
—x=1l+x— (42411) 
dx dx 


En multipliant cette dernière par k/5, il vient: 


que nous pouvons également écrire: 
Pr'X=X'P,; -h'i (42413) 
Si vous vous rappelez de la définition des commutateurs ([&, 6] = 46 — 6&), nous avons: 
[x2,1=2" 2, -2,'x=h'i (42414) 


Nous avons donc pour notre oscillateur: 


ot 4 ; c* 
2 4 
Pre jrraate os Gun 


écrivons la définition du commutateur: 


[Q,P]=0P-PQ (42416) 
Donc: 


c® # 
1 à, 1 in c 


F a 
Rte Fi m'h'@, &x m'h'@, k'&, 


el 
= ih x —jih-— (42.417) 
" — |: |- Et hs] 


 — LE _ : 2 
Écr- Pr x) ha rie, en Ris 


c'est ce qu'il fallait démontrer. 


Nous avons maintenant intérêt pour résoudre l'équation différentielle d'utiliser les opérateurs non 
hermitiques & et al définis (c'est une définition donc ne cherchez pas trop loin): 


f2a =Q+iP 
2a! _ Dir 


Ce qui nous définit donc les opérateurs (en posant temporairement »# = 1 ): 


(42.418) 


(42.419) 
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qui sont des des combinaisons linéaires des opérateurs position et quantité de mouvement et ne sont 
trivialement pas hermitiques. 


Nous retrouvons ces deux opérateurs très fréquemment en physique quantique et les physiciens parlent 
alors de "l'opérateur de création" 4! et de "l'opérateur de destruction" a (appelé aussi "opérateur 


d'annihilation"). 


Compte tenu de la relation de commutation, nous vérifions: 


Démonstration: 


et: 


et d'autre part: 


Démonstration: 


2aal = P?+Q? +1 et 2ala= P?+Q?-1 (12420) 


2aal = (Q +iPQ -iP) = Q? +iPQ -iQP + P° 
=@-iQ0P-rP0]+P = -0,P7]+ 7 (42.421) 
= PF+Q°-ii-= P+Q°+1 


2ala =(Q-iPQ +iP) = Q? -iPQ +iQP + P? 
= @ +i0P-P0]+ 2 = 0? +i10,P]+ P (42.422) 
= P+Qf+ii= P+0°-1 


[aa = aa -ala=1 (42.423) 


2aa -2ata=(P?+@)-(P?+@)+1-(-1)=2 (42424 


et donc en divisant par 2 des deux côtés de l'égalité, nous avons: 


Revenons à la relation: 


Utilisons: 


aal-ala=1 (42425) 


H = ne (p + 0°) (42.426) 


2 2 _ 2 2 
E e IP —. alat= = N+e (42.427) 


Î 


& & 


AL 


où il apparaît que N peut être vu comme un opérateur, appelé "opérateur compteur" (hermitique) puisque: 
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Il suffit alors de quantifier l'opérateur compteur pour les connaître les valeurs propres et les états propres 
de H puisque ces deux sont éléments sont liés alors par: 


(42.429) 


Nous faisons maintenant l'hypothèse que T est une fonction propre de N associée à la valeur propre n, 
telle que: 


HY = EY 
1 1 

> k% fa+i)e, = k% Pr) +, (42.430) 

= NY, =nŸ 


ñ 


Cette hypothèse est très importante car nous allons nous en servir comme principe d'induction pour 
trouver toutes les fonctions propres à partir de la fondamentale! 


Établissons maintenant des relations de commutation entre N et les opérateurs a ou &!. Pour cela, 
multiplions d'abord 441 - la =1 le tout par &4l, nous obtenons: 


Nal-alN=a (42431) 
De même en multipliant 441 - al =1 par a, nous obtenons: 
aN-MNi=a (42432) 


Puisque selon notre hypothèse T et n sont respectivement fonction et valeur propre de N, nous pouvons 
écrire: 


NY=nY (42433) 
Or, nous avons: 
WNa=aN-a (42434) 
qui multipliée à droite par la fonction d'onde donne la relation: 
NaY = (x- Day =aŸ-a% (42435) 
Cette équation entraîne les conséquences suivantes: 
- Ou bien 4 F = 0 tel que Na T = #aT 
- Ou bien 4'T est fonction propre de N pour la valeur propre n-1 !! 


Le même raisonnement établirait que 4l% est fonction propre de N pour la valeur propre n+1, si elle n'est 
pas nulle (nous verrons plus loin que 4l'% n'est jamais nulle): 


Maty) = (x +1)aty (42.436) 
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Cette relation est importante car si 41% n'est pas nulle pour une fonction propre donnée elle ne le sera pas 
non plus pour les autres fonctions propres de valeur propre n+1 !! 


Nous savons qu'il existe une valeur propre *, plus petite que toutes les autres correspondant au niveau 
fondamental (d'après le modèle de Bohr-Sommerfeld cette valeur propre existe toujours). 


Nécessairement, sa fonction propre Ÿ, obéit à la relation (le lecteur pourra vérifier avec les résultats plus 
loin): 


aY,=0 (42437) 
sinon quoi #, — 1 serait valeur propre et il y aurait contradiction. 
En multipliant cette dernière relation par 4! nous obtenons: 

NY, =0 (42438) 


ce qui montre que la valeur propre minimale #, est nulle. Nous connaissons donc le niveau fondamental 
de l'oscillateur: 


l 1 
EE =h% (x +3) = 54% (42.439) 


Remarque: Il faut noter que l'oscillateur n'est jamais dans un état de repos (mettre n = 0 dans 
l'expression de l'énergie plus haut) ce qui veut aussi dire que le zéro absolu ne peut pas être accessible 
puisque la température "chiffre" l'agitation atomique, or le repos n'existe pas! 


Pour obtenir la fonction propre correspondante, nous avons besoin de l'expression explicite de a. D'après: 


te 


P É 
et (= 
Jr ho 2 kw, 


P = 


X (42.440) 


nous avons: 


1 h ä & te 
PE — age Le nee 
n'a î dx k'æ dx Vh'a& dQ 
ce qui nous donne: 


1 h | c* d 14 
P=—————- |— —=-— (4244) 
rh i h'&, dQ oi dQ 


car rappelons-le: 
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d'où: 
d 
24 = 0 + — 
V2a =Q 0 
à (42.444) 
al =Q-— 
(e) 210 


Mais d'après aŸ, = 0: 


É + El =0 (42.445) 


d'où: 


1 4 


UV sn. 
CAPE © (42.446) 


soit (résolution d'une simple équation différentielle): 


Y(Q)=Cfe #12 (42447) 


Nous devons envisager, en réalité, Ÿ, comme fonction de x par le biais de la coordonnée réduite Q. 


D'après: 
te 


k'& 


0 = 


x (42.448) 


en introduisant la longueur A: 
x= A Q—dx= AdQ (42449) 


avec: 
A= A (42.450) 


et comme: 


= .m (2451) 


A= LA (42.452) et Q = DM (42453) 
#2 k 


Il vient alors: 
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Nous allons vérifier si nous satisfesons la condition de normalisation de De Broglie, sinon quoi il sera 
nécessaire d'introduire une constante multiplicative. Nous avons alors: 


PR © 2 2 2 
[REA dx=1= pee) 44Q = Alc*<| fe aQ = A]c*| x (42451) 


—© 


et donc nous devons avoir: 
1= A|c** F Jr =cftz AU US (2455) 
Il est loisible de choisir la constante réelle et positive, nous avons finalement: 
Yo=ce 970712 2 gU2pli4 0712 (42.456) 


Corollaire….: D'après ce que nous avons vu précédemment, en faisant agir 4! sur T, (explicitement nous 
faisions référence au résultat 7 (atw) = (x +1)at y ), nous obtenons les fonctions propres de N pour les 


valeurs propres entières 1, 2, etc. Nous vérifierons plus loin que nous épuisons ainsi toutes les valeurs 
propres de N. 


Il reste à construire les autres fonctions propres et à les normer. En effet, si Ÿ, est fonction propre 


normée associée au niveau Æ,, nous avons vu plus haut que aty, est fonction propre associée au niveau 


n+1 (l'opérateur de création 4! fait augmenter l'énergie d'où son nom...), mais il n'y a pas de raison de la 
normer à nouveau puisqu'elle est justement associée à une fonction propre déjà normée. 


Nous pouvons écrire: 
al, =a TV, (42457) 


&, étant un coefficient à déterminer. Exprimons le fait que Ÿ,.,, est déjà normée: 
à +o +o _ 
la, | = fer) ‘(al Y )ax = [% ‘(aalY dx (42458) 
Soit en tenant compte de la relation 441 - ala = 1 nous avons: 
2 ® — 

la, | = [EC +ala)Ÿ, dx (42459) 
Rappelons que Wal?) =(#+1){alF) donc: 

2 ® — 

la, | = [EE +ala)Ÿ dx =» +1 (42460) 


Nous venons de vérifier au passage que 41% n'est jamais nul (fait que nous avions supposé plus haut). 
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Toutes les fonctions Ÿ, (sauf Ÿ,; déjà fixée) ont un facteur de phase arbitraire (notion que nous avons 


vues lors de la définition des états liés et non liés), indépendamment les unes des autres, l'argument de &, 
reste donc à notre disposition et nous choisirons &, réel positif. Cela fixe toutes les Ÿ, : 


= n + 1#,, (42.461) 


En itérant cette relation sur la fonction d'onde, nous obtenons aisément (algèbre élémentaire): 


1 # 
Y,=——(al)"Y, (42.462) 


"nl 


soit en tenant compte des relations suivantes (que nous avons déjà démontrées précédemment): 


-0++ 
E À et Y, = 471274, -0f12 (42.463) 
2al=Q-— 

1e) 20 


Nous avons alors: 
1/2 aY 
= 47 lnl2"| e-<) ge #1 (42464) 


Cette équation prend une forme plus simple, en s'appuyant sur la relation: 


LS S(Q) = -"" Te e DA F(Q) (42465) 


Vérification: 


#1 ge PQ =" [ee 0) +687 IQ) 


: HET -Sro)- LS J@) 


(42.466) 


soit, en langage d'opérateurs: 


© _ à = 921 4 ,2n 
do dQ 


(42.467) 
Ainsi: 


e-< = = (> 12 5 ge 12 (42468) 


Nous obtenons ainsi l'expression de Ÿ, : 
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-g* 


Ve AN erAN ER EPLEIR [SCIENCES.CH] 
-1/2 d* 
eg" 


=" ar 2h12") eÊ (42.469) 
| 20° 


Par ailleurs, dans la théorie mathématique des familles de polynômes orthogonaux, nous rencontrons les 
"polynômes d'Hermite" À, définis par: 


H,(O) = (Ye FE | «470 


Ce sont des polynômes de degré n, pairs ou impairs (4, = 1, 4, = 2Q,H, = 4Q* -2). En les employant, 
nous allégeons la relation précédente qui devient: 


e,= ar no) Te LH (0) | (42.471) 


Soit explicitement: 


2 
-1/2 : { | 
En = "| ee) e 2 = , (42.472) 
d er] 


Ces polynômes constituent donc une base orthonormée de l'état quantique global et apparaissent donc 
naturellement dans l'expression générale des fonctions/états propres. 


Finalement nous avons: 


Tableau: 42.2 - Fonctions et énergies propres de l'oscillateur harmonique pour n=1..3 


Avec la non moins fameuse représentation graphique avec à gauche les fonctions propres associées Y, et 
à droite la probabilité de présence: 
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-0.+ -0.i 0.i Ü.4 -0.+ -0.2 d.i Ü.4 


Figure: 42.6 - Représentation des fonctions propres et fonctions de densité de quelques niveaux d'énergie 


On peut facilement obtenir la partie de gauche avec Maple 4.00b (l'exemple est non normalisé d'où 
l'abscisse qui est un peu spéciale par rapport à la figure ci-dessus!): 


>m:=1;omega:=1;h:=1; 
>plot([(sqrt(m*omega*Pi/h))\0.5*exp(-m*omega*x/2/(2*h)),(1/2*sqrt(m*omega*Pi/h))\0.5*2*sqrt 
(m*omega/h)*x*exp(-m*omega*x/2/(2*h)),(1/8*sqrt(m*omega*Pi/h}\0.5*(4*m*omega/h*x12-2)*exp(- 
m*omega*x/2/(2*h)),(1/48*sqrt(m*omega*Pi/h)\0.5*(8*(m*omega/h}\(2/3)*x13-12*sqrt(m*omega/h) 
*x)*exp(-m*omega*x/2/(2*h))],x=-6..6); 


En analysant ces fonctions d'ondes, nous retrouvons de nombreux résultats classiques: la particule dans le 
puits de potentiel a une probabilité de présence plus élargie si elle a une énergie plus haute (une bille au 
fond d'un puits va monter plus haut sur les bords si elle a plus d'énergie), la particule a plus de chance se 
retrouver sur ces positions éloignées du centre du puits (la bille a une vitesse d'autant plus petite qu'elle 
est haut dans le puits: elle va donc passer beaucoup plus de temps en hauteur qu'au fond du puits). 


Pour tous les calculs où des particules sont dans un puits de potentiel, l'approximation harmonique est très 
intéressante. Par exemple, si nous souhaitons étudier un "piège harmonique" à deux dimensions, soit 
condensat de Bose-Einstein 2D (cf. chapitre de Mécanique Statistique) nous pourrons poser l'hamiltonien 
suivant pour débuter l'étude (en analogie avec celui à une dimension utilisé plus haut): 


di, 
+ 
He Ps +5nc 


(2 +3?) (42.473) 
2m 
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4.4.5. EFFET TUNNEL 


L'effet tunnel désigne la propriété que possède un objet quantique de franchir une barrière de potentiel, 
franchissement impossible selon la mécanique classique. Généralement, la fonction d'onde d'une particule, 
dont le carré du module représente l'amplitude de sa probabilité de présence, ne s'annule pas au niveau de 
la barrière, mais s'atténue à l'intérieur de la barrière, pratiquement exponentiellement pour une barrière 
assez large comme nous le démontrerons. Si, à la sortie de la barrière de potentiel, la particule possède 
une probabilité de présence non nulle, elle peut donc traverser cette barrière. 


L'étude théorique de ce phénomène est d'une importance cruciale dans la théorie des semi-conducteurs et 
de la désintégration en physique nucléaire. Il convient donc d'y accorder une attention bien particulière! 


La barrière quantique de largeur L sépare dans les cas simples l'espace en trois, dont les parties gauche et 
droite sont considérées comme ayant des potentiels constants jusqu'à l'infini. La partie intermédiaire 
constitue la barrière, qui peut être compliquée, révélant un profil doux, ou au contraire formé de barrières 
rectangulaires, ou autres éventuellement en séries. 


Étudions maintenant le cas de systèmes où l'énergie potentielle Ex (implicitement le potentiel y relatif) 
tend vers des limites finies, non forcément égales quand x — +. Il s'agit donc d'un problème d'états non 


liés. 
D'abord, nous définissons une région I loin à gauche où Æ,, (x) sera notée: 
Eu(-o)=EÆ, (2474) 
une région III loin à droite où Æ#,,4 (x) sera notée: 
Etre) = En (42475) 
En se bornant aux situations les plus simples, il y a trois possibilités relativement aux relations données 


précédemment: puits de potentiel (a), marche de potentiel (b), barrière de potentiel (c) comme représentés 
dans l'ordre énoncé sur la figure ci-dessous: 
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(à) 


1 
Figure: 42.7 - Types classiques de variation de potentiel 


Maintenant, écrivons l'équation de Schrôüdinger: 
2 
ÀAY + 7 Eur —Æm)Y =0 (42476) 


Dans les régions I et III de la barrière de potentiel, l'idée est que £,, - #,, est constant et positif donc 
l'équation différentielle peut s'écrire en une dimension: 


PY 2m Y ; nn 
Sr tr lEa En) PET HE y=û0 (42.477) 


nous obtenons ainsi très simplement l'expression analytique de Ÿ dans ces régions sous forme générale: 


D, = Aer + Be KA 


(42.478) 
1 KrrX 1 —KmX 

Yy = À'e oué + B'e æ 
Nous trouvons ces deux expressions de façon identique que lors de notre étude du puits de potentiel à 
parois rectangulaires, à la différence que nous avons écrit ci-dessus les solutions générales de l'équation 
différentielle (cf. chapitre de Calcul Différentiel Et Intégral) sans en déterminer les coefficients (car nous 
nous intéressons ici à une généralisation). 


Ainsi, dans l'étude du puits à parois rectangulaires plus haut nous avions déjà déterminé que: 
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Br m rm L 
k; = FE (x _ Eu) et £zr = Fe (&x -Em) (42.479) 


Remarques: 


R1. Nous voyons que les nombres d'ondes k sont donc proportionnels à la racine de l'énergie 
cinétique. Et comme l'énergie cinétique est proportionnelle à la vitesse au carré des particules, il vient 
alors que la vitesse est proportionnelle au nombre d'onde (et réciproquement)! 


R2. Dans certains ouvrages, pour simplifier les notations, le potentiel dans les régions I et III et posé 
comme référence et donc égalisé à O. Il disparaît donc des deux expressions précédentes et cela a pour 
effet d'égaliser les deux nombres d'ondes qui sont alors notés simplement k. 


Dans la région II, l'idée est que Æ,, - #,. est négatif et constant donc l'équation différentielle peut 
s'écrire en une dimension: 


PY 2m 
— + 


PY 2m PY > 
__—_— (Ex - En) = K°%=0 (42.480) 


(Ea-Eu)F= TS FE 


et comme nous l'avons vu lors de notre étude du puits de potentiel rectangulaire infini selon la 2ème 
approche, la solution est alors de la forme: 


Yyr = Ce +De À (42481) 


avec: 


K= _ 1) (42.482) 


Remarque: La parenthèse sous la racine de la relation précédente doit donc être positive. Or cela 
signifierait que l'énergie cinétique de la particule est négative. Pour pallier à ce problème dans le 
cadre de ce modèle simplifié, on dit que la particule n'a pas le droit d'exister dans la barrière et qu'elle 
empreinte de l'énergie au vide. Mais il y a d'autres modèles plus complexes qui ne nécessitent pas ce 
genre de fantaisies. 


Nous obtenons ainsi très simplement l'expression analytique de dans les trois régions sous forme 
générale: 


x Fal x Fal 


Y;=4e * +Be 
Vr= CE De (42.483) 


Pr = A'E +B'e M 
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Supposons maintenant que nous ayons à -® (région Î), une source de particules (qui les envoie vers la 


droite), avec une énergie cinétique valant évidemment £,, - Æ,. 


Ainsi, ces particules ont une énergie Æ,, et la fonction d'onde qui les décrit obéit à l'équation de 


Schrôdinger. Dans la région II, il sera supposé qu'il ne peut exister que des particules allant vers la droite 
(pas de source à +®, par hypothèse). 


La région III, comme du reste la région L, est d'étendue infinie, donc le principe d'incertitude nous permet 
de parler en théorie d'une quantité de mouvement parfaitement déterminée que nous noterons p'. 


Nous savons que (c'est de la mécanique classique!) dans la région III nous avons alors: 


12 
P = I 19 AA 
— E,, Ex (42.464) 


2m 
Si £,, > eh alors p' est positif, donc grâce à la relation précédente et à la relation de De Broglie nous 
avons: 
hi 
p'= 2m, -E%) = (42485) 
27 
Soit: 
Hi E 
2m( Eu — Epa 2m(E,, — Epa (42.486) 
£zr = £; = L : 
k k 


Les nombres d'onde étant maintenant connus formellement revenons à l'interprétation de la solution II: 
y = A'et + B'e nt (42,487) 


L'hypothèse comme quoi les particules viennent de la gauche nous impose 8'= 0 pour que la solution 
décrive uniquement des particules qui vont vers la droite. Ensuite, il est loisible, pour celles venant de la 
gauche, de prendre A'=1 . La région IIT est donc relativement simple d'analyse. 


Remarque: Les conditions et hypothèses utilisées précédemment sont souvent appelées "conditions de 
scattering". 


Les constantes À et B de la région I vont être elles complètement déterminées en effectuant le raccord des 
solutions d'une région à l'autre. 


Intéressons-nous donc maintenant à l'interprétation de l'équation dans la région I: 
P,= Ae + Bot (42.488) 


Il est évident que 42** décrit des particules qui, dans la région I, se dirigent vers la droite alors Be-** 
décrit des particules qui, dans cette même région, se dirigent vers la gauche. Comme nous le savons, les 
premières sont les particules incidentes, les secondes sont les particules réfléchies. 
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Ce que nous demandons à la physique quantique apparaît maintenant d'une façon claire: une particule 
arrivant de la gauche (incidente) peut soit: 


1. Continuer vers la droite, c'est-à-dire franchir la région II et devenir une particule transmise 
2. Retourner vers la gauche et devenir une particule réfléchie. 


Nous sommes amenés à définir un "coefficient de transmission" T assimilé à la probabilité qu'a la 
particule incidente de franchir la région IL et un "coefficient de réflexion" R, probabilité qu'a la particule 
incidente d'être réfléchie. Nous devons avoir: 


R+T=1] (42489) 
Dans le cas d'une barrière de potentiel, T est également appelé la "transparence de la barrière". 


Pour calculer R et T, nous définirons les flux courants des diverses catégories de particules (incidentes, 
transmises, réfléchies). 


Par exemple, puisque les particules incidentes sont décrites par 4£**, le nombre moyen de ces particules, 


; ; à . on 
par unité de longueur dans la région I, doit certainement être proportionnel à un facteur près à [A ; 


Soit v; leur vitesse, nous voyons que le courant des particules incidentes ;,, est alors proportionnel à un 
sin 7 . _— a 
facteur près à |A] v, (analyse dimensionnelle). Aïnsi, le coefficient de proportionnalité étant de même 


nature pour les trois catégories de particules (incidentes i, réfléchies j, transmises t) et du fait que v, et 
V# Sont proportionnels à #, et & , il s'ensuit que /,,f, (courants incident et réfléchi) et /, (courant 


transmis) sont respectivement proportionnels (donc toujours à un facteur dimensionnel près!) à #, | Al : 


&; EI et &- (puisque rappelons que pour la région III nous avons trouvé A'=1 et B'=0). 


Nous déduisons de là très simplement, par un simple rapport, les expressions des coefficients de réflexion 
R et de transmission T: 
2 12 
_ HT _ &y 1 
_ _ 2 
WP kr [A 


(42.490) 


Hs 
af 


À 


et comme dans notre cas particulier #; = &;r il vient: 


Une autre façon d'écrire les choses est de dire que puisque l'onde incidente se résume à: 
pi 4% (42492) 
et l'onde transmise à: 


pT= A (42493) 
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alors: 


(42.494) 


Dans toutes ces situations, la théorie quantique conduit, en général, à des valeurs de R et T petites, mais 
pas nulles ! 


% Exemples: 
Déterminons l'expression explicite de la transparence pour notre exemple de barrière rectangulaire. 


Pour cela, nous savons que nous devons imposer la continuité de F en x =0 et x = Z, ainsi que la 
continuité de 4 Y {dx en x=0 et x=£Z. 


Donc rappelons d'abord que nous avons les trois relations (en mettant la référence du potentiel à 0): 


Y,= A8 + Be 
Pr=Ce+De À (42495) 


Yu = À'e +B'e tt 


avec donc: 
k= NT et y _ V2n(Eva — En) (42.496) 


Nous avons alors pour la continuité de Y en x=0 et x =£: 


A+B=-C+D 
Col 4 De 2 AOÛ 4 po NE (42.497) 
ainsi que la continuité de 4 Y / dx en x=0et x=£: 
ikA —ikB = KC-KD 
(42.498) 


KCe? - KDe © =ikA'e"t — jkB'e À 
Puisque B' est nul nous avons un système de 4 équations à 5 inconnues: 
A+B=C+2D -B+C+D=A 
ikXA— KB = KC - KD ikB + KC— KD =ikA 
Ce + De = 4e" Ce + De 4'e 20 
KCe® - KDe % =ik'et  |KCeË - KDe * -ik4'et = 0 


(42.499) 


Nous allons choisir d'exprimer toutes les constantes à partir de A. Pour cela nous multiplions la première 
ligne par ik et la sommons à la deuxième ligne. Nous avons alors: 
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KB +ikC+:kD =ikA 
+ ikB+KC-KD = ikA (42.500) 
(Æ+ik)C-(K-1ik)D = 25kA 


et ensuite nous multiplions la troisième ligne par -ik et la sommons à la quatrième ligne. Nous avons alors: 


ikCeË _jkDe À + jtA'ol 20 
+ KCeËl- KDe M -jkA'ekl 0 (42501) 
(K-ibeËC_-(K+ibe ED = 0 
Nous avons donc les deux relations: 


(E +ik)C-(K—ik)D = GkA 


: (42.502) 
(K-ideC-(K+ibe ED=0 
ou en posant æ=&/K: 


(+ia)C-(1-ia)D = aA 


: (42.503) 
(ie? - (+ia)e ED = 0 


De la deuxième relation, il vient: 


(l-ie ic 
= (Hi@e Ë (42.504) 
et injecté dans la première: 
(-imetic 


(+ia)C-(1-ia) = 2iG@AÀ (42,505) 


(1+iae 
Soit: 


(i+iaÿ?e À (ia) ft 


= 2itA (42.506) 
(1+iae À 


Nous avons alors: 


2i(l +id}e ue 


= ———————— À (42.507) 
(+iaÿ?e À _(1- ia) et 


et si nous notons: 
1 _ 
Fe s(GHiae F-(-ia)e%) (42.508) 


Il vient alors: 
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_ia(i+ia)e *f 
F 


C A (42.509) 


De même en repartant de: 


(+ia)C -(1- ia) D = 3aA 


Lu (42.510 
(ide ËC-(+ide ED = 0 


De la deuxième relation, il vient: 


_ (i+iaje D 


ia (42.511) 
et injecté dans la première: 


1+ia)e D 
(HE (-i@D=2@A (4251) 


(1—-ic)e 
Soit: 


| ia ee -(-10"e" 


= 2i@A (42513) 
(1- ie 
Nous avons alors: 


Ga(l-ia)e it 


= —— > ———— À (42514) 
(+iaÿ?e À _(-ia) et 


et notons toujours: 
l - 
F= ;(A+iaÿe = (ia) ei) (42.515) 


Il vient alors: 


_ia(i-ia)e® 
F 


D A (42516) 


Notez que nous avons aussi: 
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e% +9 À e% ge À 
F = Diacosh(KL) - (1- &}sinh(KL) = GE —— _(-&) sn 


L ae +2 * -(1-27)(.% e *] 


d+2%a-1)e 7 +(2a- +} | (42.517) 


Die nl Die ble Dle ble le 


Nous pouvons maintenant exprimer les constantes A’ et B en fonction de À à l'aide des relations 
précédentes: 


ial+ie Æ  ia(l-ivet 


B=C+D-A-= A+ A- A 
F F 
_ qiati+ia)e À +ia(l-idefi  #r 
F 
L PL - le tie + el _p 
. 42.518) 
_ ia” +) + (#1 e#)-r _ 4i@2cosh(KL) + @ 2sinh(KL) -F | 
F F 
_ yi@2cosh(KE) + æ 2sinh(KL) - 2iæcosh(K£)+(1- & }sinh(K£) 
F 
_ 42 2sinh(KE) + (1- æ }sinh(KL) à (1+a&*)sinh(K£) 
F F 


et: 


Cell + De _ AO 20 = 4'= 97% (ce“ + De”) 


muliai+ice # y ia(l-ivel y 

= 8 ii Age” + pr — 4e (42.519) 
5 ki : ki : —iki 

_ i&Ae (A+ia) + (ia) = € > = 2e 
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Donc finalement nous avons: 


= A + Be = Ag + AU+&)sinh(KL) is 


: af AUS pe | 


; : —ÀT - LL: KL 
y =Ce + De À _ia(l+ia)e AeË Lie id}e 


F F 
A ia(l+ia)e 0720 Lia(l-iae 072 
F 
, | a Ae : + Aoik(A-E) 
Vu = À'er +B'e = A'e%* = 2AAE its = 2iaAe 
F F 
Et donc alors: 
2 æAe%0-D | 
Tr 2 nes 
mn y | _ F (42.521) 
mp 
WT [æ*| 


en utilisant les propriétés du module complexe (cf. chapitre Nombres): 


ur 12 
GaAe * 


| x F 
F 


Lai 
Il ne nous reste donc plus qu'à calculer: 


lFF=F.F- Piacosh(KL) -(i-&) sinh(KL)| 

- (2iæcosh(K1) = (i-#) sinh(K)) (-2æcosh(KE) = (1-#) sinh(KL)) 

= 4? cosh?(KL)- 2iæ(1- &°}sinh(K£) cosh(K£) + 2iæcosh(KL)(1-æ°}sinh(K£) 
+(1- &2}? sinh? (KZ) 

= 4? cosh?(KL)+(1- &}° sinh?(K£) 

= 4° cosh?(KL)+(1- 2e + )sinh?(KL) (42.523) 
= 4? cosh?(KL)+sinh?(KL)- 2@° sinh?(K1)+ & sinh? (KL) 

= 2° cosh?(K£)+ sinh? (KL) + 2° + @* sinh?(K£) 

= 2æ/(1+cosh?(KL)}+(1+@*Ysinh? (KL) = 27 (2 +sinh?(K£)) +(1+a*)sinh?(KL) 
= 4? +2 sinh? (KL) + sinh?(K£) + a sinh? (KL) 

= 4 +(2@ pie a) sinh? (KL) = 40? +(1+ &2ÿ? sinh2(KL) 
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Donc: 


Ta 
4 +(1+a)7 sinh?(KL) 14 ET une) 


= (42524) 


| En-E E A 
D 2 sinh” (KE) 
Evo = Ex (Ex = E,:) 


lens EE, dd à … 
ÈS = +2+ a Jante) 


tot pot tot 


a e; - Ex Ÿ +2 E, ,(E ot — Ex) + E 


4 Ex (Et = Ex) 
1 


sinh? (KL) 


2 
Ée 


48 CE = Ë, } 


et 


sinh?(K£) 


Nous avons donc: 


T= 


E2, 2 (42.525) 
D he 7 


4Ë, 2 CE pot L Ex) 


Or, comme: 
gËi _ "AL 
sinh(KZ) = Es (42.526) 


si £Z >> 1 (donc à l'échelle atomique c'est plutôt K qui est immense relativement à L) nous avons: 


gli 
sinh(KZ) = or (42.527) 
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Donc: 
T = 1 - l : 168,4 (CO — En) g 2 
Be : E2,e# E?, (42.528) 


16£,; (Ex E Ex) 16E,, (E,œ _ Ex) 


relation qu'on retrouve très souvent (sans démonstration détaillée) dans de nombreux ouvrages. Ci-dessous 
nous avons tracé T: 


5 


Pa 107 [Y] 


Figure: 42.8 - Représentation graphique du coefficient T avec Matlab 5.0.0.473 


4 


a-1070 [2] 


selon la relation: 


164, —-E ; 
T = tot & ut ) e 2Ka 
0 


(42.529) 


Nous constatons que le coefficient T est très sensible (exponentiellement) à une faible variation la largeur 
de la barrière, a, lorsque le potentiel de cette barrière est faible. Nous pourrons donc visualiser des sites 
atomiques, par exemple dans du silicium, en utilisant une pointe très proche du matériau à observer. C'est 
le principe du microscope à effet tunnel où en approchant une pointe conductrice taillée très finement 
(quelques atomes seulement) à une proximité d'environ 5 Angstrôms d'une surface conductrice, et en 
imposant une différence de potentiel de quelques mV, on mesure un courant de quelques nanoampères. Le 
nombre d'électrons qui passent à travers la barrière de potentiel (ici c'est le vide entre les deux électrodes 
conductrices) diminue de manière exponentielle avec la largeur de la barrière. En analysant le signal 
d'erreur d'un asservissement sur le courant passant dans le circuit, on peut avoir accès à une cartographie 
très précise de la surface mesurée de l'ordre de 0.1 Angstrôms en vertical. 


Nous remarquons également selon la relation obtenue que les particules légères comme les électrons ont 
une probabilité plus grande de faire un effet tunnel que les particules plus lourdes à cause du terme de 
masse. 
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En utilisant la relation obtenue précédemment, on peut assez simplement calculer la probabilité qu'a un 
être humain de masse m de traverser un mur avec une hauteur h (donc facile de calculer l'énergie 


potentielle) et une épaisseur a. La probabilité est de l'ordre de 19-410 …. 


Ceci dit, l'exemple le plus célèbre d'effet tunnel pouvant être traité est celui de l'émission de particules 
& par des noyaux lourds radioactifs dont l'explication a été donnée par le physicien russe G. Gamov en 
1928. 


La démonstration est relativement simple mais comme elle constitue un cas pratique particulier, nous ne 
souhaitons pas la détailler dans ce chapitre mais dans celui de Physique Nucléaire. Cependant, pour 
résoudre ce problème il faut utiliser une méthode d'approximation connue sous le nom de méthode 
W.K.B. du nom des physiciens Wentzel, Kramers et Brillouin. 


Les résultats donnent dès lors un facteur de transmission T pour la particule & de: 
Tz 2.10? 


pour l'atome d'Uranium Y{ . Par ailleurs, dans l'approximation semi-classique, la particule & a, dans le 
puits, une vitesse de l'ordre de 10° [ms ]et elle effectue des allers-retours dans un noyau dont le rayon est 


de l'ordre de 107 [m]. Elle effectue donc environ 10°! oscillations par seconde où chaque fois elle a une 


probabilité T de franchir la barrière de potentiel. Cette probabilité par unité de temps est ainsi déterminée 
par: 


42104722 10% [s!] 
Expérimentalement, nous trouvons: 
A 25:10 [s”] 
le modèle présenté donne donc des résultats assez satisfaisants. 


Outre cet exemple technique, nous rencontrons le phénomène d'effet tunnel aussi dans un cas beaucoup 
plus accessible et très pédagogique. Aïnsi, lorsque sous condition de réflexion totale d'un faisceau de 
lumière, nous approchons un autre prisme (sur la face du prisme où aucun rayon de lumière ne sort ni ne 
rentre) de manière à produire une lame d'air suffisamment mince, un faible rayon transmis est observé. 


4.5. PRINCIPE DE SUPERPOSITION 


La notion d'état dynamique d'un système classique joue un rôle capital dans la dynamique analytique 
classique. 


Est-il possible de retrouver cette notion lorsque nous avons affaire à un système quantique, c'est-à-dire un 
système tel qu'un atome, un noyau ou une molécule, bref un système de la microphysique? 
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À première vue non, car nous savons que l'on définit l'état dynamique d'un système classique par la 
donnée des coordonnées généralisées g; et des moments conjugués ?, à un instant donné (( 


ue). Or, le principe d'incertitude s'oppose à cette procédure dès que nous sommes dans 
le domaine de la microphysique, vu l'impossibilité de mesurer avec précision les g, et p,. Cela est 
particulièrement clair lorsque le système se réduit à une seule particule que nous décrivons par ses 
coordonnées cartésiennes g; (x,y,Z) et les composantes de sa quantité de mouvement Z (P,,P,,P;). 


Fort heureusement, il existe une autre définition de l'état dynamique d'un système qui s'applique 
indifféremment aux systèmes classiques et quantiques et qui, dans le cas des premiers, s'identifie avec la 
définition habituelle. Nous allons donner cette définition en nous appuyant sur une brève théorie des 
ensembles de systèmes identiques. 


Si nous avons un ensemble (E) d'un très grand nombre de systèmes identiques, nous ferons une enquête 
statistique pour caractériser cet ensemble de la façon suivante: nous prenons un système de l'ensemble, 
nous mesurons une variable dynamique (coordonnée, composante de quantité de mouvement, énergie 
cinétique, etc.) et nous rejettons le système (qui perturbé par la mesure, ne doit pas être réincorporé à 
l'ensemble). Nous dressons ainsi un bilan qui se traduit par des fonctions de distribution de toutes les 
variables dynamiques possibles. Cela permet de définir sans ambiguïté la notion d'identité: 


Définition: Deux ensembles sont identiques, si les bilans des résultats des mesures sont les mêmes pour 
les deux. 


Considérons maintenant un ensemble unique (E). Est-il possible de le réaliser par juxtaposition de deux 
ensembles non identiques(Æ,) et (Æ,)? Ce qui permettrait d'écrire: 


(8) = (&)+(£) 


Si oui, nous dirons que (E) est un mélange. Inversement, au moyen d'un tri convenable, un mélange peut 
être décomposé en deux sous-ensembles différents. Si non, nous dirons que (E) est un ensemble pur. Tout 
tri décomposera l'ensemble pur en deux sous-ensembles identiques entre eux et nécessairement avec (E) ! 
Nous convenons alors de dire que tous les systèmes d'un ensemble pur sont dans le même état dynamique 
et que deux ensembles purs différents donnent lieu à des états dynamiques différents. Il va de soi que les 
systèmes constituant un mélange seront eux dans des états dynamiques différents. 


Supposons maintenant que les systèmes étudiés obéissent aux lois de la mécanique classique. Si les 
systèmes d'un ensemble présentent des jeux (g;,p,) différents, nous les trions en les groupant par 
systèmes ayant tous un même jeu (g,,?,). Nous vérifions bien que la nouvelle définition de l'état 
dynamique coïncide avec la définition habituelle. Notons ce fait évident, mais important (par opposition 
avec les systèmes quantiques): dans un ensemble pur de systèmes classiques, c'est-à-dire pour un état 
dynamique donné, toute variable dynamique est bien déterminée. En effet, en mécanique analytique 
classique, une telle variable est une fonction des g, et », et, de ce fait, présente une valeur unique. 


Passons aux systèmes quantiques. Il est maintenant possible de définir pour ceux-ci un état dynamique, 
mais tout de suite nous voyons une distinction fondamentale avec la mécanique classique. En effet, dans 
un ensemble pur de systèmes quantiques, c'est-à-dire pour un état dynamique donné, une variable 
dynamique n'est pas, en général, bien déterminée. Quand nous la mesurons sur des systèmes extraits de 
l'ensemble pur, on ne trouve généralement pas comme résultat, une valeur unique, mais une distribution de 
valeurs. 
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L'indétermination qui règne sur la valeur d'une variable dynamique dans un état dynamique donné est 
donc de nature purement quantique et il convient de bien la distinguer de l'indétermination d'origine 
statistique qui se manifeste dans un mélange, qu'il s'agisse de systèmes classiques ou quantiques. 


Le formalisme de la physique quantique ne peut s'édifier que si nous savons décrire mathématiquement 
les états dynamiques et les variables dynamiques. Nous avons vu que nous ne pouvons attendre de ce 
formalisme une prédiction précise comme en mécanique classique, mais, simplement les probabilités 
d'obtenir telle ou telle valeur, lorsque nous mesurons une variable dynamique sur un système dont l'état 
dynamique est donné. 


Toute la théorie que nous avons vue jusqu'ici nous permet de conclure jusqu'ici que les états dynamiques 
d'un système d'une particule sans spin sont décrits par des fonctions d'onde complexes, non nulles partout. 


Si nous appliquons cette condition aux systèmes dynamiques, nous avons alors le postulat suivant: 


Soient deux états dynamiques différents, décrits par des fonctions d'onde Ÿ, et #,, nécessairement non 
proportionnelles. À , À, étant des nombres complexes non simultanément nuls, nous construisons la 
combinaison linéaire: 


F=AY + AY, 


T est alors une fonction d'onde décrivant un état dynamique possible du système. Ce qui s'écrit aussi 
souvent avec le formalise de Dirac sous la forme suivante: 


|r}= A4|%}+2%/P) 


Ce postulat paraît assez naturel du fait de l'aspect ondulatoire que présente la physique des microsystèmes. 
En effet, dans les phénomènes ondulatoires de la physique classique les équations d'onde sont, le plus 
souvent, linéaires homogènes et il s'ensuit que l'on peut superposer les ondes. Or, le grand intérêt de ce 
postulat est qu'il contient en germe l'explication de ce fait capital qu'est l'indétermination quantique 
(appelée aussi parfois "cohérence quantique"). 


Voyons-le sur un cas très simple où nous supposons qu'une variable dynamique À, a une valeur bien 
définie &, dans l'état dynamique (Ÿ,), et une valeur bien définie 4, dans l'état dynamique (T,) avec 


&; “* &,. Cela signifie que si nous répétons la mesure de A sur des systèmes tous dans l'état dynamique 


décrit par (#,), nous trouvons chaque fois comme résultat &,, de même pour Ÿ; et &;. 


Une question vient naturellement à l'esprit: si nous mesurons À sur des systèmes tous dans l'état 
dynamique (T) qu'allons nous obtenir? Une idée naïve serait de croire que À prendra une valeur bien 
définie intermédiaire entre &, et &;. 


Ces deux hypothèses sont fausses et nous le savons bien. Premièrement, À n'est pas bien déterminée en 
physique quantique (incertitude) et n'est mathématiquement pas nécessairement située entre &, et &;. 
L'interprétation correcte est la suivante: 


Si nous mesurons À sur le système dans l'état dynamique (T'}, nous trouvons comme résultat de mesure, 
tantôt &, , avec une probabilité &,, tantôt &,, avec une probabilité #, = 1-&,. Bien entendu, &, et 


æ, devront pouvoir être calculés en fonction de À et 4,. 
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Remarque: Il ne faut surtout pas confondre l'ensemble pur des systèmes décrits par (#}, avec le 
mélange que nous obtiendrions en juxtaposant deux ensembles purs de systèmes respectivement 
(YF) et (@:4 2) : 


Il convient donc de mettre en garde le lecteur contre cette confusion, d'autant que dans la littérature 
courante utilisant la physique quantique, on dit souvent que la fonction d'onde est un mélange de 


Y, et Ÿ,. C'est par exemple dans ce sens que nous parlons de "mélange de configurations" pour traduire 


le fait que la fonction d'onde d'un atome à plusieurs électrons est une combinaison linéaire de fonctions 
d'onde appartenant à diverses configurations. Cette terminologie ne doit pas cacher le fait que les 
systèmes décrits par Ÿ constituent un ensemble pur et non un mélange. 


Exemple: 


Considérons le cas scolaire suivante de superposition: 
NE 2 42 nn 
[g}= Mt) 185) (42.556) 


Nous pouvons déjà aisément vérifier que le système est normalisé sous l'hypothèse (y; | # j } - üÿ donc 


de normalité: 


er eme) rev) - 


Comme la superposition est normalisée, il vient alors la probabilité de trouver le système dans l'état F, 
qui est alors: 


(are -Éçeres) 


GE CECI == 
=0 =0 


et si nous faisons de même pour chacun des deux autres états, la somme des probabilités sera toujours égal 
à 1. Il convient de signaler que cette probabilité est aussi la proportion d'états qui seront mesurés dans 


l'état Ÿ, si le système est constitué de N composants identiques. 


En fait, l'interprétation que donne la théorie de De Broglie (associer une fonction d'onde à une particule) 
aux principes d'incertitudes est l'exemple le plus frappant et le plus connu de la physique quantique au 
niveau des superpositions d'états (chat de Schrôdinger mis à part): 


Considérons une onde de De Broglie se propageant dans le sens de l'axe X, mais limitée à un intervalle 
(—a&,+&) à un instant donné ( £ = 0 si nous voulons). Donc à £ = 0 l'onde s'écrit, en laissant tomber la 
constante multiplicative: 
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(x) = 9% pour [xl <a 
Yix) =0 pour Ix| > a 


(42.539) 


Si nous mesurons la coordonnée de la particule, nous devons la trouver là nécessairement où T n'est pas 
nulle (sinon nous ne pourrions rien mesurer). Nous pouvons dire que x = 0 avec une incertitude Âx = & 
(l'intervalle où nous sommes sûrs de trouver la particule par rapport à l'ordonnée à l'origine divisé par 
deux) 


Si nous mesurons p, que trouvons-nous ? Nous ne devons pas trouver À&, (relation que nous avons déjà 
démontrée plus haut), car ceci serait vrai pour une onde plane indéfinie, ce qui n'est pas le cas ici. Alors, 
nous allons décomposer l'onde en ondes planes au moyen de la transformation de Fourier (cf. chapitre de 
Suites et Séries): 
+o 
Y(x) = fee" dk (42.540) 


— 


Comment interpréter cette relation? Une des ondes planes élémentaires (que nous pouvons aussi 
interpréter comme un état), a(t)e®' dk, dont la somme redonne Ÿ (x), conduit à une valeur ? = k& de la 
quantité de mouvement. Or, les valeurs de k forment un continuum. Nous sommes conduits à dire que les 
valeurs possibles de p forment dès lors aussi un continuum et qu'il y a donc une incertitude sur la valeur 
de p. Pour aller plus loin, il faut évaluer a(k) (qui doit être considéré comme variable de la probabilité de 
présence de chaque onde plane provenant de la décomposition de % (x)) au moyen de la relation (selon les 
propriétés des transformations de Fourier): 


A 
a(k) = — [Fe ax (42.541) 
27 à 


qui donne ici: 


1 +2 | 
a(k) = x fe ax (42.542) 


—2 


Posons &, - & = ÀK, l'intégrale devient alors: 


(42.543) 


a() = fe dx= — - 
27 27 | 34 72 23 7 a 


—2 


1 | 1 sl 1 | 


Le graphique de la fonction sin(x)/4 montre que 4(*) prend des valeurs qui peuvent être considérées 
comme négligeables pour b| À AT: 
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Figure: 42.9 - Tracé de la fonction sinus cardinal 


Il s'ensuit que dans l'intégrale: 
Le : 
Y{x) = fee" dk (42.544) 


ce sont les k voisins de &, qui sont effectifs, et plus précisément les k tels que: 
k-kle<z (42545) 
puisque: 


: a sin(aAk) L a sin(a(& —k)) 


a(X) 
DTA 7 rat 


(42.546) 


Il s'ensuit que les valeurs à retenir de p sont celles voisines de À&, aussi, plus précisément nous avons: 
lp-hkle < ah (42547 


Cette relation montre que les incertitudes {x et Â# obéissent à la relation: 


px = =’ (42.548) 


De manière similaire, si nous nous proposons de déterminer la coordonnée x d'un électron en le faisant 
passer à travers une fente de largeur 2b percée dans un écran: 
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sd 
4 


Électrons 
incidents 


Intensité de l'onde 
diffractée: 8) 


Figure: 42,10 - Configuration d'étude de l'électron passant par une fente rectangulaire 


La précision avec laquelle nous connaissons la position de cet électron est limitée par la taille de la fente, 
soit x = à. D'autre part, la fente perturbe l'onde associée. Il en résulte une modification du mouvement 


de l'électron qui se traduit par le diagramme de diffraction de l'onde (qui est en fait une représentation de 
la superposition linéaire de ses états intrinsèques). 


L'incertitude sur la composante dynamique »?, de la quantité mouvement de l'électron est déterminée par 
l'angle 8 correspondant au maximum central de la figure de diffraction. D'après la théorie de la 


diffraction (cf. chapitre d'Optique Ondulatoire) produite par une fente rectangulaire, nous avons 
sin 8 = À/2B puisque l'intensité {(8) s'écrit: 


1 
1(8) = Z(0) sin? GB | @2:5) 
(A sn e 


Donc p, est compris entre Psin& et -psin &, p étant l'impulsion de l'électron incident. Ainsi 
l'incertitude p, est de: 


Ce résultat simple est assez extraordinaire si nous le mettons en relation, en ordre de grandeur, avec le 
résultat que nous avions obtenu juste plus haut: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


VENT EN EAUEIR [SCIENCES.CH] 
ñ 
Lk=7rh= 2 


Nous pouvons en tirer plusieurs conclusions de la première importance: 


1. L'onde associée de De Broglie est étroitement liée au principe d'incertitude et la physique quantique 
doit tenir compte simultanément de ces deux propriétés. 


2. Si nous tenons compte que la répartition de l'intensité est obtenue à partir du comptage des électrons (ou 
particules) en fonction de l'angle et que nous obtenons la même répartition quelle que soit l'intensité du 
faisceau d'électrons monocinétiques qui arrive sur la fente et ce, même si les électrons sont envoyés un par 
un. Nous observons alors que le mouvement des particules n'est plus déterministe mais probabiliste. Aïnsi, 
la fonction d'onde % de l'électron peut être considérée comme une superposition linéaire des états définis 
chacun comme nous l'avons fait précédemment, par sa décomposition spectrale possible par la transformée 
de Fourier. 


Que pouvons-nous conclure de tout ce que nous avons vu jusqu'ici: 


1. Les équations de la physique quantique nous donnent une densité de probabilité de trouver une particule 
dans un certain volume de l'espace-temps. 


2. La superposition linéaire des états peut s'interpréter comme le fait qu'il est possible de trouver une 
particule en plusieurs points de l'espace-temps à un instant donné, et avec pour chacun de ces points une 
certaine probabilité de l'y trouver (par décomposition possible de l'équation d'onde). 


Si le point (1) a été largement étudié jusqu'à maintenant sur ce site, le point (2) est quant à lui nouveau et 
découle d'une simple opération mathématique de décomposition ou de superposition. 


Mais dès lors, que se passe-t-il si nous cherchons à mesurer l'énergie d'un atome qui se trouve dans une 
superposition d'états d'énergie? Nous ne détecterons jamais cette superposition, mais seulement l'une des 
énergies qui la constituent, l'action de mesurer fait disparaître la superposition des états au profit d'un seul 
- nous parlons alors de "décohérence quantique" (il s'agit de l'interprétation de Copenhague dont nous 
avons fait mention implicitement au tout début de ce chapitre et sur lequel nous reviendrons). Mais 
lequel? La physique quantique ne peut tout bonnement répondre à cette question. Le choix s'effectue au 
hasard! En revanche, à défaut de prédire l'état précis qui sera mesuré parmi tous ceux qui constituaient la 
superposition, la théorie quantique peut donner la probabilité qu'on a de mesurer chaque état (ce que l'on a 
déjà fait maintes fois jusqu'ici). Si l'on effectue de nombreuses mesures, on trouve finalement les 
proportions prédites par la théorie (même si chaque mesure est imprévisible). 


Erwin Schrôdinger, avait souligné l'absurdité (selon lui) de ces superpositions en ayant recours à une 
expérience de pensée devenue célèbre: Imaginez un chat enfermé dans une boîte hermétique. Dans la boîte 
se trouve aussi un atome radioactif et un dispositif capable de répandre du poison. Quand l'atome 
radioactif se désintègre, il déclenche le dispositif mortel: le poison se répand dans la boîte et le chat 
meurt. 


Mais la désintégration radioactive est un phénomène quantique: tant que nous ne l'avons pas détecté, 
l'atome est dans une superposition d'états "désintégré et pas désintégré". Dans la boîte, le système chat- 
dispositif à poison-atome doit donc lui aussi, se trouver dans une superposition des deux états "atome 
désintégré-chat mort" et "atome intact-chat vivant". Bref, si nous prenons la physique quantique au pied 
de la lettre, le chat est à la fois mort et vivant tant que la mesure n'a pas été effectuée. 
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L'absurdité de cette expérience est manifeste. mais difficile à démontrer, du moins tant que nous n'avons 
pas compris ce qui distingue un chat d'une particule. Toujours le problème de la frontière quantique- 
classique. 


Il faudra attendre les années 80 pour que la situation progresse enfin, à la fois sur le front de l'expérience 
et sur celui de la théorie. En 1982, Wojciech Zurek, chercheur au laboratoire national de Los Alamos 
(Nouveau-Mexique), reprend une idée fort simple mais géniale: dans une mesure, ce qui produit la 
décohérence, c'est l'interaction du système avec son environnement. Plus généralement, les objets 
quantiques ne sont jamais complètement isolés de leur environnement - nous entendons par là tout ce qui 
interagit avec le système: un appareil, des molécules d'air, des photons lumineux. Si bien qu'en réalité les 
lois quantiques doivent s'appliquer à l'ensemble constitué de l'objet et de tout ce qui l'entoure. Or, Zurek 
démontre que les multiples interactions avec l'environnement entraînent une destruction très rapide des de 
la cohérence quantique des superpositions d'états (appelée également "interférence quantique" puisque 
mathématiquement l'on traite des fonctions d'onde). En détruisant les interférences, l'environnement 
supprime les superpositions d'états et le comportement quantique du système, de sorte qu'il ne reste plus 
que des états simples et qu'on retrouve le comportement classique. 


Dans un objet macroscopique - un chat par exemple... - chacun des atomes est environné de nombreux 
autres atomes qui interagissent avec lui. Toutes ces interactions provoquent spontanément un brouillage 
des interférences quantiques qui disparaissent très vite. Voilà donc pourquoi la physique quantique ne 
s'applique pas à notre échelle: les systèmes ne sont jamais isolés! 


027 


La vitesse de la décohérence augmente avec la taille du système: un chat qui compte 10°” particules, 


"décohère" en 107? secondes, ce qui explique pourquoi on n'a jamais vu de chats morts-vivants jusqu'à 
aujourd'hui! 


La physique quantique est donc une théorie: 
- non-déterministe (probabiliste) d'où le fait qu'elle soit considérée comme une théorie de l'information 
- non-locale: les objets quantiques peuvent avoir simultanément plusieurs positions 


- non-Séparable: plusieurs objets quantiques peuvent êtres superposés au point de ne pouvoir être 
considérés séparément. 


Un autre excellent exemple de la superposition linéaire des états est une application remarquable au 
principe de moindre action. 


Considérons une particule quantique allant d'un point Àf, à l'instant 4 au point Àf, à l'instant £ . Nous 


savons que la probabilité de trouver une particule en un point et en un instant donnés est reliée au carré du 
module de la fonction d'onde qui lui est associée. Plaçons-nous dans le cas le plus simple où la fonction 
d'onde de la particule est une onde plane T(x,f) donnée par la fonction solution de l'équation d'évolution 
de Schrüdinger: 


ts 249) 


où À et v sont respectivement la longueur d'onde et la fréquence de l'onde associée à la particule. 
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La particule peut emprunter une infinité de chemins pour se rendre de (f,,4,) à (Wf,,4,). Choisissons l'un 


quelconque de ces chemins que nous appellerons C. Nous pouvons découper le chemin C en un nombre 
entier de tronçons de durée dt. 


72 


fl Âf Ê2 
Figure: 42.11 - Principe de découpage du chemin 


Après le parcours du premier tronçon, la fonction d'onde a la valeur suivante: 


{ *i+2x {x fAX 
TE) : in) 25m) (42.553) 


Yu tx tA)=e 


D'où nous tirons que: 


2n( nt) : 
PV tAxé+M)=Y(réle (42.554) 


Or, Planck et De Broglie ont établi (postulé) les relations suivantes comme nous l'avons montré: 
k 
E=h'vet À=— (42555) 
P 


d'où, en remplaçant À et v dans la relation précédente, nous obtenons: 


CE 


i 2y —| | p—-#8 |at è ; 
(pax-Fit} = Y(x,4)e & [La | | (42.556) 


22 
Yi tAxi + M)= (rie 


En appliquant la même technique pour le tronçon suivant nous obtenons: 


e( mue] 
Fix +2Âx,4 + 2Af) = Ÿ (x + Ax,t + Afj'e À at 


PRE CRE CR, 


Procédant ainsi de tronçon en tronçon, tout le long du chemin C nous obtenons alors la valeur de la 
fonction d'onde en {#,,£,) pour la particule venant de (f, ,é) en suivant le chemin C: 


, 272. 2 L _p | 
Fort) “Y(n4) [le er}] Ponte" Carre (42.558) 
ñ 
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Maintenant, faisons tendre la durée dt de chaque tronçon de trajectoire vers zéro. La quantité x / Â# tend 
alors vers la vitesse instantanée de la particule que nous noterons x. La relation précédente devient alors: 


Fer) = Y(ru)'e 


Dans le chapitre de Mécanique Analytique, nous avons montré que la quantité 2' * — Æ est égale au 
lagrangien. En substituant le lagrangien dans la relation précédente, nous obtenons: 


L] 
Î Littiét 
1 


23 


25 
TE — 
=Y(x.i)'et 


$-| (42.560) 


Yofxé) =Y(ré)'e 


où #, est l'action de la particule ayant parcouru le chemin C. 
Notons (sans démonstration) que le module de Ÿ,,(x,,£,) prend la même valeur pour: 
Se=2RHhR=hRh (42561) 


pour tout n. La constante de Planck trouve alors une signification physique directement liée à l'action de la 
particule ! 


Rappelons la condition de normalisation de De Broglie: 
2 r FE 
Pot (2562) 


qui donne donc la probabilité pour que la particule, partant de x, à l'instant 4, se trouve en x, à l'instant 
#, en ayant emprunté le chemin C. 


La probabilité totale est donc: 
2 ; 
one (Ah — 2 4) (42.563) 


pour trouver la particule partie de x, à l'instant £en x, à l'instant £ nécessite de calculer la somme des 


contributions de chaque chemin soit (en appliquant le principe de superposition linéaire puisque nous 
effectuons une somme des fonctions d'onde): 


23 


Me Dose 
D oante Mir4 > X2r42) sante (Xt2) nt c(ñé)'e À (2502) 


Cette intégrale fut découverte par Richard Feynman. En première analyse elle semble diverger dans la 
mesure où il existe une infinité de chemins possibles entre deux points. Regardons de plus près ce qui se 
passe. Plaçons-nous dans le cas où la trajectoire est macroscopique. La valeur de l'action #!, est alors 
beaucoup plus grande que À et varie beaucoup d'un chemin à un autre, sauf pour les chemins proches du 


chemin physique classique pour lesquels la variation est quasiment nulle (application de l'énoncé 
variationnel du principe de moindre action). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Comme les actions des chemins interviennent comme une phase dans l'intégrale de chemin, leurs 
contributions sont destructives et donc tendent à s'annuler, sauf dans le cas des chemins proches du 
chemin physique classique où les contributions s'ajoutent. Il s'ensuit que l'intégrale de chemin prend la 
valeur de l'action classique, indiquant que la physique quantique permet de retrouver les lois de la 
mécanique classique à l'échelle macroscopique. 


IS) Im(S) 


résultante 


chemins voisins du quelconque 


La situation devient très différente à l'échelle quantique, c'est-à-dire pour des valeurs de l'action dont 
l'ordre de grandeur est celui de la constante À. Une infinité de chemins apporte alors des contributions non 


destructives. Feynman a pu montrer que l'intégrale de chemin convergeait mais d'un autre côté, il n'est 
plus possible de prédire quel chemin la particule va emprunter au point que la notion même de chemin 
s'évanouit. Ainsi à l'échelle quantique la particule semble chercher son chemin parmi tous ceux qui sont 
possibles mais à l'échelle macroscopique, ce tâtonnement quantique semble avoir permis à la particule de 
trouver le "bon chemin". 


Le formalisme de l'intégrale de chemin constitue une façon très originale d'aborder et d'interpréter la 
physique quantique qui s'est ajoutée à celles qui avaient été développées par Schrüdinger. 


4.6. THÉORÈME D'EHRENFEST 


Ce théorème permet de connecter la mécanique classique de Newton à la physique quantique en 
établissant des relations similaires en ce qui concerne la quantité de mouvement et la force. 


Pour cela, nous partons l'exemple particulier d'une particule massive se déplaçant à une vitesse non 
relativiste dans un potentiel. Nous avons alors l'équation de Schrôdinger d'évolution à une dimension: 


RE GE (2565) 
F8 


— Es y) (42.566) 
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Si nous prenons en toute généralité le conjugué complexe des deux côtés de l'égalité et en multipliant les 2 


membres par À : 


ih— = -——©+E,, (GE (42567) 


à +E,: a) (42.568) 


Prenons la variation temporelle de la position moyenne de la particule (5ème postulat): 


(42.569) 


. | Ko 2 21 +o 2 72 
î k gY _ _( #2 æY 
ÉCOLE -20)7 
/ +o 27 +o | > +0 2 27 
- 5h [ _TE xPax- | Px LT dx =— | BIT TT, y dx 
2m| (8 . x? 2m 7?  &? 
Nous avons: 
P (xP) (Xe æ)- x OV 0, DV  : 
2 xl al |" "Ge à&& 2 | F9) 
d'où: 


d in P(L y y in FL (xT) ag) y 
; Ë — va À y 2 ns ri dx 


(42.572) 
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et injectons-la dans la relation antéprécédente: 


d ih P 0(—8(xT) 9Y tr. 06 on 
so Ta(r cu Rene ET r( ne (42.574) 


Le premier terme à droite de l'égalité est facile à intégrer. (puisqu'il n'y a pas besoin de l'intégrer): 


ÉÉCEPMAESE 7) 


—© 


(42.575) 


(0 


et comme la fonction d'onde doit valoir 0 à x = #v (sinon l'énergie est infinie) alors cette dernière 
relation est nulle. Il nous reste alors: 


Soit: 


et finalement: 


ce qui est l'équivalent en mécanique classique de: 


dx 
M—=MV=p (42.579) 
dt 


et qui reconfirme l'existence de l'être mathématique: 


comme étant l'opérateur de quantité de mouvement et que nous avions déterminé plus haut en retrouvant 
la deuxième loi de Newton. 


Mais nous pouvons faire un peu mieux au niveau de l'analogie classique/quantique en dérivant: 
+0 
Ép,}= [ Pp, Yax (42.581) 
—© 


Ce qui donne: 
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d _ 
ds} _ 4 ST tn] à ae jé -nf É 2€, ÿ le (42.582) 
ZX 


dt. E & x à & 
d'où: 
ä +o + +o T5 + 
BUOMÉLANILC MER NÉE ARS 
ih di Le dé x ee Œ x LÀ x Las 0x 


En utilisant: 


8Y k & 
ih— HT k : (Hits HS AE (42.584) 
Il vient: 
d +o _ LE 
>: CHEN ET LI PSN CECI 
ik dt ik", êx ih êx 
hi ay 
1+ 2 PY : + | ne BOT) 
IE or) a TEA _ dx 
k? dY (42.585) 
she Goes le À; 
| Dm ae + ra) É il 8x ° 
2 4/ 2% L tof 3[E GT L 
RENTE LA TES PNEUS CURE LA 
ih| 2m * | &°? &x 8x x° Los 8x 2 8x 


Concentrons-nous sur: 


———-F— je (42.586) 


il PYaY - a #Y 
L\ &° x 8x 8x? 


Intégrons par parties le premier terme deux fois selon la relation démontrée dans le chapitre de Calcul 
Différentiel Et Intégral: 


è è 
MOROCCO NSMONO ET 


Nous avons alors ( toujours en considérant Ÿ comme étant une fonction décroissante vers l'infini): 


2 ay ar PT 8E 87 + 9 47 47 2% 47 
[—— = [=—— x= — — = [ax = [ax (42.588) 
ox eo % 8x 0x &x|,, Lx 6x x êx 
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et encore une fois: 


#0 2 TT ko 2 #0 2 
[ee +122 axe | RTS (42.589) 
x x 0 —0 ca 


Donc finalement: 


{Tag - à d°Y fa y _ - 94% 
Ar + le || 7 
a D ôx x x 


Il nous reste alors: 


à F1 2 Evo CIF - 
Pa) l (£, x ) PC) E . 
L i PE) + on ME - 2 ÈE dx --s g m D g (2501 
2e ox x er dx 
Ja) 
Le dx 


Or, nous avons démontré dans le chapitre de Mécanique Classique que: 


F = VE, (42.592) 


Il vient donc que: 


d T= 
Ps) _ [ EF Y =(E,) (42.593) 


Ce résultat extraordinairement simple constitue le "théorème d'Ehrenfest". Nous retrouvons donc la loi 
fondamentale de la dynamique classique au sens des valeurs moyennes de position et de la force, 
calculées à l'aide de la probabilité de présence! 


5. MOMENT CINÉTIQUE ET SPIN 


Tout comme l'oscillateur harmonique, la notion de moment cinétique (ou moment angulaire) est d'une 
importance capitale en théorie quantique et possède de nombreuses applications dans tous les domaines de 
la physique: physique atomique et moléculaire, physique nucléaire et subnucléaire, physique de l'état 
condensé, etc. Ainsi, il joue un rôle essentiel dans l'étude du mouvement d'une particule dans un potentiel 
à symétrie sphérique, comme nous le verrons en chimie quantique (qui en est un excellent exemple 
pratique). Le moment cinétique est également à la base du groupe des rotations qui satisfait à l'algèbre des 
opérateurs de moment cinétique (cf. chapitre d'Algebre Ensembliste). De ce fait, il permet non seulement 
de construire la fonction d'onde d'un système quantique de symétrie donnée, mais aussi de prédire si une 
transition optique est permise et d'en déterminer son intensité (par exemple, lors de l'étude des transitions 
optiques entre états d'impureté (en état solide), états moléculaires (chimie quantique), en physique 
nucléaire, etc.). 
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Enfin, nous verrons que la méthode algébrique appliquée à l'étude du moment cinétique nous permettra 
d'introduire tout naturellement la notion de moment cinétique intrinsèque d'une particule, le "spin", qui n'a 
pas d'équivalent classique. 


Les développements qui vont suivre peuvent paraître assez déconcertants dans le sens qu'il ne faut plus du 
tout se fier à l'intuition mais uniquement aux propriétés et résultats des mathématiques. Comme 
d'habitude, si vous avez besoin de compléments d'informations, n'hésitez pas à nous contacter. 


Ainsi, rappelons que le moment cinétique d'une particule par rapport à l'origine est donné par (cf. chapitre 
de Mécanique Classique): 


eu 


b=mrXvV=rxXp (4259,4) 


La quantité de mouvement étant quantifiée (c'est une valeur propre rattachée à l'énergie d'une façon ou 
d'une autre), le moment cinétique l'est nécessairement aussi (le moment cinétique est donc aussi une 
valeur propre) et l'expérience a appuyé ce résultat (Stern-Gerlach). 


Soit la composante en z du produit vectoriel résultant: 


D, = xp, = JP;| (42.595) 
(cycl.) 


Cette relation étant cyclique, nous pouvons changer les indices pour obtenir les autres coordonnées. 


Comme x et y commutent (dans le sens que leur commutateur est nul) et que nous avons démontré: 


â à 
=—ÿh—,p, = —ih— (42596 
8x" dy 
nous avons alors: 
hk dd h à h( à 
D, =—x———y——— ER 2997) 
i dy à dx il y 


Ce qui donne: 


k| _9 à 
= 1 e- (42.598) 


En utilisant le gradient (nous retrouverons cette relation dans le chapitre de Physique Quantique 
Relativiste lors de notre étude de l'équation de Pauli!!): 


FXV=—ihrxV | (42599) 
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Ce qui nous amène à écrire: 


b =h}| (42.601) 


l, , YPz  ZPy 
a A1: 7% | (2602) 
è Py 7 YPx 


Remarque: Le plus souvent dans la littérature le moment cinétique orbital est noté Z (nous avions 
déjà fait cette remarque dans le chapitre de Mécanique Classique) mais nous avons évité cette notation 
ici afin de différencier le moment cinétique orbital et le moment cinétique orbital total. 


Avec: 


Nous allons établir certaines relations de commutation concernant } qui joueront un rôle essentiel dans 
l'étude du spin. En faisant usage des relations de commutation suivantes (démontrées lors de notre étude 
des principes d'incertitudes): 

[x,2,]=ih (cycl.) (42.603) 
et: 

[v,2,1= 0 (cycl.) (42.604) 
Nous avons la relation (il est de tradition de faire l'analyse sur la composante de la projection de } en z): 

[h,,x]=[2P,,x]-D2,,xl=-M2,,x]=iky (42.605) 

Donc: 


[£,x]=iy (42.606) 
(cycl.) 


et en procédant de la même manière: 
(cycl.) et [Z,,z]= 0[(cycl.) (42.607) 


Remarque: Nous trouvons des relations analogues avec la quantité de mouvement: 


(.P,]=ip, 
[,2,]= 7, (cycl) (42.608) 
HP] 0 


Évaluons maintenant la quantité (suite à la demande d'un lecteur, nous avons mis tous les détails): 
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1, 
Gun lle mel æs]-we]e[2 0e 2, .æ, | (or, .» | 


l l l 1 
orne, |- [5er om, +2, | 


| XPzZPy —Z  PrY  Pz TT PyZ Px-rZ PxZ Py 
k —,— = 
+ À El + À 
us 7 du =-if 7-0 =if—z=0 
ë&x dy êx (42.609) 
1 1 
= ré Pzi Pz TX Pr} Pz +|—z Pyx Pr Pr Py 
jf? y=0 er LRE —— kñ = 
> =—jf— x= 
1 1 _1 (in 2 » 2 : + 
= Par PP = El ik sp px ihz|p, ==v(dhip,-=x(h)p, 


= —i)Py HP y =ilAPy — Pr | =ih, 
Soit après simplification (c'est assez embêtant pour l'expérience que cela ne commute pas): 


[,,4,]=i4) (42.610) 
(cycl.) 
par ailleurs, à ce stade, si le lecteur a déjà parcouru au préalable le chapitre de Calcul Spinoriel, il 


remarquera que les matrices de Pauli satisfont aux relations précédentes si nous nous mettons en unités 
naturelles (la constante de Planck réduite valant alors 1): 


F4, 4, De 20, 

T, Or Or y = 20% 

JrOx OrO3 = 20, 
Ce constat sera utile pour notre étude de la physique quantique relativiste (voir chapitre du même nom). 
Effectivement, nous savons de par notre étude du calcul spinoriel (cf. chapitre de Calcul Spinoriel) que les 
matrices 2 par 2 complexes unitaires de déterminant 1 forment le groupe des rotations dans l'espace SU(2), 
dont les matrices Pauli sont les génératrices. Fondamentalement, l'origine du spin vient du lien qui existe 


entre SU(2) et le groupe des rotations de notre espace ordinaire, SO(3) (cf. chapitre d'Algebre 
Ensembliste). 


Maintenant, considérons la norme: 
JF =2+24+8 on 
r té th (42611) 


où il faut considérer le carré d'un de ces opérateurs sous la forme suivante: 
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2 _[1 | : 
d = fixe, -yô, ) =-(x0,-y0,] (42612) 


Étudions son commutateur avec une composante (sans avoir à expliciter la chose!): 


Ce 


12 
| q JU RTE) BU R TE eds RSA CRE A LUF NT A _. 


A CAN EE COR RE A COR EC 


en utilisant la relation cyclique [#,.f,]=il, il vient: 


12 ; ; 
ET I= ALLIE LI LI-U LT, iQ +LL)-i@, +21) =0 (2614) 


Donc la norme du moment cinétique orbital commute avec avec ses composantes: 
[. F f] =0 (42615) 


(cycl.) 
Conclusions des résultats obtenus jusqu'à maintenant: Comme le commutateur est nul (les quantités 
commutent) il est donc possible de mesurer simultanément avec précision une composante ainsi que le 
carré du moment cinétique (sa norme au carré), maïs il est impossible de faire la même chose pour deux 
composantes! 


Notons enfin que la relation que [#,.À,] = if, peut s'écrire: 
(,4,]= 44, LE =, (42.616) 
et donc d'une façon un peu curieuse: 
I x =5ill (42.617) 


Si nous avons un système de particules numérotées par l'indice k, chacune a un moment cinétique 
individuel #/(* et le moment cinétique orbital total du système %£ (ne pas confondre la notation avec 
le Lagrangien!!!), est défini par (en unités naturelles À ): 


L= 2. (42.618) 
k 


Mais Z n'est pas encore vraiment le moment cinétique total du système! Effectivement, une particule 
peut posséder un moment cinétique intrinsèque, ou "spin". Nous pouvons donner une image simple du 
spin en disant qu'il traduit une rotation infinitésimale de la particule sur elle-même (attention !!! ce n'est 
qu'une image car au fait la particule ne tourne pas sur elle-même !). Comme nous l'avons vu dans le 
chapitre de Calcul Spinoriel, cela correspond mathématiquement au développement limité de la matrice de 
rotations au voisinage de la matrice identité. 
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Nous noterons #{*} le moment cinétique de spin de la k-ème particule (en unités naturelles À } et la 
relation: 


S= > (42.619) 
k 


sera le spin total et enfin: 


J=É+$| (42620) 


sera le "moment cinétique total" du système (ne pas confondre la notation J avec le moment cinétique 
orbital ou la densité de courant!!!) et nous démontrerons lors de notre étude du couplage spin-orbite que 
ce moment cinétique est une constante du mouvement en présence de ce couplage. 


Nous allons supposer (mais c'est relativement facile à démontrer une fois, entre autres, les spineurs 
connus) que chaque #!*! et F{*) obéit aussi aux lois de commutation vues précédemment: 


[= ise (cycl) et LA JTE (cycl) (42621) 


Ce qui s'écrit sous forme tensorielle en utilisant le symbole de Levi-Civita (cf. chapitre de Calcul 
Tensoriel): 


1, is et LS, 5 ]=isuSe (42.622) 


Nous remarquons que dans la représentation matricielle de Heisenberg il y aussi des composantes de 
matrices qui satisfont ces deux relations. Par exemple les composantes des matrices hermitiques (dont la 
transposée conjuguée est égale à elle-même pour rappel...) et de trace nulle suivantes: 


0 —;3 0 0 0 0 
J,=|i 0 O7, =10 0 lJ, = (] 
| | (42.623) 
0 0 0 0 3 0 —i 
LE Een 


Les deux relation antéprécédentes entraînent (aussi) au même titre que pour le moment cinétique orbital: 


p. 


“| = 0 (42.624) 
(cycl.) 
avec bien évidemment la relation: 
pÉ-22+2 +2 


appelée par les mathématiciens "élément de Casimir" ou encore "opérateur de Casimir" (un simple 
développement parfaitement similaire à celui obtenu plus haut suffit à la démontrer). 
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Définissons maintenant de façon purement formelle les deux opérateurs non hermitiques dits "opérateurs 
d'échelle" (les matrices de Pauli satisfont toujours à ces relations!): 


= +; 
Ja = Je ti, (42.625) 


où respectivement , est appelé "opérateur élévateur" et J_ "opérateur abaisseur". 


Les J, commutent avec | I puisque celui-ci commute avec 7, et J, . Ce qui nous permet d'écrire le 
produit: 


J . 


+ 


ui = Pf *J. (42.626) 


Par ailleurs: 
CZ, J,1=02,7,1+i47,,J,]=i7, +J (42.627) 
Donc: 
Jul, J,J, = J, (42.628) 
De même: 
J,d_—J_J,=-J (42.629) 
Enfin, évaluons les produits J,J_ et J_J,: 
LT AGE ICE AN = PT MOT LI 
PF -2-4, 


(42.630) 


De même: 
J,J_ = PT -JŸ+J, (42631) 


Puisque les deux opérateurs hermitiques | f et J, commutent ils ont donc des états et valeurs propres 


communes et, plus précisément, ils ont une base propre complète commune. Lorsque des observables 
commutent et ont une base propre commune, rappelons que nous avons pour habitude de parler d'un 
"ECOC" (Ensemble Complet d'Opérateurs qui Commutent). 


Pour étudier leurs valeurs propres posons: 


PT 1e}= 18) 


(42.632) 
J,[f}=#|Y) 


Système qui est parfois noté sous la forme suivante dans la littérature spécialisée: 
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LP LE) = K IE m0) 
J,|K,m}=m"|K,m} 


(42.633) 
Car elle met en évidence que les états propres associés seront définis au moins en partie par les paramètres 


K, m. 


Pour commencer, nous savons que les valeurs propres K et m ne sont pas indépendantes puisque nous 
avons: 


Mi -Ji=J{+J) (42634) 


La moyenne étant notée par les crochets { L nous avons par linéarité de l'espérance (cf. chapitre de 
Statistiques): 


ff )- (2) : (J5) ii (7) (42.635) 


Ce qui peut s'écrire: 


(P-27)-62)+(7) cac 
Nous voyons que le membre de gauche de la relation ci-dessus est donc égal par définition à: 
K-m (42.637) 


Comme l'opérateur du moment cinétique orbital total au carré est de toute façon hermitique (il n'a pas de 
composante complexe dans € ), nous avons alors par construction des potulats de la physique quantique: 


(}= Wwl|#}20 (42638) 


Il vient alors que: 


)20l 
(4 -J2)20 (42.639) 
(] 


Cette dernière relation implique donc que: 
K>m? (42.640) 


Ce qui nous apporte jusqu'ici les informations suivantes: 


K 2 0,frel < VJK| (2.641) 
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À partir de [g}, nous bâtissons l'état F, [g} , nous allons montrer que si cet état n'est pas identiquement 


nul, il est état propre de |? [ et de 7, . De la relation: 


J ‘ 


+ 


112 112 
7] =? ‘ J_ (42.642) 


déjà démontrée précédemment, nous posons: 
Mi J,[8)=J7 PT [g}=X7,[8) («a2643) 


J, commutent avec |7 ['; puisque celui-ci commute avec 7, et J,.Ce qui nous donne que la relation 
précédente est nulle telle que: 
KJ,|g)=08& J,[#)=0 («264) 
De la relation 7,7, - J,J, =J, nous posons de façon identique: 
Jd,|E}=J,2,[8)+3,[8)=62+D7,[8) «2.645) 
Toujours avec: 
J,[#}=0 («42.646) 


Nous avons finalement le paquet de relations: 


J1E}=0, PA T)= RAS), JA [The Ge+ DZ /T) c2647) 


Donc 7, |} et J_|F} sont identiquement nuls et 7, |'F} et J_|T} sont des états propres de l'opérateur 


| f pour la valeur propre K, et de 7, pour la valeur propre # +1. 


Puisque le moment cinétique est quantifié, ses valeurs propres doivent donc avoir un minimum et un 
maximum avec pour chacune la fonction propre associée. 


Posons pour la suite que m ‘et |‘? '} sont la valeur et état propre associé maximal et m" et | F"} la valeur 
et état propre minimal. 


Étant données les trois relations démontrées jusqu'ici: 


pi -neu 
NE If -J1-J, (42.648) 
J.|}=0 


Nous écrivons: 
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TJ |PÈ=K-m-m)[T"= 0 


J JT" = (K-m-m")|r"}=0 
(42.649) 


Ce qui intuitivement n'est pas évident à poser mais qui mathématiquement est tout à fait justifiable. 


À partir des deux dernières relations ci-dessus, nous pouvons écrire en soustrayant la première à la 
deuxième: 


mè-m+rmt+m"=0 (42.650) 
soit: 
(mt mm -m"+D=0 (42651) 
m ‘étant le maximum, m" le minimum d'un même ensemble, nous avons: 
m'-m"20 (42.652) 
Ce qui nous donne après simplification de la deuxième paranthèse: 


m'+m)=0Sm"=-m" (42.653) 


Notons J la valeur m' (qui correspond donc à la valeur propre maximale de la quantité 7, ) puisque 
m" =" NOUS aVONS: 


m"=—Jf (42.654) 


(où souvent dans la littérature nous retrouvons un j minuscule afin de ne pas avoir de confusion possible 
avec l'opérateur associé) donc: 


m'-m'=J-(-D=2J (42655) 


Comme la différence à gauche de l'égalité est obligatoirement une nombre entier (en nous inspirant des 
résultats connus de la physique quantique corpusculaire), cela impose que 2J est un nombre entier positif 
ou nul mais cela implique aussi directement que J ne peut être qu'un nombre entier, demi-entier ou nul tel 
que: 


ES (42.656) 
2 2 


Donc, si nous nous fixons un J, puisque par construction #"—#"= 2", il vient logiquement que: 
—J Sm£<JT (42657) 
et donc puisque m ne peut être qu'entier, il ne peut prendre que les valeurs: 


m=-Jj-j+1-J7+2..,0. J-2J-1,7 (42.658) 
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Enfin, comme: 


(K-m-m)=0SK=mrm'e(K-m-m=08 K=m+m" (42.650) 
nous avons alors: 
K=J+J=J(J+Det K=(-J) -(-J)=J(J +1) (42.660) 
et finalement cela nous donne la valeur propre: 
K=J(T + (42661) 
Et puisque nous avons posé que m' est égal à Jet que nous avons la relation: 
“Fa 2 [el 
Il vient alors: 


J [SCT +0 (42.662) 


Sous forme plus explicite et moins confuse (attention à ne pas confondre les valeurs propres avec les 
opérateurs!): 


re TU, + D (42.663) 


et en définitive, en multipliant à gauche et à droite par À pour revenir en unités du système international 
(S.L), nous avons pour la composante verticale du moment cinétique orbital total, la valeur propre: 


b< SEXTA +Dh| (42.664) 


Hi [a= RJ(J+1)[P) (42.665) 


Comme nous avons vu plus haut que: 


Il vient sinon au final: 


J=Z+$S (42.666) 
(composant par composante de leur vecteur respectif) et si la particule n'a pas de spin ($ = 0 ) alors nous 
avons la valeur propre du moment cinétique orbital total qui se réduit à la valeur propre du moment 
cinétique: 
Bb < JJ(T +DhR=AJZL(L+DAR (42.667) 
où nous n'indiquons plus les indices des composantes (inutile!) 


Si nous n'avons qu'une seule particule alors: 
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# 
L=S == 
il 


Donc le moment cinétique orbitla s'écrit en se rappelant (. 
( ire) que l'est quantifié: 


ENTER 


Si nous avons À : 1, alors dans ce cas: 
ba=lh 
Nous retrouvons donc le résultat obtenu au début de notre étude du moment cinétique. 


Grossièrement, si nous posons maintenant À = #, nous retrouvons à partir du modèle ondulatoire 
l'hypothèse de quantification du moment cinétique postulée par Bohr vue dans le chapitre de Physique 
Quantique Corpusculaire. Raison pour laquelle il est d'usage de ne prendre que les valeurs entières de Î! 


Remarque: Rappelons que réellement 0 <1<#-—1 et donc qu'à la différence du modèle corpusculaire 
de Bohr le moment cinétique peut être nul dans le modèle ondulatoire.! Une autre manière d'accepter 
les valeurs prises par n outre le faire de se reporter au modèle de Bohr dans le chapitre de Physique 
Quantique Corpusculaire est de regarder les valeurs que peuvent prendre ! dans le modèle quantique 
de l'atome hydrogénoïde du chapitre de Chimie Quantique sinon quoi les polynômes associés de 
Legendre ne sont plus définis! 


Cette constatation justifie maintenant physiquement l'utilisation du nombre quantique 1 dans l'utilisation 
du tableau périodique des éléments tel que nous l'avions vu et défini (sans aucune justification réelle) dans 
le chapitre précédent. 


Enfin, indiquons qu'exactement le même raisonnement amène aux valeurs possibles suivantes du moment 
cinétique de spin: 


où l'expérience nous montre (pour ne citer que les plus connus) que le spin 0 est caractéristique du boson 
de Higgs ou de certains atomes, le spin 1/2 est une caratérisique de l'électron/positron, le spin 1 est une 
caractéristique du photon, le spin 2 serait une caractéristique encore théorique du graviton. Au jour où 
nous écrivons ces lignes, aucune particule de spin 3/2 ou 5/2 n'est connue. 


La valeur entière ou demi-entière du spin détermine une propriété cruciale de la particule : si son spin est 
entier, c'est un boson, si son spin est demi-entier, c'est un fermion. 


Le moment cinétique total vaut donc approximativement: 
|f|= (A +$]= (+sih= JU +DR 


Par analogie (c'est vraiment une analogie douteuse...), nous écrivons pour J suffisament grand...: 
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MÉ (Î+s)\h= jh (42673) 


Mais comme le spin peut avoir que deux orientations possibles, les valeurs de j seront dans le cas d'une 
particule de spin 1/2: 


j =i + spins parallèles 
(42.674) 


jf =i -; spins anti-parallèles 


D'où une classification possible des électrons atomiques tenant compte de leur spin: 


—— 
ES 


ESETS 42.3 - Types d' Le et spin 


c.. Soit sous forme schématique avec les niveaux d'énergie correspondants: 


n=] 


Figure: 42.13 - Forme schématique des orbitales et spin associés 
Ce tableau nous amène à constater que nous avons finalement: 
P-s|< j <F+s (42.675) 


Pour revenir à des considérations plus pratiques. nous avons finalement obtenu pour la norme du moment 
cinétique total (dans le cas d'une particule seule et sans spin): 


J< NT +Dh (42.676) 


où l'est un entier. Nous savons également de par le chapitre de Physique Quantique Corpusculaire que le 
moment magnétique est lui donné par: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


4 =Muh (42.677) 


et que le nombre quantique secondaire 1 et le nombre quantique magnétique #; sont d'une certaine 
manière indissociables. 


De la même manière nous obtenons: 
S'<Ajs(s+Dh (42.678) 


où nous s ne peut prendre pour une particule comme l'électron que les valeurs: 


s=+ (42.679) 


qui correspondent simplement aux deux valeurs propres de la matrice: 
©; (42.680) 


qui lie l'opérateur de spin aux matrices de Pauli de par l'équation de Dirac comme nous le démontrerons 
dans le chapitre la chapitre de Physique Quantique Relativiste: 


Maintenant, ce que nous savons de nos résultats obtenus dans le chapitre de Physique Quantique 
Corpusculaire c'est que lorsque l vaut 1 nous avons le moment magnétique qui peut prendre trois valeurs 
différentes suivant qu'un champ magnétique est appliqué ou non: 


my =—10,+1 (42.682) 
À ce moment, bien que la norme du moment cinétique total reste constante (car conservative), ses 


composantes doivent forcément changer. Comme nous ne pouvons connaître qu'une seule des 
composantes du moment cinétique en connaissant sa norme (opérateurs qui commutent) nous choisissons 


de nous intéresser par convention pédagogique à ?, . 

Nous choisissons un référentiel tel qu'une des composantes spatiales soit nulle (c'est toujours possible). Il 
suffit ensuite par exemple dans le référentiel plan X, Z choisi (donc la composante Y sera nulle) d'avoir la 
norme de J qui vaut pour = 1: 


J<ñG+Dh=4/2h (42683) 


et idem avec S en imposant que la norme vaille pour s = 1/2: 


S< CG + = 3 (42.684) 
22 2 
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Il y a alors trois possibilités pour arriver au même résultat en appliquant simplement la norme euclidienne 
si une des composantes est toujours imposée comme nulle! C'est que nous ayons: 


FR = 
J,= Ven, J,=0/[]=4V2r «2685 
oh Th 


Ce que nous pouvons aussi écrire en introduisant le nombre nombre quantique de projection orbital (qui 
quantifie donc la projection du moment cinétique orbital selon Z et est en multiplicité 21 + 1): 


J=h,J, =mh hay =+1 
J,=V2n3,=mh m=0 J]=-V2%x «2686 
J,=h,J, =rh M =] 


Ce que les physiciens aiment bien représenter de manière très simplifiée par le schéma suivant: 


Figure: 42,14 - Représentation schématique simplifiée de la quantification du moment cinétique total 


Mais qui en réalité (de par le carré des composantes de la norme) devrait se dessiner sous la forme 
suivante: 
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=1 


Figure: 42.15 - Représentation schématique complète de la quantification du moment cinétique total 


Ce qui nous permet de constater au passage p ar symétrique que: 


(= (3, }= O (42.687) 


Remarquons qu'avec de la trigonométrie élémentaire, que nous avons: 


J, ah #j 


8 = arccos F = afccos nf +77 = arccos fon 


Et donc les angles prennent les valeurs suivantes: 


(42.688) 


—À —1+1 FT ES | 
— ,...,arccos 


Î 
+1 os Ju +1) ue FU +1) de +1) 


Enfin, indiquons que nous avons alors dans ce cas particulier où ? = 1,#3 = +1, le système "abtrait" que 


arccos CCOS (42.689) 


nous avions utilisé plus haut: 


Lf LK,m}= K|K,m) 
J,|K,m}=m|K,m} 


(42.690) 


devient alors dans le cas de notre exemple particulier: 
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LE reve 3= R2 6240) = PE 11-132 282 [141 
L [Em }=hillns)= 2 |1.+1=R%[1#) 


(42.691) 


Ce qui peut être noté de façon condensée sous la forme suivante: 


Ë11,+15= 2#2 [140 


: (42.692) 
£,.[1H1}=8R[1+#1) 


De la même façon avec le spin 1/2 nous avons en introduisant le nombre quantique de spin (qui quantifie 
donc la projection du moment cinétique de spin selon Z et peut prendre autant de valeurs qu'il y a entre -s 


et +s mais par pas de 1 comme l'impose les résultats expérimentaux, raison pour lesquels il n'y pas de 
composante nulle en Z ci-dessous): 


= — (42.693) 


Le lecteur pourra aisément vérifier que le nombre quantique de projection de spin est aussi de multiplicité 
25 +1, 


Ce que les physiciens aiment aussi bien représenter de manière très simplifiée par le schéma suivant: 


Figure: 42.16 - Représentation schématique de la quantification du spin 


avec pour angle: 
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+ 1 1 
79 79 1 
cos 7 | areosl ns arecosl 2 |= mccés +) z +54739 (42.694) 
sis +1) 1 1, V3 3 
212 2 
2 _— . 1 1 
De même qu'avant, nous avons dans ce cas particulier où 5 = —,#, = + : 
1 £ 1 


Hlam)= etes) 141) -3 
1 


(42.695) 
bd ar 
due «. 2 


Ce qui peut être noté de façon condensée sous la forme suivante: 


S [5,72 } = hs|s,»e,} > Sy 


2 
(42.696) 
Re: 
D 2h 2e à 
Nous avons donc les seuls éléments variables mesurables expérimentalement qui sont: 


L,=mhlet |S, =sh| (42.697) 


qui sont donc des observables discrètes (bivaluées en ce qui concerne le spin). 


Avec une vue d'artiste du concept pour le plaisir des yeux: 


D pr 7 nil à À ne 
ANS 
RTS 


Figure: 42.17 - Représentation schématique de diverses quantification du moment cinétique 
par le physicien et sculpteur Julian Voss-Andreae 


Donc en appliquant un champ magnétique, l'hamiltonien de Pauli (cf. chapitre de Physique Quantique 
Relativiste) effectuera des sauts équivalents à la relation: 
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E,=-—— B{rg +25) (42.608) 


Ce résultat signifie que les niveaux d'énergie pour une énergie donnée (couche n) sont séparés en plusieurs 
. gh ; ” ; 
niveaux distants de _ quand l'atome est placé dans un champ magnétique. Ce résultat est l'effet 
My 
Zeeman dont nous avons parlé plusieurs fois. 


Tout cela permet de mieux comprendre l'origine mathématique des 4 nombres quantiques (nombre 
quantique principal, nombre quantique secondaire ou azimutal, nombre quantique magnétique, spin): 


#,,m4,Mm, (42.699) 
notés aussi (puisque dans le cas particulier des particules étudiées sur ce site le nombre quantique 
magnétique de projection de spin à la même valeur que le spin puisque nous traitons majoritairement de 
l'électron): 


#,l,M,S (42.700) 


Avec pour résumer un peu tout cela….: 


J=i+S 
n=le 34. 
OS? <nr-1 
1.3 5 
F=Ù —,1 —,2,—.. 
FINS INSEE 
1,35 
s=0,.,1.,25 (42.701) 


P-s|< j <ÿ-s| 

pa =i#l,14+8..,0..i-2i=1} 
—l£m <H 

ms =-5,-5+1,-5+2,..,0,..,5-—2,s-1,1 


—s£Sm, <+s 


5.1. COUPLAGE SPIN-ORBITE 


Nous avions fait remarquer dans le chapitre de physique quantique corpusculaire que quand nous 
analysons à haute résolution les raies spectrales de l'hydrogène en l'absence d'un quelconque champ 
extérieur, nous voyons qu'elles sont en fait constituées de doublets très serrés, séparés de Ü.016[###]. Ce 
phénomène étant dû à un soi-disant couplage spin-orbite. Il est temps maintenant de voir d'où cela vient. 
Rappelons que nous avons obtenu précédemment: 


… 


J={É+S (42702) 


Dès lors, la norme (ce qui est mesuré) nous amène à écrire: 
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PIRE +ST -C +5) +(2 +5, +4 +8) cr 


ce qui nous donne après regroupement: 
PE + ST EF If +245 «2700 


Le terme cf est appelé "couplage spin-orbite". C'est lui qui lors des mesures très précises fait apparaître 
un dédoublement des raies dû au couplage entre le spin de l'électron et le moment cinétique orbital (ce 


n'est pas ||! car ce terme est toujours positif). 
P il P 


Remarque: Lorsque nous avons deux corps en interaction le moment cinétique total est une constante 
du mouvement. Il peut donc y avoir un transfert de moment cinétique entre ces deux corps (c'est le 
couplage spin-orbite). L'un perd du moment l'autre en gagne. À noter qu'un corps étendu possède un 
moment cinétique de rotation autour d'un point et un moment cinétique de rotation sur lui-même. C'est 
ce dernier que nous appelons par une analogie abusive: le spin. 


L'écart mesuré est donc attribué à l'interaction du spin de l'électron avec son moment orbital. L'électron 
tourne autour du noyau, mais si nous nous plaçons sur l'électron, nous voyons le noyau tourner (sur la 
Terre le soleil tourne autour de la Terre!). Tout se passe comme si le noyau créait un champ magnétique 
au niveau de l'électron, et ce champ interagit avec le moment magnétique de l'électron, le spin, et ceci 
différemment selon que le spin est dans le sens du champ ou opposé, c'est cette différence qui ajoute ou 
retranche un peu d'énergie au niveau. 


Voici un schéma qui résume le tout: 


Figure: 42.18 - Représentation imagée de l'interaction spin-orbite 


Montrons en effet que tel que défini, est une constante du mouvement. Nous avons (inutile de préciser 
qu'en mettant au carré, il s'agit des composantes du vecteur que nous mettons au carré et non le vecteur 
lui-même!): 


d'où: 
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[7.2 $] [7 - P -#] (42.706) 


Faisons le développement pour une composante: 


1 1 
Lt -é-#]- [7-4 -#)-(2-6-#)] 
= [A -%2 De - A +2+s = [7.2 JS?- ÊJ,- SJ] (42.707) 


[4.2 + sf] 
Or, par définition (de notation) }, = Z, +#, donc: 
[7.2] - [4.4 je: le [2 +8. +$] 
= -: [44 +I Sr SL +S SE) (RL, + SE, + 28, + ss,)] (42.708) 
(841 .#]-f2.#]"[5.4) 


21 _ à | — , 
Or, nous savons que [2,4] = Ô (car un opérateur commute toujours avec lui-même) et en ce qui 


concerne [S S£ ] , nous en avons fait mention dans le chapitre de Calcul Spinoriel et nous le 


démontrerons dans le cadre de l'étude de l'équation de Dirac libre classique (cf. chapitre de Physique 
Quantique Relativiste), que le spin est totalement décrit par les matrices de Pauli qui sont des opérateurs 
linéaires. Écrivons alors à un facteur constant près: 


te te 0 1 
He ec 1 0 (42.709) 


et nous verrons que cela est bien conforme à l'équation de Pauli que nous verrons dans le chapitre de 
Physique Quantique Relativiste (et inversement)!!! 


Donc en faisant abstraction de la constante multiplicative: 


arf A JE JE Je 


ce qui était de toute façon 100% prévisible puisque de toute façon, encore une fois, un même opérateur 
commute toujours avec lui-même. 


Donc finalement: 
D28]---([2.#]+ [8.2] cr 


Dès lors: 
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ets 2 AN 
L,, . £}., x Ô 1 (sl 1 x 
(42.712) 


[720$] =0 (42713) 


d'où finalement: 


J est bien le moment cinétique total qui, même en présence d'interaction spin-orbite, est une constante du 
mouvement (une obligation pour un système isolé). 


Remarque: Une autre manière de lire la chose consiste à dire que la mesure sur un des éléments du 
commutateur précédent adapte l'autre immédiatement pour que leur commutation soit nulle donc par 
extension le moment cinétique total est une constante du mouvement. 


Revenons maintenant sur la relation démontrée plus haut: 


(42.714) 


Nous avons certes obtenues les valeurs propres. Mais il serait judicieux de déterminer l'expression des 
opérateurs de Spin. Nous avons vu dans le chapitre de Calcul Spinoriel que: 


1 0 
GO = (42.715) 
Q —1 


et nous avons démontré que pour la valeur propre +1 les vecteurs propres associés étaient: 


+ 1 A A0 
+|, (42.716) 
1 0 |fi 1 
=] (42.717) 
0 —-1|10 (] 


En multipliant à gauche et droite par un terme familier: 


kl1 O1 h{l 
LL =— (42.718 
2Lo -1[lo)" 20) 7° 
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Nous avons alors: 


Et par analogie du fait que les matrice de Pauli sont des matrices de rotations particulières, nous posons: 


Et évidemment nous en déduisons: 
2 2 F] 2 2 
ST RL À À k 3x |1 0 
ÿ = |$] (ia. +2o,) (2e =—(& +} + \=— (42.720) 


6. DIMENSIONS DE PLANCK 


Il convient d'ouvrir une petite parenthèse pour finir sur la constante de Planck (car beaucoup d'ouvrages 
font mention de ce que nous allons voir sans les précautions de rigueur). Nous venons de voir que la 
mesure des objets dépend du principe d'indétermination de Heisenberg. Cette précision joue tant sur les 
mesures du temps que sur la trajectoire des particules ou la densité d'énergie de l'Univers. Voyons que 
cela à, par extension... d'autres éventuelles implications. 


Nous avons démontré précédemment au début de ce chapitre qu'une des relations d'incertitudes est 
donnée, en prenant le module, par (de l'ordre de la constante de Planck donc à un facteur près): 


[x2,]=2 «27 


Grossièrement, nous pouvons donc dire qu'à une fluctuation À de l'espace (à ne pas confondre avec la 
notation de la longueur d'onde), nous pouvons associer la quantité de mouvement: 


À celle-ci correspond, d'après nos résultats du chapitre de Relativité Restreinte, la relation de l'énergie 
E = Me? = p'e, ou la masse équivalente (en divisant par &?) p/c. En désignant par M cette masse 
associée à la perturbation À, nous avons donc: 


La gravitation due à cette masse est caractérisée par une longueur R que nous déterminerons en ordre de 
grandeur en écrivant que l'énergie potentielle qui lui est associée (cela suppose que la gravitation 
classique et quantique sont régies par les mêmes lois...), Ga? / R (cf. chapitre de Mécanique Classique), 
est égale à la masse-énergie #?. Cela donne: 


R=—— (42725) 
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Pour qu'il n'y ait pas auto-amplification (et donc divergence) du phénomène de fluctuation quantique du 
vide, nous devons avoir de préférence À = À . En écrivant l'égalité entre ces deux grandeurs, nous 
aboutissons donc à une quantité qui représente la dimension minimale (en ordre de grandeur) que puisse 
concevoir la physique. C'est la fameuse "longueur de Planck": 


À = T 2 1.616 10% [y] (42.726) 


pour laquelle il correspond la période ou "temps de Planck" += À /c d'où: 


t,= ge =5.391.10 % [s] (42.727) 
2 


Nous pouvons maintenant revenir à une autre expression plus intéressante de la masse fluctuante. Puisque: 


= 1 L et À = Gh (42.728) 
c'À c' c 


nous avons dès lors la "masse de Planck": 


5 


M, = Je æ 2176 10 *[Kg] (42.729) 


L'analyse dimensionnelle nous donne à une constante près et selon le théorème du Viriel (cf. chapitre de 
Mécanique Des Milieux Continus): 


Æ=kT (42.730) 
et donc: 
E =M,c° "pc= = 2 = ET M, = Mo (42.731) 
€ € G  c 


d'où la "température de Planck": 


he” 
T, =, 2142107 [K] (42732) 
GX 
et encore "l'énergie de Planck": 


5 
E,=M,c° = LE - pe = 1.956 10°[J7] (42.733) 


Après tout cela, nous obtenons facilement la "densité de Planck": 
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Le FE e 
M, _NVG Gh _ EE 


a - 27e "#5 5 1:10% [er] (42.734) 


Nous pouvons nous amuser à obtenir encore d'autres valeurs de Planck encore, mais qui ne veulent plus 
dire grand-chose à force (et nous pourrions continuer ainsi longtemps avec énormément d'autres 
grandeurs): 


La "force de Planck": 


CR 
: À he Ve  _c‘ ” 44 
2 27 GCGYŸ GC 1.21:10 [] (42.735) 
"2 
La "puissance de Planck": 
E} a 
= 3620 10%[#] («2.736) 
P 


La "pulsation de Planck"”: 


5 
@ =2Hf}= . = Ca =1.855:10 [ras] (42.737) 
P 


En procédant avec le même raisonnement initial fait avec la masse, mais en utilisant l'énergie potentielle 
électrostatique au lieu de l'énergie potentielle gravitationnelle nous pouvons obtenir la "charge de 
Planck": 


dp= NJeh4re =1.875.10 [C] (42.738) 


Dès lors nous pouvons calculer un "courant de Planck": 


é 
= . . ee =347910% [4] (42.730) 
P 


ainsi que la "tension de Planck": 


£» c* 27 : 
U, = —== =1.0432:10"[7] (42.740) 
4 CAE) 
et "l'impédance de Planck" (...): 
F 1 Z 
p=—È=—- =L = 90 98[<è] (42.741) 
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Remarque: Certains physiciens se sont servis (et se servent toujours) des résultats ci-dessus pour des 
raisonnements farfelus et dangereux qui ne sont qu'interprétation. Il convient donc de prendre avec des 
pincettes toutes les informations relatives aux dimensions de Planck que vous pourriez trouver (même 
si celles-ci paraissent fort sympathiques). L'exemple le plus connu est donné par la longueur d'onde de 
Compton À; ( ) qui dépend de la masse-énergie du photon. Si cette 


longueur d'onde est égale au rayon de Schwarzschild classique pour la même masse-énergie ( 

), alors dans ce cas sa valeur est celle de la longueur de Planck et sa masse est 
égale à la masse de Planck. Il est alors tentant de dire que la particule forme alors un trou noir. Mais il 
s'agit d'une analogie car dans ce cas, rien ne nous dit que l'expression du rayon de Schwarzschild 
s'applique à la physique quantique. 


7. INTERPRÉTATION DE COPENHAGUE 


En 1930, l'interprétation probabiliste de l'amplitude de l'onde d'une particule et le principe d'incertitude 
d'Heisenberg constituent les éléments de l'interprétation "standard " non déterministe de la physique 
quantique comme nous en avons déjà fait mention au début de ce chapitre. Cette interprétation est souvent 
appelée "interprétation de Copenhague", car Niels Bohr qui y contribua largement y dirigeait un institut 
de physique renommé à cette époque. Pourtant de nombreux physiciens tels Einstein et Schrôdinger, qui 
acceptaient la formulation mathématique de la physique quantique, n'étaient pas à l'aise avec 
l'interprétation de Copenhague et la critiquaient. Et jusqu'à nos jours, la question de l'interprétation 
correcte de la formulation mathématique reste un problème. 


En effet, nous pouvons nous poser la question suivante: Où se trouve la réalité? Y at-il une réalité? Niels 
Bohr répond non: il n'y a rien au niveau quantique, la réalité n'existe ou n'apparaît que lors d'une mesure. 
Cette vision partagée par la plupart des physiciens (interprétation de Copenhague), implique que la mesure 
"crée" la position de l'électron (voir le sous-chapitre traitant du principe de superposition linéaire des 
états). Autrement dit: Aucun phénomène élémentaire n'est un phénomène réel avant d'être un phénomène 
observé. 


Einstein pensait que la physique quantique, bien que très efficace et très impressionnante, n'est pas 
complète et ne donne qu'une image imparfaite du monde quantique. Pour lui, il y aurait autre chose, au- 
delà, qui clarifierait et affinerait notre présente vision (au même titre que la théorie des gaz pour laquelle il 
avait fallu attendre les modèles statistiques, Einstein pensait qu'il restait à découvrir des variables cachées) 


Ainsi, dans l'interprétation de Copenhague de la mécanique quantique le principe d'incertitude signifie 
qu'à un niveau élémentaire, l'univers physique n'existe plus de manière déterministe, mais plutôt comme 
une série de probabilités ou de potentiels. Par exemple, le motif produit par des millions de photons 
passant à travers une fente de diffraction peut être calculé à l'aide de la mécanique quantique, mais le 
chemin de chaque photon ne peut être prédit par aucune méthode connue. L'interprétation de Copenhague 
dit qu'il ne pourra être calculé par aucune méthode. C'est cette interprétation qu'Einstein mettait en doute 
lorsqu'il disait: "je ne peux pas croire que Dieu joue aux dés avec l'Univers". D'un point de vue physique 
autant que philosophique, le principe d'incertitude implique la réfutation du déterminisme universel 
défendu par Laplace au début du 19ème siècle. 


Une réduction instantanée de tous les états possible se produit dès l'observation du système selon 
l'interprétation de Copenhague. Cette décision aléatoire de l'état observé respecte les probabilités, 
correspondant au carré des amplitudes des états. De surcroît, l'interprétation de Copenhague stipule que, 
lors d'une mesure, un processus de réduction, originaire de l'objet macroscopique, élimine les 
superpositions d'états quantiques. 
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L'interprétation de l'école de Copenhague conduit donc au problème de la mesure, l'expérience de pensée 
du chat de Schrüdinger stipulant que lorsqu'on mesure une quantité, telle que la position ou l'impulsion, 
nous intervenons dans le processus de mesure en provoquant un changement radical de l'état quantique, de 
la fonction d'onde. Nous modifions les quantités mesurées de façon imprévisible et cet état ne peut être 
décrit par l'équation déterminée de Schrôüdinger. Les physiciens et les philosophes ont réagi de plusieurs 
manières à cette interprétation: 


- Soit nous considérons comme Bobhr et Heisenberg que ce principe fait loi et qu'il est préférable de ne pas 
rechercher l'interprétation ultime. C'est une attitude qui est admise par la plupart des physiciens. 


- Soit nous considérons que la physique quantique est une théorie incomplète et certains, tel Einstein, 
Eugène Wigner ou David Bohm n'ont pas hésité à rechercher d'autres solutions, stériles jusqu'à présent. 


- Enfin, Hugh Everett et bien d'autres prennent l'équation de Schrôdinger très au sérieux, la considérant 
comme une représentation de la réalité. Ils considèrent que l'interprétation de l'école de Copenhague 
représente réellement l'évolution de la fonction d'onde. Les différents termes de l'équation 
correspondraient aux différents niveaux d'énergie dans lesquels se trouve le système. La réduction du 
paquet d'ondes s'interpréterait comme une division totale de l'objet et de l'instrument de mesure dans des 
univers parallèles. 


Aujourd'hui le débat reste ouvert, mais plusieurs expériences réalisées depuis les années 1930 nous 
permettent, pas à pas, de dissiper l'épais brouillard qui recouvre le fond de la réalité et de répondre à 
quelques questions. Cela dit, toutes ces expériences confirment néanmoins que l'époque des certitudes est 
bien révolue. L'expérience la plus fameuse restant le paradoxe EPR suite à la publication d'un article de 
Einstein, Podolsky et Rosen ayant pour seul objectif de mettre à mal l'interprétation de Copenhague. 


L'article d'origine étant un peu difficile, nous allons prendre la version scolaire d'usage simplifiée mais qui 
est celle utilisée dans les laboratoires, proposée à l'origine par David Bohm. Alors qu'à l'origine le 
paradoxe était présenté avec le couple {position, quantité de mouvement}, Bohm proposa d'utiliser le spin 
qui est une propriété à priori purement quantique. 


Un électron, ne pouvant alors avoir que deux états de spin "en haut" ou "en bas", l'expérience EPR 
proposée par Bohm consiste alors à prendre une particule de spin nul qui se désintègre, produisant ainsi 
deux électrons À et B. Puisque leur spin combiné doit demeurer égal à zéro, l'un des éléctrons doit avoir 
son spin en haut et l'autre en bas. Les électrons foncent dans des directions opposées jusqu'à ce que la 
distance les séparant soit assez grande pour éliminer tout interaction physique entre eux, et on mesure le 
spin de chaque électron exactement au même instant à l'aide d'un détecteur de spin. 


Selon Bohr, tant qu'aucune mesure n'a été effectuée, ni l'électron A, ni l'électron B ne possèdent un spin 
pré-existant dans aucune direction. Au lieu de quoi, avant d'être observés, les électrons existent dans une 
superposition d'états, si bien qu'ils sont en haut et en bas en même temps. Puisque les deux électrons sont 
intriqués, l'information concernant l'état de leur spin est donnée par une fonction d'onde du type: 


YF =(A spin Tet2 spin J\ ou (A spin Jet B spin T 
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L'électron À n'a pas de composante x de spin avant qu'une mesure effectuée pour la déterminer fasse 
s'effondrer la fonction d'onde du système A et B, après quoi elle est soit "en haut", soit "en bas". À cet 
instant précis, son partenaire B acquiert le spin opposé dans la même direction, même s'il est à l'autre bout 
de l'Univers. L'interprétation de Copenhague est alors dite "interprétation non-locale" alors qu'Einstein 
croyait au réalisme local: c'est-à-dire qu'une particule ne peut être instantanément influencée par un 
événement lointain et que ses propriétés existent indépendamment de toute mesure. 


L'approche de Bohm a cependant une faille qu'Einstein aurait probablement utilisé comme argument: les 
corrélations s'expliqueraient en avançant que les deux électrons possèdent chacun des valeurs de spin 
définies sur chacun des trois axes x, y, z. qu'elles soient mesurées ou non. Donc à nouveau, selon Einstein, 
le fait que les états de spin pré-existants du couple d'électrons ne puissent être pris en compte par la 
physique quantique ondulatoire aurait encore été une preuve de son incomplétude. 


Un physicien John Bell eut cependant l'idée d'un moyen expérimental et théorique pour sortir de l'impasse 
du paradoxe EPR en changeant l'orientation relative des deux détecteurs de spin. 


Ainsi, si les détecteurs mesurant le spin des électrons A et B sont alignés de façon à être parallèles, alors il 
y a une corrélation de 100% entre les deux ensembles de mesures chaque fois que le spin en haut est 
mesuré par un détecteur, le spin en bas est enregistré par l'autre détecteur, et vice versa. Si l'on fait tourner 
légèrement un des détecteurs, ils ne sont plus alignés. À présent, si on mesure l'état de spin de nombreux 
couples d'électrons intriqués, lorsqu'on trouve "en haut" pour l'électron À, la mesure correspondante pour 
B donnera parfois "en haut" elle aussi. Augmenter l'angle entre les axes des deux détecteurs conduit donc 
à une réduction du degré de corrélation. Si les détecteurs sont à angle droit l'un de l'autre et que 
l'expérience est à nouveau répétée de nombreuses fois, ce n'est que dans la moitié des cas qu'on détectera 
un spin en bas chez B lorsqu'on détecte un spin en haut chez A sur l'axe x. Si les détecteurs sont orientés à 
180 degrés l'un de l'autre, le couple d'électrons sera totalement anticorrélé. Si la mesure donne "en haut" 
pour l'état de spin de À, alors le spin de B sera "en bas”. 


Bien qu'il s'agisse d'une expérience imaginaire, il est possible de calculer le degré exact de corrélation du 
spin pour une orientation donnée des détecteurs, tel qu'il est prédit par la théorie quantique. Il n'est 
cependant pas possible d'effectuer un calcul similaire en se servant d'une théorie à variables cachées 
archétypique et qui conserve la localité. La seule chose que pareille théorie pourrait prédire serait un 
couplage imparfait entre les états de spin de A et de B. Cependant, en toute rigueur, c'est insuffisant pour 
choisir entre la théorique quantique et une théorie locale à variables cachées. Bell fit alors une découverte 
étonnante. Il était possible de décider entre les prédictions de la mécanique quantique et celles de toute 
théorie à variables cachées en mesurant les corrélations de couples d'électrons pour une configuration 
donnée des détecteurs et en répétant ensuite l'expérience avec une orientation différente. Ce qui permit à 
Bell de calculer la corrélation totale pour les deux configurations d'orientation en termes de résultats 
individuels prédits par toute théorie locale à variables cachées. Puisque, dans toute théorie de cette sorte, 
le résultat d'une mesure effectuée par un détecteur ne peut être affecté par ce qui est mesuré avec l'autre, il 
est possible de distinguer entre les variables cachées et la mécanique quantique. 


Bell réussit à calculer les limites du degré de corrélation de spin entre couples d'électrons intriqués dans 
une expérience EPR modifiée par Bohm. Il trouva qu'au royaume éthéré des quanta il y a un plus grand 
degré de corrélation si la mécanique quantique règne en maîtresse absolue que dans tout univers qui 
dépend de variables cachées et de la localité. Le théorème de Bell disait qu'aucune théorie locale à 
variables cachées ne pouvait reproduire le même ensemble de corrélations que la mécanique quantique. 
Toute théorie locale à variables cachées conduirait à des corrélations de spin générant des nombres, 
appelés coefficients de corrélation, entre -2 et +2. Or, pour certaines orientations des détecteurs de spin, la 
mécanique quantique prédit des coefficients de corrélation qui se trouvent à l'extérieur de la plage, appelée 
"inégalités de Bell", allant de -2 à +2. 
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Le théorème de Bell permet donc de tester en face de l'interprétation de Copenhague soutenue par Bohr la 
réalité locale préconisée par Einstein, à savoir que l'univers quantique existe indépendamment de 
l'observation et que les effets physiques ne peuvent se transmettre à une vitesse supérieure à celle de la 
lumière. Bell avait transporté le débat Einstein-Bohr dans une arène nouvelle, la philosophie 
expérimentale. Si l'inégalité de Bell résistait, alors l'affirmation d'Einstein que la mécanique quantique 
était incomplète serait exacte. Si toutefois cette inégalité venait à être violée, ce serait Bohr qui 
triompherait. Plus d'expériences de pensée! Ce serait maintenant Einstein contre Bohr au laboratoire. 


La première expérience qui testa les inégalités de Bell utilisa des couples de photons au lieu de couples 
d'électrons. Ce changement était possible parce que les photons possèdent le propriété de polarisation, 
qui, pour les besoins du test, jouait le rôle du spin quantique (de plus les photons sont plus simples à 
manipuler). C'est certes une simplification, mais on peut considérer un photon comme étant polarisé "en 
haut" ou "en bas". À l'instar du spin de l'électron, si la polarisation d'un des photons sur l'axe x est 
mesurée comme étant "en haut", alors la mesure de l'autre donnera "en bas", puisque les polarisations 


combinées des deux photons doivent aboutir à zéro. 


Les résultats violèrent les inégalités de Bell ce qui était en faveur de l'interprétation de Copenhague non 
locale soutenue par Bobhr et contre la réalité locale soutenue par Einstein. 


Bell dérivait cette inégalité de deux suppositions. Primo), il existe une réalité indépendante de 
l'observateur. Ce qui se traduit par le fait qu'une particule possède une propriété bien définie comme le 
spin avant d'être mesurée. Secundo, la localité est conservée. Il n'y a pas d'influence supraluminique, si 
bien que ce qui se produit ici ne peut affecter instantanément ce qui se produit ailleurs. Les résultats 
expérimentaux signifient qu'il faut abandonner l'une de ces deux suppositions, mais laquelle? Bell était 
disposé à abandonner la localité. 
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Notes personnelles: 
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43. PHYSIQUE QUANTIQUE RELATIVISTE 


L. lecteur attentif aura noté que la mécanique quantique (physique quantique ondulatoire) est une 


théorie non relativiste: elle n'incorpore pas les principes de la relativité restreinte d'Einstein (cf. chapitre 
de Relativité Restreinte). Nous allons donc nous efforcer à combler ce manque en étudiant maintenant la 
version relativiste de la physique quantique ondulatoire (probabiliste). 


Avant de nous attaquer à la partie mathématique, nous tenons à souligner et à rappeler que nous allons 
nous limiter uniquement aux développements théoriques effectués entre 1910 et environ 1935 (au-delà la 
complexité des théories nécessite trop de pages pour un site Internet généraliste). 


1. ÉQUATION D'ÉVOLUTION RELATIVISTE DE SCHRÔDINGER 


La physique des particules ne peut être correctement et totalement décrite dans le cadre de la mécanique 
quantique. Comme les énergies sont généralement supérieures aux masses des particules, il est nécessaire, 
en plus, de travailler dans le contexte de la théorie de la relativité restreinte. Voyons comment inclure 
celle-ci par une première approche basique. 


L'énergie-impulsion d'une particule libre de masse m, satisfait comme nous l'avons démontré dans le 
chapitre de Relativité Restreinte à la relation: 


E1 = cp? + mic" (43.1) 


Nous cherchons à quantifier cette équation. Pour cela, nous allons revenir à des relations que nous avons 
démontrées lors de l'étude des opérateurs linéaires fonctionnels et de l'équation évolutive de Schrôdinger. 


Rappelons que la quantité de mouvement est décrite par la relation (utilisant l'opérateur de divergence): 


p=ihV (432) 
et l'énergie totale par: 
E = © (43.3) 
dé 


Ces deux relations ayant été démontrées dans le chapitre de Physique Quantique Ondulatoire! 


Les substitutions des deux relations précédentes appliquées à la relation: 
E=cp" +mict (434) 


et multipliée par la fonction d'onde (cf. chapitre de Physique Quantique Ondulatoire) des deux côtés de 
l'égalité conduisent au développement: 
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E = cp +mêct & (iha,Ÿ = c?(-h9) +méct 


= (-K8; + HA) = mc y ee -H (ré -a}# = mac % 
{ré (ré -a}méet]s =0 


En utilisant le d'Alembertien (cf. chapitre d'Électrodynamique), nous pouvons écrire cette dernière 
relation sous la forme condensée finale suivante appelée "équation d'évolution relativiste de Schrôdinger" 
ou plus fréquemment "équation de Klein-Gordon libre" (en l'absence de champ magnétique!): 


(x Otre?)Y = o| (43.6) 


avec donc la signature +, -, - ,- pour la dérivée partielle: 


Certain auteurs préfèrent la signature -,+,+,+, dès lors, nous avons (c'est par ailleurs le choix que nous 
ferons dans le chapitre de Physique Quantique Des Champs puisque c'est la tradition.….): 


(RO-mc|P=0 (439) 
avec: 


Ci PA PAL Ps (43.9) 
cl? x d & 


Remarque: En physique des particules élémentaires, cette équation est nommée "équation relativiste 
covariante des bosons" quelle que soit la signature choisie. 


L'équation de Klein-Gordon libre est aussi souvent donnée sous la forme suivante (plus esthétique): 
eŸ 
me) Y=0 (43.10) 


Il est important de remarquer que l'équation de Klein-Gordon fait intervenir des scalaires et caractérise 
donc des particules de spin zéro. 
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Remarques: 


R1. Nous pouvons vérifier que les ondes planes de la forme: 


j 
y = Der (43.11) 


sont des solutions de l'équation de Klein-Gordon libre (nous y reviendrons plus en détail dans le 
chapitre de Physique Des Particules Élémentaires). 


R2. Nous reviendrons lors de notre étude de l'équation de Dirac et du spin des fermions sur l'équation 
de Klein-Gordon libre (afin de la généraliser). 


1.1. ANTIMATIÈRE 


Lors de la démonstration de l'équation de Klein-Gordon libre, nous avons laissé exprès de côté un cas très 
intéressant du développement que nous avons effectué. 


Peut-être ne l'avez-vous pas remarqué, maïs l'équation : 
E =cp?+mict (43.2) 


peut prendre deux valeurs pour une impulsion donnée: 


l'une positive et l'autre négative. La valeur de l'énergie pourrait donc prendre toutes les valeurs de 
] — ©; +co[ 


Jusqu'ici, nous avions implicitement admis en mécanique classique que les solutions négatives n'étaient 
pas physiques et devaient donc simplement être écartées. Cela ne peut se faire en théorie des champs 
quantifiés sans conduire à des incohérences graves. Plutôt que d'ignorer ces solutions d'énergie négative, il 
convient de leur trouver une interprétation physique. 


Nous observons d'abord, que toutes les énergies négatives sont autorisées par la relation précédente (aussi 
bien que pour l'énergie positive). Nous disons que les états d'énergie négative sont tous occupés mais non 
observables; les électrons sont dits "électrons virtuels". 


Imaginons un paquet d'onde constitué par une superposition d'ondes planes sur un intervalle étroit en 
impulsion. Ce paquet se déplace dans l'espace. Dans le cas unidimensionnel, il se propage à la vitesse: 


Démonstration: 


En nous nous basant toujours sur l'hypothèse que le champ de potentiel est nul, nous avons donc: 
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1  ; dE dE dE 
E = HR = — = mm — => — =y (4315) 
2 dv mdv dp 


et: 


E =c"p +nic © d(Æ*)=E dE+dE' E=2E dE 
_, d(E?) _ 28dE _ d(cp” +moc") _ 


 — a ———— 2» cp 
dp dp dp (43.16) 
2 
RS MR AE 
ap ap dp E 
Donc pour résumer: 
d 2 
y=-°r (43.17) 

dp E 


CIC.Q.F.D. 


Considérons d'abord une particule d'énergie positive Æ*+. Sa position en fonction du temps est donnée par: 


2 
E* >0:x()=2x + (43.18) 


Une particule d'énergie négative &- se déplace selon: 


1 2 
L € c 
EF <O:x = m + tem + ED so) 
: ET 
En d'autres termes, et ce sera notre première conclusion, nous pouvons dire qu'une particule d'énergie 
négative Æ” < 0 est équivalente à une particule d'énergie positive |£”| > 0 se déplaçant à l'envers dans le 


temps et ceci est ce que nous nommons une "antiparticule". 


Il nous reste maintenant à voir quelle est l'interprétation à donner à une particule se déplaçant à l'envers 
dans le temps: 


Pour simplifier, nous considérons une particule non relativiste de charge électrique (-q) plongée dans un 
champ électrique Æ et magnétique £ statiques. Elle satisfait à l'équation du mouvement: 

d°x = CNE 

m— = (-g)£ +(-g)—XxB (4320) 

di di 
Nous avons étudié dans le chapitre d'Électrodynamique que les champs £ et À pouvaient être construits 
à partir du quadripotentiel 4. Donc nous pouvons réécrire l'équation précédente à partir des deux relations 
déterminées en électromagnétisme: 
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Cependant, il est toujours possible d'imposer la jauge suivante (nous laissons le soin au lecteur de faire la 
vérification en utilisant exactement la même méthodologie que celle utilisée dans le chapitre 
d'Électrodynamique): 


L'équation du mouvement devient: 


_ 


dx ä4 je. à 
æ =-(-g)—+(-g)—x{[VXx A] (43.23) 
2 (ra) ” (-g) . (Vx 4) 
ou encore: 
2— u 
d(-£) 4(-5)  d(-i) 


Comparant les deux dernières équations, nous arrivons à notre seconde conclusion: une particule de 
charge q se déplaçant à l'envers dans le temps obéit aux mêmes équations du mouvement qu'une particule 
de charge opposée -q se déplaçant vers l'avant dans le temps. L'interprétation physique de la deuxième 
particule est évidente. 


La physique quantique relativiste implique donc l'existence d'antiparticules, qui sont effectivement 
observées. 


Tout cela pour en arriver où exactement? 


- Premièrement, la découverte théorique de l'antimatière permet d'avoir une possible explication de 
l'existence de l'Univers qui violait précédemment le principe de conservation de l'énergie. La théorie que 
nous venons de voir, prédit donc que l'Univers devrait contenir autant de matière que d'antimatière. Les 
scientifiques sont également à la recherche de la présence de cette antimatière. 


- Deuxièmement, si nous considérons dans le vide un photon d'énergie #v > 2»,e?, il est capable de 
porter un électron virtuel vers un état d'énergie positive, où il devient réel. Il apparaît alors une lacune, ou 
un "trou" dans la région des énergies négatives. D'après le principe de la conservation de la charge, on 
voit apparaître un électron positif, ou positron, particule antimatérielle symétrique de l'électron. 


Ainsi, le photon se matérialise sous la forme d'une paire 2*,e”, avec: 


= 2 AD 9€ 
hv=2mc +EÆ,, (4325) 


Remarque: Certains résultats expérimentaux semblent montrer que les antiparticules ne sont pas les 
parfaits miroirs des particules que nous connaissons. Effectivement, la symétrie droite/gauche et 
temporelle ne semble pas être respectée (il y a brisure de symétrie). Nous n'avons encore rien rédigé à 
ce sujet sur le présent site mais nous le ferons dès que nous le pourrons. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


2. ÉQUATION DE KLEIN-GORDON GÉNÉRALISÉE 


L'équation de Klein-Gordon libre que nous avons initialement présentée plus haut ne prend pas en compte 
l'influence du champ magnétique sur l'observation du dédoublement des raies du spectre des atomes 
(constat expérimental). C'est pour cette raison que Klein et Gordon intégrèrent dans leur équation le 
champ magnétique. Cependant, ils le firent sans prendre en compte le spin de l'électron. C'est seulement 
après leur travail que Pauli développa son équation (dite "équation de Pauli") qui amena ensuite à 
l'équation de Dirac (voir plus loin). 


Pour déterminer l'expression de l'équation de Klein-Gordon d'une particule chargée dans un champ 
magnétique et un potentiel électrostatique, utilisons la puissance du formalisme Lagrangien: 


L'équation classique du mouvement admise (cf. chapitre de Mécanique Analytique), comme valable aussi 
en relativité, est donnée nous le savons par (équation d'Euler-Lagrange): 


d+ | 0, L)- 0g LZ (4326) 


Dans le chapitre de Relativité Restreinte, nous avons vu que le lagrangien d'une particule libre a pour 
expression: 


5 1 
“ —. avec y={1-8?) 7 8=2 (4327) 
[es 


et dans le chapitre d'Électrodynamique que le lagrangien total était: 


2 ES 
És= -qU+gvoA (4328) 
Fr 


Pour des besoins ultérieurs, commençons par calculer: 


c? … 
3,18; - -qU+q5eAl (329 


Calculons le premier terme: 


1 
2} 2,3 v v 

3,131 l 21h 7) or, (30 
a 2 € ce” e 


Comme le potentiel ne dépend pas de la vitesse, le terme : 
8,(-q0U) (4331 
est nul. 
Le potentiel vecteur ne dépend pas de la vitesse de la particule dès lors: 


8;:qv, A, =gA, (4332) 
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Il vient dans ce cas: 


v 
A,L=-m c? Û ] +g A, =Ymov, tGA, =P, +GA, (4333) 
L'hamiltonien classique s'écrit (cf. chapitre de Mécanique Analytique): 
H=S px -L=vod,;L-L (4334) 
E 


Nous avons donc démontré précédemment que: 
d,£=p,+tgA, (4335) 


Nous pouvons donc écrire avec cette relation l'hamiltonien sous la forme: 


(43.36) 


Le produit scalaire Ÿ 5 a pour expression (puisque Z,Ÿ sont colinéaires): 


VoD=vYmMmV = YMaV? (43.37) 


L'hamiltonien s'écrit alors: 


m nc? 
H = pv + +qU (1338) 


En travaillant sur les deux premiers termes: 


v? 
VF V? + — se 250 Ymc?| — a (43.39) 
à Sn 


1 
PA PL Re m7 
€? +” €? 


Dès lors: 


pv? + 70° “= ymhct 2e D Ymac? (43.41) 


Finalement, nous obtenons (pour un système conservatif): 


H =ymc?+qU=E, (4347) 
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Toujours dans le cas d'une particule se déplaçant dans un champ électromagnétique, la relation entre 
l'énergie et l'impulsion (qui est différente de la quantité de mouvement par la présence d'un terme 
comprenant le potentiel vecteur) se calcule comme suit: 


Comme (nous venons de le démontrer): 
E =ymoc? =H -qU (4343) 


et comme nous l'avons démontré dans le chapitre de Physique Quantique Ondulatoire: 


…. 12 
— n = 2 

pa = = 8 = [EE =(p-qgA) (43.44) 
#70) 


où il faut donc voir le dernier terme comme étant un abus d'écriture pour le carré de la norme. 
Alors en substituant dans: 

E=petmic" (4345) 
nous obtenons (nous changeons de notation pour l'hamiltonien): 


2 _ — 2 
(£E,-qU) -(B-qÂÀ) c2=mict (4346) 


Si nous réécrivons cette relation en faisant usage des opérateurs correspondants (cf. chapitre de Physique 
Quantique Ondulatoire) de l'énergie et de la quantité de mouvement (quantification canonique): 


E=ihd,et p=-ihV (4347) 


alors finalement nous pouvons écrire en analogie avec l'équation de Klein-Gordon libre (en l'absence de 
champ) "l'équation de Klein-Gordon généralisée": 


RE 
(1h, qu" -[-ihV -gA\ | =micty (43.48) 


Cette équation est celle de Klein-Gordon qui s'applique à une particule de charge q sans spin se déplaçant 
dans un champ électromagnétique. 


Si U =0, A = Ô alors la relation précédente s'écrit: 
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[6n2,) - (9) e]y = met E 


(-R87 + Ac) Y = met 
1 
Ë 
1 
h? (Ze +) Y+mdc y =0 
(RO+mge?)Y =0 
Nous retrouvons donc l'équation de Klein-Gordon d'une particule libre mais sans spin ! 
Il serait intéressant de regarder maintenant l'expression de l'équation de continuité (qui exprime rappelons- 
le: la conservation de l'énergie) avec la prise en compte du champ magnétique (parce qu'au fait elle posera 
toujours problème... et même un très gros). Pour cela, considérons le cas d'une particule libre se déplaçant 


avec une quantité de mouvement À et ayant une énergie E. Nous avons vu que nous pouvions lui associer 
une onde plane de la forme: 


yr= Ae@t-8#) (4350) 


Soit l'équation Klein-Gordon libre et son expression en conjugué complexe (nous travaillons avec les 
unités naturellesie =h=1i) 


-8?Y+AY-mÈY=0 (1) 
je (43.51) 
0, Y+AT-m Y =0 (2) 
Nous multiplions (1) par -3® et (b) par 1? 
19 [-2/v]-VAS+:P mi 9 = 0 (1) 
-iv[-4; v] LE A+ Pm2Y =0 (2) 
Soit: 


iVO?Y-I PAT +; PmiY =0 (1) 
—_ _ _— (43 
iWOPY PAT +: Pr Ÿ = 0 (2) 


Par différence (1)-(2): 


il pa?y-yaiyil-i PAY-YAPI=0 (4354) 


Le calcul des dérivées par rapport à t des fonctions suivantes: 


8,/T8,% i=8,T9,P+Y9 %  () 
_ _ _ (43.55) 
8,/Y8,T i=8,Y8,Y+Y42T (2) 
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Par différence (1)-(2) 


8,1Pa,Y9-Ya,9 1 =|Pa?9- pa2P| (4356) 


Ce qui nous donne finalement: 


CR EF: Ya,Y-Ya,Y | = =0 (4357 
Soit fun champ scalaire et £ et un champ vectoriel. L'analyse vectorielle donne: 
Vo(f = (Vnos+f(Vog = fUos)=Vo(f 2)-(Vf)og (358) 
Posons: 
f=T,g=VY (4359) 
Dès lors: 


FVog=Vo(f 2 -(Vf)og= TVOoVY) =Vo(YVY)-(VY)oVY (1) 
(43.60) 


Posons maintenant: 
f=Y,g=VY% (4361) 
Dès lors: 


FVog=Vo(f' a -(Vnog= P(VoVY) = Vo (PVY) -(VY)oVY (2) 
(43.62) 


Soustrayons (1)-(2): 
PV o VE) - PV oVP) = Vo( PV) -V o(PVY) (43.62) 

Comme Ÿ 0Ÿ = 4? = A: 

PAP-VAY = VO(PVT-PVY) (43,69 
En changeant les signes: 

VAY-PAT = Vo PUY PV) (42,65) 
Cette dernière relation et: 

8, [T2 -v a, | ii PAY- YATI=0 (1266) 


donnent: 
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a, [57 8,Y-Y8,Y | Viry LATE | =0 (4367) 


À nouveau, rapprochons cette relation avec l'équation de continuité: 

8,9 +Voj=0 (43.68) 
Rappelons que lors de notre première étude de l'équation de Klein-Gordon nous avons vu qu'en mécanique 
quantique son équivalent est donné par la même équation mais avec les significations suivantes: £ est la 


densité de probabilité, ; est la densité du flux de particules. 


Nous avons donc: 

p=ilYa,y-Ya,Y| 
L _ .—. (43.69) 

JjJ=—i(TVY-YVY) 
Si la fonction d'onde associée T et sa conjuguée complexe Y : 

= A0 8-7) D = At) (43,70) 
Les dérivées par rapport au temps de ces fonctions 
8,9 =-i£ 4e 29) 9, Y =iE AC 2%) (371) 

Les gradients se calculent comme suit: 


Ty =9, Aer =; PAe*Gt-R7) 


oYy …; 5 APR) (43.72) 


En reprenant l'expression de la densité de probabilité et compte tenu de différentielles précédentes, il 
vient: 


p=ilVa,?-Ya,%| 


=i| [as à 2 464897 | [ares EAëTER SRE || (43.73) 


=j(-iE A -5E A )=i(-2iE 4) 
La densité de probabilité a donc pour expression: 


En reprenant l'expression de la densité de courant et compte tenu des différentielles, il vient: 
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J=-iYVY- PUY | 
(fase 5 4048080 | LAERRN 5 AASEN || (a375 


rifiñ4-(i54#i]-- ir) 


La densité de courant a pour expression: 


En se plaçant dans la situation des connaissances de l'époque, l'équation de Klein-Gordon présente 
plusieurs pathologies et inconvénients. 


- La densité de probabilité £ =2Æ 4° peut devenir négative (puisque comme nous l'avons vu, l'énergie 
peut l'être aussi), ce qui est inexplicable. Une telle situation n'existe pas avec l'équation de Schrüdinger. 


- L'équation de Klein-Gordon a l'inconvénient d'être du second ordre en t (l'équation de Schrôüdinger est 
elle du premier ordre). L'évolution temporelle nécessite dont la connaissance non seulement de T(£,) 


mais également de sa dérivée 14, T1, 


- Si nous appliquions cette équation à l'atome d'hydrogène, nous ne retrouverions pas les mêmes niveaux 
d'énergie en structure fine. 


Tout ceci a conduit à l'époque qui précède les travaux de Dirac, à un rejet de cette équation qui, de plus, ne 
tenait pas compte du spin. 


7 


3. EQUATION DE DIRAC LIBRE CLASSIQUE 


Jusqu'à présent, toute particule a été considérée comme ponctuelle et sans aucune structure ou degré de 
liberté interne. Dans cette optique, toute l'information sur l'état du système à l'instant t est alors réputée 
entièrement contenue dans la connaissance de la fonction d'onde F'(x,y,z,é). 


Une telle description est insuffisante, comme nous allons le voir. Cette insuffisance provient des preuves 
expérimentales démontrant qu'une particule telle que l'électron possède un moment magnétique propre, 
indépendamment de tout mouvement de rotation dans l'espace autour d'un centre. L'existence de ce 
moment magnétique entraîne à son tour l'existence d'un moment cinétique propre, ou intrinsèque, qui a été 
baptisé "spin" car on croyait au début que ce degré de liberté était lié à une rotation de la particule sur 
elle-même. Ce degré de liberté est "interne" - bien que l'électron continue à être considéré comme une 
particule ponctuelle ; c'est, au même titre que la charge ou la masse, un attribut intrinsèque, donné une fois 
pour toutes. Il s'avère impossible de donner du spin une image classique! Se représenter l'électron comme 
une petite bille de rayon non nul qui tourne sur elle-même conduit à des absurdités (par exemple, on 
trouve qu'un point situé à la périphérie de l'électron a une vitesse très supérieure à c). Il reste cependant 
que le spin d'une particule massique est son moment cinétique dans le référentiel où elle est au repos. 
L'hypothèse du spin de l'électron a été formulée par Uhlenbeck et Goudsmit en 1925 pour rendre compte 
des atomes complexes comme nous l'avons vu en physique quantique corpusculaire. 
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Le spin d'une particule est toujours demi-entier ou entier, c'est un fait d'expérience. Le caractère entier ou 
demi-entier du spin définit deux grandes familles de particules, les bosons (spin entier) et les fermions 
(spin demi-entier), obéissant à des statistiques très différentes telles que celles que nous avons présentées 
dans le chapitre de Mécanique Statistique (d'où l'existence d'une relation appelée "théorème spin- 
statistique"). 


Revenons au cas de l'électron. Les deux valeurs possibles révélées par une mesure de S (le {; que nous 


avions dans le chapitre de Physique Quantique Corpusculaire) sont donc les valeurs propres +hf2 (cf. 
chapitre de Physique Quantique Ondulatoire) associées aux deux valeurs possibles d'un nombre quantique 
m, = +1/2 lui-même associé donc à l'état libre (£ = 0 ) au moment cinétique: 


b£ JT +Dh= AZ + SN +5) + Dh = JSCS + DR «377 


b £ JS +DA- Miele ne (43.78) 


Une description complète de l'état de l'électron contient donc nécessairement une fonction d'onde donnant 
comme d'habitude la densité de probabilité de présence, mais prenant également en compte le degré de 
liberté du spin, d'où la notation Y{x, y,z,#,,£). Si les coordonnées d'espace prennent des valeurs réelles 
continues, en revanche la variable de spin est donc essentiellement discrète. 


Donc: 


En maintenant l'interprétation usuelle, la quantité lECx, Y,Z,M, 2) dr° est la probabilité de présence 


autour du point choisi avec la valeur #:,} pour le spin. La condition de normalisation des probabilités 


introduit comme toujours une sommation, qui porte non seulement sur les degrés orbitaux (sommation 
continue, c'est-à-dire intégration) mais également sur les degrés de spin (sommation discrète): 


- Ii ne 1 
(l YIF,+— IF, -— 
2 2 
exprimant notamment le fait que nous épuisons toutes les possibilités du spin en sommant sur les deux 
valeurs possibles. En tout état de cause, l'électron n'a plus une mais deux fonctions d'onde, une pour 


chaque valeur de ##,. 


2 2 
dr? “1 dr =1 (4379) 


La notation précédente n'est pas forcément la meilleure pour les particules libres de spin supérieur à 1/2 
comme nous l'avons vu lors de notre étude du moment cinétique. S'agissant d'une variable prenant des 


valeurs discrètes, il est tout aussi légitime de mettre ##, en indice de Ÿ et de poser Ÿ,, (F,£). Enfin, il est 
commode d'utiliser une notation matricielle, rangeant en colonne les différentes fonctions correspondant 
aux valeurs possibles de la variable discrète ##,. Ainsi, pour l'électron, nous admettrons désormais que 
toute l'information au sens de la physique quantique ondulatoire est contenue dans un vecteur-colonne à 


Zu 


deux lignes appelé "spineur" (cf. chapitre de Calcul Spinoriel) et noté: 
Y ,(7,6) 
3 


g_(7.6) 


AGO] 
ATP à 
72 
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Revenons maintenant sur l'équation de Klein-Gordon libre (plus générale que l'équation de Schrôüdinger 
bien évidemment mais moins que celle comportant le champ magnétique): 


8?Y 
RE = RÉCAY - mic Y 
F 
Cette équation est comme nous le savons malheureusement incomplète car elle ne contient aucune 
information sur le spin de l'électron. 


Nous pouvons cependant, pour tenter de trouver une solution à ce problème, faire un parallèle avec le 
Re Da Celui-ci comporte aussi un spin, résidant dans la polarisation du champ (cf. 

). Cette polarisation est étroitement liée à la nature vectorielle du champ 
électromagnétique et transparaît dans les équations de Maxwell, qui sont du premier ordre en dérivées. 
Cependant, en combinant les équations de Maxwell, nous avons vu dans le chapitre d'Électrodynamique 
que nous pouvions obtenir les équations d'onde: 


Les équations d'onde recèlent cependant moins d'informations que les équations de Maxwell originales: 
elles ne contiennent explicitement aucune relation entre les différentes composantes des champs £ et 8, 
comme par exemple le fait que, dans une onde électromagnétique de vecteur d'onde donné, les champs £ 
et & sont mutuellement perpendiculaires et tous les deux perpendiculaires au vecteur d'onde. Pour établir 
ces contraintes, il faut retourner aux équations de Maxwell et donc à des équations avec des dérivées du 
premier ordre. 


Il en est de même pour les fermions (les électrons en font partie). L'équation de Klein-Gordon, quoiqu'elle 
ne soit pas fausse, est incomplète. Il faut tenter ici d'établir une équation du premier ordre en dérivées qui 
décrive bien le spin 1/2 des électrons des fermions. Cette dernière condition signifie que cette équation 
doit donc faire intervenir les deux composantes d'un spineur (en analogie avec celui que nous nous 
déterminé plus haut): 


Nous écrirons alors cette équation que nous cherchons comme: 
D7=0 


où D est une matrice 2X2 faisant intervenir des dérivées du premier ordre (un opérateur différentiel du 
premier ordre). 


Pour donner un exemple avant d'aller plus loin, regardons comment l'équation de Klein-Gordon peut 
s'exprimer sous une telle forme. 
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Nous avons donc (équation de Kleïin-Gordon libre): 
2 
k _. = RAY mc" Ÿ (4386) 
É 
ou (équation de Klein-Gordon généralisée): 


[ira, -qUŸ — | _ihŸ -a À «] =mi ctY (43.87) 


Ce qui s'écrit aussi pour l'équation de Klein-Gordon libre: 


hk à hk à 2 
14 © ||1- 1. ny (43.88) 
mc dE mMyc dE Me 


ou pour l'équation de Klein-Gordon généralisée: 


[-# 82 -2ih8,qU +q° 0? +R °c? - DhV q Ac? - q° #c?] Y=micty 


x? 82 (-g? A e2- DhV a Ac? +R? Ac? + g_U?- ha, qU | 

1 2 ,4 F : 2 4 F > 
Mo € Mo C (43.89) 
ih À ik 8 lp gt A e2- 2h V q Ac? +h Ac?+ QU? Dh, qU'| 

1+ —> D 
mc Ô mac Ôt mè c 


Restreignons-nous maintenant au cas de l'équation de Kleïin-Gordon libre (le raisonnement étant similaire 
mais. plus long pour la version généralisée). 


La dernière expression de l'équation de Klein-Gordon libre suggère d'introduire les deux combinaisons 
trouvées après (paraît-il) de nombreux essais par nos prédécesseurs: 


u mpe? mpc? d 
(43.90) 
Y=Y- ih OT 3 9 
d'où résulte: 
Le 
y on —(Y, + Y, | 
: (43.91) 
CEE és I =;) 
dé Bh 
Dès lors: 
}? 


—|Y=— AY (4392) 
FC 
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peut s'écrire de deux façons après substitutions respectives: 


(43.93) 
ih à h? 
LT —|Y,=——AY,+Y,) 
Mc z| Oct - ; 
Soit, sous forme matricielle: 
2 2 
mc” oh ue À 
DE: 27% 2% Ta 
Fr Aus = : - (43.94) 
dŒlY, h ; Y, 
— À Mc + À 
2 
ou encore: 
2 2 
a [10 mer A = y 
ih - 7 #l=0 (4395) 
dé [0 1 x? à 4 Y, 
— À Mc + À 
2 y 
Ce que nous pouvons écrire: 
2 2 
ih— — mp? + Le 
ok 2% 2 al = 
x : y, = 0 (43.96) 
—— À —ih = mp? + —— À 
2 9 


Donc par rapport à notre idée initiale d'avoir une relation sous la forme: 
D7=0 (4397) 


nous pouvons faire la similitude avec l'équation antéprécédente: 


8 h? Le 
in —— pc? +— À — À 
de ok 2% 2% 
Y= et D = £ à (43.98) 
Ta k . à > À 
À A mp + À 
2% of 2 


où D est bien une matrice 2x2. 


Mais nous, nous recherchons toujours (pour faire le parallèle avec les équations de Maxwell) un système 
d'équations avec des différentielles du premier ordre. Dans l'objectif de chercher une forme plus générale 
incluant sous forme naturelle le spin, nous allons poser en analogie avec le résultat ci-dessus: 
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D=A+Bo& (4399) 


où À est un vecteur (mais représenté par tradition comme un scalaire), & est un vecteur (et noté tel quel) 
et & un vecteur composé de matrices symétriques 2*2 (en lisant la suite vous verrez que poser cela 
permet de trouver ce que nous cherchons...). 


Rappelons que la multiplication entre & et & constitue un produit scalaire tel que celui défini dans notre 
étude du chapitre de Calcul Spinoriel. 


Remarque: Il faut être très prudent dans les développements qui vont suivre, car les notations 
traditionnelles dans le domaine rendent très difficiles les distinctions entre produits, produits scalaires, 
et produits de composantes de vecteurs formant un vecteur. 


Posons (au fait nos prédécesseurs ont aussi fait de nombreux essais avant de poser cela...): 


à _ 
D = +A480V (43.100) 
£ 


Ce que nous cherchions initialement c'est-à-dire 27 = 0 devient alors: 
a  - 
Tr ttAS°oVy7=0 (43101) 


Ainsi, 4=@/8t, B = AV et © reste (imaginons...) inconnu. Il nous faut également déterminer À. 


Toujours par analogie avec l'exemple fait plus haut, tentons de retrouver l'équation d'onde pour déterminer 
la constante À: 


4 (3 : " 4° . . a“ 
(Re Q(4+ 2020) 62 È-Piooioso T=0 (43102) 


Pour que nous retrouvions l'équation d'onde, il faut donc que: 
1. (0%) (et i= V? 


Effectivement (attention il faut que le lecteur ait étudié idéalement le chapitre de Calcul Spinoriel pour 
savoir en détails comment nous arrivons à ce développement!): 


8, ,-i8,| 4, 8,-i8, 


z 


(&5Ÿ) (eV) = 8,+i8, 8, |2,+8, —à, 
82+(9,+i8,)(8,-1i9,)  8,(9,-i8,)-8,(2, -ia,) 
| |a,(8,+i8,)-2,(8,+8,) (a,-18,)(8,+i0, +82 | 
_ 85 +85 + 0 1 n ve 
0 +9, +8 


2. A=c: 
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La - 422 
af? 


+7=0 (43.104) 


Il y a donc deux possibilités qui peuvent s'appliquer à des champs différents que nous noterons 7. Nous 
avons donc une sorte de double spineur tel que: 


Ces équations sont appelées "équations de Weyl". 


Il nous faut maintenant généraliser les équations de Weyl au cas d'un fermion de spin demi-entier avec 
masse. Cette nouvelle équation doit respecter les contraintes suivantes: 


C1. Elle doit se réduire aux équations de Weyl quand la masse tend vers zéro. 

C2. Elle doit mener à l'équation de Klein-Gordon libre. 

C3. Elle doit décrire des particules possédant un spin. 

La solution consiste alors à coupler les deux équations de Weyl par un terme proportionnel à la masse: 
a[e + c8) = me? 0 


à (43.106) 
A[S-c0.0) Vi = me 70) 


ie — _—. : ô + S 
Pour vérifier que les facteurs ont été correctement choisis, nous appliquons e + cs) sur la 


première équation et nous y substituons la deuxième. Nous trouvons: 


à Fe à s ) nl + 
ih ÉRALER AS mé fT 8) ra |. “inc y (43.107) 


ou encore: 
a? 
Nc UN = -mict (43108) 
dé 
à comparer avec: 
a? 
1 | = mc Ÿ (43.109) 


Ce qui est bel et bien l'équation de Kleïin-Gordon libre (nous démontrons la même correspondance pour la 
composante ?!-}) et renforce donc la validité des hypothèses et développements faits jusqu'à maintenant. 
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Il est usuel de rassembler les deux spineurs dans un seul spineur (cela devient alors un "bispineur") de 
quatre composantes (un spineur à quatre composantes dont deux sont en fait associées aux particules et 
deux aux antiparticules comme nous le verrons): 


p*} 
0) 


Y = = (43.110) 


Fi 
Fa 
F3 
Fa 


et de définir les deux matrices 4X4 suivantes (sous une forme dite "forme chirale"): 


Q 1 
À | (43.111) 


où Î est la matrice unité 2*2 traditionnelle définie par: 


[0 1]. 
o 11 12 


et: 


, [0 -al , [0 al 01 
di 0 on ollo -1 (43.113) 


où les & sont les "matrices de Pauli" données par (cf. chapitre de Calcul Spinoriel}: 


A OST ee 0 
= lg AS lt pre ls PB 5l5 à (43.114) 


qui doivent satisfaire rappelons-le (démontré plus haut): 
logo IV (3115) 


qui est pour rappel une matrice 2X2 . Les matrices de Pauli sont donc de bonnes candidates pour résoudre 
notre problème! 
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Remarques: 


R1. Comme nous l'avons vu dans le chapitre de Calcul Spinoriel (section d'Algèbre), &, n'est pas 


vraiment une matrice de Pauli en soi. Cependant, dans certains ouvrages, elle est indiquée comme en 
étant une (c'est aussi notre choix ici). 


R2. Comme nous l'avons également vu dans le chapitre de Calcul Spinoriel, rappelons que les matrices 
de Pauli représentent implicitement des rotations spatiales infinitésimales d'un spineur. 


R3. Attention dans les matrices de Pauli, l'écriture du 0 signifie qu'il s'agit des matrices 2X2 dont 
toutes les composantes sont nulles. 


Ceci nous permet, enfin, de combiner les équations: 
10 s à 
a[ + c8) = mc? 2° 
4 (43.116) 
ihl—-ca0ÿ| D = me pt 
dé 
en une seule (ne pas oublier l'association des opérateurs # — ihà / dé, p —-—ih\ ): 
—+p—- 2 |T =0 (43117) 
en utilisant la notation d'usage en calcul tensoriel et en choisissant les unités naturelles € = 1,* = 1 nous 


avons: 
(17*8 , —m, | Ÿ =0| (43.118) 


ce qui constitue la forme habituelle de "l'équation de Dirac" (implicitement un système de quatre 
équations différentielles couplées) ou "équation relativiste de l'électron" avec la "dérivée covariante": 


et où le vecteur nul est donc (pour rappel...) un vecteur à quatre composantes toutes nulles! 


Remarque: En physique des particules élémentaires, la relation antéprécédente est appelée "équation 
relativiste covariante des fermions" car elle décrit les particules de spin 1/2. 


Les matrices 7“ sont appelées "matrices de Dirac". Sous forme encore plus condensée (en utilisant le 
"slash de Feynman") l'équation de Dirac s'écrit parfois: 


id -m\Y =0| (43.120) 
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Nous avons ainsi, comme en analogie avec les équations de Maxwell, des équations différentielles du 
premier ordre qui ont comme propriété: 


P1. De permettre de retomber sur l'équation de Klein-Gordon, in extenso sur l'équation d'onde (comme 
pour les équations de Maxwell) 


P2. De prendre en compte (décrire) explicitement le caractère spinoriel des fonctions d'onde comme nous 
allons le voir en nous penchant de plus près sur les matrices de Pauli. 


Remarque: Comme l'équation de Dirac s'applique aux particules de spin 1/2 elle s'applique aussi aux 
neutrinos dont la masse au repos est nulle (donc la résolution de l'équation de Dirac se simplifie 
largement). 


Dans le but maintenant d'interpréter le contenu physique de l'équation de Dirac, nous allons utiliser une 
représentation différente des matrices de Pauli. Nous avons vu que la représentation par les matrices 4 X4 : 


0 11, [0 -c L 
pb 1-0 “| (43.121) 


était dite "représentation Chirale" alors que nous allons utiliser maintenant la "représentation de Dirac" 


définie par: 
1 OÙ, 0 & | 
" = k » : Ÿ _ ke 0 | (43.122) 


Nous vérifions facilement (algèbre linéaire élémentaire) que cette représentation s'obtient par la 
transformation: 


| 1 [D 1 
y = Uy#UT où du 1 1 12 


Rappelons que £}1 est la matrice adjointe (la conjuguée de la matrice transposée) de U. Or, lorsque tous 
les éléments sont des réels comme c'est le cas ci-dessus et que la matrice est carrée alors (cf. chapitre 
d'Algèbre Linéaire) nous savons que { = U. 


Démonstration: 
1 110 1 1 1 1 110 111 1 
P UP Ut = L L _ 
li -1/l1 0fÆ11 -1] 2[21 -1/[2 01 -1 
C1f2 271 1] 1f1+1 -1+1] 1[21 0] [1 0 
- 2la 211 2! 212-121 -1+-2| 210 -21| [0 -1 


et: 
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| 111 110 -& 1111 1 1 
Hype A ES se 
Pure Ale kel fr: 
_1il 1}-& &G| 1, 9 2&| [0 & 
211 1e &] 2-2& 0 | [-& 0 


Cherchons maintenant les solutions particulières à l'équation de Dirac sous la forme: 


Pme (43126) 


En substituant dans l'équation de Dirac et après simplification par £“?**-} nous trouvons facilement: 


ip CE) +9 P Gp;) #0 |Ÿ, = 0] (3.127) 
L 


Effectivement en unités naturelles: 
: A (Do Er) _ ,,, À (por-A) (Por Et) 
(y du") Y pe PT mip 0 Vge -mYe 
+ y à ge (PT-E0 +; y? 8 get PT-R) +; PO3% ,e il por Et) — ge (FT-20 


_..0 à UfoF-R) 
SI ar 


a TS a Fr a PV 

Hy ei él Et) +iy? De Ft) HP Ye r-Æ) MY ee *—Et) 

= (Ex pp PEN + 0 Per E) LA g, 

ôf (43.128) 

a Pre a rs a es  . 

+ y tr Er) hé 27 y CPS Er) +; 3 y _lpor-R) _ gp _ (PTE) 

a _. dr di. AE 
= (HE) 70 e(P ED 
Hp oPr-2) .  +ip2e PE) L Fe +i pe Pe-2) . A 
ZX 
= (HE) y (PE) 


+ Vip, Yet T-E) +j Vip, g e(PF-E) +ip hp, Ÿ 6 PTE) . mp Ye PTE) 


Avec la représentation de Dirac, nous obtenons après développement (calcul trivial): 


E- -po - 
70 . Y, = 0 (43.129) 


pË -E-" 


ou plus explicitement: 
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E- 1 -poT ” 
| = ke | L F5 =Û0 (43.130) 
po (—E- 9 1 


Effectivement avec la convention de sommation d'Einstein: 


nur GP,) -r) Y;=(VE-Vp;-"m)T; 


j 


1 O0 le 0 « 0 æ 0 y 
= 0 a 0 21 _œ 0 P3— SG 0 P3 #9 Ê 
E 0 É ee . 
0 -£| -GA —T2P2 Lars 
Je M : An +? .. A 
D: =£ AA BP TP; 0 43.131) 
E 0 0  po® E 0 DURE 
um fu, = LA 
Le aLre * 5 . [ %| je L Fr) | 
_ g,=|| ” V5 MY 
L He . 7 ]°8" (| 508 TOP 
reve fe LE - r9) - po ). es 1) 
poë #, - Eh - md po, +& (— E M) -E-#0 # 
E- -poû 
= | 7 poë jrs _; 
PE -E-ry 


Pour que cette équation matricielle ait des solutions non nulles, il faut comme d'habitude que le 
déterminant de la matrice soit nul (cf. chapitre d'Algèbre Linéaire), Nous vérifions facilement que: 
E-— -po 
ee 7 
PoË Er 
+ 2 
= (Em XE +70) + |Pf = (87-76) +5 = 27 +r8 +I5f =5 


| = (E-mX-E- m0) -(F00 (Fe) 
(43.132) 


Ce qui implique (ne pas oublier que nous sommes en unités naturelles!): 


E=+\]5f +r8| G3125) 


Il s'agit donc d'un système d'équation follement amusant à résoudre (ne pas oublier que chaque terme de la 
relation ci-dessus en réalité une matrice 2% 2 ). 


Avec la représentation Chirale, nous aurions obtenu (toujours en adoptant la notation traditionnelle du site 
pour le produit scalaire): 
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er HZ y Gp,) en Y;=(VE-Vp;-")T; 


. 
Q 1 E 0 -a Q —-a, 0 -æ y 
1 0 le, dl le di Or 
0 E |. LL” ( TP 0 —P3 

= m0 |; 

E 0 7 [or ( GP3 0 
An BP BP 

| mes 


GP re De 0 


LL. ä 
Foë + 0  pot+E 
Fe AC Î-mr,) 


() 
he +(F°8+E)4 - ren) se À Pi) pere) 
+ - 


Len, 


et nous ne serions pas tombés sur une condition aussi esthétique et physique pour qu'il y ait des solutions! 


La masse étant toujours positive, l'équation de Dirac comporte donc quatre solutions linéairement 
indépendantes, dont deux avec une énergie positive : 


et deux avec une énergie négative: 
E=-Æ, (43136) 


Il s'agit donc bien des antiparticules que nous avions déterminées lors de notre étude de l'équation de 
Klein-Gordon libre mais avec le spin en plus d'où le doublage des solutions supplémentaires (deux 
orientations du spin possibles par particule et par antiparticule). Avec la représentation Chirale, nous ne 
serions pas retombés sur ce résultat. D'où la nécessité de l'utilisation de la représentation de Dirac des 
matrices de Pauli. 


Nous savons donc qu'il existe des solutions à l'équation de Dirac. Déterminons maintenant celles-ci. 
Posons: 


où &,,& sont les deux doubles composantes du spineur. Nous écrivons ainsi le système d'équations (nous 


utilisons, comme le faisait Dirac, le simple symbole de multiplication en lieu et place du symbole du 
produit scalaire): 
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Ô 
= (43.138) 
0 


ce qui nous donne (ne pas oublier que le terme au dénominateur est en réalité une matrice 2x2 ….): 


Ni -_p°&  … 
ë Ein) dé let \# E-m)? (43.139) 
po Em) mo* (43.140) 


Nous savons qu'il existe des solutions et la physique quantique nous impose que ces solutions soient 
linéairement indépendantes. Ainsi, choisissons les solutions pour &,,# comme étant proportionnelles à: 


fi fo) 
a. Le ou #,,4 = | 40 


et comme (cf. chapitre de Calcul Spinoriel): 


Ainsi, nous avons: 


nous avons alors les possibilités suivantes: 


poë : po 1 : 5 
(M) &= L]4-£ me 2) mr ( Je Fer 
- __Poë , _ poë 

@ 6 NE Em ]- |. ] 
| -_boë , _ peë [1] _ : 
(3) $ (Je 4 E-ms® nt (À) 
pot pog P- 
TPz 


0 
4 [lea | 


(43.143) 


La question est maintenant... devons-nous utiliser Æ = +, | 5[ + à ou E=-, Î f + à ? Eh bien, pour 


(1) et (2) nous devons utiliser & =+./ sinon 1/(£ +#,) devient une singularité pour 5 = Ô. Pour (3) et 
(4) nous devons utiliser & =-,f sinon 1/(£ -#%) devient une singularité pour 5 = Ô. 


Remarque: Le terme £ =+./{ est souvent appelé "solution particule" dans la littérature et le terme 
E=-{ "solution antiparticule". 
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En reprenant 


Lee h (43.144) 


et en notant les spineurs (nous changeons de notation): 


1 (s] 
PA -{] 20) -() (43.145) 


Nous avons finalement en utilisant (1) et (2) et en notant N( ) la partie de solution que nous devrions 
normaliser les solutions suivantes possibles et qui sont indépendantes: 


ê 
EU =NTI-N =N| 5° |#* 
| h Er _peë |+ 
E + 
P+ 
E+m; 
(43.146) 
) 
l 
é l 
ee - | Jr = =N| 56 | 
É "y Em, 
Pz 
E+r 
avec Æ =+./ ainsi que: 
Ps 
Er L 
ê P _ 
ep] —_|[2nle- | 
x E- 
% 70 : 
1 
(43.147) 
P- 
Er _.. 
ê P _ 
gi =yl"e|- IDIEE L 
7 (| NW E- W M à 


avecE = -{ . 
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Ce qui peut s'abréger: 


POD=N] po |, 2002) = N|E-" | 7°] (43148) 


Indiquons que le terme 5° qui est donc la projection de la quantité de mouvement (impulsion) sur une 
entité mathématique directement liée au spin est appelé "hélicité". 


4. ÉQUATION DE DIRAC LIBRE LINÉARISÉE 


Nous avons vu tout au début de notre étude la physique quantique ondulatoire que l'équation de 
Schrüdinger classique d'évolution était: 


k 
Ih0,Ÿ = (8. = 24] (43.149) 
soit une équation différentielle d'un premier ordre par rapport au temps et du second par rapport aux 


coordonnées spatiales. 


Nous avions ensuite déterminé l'équation d'évolution relativiste de Schrôdinger (équation de Klein- 
Gordon libre) donnée par: 


R'9iY = (RC A-mict | (43.150) 


Nous remarquons qu'en passant à une forme relativiste, nous avons maintenant une équation différentielle 
du second ordre dans le temps et dans l'espace. 


Ensuite en passant par l'équation de Klein-Gordon généralisée qui contenait également une équation 
différentielle du second ordre en temps et en espace: 


fins, -qUuŸ i-n9 gif ee = mc y (43.151) 


et dans l'équation de Dirac libre, nous obtenons de même une équation différentielle matricielle de 
premier ordre en temps et de deuxième ordre en espace: 


2 2 
mc” nn. 
ie Te 27% PR a (43.152) 
dé y 2 y 9.194 
; k à nn k AÏLTS 
2% 2% 
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Ces changements d'ordre des différentielles d'un modèle relativiste ou non imposent bien sûr dans le cas 
d'un premier ordre de connaître les conditions initiales en temps et en espace de l'équation d'onde, ce qui 
est faisable. Cependant, lorsqu'un second ordre apparaît, il faut alors en plus connaître les conditions 
initiales des dérivées des fonctions d'onde (cf. chapitre de Calcul Différentiel Et Intégral), De plus, même 
si mathématiquement la rigueur nous a amené naturellement aux différents ordres obtenus, il est étrange 
en passant d'un modèle relativiste que nous changions d'ordre. Pourquoi ?: pour la simple raison qu'en 
approximant les équations relativistes, nous n'arrivons pas avec le facteur de la constante de Planck à faire 
des approximations (développement en série de v/c ) qui nous ramèneraient à du premier ordre. Les 
équations relativistes et non relativistes sont donc a priori incompatibles dans les limites non relativistes ! 


La méthode de Dirac pour résoudre ce problème aura été la suivante: 


Les ordres de l'équation différentielle de Klein-Gordon venant à la base de la relation (voir les débuts de 
nos développements de l'équation de Klein-Gordon libre) de l'énergie totale en l'absence de tout champ: 


d 2.4, 22) :,32,4#, 9,9, 29, 9 2 _. 24, 2.29, 2,9, 2.2 
E = met +e FA] = mac top,top,tep, mc top te pi tep 


= mo +e(pi +p3 +25] = H° 


Dirac aurait eu donc l'idée géniale de linéariser cet hamiltonien en posant: 


AH, = Éme +can ton, +cap, = Be? +c&op| (43.154) 


dont nous devrons déterminer les paramètres $5,&1%,&,,&, | qui pourront être des scalaires, des vecteurs 


ou des matrices (attendons un peu... la réponse viendra). Il s'ensuit que l'hamiltonien est lui aussi soit un 
scalaire, soit un vecteur, soit une matrice. 


Ainsi, l'équation d'onde d'évolution relativiste la plus simple que nous pourrons construire sera: 
1h0,Ÿ = HY —ih0,Ÿ = H,Ÿ = iha,Ÿ =| Emc° +c&oplT (43155) 


Sous une forme beaucoup plus commune dans la littérature: 


(1h9, — Bmc° -c&opi? =0| (43156) 


Comme ici: 
P=ihV (43.157) 


nous retrouvons alors la relation antéprécédente aussi sous la forme: 


(h9, +ihc@oV - Emc° | Ÿ = 0| (43.158) 


Si la quantité de mouvement venait à être nulle, nous retrouverions ainsi l'énergie au repos pour 
l'hamiltonien: 


ihA,Ÿ = Emme Ÿ (43.159) 


où comme nous allons le voir plus loin # = +1. 
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La validité de cette linéarisation devra être vérifiée en retrouvant les résultats obtenus lors de notre étude 
précédente de l'équation de Dirac. 


Élevons maintenant l'opérateur au carré soit: 
H? = 24 + + 2 4316 
D =lôm c+cap,tca,p,tc@,;p,;l (43.160) 
et posons: 
A=|Bm,c'+ca,plet B=|ca&,p,+tcæ,p,] (43.161) 


À ce stade, il est important de remarquer que nous travaillons peut-être avec des opérateurs (des matrices 
typiquement) qui pourraient ne pas commuter car les &, £ sont inconnus. Dès lors, l'élévation au carré 
sera effectuée comme suit: 


H?=(4+8) = A?+B?+AB+B A (43.162) 


soit simplement développé mais sans simplifier la somme AB+BA en un 2AB ou en un 2BA puisque nous 
ne sommes pas sûr pour l'instant s'il y aura commutativité ou pas. 


Nous développons ainsi l'hamiltonien de Dirac 


OS PE | 4. 2 
Hj=(f" mie te 4) p, tÜmc cap ted pme ]|+ 
2,1 1, 2,.2.3 
LE ypate 3 Ps CG Pa C3 Ps CUP CG Pa lt 
2 
l£moc +topillcaptcap;ltlca,p,tca,p,ll 8mc +c&pP;l 
(43.163) 
En effectuant les produits des termes entre parenthèses et en respectant l'ordre des opérateurs, il vient: 
di ni 4%, 1 8.2.5 à 3 3 3,9, 2:23... 
Hn=8 mic tcp: tmoc faipitmoc MP # te dpate ps t 


2 2 3 3 2 
CU Pa Ps TC 3 P3 Pa toc BiPa toc BP; te MPi Pat 
——y,— 
n ne 15 
2 3 2 3 2 
CLP: P3 tM0C Pa 8 CG Pa Pi tM0C A3 P3 8 +C O3 P3 MP: 
7 4 ë D ë 


(43.164) 


En groupant certains termes: 
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2 
H5 = 6° ie +e api , airs La LE se ee PPat 
Les es 


2 3 
ee * ss Prato |, a, +a,@, |r,p;tmc | 8a té [pit 
ÿ ÿ Î Ë 


l8a + a,8|p,+mc| 8a,+a, 8 |?; 
CR NE + 
13 4 
(43.165) 
Pour être conforme à nos hypothèses de linéarisation, nous devons avoir: 
1— mic" =mic > = 
2,3,4— c'(@ pita; piste psl=c/(pitpitpil > = aa =1 
2 = = 
5,6—c"{aa,+a,@ip,p,=0—a&a,+a,a, =0 
2 ee _ 
7,8—c"{a&,+&,@lp,p, =0 = aa,+a,a, =0 
2 _ “ 
3,10 c'ia, a, +a,a,ip,p,=0—4«,a,+a,a,=0 
1112 mc°l£a +a8ip, =0 = £a +a8=0 
13,14 = mc (£a, +a, Bip, = 0 = £a, +aæ,8=0 


15,16— mc°|£a, +a,8\p, =0 = £a, +a,B=0 
(43.166) 


et nous allons de suite voir que pour satisfaire à ces conditions les &, Ë devront être des matrices 4x4. 


Écrit sous forme de commutateurs, nous avons donc les trois conditions suivantes à satisfaire: 


== ==] 
L æ], =[æ, “ =[æ& ns 43.167) 
[u. 81, =[æ.61 =[æ.81 = 


Nous observons ce qui suit: 


- Le carré de chaque opérateur £ et #; est égal à 1 (ou à la matrice unitaire s'il s'agit de matrice...). 
= [æ.a;] T0 ViJ= 11,2,3),i # j est un anticommutateur. 
- [a 4] . 7 © est un anticommutateur. 


ces trois relations peuvent se résumer comme suit: 


À =1, [æ.a;] "25; [«.4] un O (43.168) 
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À ce stade, nous devons rechercher quels sont les objets mathématiques répondant aux trois conditions ci- 
dessus. Nous pourrions montrer qu'une matrice carrée de dimension 2 ou 3 ne répond pas aux trois 
conditions et un scalaire encore moins! 


Dirac a alors adopté par analogie aux développements antérieurs, des matrices carrées de dimension 4 
incluant des matrices de Pauli (comme par hasard...) et a admis pour Æ une matrice unité (ce choix fait par 
Dirac est particulier, il y a d'autres choix possibles). 


Donc ce que nous notions "1" avant est au fait une matrice unitaire carrée de dimension 4! Et donc les 
fonctions d'onde doivent avoir 4 composantes et des êtres mathématiques qui ont cela sont les spineurs! 


Les matrices considérées par Dirac (qui sont un choix particulier!) sont donc pour &; #t £: 


0 a, 1 0 
," t £= 3.160 
&; 0 et £ o -1 (43.169) 


et par exemple dans certains domaines de la physique quantique on utilise le choix de Weyl: 


| % al 5 0 70 
a — , D = 43.170) 
% a OÙ Q — | 


Dans le choix considéré par Dirac ou de Weyl, nous avons les matrices de Pauli et la matrice unitaire 


suivantes: 
_. Q 1] an Q —; . 1 0 .. 1 0 
1! 0 2"; 0 5-0 o 1 (43.171) 


dt NT | 1. à k | : 
er] fi 


HT 1 DIRE de: 


(43.172) 


R 
Il 


On peut vérifier que les conditions de linéarisation sont vérifiées par les matrices précédentes: 


- Première condition: 
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PRIE 
Hd -11[o -1] [0 1 
8? =1 — 
: 011 [1 01 
sa LE JT 
De même pour les & 
0 0 0 1f0 0 0 11 [1 0 0 
CRI RER SRE ES 
ä 0 0 1 0 oo 1 o 0! lo o 1 
1 0 0 01 0 o o[ [o oo 
0 0 0 fo 0 0 —] [1 0 
;, [o æf lo o à oo o à ol lo 1 
a-| JÉPRESIRRR EE 
ÿ 0 o oi o o of |[o o 
0 0 1 oo o 1 o][10 
Afin 
87e 0) 11 0 0 oÙ1 0 o ol loo 
o -1 0 oo -1 0 0! [0 0 


La première condition est donc bien remplie! 


(43.173) 


(43.174) 


OS mm © © 


- Deuxième condition (attention aux notations qui dérapent un peu par tradition entre matrices et 


scalaires!): 


+ 


safe FE JE ST 
pe pps pes 


1 0 
-(,7,+9,0, { À PE SE 


AUS 2(9,a,1-210,| 


2 [0 11° 
Si i=1 — 2(9;) 2| | =2i-1" =2 


V1 


_. 3 D: =; . 2 
dl i=2 + 21,} 2). 0 =2i-11 =2 
i 


2 
‘| =2i-17 =2 


1 
i=3 — 219, ” =2 
0 -1 


et: 


( 
+€;0; 


(43.175) 
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S1i= 1 etj=2 

0 11[0 —- 0 —||[0 1 i 0 — 
GT + = | +]. = Le | =0 

1 Os 0 i O1 0 0 — 0 ; 
Hi=lét)i=3 (43.176) 


0 111 0 1 OO 1 0 —1 Q 1 
Go +034 = + = + =0 
1 0110 —-1|] [0 -1{|[1 0 1 0 -1 0 


9,9; +t0;0; =26;; (43.177) 


Donc: 


la deuxième condition est bien remplie. 


- Troisième condition: 


sel. a, O1[0 -1 0 -1115, 0 ag, 0 a, 0 0 0 (43.178) 
La troisième condition est bien remplie. 


En se référant à l'équation de début écrite avec le formalisme de Dirac 


RO Ÿ = HD Y —iho,Ÿ = Emme V+can Y+cpT +capaŸ (43179) 


Avec: 
NU: 0 0 0 1 ( Ô — 0 0 1 0 
8- 0 1 ©  . 0 0 1 0 : ( i : 0 0 O0 —- 
lo o -1 0470 1 0 02" lo à o ol 11 0 0 0! 
Q 0 0 -1 1 0 O0 0 i 0 0 0 0 —1 0 O0 
Ce qui donne finalement: 
YF, 1 0 0 O1 0 0 © 1 y, 
| Y, 210 1 0 01%, 0 0 1 0 y, 
1hO, = Mpe +e Pl + 
Ya 0 0 -1 0 |Y., 0 1 o ol'|», 
Y 0 0 0 -1]w,| [1 0 o o| |w, 
(43.181) 
0 O0 O0 — y 0 0 1 0 YF, 
0 0 à O0 y, 0 0 O0 -1 y, 
€ P2 +c P3 
0 — 0 0 Y, 1 0 0 0 #- 
i 0 0 0 F4 Q —1 0 O0 Fa 


Nous nous retrouvons devant une fonction d'état possédant 4 composantes dans laquelle: 
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Fi LE 

et 43.182 
F, y, ( ) 

sont des spineurs et l'ensemble: 
LÉ 
Fa 
43.183 
A ( ) 
T4 


est donc un "bispineur de Dirac" et nous notons: 
Fi 
Ya 
P = (43.184) 
F3 
Ta 


la "fonction d'état de Dirac". Le lecteur remarquera que nous retrouvons les mêmes concepts que lors de 
notre étude de l'équation de Dirac libre non linéarisée. 


En développant, il vient: 
ha, %=mc VitepiY,-icp, V,top: Y,= 
=mec Yitclp,-ip.l\Y,+tcp,Y, 
ih4,V,=mcY,tcpiY;ticpaV,-cp3 V4= 
=moc?Y,tclpitipal Va -cp:Ÿ4 
ihô,V,=-mcY,tepi V-icpVitep: V,= D 
mc Pto(pi-ip:)Yitep:Ÿ: 
ih4, V,=-mcYVitepiŸiticpa Yi-cp:3%Ÿ,= 
=-mocVitcl pitipilPi-cP3 Va 
(43.185) 


Pour un électron libre, nous savons que la solution est: 


: Ét-por 
PF, | CE?) (43.186) 


Avec le bispineur de Dirac, nous avons: 
” - Et 
Yir,i) =? Derp(- +) (43.187) 


avec: 
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b; 
b 5of 
EF ,qie : [2] (43.188) 
3 
b, 


où À à à, sont les composantes du bispineur de Dirac. 


Nous noterons: 


Y,=à| ] 
s Fe | avec | Jef 2] 1% (2) 
v,-n[] 


(43.189) 


En calculant leurs dérivées par rapport à t: 


ihA,Y, =ih8, Que (2 | ce ( 5e] nf ]-£8,[] 


À 
ih8,Ÿ,-Eb[] G) 
HOT, =Eb |] 
iha,Y,-Eb,|[|] 
(43.190) 


Avec (2) et (3) dans (1), il vient 


Eb[ ]=mcb[ ]+eip-in ia ]+ep,b[] 
Eb,[ ]=me*b,[ ]+eip:+imià[ ]-cp.8,[] 
Eb,[ ]=-mc"b,[ ]+eip, -iniB[ ]+en al] 
Eb,[ ]=-m"b,[ ]+cip, +imlä[ ]-cp,8,[] 


(43.191) 


soit un système d'équations dont les inconnues sont #, à, 3, b4: 


(E-moc")h+0b, -cp;b;-c(pi-ipilb, =0 (a) 
Ob+(E-moc")b;-cipitipilbstep:b,=0 () 
-Cp3b-c(pi-ipilbat(E+mc"]b, +08, =0 () ® 
-c(ptipilh tep:b,+0b,+(EÆE+mc°)b, =0 (d) 


(43.192) 
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Nous aurons des solutions non toutes nulles si et seulement si le déterminant des coefficients est nul (pour 
en connaître les raisons, se référer au chapitre d'Algèbre Linéaire) et donc une infinité de solutions (pour 


les composantes du spineur de Dirac) possibles. Soit: 


E-mc? ( —CP3 —C(p1-ipal 
0 E-m,c° —c(pitipà:l CP3 
CP; -cip-ip:l Etmic? () 
-c(pitipl CP3 ( E+mc? 
(43.193) 
En simplifiant par c: 
= Air Ô T3 —(P17ipPa) 
0 Mae T(P1 Pa] P3 
€ 
=0 
— Pa —-(p1-ipPà) — + c 0 
€ 
T{P1tipal P3 0 mc 
€ 
(43.194) 


La division dans le déterminant précédent permet le calcul des déterminants partiels (cf. chapitre 
d'Algèbre Linéaire): 


[-77 -|p1-ipallpitipa | 


E 2 
F -[ +\D1 -iPallPitipa ] 
[-7? |P1-ËPallP1 té Pa | E 
— +9 € 
c 


-[?3 (min pti ] 
(43.195) 


En résolvant le déterminant précédent, il vient: 


E E ; 2 
E-me][£ 4m | -[ 73 +(p1-ipallpi tip ] 0 
€ € 


E? i a 
L 2 _2 = 2 + 2 _{;: | \ = 
TT Mo € | |P3 [ri (3Pa]l |: 0 (43.196) 
2 
E? 
me) -(p3+pi tp3)=0 
———, —— 


C2] 


D'où la relation suivante: 
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2 .4 2,2 


— — M C =p?&EÆ? “Mic =p'e" (43197 


Les valeurs de l'énergie données par l'équation de Dirac sont donc: 


E=+ mè ct+pic? (43.198) 
Soit: 
PR + pri c' +p°c° 
(43.199) 


E_=- 3 +pic 


Si nous adoptons pour Æ,, deux valeurs constantes pour À, et à,, nous disposons de deux relations pour 


calculer à, et à, soit: 


- Avec (4c): 

-cp;b-cip,-ipilbtlE +mc lb, =0 (43.200) 
Soit: 

c[psh+ipi-ips | 
;= s (43.201) 
E,tmoc 

- Avec (4d): 

-cip,tip,lbtep,btlE, +m,c*ib, =0 (43.202) 
Soit: 


[ir + Palb — Psba | 
b, = (43.203) 


E, +mc° 
N.B: En adoptant à, = 1,8, =0, il vient: 
cp cp clpitipal € 
b, = —— TZ —— D TT 2+ x (43.204) 
E,tmc" E,t+mic E, tmoc E, tmoc 
En prenant les unités naturelles: 
P P 
Ds — D, = (13205) 


= . à = 
E, tm" E,tm, 


En adoptant , = 0,b, =1, il vient: 
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_C(P17iPa) _  œ. _ —CP3  —CPs 


EC DS 24 Un qu nd D du ad 
E, +mc E, tm,c E,tmc" E,+mc 


: (43.206) 


En prenant les unités naturelles: 


Fe 


LA . 


b 
: E, +", 


Si nous adoptons pour £_, deux valeurs constantes pour à;,à, nous disposons de deux relations pour 
calculer à ,à, soit: 


- Avec (4a): 

(ÆE_-mcib,-cp,b,-cip, -ip,lb, =0 (43208) 
Soit: 

h, _c[rst: +(?1 ne. ë,] 0 
E_-myc 

- Avec (4b): 

(E_-m,c)b,-cip,+tip,lb,+tcp,b,=0 (43.210) 
Soit: 


cl-p.,b,+{p, tip,lb 
> [ ner 4 :16 ] (43.211) 


2 
E_-mc° 


Notons, qu'en adoptant à; = 1,b4 =0 , il vient: 


CP Cp ClpitiPal € 
b, = 5 _- RE m —7+ 7 (43212) 
E_-m,c E_-m,c E_-m,c E_-moc 
Avec les unités naturelles: 
Piti? 
b, = Ps RS ee RE 2 Pr 3213) 
E_-Mm, E_ -" E_-m, E_-m, 
En adoptant à; = 0,8, =1, il vient: 
C(P1-iPal cp. ÉD Cp 
Es ? To : ZT < 7 (43214) 
E_-mc E_-moc E_-moc E_-moc 
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Soit avec les unités naturelles: 


Fu 7 Pr 
E_-", E_-", 


Bien que la méthode soit différente, nous retrouvons donc les coefficients des spineurs que nous avions 
obtenus dans notre étude de l'équation de Dirac libre classique. Cela nous rassure donc dans les 
hypothèses posées au début de cette linéarisation et valide ces résultats. De plus, les relations précédentes 
indiquent aussi une dégénérescence d'ordre deux de l'énergie pour chaque valeur de l'impulsion. En 
l'absence de champ extérieur, l'électron libre n'est donc pas influencé par l'orientation de son spin. Nous 
retrouvons donc les mêmes résultats que ce soit pour l'équation de Dirac libre classique ou linéarisée. 


Cependant, l'explication donnée par Dirac pour expliquer les énergies positives et négatives est que son 
équation s'applique non seulement à l'état d'une particule à énergie positive (en l'occurrence l'électron) 
mais également à l'état d'une particule à énergie négative (son antiparticule soit le positron). La valeur 
absolue de ces deux énergies étant strictement égale. 


La présence du signe négatif affectant l'énergie a posé problème à l'époque pour son interprétation (dans le 
cadre où nous omettons la variable du temps puisque nous avions vu lors de l'étude de l'équation de Klein- 
Gordon libre qu'une particule à énergie négative peut être vue comme une particule qui remonte le temps). 


2 


Si nous raisonnons dans le cas où le terme pc? est faible comparé à #%€?, nous nous posons la question: 


comment et quelles sont les conséquences d'une transition entre un état d'énergie #%c? à celui de l'état 


d'énergie -”#9c* avec un saut ("gap") de 2#,€° (nous retrouverons cette valeur lors de notre étude de la 
matérialisation dans le chapitre de Physique Nucléaire). 


Dirac a recours à l'image d'une mer d'énergie négative (puisque rappelons-le, le nombre de solutions à 
notre système matriciel est infini, d'où l'analogie avec une mer plus qu'un contexte discret) dans laquelle 
tous les états d'énergie négatives sont occupés par les électrons et les états d'énergie positives seraient 
vides. Si un électron est soumis à une transition (via, par exemple un photon d'énergie supérieure à 


2m5€° ), il quitte cette mer en laissant derrière lui une lacune (le fameux "trou" de charge positive auquel 


les électroniciens font parfois référence.….). Cette lacune devient une charge positive, d'énergie Æ,. 


L'apparition de cette lacune est assimilée à l'apparition d'une particule ayant une charge positive. Bien 
évidemment, nous pouvons nous imaginer le cas inverse, ce n'est qu'une question de conventions. 


5. ÉQUATION DE DIRAC GÉNÉRALISÉE 


Dans le cas de l'électron libre, nous avons donc maintes fois vu et démontré que l'hamiltonien a comme 
expression 


1 
E={(p'ce?+mèc")? 


Dans le cas d'un électron se déplaçant dans un champ électromagnétique, nous avons aussi démontré lors 
de notre étude de l'équation de Klein-Gordon au début de ce chapitre: 


. 12 
(E-qU)" =(?-g À) c'+mi ct 


Soit: 
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1 
E -[& aâfe+mict[ +qU (43218) 


Bref fini pour le rappel! 


Si maintenant, nous reprenons l'hamiltonien de Dirac pour l'électron libre démontré plus haut (qui est pour 
rappel une matrice 2X2 ): 


H,=cü&op+f£moc? (43219) 


et du fait qu'il faille rajouter à l'hamiltonien le terme de l'énergie potentielle électrostatique via la potentiel 
vecteur, NOUS avons: 


H, =c&s (5 ” gÂ) +qU + Bmpc? (43.220) 
où le potentiel U devra dont aussi être exprimé sous la forme d'un matrice 2X2 diagonale. 


Nous obtenons alors l'hamiltonien de Dirac généralisé sous la forme traditionnelle suivante: 


(AH, -gÜ)=c&o(p -qÂ) + Em, c° (43.221) 


Nous avons donc sous une autre forme connue: 
LS +_f+ + 2 _— 
he =[cae(5-aÀ)+au+ Er IE (43.222) 


6. ÉQUATION DE PAULI 


Considérons maintenant une représentation à deux composantes du spineur: 


F, 
Yir,£) = k “ “| (43.223) 


et rappelons que: 
Il vient alors: 
Soit: 


. à b, ( T - & # ê 1 ( É, 
na] ds re-as ei L An 


Ce qui après simplification donne: 
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To|[p— À 
2%) dl (3 4)4 rau% mel fa | (43.227) 
A8] (coc(5-ad4) * Lé . 


Avant de continuer, ouvrons une parenthèse importante sinon quoi nous n'arriverons pas à trouver une 
solution à ces deux équations. 


Rappelons qu'un des spineurs solutions de l'équation de Dirac libre était donné par (nous l'avons démontré 
plus haut): 


poë 
À = res É (43.228) 
Soit en unités S.L.: 
cpog 
= ———— 7 (43.229) 
E+ Mc? L 


Afin de simplifier le calcul des équations antéprécédentes nous abaïsserons la situation à un cas non 
relativiste, c'est-à-dire lorsque l'énergie de masse est beaucoup plus grande que l'énergie cinétique. Donc 
la solution précédente devient (on oublie la deuxième qui poserait problème...): 


L'idée est alors de trouver une solution telle à: 


, 2[4]_[cae(5-44)4 +] A 
Len PA Ü 43.23 
12%] coo(5-aé)é +g A + #0c . (43.231) 


qui lorsque nous faisons une approximation non relativiste et que nous annulons le champ magnétique (in 
extenso le potentiel vecteur), nous retombons sur: 


L'idée est simple mais il fallait y penser! 


Après maints tâtonnements (eh oui la physique quantique ne s'est pas faite en un jour...) nous trouvons 
qu'une solution particulière satisfaisant à notre idée précédente est: 


| = bu (a (43.233) 
# | Lébo U 


Effectivement: 
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im 
Aù | inctih c&o(p -qÀ) Àoe A dafé le) &o De 
& | 0 c®0|5-qÀ) dos tt %o —%o 
Le 
à a met | ie 2 “mtih _ cé(- 4A) 4o cf auf] Fe À Éo irettiñ 
La ae ve #0 #0 a 
LP 
ch a" mt | Un “mtiñ_ co(s- qAlé gt auf] . 2% } imtif 
1 c®p- g) fe #o —#o 
4 
RER 
à co * = %o %o 


(43.234) 

Nous avons finalement deux équations: 

D m fs .* 

ik Go =c@ (5 -qÀ)40 +4Udo 

0 ne 2 

ih— ho =co'e (5 n qÀ) Éo + 200 — 200" bo 
Maintenant, considérons uniquement la deuxième équation: 

a. (= à 2 _—. 

h— ho =cû0{5-q4)#0 +aUdo - 200 do (43236) 


En supposant (gratuitement! après quoi il faudra comparer aux résultats expérimentaux) que le terme 


[8,4 | est beaucoup plus petit que Pme? nous pouvons écrire: 


0 = c&o(p - gÀ) 0 +40 — 2m bo (43.237) 
En faisant la même hypothèse avec lg Uol nous avons: 


02 cao(5-qÀ)#0 - 2mpc ho (43.238) 
Nous avons alors (ne pas oublier que le dénominateur est une matrice diagonale en réalité.…): 


ho = LE PA (43.239) 
2e 


Or, nous voyons bien que si le champ magnétique (in extenso le potentiel vecteur) s'annule, nous 
retombons sur bien notre idée de départ! Le pari est donc bon! 
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À cause de toutes ces approximations vers le bas, la composante #4, est souvent prise comme étant la 


"petite" composant de la fonction d'onde Ÿ, relativement à la grosse composante #, . 


La première équation: 
0 ms 3 
ne 0 = c&o(p -qÀ) Bo +40 En (43.240) 


peut maintenant être simplifiée facilement en prenant la solution précédente tel que: 
4 ___ [&0,(5-a4 
ik Go Z cT 0 (5- A (6-2) bo +4Ud0o (43.241) 


Soit: 


cd o (F = gA)& o(5 - gA) 


#0 + aU'É 0 (43.242) 
2e 


Ge) 
IR — É9 = 
FA #0 
En utilisant l'identité remarquable démontrée dans le chapitre de Calcul Spinoriel: 
(do4) (ab ) = (acb)1+iSo(axé) (43245) 


Nous avons: 


… 


G(5-a4)6 (5-44) (5-44) +0 0(5-44)x (5-4) 


. Li (43.244) 
= (5-qÀ) + | (1h09 -44)x(-ih0 44) ] 


Détaillons le produit vectoriel en se rappelant qu'il agira comme opérateur sur #0: 


So(hV - 44) x(-hV -44)bo 
=do(-n0xn0)#, +o(-n0 x-g4 do +ao(-gAx h0)#0 + 0(-4Ax-44)6; 
—————— ——————— 


, (43.245) 
— =Û 


= ihg[ae (0x4) do + (4x0) do] 


Or, nous avons (cf. chapitre de Calcul Spinoriel): 


&o(PxA)+e( 4x 0)- 
8,4, - 8,4, (8,4 -8,4,)-i(8,4, -8,4) 

: (2,4 L 8,4) +i(8,4,-06,4) -(8,4, -à,4,) (43.246) 
4,8, - 4,8, (4,8, -48,)-i(48, -4,8,) 

: (4,8, - 48, )+i(48,-4,2,) -(8,4, -8,4,) 
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Intéressons-nous juste à la composante dans le coin supérieur gauche (sinon les calculs sont trop longs) de 
cette somme de matrices. Il ne faut pas oublier que cette composante de la matrice agira sur la première 
composante en tant qu'opérateur sur #,n (notée de même...): 


(8,4, #0 = ê,4, do) + (4, ô, #0 s À, ê, do) 
= (8, (4, do) -2, (4do)) +48, do - 4840) 3247 
= (3, (4, 40) - 4 8, 40) +(48, do - 8, (4 40) 


9, (4, bo) — A, 8, ot É00,4, nd 8, (A, éo) = 4,0, £0 _ É09;4, 
ô, (A, ko) = À, 8, $0 LE #00, À, > À, ô, #0 ü 8, (A, 0) . É0, Fa 


Donc: 
(, (4, do) - 4 8:40) +( 49, do - 2, (4 do))= 408,4 - 409,4, (43249) 


Or, nous reconnaissons ici la troisième composante d'un produit vectoriel n'agissant pas comme opérateur. 
Finalement, il vient: 


So(n0—qÀ)x{ AV -g4)do = o(-hV x-gA do =ihgdo(Vx Ag (13250) 


Soit: 


(5-a4) +80[(h0-44)x (0 -024)]- (5-44) -h60(Vx À) 
(43.251) 
= (5-44) -h@oË 


Ainsi, la relation de la composante principale: 


0, CC 
of 2e 


Devient: 


(5-44) - mas 


bo +4 do (299) 
29 


à 
ih— = 
F7 #0 


Le lecteur remarquera que les notations ne sont pas des plus joyeuses (entre vecteurs, matrices et 
constantes il faut bien suivre pour savoir qu'est-ce qui est quoi là-dedans.….). 


Après réarrangement: 
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ô (5-44) 19 
| _[(B-a4) 
ag fee © 2m 2 


doB+qU Idol (43254) 


ce qui constitue "l'équation de Pauli" et décrit donc de manière relativiste les deux composantes #,1 de 
liberté du spin de l'électron (il s'agit donc en réalité d'un système deux équations). 


L'expression: 


est appelée "terme de Stern-Gerlach" et représente l'énergie d'interaction du champ magnétique avec le 
moment intrinsèque de l'électron (c'est une matrice 2*2 pour rappel). 


L'équation de Pauli, et donc celle de Dirac (puisque cette dernière est plus générale), donnent le facteur 
gyromagnétique correct de £ = 2 pour un électron libre. Pour vérifier ceci, prenons comme il a été fait 
expérimentalement, un champ magnétique constant: 


Nous vérifions facilement que le choix d'un potentiel vecteur correspondant à un champ magnétique 
constant est alors: 


A=-BXxX (43256) 


Ce choix va avoir pour effet de faire disparaître le potentiel vecteur au profit du champ magnétique dans 
l'équation de Pauli, ce qui fera apparaître l'interaction entre le moment angulaire orbital et le champ 
magnétique comme nous allons le voir: 


Effectivement, nous avons: 


2 
Démonstration: 
B,z-B, 8,(8,7-28,x)-8,(8,x-28,2) 
Pa[saxr)- 29 B,x- B,z == 8,(8,z2-8,»)-8,(8,y-2,x) 
B,y-B 
2,(8x-B,z)-8,(8,2- 8) (43.258) 
B,+8,\ (8, 
=-|2,+8,|-|28,|-8 
B,+8B,]) (8, 


Nous avons alors dans l'équation de Pauli: 
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(5-02) 2 (5-484x) rh 05e EI = 


—— (43.259) 


= PP -a(8xr)e? 
Or, rappelons que nous avons vu dans le chapitre de Calcul Vectoriel que: 
(xxÿy)oZ=xo{yxz) (43.260) 
Cela nous donne donc: 


IAP-a(8x#)°5= PP -aBe(#x2)= PP -280£ 261) 


L=#xp (43262) 


noté aussi à (cf. chapitre de Mécanique Classique/Physique Quantique Corpusculaire) est donc un 
opérateur représentant le moment cinétique. 


Nous avons donc: 


En faisant comme l'avait Dirac en définissant l'opérateur spin comme étant la matrice (oh! on retrouve 
quelque chose de connu et vu dans le chapitre de Physique Quantique Ondulatoire!! c'est magnifique 
non?): 

S=—hÈ| (43.264) 


Cette relation nous sera très utile dans le chapitre d'Informatique Quantique. Indiquons la notation 
suivante courante (logique) dans la littérature pour le moment magnétique intrinsèque: 


M= ES (13265) 
2m 0 
L'équation de Pauli s'écrit alors: 
0, [IP _4e5 
| - — -— SoB +qU 43.266 
ôf F0 2 2 Es LCR 


ou encore: 
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0. IF +7 = —_ 
h— do = ne ne (E +25) B+qU do (43.267) 


ou encore en plus condensé en faisant bien attention à bien différencier ce qui est un opérateur, d'un 
vecteur et ce qui est un produit d'un produit scalaire et ce qui est une fonction d'un spineur.. (que du 
bonheur...) et en posant: 


&=2 (43.268) 


ZA 


comme étant le “facteur de Landé" ou "facteur gyromagnétique", nous avons: 


[FE 


= - (4 +gäs)°B+qU ol (43.269) 
2 


avec étant donc le "moment magnétique orbital" (en comparant avec l'expression du moment 
magnétique démontré dans le chapitre de Magnétostatique vous verrez qu'il a effectivement la même 
forme et aussi les mêmes unités), Æ$ le "moment magnétique de spin". 


On retrouve parfois l'expression entre parenthèses dans la relation ci-dessus notée de la manière suivante: 
= fix +gls (43.270) 


Avec tout cela le terme de Stern-Gerlach (moment magnétique) devient donc explicitement: 


- 2 ls q 
= ———}hT = ——$ 29 
M= 8 2mp 2 & 2m (43.271) 
En se rappelant que: 
Xp = en (43.272) 
29 


est le magnéton de Bohr que nous avions introduit rigoureusement dans le chapitre de Physique 
Quantique Corpusculaire, nous avons alors avec cette notation: 


Chose intéressante. le neutron a (observation expérimentale) un moment magnétique de spin non nul et 
pourtant sa charge est nulle. donc il doit être consituté de particules chargées (si l'on reste dans le cadre 
d'un modèle d'explication de la nature par des particules..). Il est intéressant de savoir que dans la pratique 
nous avons pour l'électron, le proton et le neutron: 
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Electron = HE 
Hyroton © 2.19Hp (43274) 


Énatron = —19148 


et les valeurs suivantes ont été mesurées pour les particules de spin 1/2 telles que l'électron, le proton et le 
neutron (attention le signe peut changer suivant la manière dont est notée l'équation de Dirac!): 


Le = 2 
Ep = 3.585 (43.275) 
ge, = 3.826 


Donc la théorie de Dirac dans le cadre non relativiste prédit en bonne approximation que les particules 
élémentaire de spin 1/2 ont un facteur gyromagnétique de 2, et cette prédiction conforme à l'expérience 
pour l'électron est le plus grand triomphe de l'équation de Dirac. Les déviations de la valeur théorique 
(déviations conséquentes!) pour le proton et le neutron sont parfaitement expliquées dans le cadre de 
l'électrodynamique quantique. Ces déviations montrent que la structure du proton et celle du neutron sont 
plus complexes (composition de sous-particules) qu'une particule ponctuelle de spin 1/2 alors que dans le 
cas de l'électron, il semblerait qu'il n'y ait pas de sous-structure. 


Remarque: Le facteur gyromagnétique est pris parfois comme étant négatif mais ce n'est qu'une 
question de convention. 


C'est par ailleurs le terme d'interaction entre le champ magnétique et l'addition du moment cinétique 
orbital et intrinsèque de spin: 


E, = Ai 2)°8 (43.276) 


de l'hamiltonien de Pauli qui donne les valeurs mesurées par l'effet Zeeman! Raison pour laquelle cette 
expression est appelée parfois "énergie de Zeeman" et notée parfois sous la forme d'opérateur 
d'Hamiltonien: 


A, =-T (f+28)8 (4: 
27% 


Nous savons que cette dernière relation peut aussi s'écrire pour toute particule seule (cf. chapitre de 
Physique Quantique Ondulatoire) plongé dans un champ magnétique colinéaire à l'axe Z et nul dans les 
autres directions: 


E,=-(f+eñsloB=- (1425) 2 7 426,18, 
29 279 


= (hi + 26h) B = Th 7 +25)B=-yhim +25\8 = up (ny +2s\B 
7 2.74) 
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où est le"rapport gyromagnétique" et {x le "magnéton de Bohr" (et nous avions vu lors de la 


démonstration de cette relation que le magnéton de Bohr n'est qu'un cas particulier avec le facteur g de 
Landé égal à celui de l'électron). 


Intéressons-nous maintenant seulement à la plus petite variation d'énergie entre deux états du moment 
cinétique orbital (puisque le plus petit pas de varation est de 1 de par la quantification de 1). Il sera alors 
toujours à spin égal de la forme: 

ÀAE,;1=-YhB (43279) 


Cette variation d'énergie sera restituée sous forme d'ondes électromagnétiques correspondant à: 
@æ Fe 
hv=h— =-yhB=-y— B (413.280) 
27 27 


d'où: 
=—YB (43.281) 


qui est la "relation de Larmor" (à ne pas confondre avec le "rayon de Larmor” vu dans le chapitre de 
Magnétostatique). Mais dans la pratique nous utilisons surtout la relation: 


qui donne ce que nous appelons la "fréquence de résonance" du moment cinétique orbital. 


De même, en procédant pour le moment cinétique intrinsèque, nous obtenons à moment cinétique orbital 
constant (lors du transition de spin de +1/2 à -1/2 ou inversement): 


LE, ; =-A(yh2s)B=-yhRBA(25s)=-27hBÂs =-27hB (43283) 


et en reposant £ = 2 il vient: 
d'où: 


et évidemment: 


BE 
V=—£gY—| (43.286) 
27 


Cette dernière étude de variation d'énergie due à l'application d'un champ magnétique et les fréquences 
d'émission d'énergie qui s'en suivent est à la base de la résonance magnétique nucléaire (RMN) qui ne 
marche donc que pour les particules possédant le moment magnétique de spin {4 (par construction de 
l'hamiltonien de Pauli!). 
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La RMN consiste à modifier le moment magnétique nucléaire, autrement dit à faire passer le noyau d'un 
niveau d'énergie à un autre, en appliquant des champs magnétiques à l'échantillon qu'on veut étudier. 
Lorsque l'énergie des photons qui constituent ces champs magnétiques correspond à l'énergie de transition 
d'un niveau d'énergie à l'autre, ces photons peuvent être absorbés par le noyau: nous disons alors qu'il y a 
"résonance nucléaire". 


Nous pouvons caractériser l'énergie de transition du moment magnétique de spin nucléaire en donnant la 
fréquence de l'onde électromagnétique qui permet la résonance. Pour les champs usuels (de l'ordre du 
tesla), la résonance du proton a lieu dans le domaine des ondes radio (100 [MHz] environ): 42 [MHz] dans 
un champ de 1.0 [T] et 63 [MHz] dans un champ de 1.5 [T1]. 


Signalons au passage que dans certains ouvrages, puisque nous avons: 
AE, =-gyhB (43287) 


alors pour une particule avec que deux états de spin possible l'énergie de chacun des niveau est alors 
évidemment la moitié de la différence ci-dessus, ce qui est souvent noté: 


RE B 
Et. =h@ -- 1-2 (43.288) 
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Notes personnelles: 
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44. PHYSIQUE NUCLÉAIRE 


1. L'ARME NUCLÉAIRE 


Sans souhaïiter faire d'amalgame, nous considérons qu'il est indispensable, à l'époque où l'arme nucléaire 
sert de moyen de dissuasion et donc d'élément de stabilité planétaire (mais également de menace de 
destruction...), à la culture générale de l'ingénieur de connaître certaines propriétés élémentaires de la 
bombe atomique à fission. Nous allons donc exceptionnellement dans ce petit sous-chapitre sans 
mathématiques (les développements mathématiques de l'arme nucléaire et des centrales nucléaires seront 
présentés lors de notre étude de la neutronique plus loin) parler un petit peu de cette arme de destruction 
massive qui fascine souvent les jeunes étudiants. 


Certes, nous étudierons plus tard théoriquement comment provoquer une réaction en chaîne divergente 
dans un volume donné. Cependant, il ne faudra évidemment pas s'attendre à acquérir les connaissances 
nécessaires à la fabrication d'une telle arme puisque celle-ci ne fait pas appel uniquement à des 
connaissances de la physique, mais également à de l'électronique, mécanique, chimie, mathématiques, etc. 


S'agissant d'une explosion, l'usage s'est immédiatement introduit de comparer l'énergie d'une arme 
nucléaire à celle d'un explosif courant: le Trinitrotoluène (T.N.T). Ce T.N.T fournit 4'200'000 Joules par 
Kilo, mais les énergies des armes nucléaires sont telles qu'il est plus parlant de les évaluer en milliers de 
tonnes - ou kilotonnes de T.N.T (ultérieurement les armes thermonucléaires représentèrent un nouveau 
bond dans les énergies explosives: l'unité pratique de comparaison est le million de tonnes - Mégatonne de 
T.N.T). 


La fission de 56 grammes d'Uranium 235 ou de Plutonium 239 donne l'équivalent de 1 kilotonne avec la 
fission de 1457! atomes (ce n'est même pas une valeur entière du nombre d'Avogadro!!). 


La première explosion nucléaire expérimentale, à Alamogordo le 16 juillet 1945 - fut évaluée à 20 kt, 
avec une bonne précision car il avait été possible de mettre en place de multiples dispositifs de mesure. 


Celles du 6 août, sur Hiroshima (à Uranium 235) puis du 9 août sur Nagasaki (au Plutonium 239) furent 
d'abord estimées aussi à 20 kt. Ultérieurement, et par étude fine sur les effets de souffle, leurs énergies 
furent respectivement ramenées à environ 17 et respectivement 15 kt. Cela n'en représentait pas moins 
l'équivalent d'un chargement en T.N.T. d'un convoi de l'ordre de 6'000 camions de l'US Army. 


Voici un schéma à la fois intéressant et persuasif des effets d'une bombe atomique (pour information à 
partir d'une vitesse de 220 [km/h] un être humain moyen est soulevé du sol): 
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Figure: 44.1 - Effets d'une arme fission de 1 Mt en fonction de la distance (source: Pour la Science) 

Donc en d'autres termes voici en résumé et en approximations les effets d'une arme à fission de 1 Mt 
explosant à 2'450 mètres d'altitude (tout en sachant qu'aujourd'hui les Américains et les Russes ont des 
armes nucléaires à fusion dont la puissance de feu dépasserait les 50 mégatonnes.….): 


Jusqu'à 1.3 [km], tout est rasé, même les bâtiments en béton armé. Jusqu'à 4.8 [km], la plupart des usines et 
des bâtiments commerciaux sont détruits; les habitations faites de briques et de bois sont anéanties, et 
leurs débris éparpillés. Jusqu'à 7 [km], les ensembles commerciaux de structure légère et les résidences 
privées sont démolis. Les constructions plus lourdes sont sérieusement endommagées. Jusqu'à 9.5 [kml], 
les murs des bâtiments légers sont renversés, les résidences privées gravement détériorées. Le souffle (ou 
surpression) est encore assez puissant pour tuer les personnes qui se trouvent à l'extérieur (explosion des 
poumons). Jusqu'à 18.6 [km], différents édifices sont endommagés, les rues sont jonchées de débris de 
vitres et de tuiles. 10 à 20 minutes après la déflagration, les débris aspirés dans la dépression de la tige du 
champignon atomique, retombent au sol. Suivent 1 à 2 heures après, les débris se situant dans le 
champignon (sa tête). 


La plupart des effets représentés sur le schéma ne sont pas proportionnels à l'énergie. Il n'y a donc pas lieu 
de faire une simple multiplication pour une arme ayant une puissance multiple de celle utilisée pour le 
graphique ci-dessus! 


Remarque: Pour un petit calcul sympathique sur les bombes nucléaires utilisant l'analyse 
dimensionnelle le lecteur pourra se référer au chapitre des Principes de la mécanique où nous donnons 
l'expression de l'énergie d'une bombe en fonction du rayon de sa boule de feu. 


Avant de nous attaquer à la partie mathématique, nous tenons à souligner et à rappeler que nous allons 
nous limiter uniquement aux développements théoriques effectués entre 1890 et environ 1935 (au-delà la 
complexité des théories nécessite trop de pages pour un site Internet généraliste). 
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2. RADIOACTIVITÉ 


Lorsque nous analysons expérimentalement la radioactivité, nous nous apercevons d'abord que le noyau 
n'émet pas ses constituants. Ensuite, nous découvrons de nouvelles forces, qui luttent et dominent à tour 
de rôle. Enfin, de nouvelles particules de matière, et même d'antimatière apparaissent. Le décryptage de 
ces énigmes a fourni une image cohérente du monde infiniment petit dont la radioactivité a révélé 
l'existence, un monde où les lois physiques échappent à une intuition issue de la pratique quotidienne de 
notre monde macroscopique. 


D'emblée, la radioactivité a surpris. Dès 1900, il était connu que les rayonnements émis par l'Uranium et 
ses descendants avaient trois composantes, baptisées: "alpha" (&), "bêta" (Æ) et "gamma" (7) séparables 
par l'action d'un champ magnétique comme représenté symboliquement dans l'image ci-dessous: 


CHAMP MAGNÉTIQUE (2 ed 


Figure: 44.2 - Séparation des rayonnements à l'aide d'un champ magnétique (source: Pour la Science) 


Plus tard, il fut montré que la radioactivité alpha était l'émission de noyaux d'hélium (2 protons et 2 
neutrons) , la radioactivité bêta l'émission d'électrons. De ces observations, il était logique de déduire que 
le noyau était constitué de ces trois types de particules (protons, neutrons et électrons), ce qui n'est pas le 
cas: les constituants du noyau n'ayant été découverts par J. Chadwick qu'en 1932. 


Alors, pourquoi les noyaux radioactifs n'émettent-ils pas des protons ou des neutrons? Comment les 
noyaux éjectent-ils autre chose que leurs constituants? Ces questions doivent être précédées d'une autre, 
sans doute plus fondamentale pourquoi certains noyaux sont-ils radioactifs? La réponse est la même pour 
tous les phénomènes physiques spontanés. La pomme tombant de l'arbre, par exemple: c'est parce que le 
système peut rejoindre un état plus stable en perdant de l'énergie potentielle, l'excédent d'énergie 
s'échappant sous forme d'énergie cinétique, c'est-à-dire sous la forme de mouvement. 


Cette raison explique aussi pourquoi les isotopes n'émettent pas de protons ou neutrons seuls car souvent 
au niveau de la structure quantique du noyau, il est plus favorable au niveau énergétique d'émettre un petit 
noyau ou de changer un neutron en proton (l'étude quantique du noyau dépasse le cadre mathématique des 
sujets traités sur ce site web). 


Définitions: 


D1. Tout élément chimique (cf. section de chimie) est caractérisé par son nombre de protons Z appelé 
"nombre atomique”. 
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D2. Le "nombre de masse" A est par définition le nombre de protons Z sommé du nombre de neutrons N 
de l'élément chimique donné. Aïnsi, ce dernier se trouve entièrement caractérisé si nous connaissons son 
nom ou son nombre atomique Z et son nombre de neutrons N ou son nombre de masse. Nous notons 
usuellement n'importe quel élément sous la forme: 


A 
zAN 


Les éléments chimiques d'une même espèce (même Z) peuvent avoir différents nombres de neutrons N, 
c'est-à-dire différents nombres de masse A, nous parlons alors "d'isotopes" ou de "nucléides" (aujourd'hui 
cela paraît évident comme définition mais il a fallu de nombreuses années de recherche pour arriver à ce 
concept et on le droit particulièrement à Niels Bohr). Les éléments chimiques qui ont le même A sont 
appelées des "isobares". 


Évidemment, l'énergie nucléaire (du noyau) associée à un même élément chimique diffère selon le 
nombre de masse et il existe nous le verrons un nombre À pour lequel l'énergie est minimale. Les isotopes 
pour lesquels l'énergie n'est pas minimum pourront, pour certains d'entre eux et de façon spontanée, 
libérer l'excès d'énergie en se désintégrant. 


D3. La propriété qu'ont certains atomes de modifier spontanément la structure de leurs noyaux pour 
atteindre un niveau d'énergie inférieur, plus fondamental, est appelée "radioactivité". Nous parlons alors 
de "radio-isotopes" pour les atomes concernés. 


Les propriétés chimiques d'un atome dépendent ( ) du nombre et de la disposition des 
électrons dans son nuage. Ainsi tous les isotopes d'un même élément chimique ont les mêmes propriétés 
chimiques (c'est cette caractéristique chimique qui est à la base de la médecine nucléaire). Ce sont en 
quelque sorte des atomes "frères". Cependant, la légère différence de masse de leur noyau fait que leurs 
propriétés physiques se différencient quelque peu. 


D4. Enfin, les "isotones" sont les isotopes de différents éléments chimiques (différents Z) ayant le même 
nombre de neutrons N. 


Plutôt que de parler "d'éléments chimiques" lorsque l'on fait en réalité implicitement référence au noyau, 
on préfère utiliser le terme de "nuclide”. 


La petitesse des atomes pose un problème évident de mesure de masse. C'est pourquoi il a été préféré par 
les physiciens et les chimistes de mettre en place un système de masse atomique qui est un système de 
nombres proportionnels à la masse réelle des atomes. 


Comme il y a une infinité de systèmes de nombres, un a été choisi judicieusement comme référence et 
c'est le chiffre 12 pour l'isotope 12 du Carbone: 


2C' = 12.00000 uma 
où "uma" est l'abréviation de "unités de masse atomique". 


Ceci a pour conséquence intéressante de conférer au proton et au neutron des masses atomiques très 
voisines de l'unité. 


Nous pouvons donc relier le système S.I. (cf. ) avec le système des unités de masse 
atomique (uma). 
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D5. "L'unité de masse atomique" est par définition la masse du 1/12 de l'atome de Carbone É£€, nous 
avons (la masse des électrons est négligée car très faible par rapport à celle des nucléons): 


ee ; 
LD ee — — =1.6605402 10% [g] (423) 
D —_— # 6.0221367 : 10% 


at. 


pour la valeur admise le lecteur devra se reporter à la littérature des normes internationales ad hoc (car 
celle-ci varie en fonction des nouvelles versions des normes). 


Donc la masse du proton en uma vaut: 


__1.6726231:10 * [g] 


1.6605402: 107# [g] =1007276468 uma (444) 
j | E 


Attention, cependant la masse molaire d'un isotope différent que le 2€’ ne peut pas être calculée par 
addition des masses des nucléons (protons et neutrons) qui compose son noyau, car il faut tenir compte du 
défaut de masse (notion que nous verrons plus loin). 


Les masses peuvent être aussi exprimées en unités d'énergie puisqu'il y a équivalence masse-énergie 
comme nous l'avons vu en relativité restreinte d'après la relation Æ =y#e? (cf. chapitre de Relativité 
Restreinte). L'unité d'énergie en physique nucléaire souvent utilisée est "l'électronvolt". 


D6. Un "électronvolt" noté [eV] est l'énergie acquise par une charge élémentaire soumise à une différence 
de potentiel de 1 [VI. 


Ainsi, d'après la relation entre l'énergie et le potentiel électrostatique Æ = g' 2 (cf. chapitre 


d'Électrostatique), nous avons: 
1[e7]= 160217733107 [J]| (445) 


Nous en tirons puisque la vitesse de la lumière dans le vide vaut & = 299792458 [ms]: 


1[g]=8.987551: 108 [7] = 5.60959: 10°? [ev] 
= luma = 93149432 [MeV] 


(44.6) 
Encore une fois, pour la valeur admise le lecteur devra se reporter à la littérature des normes 
internationales ad hoc (car celle-ci varie en fonction des nouvelles versions des normes). 


2.1. DÉSINTÉGRATION 


Certains noyaux possèdent donc la propriété de modifier spontanément leur structure interne pour 
atteindre un niveau d'énergie plus fondamental. Cette transformation s'accompagne de l'émission de 
particules et/ou de rayonnements électromagnétiques. Le noyau résiduel peut être lui aussi radioactif et 
subir d'autres transformations par la suite ou être stable. 


La désintégration radioactive d'un isotope est un phénomène aléatoire et nous ne pouvons jamais dire à 
quel moment un noyau va se désintégrer (probabilité sans effet de mémoire). 
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Remarque: Pour la démonstration de cette affirmation, le lecteur peut se reporter au chapitre de 
Techniques De Gestion dans la partie traitant de la théorie des files d'attentes et en particulier la 
modélisation des arrivées. Effectivement, le développement est en tout point identique mais seulement 
l'objet d'étude change (ce ne sont alors plus des appels téléphoniques mais des désintégrations). Ainsi, 
on y démontre que sous certaines hypothèses le phénomène suit une loi de Poisson et nous y 
démontrons que celle-ci n'a pas de mémoire. 


Nous ne pouvons donner que la probabilité de désintégration par unité de temps. Cette probabilité est 
donnée par la "constante radioactive" et a pour unité l'inverse du temps tel que [ 4] = s"!. Cette constante 


peut être calculée comme nous l'avons déjà vu lors de l'étude de l'effet tunnel dans le chapitre de Physique 
Quantique Ondulatoire. 


La constante radioactive varie pour tous les isotopes connus: 
157108 [s1]<4<3:10$ [sl] (447) 


Soit N(6) le stock d'atomes d'un isotope radioactif au temps t. Le nombre d'atomes se désintégrant durant le 
temps infinitésimal dt est donc égal à: 


ÀA'N(éjdt (448) 
conduisant à une diminution du stock égale à: 
—AN(E)dt (419) 
L'équation différentielle (cf. chapitre de Calcul Intégral Et Différentiel) s'écrit donc: 
dM =-AMNdt (4410) 
ou: 


aN | 3y =0 (44.11) 


dé 


qui a pour solution très simple (cf. chapitre de Calcul Différentiel Et Intégral): 


NO = Neil Gui) 


avec Ÿ, = V6) le stock de noyaux au temps £,. 


Remarque: N(t) ne représente pas le nombre d'atomes restant au temps t mais le nombre le plus 
probable d'atomes radioactifs restant au temps t!! 


Dans la pratique, la mesure de la constante radioactive se fait à l'aide de la décroissance de l'activité (voir 
plus loin) de l'isotope intéressé. 
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2.1.1. DEMI-VIE D'ISOTOPE 


Définition: La "période radioactive" ou de "demi-vie" 7,, d'un isotope est le temps moyen qu'il faut 
attendre pour que 50% du stock de noyaux radioactifs d'un isotope donné soit désintégré: 


N(t=Tn) . 


1 In(2) 
M, ; 


L Put = re = Ta (44.13) 


Nous avons ainsi une relation très importante entre la période de demi-vie et la constante radioactive! 


Si le radio-isotope a le choix de se désintégrer selon deux voies de désintégrations distinctes caractérisées 
7e : à Ére é 1 2 . . Ze pee 

par deux périodes radioactives distinctes %,, et %;,, la demi-vie de ce nucléide est définie par la 

moyenne: 


1/2 
1, 1 (414) 
l 2 
Tia Ti 


et nous calculons le nombre de nucléides restant par la relation: 
NO = Metal (415) 
2.2. ACTIVITÉ RADIOACTIVE 
Définition: L'activité A d'une source radioactive est le nombre de désintégrations par unité de temps. 


Remarque: Son unité de mesure est le "Becquerel" noté [A] =[8g] . 1 Becquerel correspondant donc 
à une désintégration par seconde. 


L'ancienne unité de mesure de la radioactivité était le "Curie" [Ci]. Le Curie avait été défini dans un 
premier temps comme l'activité d'environ un gramme de radium, élément naturel que nous retrouvons 
dans les sols avec l'Uranium. Cette unité est beaucoup plus grande que la précédente car par définition 1 
[Ci] correspond à 37 milliards de désintégrations par seconde: 


1[Ci]= 3.710" [Bg] (416) 
L'activité s'obtient par la dérivation temporelle du stock d'atomes d'un échantillon donné: 


Age = - VO) Le app 380) = ANG) Gain 
dt : 


La relation dite "équation d'activité": 
A=AN (4418) 


montre ainsi que l'activité d'un nombre donné d'atomes N d'un isotope radioactif est proportionnelle à ce 
nombre et inversement proportionnelle à la demi-vie de l'isotope (de par la relation vue plus haut entre la 
constante radioactive et la période de demi-vie). 
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Exemple: 


Un gramme de #84 contient (il faut régulièrement se référer aux normes d'usage pour les valeurs des 
constantes utilisées): 


1[g]-6.0221267.107 [at / mole] 


= 2.664.102! atomes (44.19) 
226.0254 [g/l] 


donc l'activité de ce gramme vaut connaissant 7,, = 1600 années : 


In(2). N- In(2) 


A=AN = a 
Fe 1600: 365.256: 24: 60: 60 


2.664107 =3.66:10" [84] (4420) 


Par le même raisonnement, mous montrons que l'activité au cours du temps suit la même loi exponentielle 
que la diminution du nombre de nucléides: 


At) = 4e #4) (4421) 


avec: 
À = AG,)= AN, (4422) 


Expérimentalement pour déterminer la période de demi-vie d'un isotope radioactif, nous procédons de la 
manière suivante: 


1. Nous choisissons un échantillon pur d'un isotope dont nous souhaitons déterminer la période de demi- 
vie. 


2. Au temps # nous mesurons à l'aide d'un détecteur pendant un intervalle de temps A£ fixé le nombre de 


désintégrations. Nous avons alors le nombre de désintégrations pendant un intervalle de temps en début 
d'expérience (l'unité de la mesure est alors les désintégrations et non pas le nombre de désintégrations par 
seconde). 


3. Ensuite, pendant chaque Â£ consécutif (l'intervalle de temps est fixé) nous mesurons le nombre de 
désintégrations pendant cet intervalle de temps. Cela nous donne donc une série de mesures du nombre de 
désintégrations observées pour Af,,Â£,, ht, 


4. À l'ensemble des mesures de désintégrations effectuées, nous enlevons le bruit de fond du laboratoire 


Puisque: 


En prenant le logarithme népérien nous avons: 
In (A(:)Af) =In(A(G}At)- A(t-4)=-A(6-6)+In(Aft)4t) (429 


Soit: 
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In (A(E)AË) = -4.1'+In(Af)Af) (4425) 


Il s'agit donc de l'équation d'une droite de pente —4 et d'ordonnée à l'origine In (4 (5) Aë) . Ainsi, la 


constante radioactive est immédiatement mesurée et l'on en déduit rapidement la période de demi-vie à 
l'aide de la relation démontrée plus haut: 


2.2.1. DATATION AU CARBONE 14 


Certains éléments radioactifs naturels constituent de véritables chronomètres pour remonter dans le temps. 
Des méthodes de datation ont été mises au point, fondées sur la décroissance progressive de la 
radioactivité contenue dans les objets ou vestiges étudiés. On peut ainsi remonter jusqu'à des dizaines de 
milliers d'années dans le passé avec le carbone 14, voire bien d'avantage avec d'autres méthodes telles que 
la thermoluminescence ou la méthode uranium-thorium. La datation au carbone 14 permet d'aborder 
l'étude de l'histoire de l'homme et de son environnement pendant la période de 5'000 à 50'000 ans à partir 
du temps présent. 


Le carbone naturel est composé de deux isotopes stables: le 2€ (98.892%) et ÊC (1.108%). Il n'existe 
donc pas de “C' dans le carbone naturel. Ce dernier est produit en haute atmosphère par l'action de 
neutrons cosmiques sur le *C'. Nous parlons alors de "capture neutronique" (voir plus loin) ou "activation 
BC'(2,») C'". Ainsi, continûment du “C' est produit en haute atmosphère et se désintègre naturellement 


avec une période de 5'700 ans. Nous nous imaginons aisément que la concentration en “C' s'équilibre 
lorsque le taux de production est égal au taux de disparition suite au processus de désintégration radioactif 
(sinon quoi il n'y aurait plus que du “C' partout). 


Il se forme environ 2.5 atomes de “C' par seconde et par &#° de surface Terrestre (ce chiffre est 
cependant dépendant de beaucoup de facteurs mais en amplitude négligeable sur le très long terme. Vous 
pouvez trouver des ouvrages entiers traitant du sujet), la contribution positive au nombre d'atome de 

#C vaut environ: 


N,=2547R°=128: 10" [atomesis] (4427) 
R étant le rayon de la Terre. 


Ou encore en débit de masse cela représente: 


14 [g /moie] 


a, = 1.28:10° a ——— 
6.0221367: 10" [atomes mole] 


=2.98:10* [g/s] (4429) 


Le taux de disparition est égal au taux de production radioactif, c'est-à-dire: 
-N, = N_=-12810" [afomes/s] (4129) 


Car: 
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a 
di 


0 (44.30) 


Comme le taux de disparition vaut: 


= ]n(2) 


me —_—_—_— "2 = -128 10 [afomes/s] (4431) 
5700: 365.256: 24: 60 : 60 


Nous en déduisons qu'il y a M = 3.32: 10% atomes de “C'. Le lecteur pourra vérifier en divisant par la 
masse de l'atome de “€ que cela fait une énorme masse présente dans l'atmosphère. 


Ce radio-isotope se retrouve sous la forme chimique CO, et pénètre par photosynthèse et métabolisme 
dans le règne végétal et animal. À la mort de la plante ou de l'animal, la teneur en “C reste figée et 


commence à décroître par désintégration radioactive au cours des âges. 


ke + 5 


pa = N=c* (4432) 


La datation n'est donc qu'une simple comparaison entre la concentration en €’ de la matière vivante et 
de la matière morte. De fait, on détermine les activités spécifiques 


Les archéologues peuvent ainsi aisément dater ce qu'ils veulent avec une relativement bonne 
approximation. 


2.3. FILTATION RADIOACTIVE 


Définition: Une filiation radioactive (dite aussi "série de décroissance radioactive" ou encore 
"décroissance multiple") est par définition la stabilisation d'un noyau appelé "noyau mère" en une 
succession de désintégrations. Chaque étape est caractérisée par un état intermédiaire correspondant à un 
radionucléide appelé "nucléide fille" de l'élément mère. Nous avons: 


XX; XX, (1434) 


où le petit symbole * désigne un isotope radioactif donné, #, l'isotope stable de la filiation radioactive de 


l'élément mère X; (les éléments entre deux étant tous des nucléides instables),. 
Exemple: 


Considérons le problème à 2 corps (nous ne nous intéresserons pas aux cas supérieurs excepté sur 
demande). Supposons qu'à l'origine des temps, le premier descendant n'existe qu'en quantité négligeable: 


Conditions Initiales (C.I.) à £ =0: 


ME=0)=M 
M,(t=0)=0 


(44.35) 


La variation de l'élément mère (1) n'est donnée que par une contribution négative, la désintégration de 1. 
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Nous avons: 


dN,=-AMdt (4436) 
avec pour solution tenant compte des conditions initiales: 
MG)=Me" (4437 


La variation de l'élément descendant (2), c'est-à-dire la fille de 1, est donnée par une contribution positive 
(les atomes de (1) désintégrés) et une négative, la désintégration de 2. On a: 


aN, = +AMdt - A Ndt 


= TE + AN, = +AM = Me * 


(44.38) 


il faut donc résoudre cette équation différentielle (cf. chapitre de Calcul Différentiel et Intégral). 
Nous avons comme solution homogène (équation caractéristique ECAR): 


aW, 
— + À, M, = 0 (443239) 
F A, 


Nous tirons la solution de l'équation homogène comme: 

Ni =Nie%* (440) 
avec la lettre h pour signifier qu'il s'agit de la solution “homogène”. 
Déterminons maintenant la solution particulière de: 


aN. 
ea AN, = ANe* (4441 


La démarche consiste à poser que: 
NT (si) = Mer (44.42) 
avec la lettre p pour "particulière". En substituant nous trouvons: 
= = _ À f At 
An (a tr) à (Me) A Aa) 
(44.43) 

> À, =À 

Car si nous avions À, = À nous aurions une égalité nulle ce qui est absurde et nous avons dès lors: 
ANS + ANS = AM (4444 


d'où nous tirons que: 
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W 
N; = M, (44.45) 
À À 
Finalement la solution générale est la somme de la solution homogène et de la particulière, ainsi: 
W, 
MN, (€) = Nie7* 4 M ous (44.46) 
ù es 
À 
Appliquons les conditions initiales: 
AM 
t=0,M(t=0)=0= MX = A5, (44.47) 
4 À 


Finalement nous avons: 


AM 5e 
NE = ———©{e # —0 #)) (4448) 
10" al 


Nous laisserons le soin au lecteur de tracer les graphiques de: 
M 
MG) = Me"? et N,( = 2e -e"#) (4449) 


pour voir l'allure que cela à s'il en ressent le besoin. 


W, (£) étant nul pour £ = 0 et pour £ = © , obligatoirement il passe, comme l'activité À, (£), par un 
maximum. Soit £ * le temps où le maximum est observé, nous avons: 


| _ 2%] si AM, = ar" gr 
dé ke dé | Let Â É ) (44.50) 


= (-4e #" + 4e) = 0 


d'où: 


La connaissance de # * est importante en particulier en médecine nucléaire où nous désirons administrer le 
produit 1 à des fins radiodiagnostiques et minimiser les effets néfastes du/des produit(s) fille(s) de 1. Nous 
choisissons alors des produits tels que le temps #£ * soit supérieur au temps d'élimination biologique (voies 
d'élimination naturelle de l'organisme) de sa fille. Nous y reviendrons d'ici quelques paragraphes après 
avoir étudié les trois scénarios classiques de la filiation radioactive: 
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2.3.1. ÉQUILIBRE SÉCULAIRE 


Ce type de relation entre activités mère et fille intervient quand la demi-vie du noyau mère est beaucoup 
plus grande que celle du noyau fille. En d'autres termes, la décroissance du noyau mère est négligeable et 
l'activité du descendant tend vers celle du parent. 


Nous avons alors dans ce cas particulier: 
À & A (44.52) 


Donc nous avons pour l'activité en utilisant la relation précédemment démontrée: 


ÆAA M —À At AA —À At 
No (0 = Ant) = 2 fe #4 - 2h fr 
À 2 2 FRE (e e | FRE (e 2 ] ue 


AE He 
Donc: 


A(6)= A, fe Ê -e#) (44.54) 


Nous voyons aussi que dans le cas où À À, et £ — +0, nous avons: 


en d'autres termes, les activités mère et fille, deviennent équivalentes après un certain temps suffisamment 
grand. Par exemple, après un temps d'une demi-vie de l'isotope fille, nous avons déjà l'activité fille qui est 
égale à 50% de celle de l'activité mère: 


À 3 


A(An)= 4e M=—A (4456) 


1 
s. 
Si nous avons le cas où l'approximation suivante est acceptable: 


A1Z=0 (4457) 
nous aurons alors: 
A()= À, (1- ec) 


2.3.2. ÉQUILIBRE TRANSITOIRE 


Ce type de relation entre activités mère et fille intervient quand la demi-vie du noyau mère est plus 
grande que celle du noyau fille (mais pas beaucoup beaucoup plus grande contrairement au cas de 
l'équilibre séculaire). En d'autres termes, la décroissance du noyau mère et l'activité des descendants sont 
égales à un facteur constant près (en d'autres termes, leurs courbes de décroissance radioactive sont 
parallèles après un temps suffisamment long). 
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Nous avons alors dans ce cas particulier: 


À <ÂD (4458) 


Donc nous avons pour l'activité en utilisant la relation précédemment démontrée: 


AN Ô = A (6 = _” É.= ec) = MES = ex) (44.59) 


%-À %- A 
Après un temps suffisamment long, il vient: 
PNG A ar = y (44.60) 
%-À %- À 


où nous voyons que le facteur: 


2 
Co 


est supérieure à l'unité. Donc après un temps suffisamment long, non seulement l'activité de l'isotope fille 
est parallèle à celle de la mère mais en plus elle lui est supérieure. 


(44.61) 


2.3.3. NON-ÉQUILIBRE 


Ici le temps de demi-vie de l'élément-fils est supérieur à celui de l'élément mère. En d'autres termes nous 
avons l'hypothèse: 


ÀA1>A (4462) 


Ceci implique pour rappel que la probabilité de désintégration de l'élément mère (1) est supérieure à celle 
de l'élément fils (2) ce qui est logique ici. 


L'activité de l'isotope fille croît alors dans l'échantillon suivant la relation démontrée juste plus haut: 


A(t)= (ts _ ex) (44.63) 


Finalement, après un temps suffisamment long, seule l'activité de l'élément fils restera, puisque l'activité 
de l'élément mère disparaît à un taux plus élevé selon: 


Aoe 4 (4) À Ac" 


2 7 À 


Après un temPS Émax ; l'activité de l'élément fils atteindra une valeur maximale pour: 
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dE) _ à AA, (+ “ht e#)|- AA, TL fe #1) 
dt | dl -À; LA À dt 
(44.64) 
AA, | : e À e**) 
En 
Soit: 
ET au 3e * #) = 0 (4465) 
Ca 
Ce qui se simplifie en: 
A * F = 1 7 (44.66) 


Il vient alors immédiatement le résultat déjà démontré lors de l'exemple présenté plus haut: 


1 
Lux = in [2 (44.67) 
AA (A 


Enfin, considérons le cas extrême de la situation de non-équilibre qui consiste à considérer le cas où: 
A =0 (44.68) 
En d'autres termes que l'élément fils n'est pas radioactif. Nous tombons alors sur le cas classique: 


no É_ At | > 


4O=T Fr 


(44.69) 


2.4, PHÉNOMÈNES RADIOACTIFS 


Lorsque nous "pesons" un noyau, nous constatons expérimentalement un fait très important!: sa masse est 
inférieure à la somme des masses de ses constituants. Cette différence est appelée le "défaut de masse" et 
est relativement bien déterminée avec des modèles théoriques simplificateurs. 


Le défaut de masse est alors donné par définition: 

An=2'm,+(A-Z)' "M — Myyms (44.70) 
avec #wyy étant la masse du noyau dans son état fondamental, #, la masse du proton et >, la masse du 
neutron. 


La masse d'un ensemble de nucléons liés est inférieure à la somme des masses des nucléons isolés 
(suffisamment éloignés en tout cas pour ne pas interagir). Nous tirons de la relativité restreinte (voir 
chapitre du même nom) que: 


1 & 
Ame Moon (44.71) 
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où A est l'énergie de liaisons des nucléons composants le noyau (>0). 


{mn est donc positif pour tous les éléments (émission d'énergie et donc de masse vers le système 
extérieur). Si tel n'était pas le cas, les nucléons n'auraient aucune raison de se mettre ensemble afin de 
former naturellement des noyaux stables (ou plus stables.….). 


Soit À = f(4,Z) l'énergie moyenne par nucléon d'un atome donné. Nous avons: 


LEZ, + AN m8 — Moy (A, Z)]' € 
A 


Ua 


(44.72) 


qui est donc par convention une valeur positive! 


Remarquons que la masse du noyau est reliée à la masse de l'atome par: 


Mg CZ: À) = Puma (ZA) + Z'M,| (44.73) 


De même, la masse du noyau ajoutée à la masse de ses électrons isolés est supérieure à celle du noyau 
entouré de son cortège électronique. Notons que l'énergie de liaison électronique peut être souvent 
négligée à celle d'origine nucléaire et c'est une règle que nous adopterons tout au long de ce chapitre. 


Cette énergie dégagée lors de la fusion, c'est-à-dire lors de la constitution de l'atome à partir de ses 
constituants, s'appelle aussi "énergie de liaison" (appellation qui pose souvent des problèmes 
d'interprétations aux jeunes étudiants) car c'est elle qu'il faut fournir si nous voulons, en sens inverse, 
séparer les éléments. Il ne faut jamais oublier que derrière le terme "énergie de liaison”, il y a donc la 
variation d'énergie entre les éléments isolés et les éléments combinés d'un élément atomique. 


L'expression générale pratique de l'énergie moyenne par nucléon d'un atome donné exprimée en unités de 
masse atomique est alors: 


__ [Z:1.00727647 + N°1.008664904 - m»,., (4, Z)] 
E- RE SERRES 931.49432 [MW] (4474) 


Les principes de production d'énergie nucléaire de la fission ou de la fusion résultent de la forme de 
l'énergie moyenne par nucléon en fonction de A. 


Nous avons en réalité la courbe suivante reliant l'énergie moyenne par nucléon (c'est-à-dire la variation 
d'énergie moyenne entre le nucléon seul et accompagné...) et le nombre de nucléons appelée "courbe 
d'Aston"”: 
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Nombre de nucléons ou nombre de masse 
Figure: 44,3 - Courbe d'Aston 


où nous voyons qu'à partir du Fer (élément qui est donc le plus "collé" et le plus stable en termes 
énergétiques car ayant la plus forte énergie de liaison moyenne) l'énergie moyenne diminue à nouveau. 
Cette diminution étant due au fait qu'à partir d'environ 70 nucléons il semblerait que la force 
électrostatique à l'intérieur du noyau commence à prendre le dessus sur une autre force qui règne dans les 
noyaux à très petite échelle (cette force sera nommée plus tard la "force forte" ou "interaction forte"). 


Au fait, ce qui est vraiment très important de remarquer dans le graphique ci-dessus c'est qu'il y a un point 
de flexion et que c'est celui-ci qui permet d'obtenir de l'énergie aussi bien avec la fusion, qu'avec la fission 
nucléaire! Nous voyons également que la variation est beaucoup plus grande sur la gauche que sur la 
droite, d'où le fait que la fusion libère des énergies beaucoup plus considérables. 


Des phénomènes de radioactivité, nous en distinguons 8 dont certains sont qualifiés de "secondaires" car 
n'étant que les effets secondaires possibles des 6 premiers. Certains de ces phénomènes sont provoqués 
par l'homme, d'autres sont naturels et les autres sont purement probabilistes. 


Voici un diagramme représentant en haut la "vallée de stabilité" des atomes et isotopes et en bas la même 
vallée mais mettant en évidence le type de désintégration: 
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Type de désintégration 


M 105 HE stable 

Fi 1025 el. capture (beta+) 

fi 105 beta - emission 

3 1045 alpha emission 
105 # proton emission 
1065 neutron emission 
107 spontaneous fission 
107155 unknown 

M 105 M1: 


unknown 


Figure: 44.4 - Vallée de stabilité 
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Voyons donc les types de désintégrations ou modifications de la structure de l'atome/noyau qui sont 
possibles dans les détails: 


2.4.1. FUSION NUCLÉAIRE (1) 


Si nous assemblons deux noyaux légers F4 et ré d (Az £ 4) pour former un atome "lourd" ps , alors 


conformément à la partie gauche de la courbe d'Aston vue plus haut, nous augmentons le défaut de masse 
puisque l'énergie moyenne par nucléon augmente. En effet: 


- l'énergie de X vaut: 

Az 'B(Ay,Zy) = AyBy (44.75) 
- l'énergie de Y vaut: 

Ay' B(Ay,Zy) = AyBy (44.76) 
- l'énergie de Z vaut: 

A 'B(4,Z3) = AzBz (4477) 
Comme: 

B, <B,<B, (4178) 
alors: 
ÂE = A,B, -(AzBy + AyBy)| (44.79) 

est strictement positive. 


La fusion nucléaire est quasi exclusivement provoquée par l'homme (sur Terre en tout cas. car les étoiles 
la font toutes seules avec l'aide de la gravité). La probabilité d'observer une fusion nucléaire naturelle dans 
des conditions normales de température et de pression est tellement faible qu'il est inutile d'en parler du 
moins à ce jour... 


2.4.2. FISSION NUCLÉAIRE (2) 


De même, si nous cassons avec des moyens adéquats (souvent avec des neutrons car pour s'approcher du 
noyau et vaincre sa répulsion électrostatique c'est le moyen adéquat. c'est celui qu'utilisent les centrales 


nucléaires et les bombes nucléaires) un atome . lourd en deux atomes légers 14 et 


22 (4 £ 4) nous augmentons aussi le défaut de masse et l'énergie gagnée vaut: 


AE = (A,B, + AB) - AyB,| (44.80) 


Que ce soit dans le cas de la fission ou de la fusion, l'énergie dégagée se répartit alors en énergie cinétique 
des produits de fission, des neutrons émis et enfin des divers rayonnements. 
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Remarque: Un atome est dit "fissible" quand il faut des neutrons rapides pour produire la fission et 
"fissile" quand il suffit d'avoir des neutrons lents pour la fission (ce qui est plus rare). 


L'énergie nucléaire est de loin une forme d'énergie beaucoup plus concentrée, puisque 1 kilogramme 
d'uranium naturel fournit une quantité de chaleur de 100'000 [kWh] dans une centrale électrique courante, 
alors que 1 kilogramme de charbon fournit en brûlant 8 [kWh]. C'est pourquoi on ne manipule que d'assez 
faibles masses de combustible nucléaire pour la production d'électricité: une centrale électronucléaire 
d'une puissance de 1'000 [MW] électrique consomme par an 27 tonnes d'uranium enrichi, le quart de son 
chargement, alors qu'une centrale thermique de même puissance consomme par an 1'500'000 tonnes de 
pétrole. Pour comparaison dans le soleil, 1 kilogramme d'hydrogène produit, par réactions nucléaires le 
transformant en hélium, 180 millions de KWh! Mais attention, industriellement nous ne savons extraire 
qu'une faible part de l'énergie nucléaire emmagasinée dans la matière. Sur les 27 tonnes d'uranium enrichi 
consommé en une année par une centrale, seule une petite quantité de noyau a été réellement consommée 
(d'où la nécessité économique de retraiter l'uranium après utilisation). 


Nous nous rendons vite compte que le pouvoir calorifique de la fission est gigantesque par rapport à celui 
des énergies fossiles. Une estimation donne un rapport d'énergie dégagée par atome de 50'000 millions !!! 
Par contre le rapport de risque en termes d'exploitation et de gestion des déchets et d'impact sur 
l'environnement est de l'ordre du même facteur mais dans le sens inverse. C'est pour cette raison qu'il 
faut que l'humanité trouve soit une autre manière de produire de l'électricité, soit change ses habitudes de 
consommation. 


Nous trouvons pour information en Suisse, rien que 5 centrales nucléaires (au début du 21ème siècle) pour 
une population de -6 millions d'habitants (figure ci-dessous): 


Les centrales LEIBSTAOT 
nucléaires de 
la Suisse 


Centrale Type de réacteur 

Beznaut eau sous pression 3 290 milliards de kw 

Bezrneu ll eau sous pression 2.567 miliscds de km 

Muhieberg eau bouillante 2.768 milliards de kw 

ge L ur 5 

Leibstadt eau bousllante 9.089 milliards de kW 
Figure: 44.5 - Centrales nucléaires en Suisse à la fin du 20ème siècle 


eau sous pression 7 7.270 milliards de kim 


Cette petite introduction étant faite, revenons à la partie purement mathématique: 


Dans le cas de la fission spontanée (ou naturelle) nous avons émission de deux produits de fission et de w 
neutrons. Ce que nous notons: 


A M4 A-M-w 1 dE 


Exemple: 
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L'isotope du Carbone 15 par fission spontanée donne un isotope de l'Azote avec émission d'un électron et 
d'un antineutrino: 


PC PN+E +0 (4482) 
2.4.3. DÉSINTÉGRATION ALPHA (3) 
Définition: Lorsqu'un noyau lourd contient trop de protons et de neutrons (comme l'Uranium 238 par 
exemple), il va vider son trop-plein de nucléons en émettant une particule alpha (noyau d'hélium composé 
de 2 protons et deux neutrons) et le système final qui sera un nouveau noyau aura une masse plus faible et 


éventuellement stable. Ce mode de désintégration est la "radioactivité alpha". 


La probabilité de désintégration est gouvernée par le mécanisme de barrière de pénétration (effet Tunnel) 
comme nous allons le démontrer un peu plus loin après une petite introduction. 


La décroissance radioactive selon la radioactivité alpha, peut être schématisée comme (avec quelques 
petites variations selons les cas): 


A 4-4 4 
ZA  z2Ama t2@ (44.83) 


jd= Het (484) 
Exemple: 
Ra — Po+tat+Y (4185) 
L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse: 
Q.=(M,-My;-My)'e (4486) 


avec À, étant la masse du noyau initial, Æf, la masse du noyau final et A, la masse du noyau 
d'Hélium. 


En négligeant l'énergie de liaison des électrons, nous avons: 
My = M, + 2m, et My = My +(Z — 2), et My = Mrs + OM, (44.87) 


Finalement: 


= , 2 leje] 
O, =(Miy — My — Myp)'C"| (44.88) 


Cette expression montre que l'énergie des particules & est bien définie pour des noyaux initiaux et finaux 
donnés. De fait, nous observons en réalité un spectre énergétique discret. Nous en concluons que ces 
émissions mènent le noyau à des niveaux d'énergies intermédiaires correspondants à des états excités du 
noyau final. Nous pouvons expliquer ces observations par une structure nucléaire en couches. La 
désexcitation du final se faisant par émission de photons Ÿ. 
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La conservation de l'énergie impose que l'énergie de la désintégration # se répartit entre l'énergie 
cinétique des deux produits résiduels. 


Q, = ER + En = mé 


l 
LV Sax (44.89) 


La conservation de la quantité de mouvement nous donne: 
Paoyas  Poves Vaoys Pa  MaVa (44.90) 
et donc: 


P7 
Vues = ——V, (4491) 


#apau pes 


que nous remplaçons dans l'équation de conservation de l'énergie: 


Ca TT Pugur Te Va + mi - ÊS | L Le 
2 Pyoyas 2 Myoyas 2 2 | 
(44.92) 
milite te | gere 
2 Fuoyau Fan 
et on en tire que l'énergie de la particule & vaut: 
[01 Q, 0. A 
AR mes + PTT 93) 
1+ ui #epau & (44.93) 
Fugyau PE syau 


vu que les masses du noyau et de la particule & sont environ proportionnelles à leur nombre de masse, 
soit À et 4 respectivement. 


Voyons les détails du mécanisme de la désintégration & avec une approche scolaire, simplifiée à 
l'extrême et donc approximative (mais suffisante quand même). Pour cette approche, nous allons utiliser 
les développements sur l'effet tunnel que nous avons effectué dans le chapitre de Physique Quantique 
Ondulatoire. 


Pour des noyaux ayant un nombre de nucléons devenant trop important, la répulsion coulombienne entre 
protons prend des valeurs significatives par rapport à l'interaction forte qui assure la cohésion du noyau. 
On assiste alors au phénomène de saturation, qui donne lieu à la désintégration & qui est un cas 
particulier d'une fission spontanée. 


Gamow a proposé une explication théorique à ce phénomène en 1928. Il suppose que la particule 
& préexiste dans le noyau et cogne sur les parois. Elle a alors une probabilité non nulle de franchir la 
barrière de potentiel du noyau par effet tunnel. 


Si par la pensée nous débranchons les interactions coulombiennes, une telle particule & est liée au reste 
du noyau par un potentiel nucléaire de courte portée r et de profondeur correspondant à une énergie 
potentielle que nous allons déterminer. 
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Schématiquement dans le cas de l'Uranium 238 la situation est considérée comme la suivante: 


1 
on 


3 


ÉNERGIE 
(EN MILLIONS D'ÉLECTRONVOLTS) 
un 


_ 
a o 


o 


Figure: 44.6 - Représentation de l'idée de Gamow (source: Pour la Science) 


En physique classique on représenterait l'émission & comme la fuite du noyau à partir du noyau. Cette 
représentation n'est pas valable, car elle implique que la particule &, subissant la répulsion électrostatique 
du noyau résiduel de Thorium 234 ne s'en éloignerait que moyennant une énergie d'environ 25 [MeV]. Or 
on ne retrouve la faible valeur observée expérimentalement (de seulement 4.2 [MeVT) qu'en faisant appel à 
la physique quantique. 


Bon passons à la partie mathématique: 


Branchons la répulsion coulombienne entre la particule & de charge +2e (deux protons et deux neutrons) 
et le reste du noyau, alors de charge +(Z-2)e à l'extérieur du puits de potentiel nucléaire. 


Nous obtenons alors l'expression de l'énergie potentielle (cf. chapitre d'Électrostatique): 


1 (Z-2)e.2e 1 2(Z -2)e? 
En = ———— ————————— = ——————  ——— 
Â7E) r 470 Fr 


(44.94) 
où rest la distance entre le centre du noyau et la particule &. L'énergie potentielle diminue donc avec la 
distance puisque la force est répulsive. 


Maintenant, ayons une approche qualitative du phénomène. Nous allons maintenant noter la probabilité T 
de passage comme étant proportionnelle, selon nos résultats dans le chapitre de Physique Quantique 
Ondulatoire, à: 


2ME + — En) 
= EXP I —— (44.95) 


T œe 2 


en sachant qu'il s'agit suite à nos approximations d'une borne inférieure indicative. 
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Si nous modélisons la barrière de potentiel du noyau par un profil non rectangulaire tel que présenté ci- 
dessous: 


Figure: 44.7 - Profil de barrière non rectangulaire du noyau 


où nous remplaçons le profil réel de la courbe par une série de barrières d'épaisseur Âx et où le potentiel 
est égal à £,4(&) au point é,. 


La probabilité de passer une barrière sera donc proportionnelle à: 


2 
 œ exp (-52x fm(s, (£)- B)) (44.96) 


et nous savons (cf. chapitre de Probabilités) que la probabilité de passer une des barrières est un 
événement indépendant (mutuellement exclusifs). Nous pouvons donc multiplier les probabilités tel que: 


T & exp (z- £ax Pme, (£)-E,, ] (44.97) 


et en passant à la limite il vient: 
21 
Tœexp| [ 2m(E,, (2) Ex] (4496) 
% 


et si x est assimilé à un rayon d'une configuration à symétrie sphérique: 


T œ& exp - :] 2m(E,n (rie | (44.99) 
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Dans le cas d'un noyau &, la barrière de potentiel va de ñ où elle commence jusqu'à >; valeur où la 


barrière est considérée comme négligeable. 


Or, l'énergie potentielle du noyau & en tout point distant r de l'extérieur du bord du noyau de l'atome 
radioactif sera égal, comme nous l'avons vu un peu plus haut à: 


1 2Z-2)e 
E a (7) = nn Cr (44.100) 
Nous avons donc pour ñ £r £7;: 
L o,2 
En - Egg , Gaso 
47E Fr 


Pour déterminer Æ,, du noyau & émis, il faut savoir que son énergie totale est supposée conservée dans 
ce modèle simplifié. Elle est donc la même avant son passage dans la barrière de potentiel nucléaire 
lorsque ñ £r, pendant, et après 7; . 


De plus, dans ce modèle, l'énergie cinétique aussi est supposée constante lorsque r £7;,. Autrement dit, 


puisque le noyau & préexiste dans le noyau de l'atome radioactif, il a déjà la vitesse finale qu'il aura lors 
du point de franchissement de la barrière du potentiel nucléaire. 


Donc sous toutes ces hypothèses très simplificatrices. si nous savons déterminer l'énergie totale du noyau 
& en 7; (par exemple), à la sortie de la barrière, nous avons son énergie totale lors de l'ensemble du 
phénomène de traversée de la barrière. 


Réciproquement, son énergie totale nécessaire pour sortir en >; de la barrière de potentiel par effet tunnel 


en partant du noyau (et partir ensuite loin à l'infini et gagner en énergie cinétique et perdre toute son 
énergie potentielle coulombienne) est la même par hypothèse que l'énergie totale obtenue en calculant le 
travail de la force qui d'une distance infinie du noyau de l'atome radioactif ramènerait le noyau & à la 
vitesse précitée au point de sortie minimal >; (rayon minimal de sortie pris comme constant car très 


éloigné en ordres de grandeur par rapport au noyau de l'atome radioactif). 


Ce qui correspond alors à la différence d'énergie potentielle entre un point à l'infini et 7; . Et comme 
l'énergie potentielle est nulle à l'infini pour un système répulsif, il ne reste plus que le terme: 


1 2(Z - 2)e? 
AE) Fr 


Et finalement: 


LL A2 Det 1 22-3% 2G-Me ll | 


470 Fr AE Fr 470 Fr F5 


valable toujours que pour ñ £r £r; (c'est comme si pendant la traversée de la barrière, le noyau 
& restituait de l'énergie cinétique au vide au fur et à mesure de son approche du point 7; , ceci dit, en 
physique quantique on ne peut pas utiliser l'interprétation de la mécanique classique). 
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Me INA era EN EAVEIR [SCIENCES.CH] 
Or, très souvent dans les laboratoires, r; est exprimé comme une constante suffisamment loin du noyau 
de l'atome radioactif. Il est alors relativement naturel (même si c'est du bricolage) de prendre r comme 
variable d'intégration tel que: 


r. = 2 2} 
T & exp Ch mt CAN ss _ dr |=exp| -2— — _ dr | (44.104) 
r* ( 
r r k k 


ñ AE 


et il est de tradition de prendre ensuite: 


_ 2 
EU ts 
k 47E 


ce qui nous amène à: 
r. 
2y 


T & exp Ba 
Ver 


di F5 


11 
F-L}e (44.106) 


Faisons maintenant le changement de variables (la dérivation du c652x est détaillée dans le chapitre de 
Calcul Différentiel Et Intégral): 


dr d cos?u 
= P———— =-r"2cos{u)sin(s) (44107) 


d'où: 
dr =-r2cos{u)sin(u)du (44.108) 


et en notant: 


2 ñ 
COS" &g = — (44.109) 
2 


L 

£ l 
[ La (44.110) 
ñ Fr 


L'intégrale: 


devient: 
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1x -j la -j ft l-cos jé En udr 


r | 
= re Lhenit SLR nt — 


mc (-r2cos(u)sin(}du) (44111) 
: 4 cos? u Ve à COS 5 ñ COS 
LA 
22 sin? (u du = fs] sin? (4 )du 


É ñ 


Concernant les bornes nous avons pour rappel: 


r ñ 
cos? 1 = —, cos? Lg — ue (44.112) 


F2 Le 


Donc si r vaut ñ nous écrivons la borne comme étant x, et si r vaut 7; alors: 


. 
cos u = 2=1—y-0 (44.113) 


rm 


Il vient alors: 


Fa (l 4 
[ F- Le _ -2,f; ] sin? (u du = 2 | sin (du (44.114) 
ñ Fr F LA Ô 


Nous avons vu dans le chapitre de Calcul Différentiel Et Intégral: 


É = [ain* xar = 2 (- cos xsin” xt Di) (44.115) 
% # 


Donc: 
. 2 1 
L = [sin xdx = —(-cos xsin x +1, 
2 (44.116) 

À = [sin° xdx = [ar= x 

Alors: 
. 2 l l | 
L = [sin xdx = 3 cos xsin x +49) = > cosxsinx+x) (44.117) 

Ce qui fait: 


ty 
2. | sin? (u)du = 2,/r, {cos x sin x+x)f7 = Ar (cos xsin x+ x)? 
Û 2 (44.118) 


F [(-cosu, sinu, +u,)-(-cos0sin 0+0)]= Ja [(- COS, int, +ü, )| 
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Or, nous avons aussi (cf. chapitre de Trigonométrie): 


sin(2n)=2sinupcosug (44.119) 


Donc: 


DA : D 
2 Jante (LC, |. EC) (44.120) 
0 


2 


2 ñ ñ 
COS Ug=—— Up = ArCcos| |— | (44121) 
"2 F2 


Si nous développons en série de Maclaurin (cf. chapitre de Suites et Séries) jusqu'au premier ordre: 


Rappelons à nouveau que: 


Or, r, æ n doncn/r =0. 


Lg & ArcCOS (0) + = "}?@;% 2 ne + 
il an 2 ñ ñ 2 ñ F5 
ln ee L (44.122) 
"à 2 2 
CLR LE AU Le Li LENS Li 
2 nn Nain 2 r 
Alors: 
OS Li 
y =—— |[— (44123) 
2 F5 


Nous avons alors: 
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(229 sin (22) LE 2) (fs z)) 


PL € 5 


EE dont a) 
ME ER ET) 


Si on prend le développement de Maclaurin au premier ordre: 


É 72 
Donc: 
(249 —sin(2u9)) Æ fn 1. r Æ  Îñ 1 ñ 
Le eo TE RE ef 
2 V2 2 %Ÿ" 2 F 2 2 VYrn 2 Fr 


Donc tout cela pour écrire finalement: 


r 
| L 
T &œexp|- 2 F-L}a = EXP (5-21) = EXP fr-af) (44.127) 
-Z Wa & PC 72 
Soit explicitement: 
1 [m4(Z - 2)e? 
œ exp| -— mt A À J-4 3 (44.128) 
À AE F5 


Relation dans laquelle nous pouvons remettre le coefficient de l'exponentielle que nous avions déterminé 
dans le chapitre de Physique Quantique Ondulatoire. C'est le facteur exponentiel dans la relation ci-dessus 
qui explique la grande variation des périodes radioactives des différents nuclides, alors que l'énergie des 
particules varie elle relativement peu. 


] 


Typiquement pour le noyau d'Uranium #7; , nous prenons les valeurs dans les tables des constantes 
physiques et universelles qui sont dans la relation précédente pour obtenir une certaine valeur de T (je 
m'abstiendrai de montrer le calcul car les tables ne sont pas toutes d'accord entre elles...). 
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Ensuite, dans l'approximation semi-classique, le noyau & a, dans le puits, une vitesse de l'ordre de: 


et il effectue des allers-retours dans un noyau dont le rayon est de l'ordre de *.. 


Ces allers-retours correspondants donc à un certain nombre d'oscillations par seconde. Effectivement, si 
nous notons T la durée moyenne entre deux chocs successifs, nous avons alors: 


2ñ 2ñ 
g= 1 2 1 | 
V 2Æ, (44.130) 
\ A 
Donc la fréquence vaut: 
Jf =— (44131) 


À chaque fois elle a une probabilité T de franchir la barrière de potentiel. Cette probabilité par unité de 
temps est ainsi déterminée par: 


AZ f-T (44.132) 


et donne la constante de désintégration de l'isotope par émission & avec une relativement grosse erreur si 
on fait le calcul avec les valeurs numériques. Sinon, l'ordre de grandeur est par contre exact ce qui pas mal 
du tout! Le modèle (scolaire) présenté donne donc des résultats satisfaisants. 


Ce qui est impressionnant dans ce résultat c'est que puisque T est très très sensible à Æ,,, = Æ,, les ordres 


de grandeur de À varient énormément pour de petites variations de l'énergie. Et le modèle reste aussi 
satisfaisant sur environ 30 ordres de grandeur!!! 


2.4.4. DÉSINTÉGRATION BÊTA- (4) 


Définition: Lorsqu'un noyau est instable à cause d'un trop plein de neutrons (comme le Carbone 14 par 
exemple) il n'émettra pas de neutrons. En revanche il aura la faculté de changer un de ses neutrons en un 
proton. Lors de cette transformation, pour conserver la charge électrique totale du système, un électron 
sera créé. Cette transformation est la "radioactivité bêta-" (- car l'électron à une charge négative dans cette 
désintégration). 


La désintégration dite # est donc une caractéristique des noyaux ayant un excès de neutrons. Les 
isotopes concernés se rendent plus stables en transformant un neutron en un proton avec émission d'un 
électron $# et d'une particule appelée "antineutrino" dont nous justifierons la présence plus loin. 


Nous avons alors pour le neutron concerné: 
1,,+1/2 +1/2 3, D | 
02 "pi +#" +5 (44.133) 


Nous avons mis en exposant droit le spin de la particule concernée et en indice droit le signe de charge de 
la particule. Ainsi, nous observons que le spin est une quantité conservée, ainsi que la charge. 
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Nous avons pour l'isotope concerné: 


ZA > zHnwit 8 +0 (ex: SC SN+E +0) (44134) 
L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse: 
Q,- = (Mz-My-m)e (44135) 
en négligeant l'énergie de liaison des électrons, nous avons: 
My = M, + 2m, et My = My +(Z +), (44136) 


Attention! le Z dans l'égalité de ># est le même que celui que nous trouvons dans l'expression de #7, d'où 
le Z + 1. 


Nous avons alors: 
2 
Q- — (CP — My) "e (44.137) 


Chaque désintégration £ pure est caractérisée par une énergie fixe de décroissance Q. Du fait que 
l'énergie cinétique du noyau est négligeable de par sa masse comparativement à celle de l'électron et de 
l'antineutrino réunis, l'énergie dégagée Q est partagée entre les énergies cinétiques de # et de &. La 
masse de l'antineutrino étant de très loin inférieure à celle de l'électron, l'énergie cinétique de l'antineutrino 
peut aussi être négligée. L'énergie de $ n'est cependant pas fixe et peut prendre n'importe quelle valeur 


entre 0 et Q. Nous observons donc un spectre d'énergie contrairement aux autres types de radioactivité 
(car l'électron peut avoir une énergie cinétique variable). 


La forme des distributions observées permet de donner une valeur d'énergie moyenne aux # qui se situe 
autour de Q/3: 


(44.138) 


5 Êe Eu 
3 3 


L'existence de l'antineutrino a été postulée en 1933 (3 ans après le neutrino que nous verrons plus loin) par 
Wolfgang Pauli afin de satisfaire la conservation de spin. L'introduction d'une particule aussi étrange fut 
très controversée et mal acceptée (charge nulle, spin non nul, masse négligeable) et elle continue à poser 
quelques problèmes dans la physique contemporaine du 21ème siècle. 


Indépendamment du neutrino d'électron (noté v, habituellement) accompagnant les particules # et $#* 
(ce dernier ayant plusieurs noms "positon", "positron", "électron positif") il existe un neutrino de méson 
(muon) # ou neutron tau (tauon) T notés: v,, et v, pour ne pas les confondre. Par la suite, n'étant pas 

confronté aux neutrinos de méson ou tau, nous noterons simplement le neutron électronique v à la place 


de v,. 
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Remarque: Au début de sa découverte, la désintégration # était vue comme une transmutation du 
noyau..., dans les petites classes, encore aujourd'hui, on la voit comme la transformation d'un neutron 
en proton. Dans les théories contemporaines, elle est vue comme d'un quark d en quark u et elle a 
amené les physiciens à développer la théorie de l'interaction faible pour en expliquer l'origine. 


24.5. DÉSINTÉGRATION B+ (5) 


Définition: Lorsqu'un noyau est instable à cause d'un trop plein de protons il n'émettra pas de protons. En 
revanche, il aura la faculté de changer un de ses protons en neutron, soit par capture d'un électron, 
phénomène appelé "radioactivité par capture électronique" (voir plus bas), soit par émission d'un électron 
positif (positon) ce qui correspond à la "radioactivité bêta+". 

Cette transformation a une probabilité ridiculement faible puisque l'inverse de l'émission d'un électron et 
d'un antineutrino serait la capture simultanée de ces deux particules. et une telle rencontre serait un 
miracle. Pour surmonter cette difficulté, le noyau utilise un subterfuge quantique: l'émission d'une 
particule équivaut à la capture de son antiparticule. Ce joker offre alors les possibilités susmentionnées au 
noyau excédentaire en protons. 


Lors de la désintégration $* un proton est dissocié en un neutron, un électron positif ("positon") noté 


£* et un neutrino (dont nous justifierons la présence un peu plus bas) et un neutrino. 


Effectivement, pour effectuer l'inverse de la désintégration #, la solution consiste pour le noyau à 


utiliser la conservation de l'énergie et du spin en émettant un positon et en capturant dans l'énergie 
quantique du vide un antineutrino et d'émettre en échange un neutrino. 


Nous écrivons cela: 
p—gnt# +U (44.139) 

ou: 

LA > gun + B°+U (44.140) 
L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse: 

Qu = (Mz My -m)c (44141) 
en négligeant l'énergie de liaison des électrons, nous avons: 

My = M+t£m, et my = My +(Z Dm, (44142) 


Attention! le Z dans l'égalité de ># est le même que celui que nous trouvons dans l'expression de #7, d'où 
le Z=1 


Nous avons ainsi: 


n 
Que = Cris my — 2m.) | (44.145) 
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La désintégration £* ne peut donc avoir lieu que si De 2 0, c'est-à-dire si: 


(my = my) c > 2m? =1022[WMeP] (44.144) 


L'énergie massique de l'électron Æ = mc? est importante car c'est l'énergie d'un des deux photons 


résultant d'une annihilation d'un #* avec un électron. 


Comme pour la désintégration # , l'énergie du £$* n'est pas fixe et peut prendre n'importe quelle valeur 
entre 0 et Q. Nous observons donc un spectre d'énergie. 


2.4.6. CAPTURE ÉLECTRONIQUE (6) 


Définition: Lorsqu'un noyau est instable à cause d'un trop plein de protons par rapport aux neutrons, nous 
savons donc qu'une solution favorable du point de vue de son énergie est de transformer un de ses protons 
en neutron, c'est-à-dire de réaliser l'inverse de la radioactivité $#°. Nous avons vu tout à l'heure qu'une 


possibilité était pour le noyau via la désintégration #* d'attraper un antineutrino du vide et d'émettre un 


positon (perte de sa charge électrique) et un neutrino. Mais il peut aussi capturer un électron du cortège 
électronique (neutralisation de sa charge électrique) en lieu et place d'émettre un positon. 


Ce sera le plus souvent un électron de la couche K. Ce qui se note: 
LXyte— ya LU (44.145) 
L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse: 
One = (My tm, = My)? (44.146) 
en supposant que l'énergie de liaison de l'électron K et celle de recul du noyau sont négligeables. 


C'est donc le neutrino d'électron qui emporte toute l'énergie, d'où la nécessité qu'avait eue Wolfgang Pauli 
d'introduire cette nouvelle particule (ce qui lui avait fait horreur...!). Comme l'électron capturé occupait un 
niveau d'énergie précis dans l'atome, les neutrinos issus de la désintégration d'un isotope par capture 
électronique ont une énergie déterminée et présentent donc un spectre de raies. 


En négligeant l'énergie de liaison des électrons, nous avons: 
My = M+tZm, et my = My +(Z Dm, (44147) 
donc: 
. 2 a 
Orc = (My — My)C"| (44.148) 
La désintégration par capture électronique n'est en concurrence avec la désintégration $* que si: 
(mn, = my)e® > 2m? =1022[MeW] (44.149) 


Dans le cas où 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


(nm, = my) < 2m,c°? =1.022 [MeV] 


seule la désintégration par capture électronique est possible. 


Cependant, le trou laissé par l'électron absorbé nécessite un réarrangement du cortège atomique et 
l'émission d'un rayonnement. 


2.4.7. ÉMISSION GAMMA (7) 


Définition: Pour le noyau, l'émission d'un rayonnement électromagnétique Ÿ est une possibilité de 
gagner en stabilité. Cette émission suit généralement un phénomène de désintégration #,8*,4æ ou de 


capture électronique. On peut donc s'imaginer que lors de tels types de désintégration, la topologie des 
nucléons dans le noyau n'est pas idéale et que le réarrangement de ces derniers s'accompagnera d'une 
diminution d'énergie; cette dernière émise sous forme d'un ou de plusieurs photons #. 


Nous avons donc un schéma: 
À ArrM — 
zu gba + # D 


puis: 


Av _ A . 
sara = za + } (désintégration # ) 


où le m signifie "métastable” ou "isomère" (on utilise ce dernier terme lorsque l'émission du rayonnement 
a lieu longtemps après la désintégration). 


Remarque: "Isomère" veut dire que le noyau est excité. Il se désexcitera avec une période 7 ,; . 
Généralement 7,, est extrêmement petit et le(s) photon(s) est (sont) émis immédiatement après 
l'électron dans le cas de notre exemple d'une désintégration #°. Nous parlons alors d'état métastable 


ou isomère. Notons que ces radio-isotopes isomères sont particulièrement intéressants en imagerie 
médicale. 


L'énergie du photon Ÿ vaut: 


0, =(M,. -M,X° 


Il est évident que dans cet exemple, nous avons considéré le cas le plus simple; soit la désexcitation de 
noyau ÿ* en une seule étape avec émission d'un seul photon Ÿ qui emporte toute l'énergie. De fait, selon 
le radio-isotope, cette désexcitation peut s'effectuer avec l'émission de plusieurs photons Ÿ en cascade. 


2.4.8. CONVERSION INTERNE (8) 


La conversion interne I.C. est un processus lié aussi à l'émission d'un photon #. En effet, il se peut que 
l'énergie soit transmise directement à un électron du cortège électronique, généralement de la couche K, 
qui se trouve éjecté de l'atome. Cet électron est appelé "électron de conversion". La place laissée dans le 
cortège électronique est par la suite comblée par un électron des couches supérieures et ainsi de suite. On 
a donc, comme dans le cas d'un processus de désintégration de capture électronique, un réarrangement du 
cortège électronique caractérisé par l'émission de rayons-X caractéristiques de l'élément Y. 
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L'énergie transmise vaut: 


avec £ - étant l'énergie cinétique de l'électron émis, £, l'énergie du photon percutant l'électron, £,, 
l'énergie de liaison de l'électron considéré (K, L, M...) 


L'énergie du photon Ÿ est transmise directement à un électron qui est éjecté; le processus est suivi du 


réarrangement des électrons (s'ensuivra une émission de rayons X). L'électron éjecté est appelé "électron 
Auger". 


Si nous représentons sur un graphique tous les isotopes avec en ordonnée leur nombre atomique Z et en 
abscisse leur nombre de neutrons nous pouvons observer que les éléments stables existant dans la nature 
se trouvent tous dans la région nommée "vallée de stabilité”. Les autres étant radioactifs. Nous pouvons 
remarquer que la ligne Z = À est située presque partout en-dessous de la zone de stabilité. 


Ces résultats ont été obtenus expérimentalement, car il est encore mal aisé aujourd'hui même avec les 
ordinateurs les plus puissants et ce en connaissant la théorie quantique, de simuler le comportement de 
noyaux ayant des nombres atomiques élevés. 


L'émission d'un électron du cortège électronique appelé "électron Auger" est donc un processus similaire 
au processus de conversion interne (IC), mais le rayonnement électromagnétique ne provient pas d'une 
désexcitation du noyau (ce n'est pas un photon Ÿ) mais d'un rayon-X produit lors du réarrangement du 
nuage électronique. Dans un processus radioactif, ce réarrangement électronique peut provenir soit d'une 
capture électronique (EC) soit d'une conversion interne (IC). 


L'électron Auger éjecté provient principalement d'une orbitale externe et son énergie est l'énergie 
caractéristique du rayon-X moins son énergie de liaison. L'énergie des électrons Auger est donc faible 
(quelques [keVT) par rapport à une particule # et ces électrons sont donc souvent réabsorbés à l'intérieur 
de la source. Le processus d'émission d'un électron Auger est favorisé pour des éléments à faible numéro 
atomique à cause de leurs faibles énergies de liaison électronique. 


Lors d'un réarrangement du nuage électronique tel que le passage d'un électron de la couche L à la couche 
K, l'énergie du rayon-X émis vaudra Æ, - Æ,. Cette différence d'énergie étant supérieure à l'énergie de 
liaison d'un autre électron se trouvant sur la couche L, ce dernier sera alors émis avec l'énergie cinétique: 


Een = AViox = Er = (Ex -E)-E ;=Ey-2E, >0=c* 


gr 
À leur tour, les 2 vacances laissées sur la couche L sont comblées par des électrons des couches 
supérieures. Fluorescence et électron Auger sont en compétition. Il se peut même que plusieurs électrons 
Auger soient émis lors de la désexcitation de l'atome. On parle alors de "cascade Auger" laissant l'atome 
considéré fortement ionisé, ce qui peut conduire à l'explosion coulombienne de la molécule dont il fait 
partie. 


Pour conclure sur l'ensemble de ces phénomènes radioactifs indiquons l'ordre de grandeur des périodes 
radioactives de quelques éléments naturels et artificels: 
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| _ Nucléide | Décroissance | Période 
Morumax | | “om | 
Wamun 2 | | 0m | 
CE CE ET 
ram | | mé | 


+10° années 
+10 années 
12 années 
“5.3 années 
8 jours 
7.1 secondes 
-10$ années 
58 


+20 minutes 


+110 minutes 


GE D 


Tableau: 28.1 - Ordres des grandeurs des périodes ractioactives de quelques nucléides 


Avec un exemple de la famille radioactive de l'uranium 238: 
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Figure: 44.8 - Famille radioactive de l'uranium 238 (source: Wikipédia) 


3. RADIOPROTECTION 


En physique nucléaire, il est très important de connaître la façon dont les divers rayonnements alpha, 
gamma, rayons-X ou neutroniques interagissent avec la matière (en gros les rayonnements non chargés ou 
chargés). Cela permet de connaître la façon dont leur énergie cinétique se répartit ou se dissipe dans la 
matière qu'ils rencontrent sur leur chemin et de s'en protéger de façon adaptée 
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3.1. FORMULE DE BETHE-BLOCH 


Une particule chargée lourde ayant une énergie de un ou plusieurs MeV perd son énergie principalement 
par collisions avec les électrons des cortèges atomiques, électrons qui lui apparaissent comme quasi-libres. 
Le processus par lequel des électrons sont ainsi éjectés lors du passage d'une particule ionisante est appelé 
“ionisation primaire". Un électron pourra s'échapper s'il reçoit une énergie supérieure à son énergie de 
liaison. 


Le transfert maximum d'énergie Æ,.. qui peut se produire dans une collision non relativiste et élastique 


(où l'énergie du système est conservée car il n'y a par définition pas de dissipation de chaleur) est calculé 
simplement en utilisant le principe de conservation de la quantité de mouvement et d'énergie: 


Soient Àf,v,, et #2,,v, les masses et vitesses respectives de la particule incidente et de l'électron. Nous 
supposerons que l'électron est immobile sur son orbite et que sa vitesse initiale est nulle v, = 0. Après le 
choc, nous supposerons que la particule incidente aura transféré toute son énergie cinétique à l'électron et 
se trouvera à son tour au repos telle que v',, = 0. 


Posons d'abord l'équation de conservation de la quantité de mouvement: 
Mv,, tv, = Mv'tmv (44156) 
La conservation de l'énergie nous permet aussi d'écrire: 


1 1 1 1. 
— Mvi, + = mvi = SMvutsmve (44.157) 


2 2 2 
D'où après regroupement et simplification: 
Mlvy -vyi=rmlv -v | 
1 
Ml vi \= (V2 - V2 | 


soit autrement écrit: 


Mlvy -vy = ml -ve | 
(44.159) 
Ll 1 
M vas + Vas vas — Vas | = Pre (Ve = Ve lle + | 
Ensuite, après division de la deuxième équation par la première nous avons: 


! 1 
Vif T Vif = Ve TVe (44.160) 


Nous avons alors le système: 


Mois +meVe = Mv'u tv 
si sd > MoV'e = My +MeVe — M\vV'etVe -Vyml (44161) 
V' = V'etVe —VM 
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on déduit l'expression des vitesses après le choc: 


_v(r, = M)+2My, 


(44.162 
Ci VW + Pr, ) 


relativement à nos hypothèses initiales, nous avons (v, = 0,v',, = 0) donc: 


, 24, : 
Mi, (44.163) 
Manipulons un petit peu cette relation: 
24 24 2m,v' 
vu St ne Te &° Ar Te” 
M+m, 2 2 M +m, 2 vs CM + mm) 
24, (44.164) 
s E" : E 2m, Va : EM 2m, M + Fe . 4Mn, EM 
(Mim)v,  ‘ (Mim)  vy (M+m) ° 


Pour une particule lourde, avec À >> #,, nous pouvons écrire: 


dr 
Et =" EM (44165) 


[a M [a 


Une ionisation ne pourra se produire que si ,,,Æ#° est au moins égale au seuil d'ionisation de l'électron que 
l'on notera À, et dont on a vu le calcul lors de l'étude du modèle de Bohr (cf. chapitre de Physique 
Quantique Corpusculaire). 


L'énergie de la particule incidente devra donc au minimum être égale à: 


û 
mi (44.166) 
dr 


Donc, lors de son passage à travers la matière, le corps chargé de charge Z'e et de vitesse v,, cède son 
énergie en de nombreuses collisions avec les électrons des atomes rencontrés. L'interaction est 
coulombienne et à chaque fois, une diffusion se produit. L'énergie de recul de l'électron, supposé libre, 
peut se calculer de manière précise. Pour faire une estimation de la perte d'énergie, nous ferons ici 
l'approximation que la quantité de mouvement transférée ? est égale au produit de la force d'interaction à 
la distance r multipliée par le temps nécessaire au projectile pour parcourir le trajet 2r. Nous avons la 
force F de Coulomb donnée par: 


1 Ze’ 


et la quantité de mouvement: 
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1 Ze? .èr 1 2Ze? 


Âp=Fr't= — l'—= (44.168) 
z - î 
AE, r Vu NE Tr 'Vy 

L'énergie cinétique transférée à un électron de masse #2, sera: 

1 1 (pŸ 1 27°e° 

AE° A EC 2, = (14169) 
€ € 2 2,,,2 
2 2 m, (AE) r'vy me, 


La perte d'énergie totale sera obtenue en intégrant sur tous les électrons rencontrés. À la distance 
comprise entre r et r + dr de la trajectoire et sur le parcours dx, se trouvent: 


dMN = N'Z"23tr' dr'dx (44170) 


électrons, où N est le nombre d'atomes de nombre atomique Z' par unité de volume. La perte d'énergie par 
unité de distance est donc: 


on 2 2 4 1 72,4 Ten 
-&-] RE dr 
ax ax 4 (47e) r''vu me (AE) mvu sr 


(44.171) 


La valeur de ,,, est évaluée en remarquant que ce paramètre d'impact correspond au transfert d'énergie 
maximum. En utilisant les équations que nous avons démontrées précédemment: 


: l 2Z%e* : 4, pi 


= ————" ——— (44.172) 
IX € 2 4 3 € 
CAE) PonVue M 
Avec EX = lp: btenir 1 è 
vec #, 5 v,, , On peut obtenir le parametre 7,,;, par: 
PE L 
an 5 75 —7 (173 


Are) vin, 2mvy (47%) vin 


et nous obtenons: 


ñ 1, Z 44.174) 
Le" (44.17 
4 Ve 


Lorsque r devient très grand, le transfert d'énergie est plus petit que l'énergie moyenne d'ionisation notée 
7 des électrons et le processus n'est plus efficace. Nous devons donc avoir la relation suivante: 


| Ze 
E 


mi é. ya 3 2 2 
ARE) roue Var 


>1 (44175) 


Nous en tirons une valeur pour %, : 
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1 Ze [2 


AE V, NP: 


En remplaçant les valeurs de %,,, et %,. des équations précédentes dans l'équation: 


dE AxNZ' .Z'et 4 . 
RE ( 17 1 / 
dx (4E, Pom 7 Ô 
nous obtenons: 


_dE _ArNZ' Let 2m, v? 
dx Ur: ME 


(44.178) 


Un traitement quantique plus rigoureux montrerait qu'il faudrait supprimer la racine de l'argument du 
logarithme en prenant en compte les effets relativistes ainsi que les propriétés intrinsèques de l'électron 
(constante de structure fine). Nous obtiendrions alors la formule de Bethe-Bloch: 


I 
à Ge) nl 


_dE _AxrNZ' Let (ere 


| ma-#-# + (44.179) 


où Ê=v/e, €, est quant à lui un terme de correction qui dépend de l'énergie et de Z lorsque nous tenons 
compte de la structure complète des noyaux (modèle en couche) de la matière. 


Nous voyons finalement que la perte d'énergie linéique est proportionnelle au numéro atomique du 
rayonnement incident et de la matière pénétrée. Donc, des protections composées de matériaux à numéro 
atomique élevé (masse volumique élevée) auront un fort pouvoir de ralentissement et seront avantageux 
en radioprotection. 


3.2. EFFET COMPTON 


L'effet Compton s'observe lorsqu'un photon est diffusé inélastiquement par une particule chargée. En fait 
le photon est absorbé et puis réémis par la particule lui cèdant ainsi au passage une partie de son énergie. 
C'est ce transfert d'énergie qui justifie le caractère inélastique de la diffusion. 


Ainsi si la particule chargée est un électron, cet effet peut avoir lieu indifféremment sur un électron de 
n'importe quelle couche électronique voire sur un électron libre. L'énergie du photon et celle de l'électron 
dépendent de la direction d'émission de ces particules. Étant donné que cet effet dépend du nombre 
d'électrons disponibles par atome cible, la probabilité de diffusion Compton augmente linéairement avec 
le nombre atomique Z de l'absorbant. Mais comme cet effet est en concurrence avec la production d'une 
paire électron - positron que nous verrons plus loin, l'effet Compton est surtout important aux énergies et 
aux numéros atomiques moyens. 


Nous avons démontré dans le chapitre de Relativité Restreinte, la relation d'Einstein: 
E=m°=E +me =E£, =mc-mpe (41180) 


et rappelons que nous avons ainsi pour la quantité de mouvement d'un photon: 
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E 
E=m° = =m=p (41181) 
c 


et nous y avons aussi démontré que, partant de l'énergie totale, la quantité de mouvement est donnée par: 


2 
E=c Mine ar ss E -mèct LE. + mc? Ÿ -mêct 
€ ë € 
= 1 [5 42E me +nêce - née — E? +2E mc° - E.|E, +2mc°| 
€ € € 


d'où la relation, dont nous allons faire usage plus loin: 
pc? = E|E + 2m,c° | (44.183) 


Avant l'interaction, photon-électron, nous avons (nous considérons grossièrement l'électron comme étant 
au repos) y, + #4c° et après la collision hv, + rc + pc? . La conservation de l'énergie nous amène 


donc à écrire: 


lv, + mc = hv, + frèct +pic? (44184) 
En ne considérant que les énergies cinétiques, nous avons en négligeant celle de l'électron avant le choc: 
hv, = E,+hv, = (mc? mc |+hv, (44185) 


Soit la figure ci-dessous: 


slectr 
? DS 
Photon 
x 
Compton 
E, = hv, 


Figure: 44.9 - Illustration de l'effet Compton 


La conservation de la quantité de mouvement nous donne: 
Selon l'axe x: 


A cos8 & p, cos 
RE 


—<cos# (44.186) 
€ 


5-52 


Selon l'axe y: 


Ë, 


0=Zsing-p,sin8 & p,sing = 2aing (44187) 
É € 
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La somme de ces deux relations élevées au carré nous donne la quantité de mouvement totale: 


2 2 
E 

p} cos” 8 + p} sin? = Ë Ru] (Lis ) 
RE € 


FE EE FE? ei à ee Ej (44.188) 
= pe = +2 cos p+ cos” D+ sin D= 5-2 cos h+ + 
€ € c c € ë , 


= pc = EH +E; -26E, cosé 
Puis en substituant pic: 
E,(E +2mc°)=Æ+EÆ -2ÆE, cos (44189) 
et comme £, = Æ, -E,: 
E, = À 
1: _À (1=-cosg) (44190) 


Pyc° 


Lorsque l'énergie du photon est assez élevée, Æ,  »4c°, celle du photon diffusé tend vers une limite 
donnée par (voir la règle de l'Hospital dans le chapitre de Calcul Différentiel Et Intégral): 


2 
| ; C 

lim Av, = lim Æ, = RO yon 

CET Exmc {l-cos #) 


L'énergie acquise par l'électron Compton vaut finalement: 


2 
E _(1-c05 6) 
E,=E,- a (44.192) 
+ À 1 cos gi 
ME 


Il est intéressant de remarquer que nous ne pouvons avoir Æ, = Æ. Effectivement cela supposerait que: 


E, RE OS, 
1+ = (1- cos #) CR 
MC 


et nous voyons bien que quel que soit #, nous avons toujours Æ, #“ 0. 


La fréquence du photon diffusé est inférieure à celle du photon incident car son énergie Æ, est toujours 
plus faible et donc sa longueur d'onde À, plus grande. Donc: 


le 4 1  ] kc|EÆ 
AA= À A =cl—-—|= cl —-—|= —|—-1 4.194 
À — À de 1 A E, EE | (44.194) 
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et puisque: 
F E _(1- co) (44.195) 
FC 
Nous avons: 
E 
A1= 7 1+—il-cos#)-1|= he 1005 6) (44.196) 
1 PyE bi 


ce qui s'écrit aussi en utilisant la définition de la constante de Planck et les relations trigonométriques 
habituelles: 


mc 


Ah 
AA = —— sin? fs) (44.197) 


ke 
Nous appelons le facteur A la "longueur d'onde de Compton” et elle vaut: 


An = 2.426107 [we] (44.198) 


Remarquons que si l'angle # est nul, alors la variation de longueur d'onde est nulle et que si l'angle # 
correspond à 180° alors la variation de longuer d'onde du photon incident est le double de la longueur 
d'onde de compton! 


3.3. EFFET PHOTOÉLECTRIQUE 


L'effet photoélectrique est l'éjection d'électrons (dits alors "photoélectrons") de la surface de divers 


métaux exposée à une énergie de rayonnement. Ce rayonnement peut provenir du réarrangement du noyau 


de l'atome aussi bien que d'un rayonnement externe. 


Par ailleurs, c'est par des mesures quantitatives de l'effet photoélectrique qu'Einstein proposa d'éprouver la 
validité de la théorie quantique de la lumière (transport d'énergie par paquets: quanta) et donc l'explication 


théorique lui valut le prix Nobel. 


Exposons d'abord l'expérience mise en oeuvre: l'émission d'électrons par un métal ne contredit pas la 
théorie électromagnétique de la lumière. Si nous considérons un faisceau uniforme, son énergie est 
uniformément répartie sur tout le front d'onde. Plus la lumière est intense, plus grandes sont les 
amplitudes des champs électrique et magnétique en chaque point du front d'onde et plus l'énergie 
transmise par l'onde en une seconde est grande. Ces champs exercent des forces sur les électrons dans le 
métal et peuvent même en arracher de sa surface. 


Voici l'expérience mise en place: 
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—} Radiant energy 
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È Collector 


Liberated electrons 


(A) Photocurrent 


D BrouCse 


Figure: 44.10 - Expérience pour la mesure de l'effet photoélectrique 


Si l'anode collectrice est à un potentiel positif relativement à la cathode émettrice, les photoélectrons 
parcourent le tube et constituent le courant mesuré par l'ampèremèêtre. Nous observons alors une 
proportionnalité entre l'intensité du faisceau incident et le courant. 


Cependant, au moins trois problèmes persistent entre le modèle théorique et l'observation expérimentale: 


1. La notion ondulatoire de la lumière ne convient pas pour expliquer le temps nécessaire à l'absorption de 
l'énergie d'extraction. 


Effectivement, supposons une lampe de 100 [W] avec un rendement lumineux 15% placée à 0.5 [m] d'une 
plaque revêtue de potassium K d'énergie d'extraction Æ, minimale de 2.25 [eV] en admettant un diamètre 


de 1[ 4] pour l'atome de Potassium. 
Nous avons alors: 


P _10{#] 0.15 
F A7 R? 


rapportent 


14 
1= =4,77 | (44.199) 
mi 


La puissance lumineuse absorbée par l'atome par sa demi-surface qui fait face au rayonnement est alors: 


s A7RÈ 2 
Be =1 = AT TE =477.2#10.5.10"10) 2749.10 2 [y] (44.200) 


La durée nécessaire pour l'absorption est alors: 


= = =AG[s] (44201) 
PE, 749.10 2 


ce qui est en contradiction avec l'expérience où l'on observe que le phénomène est quasi instantané (le 
temps à la lumière pour se propager jusqu'au métal). 


2. Si nous inversons les bornes, les électrons émis par le métal sont repoussés par l'électrode négative, 
mais si la tension inverse est faible les plus rapides pourront quand même l'atteindre et il se produira un 


courant. À un potentiel négatif, spécifique pour chaque métal, appelé potentiel d'arrêt L?, , tous les 


électrons émis sont repoussés et le courant est nul. L'énergie cinétique maximale de ces photoélectrons est 
alors: 
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Or, nous trouvons expérimentalement que ce potentiel d'arrêt est indépendant de l'intensité du 
rayonnement. Dans la théorie ondulatoire, l'augmentation de l'intensité devrait augmenter le nombre 
d'électrons extraits (quel que soit leur niveau énergétique) et leur énergie cinétique maximale. Une plus 
grande intensité suppose une plus grande amplitude du champ électrique: 7 « Æ?. Ainsi, un champ 
électrique plus grand devrait éjecter les électrons à plus grande vitesse toutes couches confondues au fur à 
mesure que l'intensité augmente. 


3. Lorsque nous varions la fréquence v de la lumière incidente et que nous mesurons L}, , nous observons 
que l'effet photoélectrique n'a pas lieu si v < % (#% est appelé le seuil de fréquence) et ceci quelle que soit 


l'intensité de la lumière. Ce qui est plutôt gênant... parce que dans la théorie ondulatoire, nous devons 
toujours pouvoir éjecter des électrons quelle que soit la fréquence, il suffit d'augmenter l'intensité. 


Chaque problème peut être résolu en adoptant le point de vue suivant: 


1. Dans l'aspect ondulatoire, la source est vue comme se propageant comme un front d'onde sphérique 
dont la densité superficielle d'énergie décroît comme 1/r?. Alors que pour expliquer l'observation 
expérimentale, il faut voir l'expérience d'un point de vue corpusculaire où le front est un front de 
corpuscules dont la densité superficielle de photons décroît en 1/r? mais où l'énergie de chaque photon 
reste hv (selon la relation de Planck-Einstein). 


2. Si nous pensons en termes de photons, quand nous augmentons l'intensité, nous augmentons le nombre 
de photons, mais l'énergie par photon £ = kv, reste inchangée. Ainsi, Æ.,% que peut avoir chaque photon 
ne change pas. D'où le fait que le potentiel d'arrêt est indépendant de l'intensité du champ. 


3. Si nous pensons en termes de photons à nouveau, les électrons dans la cible sont retenus par les forces 
d'attraction, l'extraction d'un électron de la surface requiert une énergie minimale Æ, qui dépend de chaque 


matériau (Æ;, est aussi appelé "travail d'extraction" qui est de l'ordre de quelques électronvolts). Si 
l'énergie du photon incident Æ, = #v est supérieure à £,, un électron peut être arraché, par contre si elle 


est inférieure, aucun électron ne peut être arraché. L'apport d'énergie #v est égal à l'énergie cinétique de 
sortie de l'électron plus l'énergie requise pour l'extraire du métal, soit: 


E +E, =E,=hv 


Ainsi, si l'on augmente la fréquence de la lumière, l'énergie cinétique maximale des électrons augmente 
linéairement. R.A. Millikan fit entre 1913-1914 des expériences rigoureuses dont les résultats 
corroborèrent parfaitement la théorie d'Einstein. Ce dernier reçut le prix Nobel en 1921 pour ses apports à 
la physique théorique, et surtout sa découverte de la loi de l'effet photoélectrique. 


La lumière se propage d'un endroit à un autre comme si elle était une onde. Mais la lumière interagit avec 
la matière dans des processus d'absorption et d'émission comme si elle était un courant de particules. C'est 
ce que nous appelons la "dualité onde-corpuscule". Ainsi, celle-ci se trouvant dans les particules massives 
comme le suggère l'hypothèse de De Broglie que nous avons vue en physique quantique ondulatoire, se 
vérifie finalement également pour la lumière. 
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Figure: 44.11 - Principe de l'effet photoélectrique sur le modèle de Bohr de l'atome 


Un photon d'énergie incidente Æ, qui interagit avec un électron d'un atome cible peut éjecter cet électron 
de son orbite en lui communiquant une énergie cinétique Æ, : 


Æ, =Æ;-Æ, (44204) 


où £, est l'énergie de liaison de l'électron éjecté de son orbite (cette relation est indiquée sous la forme 
T=Æ-KW; dans la figure ci-dessus). 


Si l'énergie du photon incident est inférieure à l'énergie de liaison de l'électron K (cf. chapitre de Physique 
Quantique Corpusculaire), l'effet photoélectrique se fait avec un électron de la couche L, etc. 


Dans le cas où le rayonnement est absorbé, l'atome est dit "excité", car son état d'énergie n'est pas l'état 
y 

minimal. Il s'ensuit donc une "relaxation" (ou "désexcitation"): un électron d'une couche supérieure vient 

combler la case quantique laissée vacante par l'électron éjecté. 


Si l'énergie de transition est modérée (c'est-à-dire si le rayonnement incident avait une énergie modérée), 
la relaxation provoque l'émission d'un photon de faible énergie (visible ou ultra-violet), c'est le phénomène 
de fluorescence. Si l'énergie de transition est élevée, on peut avoir deux cas: 


Fucrescence UVvis1ble fluorescence X émission Auger 
dhctron éjecté 
photon lumineux lAuger} 
ra photon X CE 
0] Li PT Ted, {} Jo 
$ 4 TE. j} 
s n : , è . , » . , + , 
r. (l ( À { . { à (| 4 "| 
+ D , lé S + ou ‘ © |? é à È 
° + “ + Li 
* A de ° » eo ® se" 
Li L LA Li 


Figure: 44.12 - Types de transitions d'énergie selon le modèle de Bohr 


1. Il y a émission d'un photon fluorescent, qui du fait de son énergie, est un photon X, nous parlons alors 
de "fluorescence X" 


2. Ce photon X peut être recapturé par l'atome lui-même et provoquer l'éjection d'un électron 
périphérique, c'est "l'émission Auger" dont nous avons déjà parlé plus haut. 


Pour résumer, nous avons vu jusqu'ici: 
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+ 
Figure: 44.13 - Diffusions et ionisations étudiées jusqu'ici 


Indiquons qu'à l'époque de la découverte de l'effet, les premiers théoriciens avaient tenté de modéliser le 
phénomène par un processus mécanique fonction de l'intensité lumineuse (résonance mécanique). Or 
comme nous venons de le voir, ce n'est pas l'intensité de la lumière qui compte, mais sa fréquence. 


3.4. DIFFUSION DE RUTHERFORD 


Considérons la diffusion qu'une particule chargée subit quand elle est soumise à une force électrostatique 
répulsive inversement proportionnelle au carré de la distance entre la particule mobile et un point fixe ou 
centre de force. Ce problème est particulièrement intéressant en raison de son application à la physique 
atomique et nucléaire. Par exemple, quand un proton, accéléré par une machine telle qu'un cyclotron, 
passe près d'un noyau de la matière de la cible, il est dévié sous l'action d'une force de ce type, provenant 
de la répulsion électrostatique du noyau (c'est la raison pour laquelle nous parlons aussi de diffusion 


coulombienne). 


Figure: 44.14 - Diffusion de Rutherford 
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Soit O un centre de force et À une particule lancée contre O d'une grande distance avec la vitesse », (voir 


figure ci-dessus). Nous choisirons l'axe des X passant par O et parallèle à v,. La distance b, appelée 


"paramètre d'impact", est la distance entre l'axe X des abscisses et le point À. En supposant que la force 
entre À et O est répulsive et centrale, la particule suivra la trajectoire AMB. La forme de la courbe dépend 
de la manière dont la force varie avec la distance. Si la force est inversement proportionnelle au carré de 
la distance, c'est-à-dire si: 


F=kl{r (44205) 
la trajectoire est une hyperbole. Avec bien évidemment (cf. chapitre d'Électrostatique): 


1 
& = de -4-@ (44.206) 


Quand la particule est en À son moment cinétique est ##v, . Dans une position quelconque telle que M, 


son moment cinétique, est (cf. chapitre de Mécanique Classique) aussi donné par sr? d 8/ dt . Comme le 
moment cinétique doit rester constant puisque la force est centrale: 


48 
mer = mvyb (41.207) 
dt 


L'équation du mouvement dans la direction OY est obtenue en combinant l'équation par: 


Vy . & . 
M —— = , = Fan 89- — sin 8 (44.208) 
dt r 


En éliminant »? à l'aide de l'avant-dernière équation nous pouvons écrire: 


dv & 
d£ vob 


. 48 
sin @— (44.209) 
£ 


Pour trouver la déviation de la particule, nous devons intégrer cette équation depuis l'une des extrémités 
de la trajectoire jusqu'à l'autre. En A la valeur de v, est nulle car le mouvement initial est parallèle à l'axe 


des X et nous avons aussi 4= 0. En B nous avons v, =, sin # et 8= $ où x -8=x7-#.Remarquons 
qu'en B la vitesse est de nouveau », car, par symétrie, la vitesse perdue quand la particule s'approche de O 
doit être regagnée quand elle s'en éloigne. Alors: 


r smy k 2 
[ dv, = 1 848 (44210) 
AV, D 


Ce qui donne: 


vo ain #=- : (cos(z7—#)—1] (44211) 
"RVO 


soit en utilisant les relations trigonométriques d'usage: 
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VO sin ÿ = ne His ÿ) (44.212) 
vob 


et après réarrangement: 


il+cos#i _ mvib 


- (44.213) 
sin # 
Rappelons (cf. chapitre de Trigonométrie) que: 
sin(24) _ 1 


tan(&æ) = 


l+cos(2æ) co (1) 


Ce qui nous donne alors: 


l noi 
t| — = 44.215) 
co (4) ps ( 


Soit de manière plus détaillée: 


2 
cot fs) = dresmgb (44.216) 


ZOq 
Cette relation donne l'angle de déviation # en fonction du paramètre d'impact b. 


Ce qui nous donne aussi: 


1 Z 
b= 22 cot[$) (44.217) 


Bien évidemment, dans les cas scolaires, on pose souvent Q=gq ce qui simplifie un peu la lourdeur de la 
relation mais on perd en généralisation. 


Cette équation est appliquée à l'analyse de la déviation d'une particule chargée par les noyaux. 
Remarquons que ce résultat n'est valable que pour une force inversement proportionnelle au carré de la 
distance. Si la force dépend de la distance selon une autre loi, l'angle de déviation satisfait à une autre 
équation. Les expériences de déviation sont donc très utiles quand nous voulons déterminer la loi de force 
entrant en jeu dans les interactions entre particules. 
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Trajectoires de particules alpha 


Figure: 44.15 - Représentation de la diffusion de Rutherford de noyaux alpha 


Dans les laboratoires de physique nucléaire, on fait des expériences de diffusion en accélérant des 
électrons, des protons ou d'autres particules au moyen d'un cyclotron, d'un accélérateur de Van de Graaf 
ou de quelqu'autre dispositif semblable, et en observant la distribution angulaire des particules déviées. 


Il est clair qu'une particule incidente dans une surface définie par un rayon compris entre b et b + db sera 
respectivement comprise dans l'angle solide de diffusion: 


de =27rbdb (44.218) 
avec (cf. chapitre de Trigonométrie): 


dSè=2ran#df (41219) 


A 
el 


#! 


L 


Figure: 44.16 - Représentation de l'angle solide de diffusion 


La "section efficace" étant définie par: 


Dre : 27rbdb 


de 2xangg) 0 


Partant de (relation démontrée plus haut): 
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D ce(s | (44.221) 


AXE, #v, 


et en utilisant la dérivée usuelle suivante démontrée dans le chapitre de Calcul Différentiel Et Intégral: 


cot'(x)= — : 44.222) 
sin?(x) si 
nous avons: 
db __ 1 40  Lca($)=- 1 gQ 1 
dé AT my d# 2 AE mvf Zn $) (44.223) 
2 
soit: 
db -__1 40 1 
AE mvf Zn $) C2 
2 
Dès lors: 


Lu 2 2 
— ae ( (e —— << d$ (44225) 
Zn $) 4780 } Ln ] 2 sin (4) 


Soit: 


EE 


ingdf (Ar) ont) 3 (s) sin { fi 
2 
2 2 cos (4) 

== Es E —— 2 (44.226) 

2 ro 2 sin? (4) 2sin (4) cos fs) 

2 2 2 

ras) ce) 

a: Pro 4sin* (4) 

2 


Nous avons alors, en se souvenant que le membre de gauche n'est rien d'autre que la section efficace: 
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do (40 1 (40 
2 2 
(47e | #29 4sin* (£) (47 V4 mé 4sind () 
. 4 (44.2 


(40) Î 
2 
16(47 | Æ2 sin* (#) 


et il est d'usage de prendre la valeur absolue pour définir la "section (différentielle) efficace de Rutherford 
(ou de Coulomb)": 


2 
(gQ Î 
(44.228) 


= ——— 
D 164%, | &2 snt[$) 


Nous remarquons plusieurs petites choses intéressantes: 

1. Pour un angle d'incidence nul, la section efficace diverge (à cause du sinus au dénominateur) 
2. La section efficace décroit selon le carré de l'énergie cinétique de la particule incidente 

3. L'expression est valable quelles que soient les charges mises en jeu (positives ou négatives) 


À l'aide de la diffusion de Rutherford/Coulomb, Rutherford a pu déterminer une approximation de la taille 
du noyau de l'atome (bombardement d'une feuille d'or à l'aide de noyaux alpha) comme nous l'avons fait 
remarquer au début du chapitre de Physique Quantique Corpusculaire. Le raisonnement appliqué est le 
suivant pour déterminer une borne inférieure du rayon du noyau: 


L'énergie totale d'un système en rotation est l'énergie cinétique de translation sommée à l'énergie cinétique 
de rotation, sommée à l'énergie potentielle. Ce qui nous donne: 


2 


E = 2m + smart +U(r) = sm + smré +U(r) (44.229) 


en notant L le moment cinétique donné par Z = #r°89 nous avons: 
3 


1 > Ê 
E = nf +——— +1/(r) (44.230) 
2 2m? £ 


d'où: 


Il en résulte donc: 
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Ldr 


2 


r° dE vo) 


(44.232) 


D'où il découle que l'angle associé à deux distances radiales »,7, est donné par: 


ë Ldr 


2 


FA (44.233) 
one ne se DU 
2er 


La figure ci-dessous montre un processus de collision par un potentiel central U(r). La particule incidente 
possède une vitesse initiale: 


2E 


v = £ (44.234) 


mi 


en = -@ avec ZÜ£ = -w) = -@ et yÜé = +) = par symétrie à nouveau. 


. 


bissectrice 


Figure: 44.17 - Approche schématique pour la détermination du rayon de la cible 


L'angle @ est l'angle de déflexion lorsque la particule incidente approche le diffuseur à la distance 


MINIMUM Fin - 


Revenons-en à nos équations où le moment cinétique est lié au paramètre d'impact par la relation Z = m#vb 
ou encore: 


L=bfèmE, (44235) 


Nous pouvons donc écrire après simplifications: 
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r 


= bf2mE. d 
A8=T EL =8-f si 
2 2 
Tr? en[s- 2-00) ne en[s- - -U(r) 
F7 F7 


RE. 
f bdr L f bdr L f bdr 
Su 1 E _b* Ur) Fm 1 _b? Ur) em [4 2.2 r'Ü(r) 
FE + Fr -—- + _ rp 
Er E, F E, E. 


où nous avons posé £ = Æ, (l'énergie de rotation et du potentiel considérés comme négligeables par 
rapport à l'énergie cinétique) et: 

1 2e À 

Ufrj=— 12 = 


(44.237) 
AE, Fr Fr 


La distance minimale d'approche est donc déterminée par le plus grand zéro du dénominateur: 


A 
r-r-b =0 (41238) 
(a 
c'est-à-dire (trivial): 
2 
+ [= | +42 ; 
 : E, : _A, À. (44.239) 
ES 2 2E. 2E, 


Nous avons donc: 


Comme nous le voyons dans cette dernière relation, la particule incidente subira une collision frontale 
lorsque à = 0. Dès lors, la valeur de l'approche maximale est: 


(44.241) 
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L'expérience de Rutherford permit d'estimer la taille du noyau atomique. En effet, les particules qui ont 
rebondi sur le noyau avec un angle de diffusion de 180° (nous parlons alors de "rétrodiffusion"), sont 
celles qui se sont approchées le plus près de ce dernier. Puisque nous avons: 


: "> L 27% 


)\ 
] 
- } 


(44.242 


AE, à 


um 


avec une énergie cinétique initiale de 7.7 [MeV], Rutherford trouva pour le rayon de l'atome d'or (Z=79) 
avec des particules alpha (Z=2) une valeur de: 


ay = 3107 *[#] (44.243) 
Ainsi, le noyau n'est pas ponctuel mais de l'ordre de la dizaine de femtomètres. 
3.5. RAYONS-X ET GAMMA 


La différence fondamentale de ce type de rayonnement, par rapport aux &, #, 8°, est qu'il n'est pas 


porteur de charge électrique et n'a donc pas d'interaction coulombienne avec le cortège électronique du 
milieu traversé. Par conséquent, le photon suit un chemin rectiligne sans perte d'énergie jusqu'à ce qu'il 
rencontre sur sa trace une particule (électron, noyau) où il va subir une interaction modifiant 
profondément son état. 


Le rayonnement gamma est une radiation électromagnétique de haute énergie produite par un phénomène 
nucléaire, alors que les rayons-X sont des radiations électromagnétiques de haute énergie produites lors de 
phénomènes atomiques ou moléculaires. Le photon est la particule élémentaire qui est associée à ces 
ondes électromagnétiques. Les photons gamma et X sont donc de même nature mais d'origines 
différentes, ils ont donc des propriétés identiques qui dépendent de leur énergie. 


Rappelons que: 


En traversant la matière un photon peut interagir avec: 

- Un des électrons de l'atome rencontré 

- Le noyau de l'atome 

- Le champ électrique des particules atomiques chargées 

- Le champ mésique des nucléons (interaction forte) 

Le résultat de l'interaction peut être schématisé comme suit: 


- le photon est dévié en conservant son énergie, il y a alors "diffusion totale" de l'énergie et le processus 
est dit "cohérent" (élastique) 


- le photon est dévié et son énergie diminuée, il y a alors "diffusion partielle" de l'énergie, l'autre partie est 
absorbée par la matière, le processus est dit alors "incohérent" (inélastique) 
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- le photon disparaît, il y a "absorption (totale)" de son énergie par la matière. 


Nous pouvons démontrer que les caractéristiques macroscopiques de ces interactions dans le cadre d'un 
faisceau fin et collimaté conduisent à une loi exponentielle d'atténuation du rayonnement photonique dans 
la matière. Cela signifiant que pour les photons il n'y a pas de parcours fini (!) comme pour les particules 
chargées; on ne pourra jamais assurer qu'à une distance donnée tous les photons d'un faisceau aient subi 
une interaction. 


Le nombre de particules interagissant avec la matière dépend évidemment de l'intensité I et du type de 
matière traversée (caractérisée par le "coefficient d'atténuation linéique" #) et de son épaisseur x. 


Nous avons: 
di =-Hildx (44245) 


le signe "-" étant là pour mettre en évidence une diminution. Nous résolvons facilement cette équation 
différentielle (c'est simplement la loi de Beer-Lambert que nous avons déjà étudiée dans le chapitre 
d'Optique Géométrique): 


1=18#* (44246) 


avec 1, l'intensité initiale ou "débit de fluence" et X le coefficient d'atténuation linéique [æ#°}] qui tient 
compte de tous les effets d'atténuation possibles. 


Remarque: Souvent dans les tables, nous trouvons le coefficient d'atténuation massique {#2 exprimé 
en [c»° / g]. Nous avons alors: 


Dans le cas d'un absorbant contenant plusieurs éléments chimiques homogènement distribués, le 
coefficient d'atténuation vaut: 


où {4 est le coefficient d'absorption de l'absorbant, {4 le coefficient d'absorption de l'élément i, &, la 
masse volumique de l'absorbant, & la masse volumique de l'élément i, w, étant la fraction massique de 
l'élément i dans l'absorbant. 


Faisons maintenant une approche microscopique: 


Soit un faisceau de } [ particules {em : s] (où s est l'unité des secondes puisqu'il s'agit d'un flux de 
particules) frappant perpendiculairement la surface d'un matériau d'épaisseur dx et de densité atomique 
N [atomesi em ]. Si nous considérons les particules frappant la surface À, ces dernières peuvent 


théoriquement rencontrer 4 - 4. 4x atomes cibles dans cette couche. Le nombre de particules interagissant 
sera proportionnel à l'intensité fois ce nombre et nous aurons: 
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di. A=-c.1.M.A.dx (44249) 


4 LA 


où & est la constante de proportionnalité, appelée "section efficace microscopique". Ces unités sont 
souvent exprimées en "barn" (1 [harx] = 10" [cre°]). 


Remarques: 


R1. La densité atomique N est égale à 24,4, : M où £ est la densité en [g/cm°] de la cible, W,, le 


nombre d'Avogadro (6.022:10% [atomes { male]) et M est la masse molaire de la cible exprimée en 
[g/maole]. 


R2. Si nous admettons que les centres de diffusion sont les électrons et non pas les atomes cibles, alors 
il faut remplacer N par À, = N'Z. 


D'où nous obtenons: 


ZN y 29 


f= l expl- M Or) = ELexpl-Nox]= i, | Fr 


) (44.250) 


En identifiant l'aspect macro et microscopique, nous voyons que # joue le même rôle que ZW,, 6e! M 
et que nous trouvons que la section efficace peut s'écrire comme: 


cs 
eZN, (44.251) 


et dans l'hypothèse où l'électron constitue une "sphère d'action" présentant une surface frontale x”, Fe 
étant le rayon de la sphère d'action alors: 


rm -4 M 
TR T— (44.252) 
8 AUS 
et nous avons: 
fi 
= |— (44.253) 
© NezN,x | 


Par définition, nous appelons Coude de Demi-Atténuation (CDA) l'épaisseur du matériau qui divise le 
débit de fluence 1 d'un facteur deux. Ainsi: 


1 
In] — 
É Ini2 
OR RS UE 0 RP LE 
2 2 2 FA FA 


En radioprotection, nous utilisons parfois la notion de couche d'atténuation au dixième TVL (Tenth Value 
Layer) donnée par: 
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_ In(0) 
Li 


TV 


Nous faisons usage parfois aussi de la "longueur de relaxation", qui représente l'épaisseur à partir de 
laquelle l'intensité d'un faisceau monoénergétique est diminuée d'un facteur e, et qui est donc donnée par: 


227 
H 


Cette valeur est beaucoup plus utile que les autres, car c'est aussi la distance moyenne à laquelle a lieu la 


première collision du photon. 


Remarque: L'irradiation gamma est anecdotiquement utilisée dans le cadre de la conservation du 
patrimoine des objets organiques. Effectivement, lors de la découverte des archéologues d'oeuvres ou 
vestiges anciens, ces derniers sont attaqués par des micro-organismes qui vont détruire ces objets avec 
le temps. Le rayonnement gamma va permettre, sans détruire les objets, de tuer par irradiation gamma 
tous ces micro-organismes. L'exemple le plus connu étant l'irradiation de la momie de Toutankhamon 
pendant 10 heures dans les laboratoires du CEA. 


Les causes microscopiques connues de l'atténuation d'un faisceau de photons (neutre au point de vue 
coulombien) qui méritent notre attention dans le domaine d'énergie des photons gamma ou rayons X sont 
au nombre de sept: 


- Diffusion cohérente de Thomson 

- Diffusion cohérente de Rayleigh 

- Diffusion cohérente de Delbrück 

- Diffusion cohérente de Compton (déjà vue partiellement plus haut) 

- Absorption photoélectrique (déjà partiellement vue plus haut) 

- Réaction photonucléaire 

- Création de paires d'électrons-positrons (déjà partiellement vue plus haut) 


Bien que nous puissions à ce jour parler de ces effets, il nous est impossible dans l'état actuel du site de 
présenter le formalisme mathématique permettant de déterminer la section efficace de chacune de ces 
diffusions. 


3.5.1. CRÉATION PAIRES ÉLECTRON-POSITRON 


Au cours de la création de paires, le photon absorbé dans le champ électrique du noyau peut générer une 
paire électron-positron. Pour que l'interaction puisse avoir lieu, il faut que l'énergie du photon soit 


supérieure à 2”%e° (soit environ 1.02 [MeV]), soit l'énergie au repos de la paire électron-positron. 
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Cet effet est important pour les hautes énergies et les numéros atomiques élevés. Le positron créé est 
freiné dans la matière tout comme un électron et, en fin de parcours, il s'annihile avec un électron pour 
donner lieu à deux photons de 0.511 [MeV] (photons d'annihilation) émis presque à 180° (toute la quantité 
de mouvement est transformée en énergie d'où la valeur de l'angle, ainsi la quantité de mouvement finale 
est nulle). 


La création d'une paire coûte évidemment au moins l'énergie de masse de l'électron et du positron, soit 
2mc?. Le solde d'énergie se répartit ensuite dans l'énergie cinétique des deux particules: 


hv = 2m0c7+Æf + EŸ (44257) 
La nécessité de satisfaire simultanément aux conditions de conservation de l'énergie masse et de la 
quantité de mouvement d'autre part impose à l'effet de matérialisation d'avoir lieu au voisinage d'une 


particule matérielle qui participe au phénomène. En effet, dans le vide, les deux conditions sont 
contradictoires ! La quantité de mouvement de chaque électron vaut: 


où Æ,, est l'énergie totale de chacun des électrons, c'est-à-dire: 


Ë, 


#=Moc+Æf* (44.259) 


Le photon d'origine a: 
kv 
hv = 2F,, et p, =— (44260) 
[es 


que nous introduisons dans l'équation de conservation de l'énergie et avec l'aide la relation donnant P, ; 
nous avons: 


2 
€ 
PE =2E4 2pa,- (£) (44.261) 


ce qui montre bien que par le terme &° /v > 1 que le noyau doit emporter une partie de la quantité de 
mouvement puisque: 


2 
< _ (44,262) 
Pate S Pete ‘ (44.262) 


4. MODÈLE NUCLÉAIRE "GOUTTE LIQUIDE" 


En ce début de 21ème siècle il n'existe pas de théorie générale qui sous-tende l'ensemble des propriétés 
expérimentalement découvertes relatives aux noyaux. Le noyau a de multiples facettes qui à ce jour ne 
sont pas réconciliables dans une théorie unique (la chromodynamique quantique n'arrivant pas à modéliser 
le noyau). 
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Les informations les plus précises sur les rayons des noyaux nucléaires et plus généralement sur la densité 
de charge des noyaux proviennent des mesures de diffusion d'électrons. Ces derniers considérés à ce jour 
comme particules élémentaires, ne subissent pas la force nucléaire forte garante de la cohésion du noyau 
et peuvent être considérés dans les traitements théoriques comme ponctuels. 


Voici en gros l'état de nos connaissances sur les noyaux en ce début du 21ème siècle: 


1. Le potentiel d'interaction nucléaire nucléon-nucléon est a priori attractif à l'échelle du noyau mais 
parfois aussi répulsif si la distance devient trop petite entre ses constituants. 


2. L'interaction nucléaire est de faible portée et présente un phénomène de saturation comme si chaque 
nucléon n'était lié directement qu'à ses seuls voisins directs (après s'être lié à quelques nucléons sa 
possibilité de liaison est épuisée), contrairement à la force électrostatique. 


3. La force nucléaire est a priori indépendante de la charge. Elle agit aussi bien entre neutrons, qu'entre 
neutrons et protons et protons-protons. 


Dans le modèle naïf que nous allons étudier ici (qui explique assez bien l'énergie de liaison des nucléons), 
le noyau sera assimilable à une goutte liquide nucléaire en première approximation sphérique et 
incompressible, de densité volumique constante donc: 


À fe 
ne R° 
3 


où À représente toujours dans le cadre ce chapitre le nombre de masse. 


Ce qui entraîne: 


avec: 
R=1.17-1070 [we] (44265) 


Cependant la modélisation échoue déjà ici car les isotopes du mercure présentent des rayons plus grands 
que ceux prédits dans le cadre du modèle et ce avec de fortes variations (ces variations étant inconciliables 
avec l'évolution régulière d'une goutte en fonction de son nombre de constituants). Il y a même des cas où 
en enlevant des neutrons, le rayon du noyau augmente de façon très importante. 


Passons maintenant en revue les différentes énergies en présence. Nous construirons chemin faisant la 
formule semi-empirique de von Weizsäcker. 


4.1. ÉNERGIE DE LIAISON EN VOLUME 


L'interaction nucléaire forte confère une "énergie de liaison en volume" de la forme: 
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Ey = ay À (4466) 


où est 4y une constante déterminée (dans un premier temps...) expérimentalement comme valant: 


ay =14 [MeV] (44267) 


et nous démontrerons comment la déterminer théoriquement un peu plus bas lors de notre détermination 
de l'énergie de Pauli. 


La représentation schématique de l'idée "énergie de liaisons en volume" (avec voisins directement 
connexes) donne: 


où les couleurs (rouge, blanc) ne sont là que pour illustrer l'ensemble des énergies de liaison que nous 
allons aussi voir par la suite. Il s'agit cependant bien évidemment indistinctement de nucléons (protons et 
neutrons). 


4.2. ÉNERGIE DE LIAISON SUPERFICIELLE 


Les nucléons proches de la surface externe du noyau sont moins liés via l'interaction forte que les 
nucléons situés en profondeur puisqu'ils ont moins de voisins directs. Il faut donc se départir de l'idée que 
chaque constituant possède la même énergie de liaison en volume et soustraire de la totalité de celle-ci 
une "énergie de liaison superficielle" proportionnelle à la surface du noyau qui est: 


S=47R? =47| RA!5 F = 478$ A°5 (44.268) 
Nous avons alors pour l'énergie superficielle: 
Ee = as A7 (44.269) 
où est 4s une constante déterminée expérimentalement comme valant: 
as=17[MeV] (44270) 


La représentation schématique de l'idée "énergie de liaison en surface" (avec voisins directement 
connexes) donne: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


C'est ce terme qui fait penser à une goutte liquide. En effet, dans une goutte liquide, les forces sont 
également supposées à courte portée (forces de Van der Waals), et donc saturent ce qui provoque 
immédiatement une tension superficielle. 


Nous avons donc jusqu'à maintenant l'énergie potentielle totale de liaison du noyau qui est donnée par une 
partie de la "formule semi-empirique de von Weïizsäcker" (ou "formule de Bethe-Weizsäcker"): 


4213 


E, = Êy +EÆEc=ayA-as (44.271) 


4.3. ÉNERGIE DE RÉPULSION ÉLECTROSTATIQUE 


Il nous faut aussi prendre en compte l'habituelle "énergie de liaison électrostatique" qui résulte de la force 
de répulsion électrostatique entre les protons: 


R 


® 
ce 


Comme elle est répulsive, elle diminue l'énergie de liaison (donc cela sera un terme négatif). Pour obtenir 
l'énergie potentielle électrique, rappelons que nous avons déjà démontré dans le chapitre de Mécanique 
Classique que pour l'énergie gravitationnelle nous avions: 


O 


3 1 (Ze  %? 7? ze 7! 2 
a — 
PC 547 R 207%n À 207 Rp 417 CS 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


avec la constante calculable: 


ac =0.72[Me7] (44274) 


Nous avons donc jusqu'à maintenant l'énergie potentielle totale de liaison du noyau qui est donnée par une 
partie de la formule semi-empirique de von Weizsäcker: 


2 
- = 2/3 2 . 
E, = Ey +Es+E, c=ayA-asA SCI (44.275) 


4.4. ÉNERGIE D'ASYMÉTRIE (ÉNERGIE DE PAULI) 


Ce terme énergétique s'inspire du modèle du noyau basé sur le gaz de Fermi où l'on considère le noyau 
comme un ensemble de A nucléons (quasi)libres enfermés dans une boîte rectangulaire ayant les 
dimensions du noyau et respectant des règles de quantification (ce que l'expérience semble mettre en 
évidence). La physique quantique n'est donc pas propre au monde atomique mais aussi à la structure du 
noyau (on pouvait s'en douter….). 


Nous avons alors démontré dans le chapitre d'Électrocinétique (lors de notre étude de la théorie des 
bandes) que sous certaines conditions (fortes!) bien précises, le nombre d'états maximum dans un volume 
sphérique était donné pour les fermions par: 


L 
n@)= "ET (44276) 


37 


où pour rappel &# est le nombre d'onde de Fermi qu'il est plus d'usage dans le domaine nucléaire d'écrire 


d'une autre façon en utilisant la relation de de Broglie (cf. chapitre de Physique Quantique Ondulatoire): 


p=h& (44277) 
Soit: 
pr 
#(p)= WT (44.278) 
3 


Nous pouvons alors avoir un nombre de neutrons (N) et un nombre de protons (Z) respectivement égaux 
au maximum à: 


3 3 
pl (pr | 


N= tr 
37H 3h 


(44.279) 


Connaissant l'expression du volume d'un noyau, sous l'hypothèse de modélisation par une goutte liquide 
sphérique et incompressible, nous avons explicitement: 
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3 3 3 3 3 
EF = PE Rs = “PR (RAS) = SPFL 3 (44.280) 
37h 37H 3 97h 97h 


n = n(p) = 


Nous avons donc in extenso: 


153 
Es : É | ñ 
pr=| | =|—»#| — (4281) 
# 


En assumant que: 


Nous avons alors pour la quantité de mouvement (du nucléon considéré comme (quasi)libre dans le 
noyau... par construction des hypothèses de la théorie des bandes): 


np (SAYS ñ (or\ nn | 
PorpePr (as) SR le 5 
Àj À 


Connaissant expérimentalement Àj, nous en extrayons une valeur numérique. De celle-ci, nous pouvons 


en tirer, en prenant la formulation classique de l'énergie (donc non relativiste), que le niveau d'état 
d'énergie maximum (niveau de fermi du noyau) est alors: 


2 
IPF 33 [Mey] («4284 
2 m 


| AR 
3 J 
be 0 0er * 
0 N 3 3 3 
PF PF _y PR y PF 
32H FC 3H (44.285) 
Tr ŸF à 
31 SP dp [r“æ 31,5 .: 
= = 0 = 25 2 PF 220 [MT] 
3 3 3 5 dy 
PF PF PF 


L'énergie cinétique totale du noyau est alors (en approximant la masse du neutron comme étant égale à 
celle du proton): 
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(44.286) 


3 3 
h | 2 
\PF| = \PF| (44.287) 
37h 3h 


Il vient: 


213 
pe) En 
23 
F F 2 51 7513 
PRTÉ +73 LH {sr | [N°27 
5 2#y 2m DIF Foy My 
2 283 
372 372 | 55 758 | 3 | 372 | A5 _ (44.288) 
EE — | ———— — + — |= — — + — 
10 x(r 4% | Mn My 10 . Rj A Feu Fp 


: 372 CRE 


Et si nous posons: 
Mn = My = M (44289) 


Nous avons alors: 
3 (or | 158 4 758 
E, = nt jrs ne — (44.290) 
IOMWR, 4 A 
Nous savons que: 
E, = Er -—EÆ, (44291) 


Nous allons chercher à obtenir une relation similaire en faisant une approximation astucieuse. Pour cela, 
en se rappelant que À = Z + N, nous allons considérer le rapport: 


7_N-Z2 _A-22 
A A 


Z 
=1-2— (44.292) 
A 


qui sera supposé petit. Nous avons alors: 
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513 513 58 053 4513 PA a 24 
NU +27" =(A-Z) +77 =A fi-2) +(2) (44.293) 


A 
Nous avons aussi: 


(44.294) 


Il vient alors: 


PB +798 2 48 ( - 2 (2) = 48 (- I + 2") 
= #5 (2 - =)" = ol [a+ LP +(1-27 Fr» |] 


Le développement en série de Taylor en 1 au deuxième ordre donne: 


(44.295) 


ES ds = 1421 ++. 
5 5 (44.296) 
EP à à Be ed 
3 9 


et donc: 


Nous avons alors: 
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2 243 543 
Rem (nf 1 (a), 


ere] 


s(N-ZŸ 
F2. 


_ 32 ge) 1 ÊR . 
5MRÈ \ 4 458 (2 9 A 


(44.298) 
37 28 ( 1 Ÿ# s(N-ZŸ 
= (97) — St ——— 
SMRÈ 2) 958] 9 A 
M GB 0 5(N-2) 
SMRÈ PC 9 A 
3}? (97125 s(N-ZŸ (N-Z\ 
= 3 _ = y A+ 4 = Ër - Ep 
SMRÉ 2 9 A 


Ainsi nous avons fait d'une pierre deux coups: d'une part nous avons identifié la valeur du coefficient du 


terme d'énergie de liaison volumique &y et d'autre part nous en déduisons le terme d'énergie d'asymétrie: 


2 
(N—-Z) 
Ep = 44 ——- Ey (44299) 


Nous avons alors un terme d'énergie potentielle qui apparaît sous la forme: 
(N-ZŸ 


avec: 


a 4 = 21 [Me] 
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Puisque ce terme est nul lorsque le nombre de neutrons est égal au nombre de protons, nous comprenons 
alors un peu mieux l'origine de la vallée de stabilité. 


Nous avons donc jusqu'à maintenant l'énergie potentielle totale de liaison du noyau qui est donnée par une 
partie de la formule semi-empirique de von Weizsäcker: 


2 (N-2Ÿÿ 
E, = Ey +Es +E,c +E, = ay Aa A? CR 4 — (44.301) 


4.5. ÉNERGIE DE PAIRE (ÉNERGIE D'APPARIEMENT) 


Une étude systématique des noyaux montre qu'ils sont plus stables quand ils sont constitués d'un nombre 
pair de neutrons ou de protons. Empiriquement, nous écrivons ce fait en soustrayant l'énergie de paire 
suivante: 


où 4 vaut -11.2 [MeV]siZ et N sont pairs, 0 si A est impair et 11.2 [MeV] si Z et N sont impairs. 


Nous avons alors au final l'énergie potentielle totale de liaison du noyau qui est donnée par la formule 
semi-empirique de von Weizsäcker: 


(44.304) 


volume surface coulomb 


L'énergie de masse du noyau peut alors s'écrire: 
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VIT II erAN ER EPIUEIR [SCIENCES.CH] 
2 2 
£ (A—-27 1 ô 


2 2 2 243 
Mac = mA Ze +2m,e —| apA-QoÀ  -Q0 —- 0 4 —————- > 3 
AC nt ) p F s C 45 A A F4 (44.305) 


Remarque: Les valeurs numériques des constantes ne sont à ce jour pas encore normalisées et nous 
pouvons trouver dans la littérature plusieurs jeux de valeurs différentes. 


Signalons que le modèle de la goutte liquide échoue aussi à expliquer que les éléments de fissions ne 
soient pas de taille symétrique (le modèle de goutte liquide privilégiant une fission en deux noyaux de 
même taille). 


Nous avons pour le modèle théorique ci-dessus la représentation graphique correspondante: 


20 


E, [ Me F] | 
Energie de volume 


5 NN NN 


PS coulombienne 


10 LL 


LT, 


Énergie d'asymétrie 


Énergie potentielle totale de hason 


0 50 100 150 200 250 
A 


Figure: 44.18 - Représentation schématique de la formule semi-empirique de von Weizsäcker 
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Nous voyons ci-dessus que l'énergie de liaison moyenne peut être considérée très approximativement 
comme constante. Ceci peut être interprété aussi comme une force exercée par un nombre limité de 
partenaires. Nous parlons alors de "force saturante". Par force saturante nous entendons que pour une 
force donnée, il existe une limite au nombre de nucléons mis côte à côte à partir de laquelle l'ajout d'un 
nucléon ne fait plus qu'apporter une énergie de liaison supplémentaire constante. Ce sont donc les proches 
voisins qui amènent la force à son niveau, l'arrivée de nouveaux voisins ne faisant plus par la suite que 
soutenir la valeur moyenne atteinte. C'est la raison pour laquelle nous disons que l'énergie de volume ne 
se calcule qu'avec les voisins directs et que le modèle est aussi assimilable à une goutte liquide (les 
molécules d'une goutte d'eau n'étant sensibles qu'aux molécules directement voisines). 


Cette approche permet aussi d'expliquer l'augmentation de l'énergie de liaison par nucléon pour les faibles 
masses. Effectivement, considérons une force dite de type "F2". Nous avons alors la construction des 
noyaux grâce à ce type de géométrie: 


î 
Il 
a 


A=4 

A=5 

Chaque nucléon a deux liaisons (excepté le cas À = 2 ce qui explique que l'énergie de liaison augmente 
pour les petits À) et épuise les possibilités de la force de type F2. Cette limitation n'impose aucune 
restriction sur la taille des objets à construire et nous pouvons imaginer des édifices aussi gros que nous 
voulons, stabilisés par ce type de force. 

Si nous calculons l'énergie totale de liaison, nous aurons 1£? pour A = 2, où ÆP est l'énergie potentielle 
de liaison apportée par une liaison. De même, nous aurons 3Æ> pour À = 3, 4£> pour À = 4, 5EP pour 
A =5, etc. L'énergie de liaison par nucléon sera alors Æ> /2 pour À = 2 puis Æ pour toutes les autres 


masses, pour une force constante F2. Donc cette force sature au-delà de À = 2. 


Si nous prenons une force de type F3, nous aurons: 
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A=2? A=4 


F.| 


x 
Ê 


Si nous calculons l'énergie totale de liaison, nous aurons 1Æ> pour À = 2, où Æp reste l'énergie 


5 


potentielle de liaison apportée par une liaison. De même, nous aurons 3#> pour À = 3, 6ÆP pour À = 4, 


TER pour À =5, etc. 


Remarque: Notons que pour À = 5 seules 2 liaisons peuvent partir du dernier sommet du pentagone 
sans quoi un autre sommet de celui-ci compterait 4 liaisons et non 3 (force F3). 


La valeur asymptotique de l'énergie de liaison par nucléon sera alors de 1.5#> pour toutes les masses 


supérieures à À = 3, pour une force constante F3. Donc cette force sature au-delà de A = 3. 
Nous pouvons continuer avec des noyaux incluant de plus en plus de nucléons. 


Dans le cas particulier d'une force qui pourrait interagir avec tous autres nucléons environnants, il y aura 
comme nous l'avons démontré dans le chapitre de Théorie Des Graphes pour des graphes complets: 


A(A-T) 
: 


liaisons au total et donc un comportement en { A 11/2 dans l'énergie de liaison moyenne (puisqu'il s'agit 
simplement de diviser par À le nombre de liaisons). Donc dans le cas classique, l'énergie de liaison ne 
ferait qu'augmenter ce qui n'est pas compatible avec l'expérience. 


Exemple: 


Voyons quelques applications de ce modèle en commençant par examiner les prédictions sur la fission de 


l'uranium nt en deux sous-produits égaux en masse et en charge: 
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ÂX 242% (4307) 
et ce en utilisant le modèle de la goutte liquide en négligeant les termes d'énergie d'asymétrie et 
d'appariement. 


Pour cela, rappelons que: 


72 (A-2ZŸ 6 
E (AZ)=apA-ae A5 0 a 7 (44308) 
D F s APTE A VA 


et nous prendrons comme valeurs des constantes: 


ay = 15.85 [Me] 

as = 18.34 [MeF] 

ac =0.71[4e7] (44.309) 
a 4 = 23.21 [MeV] 
ô=12[W 7] 


Évaluons la différence d'énergie entre d'une part les 2 noyaux issus de la fission et d'autre part le noyau de 
départ. 


Nous avons alors: 


AE=2M|É2X le -M|£Xm lc 


72 2 (44.310) 
& 2 ay A - ag Aÿ" —äc = = ras = a” —äc = 
s À 


comme: 
2ay As — ay An =ay|24; — A, \=apl2Âr — 24; i= Û (44.311) 


Le développement se simplifie en: 
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PER 1 
Am É | (44.312) 
2 


| | 72 -2 | à 
= a 5428 (1-21 ace F2 = as #8 (1-25 ac (1-228) 


S'il y a fission, nous aurons ÀE > 0, donc: 


2 
| | Z1 4 Dh 
as [1-2 eee (12 28) Gusis 


Et donc: 
as(1-25) 2 
TT 7 (44314) 
acl1-2°7 | 
ou réarrangé: 
72 agli-2) 
> (44.315) 


Soit en mettant les constantes, cela donne: 


2 
7 >18 (44.316) 
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Il s'agit donc de l'inégalité devant être satisfaite pour que comme énoncé dans l'exemple, la fission génère 
des produits identiques en masse et en charge. 


Or, pour SU nous avons: 


2 2 
Z 92 
——=———=36>18 (44317) 
A4, 236 
Donc d'après le résultat ci-dessus ct peut fissionner de manière symétrique mais ce n'est pas le cas 


dans l'expérience, car dans la réalité, nous avons: 


26 743 500 17 O4 More om (44318) 


Il y a cependant une autre approche théorique possible qui donne un résultat plus en accord avec 
l'expérience. Effectivement, nous pouvons imaginer qu'un noyau peut subir une fission si la force dérivée 
de l'énergie de surface est exactement compensée par la force de Coulomb. 


Au final, nous comparerons le rapport Z : /4 obtenu avec le résultat précédent. 


Rappelons d'abord que nous avons vu dans le chapitre d'Électrostatique (entre autres...) que la force 
électrostatique dérive du potentiel électrostatique: 


_ 148 


(44.319) 
e dR 


FES 


dR 


où le rayon R a dans notre cas la valeur du rayon nucléaire avec pour rappel: 
R=RjA" (44320) 


Nous avons alors: 


2 
1 (R 1 
He ad =") #7 
e Æ9 € RÈ 
: (44.321) 
Ue(R=-lapz24 18 2 1, 72 ES =-l, 72RR 
e e À e 


Donc: 
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à & 24 24 Da 
Fs(R) = tee) = EE = LE A3 - “AS 413 
eRÿ eRÿ kel Ré k|Æ 
(44.322) 
7° re 72 72 
Fc (R) = wa ac2 À p = ac2" AR 9-2 us Àg ro Loue 47283 
dR e e kel le 


Si la répulsion coulombienne l'emporte, la fission l'emporte et nous avons alors: 
Fe(R)> Fo(R) (44323) 


Soit: 


î 
22° 4288 > as 48 (44.324) 
FIR Fl& 
Après simplification il reste: 
acZ?A 8 > 2aç A (4325) 


Soit: 


27, 2as . 2.18.34 
A ap 071 


z 52 (44.326) 


Comme ce rapport pour ŒU est voisin de 36, donc inférieur à 52, cette approche expliquerait naïvement 


pourquoi il ne peut y avoir de fission de manière symétrique (ce que l'expérience confirme). 
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Notes personnelles: 
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45. PHYSIQUE QUANTIQUE DES CHAMPS 


À sant la formulation de la physique quantique, les particules et les champs étaient considérés 


comme des entités distinctes mais liées; les particules possèdent certaines caractéristiques intrinsèques 
(comme la masse et la charge électrique) et produisent les champs (gravitationnels et 
électromagnétiques). Chaque champ de force émane des particules et remplit l'espace autour d'elles. 
Les champs emmagasinent et peuvent transporter de l'énergie; ils sont, en ce sens, des milieux continus 
réels qui lient les particules et communiquent les interactions entre elles. On considérait que les 
particules étaient composées de matière et les champs étaient composés d'énergie. La notion de champ 
de force était l'alternative du 19ème siècle à l'ancienne action à distance assez mystérieuse. Des 
particules qui ne réagissent à aucun champ de force ne sont pas observables et physiquement n'ont 
aucun sens. De même, des champs de force qui n'agissent sur aucune particule sont également sans 
signification. Les notions de particules et de champs n'ont donc un sens que lorsqu'elles sont reliées. 


La notion de champ a commencé à être modifiée fondamentalement avec l'introduction par Albert 
Einstein du concept de photon. Selon cette nouvelle conception, le champ électromagnétique n'a pas 
son énergie distribuée d'une façon continue dans l'espace. Le photon est le "quantum du champ 
électromagnétique". Il transporte l'énergie et la quantité de mouvement du champ. L'interaction 
électromagnétique de deux particules chargées et le transfert de l'énergie et de la quantité de 
mouvement d'une particule à l'autre doivent donc avoir lieu par l'échange des quanta d'énergie 
électromagnétique, les photons. La théorie de telles interactions (entre particules chargées), appelée 
"électrodynamique quantique" (Q.E.D.), a été la première application réussite de ces idées (elle permet 
de démontrer la structure fine du modèle de Sommerfeld, d'expliquer le spin de l'électron, etc.) et c'est à 
elle que nous allons nous intéresser ici. 


Dans ce chapitre, nous n'avons pas souhaité faire un cours complet de physique quantique des champs 
car pour rappel, l'ensemble du site n'a que pour objectif de donner les bases de ce qu'un ingénieur doit 
connaître au début du 21ème siècle et accessoirement à l'auteur de se faire plaisir en étudiant des sujets 
qu'il n'avait pas pu voir pendant son cursus scolaire. À ce titre, le lecteur intéressé à approfondir plus 
cette matière pourra se reporter au meilleur ouvrage que nous ayons eu entre les mains à ce jour 
(développements détaillés, simples et pédagogiques avec de nombreux cas pratiques) sur ce sujet qui 
est celui Quantum Mechanics with Basic Field Theory de Bipin R. Desai (référence [96] dans la 
bibliographie). 


Remarque: La théorie quantique des champs est l'application de la mécanique quantique aux 
champs. Elle fournit un cadre largement utilisé en physique des particules et en physique de la 
matière condensée. Les bases de la théorie quantique des champs auxquelles nous allons limiter 
notre étude furent développées entre 1935 et 1955, principalement par Paul Dirac, Wolfgang Pauli, 
Sin-Itiro Tomonaga, Julian Schwinger, Richard Feynman, et Freeman Dyson. 


Avant de nous lancer dans les calculs (voir plus loin), montrons que l'approche proposée 
précédemment, peut être considérée à l'aide d'un formalisme fort simple (pédagogique). 


Le lecteur doit cependant se rappeler que les approches simples nécessitent parfois des constructions 
mentales erronées (par trop simplificatrices) par rapport à la réalité, mais qui satisfont à l'objectif visé: 
avoir un modèle compréhensible et plus ou moins intuitif. 
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Considérons à ce titre la figure ci-dessous (représentation de la collision élastique de deux électrons): 


: Temps 


Espace 


Cette figure est appelée, et à tort (!), dans de nombreux ouvrages pédagogiques "diagramme de 
Feynman" (en réalité il s'agit seulement d'un diagramme qui y ressemble un peu car les vrais 
diagrammes de Feynman sont destinés à calculer des produits de Wick dans une série perturbative). 


Supposons que les deux électrons qui y sont représentés, se déplacent initialement à la même vitesse. Ils 
s'approchent d'abord puis s'éloignent l'un de l'autre le long d'une droite dans l'espace qui est projetée sur 
l'axe des temps, dans le sens des temps croissants. L'électron à gauche émet un photon (la ligne 
ondulée), et pendant un certain temps /#, il y a deux électrons et un photon. L'électron à droite 
absorbe ensuite le photon et l'interaction est momentanément terminée; d'autres photons feront par la 
suite l'aller et retour entre les électrons. La force moyenne est proportionnelle au taux de transfert de la 
quantité de mouvement due à l'échange des photons. La probabilité de l'émission ou de l'absorption de 
photons par une particule est reliée à sa charge. La force doit donc être proportionnelle au produit des 
charges en interaction (en accord avec la loi de Coulomb). Pensez à la force de répulsion entre deux 
astronautes flottant dans l'espace et échangeant une balle dans un sens puis dans l'autre (c'est une 
approche pédagogique du problème mais qui ne s'applique pas par exemple à l'attraction entre deux 
particules de charges opposées!). Cependant, le phénomène inverse d'attraction ne peut être visualisé 
de cette manière mais uniquement sous forme mathématique formelle. 


La collision présentée dans la figure ci-dessus est élastique; l'énergie de chacun des électrons est 
inchangée dans la collision. Malgré cela, pendant un temps {ÿ, le système contient une quantité 
d'énergie supplémentaire hv correspondant au photon. Pendant ce temps À, la conservation de 
l'énergie est apparemment violée! Peut-on tolérer cette situation? La réponse, donnée par la physique 
moderne, est oui; mais elle ne peut jamais être observée. Autrement dit, il y a toujours une certaine 
incertitude AZ sur la valeur mesurée de l'énergie d'un système. Le principe d'incertitude de Heisenberg 
impliquant (voir démonstration dans le chapitre de Physique Quantique Ondulatoire) que: 


M'AF=R 


Une violation de la loi de conservation de l'énergie jusqu'à une quantité AÆ sera cachée par 
l'incertitude sur l'énergie à condition que le temps disponible pour faire l'observation A soit 
suffisamment grand tel que 
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évidemment une valeur inférieure à A satisfait également la condition. Nous pouvons donc écrire: 


(45.3) 


az 


L'incertitude sur l'énergie dépasse l'énergie d'un photon d'énergie hv si le photon existe pendant un 
temps plus court que: 


Ce photon est alors observable sur une distance maximale de: 


R=c'AM= É (45.5) 
4x f 


et comme la fréquence peut être arbitrairement petite, la portée de la force transmise par le photon sans 
masse est illimitée. Il peut paraître dans cette relation que la portée est limitée pour un photon libre. 
Mais ce serait oublier (cf. chapitre de Physique Quantique Ondulatoire) qu'un photon libre n'existe pas, 
car il aurait une fréquence totalement indéterminée. Donc la distance d'interaction le serait aussi. 


Ces quanta d'échanges, qui sont inobservables, sont appelés des "photons virtuels". Comme les photons 
ne sont pas chargés, nous disons aussi que l'interaction s'effectue par "courant neutre”. 


Une approche beaucoup plus satisfaisante est celle qui consiste à utiliser la masse comme terme 
d'énergie: 


À l'aide de cette relation, il est possible de connaître le temps pendant lequel une particule virtuelle peut 
parcourir une distance qui correspondrait à: 


k 


R=gc. ht -— (45.7) 
QC 


Nous verrons plus loin comment déterminer approximativement la masse des particules virtuelles qui 
interviennent dans les forces nucléaires ce qui nous permettra d'estimer la durée des interactions 
comme étant de l'ordre de 107% [5]. 


Vers la fin des années 1920, il était devenu clair que l'on pouvait considérer chacune des particules 
connues (proton, électron, etc.) comme le quantum d'un champ spécifique. Dans cette vision, il y a un 
champ d'électron, un champ de proton, et ainsi de suite comme nous le démontrerons plus loin 
(l'Univers serait donc un ensemble de champs unifiés). Un objet quelconque est en réalité un ensemble 
de manifestations observables des quanta des champs. 
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Par ailleurs, nous avons vu que l'écriture des équations d'onde pour des particules relativistes (équation 
de Dirac et équation de Klein-Gordon vue en physique quantique relativiste) amène des problèmes 
insolubles classiquement, notamment des énergies négatives. En fait, cette approche n'est pas justifiée, 
car d'après l'équation d'Einstein masse et énergie sont équivalentes et si l'on rajoute à cela le principe 
d'incertitude d'Heisenberg énergie-temps nous constatons qu'un nombre infini de particules peuvent être 
créées ou annihilées, d'où la nécessité d'un modèle ne prenant plus en compte les propriétés d'une seule 
particule, mais d'un ensemble de particules, aussi bien réelles que virtuelles. 


Remarque: Quand Fermi formula sa théorie des interactions faibles en 1932, il la fonda sur les 
mêmes principes que l'électrodynamique quantique (c'est une des raisons pour laquelle la QED est 
appelée "bijou de la physique" - le modèle standard est calqué sur cette théorie par ailleurs). Deux 
ans plus tard, le physicien japonais H. Yukawa proposa que l'interaction faible était due à l'échange 
d'un boson virtuel massif. 


1. POTENTIEL DE YUKAWA 


Le meilleur moyen pour argumenter l'exemple des quantums reste la "démonstration" de la loi de 
Coulomb (et de Newton) à partir des résultats que nous avons obtenus en physique quantique 
ondulatoire (nous devons ces développements à Yukawa). 


Une version simplifiée de cette démonstration consiste d'abord à se rappeler de l'équation de Klein- 
Gordon libre (cf. chapitre Physique Quantique Ondulatoire): 


2 
: 5% = hc'AY - nèc"% (45.8) 


dd 


k 


cette équation décrit la dynamique d'amplitude de présence d'une particule sans spin dans le temps dans 
un potentiel donné. 


Considérons une composante de statique (indépendante du temps) à symétrique sphérique: 
YW=uU(r) (459) 
L'équation de Klein-Gordon se réduit alors à: 
Re AU(r)- me U(r) =0 (45.10) 
Si nous divisons des deux côtés de l'égalité par 32.2: 
AU(r)-R me U(r) = 0 (45.11) 
Rappelons (cf. chapitre de Calcul Vectoriel) la notation du laplacien d'un champ scalaire: 
ŸY2=A (45.12) 


ainsi que son expression en coordonnées sphériques où >» = 0 est identifié à l'origine du champ (cf. 
chapitre de Calcul Vectoriel): 
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y = sf ,,1#, LAS ,cot#af, 1 7 : 


— —— (45.15) 


8?  rôr r° 48 r? 489 r°sin 84# 


Comme le champ Ur) est à symétrie sphérique (dépendant de r uniquement) le laplacien se réduit à: 


Donc l'équation du champ U(r) s'écrit: 


14f:4 
7. PEU] rmét 0 (45.15) 
7 Fr 


Cette équation différentielle a pour solution (on devine assez facilement que l'exponentielle est une 
solution possible): 


Ur) = Ce -r ir me) (45.16) 
F 


où C est une constante d'intégration. 


Dans le cadre de l'utilisation des unités naturelles (ce qui est le plus fréquent à ce niveau dans la 
littérature scientifique) ce potentiel s'écrit: 


Ce. = 
Utr)=—e "0 (45.17) 
Fr 


et se nomme "potentiel de Yukawa". 


Le lecteur remarquera que mise à part la distance r, l'autre variable dans l'exponentielle est la masse 
(les autres termes étant des constantes universelles). Conséquence: le potentiel de Yukawa est aussi 
bien un "champ scalaire" dans le cas où la masse est nulle (voir l'exemple ci-après) qu'un "champ 
massique" dans le cas où la masse est non nulle ! 


Cela nous conduit à l'hypothèse suivante: si c'est le champ électrique qui maintient les particules 
chargées entre elles dans l'atome (voir le traitement du champ non-massique ci-dessous), c'est le champ 
massique qui maintient les particules non chargées entre elles dans l'atome. 


Autrement dit, si des particules interagissent par l'intermédiaire d'un champ massique de masse #3, (au 


lieu d'interagir avec des photons de masse nulle), leur force mutuelle va décroître exponentiellement (ce 
qui est très rapide). 


L'approce de Yukawa permet une nouvelle approche interprétation des phénomènes nucléaires, mais 
elle reste toutefois trop naïve pour expliquer adéquatement les interactions fortes dans leur ensemble. 


1.1. CHAMPS MASSIQUES 


Le physicien H. Yukawa proposa donc en 1935 que la force nucléaire devait sa très courte portée au 
fait qu'elle était transmise par des particules massives (plus la masse du quanta échangé est grande, plus 
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la portée de l'interaction est réduite), décrites par le champ massique ci-haut. 


Remarque: Dans le cadre historique de l'époque ces particules hypothétiques étaient les "mésons". 
Mais nous verrons que cette hypothèse ne tiendra pas la route très longtemps. 


Voyons cela de plus près. Notons le potentiel de Yukawa sous la forme suivante: 
és 
Ur) = —e7'# 
Fr 


avec: 


Ch 
ET 


Cette notation n'est pas innocente, car comme nous le verrons en détails plus loin, lorsque À — +0 
(cas de l'interaction électromagnétique et gravitationnelle) alors #9 — Ô et nous retrouvons alors la loi 


fondamentale de l'électrodynamique ou de la gravitation où la particule d'interaction est respectivement 
le photon (masse nulle) pour la première et le graviton pour la deuxième. 


Ainsi, en supposant que le rayon de l'interaction nucléaire forte (cohésion des nucléons entre eux) est 
Rz= 1.101 [#] et celui de l'interaction nucléaire faible (qui serait à l'origine de la désintégration bêta 
comme nous l'avons précisé dans le chapitre de Physique Nucléaire) 8 = 1.10 71% [#], nous obtenons 


alors les énergies de liaisons des interactions ainsi que leur masse approximative immédiatement: 


- Pour "l'interaction nucléaire forte": 
E = mc? = — 23.15.10 [J]z 196 [WMV] 


10 À [kg] = 3867, = 2m, 


soit environ 386 fois la masse de l'électron et 1/5 de la masse du proton. 


Deux ans après cette prédiction de Yukawa, les physiciens découvrirent une particule correspondant à 
cette masse: le méson ;;-. Il s'avérera plus tard que ce n'était pas la bonne particule mais une particule 


de même type que l'électron, soit un lepton et donc un fermion (ce ne peut donc être une particule 
messagère). De plus, les expériences de diffusions et de collisions avec des protons, deutérons, etc. à 
des énergies de plus en plus hautes ont montré qu'il y avait une modification de l'intensité/forme de 
l'interaction forte incompatible avec l'hypothèse d'un seul méson. En outre, les résonnances 
hadroniques montraient qu'il existait des états excités des mésons ce qui est difficile à imaginer pour des 
particules considérées comme fondamentales en analogie avec le photon!! 


Les particules détectées dans les laboratoires et qui semblaient être les meilleures candidates à l'époque 
(car il y en avait plusieurs...) de l'interaction nucléaire forte étaient les "pions" (ou “mésons pi") qui se 
présentent sous trois formes: 
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xt,7 70 (45.21) 


et qui sont 270 fois plus massifs que l'électron. Donc cette différence de masse indique bien que le 
modèle de Yukawa n'est pas tout à fait exact. 


Avant la découverte des quarks (dont sont constitués les mésons), les mésons pi (pions) étaient donc 
considérés comme les vecteurs de l'interaction forte (aujourd'hui nous savons qu'en fait ces vecteurs 
sont les gluons). 


- Pour "l'interaction nucléaire faible": 


= 
an 
(dx. 
ND 
N 


Il s'agit donc d'une masse colossale, une centaine de fois la masse du proton! Les vecteurs d'interactions 
ont des candidats qui ont été mis en évidence en 1983 dans les accélérateurs du CERN. Ces particules 
messagères de l'interaction nucléaire faible se nomment les "bosons intermédiaires" + 7, z0. 


Ces observations amenèrent l'hypothèse que la théorie de Yukawa n'était pas une théorie assez 
fondamentale quoiqu'elle représente bien certaines de ses propriétés... 


1.2. CHAMPS NON-MASSIQUES 


Imaginons maintenant un champ scalaire à symétrique sphérique statique, dont le photon (particule sans 
spin) est l'hypothétique quantum d'échange. 


Comme la masse du photon est nulle, l'expression de U(r) se réduit à: 
C 
U(r)=— (45.23) 
r 


Si nous interprétons U(r) comme le potentiel électrostatique source d'une quantité © = #4 de charges 
élémentaires q alors la constante C dans notre système métrique vaut: 


= La (45.24) 
Â7E 
Tel que: 
Ur) = 7e (45.25) 
AXE r 


Comme nous avons: 


Cr) = En (45.26) 


Il en découle: 
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aU(r) 1. © 
= -E# = ns 
dr AXE r 
Ce qui nous donne: 
= 0 
AXE r 


Conclusion: Si une particule se trouve dans un champ de potentiel à symétrique sphérique U(r) dont le 
photon est supposé être initialement le quantum d'interaction alors nous avons affaire à un champ 
électrostatique dont l'expression est identique à la loi de Coulomb (ceci valide donc encore une fois de 
façon magistrale la théorie de la physique quantique ondulatoire). 


Remarque: Le photon est donc bien le quantum d'interaction du champ électrique à symétrie 
sphérique (lorsque les charges ont une vitesse relativiste le champ électrique n'est pas à symétrie 
sphérique et les équations deviennent un peu plus compliquées - voir le chapitre de Relativité 
Restreinte) et nous ne devrions plus parler de charge électrique mais de "transparence" aux 
photons. Effectivement, le neutron étant neutre globalement celui-ci ne devrait pas interagir avec le 
champ électrique, mais comme il est composé de particules chargées (les quarks) les expériences 
mettent en évidence une affluence en présence du champ électromagnétique (dont le photon est le 
quantum d'interaction). 


Ceci dit, en appliquant le même raisonnement, nous pouvons de même retrouver le potentiel 
gravitationnel de Newton: 


a = Fues 

Fr 

Ce qui impliquerait que le quantum d'interaction du champ gravitationnel est aussi sans masse (du 
moins dans le cas des petites masses étant donné que nous savons que le potentiel de Newton n'est 
qu'une approximation de la relativité générale dans le cas des petites masses). Étant donné que le 
champ gravitationnel ne semble pas interagir avec la présence d'un champ magnétique ou 
électrostatique, cela nous amène à émettre l'hypothèse que le quantum d'interaction n'est pas le photon 
et à supposer qu'une autre particule, que nous appellerons "graviton", en est le messager. 


2. ÉQUATION D'EULER-LAGRANGE DES CHAMPS 


La façon dont la théorie des champs fut introduite à partir des particules élémentaires par Dirac est 
connue pour des raisons historiques sous l'appellation de "deuxième quantification". 


Il est peut-être utile de mettre en évidence une possible source de confusion: les champs ne sont pas liés 
à la dualité onde-corpuscule. Ce que nous entendons par "champ" est un concept qui permet la création 
ou l'annihilation de particules en tout point de l'espace comme nous le verrons dans les développements 
mathématiques. 


Rappelons que nous avons défini dans le chapitre de Physique Quantique Ondulatoire lors de l'étude de 
l'équation d'évolution de Schrôdinger l'opérateur d'Heisenberg, nécessaire à la condition de 
normalisation de De Broglie: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


it it 


XO=eh Xeh (4530) 


En dérivant cet opérateur par rapport au temps, nous avons trivialement: 
: Ë 
ÆX(£) = 70] (45.31) 


où rappelons-le, le commutateur de deux opérateurs est donné (comme nous l'avons déjà vu lors de 
notre étude des opérateurs adjoints et hermitiques en physique quantique ondulatoire) par définition 
par: 


[a, 81= af - 6& (45.32) 


C'est l'hamiltonien H qui fait irruption en premier dans la relation précédente. Mais nous pouvons tout 
aussi bien lui substituer un hamiltonien dépendant du temps H(t) tel que: 


X (8 = -HXO.AO] (45.33) 


Maintenant, nous pouvons substituer à X{(#) des observables connues telles que: 


i@ = O0) 


SR 
O1 
Lo 
À 


5 = OO) 


dites "équations du mouvement de Heisenberg". Ce qui est intéressant dans les deux relations obtenues 
précédemment, c'est la façon avec laquelle se réalise la jonction entre la physique quantique et la 
mécanique classique. Effectivement, nous avions démontré dans le chapitre de Mécanique Analytique 
que les relations ci-dessous sont et seront toujours valables quel que soit le domaine étudié: 


ainsi que: 


et en supposant la généralisation à plusieurs degrés de liberté comme étant intuitive: 
H = D Pid =f£. (45.37) 


La généralisation à plusieurs degrés de liberté est immédiate et nous donne l'ensemble des relations 
(nous allégeons les écritures en omettant l'écriture de la dépendance à la variable temporelle): 
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d£, 
Pr 


36. tH=S pà, -L 


. 04 
du : 


D: Fi le #1] (45.38) 
44 © 
I 
- = — 2 = .# 
Pr 84, Pa RL: ] 


Nous avons encore besoin de deux autres relations importantes que nous allons de suite déterminer. 
D'abord, d'après les définitions des commutateurs, il est inutile de démontrer que (trivial): 


[g,g]=[2,p]=0 (4539) 


Par contre, il est un peu plus subtil de démontrer la valeur de [4,p] (nous plaisantons...). Rappelons 


que nous avions démontré lors de notre étude des opérateurs linéaires fonctionnels que (nous nous 
restreignons au cas de la coordonnée x ici): 


et que q représente une coordonnée généralisée (x par exemple..). Nous avons donc (résultat déjà 
démontré dans le chapitre de Physique Quantique Ondulatoire.…): 


hk à hd hA 
[g,p]= A) A2 


À 
=0-—=;ih (45.41) 
i x î 


i 0x oi dx 


Les deux dernières relations peuvent être généralisées à toutes les composantes voulues telles que: 


[4,,2,1"[P5,2,1=0 


| (45.42) 
CRE 0 LE à, COR 


avec rappelons-le (cf. chapitre de Calcul Tensoriel): 
n . (lai 
ô; = 8 = 6; ... . (45.43) 
Osii j 
qui est le symbole de Kronecker. 


Pour en arriver enfin à la théorie quantique des champs, il nous faut encore généraliser à une infinité 
continue de degrés de liberté. En effet, même le plus simple des champs est caractérisé, à un instant t, 
par une infinité continue de quantités: 


D(x,y,z,6) = DA (45.44) 


pour tout x. Nous pourrions donc imaginer représenter la fonction par ses valeurs (X,f) en un 
ensemble discret de points x, que nous rendrons en fin de compte infiniment dense (prenez garde au 


fait que nous utilisions la notion de densité !). Nous pouvons aussi travailler, pour commencer, non pas 
dans tout l'espace, mais dans un volume fini que nous finirons par rendre très grand. En procédant ainsi, 
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nous pouvons trouver comment généraliser le formalisme canonique et le processus de quantification. 
Au niveau formel, nonobstant de subtiles questions de convergences (voir les parties mathématiques du 
site), la généralisation aux systèmes continus consiste principalement à remplacer les sommes sur des 
indices n par des intégrales sur des arguments x, et les deltas de Kronecker par des deltas de Dirac (sur 
l'espace-temps): 


5% (GMA) (V2 22Ë)) = 5((4) ÉD EME: pie Cp (45.45) 
En considérant alors le principe variationnel comme nous l'avons étudié en mécanique analytique: 


te 


S(g,d) = [EG dat (45.46) 
4 


et le principe de moindre action nous imposant: 


te te 


ôS = 6 [dt = [éLat =0 (45.47) 
t EP 
où le lagrangien sera maintenant une fonction du champ ®(Xx,f) et de dérivée par rapport au champ 
#(x,#) (puisqu'il n'y a pas de notion de quantité de mouvement pour un champ !). 


Si nous divisons la relation précédente par äg{f) = £g # 0 nous obtenons: 


5S(g,4) 
ÿg 


=0 (45.48) 


ce qui nous donne le droit d'écrire: 
68,4) = [PE gt -(OBgat =0 (45.4) 
ÿg 


et en imposant une analogie avec un concept de champ: 


SS(D4, 4) 


OS(g,g) = [ES Ügdt | a: Sbädxt (45.50) 


où x = (#6) et d'x = dndxdrdt . 


Finalement, comme tous les termes suivants sont nuls, ils sont égaux (nous faisons intervenir l'équation 
d'Euler-Lagrange démontrée dans le chapitre de Mécanique Analytique): 
GS (4,4) ACC PL OPEL 
Üg()  0q;E) dt 4,6) 


en analogie avec le champ 44 nous obtenons (donc c'est une démarche intuitive à la sauce 
physicienne…): 
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5$(D*,b*) _ AL dd ôL | 
Sb4 9b4 d(A) ab 


Il s'agit donc maintenant d'un lagrangien avec des dérivées partielles fonctionnelles. 


Cette écriture étant cependant peu commode, on prend pour habitude d'écrire les différentielles 
partielles (en utilisant les unités naturelles de la physique) aux composantes 4 / dé, / Gy,d/ 4z,9/x 


sous la forme 4, , ce qui nous donne finalement: 


ü£ 


4(8,P*) 


ap CPR 


=0| (45.53) 


Évidemment, si nous n'utilisions pas les unités naturelles, nous devrions adopter l'écriture: 


Le fait que la dérivation partielle 4, porte maintenant sur toutes les composantes et non pas 
uniquement sur t est dû au passage de coordonnées généralisées q fonction uniquement de t à une 
fonction du champ 44 dépendante de x, y, z et t. La raison profonde réside dans le fait que le temps et 
les coordonnées spatiales jouent le même rôle, celui de décrire le continuum espace-temps sur lequel 
évolue le système physique. 


Ceci nous amène aussi à écrire le principe de moindre action sous la forme suivante: 


85(g,4) = [SZat =0 


45.55 
= 65(b",b*) - = 8b“ax" = É Bbdrt=0 


Avec l'action des champs notée plus traditionnellement: 
S = fL(D*,b°,2,D"}ar dt = [L(D*,d,8,œf ht (556) 


ou encore pour différencier lagrangien et densité lagrangienne (nous "stylisons" parfois le L): 


(ex 
U1 
NI 
— 


S= fe(®", 8, jar") (45 


à comparer à l'action de la particule: 


te 


S(g,4) = [£a at (45.58) 
4 


g£ 
En analogie avec P, = FE nous écrirons: 
* 
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a£ êL 
IL 


= 8,24) _ ad (45.59) 


et en analogie avec Æ = > Pag, = Z nous écrirons: 


H = d'ILE* —Z (45.60) 


mais un champ est un milieu continu. La somme sigma n'est donc plus adaptée et il faut passer à une 
intégration sur tout l'espace-temps telle que: 


H = (IL Sfax - 2 (45.61) 


En analogie avec les équations du mouvement de Heisenberg (cette démarche est souvent appelée 
"principe de correspondance"), nous écrivons: 


; dÆ 
Eu ES 4 = T 
RE À (45.62) 
_. _94 fl. -- 8H 
" #4 4 ab 


Passons maintenant à la théorie quantique en postulant des champs d'opérateurs de Heisenberg 
correspondants. Rappelons que nous avions obtenu plus haut que: 


x = “la. #15, L > [p.41 et [gu,Qu]=TPu, Pn 1 0,[guPul Rd (45.63) 
ce qui nous donne: 
bi - [64 #1 - ITS, #] et[D*,D?]=[T*,N1/1= 01,11 1= 5h68 (45.69 


Si nous résumons un peu le tout et que nous affichons la comparaison avec la physique quantique 
ondulatoire, nous avons finalement: 


1. En physique quantique ondulatoire (c'est joli à regarder non?): 


0g, 
a = À 0 À 
x 8, . y la ] LL 
4 FE 
# slt] 
04, k 


7,4," [2,:2,1"0 
[du Pa] RO 


2. Et l'équivalent par principde de correspondance en physique quantique des champs (alors là... ça 


devient de l'art!): 
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_ dE L ET 
Lx #4 - [IL a x=£E 
44 
= bA=- 2 [Dh4,7] 
‘IL F 
| a € ré ; er (45.66) 
= =-_[[]4,X 
Ur ab4 x! 
[b*,b#]=[(TT*,11]= 0 
CRIME TE 


Et le tour est joué! Nous venons de passer les paramètres de la physique quantique où les corps 
ponctuels sont décrits par des fonctions d'onde, à une physique quantique où les corps ponctuels 
deviennent des champs continus. 


Il ne reste plus qu'à appliquer ce schéma général à des exemples concrets: 


Nous allons commencer par un premier exemple en tenant compte de l'aspect relativiste. Aïnsi, la 
densité lagrangienne la plus simple non triviale que nous puissions construire est de la forme (vous allez 
de suite voir à quoi elle va mener, ce qui confirmera sa validité théorique - par ailleurs, le 
développement qui va suivre aurait très bien pu être présenté dans l'autre sens): 


L= 50, "24 sr (#Ÿ (45.67) 


ou plus explicitiement: 


2 
L= -lootifes |] 3ao4te4 ,l,2le4f | 7 y 
2 ren per 2 
sommation dEinstein 
uniquement sur les 
composantes spatiales 


1 
° (45.68) 


a —] ——+— 
terme énerge cinétique de L terme de mass 


terme énergie potentielle de Z 


que les physiciens appellent "champ scalaire pour une particule libre et sans spin" ou "lagrangien de 
Klein-Gordon" pour une particule sans spin où nous utilisons les notations condensées habituelles: 


_4p"* 


ôx, 


4 4 


A 


HA # 
4,49" DA = 8,48 DA (45.60) 
H 
et les unités naturelles: 
calculons l'équation d'Euler-Lagrange y relative (normalement c'est trivial) en n'oubliant pas qu'il s'agit 


de dérivées fonctionnelles ce qui simplifie grandement le calcul (n'hésitez pas à nous demander les 
détails si besoin est): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


& _, |__er 
af *|a(a pb) 


= #5 D* + 4,9" æ* (45.71) 
d'où l'équation du mouvement en unités naturelles et en osant une écriture dangereuse pour la double 
dérivée partielle (la sommation d'Einstein est alors sous-entendue…): 
2 _ 2 À = 5 79 
(5 -#S)Dbf=0 (45.72) 


où comme nous allons de suite le voir, pour retomber sur les résultats obtenus dans le chapitre de 
Physique Quantique Relativiste, nous sommes obligés d'introduire l'opérateur différentiel contravariant 
et covariant (cf. chapitre de Calcul Tensoriel) avec la signature -,+,+,+: 


2 2 2 2 
a = CA r Le .ÿ2 
at à à? &°] |? _ 
a uno 2-2 # à || à 6 
ce? x? 2? &°? c282 


Rappelons maintenant à titre de comparaison que dans le chapitre de Physique Quantique Ondulatoire, 
nous avions obtenu l'équation de Klein-Gordon libre suivante: 


(HO-mc?|P=0 (45.74) 


aussi avec la signature -,+,+,+ donc avec l'opérateur d'Alembertien: 


 # & & 


Ù = ++ —+— 
IX à @ à 


(45.75) 


Nous avons alors une correspondance parfait entre l'équation de Klein-Gordon libre et l'équation des 
champs (notée ci-dessous en unités naturelles comme il est d'usage): 


CSL: =0et CL =0 (45.76) 


et c'est ici que l'on peut éventuellement ressentir un frisson dans le dos et rester admiratif face à la 
puissance du formalisme mathématique ouvrant de nouvelles perspectives sur la manière de voir les 
rouages de l'Univers. Ainsi, dans la théorie des champs, l'équation de Klein-Gordon peut être 
réinterprétée comme une équation de champ! 


La forme de l'équation de Klein-Gordon libre impliquant les champs est parfois appelée "équation des 
champs de Klein-Gordon". 


Et encore... mieux...vous allez voir, nous allons le faire un peu à l'aveugle et... alors là ! Considérons 
maintenant le lagrangien suivant (que nous supposerons obtenu par bricolages successifs. mais à 
nouveau nous aurions pu faire le développement dans l'autre sens) se voulant exprimer "l'interaction 
d'un champ électromagnétique avec une densité courant": 
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L=SFPE, — j"A,| (45.77) 


où nous y reconnaissons les tenseurs du champ électromagnétique démontrés et déterminés dans le 
chapitre d'Électrodynamique et pour lesquels, rappelons-le: 


F, = 0,4, 0,4, (45.78) 


Dans ce lagrangien, traitons le potentiel vecteur comme étant champ tel que: 


sl Lee Loan 
05 |a(a,æt)] 84 *|2(2,4) | 


Dès lors en décomposant les développements, nous obtenons très facilement: 


Dans un premier temps, le lecteur vérifiera en faisant un peu de calcul tensoriel relativement 
élémentaire que: 


or, _0(2.4,-8,4.) LHa-æs un) 
9(8,4)  3(3,4) 
Puis: 
(FFE) _ af dE + ar = Fe af 


Lt — EF, 2 F 
4(8,4,) 4(8,4,) 8(8,4) *  4(8,4) (582) 
=2[88 -&a]|r* -2[F*-F*]-4r" 


Dès lors, l'équation du champ s'écrit: 
GA GTA l 
—-8,| ———|-;" -8, (aar*) =0 (45.83) 
04" (2(2,4) 4 
d'où: 
CP LS = j" (45.84) 


Faut avouer que le résultat assez c'est beau même si la démarche n'est pas des plus rigoureuses!!! Nous 
retrouvons donc l'équation de Maxwell avec sources avec le même lagrangien du champ (cf. chapitre 
d'Électrodynamique). Ainsi, ce lagrangien sans masse est assimilé au lagrangien du champ vectoriel de 
spin 1 assimilé aux bosons (cf. chapitre de Mécanique Statistique). 


Rappelons maintenant que nous avions obtenu dans le chapitre d'Électrodynamique l'action suivante 
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pour une particule chargée dans un champ électromagnétique (avant un long développement qui nous 
avait amené au tenseur du champ électromagnétique): 


Ê 
S = [rocds _ gA'ax, (45.85) 


et en se rappelant que (cf. chapitre d'Électrodynamique): 


.- cNl-v/e? (45.86) 


d£ 


il vient: 
8 
S = [lc V1-v{c? - Ad | dt (45.87) 


La densité lagrangienne correspondante est donc: 


L=-pc\1-v{e?-;"A (45.88) 


Nous avons donc finalement: 


1. Le lagrangien (densité lagrangienne) d'une particule chargée dans un champ électromagnétique (que 
nous venons d'obtenir): 


L=-aefl-vie-ÿA (45.89) 


2. Le lagrangien (densité lagrangienne) de tout à l'heure (qui nous a permis de retomber sur les 
équations de Maxwell avec sources): 


L=SFPE, - j"A, (45.90) 


Dès lors, il est naturel d'écrire le "lagrangien (densité lagrangienne) total du champ électromagnétique": 


l 
L=-me1-v 102 - j'A, re, (45.91) 


0 


Continuons maintenant notre bonhomme de chemin avec l'équation de Dirac libre! Rappelons que nous 
avions obtenu dans le chapitre de Physique Quantique Relativiste l'équation de Dirac libre sous la 
forme (fondamentalement rappelons qu'il s'agit d'une équation relativiste): 


(#8, 9) Ÿ = (: M") % =0 (45.92) 


Maintenant rappelons (cf. chapitre d'Algèbre Linéaire) que { AB) = B1AT. Dès lors, il vient: 


(64 -m)2) = oi = pa -m) - AOF =) = Pi(-iy#al -m)=0 (45.93) 
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Or, ai, = à, et il est super facile de vérifier (ne pas oublier que nous utilisons la forme représentative de 


Dirac des matrices de Pauli !!1) 74 = #y#y! ce qui nous amène à écrire: 
D(sY ya, -m)=0 (45.94) 


Il est alors commode d'introduire "l'adjoint de Dirac": 


Remarque: Rappelons que # est une matrice-colonne et #1 une matrice-ligne. Il vient donc que 
Y est aussi une matrice-ligne! 


Utilisant le fait que dans la représentation de Dirac ÿ/y° = 1 nous pouvons écrire: 
Ds ytp 0, mp #)= 0 
= P(-y#y8,-my)=0 (456) 
= Pfiy#p 8, +my°)= 0 
en simplifiant les y” il vient l'équation de Dirac libre adjointe: 
Pire, + ) =Pig+m)=0 (45.97) 


Ce que nous notons traditionnellement: 


g(id+ ) =0| (45.98) 


La notation # signifiant que l'opérateur # opère sur Y vers la gauche tel que: 


VY = (8,7) y# (45.99) 


Remarque: Certains auteurs écrivent (é +7 )Y = 0 mais ceci est faux car ÿ est une matrice 


ligne comme nous l'avons fait remarquer plus haut!!! 


Finalement nous avons pour les équations de Dirac libres: 


(8 -m)T =-0S ip 8,T -mE =0 


_ _ (45.100) 
TGid+m)=-0@:i(8,7)7" + % = 0 


Supposons maintenant que le "lagrangien du champ spinoriel de Dirac libre" soit de la forme (parce que 
finalement c'est le lagrangien qui nous intéresse): 
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L= Pire, — 5) Y| (45.101) 


où nous avons posé F = #17? Il s'agit donc du lagrangien du champ spinoriel pour les particules de 


spin 1/2 qui sont donc des fermions libres. 


En considérant les quantités  Y comme indépendantes (c'est ce qu'elles sont de toute façon puisque 


orthogonales) et choisissant le champ spinoriel comme yf, nous avons l'équation d'Euler-Lagrange: 


a “36,5 


Le deuxième terme est nul puisque le lagrangien de Dirac ne contient pas de termes en à ni . De fait il 


reste: 


: 4,4 _ 
a Y 9Y 
Nous retombons donc bien sur l'équation de Dirac libre (le même développement pouvant être fait pour 
l'équation de Dirac libre adjointe)! Aïnsi, dans ce cadre, la seule manière d'expliquer les propriétés 
quantiques de la matière comportant des particules avec spin 1/2 est de faire intervenir des champs 
YY représentant des particules chargées électriquement, les électrons et positrons comme nous le 


savons. Nous appelons alors ces entités des "champs (spinoriels) de Dirac". 
3. THÉORIES DE JAUGE 


Nous allons voir maintenant une approche simple d'un outil qui a révolutionné l'approche de la 
physique moderne des particules au milieu du 20ème siècle et qui a valu plusieurs prix Nobel à ceux qui 
y ont contribué. 


Nous conseillons très fortement avant de lire ce qui va suivre que le lecteur aille jeter aussi un coup 
d'oeil préalable sur le sous-chapitre de théorie des Jauges du chapitre d'Électrodynamique, car c'est un 
premier exemple d'une invariance de jauge faisant apparaître un champ (le potentiel vecteur) 
indispensable pour expliquer certains phénomènes à l'échelle quantique comme l'explicite clairement 
l'équation de Pauli (cf. chap 1ysiq ela te). 


Depuis le début des années 80, les magazines de vulgarisation parlent beaucoup en physique quantique 
des théories de jauge. Les interactions électromagnétiques et les interactions faibles sont décrites 
conjointement par une théorie de jauge élaborée par Glashow, Weinberg et Salam. Les interactions 
fortes semblent aussi correctement décrites par une théorie de jauge. C'est dans le cadre de ces théories 
de jauge que les physiciens théoriciens tentent d'unifier les diverses interactions fondamentales de la 
nature. Il convient donc, même sur ce site qui traite de manière élémentaire de physique quantique, de 
parler de théorie de jauge dans le cadre de ce domaine. 


Pour ce faire, nous considérerons déjà comme connu le contexte qui mena à la découverte de 
l'invariance de jauge dans le cadre de l'électrodynamique (voir chapitre du même nom pour les détails) 
et ferons un rapprochement avec certains développements vus dans le chapitre de Relativité Générale 
et le rôle qu'a joué Weyl dans la mise en évidence des principes fondamentaux d'une théorie de jauge. 


Rappelons que la relativité restreinte et générale reposent sur le postulat qu'il n'existe dans l'univers 
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aucun référentiel absolu. Nous avons vu dans le chapitre de Relativité Restreinte en long et en large 
que les relations qui permettent de passer les lois de la physique d'un repère à l'autre ne dépendent que 
de la vitesse relative entre les référentiels. Ainsi, la relativité restreinte est une théorie à symétrie 
globale. Nous avons également vu en long et en large dans le chapitre de Relativité Générale que la 
connexion affine est le lien entre les référentiels de la théorie locale (approximation des champs faibles) 
qu'est la relativité générale. 


En 1919 eut lieu la première observation expérimentale de la déviation de la lumière d'une étoile par le 
champ gravitationnel du Soleil. Cette confirmation spectaculaire de la théorie de la relativité générale 
inspira Hermann Weyl, qui proposa la même année une conception révolutionnaire de l'invariance de 
jauge: Si les effets d'un champ gravitationnel peuvent être décrits par une connexion exprimant 
l'orientation relative entre des référentiels locaux de l'espace-temps, d'autres forces de la nature telles 
que l'électromagnétisme peuvent-elles être associées aussi à des connexions similaires? 


Nous considérons deux types de symétrie de jauge: l'une dite "jauge globale" et l'autre dite "jauge 
locale". Elles se distinguent par le paramètre caractérisant le changement de phase de la fonction 
d'onde (nous verrons cela en détails un peu plus loin). 


3.1. INVARIANCE DE JAUGE GLOBALE 


Nous allons donc étudier l'invariance de jauge à partir de l'équation de Schrüdinger et montrer que 
même si les résultats peuvent paraître déroutants (dans le cadre d'applications complexes) ils n'en 
restent pas moins mathématiquement corrects. 


Remarque: L'invariance de jauge globale est rigoureusement dénommée "symétrie globale". 


Considérons donc l'équation de Schrüdinger: 


&EY- FA 
dé 
avec comme nous l'avons montré: 
2 
4=-À Gr 
2m 


avec F = Ÿ(F,f). Soit dans le cas d'une particule libre: 


ni 
PRALE = (-Ÿ) 
2m 2m 


Cet opérateur est manifestement invariant dans la transformation qui fait passer de Y à F'' avec: 
Des" Ve V=s 02 


où g est une constante de couplage (pour assurer l'homogénéité des unités et l'amplitude) étant 
considérée comme un nombre réel et & un paramètre réel indépendant des coordonnées (dans un 
premier temps...) d'espace et de temps. 
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HY- ny (45.108) 
dé 


devient: 


| à 
HT V'= he UE (45.109) 
f 


et comme & ne dépend ni de x,y,Z.f alors: 


e "EH Y'- SRE (45.110) 
tA 


Soit après simplification: 


He ih y (45.111) 
Of 


La forme de l'équation est restée la même lorsque nous avons fait le changement de Y en YF. 


Ainsi, la description d'un système libre n'est pas affectée par le changement de phase globale. En 
langage de la théorie des groupes (cf. chapitre d'Algèbre Ensembliste), nous parlons d'invariance sous le 
groupe U(1) des phases. 


En d'autres termes pour parler comme les physiciens.…: 
gEXY (45.112) 
définit une transformation de jauge par la rotation & (le paramètre au sens des groupes de Lie). 


L'ensemble des rotations forme un groupe nommé U(1) que l'usage appelle le groupe de jauge 
(isomorphe de SO(2)). 


L'ensemble des ,##* forme une représentation monodimensionnelle du groupe U(1) que nous appelons 
la représentation g. Il y a bien entendu une infinité de représentations g (autant qu'il y a de valeurs de 
g'). 


Comme le paramètre & ne dépend pas de la position et du temps, nous disons que le système est 
invariant par transformation de jauge globale (partout en même temps) ou simplement un invariant de 
U(L) dans le temps et l'espace. 


3.2. INVARIANCE DE JAUGE LOCALE 


Mais mais... soit l'invariance de jauge globale montre que nous avons une équation qui reste valable 
dans le cadre d'un changement de phase fixe. Mais maintenant dans un laboratoire cette équation de 
Schrôdinger doit être valable même si la phase dépend de la position et du temps. Cette contrainte 
s'appelle une "invariance locale”. 


Nous considérons cette fois que & est une fonction &{F,f) et l'idée bien évidemment est de vérifier si 
l'équation de Schrüdinger reste invariante dans la transformation: 
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Yÿ'-4E%Y (45.113) 


Il est dès lors évident que l'équation de Schrôüdinger: 
se 
HY=ih—Y%Y (45114) 
dk 


n'est plus invariante. Effectivement, nous voyons rapidement que rien que l'opérateur 72 dans 
l'hamiltonien va poser problème en faisant apparaître des termes gênants qui ne s'annuleront pas: 


VY = 9 Ex (Vy —ige EX (Va) l'A 
V2 = V(e7e (Vy i) —igV (ee (Va) y j 


= [ere (V2) ige ter (Ga)(G9)|-ie [(Hg)e es (Pa) prepa te ay | 


(45.115) 


Pour contourner ce problème, nous introduisons le champ de force associé au potentiel vecteur et au 
potentiel électrique et nous verrons qu'il garantit l'invariance locale (donc il est impossible d'envisager 
un changement de phase invariant sans la présence d'un champ de force de ce type). L'invariance locale 
impose que la particule ne soit plus libre (il n'existe donc pas de particules chargées libres!). 


Pour cela, reprenons l'hamiltonien de l'équation de Pauli (cf. chapitre de Physique Quantique 


Relativiste): 


. S 
(5-44) hq o-B+qU (45.16) 


29 2 


et négligeons l'interaction entre le spin et le champ magnétique tel que l'hamiltonien devienne: 


es 2 
Brad) y wsun 
2 
Soit: 
Un 
CAV-A) y vus 
2% 


Nous obtenons donc l'équation de Schrôdinger suivante: 


(-n9- 44) 


2) 
+gU|TY=ih—% (45119) 
2% ok 


Ce qui par rapport à l'équation de Schrôdinger libre: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


mt 2 
(-iŸ) Wing (45.120) 
2m êt 


fait intervenir les correspondances suivantes: 


(45.121) 


Considérons la transformation de jauge (cf. chapitre d'Électrodynamique) en notant dorénavant le 


potentiel électrique par la lettre V: 
A ÀA'= A+ 
Po r_# (45.122) 
æ 
où f = (F6). 


D'abord, nous voyons alors immédiatement que les opérateurs sont invariants. Effectivement: 


(9-22) : (o-:£(a+vr) jar -(9-42-407)e 


Àk À 
= ige et (Gare; joiea _; 7 6 iea (45.123) 
ge (Va) : VE 
= |iVarv-:14-:76 | 
(ie r ; fé à 


ee g + ia ia g si g + g ia pe g + 
(9-22) =eÀ 2% +923 ff |=ef (s-42 (45.124) 


Soit tout simplement: 


De même en sachant maintenant que f est &: 
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4 2 
Œ À æ À GA 


4 q 4 | 
ji 08 0 an 208 EE (45.126) 
hk Ge Œ À k ôt 
rs 
=eh Ë 4e r) 
æ À 
Nous avons donc: 
L INR af, a 
9-142)e) =} (v-:42) 
hk À 
(45.127) 
q q 
(tr) à (né) 
df Œ À 
Soit: 
n ia a 
D'eh =ek D 
(45.128) 


La relation: 


ee 
(A) Win (45.129) 
2m of 


devient alors avec les nouvelles correspondances: 


sd 
sa w=;nn0y (45.130) 
#72 


et avec les développements antérieurs, nous avons donc: 


2 RM 
ge CRE), COT 
D er (45.131) 


ep =D Ep 
Soit: 
, 2 
(5 ] Exp = :pn0 eg (45.132) 
2m 


Ce qui donne après simplification: 
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0 
(A 5") W=ixn0 y (45.133) 


Ainsi, en demandant l'invariance de jauge, nous avons fait apparaître une interaction... et nous savons 
bien qu'elle est cette interaction! 


L'équation de Schrüdinger d'une particule se déplaçant dans un champ électromagnétique est donc 
invariante sous la transformation locale de phase. La phase d'une fonction d'onde est bel et bien une 
nouvelle variable locale au sens de Weyl et le potentiel électromagnétique peut être interprété, suivant 
Weyl, comme une connexion reliant les phases en différents points. 


Nous en concluons que le champ électromagnétique est une conséquence de l'invariance de jauge 
locale fondée sur le groupe U(1), groupe des matrices unitaires à une dimension (cf. chapitre d'Algebre 
Ensembliste). L'intérêt qui s'en dégage est de construire des théories de jauge sur des groupes plus 
compliqués (non-abéliens): ces théories sont appelées "théories de Yang-Mills”. 


Maintenant allons un tout petit peu plus loin mais, sans trop approfondir... Nous avons montré plus haut 
que le lagrangien de l'équation de Dirac libre était: 


£= ir, = io | E (45.134) 


Or, cet opérateur ne faisant pas apparaître le champ électromagnétique, on se doute très fortement qu'il 
ne porte pas en lui une invariance pour une jauge locale... 


Or, l'équivalent de l'opérateur divergence *; dans l'équation de Schrüdinger libre est la dérivée 
covariante 4, . Donc au même titre que nous avons associé pour garantir l'invariance locale de jauge 


de l'équation de Schrüdinger libre: 


ÿ = D=V-i T 4 
À a. 
a a (45.1 2) 
ER Re di 
G}s Œ À 
il est tentant de combiner le tout en un nouvel opérateur: 
= q 5 12 
D,=0,-iTA, (45.136) 
avec: 
ES LP ERA ei) 
À cŒ h 


Le lagrangien de l'équation de Dirac libre s'écrirait alors: 
L= Al FD = rio | E (45.137) 


Soit: 
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= HEz (a, = L4)-r)" = Pia, -m")Y- GiyhF AT 


. P(irf0, m0) P+ Pr A, = Pfiy*o =)? -j*A 


avec: 


Fu 


Py#Y]| (45.139) 


= PO 


Il ne reste plus qu'à rajouter le terme du champ pour obtenir le lagrangien total de l'équation de Dirac 
(cela aurait été relativement dur de le trouver d'une autre manière.….): 


L= Pfyfa, 0) # = FAy + 8 F# (45.140) 


qui correspond aux équations de Dirac-Maxwell et qui est le "lagrangien de l'électrodynamique 
quantique des champs" où à gauche nous avons le terme des fermions et à droite la partie d'interaction 
des bosons de masse nulle (photons). 


Donc le fait d'avoir rajouté au lagrangien libre une condition d'invariance par des transformations 
locales, nous a conduits à une théorie avec interaction que nous pouvons écrire avec plus de rigueur et 
sous forme développée: 


ur = l 
Loup = V(irf0, m0) V4 PP PA + OFF (asia) 


ou encore en unités naturelles et avec la charge de l'électron: 
Le = Ÿ (re, — #9) P+q y TA, + FA FP (45.142) 


L'électrodynamique quantique a fait défaut cependant dans les années 1940 pour décrire bon nombre 
de particules mises en évidence par les accélérateurs. Certes, d'une certaine manière, elle a été étendue 
pour décrire de nouvelles particules. Mais beaucoup d'entre elles semblaient jouir de propriétés dont 
l'électrodynamique quantique ne pouvait rendre compte. 


En fait, la raison est simple. c'est une théorie dans laquelle aucune solution exacte n'est connue, une 
situation qui perdure jusqu'à nos jours (2008). La seule méthode de calcul disponible est appelée 
développement perturbatif. L'idée est essentiellement la même que celle du développement limité que 
l'on pratique dans le domaine du calcul différentiel. En l'occurrence, si nous ne savons pas calculer la 
valeur d'une fonction, nous la décomposons en une séquence de polynômes et l'approximation s'affine 
au fur et à mesure que nous prenons en compte des termes de degrés de plus en plus élevés. Un tel 
développement en série commence par un terme d'ordre zéro, qui est juste la valeur de la fonction 
inconnue en un certain point où l'on sait calculer cette fonction. 


Dans le cas du développement perturbatif de l'électrodynamique quantique, le terme d'ordre zéro 
représente la propagation pure, sans interaction (l'intensité de l'interaction entre l'électron et le champ 
magnétique est mise à zéro). Dans cette approximation, l'électrodynamique quantique est une théorie 
des particules libres et elle est exactement calculable. Nous avons des électrons, des positons et des 
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photons mais ils se croisent sans s'influencer. Le terme suivant dans le développement en série, celui du 
premier ordre, est aussi exactement calculable. Dans cette approximation, la théorie semble refléter 
assez fidèlement le monde réel. Des phénomènes physiques très intéressants apparaissent dans cette 
approximation de premier ordre de la théorie réelle de l'interaction photon-électron et la théorie 
s'accorde bien avec les résultats expérimentaux. 


Malheureusement on eut tôt fait de découvrir que le calcul des termes de second ordre et des termes 
plus élevés semblait dénué de sens jusqu'à donner des valeurs infinies. aujourd'hui il n'existe encore 
que des méthodes de résolution approximatives et non totalement satisfaisantes dès lors on a été obligé 
de chercher une autre technique d'approximation se basant sur une renormalisation des équations... et 
les résultats sont extraordinairement bons (à la 11ème décimale près!) mais au fond cela sent un peu le 
bricolage sur mesure quand même... 
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Notes personnelles: 
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46. PHYSIQUE DES PARTICULES ÉLÉMENTAIRES 


N avons déjà mentionné dans le chapitre de Physique Nucléaire que nous constatons donc 


expérimentalement que les noyaux radioactifs n'émettent pas de neutrons ou de protons. Mais nous 
pouvons nous interroger: comment font-ils pour synthétiser une particule alpha, ou transformer un neutron 
en proton, ou vice et versa? Pour répondre à ces questions, examinons les forces en présence. 


Avant la découverte de la radioactivité, les physiciens avaient identifié deux forces fondamentales: la 
force de gravitation et la force électromagnétique. La découverte de la radioactivité et les études 
concernant le noyau atomique ont conduit les physiciens à introduire non pas une mais deux nouvelles 
forces fondamentales! 


Avant même de connaître la composition exacte des noyaux, pour expliquer l'existence de ces systèmes 
minuscules et portants parfois de fortes charges positives, les physiciens avaient pressenti la nécessité 
d'une force de cohésion puissante capable de dominer la répulsion électrostatique s'exerçant entre ces 
charges (rappelons que nous avons vu en mécanique classique que la force gravitationnelle entre deux 
corps de masses équivalentes à celles de particules est totalement négligeable). Comme le noyau est petit, 
cette "force nucléaire" devait s'exercer à très courte distance. Quand J. Chadwick découvrit le neutron, il 
fut démontré expérimentalement que force attractive s'exerçait aussi bien entre deux neutrons, deux 
protons et entre un neutron et un proton. Dès 1935, H. Yukawa en élabora une théorie dont les grandes 
lignes sont encore acceptées, mais qui doivent être améliorées suites aux défauts qui ont été mis en 
évidence (cf. chapitre de Physique Quantique Des Champs). 


Cependant, comme nous le savons déjà, cette force nucléaire n'expliquait pas la transformation d'un 
neutron en proton, qui a lieu dans la radioactivité bêta. Il fallut introduire une quatrième force 
fondamentale, d'intensité plus faible, baptisée pour cette raison "interaction faible", la force nucléaire 
devenant ipso facto "l'interaction forte". 


Ainsi, en principe, la radioactivité met en jeu les quatre forces fondamentales de la Nature: la gravitation 
et la force électromagnétique, puisque les particules alpha et bêta possèdent une masse et une charge, et 
les deux interactions nucléaires, forte et faible (en fait, la gravitation, d'intensité bien moindre que les trois 
autres aux échelles subatomiques est souvent négligée). 


Nous avons partiellement abordé dans le chapitre de Physique Quantique Des Champs les interactions 
fondamentales et leurs vecteurs d'interactions. Avant de nous lancer dans des calculs ardus, il est 
souhaitable d'abord d'acquérir un certain vocabulaire d'usage courant chez les physiciens théoriciens. 


Le concept le plus simple à aborder dans le domaine de la physique des particules élémentaires est la 
comparaison des quatre forces élémentaires via leur constante de couplage respective (c'est un truc que les 
physiciens aiment bien.…..). 


Remarque: Hubert Reeves et ses collègues astrophysiciens ont démontré qu'à l'époque de la genèse de 
l'Univers, la moindre déviance des constantes de couplage des valeurs nominales actuelles aurait 
provoqué l'instabilité des nucléons et aurait condamné l'évolution cosmique. 
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1. CONSTANTES DE COUPLAGES 


Nous allons essayer ici de classer les quatre forces selon leur intensité via l'utilisation de "constantes de 
couplage". 


Pour cela, il faut calculer les quatre interactions pour deux mêmes particules, par exemple deux protons, à 
des distances identiques, donc de type nucléaire, et les comparer à une grandeur commune de même 
dimension de sorte que leur rapport fournisse un nombre sans dimension. 


Cette grandeur commune sera choisie comme étant le produit: 
k _ 
_c=hc=316.10 € [W.»#2] (46.1) 
27 


Nous trouvons ainsi: 
1. Pour la force de gravitation (cf. chapitre d'Astronomie) où: 
2 AY x 
Fr =Gm MI[IN:#] (462) 
avec la masse du proton telle que »# = f = 1.67. 10 [kg] , la constante de couplage de la force de 
gravitation vaut alors par définition: 
02 
Ag=———=—?26.10% (463) 


2. Pour la force électrique (cf. chapitre d'Électrostatique) où: 


l 
0 


avec les charges des protons telles que 4 = © = 1.602. ed es ], la constante de couplage de la force 
électrique vaut alors par définition: 


1 . 

4 
PL ONE 
ke 137 


Remarque: Nous retrouvons ici la "constante de structure fine" que nous avions vue déjà dans le 
chapitre de Physique Quantique Corpusculaire. On comprend ainsi mieux le choix de départ pour la 
comparaison relative des interactions. 


3. Pour la force nucléaire forte ("strong en anglais), où F représente la "charge nucléaire forte", la 
constante de couplage forte vaut (attention la valeur dépend du modèle théorique choisi!): 


a = ——=<5 21 (46.6) 
RC 
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d'où son nom. 


4. Pour la force nucléaire faible ("weak" en anglais) responsable de la désintégration des particules, f 
représente la "charge nucléaire faible", et sa constante de couplage faible vaut (attention la valeur dépend 
du modèle théorique choisi!): 


= Ts (46.7) 
ne ke Re 


Ainsi tout cela peut se résumer dans le tableau phénoménologique suivant: 


&z1/1357 


Groupes turbines-alternateurs 


Pile thermoélectrique avec 
isotope radioactif 


Vukawa Centrale nucléaire 


Tableau: 46.1 - Résumé des 4 interactions fondamentales avec lois et constantes associées 


ou encore avec le diagramme suivant (plus intéressant) où nous retrouvons, en tenant compte des résultats 
que nous avons tirés lors de notre étude des champs massiques et non massiques dans le cadre du modèle 
de Yukawa (cf. chapitre de Physique Quantique Des Champs): 


1. En ordonnée à l'origine l'intensité des forces telle que calculée précédemment en fonction de la distance 
selon le modèle de Yukawa des champs massiques (interactions faible et forte) et non massiques 
(interactions électr. et gravitationnelle) 


2. Les schémas représentatifs (diagrammes de Feynman) des interactions conformément aux résultats 
obtenus et particules déjà mentionnées dans le chapitre de Physique Quantique Des Champs. 
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INTERACTION FORTE 


p 
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æ 
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& 
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Figure: 46.1 - Diagrammes de Feynman et distance d'interaction des forces fondamentales 


Il convient de préciser pour la culture générale que ces quatre forces sont décrites respectivement par 
quatre théories: 


1. La relativité générale (englobe la mécanique classique) pour la gravitation 

2. L'électrodynamique quantique (englobe l'électrodynamique) pour la force électromagnétique 
3. La théorie électrofaible (qui englobe l'électrodynamique quantique) pour l'interaction faible 
4. La chromodynamique quantique pour l'interaction forte 

Les trois dernières étant regroupées dans le "modèle standard”. 


2. RÉSONANCE MAGNÉTIQUE DE SPIN 


Nous avons hésité à mettre le traitement de ce sujet dans ce chapitre mais après réflexion, ce n'est pas de 
la physique nucléaire car les calculs ne s'appliquent pas qu'au noyau des atomes et cela n'est pas vraiment 
de la physique quantique relativiste pure car ne s'applique pas qu'à des particules élémentaires du type 
électron (comme le supposaient nos développements dans le chapitre de Physique Quantique Relativiste). 
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Lors de notre démonstration de l'équation de Pauli dans le chapitre de Physique Quantique Relativiste à la 
sauce physicienne….. nous avons vu que pour une particule de spin #2 (qui pourrait être un noyau nucléaire 
de spin #2), nous avions: 


2, PE Bel Moestaulén dr 


en posant: 


(46.10) 


LA 
Il 
LS 


comme étant pour rappel "facteur de Landé" ou "facteur gyromagnétique" (cf. chapitre de Physique 
Quantique Relativiste). 


“4 LA 


Maintenant plongeons la particule appelée "sonde" dans un champ magnétique du type oscillant stable sur 
le plan horizontal et constant sur le plan vertical du type: 


Bacosiæ| 


… 


B=|-Bysiniæ| (46.11) 
20 


où dans la pratique le champ #4 va de 0.1 à 17 Teslas. 


Il vient alors: 
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[a Bacosiæ| 
Hs=-É 0-25 a |o|-B4sin(@f| 
T3; Ë0 


= (a Bacos| ai-mBasniæi+oh 


Hs cta-l 2 tel © le 
1 0 ACOSI a! ; 0 ASin! [ o -1 0 


(e Ba cos( @é| 0 —B sin) É B 0 
Bacosiæéi (e] iB 4sin(d&| (e] 0 —Ëg 


Ë0 Bacosi@ti+iB4siniæ|) 
Bacosi@ti-iB4sin|dæ|) —Eg 


Il 

| 

ga 
NES 


Nous avons alors en nous concentrant uniquement sur cet hamiltonien: 
Va (46.13) 


Et comme #9 est la double composante d'un spineur, notons-la explicitement: 


nf] So a kb (46.14) 
{a (6) 2 [Bet 2 [\a() 


Soit après réarrangement: 


É BA p jeiût 
AE h 7 n°4 ii o] . 
Œ\a()) 2/84 at _8Hn |\aæ() 
ri ES 


Et rappelons que nous avons obtenu démontré tout à la fin du chapitre de Physique Quantique Relativiste 
que: 


B 
œ=-gyB=- Se (46.16) 


Il nous vient alors naturellement de poser que: 
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EH 
= —— B, 
F0 À 
(46.17) 
4 = 284 


Cela nous donne: 


> pi 4 : es yet és e) 7. 


de (#) met -æ |\& 


Soit un système de deux équations différentielles: 


24,()=il me, (O0 +aue a (6)] 


(46.19) 
1 


2à&_(t)=ilee a, ()-ma (6 


Si nous assumons que le spineur est orienté vers le haut initialement (conditions initiales) alors: 


æ,(O)} fi 
= (46.20) 
æ_ (0) 0 
Maintenant pour résoudre ce système d'équations différentielles nous allons utiliser le travail laborieux de 


tâtonnement déjà effectué par nos illustres prédécesseurs en posant que la réponse est probablement du 
type: 


a ()= A8 = f+) 


| (46.21) 
a (= A et | 


soit: des fonctions d'onde! 
Alors en injectant ces solutions dans le système d'équations différentielles il vient: 
d | r : | . 
22 Aje®+ =il Aie 4 + ot A gl | 
2H A6 =ilæye it 4 04 - Ad | 
Soit: 


aa, A 2 il ape +o4A etat | 
| . (46.23) 
Do A et =;|o ge HO 4 m4 04) 
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et après simplification par l'exponentielle et l'imaginaire pur: 


,. œ À, = % de +@4 À get-He fief 


er SR (46.24) 
2æ@ À = œaA,e œf+ic,f RE _ mA 


Soit: 


2@, A, = mA, +@44 (te ail 


| (46.25) 
i(o-@,+a)f | A 


2@_A_ = @yA,e 
Nous pouvons nous débarrasser de la dépendance en temps ci-dessus en posant: 
@, = @ +@ (4626) 
Notre système se réduit alors à: 


2@, À, = A +44 


(46.27) 
2&_ À = Da A, = À 


Soit en réarrangeant: 


A. (2@&, -)i-æ44 =0 


(46.28) 
—@aA, + A (2 +api=0 


ce qui peut s'écrire sous forme matricielle: 


=0 (46.29) 
A 


Pour avoir une solution consistante (solutions non toutes nulles), le déterminant de la matrice doit être nul 
pour que celle-ci soit inversible (cf. chapitre d'Algèbre Linéaire), Or le déterminant de cette matrice est: 


2 _—_ Es 

ss on re -a)(28. +a)-cauit-ou) 

= (20, -mii2@ +@)-œ4=40, +2@, -2@_@ - & - 
| 2 2 (46.30) 

=die +oiæ +2(@ +@)iap -2@ & - - 4 

=4 +40 +24 + 2@4h -2®_ &h _ - À 


= 4 +40@ +2@4h — = a 


Or les racines de ce polynôme du deuxième degré en &_ sont (cf. chapitre de Calcul Algébrique): 
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| 2 2 2 | 
_4a+ [40 —4.4.[2@@h — & — @41| 


ie 5 2.4 

—-@+ fe? (200 - ac) DE Lu DE 

2 (46.31) 
ae 

a+ fa _ 2œ@ + À +a -æ+,l æ- | +ei _e, læ- | +44 
SR E 2” 2 
=-T+io 

2 


Nous en déduisons donc aussi: 


() œ 
D,= D + @i1=@12+@= ro cree ur TAG (46.32) 


Nous avons donc pour résumer: 


Résultats à injecter dans: 


a (E) = Age ot 


ne DT (46.34) 


Donc comme chaque pulsation à deux solutions, la solution générale sera la somme des solutions 
particulières (cf. chapitre de Calcul Différentiel Et Intégral). Concentrons-nous sur la deuxième relation. 
Nous avons alors: 


[re] .@ 
“it  , “it _, 
æ(=Ae ? etihot po 2 AG (46.35) 


Or, rappelons la condition initiale que nous nous étions imposés pour la deuxième composante du spineur 
(liée au fait que le spineur est orienté vers le haut): 


&_(0)=0 (46.36) 
Nous avons alors: 


A=-B = A (4637) 
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Donc: 
a (£) = PR LA T Ast (46.38) 
avec: 
de (6) (240) 788 4(-2-20) 788 (46.39) 
et: 


&_ (0) =14(-$+40)-u[-$-20) = 2iAÂ&G (46.40) 


Maintenant, pour déterminer À, nous allons de façon astucieuse utiliser la différentielle de départ obtenue 


plus haut: 


1@ 


2&_ (= il og a, (6) ma (| (641) 


sans oublier les conditions initiales choisies, nous avons: 


1@ 


2&_ (0) =il age 0, (0)- ma (0) =i(@4-1- ab -0) =i@4 
Soit: 


&_ (0) = + (46.43) 


Nous devons donc avoir l'égalité entre les deux expressions: 


& (0 = 74 
2 (46.44) 
&_ (0) = 444 œ 


et cela ne peut être satisfait que si: 
æ 
A=—À (4645) 
4kæ 


Nous avons alors: 


(46.42) 
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it 12 
æ { 4j —j æ 2. 
a (6) =—4 8 2 Pastel — 2 tAat l= "A y 2 DsinliAæ 
4ñæ 4ñæ 
: (46.46) 
& | —i—+ 
= {À jginliAæie 2 
æ 
Soit explicitement: 
D 4 Pr, 


a (£) = isinlih@tie 2 (46.47) 


2 2 


Puisque la deuxième composante du spineur représente l'angle et que ce que nous avons ci-dessus 
représente la position angulaire dans le temps, le terme: 


(46.48) 


peut être vu comme la valeur maximale de l'amplitude de l'angle (rotation de Larmor du spin de l'électron 
autour du champ magnétique). Cette amplitude maximale a elle-même un maximum si le dénominateur 
est le plus petit possible et donc: 


@ = & = _ Bp (46.49) 


Nous disons alors qu'il y a "résonance de spin". 


Donc le champ magnétique peut faire basculer l'état d'énergie de chaque spin si son amplitude 
d'oscillation est maximale. Comme nous l'avons démontré juste plus haut, pour une particule isolée, la 
variation d'énergie d'un état à l'autre est: 


et donc lors d'un basculement de spin génère l'émission d'un rayonnement que l'on appelle "Free Induction 
Decay". Le signal recueilli dépend de plusieurs paramètres qui caractérisent la particule ou le noyau 
nucléaire. Bref dans la pratique c'est 99% d'ingénierie et 1% de théorie! 


Lorsque nous appliquons ces résultats théoriques à un électron non apparié, c'est-à-dire pour la "résonance 
magnétique électronique", nous avons les données expérimentales suivantes pour un champ constant 


Bo = 0.3 (71: 
f =10[GHz], 4=3 [em], E, =AE=4.10* [ey] 


et donc la technologie de résonance magnétique électronique est basée sur la détection de micro-ondes. 
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Lorsque nous appliquons ces résultats théoriques à un noyau nucléaire d'un seul proton, c'est-à-dire pour 
la "résonance magnétique nucléaire", nous avons les données expérimentales suivantes pour un champ 


constant 84 = 1[7]: 


f =40[MH], 1=7[m],£,=AE= 2107 [e7] 


et donc la technologie de résonance magnétique nucléaire est basée sur la détection des ondes radio. 
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Notes personnelles: 
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Cosmologie 


47. ASTRONOMIE (MÉCANIQUE CÉLÉSTE) 


1 a mécanique céleste est la conséquence de la loi d'attraction universelle de Newton et du 


principe fondamental de la mécanique (cf. chapitre de Mécanique Classique). Elle a pour principal 
objectif la description du mouvement d'objets astronomiques tels que les étoiles et planètes à l'aide 
des théories physiques et mathématiques. 


Nous allons dans ce chapitre aborder le sujet, comme toujours sur ce site, de la manière la plus 
élémentaire possible (à ce jour les sujets traités sur cette page ne dépassent pas techniquement le 
niveau de ce qui se faisait au milieu du 18ème siècle dans le domaine de l'astronomie). 


D'abord, nous nous échaufferons avec une loi sympathique sur le vivant dans l'Univers. (l'équation 
de Drake). Une fois cet exercice de style accompli, nous commencerons à "énumérer" les lois de 
Kepler (en faisant souvent référence au chapitre de Mécanique Classique) pour ensuite étudier en 
détails les propriétés des orbitales Képlériennes à l'aide de la mécanique et ensuite à l'aide de la 
relativité restreinte, ce qui nous amènera à constater une précession théorique des orbitales 
concernées. Ensuite, nous nous amuserons à modéliser approximativement la variation de la durée de 
la journée (et de la nuit) sur la Terre en fonction du mois et de la latitude. Enfin, pour terminer en 
beauté, nous nous lancerons dans le calcul détaillé des cinq points de Lagrange! 


2 


ÉQUATION DE DRAKE 


Cette équation a été inventée (..) par F. Drake dans les années 1960 dans l'intention d'estimer le 
nombre de civilisations extraterrestres dans notre galaxie avec lesquelles nous pourrions entrer en 
contact. Le principal objet de cette équation pour les scientifiques est de déterminer ses facteurs, afin 
de connaître le nombre probable et (très) estimé de civilisations extraterrestres. 


Cette équation empirique (qui reste un amusement... et dont le principe peut être appliqué à pas mal 
de domaines différents de la physique et de la vie...) s'écrit: 


NN nef A LS 


Les termes de cette formule (car c'en est une!) se définissent ainsi: 


- NM* représente le nombre d'étoiles dans une seule et unique galaxie 

- f, est la fraction d'étoiles qui auraient une planète en orbite (comprise entre 0 et 1) 

- #, est le nombre de planètes par étoile qui remplissent les conditions au développement de la vie 
- f, est la fraction de planètes dont la vie s'est effectivement développée (comprise entre 0 et 1) 

- f; est la fraction de celles où une vie intelligente s'est développée (comprise entre 0 et 1) 


- f. est la fraction de qui a mis en oeuvre des moyens de communication radio (comprise entre 0 
et 1) 


- Jr est la fraction de temps pendant laquelle les civilisations  vivront (comprise entre 0 et 1) 


Dans la pratique, il faut remarquer que l'équation consiste à essayer de déterminer une quantité 
inconnue à partir d'autres quantités qui sont tout aussi inconnues qu'elles. Maïs c'est une équation 
sympa à sortir et à évaluer entre amis pour passer le temps... 


Il n'existe donc pas de garantie que l'on soit davantage fixé après cette estimation qu'avant (argument 
nommé parfois dans la littérature "garbage in, garbage out".….). 


La valeur résultante peut motiver que les développements qui vont suivre ne sont pas applicables 
qu'à un seul système solaire dans l'Univers... peut-être. (cela ferait beaucoup de vide gâché sinon...). 


LOIS DE KEPLER 


En astronomie, les lois de Kepler décrivent les propriétés principales du mouvement des planètes 
autour d'un astre principal, sans les expliquer (à l'époque!). Elles ont été découvertes par Johannes 
Kepler à partir des observations et mesures (en quantité phénoménale) de la position des planètes 
faites par Tycho Brahe, mesures qui étaient très précises pour l'époque. 


Les deux premières lois de Kepler furent publiées en 1609 et la troisième en 1618. Les orbites 
elliptiques, telles qu'énoncées dans ses deux premières lois, permettent d'expliquer la complexité du 
mouvement apparent des planètes. 


Peu après, Isaac Newton découvrit en 1687 la loi de l'attraction gravitationnelle (ou gravitation), 
déduisant de celle-ci, par le calcul, les 3 lois de Kepler. 


Nous allons maintenant nous efforcer de présenter ces lois de la manière la plus pertinente possible: 


PREMIÈRE LOI 


ZA 


La "première loi de Kepler", appelée parfois aussi "loi de conicité” ou encore "loi des orbites" 
s'énonce ainsi: Les orbites des planètes sont des coniques (ellipses) dont le Soleil occupe l'un des 
foyers. 


Au fait, il convient de préciser que ce n'est pas vraiment une "loi" dans le sens propre du terme 
puisque plus loin vous en trouverez la démonstration telle que: 


P 


PO = —— 
l+ecos 8 


Remarque: Le lecteur qui aura lu au préalable le chapitre de Géométrie Analytique ne sera pas 
étranger à cette relation... 


DEUXIÈME LOI 


La "deuxième loi de Kepler", appelée parfois aussi "loi des aires", nous dit que le segment qui joint 
une planète au Soleil balaie des aires égales en des temps égaux (vitesse aréolaire constante) tel que: 


C'est une relation qui découle de la conservation du moment cinétique comme nous l'avons déjà 
démontré dans le chapitre de Mécanique Classique où nous avions obtenu: 
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Donc à nouveau, son statut de "loi" est discutable dans le langage de la physique moderne! 


Par ailleurs, rappelons que nous avions aussi obtenu comme résultat que le mouvement soit et reste 
plan sans aucune action extérieure! 


Nous constatons par ailleurs que cette loi nous donne que la vitesse de la planète est variable. Elle est 
plus grande au périhélie qu'à l'aphélie: 


périhélie 


Figure: 47.1 - Représentation des surfaces balayées 
Ceci se vérifie pour la Terre par exemple. En effet, cette dernière est plus proche du Soleil en hiver 
(pour l'hémisphère Nord) et elle a alors une vitesse sur trajectoire un peu plus élevée qu'en été; le 
temps de parcours est donc plus faible (l'hiver compte moins de jours que les autres saisons). 


TROISIÈME LOI 


La "troisième loi de Kepler", appelée parfois aussi "loi des périodes", s'énonce ainsi: Les carrés des 
périodes de révolution T sont proportionnels aux cubes des demi-grands axes D des orbites: 


T? mc*: D (475) 


À nouveau, nous verrons plus loin que le statut de "loi" n'est plus justifiable à notre époque puisqu'il 
est possible de démontrer que cette relation, dont l'expression sera détaillée, est réellement: 


Bien évidemment, Kepler n'a pas d'emblée publié ses trois lois dans cette provocante simplicité. Leur 
ordre actuel n'est d'ailleurs pas celui de leur énonciation.. Elles sont en réalité à dénicher au milieu 
d'un foisonnement de spéculations physiques et de réflexions sur l'harmonie du monde. 
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LOI DE LA GRAVITATION DE NEWTON 


Pour vérifier l'exactitude de son hypothèse, Newton (relativement longtemps après) retrouva les lois 
de Kepler à partir de la loi de la gravitation, donnant ainsi l'explication du mouvement général des 
planètes. 


Newton considéra pour déterminer la loi de gravitation une planète théorique, gravitant autour du 
Soleil sur une orbite circulaire à vitesse constante v. Pendant une orbite complète, la planète parcourt 
une distance égale à la circonférence du cercle de rayon R, soit 2x7À, en un temps (sa période) égal à 
cette distance divisée par sa vitesse, soit: 


Newton s'appuie ensuite sur la troisième loi de Kepler avec toujours l'hypothèse d'une orbite 
circulaire. 


Nous avons donc: 
Tr? = c'e : R° 


mais puisque: 
27TR 
T = alors T° = 4x° _ 
V v 
En comparant: 


2 
Fac er" 4m À 


V 


et en posant maintenant que 4x2 divisé par la constante est une nouvelle constante (que nous 
noterons de la même manière que la première bien qu'elle ne lui soit pas égale) on obtient: 


ax R?  , R? Le R2 = te À 
ou a Meet 
C V V 14 


R3 


Ensuite, si nous renversons les termes, cette expression devient (tout en notant que l'inverse de la 
constante d'origine est, elle aussi, une constante): 


1 2 
— = — 


k° À 


Par un autre calcul, nous avons déjà établi dans le chapitre de Mécanique Classique l'expression de la 
force centrifuge: 


en rapprochant cette expression de l'expression précédente: 


ON ONE LE 
ms 7 (FN 
c* À AR 
nous obtenons: 
v? 1 1 m'c* 


Il existerait donc une force opposée à la force centrifuge qui maintient la cohésion orbitale et qui 
s'écrit: 


reste à déterminer la valeur de la constante! 


Il est trivial que la masse centrale M du système orbital doit intervenir d'une façon ou d'une autre 
dans cette constante. Si la masse du corps secondaire intervient de façon proportionnelle dans la 
force centrifuge, l'envie est grande de faire de même avec la masse du corps central. Donc: 


m'M'c* 
Fa = TR 
maintenant a priori il n'y aurait plus de paramètres à prendre en compte. La constante restante est là 
pour satisfaire à l'analyse dimensionnelle de telle façon que l'on ait des "Newtons" (nom donné à 
l'unité de force) des deux côtés de l'égalité. Les scientifiques ont déterminé avec grande précision 
cette "constante gravitationnelle" notée G qui a priori semble universelle et qui a comme valeur: 


G=6.6732 10! [Nm Kg?] (47.8) 


Ce qui nous amène à écrire la "loi de la gravitation de Newton": 


Évidemment il ne s'agit nullement d'une vraie démonstration car nous nous sommes basés sur les 
observations expérimentales de Kepler. Par contre, à partir de la relativité générale il est possible de 
la démontrer (sous certaines hypothèses...)! 


Remarque: En égalisant force centrifuge et force gravitationnelle, il est assez facile d'obtenir une 
approximation de la vitesse de rotation des planètes sur leur orbite. Le lecteur qui fera le calcul 
verra que le chiffre tourne pour les planètes du système solaire autour d'une vitesse de l'ordre de 
100'000 [km/h]. 


À partir de cette dernière relation, revenons brièvement sur notre troisième loi de Kepler et détaillons 
là un peu pour montrer qu'elle est valable pour tout type d'orbite conique et afin de déterminer 
l'expression de sa constante. 


Exprimée dans le repère de Frenet (cf. chapitre de Géométrie Différentielle), et décomposée en son 
accélération normale (centripète) et tangentielle, l'accélération par rapport à un référentiel 
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géocentrique (dans le cas d'un référentiel situé au centre de masse du système l'expression change un 
peu) s'écrit: 


2 


a. = [0e de 


Des relations obtenues lors des développements précédents: 


2 
T?=c*:R$ et T° TES 
L 


la constante de la troisième loi de Kepler prend comme valeur (c'est une formulation utilisée parfois 
dans la pratique mais une étape non rigoureusement nécessaire dans le présent développement): 


c* = 47 2 = at 
v? R 4 R 


Or, puisque nous avons aussi: 


R R? R 
alors: 
2 
mue tn le 
Gm R2 Cm R° Cm 
& 
d'où: 
72 AT 3 
Gn 


Finalement, la troisième loi de Kepler se retrouve alors fréquemment dans la littérature sous la forme 
suivante: 


Cet interlude effectué, revenons sur notre loi de la gravitation de Newton: 


Gom M 
Fe — 5 — 


À partir de cette loi de la gravitation, nous pouvons retrouver toutes les lois de Kepler. D'ailleurs, 
nous l'avons déjà fait pour la deuxième et troisième loi de Kepler puisque ce sont ces dernières que 
nous avons utilisées pour obtenir cette relation (c'est cependant un peu le serpent qui se mange la 
queue...). 


Sous forme vectorielle nous avons ainsi: 


Identiquement au champ électrique (cf. chapitre d'Électrostatique), nous pouvons développer: 


Fans Cm (FA) 


{IF -AT FA 


=m & (4729) 


Comme le champ électrique dérive d'un potentiel électrique, identiquement, le champ gravitationnel 
dérive lui aussi d'un potentiel gravitationnel. En effectuant le même développement qu'en 
électromagnétisme pour la première équation de Maxwell (cf. chapitre d'Électrodynamique), nous 
démontrons que: 


he 


a=V'@ (47.30) 
où est le "potentiel gravitationnel" qui varie en raison inverse de la distance relative des corps 


(ceci confirmant ce que nous avions démontré lors de notre étude du théorème de Noether dans le 
chapitre traitant des Principes) et vaut donc: 


Remarque: Nous retrouverons souvent ce potentiel dans le chapitre de Relativité Générale. Il 
convient donc de s'en souvenir si possible. 


Écriture qui implique bien évidemment la relation suivante: 


F=-mV:@p (4731) 


L & = 
Remarque: Evidemment en l'absence de champ, nous avons $@ = € et donc & sera nul. 


Comme en électromagnétisme à nouveau, nous démontrons comme nous l'avons fait pour la 
première équation de Maxwell que: 


D, = ga oas = ele =4nOm Vo =4nGe 52 


Z 


Si nous exprimons cette équation en fonction d'un potentiel gravitationnel © (noté aussi souvent par 
la lettre U comme en EÉlectrostatique..), nous obtenons: 


Ÿo (V p) =47nGEP (4732) 


ce que l'on note de façon plus esthétique avec le laplacien scalaire (cf. chapitre de Calcul Vectoriel): 


A'p=47GpP| (47.34) 
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qui n'est autre que "l'équation de Newton-Poisson" que nous retrouverons aussi lors de notre étude de 
la relativité générale (elle y a une place importante pour des raisons de validation de la théorie 
d'Einstein)! 


Cette équation signifie que la théorie Newtonienne de la gravitation se résume à dire que le champ 
gravitationnel est décrit par un seul potentiel © engendré par la densité volumique de masse et 
déterminant l'accélération d'une particule d'épreuve plongée dans le champ extérieur 2. 


Amusons-nous maintenant un peu avec l'équation de la gravitation de Newton pour obtenir quelques 
résultats intéressants et curieux: 


Soit un objet situé à l’extérieur de la Terre et r la distance de cet objet au centre de la Terre, nous 
avons: 


M 'm 
m'g(r) =G' : 
r 
il vient: 
W 
ee) CT 


Si l'objet est situé à la surface de la Terre de rayon R, nous avons (r = R): 


W 
£a ré 


Des deux dernières relations il vient donc: 


2 
gr)=& F] 


En surface nous avons donc bien (on s'y attendait….): 


W 
CL Embed] 


Maintenant, si l'objet est situé à l'intérieur de la Terre en notant la distance par rapport au centre par 
la lettre r et la masse centrale par M, nous avons: 
M'm 


m' g(r)=G" : 
Fr 


Introduisons la masse volumique © que nous supposerons égale partout. 


Mr.) 
3 
4 
M'==7": 
3 re) 


En combinant ces quatre dernières relations, nous obtenons: 


VOA erAT ER EPRIEIR [SCIENCES.CH] 
_ F n 
tr) = & F (47.42) 


g(r) 


R 2 
r 


0! intérieur jp extérieur 


Figure: 47.2 - Profil intérieur/extérieur de l'accélération gravitationnelle 


Pour de nombreuses personnes ce résultat est assez contre intuitif (faites un petit sondage dans votre 
entourage, VOUS verrez). 


SPHÉRISATION DES CORPS CÉLESTES 


À l'aide de la loi de Newton, nous pouvons répondre à pas mal de questions pertinentes de manière 
approximative et nous donnant des résultats tout à fait probants. 


Un premier exemple est de se demander à quelle échelle il y a une transition du domaine des formes 
(les astéroïdes, lunes de Mars, comètes, etc.) au domaine des sphères (planètes et grandes lunes)? 
Pourquoi les satellites de Mars, Phobos et Deimos, ont une forme patatoïde tandis que notre lune est 
à peu près sphérique. Nous allons voir que ceci est dû à la masse qui est plus importante dans le cas 
de notre lune. Effectivement, à partir d'une certaine masse, les formes géométriques quelconques ne 
sont plus possibles. 


Pour aborder cette étude, nous allons d'abord estimer la hauteur maximale d'une montagne sur une 
planète. Le Mont Everest a une altitude de 8.8 [km] tandis que le Mont Olympus sur Mars est de 27 
[km]. Pourquoi de telles montagnes ne peuvent-elles exister sur Terre? 


Pour prendre une approche simpliste, nous allons supposer qu'une montagne doit être en équilibre 
hydrostatique. Nous connaissons expérimentalement la pression limite type dans un réseau cristallin 


de roches au-delà de laquelle les roches commencent à "couler": Æ,, = 3: 105 [Pa]. 


Nous connaissons de par notre étude la mécanique des milieux continus (cf. chapitre de Mécanique 
Des Milieux Continus) que la pression à la base d'une montagne de hauteur h sera donnée dans 
l'approximation hydrostatique par: 


PB, =gPh (47.43) 
Pour que la montagne soit stable, il faut donc que: 


Æ < As et donc # <Ag (47.41) 
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Ainsi: 


k = Him _ Le 
Pg PmG 


En supposant une densité moyenne de © = 3'000 [kg m* | (croûte continentale de la Terre) nous 


obtenons: 

- Terre: 4 = 10 [&] 

- Mars: # = 27 [ia] 

Ce qui est remarquable comme résultat approximatif. 


Pour estimer la taille minimale ?,, d'un astre, à partir de laquelle la forme sphérique devient 
prédominante par rapport aux déformations de la surface (c'est-à-dire où la gravitation a pris le 
dessus sur les forces interatomiques), nous allons exiger que la taille 7,, soit supérieure à la hauteur 
maximale d'une montagne #. Nous supposons aussi que la densité © reste constante à travers 
l'astre. En reprenant la relation: 


# : Enr? 
ormG 
nous avons: 
Br a 2 
% = He or 
26 3 
d'où: 
_ 3B 
G4r 


bien évidemment pour ? # 7, nous serons encore plus proche de la forme sphérique. 
APLATISSEMENT DES CORPS CÉLESTES 
À cause de la symétrie du potentiel gravitationnel une étoile ou une planète devrait avoir une forme 


parfaitement sphérique à partir d'une certaine taille comme nous venons de le voir. Or, il n'en n'est 
pas ainsi. 


À cause de la rotation propre de l'astre, un terme centrifuge vient modifier le potentiel. Ce terme 
dépend de la latitude ce qui explique la forme ellipsoïdale. 


Rappelons que: 


où R est le rayon équatorial de l'astre à laquelle vient s'ajouter l'accélération centrifuge à une latitude 
donnée de rayon r: 


Ainsi, l'accélération totale: 


M 
un =C—+ @r (47.52) 
R2 
explique simplement que la Terre est aplatie aux pôles (ou selon le point de vue: étirée à l'équateur...) 
et que plus une planète tourne vide, plus elle sera aplatie aux pôles. 


Sur Terre, le rayon équatorial est de 6379 [km] tandis que le rayon polaire est de 6357 [km]. La 
différence est de 22 [km]. "L'aplatissement" d'une planète peut être exprimé comme: 


soit la différence entre rayon équatorial et le rayon polaire divisée par le rayon équatorial. 


Bien qu'un ellipsoïde de révolution soit la meilleure description pour la forme d'une planète: 


il y a des imperfections entre le modèle et la réalité pour certains corps du système solaire (en 
particulier les planètes telluriques, les satellites, et les petits corps rocheux). Le géopotentiel d'une 
planète réelle peut avoir une forme nettement plus compliquée à cause des influences des 
inhomogénéités visibles à la surface comme l'atteste cette image satellite de la Terre omettant les 
parties liquides (les déformations ont été un peu exagérées sur l'image ci-dessous): 


Figure: 47.4 - Image de la Terre sans son atmosphère 


Les géodésistes tiennent compte de ces inhomogénéités. Ils mesurent et décrivent la forme des 
planètes qu'ils appellent "géoïdes". 


STABILITÉ DES ATMOSPHÈRES 


En comparant les vitesses de libération et les vitesses de divers gaz, nous pouvons expliquer la 
stabilité de certaines atmosphères et l'inexistence d'autres. Nous avons démontré dans le chapitre de 
Mécanique Classique que la vitesse de libération d'un astre sphérique était donnée par la relation 
suivante (sur laquelle nous reviendrons aussi dans le chapitre de Relativité Générale): 


GW 
v= EE (47.54) 
À 


Pour la Terre, une application numérique donne v; = 11.2 10° [m/s] et pour la Lune 
v = 2.37.10° [m/s]. 


Rappelons que nous avons démontré dans le chapitre de Mécanique Des Milieux Continus lors de 
notre détermination de la température cinétique la relation suivante: 


3XT 
v = Eu (47.55) 
Fr 


En utilisant la masse molaire (cf. chapitre de Chimie Thermique): 


LEA 47.56 
v = — À 5 
M. ( ) 


Une application numérique donne pour l'azote V4 = 517 [2/5] et pour l'hydrogène 
vg =1934 [#/5] avec une température arbitraire de 300 [K1]. 


Donc l'azote est nettement piégé dans l'atmosphère terrestre. L'hydrogène, gaz léger, donc rapide l'est 
moins. Les deux gaz sont encore moins retenus par la Lune. 


Remarque: En fait, la vitesse quadratique moyenne n'est pas la vitesse unique des molécules. Il y 
a une distribution des vitesses. Nous avons effectivement vu la distribution de Maxwell- 
Boltzmann d'un gaz à l'équilibre dans le chapitre de Mécanique Statistique. 
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LIMITE DE ROCHE 


La limite de Roche est la distance théorique en dessous de laquelle un satellite commencerait à se 
disloquer sous l'action des forces de marées causées par le corps céleste autour duquel il orbite, ces 
forces dépassant la cohésion interne du satellite. 


Nous pouvons simplifier le problème en considérant le satellite liquide et en le décomposant en deux 
petites masses m de rayon r et de masse volumique &,4. 


2r 


D 
—————————————————+ 


Figure: 47.5 - Configuration pour l'étude de la limite de Roche 


La planète est une sphère de rayon R, de masse M, de masse volumique ,5, située à une distance D 
de l'axe du satellite. 


La planète exerce sur le satellite une attraction gravitationnelle: 


ma 
F, SE 7 (47.57) 


La différence de force entre les 2 masses est: 


ÂF, = pe Qi (47.58) 
(D-r) (D+r) 

Nous pouvons considérer r <# 2, ce qui donne: 

| #5 

(D-rÿ (DH) D 1-25 1422 D 2x fu 27) (47.59) 

= 43 
Donc la différence de force est 

ÀAF, =G . r (47.60) 
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La force de cohésion du satellite résulte dans l'attraction gravitationnelle entre les 2 masses: 


Or nous avons les relations: 
4 4 
M = 3 TR Pyia et = 377 Pa 


donc nous obtenons: 


3 
Pa 16 


8 pla D 


et nous en déduisons la "limite de Roche": 


Comme, dans ce calcul, nous avons considéré un satellite constitué de deux masses ponctuelles, et 
que de plus nous avons supposé que la cohésion du satellite était assurée exclusivement par les 
interactions gravitationnelles, cette valeur n'est qu'un ordre de grandeur (un minimum donc!). 


Il faut savoir que les forces de marées de Jupiter ou de Saturne sur leurs satellites respectifs 
déforment de plusieurs centaines de mètres leur structure interne. Cela a pour effet de dégager de la 
chaleur par friction et déformation et provoque une dynamique de surface (éruptions) qui peut aider à 
l'émergence d'une forme de la vie élémentaire même dans les conditions extrêmes de température qui 
y règnent. 


TRAJECTOIRES D'ORBITALES KÉPLÉRIENNES 


L'observation (outil principal du physicien pour rappel) semble montrer qu'à première vue, les 
trajectoires suivies par les corps célestes en orbite autour d'astres sont bien du type conique (ouf!). 
Sachant cela, nous pouvons, afin de faciliter les calculs, anticiper la complexification des calculs et 
exprimer directement la dynamique d'un point matériel en des coordonnées polaires. 


Comme nous l'avons vu dans le chapitre de Calcul Vectoriel, la vitesse en coordonnées polaires 
s'exprime par la relation (nous avons changé la lettre grecque de notation de l'angle pour nous 
adapter à la tradition): 


où pour rappel le premier terme est la composante radiale de la vitesse et le second la composante 
tangentielle de la vitesse (angulaire). 


Pour l'accélération (la démonstration se trouvant toujours dans le chapitre de Calcul Vectoriel): 


L (d?r (4) A ECI CA d?8). 
Œmi—-FIi— ur. —— + —— |l 17.67 
dr? dt d æ& "42 fe 75) 


Maintenant que nous avons les outils nécessaires, attaquons-nous au cas des orbites Képlériennes 
dans le cas d'un champ Newtonien. 


Il existe à notre connaissance deux manières principales de faire les développements mathématiques 
nécessaires mais qui n'amènent pas (à notre connaissance) au même niveau de détail quant au 
résultat. La première approche qui permet d'obtenir un résultat plus fin mais où la démarche est un 
peu du bricolage par moments. est basée sur l'utilisation de la vitesse radiale et d'une relation 
importante en astronomie, appelée "première formule de Binet". La seconde approche est la plus 
simple et la plus élégante, elle utilise l'accélération radiale pour l'approche du problème et une 
relation spéciale appelée "deuxième formule de Binet". 


PREMIÈRE FORMULE DE BINET 


Pour commencer par cette première approche du problème, rappelons que nous avons déjà démontré 
plus haut que: 


e ue —(_ M 
F = GE à = gai[ 7) =-mgrad(U) (47.68) 


Cependant, il est peu probable que le corps principal soit une sphère parfaite et homogène... Les 
astrophysiciens ont donc l'habitude de noter le potentiel Newtonien U sous la forme: 


U=-É(f) (76) 
- 
où = GW est appelée "constante de gravitation de l'astre" et où f est une fonction représentant les 
hétérogénéités de l'astre. 
S'il est un endroit de l'Univers où les lois de la mécanique sont parfaitement vérifiables, c'est bien 
l'espace, parce que le frottement ou les causes de dissipation y sont extrêmement faibles. Dans le 
champ d'une seule force dérivant d'un potentiel, le mouvement vérifie la conservation de l'énergie 


mécanique. 


Nous aboutissons ainsi à l'équation dite de l'énergie, dans laquelle E désigne "l'énergie spécifique" 
par unité de masse (kilogramme) envoyé. 


E =E +tU= 2m -mË = ME (47.70) 
Fr 


donc: 
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La force de gravitation Newtonienne est centrale, donc de couple nul au centre O du corps principal. 
Il en résulte la conservation du moment cinétique en norme et en direction, soit: 


Zu 


Le vecteur JF est l' unitaire de » ou de # appelé "moment cinétique réduit". K est la constante des 
aires (cf. chapitre de Mécanique Classique) telle que: 


-F-Fs1 


Nous rappelons que la norme de la vitesse exprimée en coordonnées polaires plane est donnée par la 
relation (n'oubliez pas que les deux vecteurs de la base polaire sont orthogonaux et que l'on peut 
donc appliquer le théorème de Pythagore pour calculer la norme comme il l'a été démontré dans le 
chapitre de Calcul Vectoriel du site): 


Ce qui nous permet d'écrire pour la constante des aires K: 


Plaçons-nous dans le plan orbital, en coordonnées polaires. Nous possédons deux intégrales 
premières dépendant des deux constantes essentielles E et K. 


Soit la relation déjà démontrée: 


L dr 49 _ 
V=—u, tr —ù, 
dé dé 
et sa norme au Carré: 
2 2 
2 = dr + r? ag 
dé dt 
Or dans le cas d'une force centrale: 
Pure d8.E 
dt dt r 


Mettons cela dans l'expression de v? antéprécédente, nous avons alors: 


; Éi dE 2 SE) Ê | k? 
Mm|l——| +rl2 +=) ===) += 
dt dt dt 48 r? dt 48 rè 
(47.79) 
K drŸ K? à (NY &2 offaf(1\Ÿ 1 
|| += || += = KE) +— 
r2 48 r2 48 r r2 48 r r? 


Cette dernière relation est appelée "première formule de Binet". 


En égalant avec l'expression de v? résultant de la conservation de l'énergie vue un peu plus haut, 


nous avons: 
alfa fi 1) 2x 
RAC) +7) Bree cran 


Ce qui nous donne une équation différentielle assez compliquée: 


2 2 2 
1 2E 
at) | Fe Ft (20 
Fr Fr 


Et là nous nous demandons comment nous pouvons faire pour nous en sortir? Après quelques heures 
de réflexion. nous nous rendons compte qu'il faut faire une substitution. Après une autre heure de 
chaos neuronal cela finit par aboutir. Nous décidons de poser (nous en avons tout à fait le droit), 
sachant que r est une fonction u de 8: 


2 
_e le + 22 (47.82) 
r K& EE 


Dérivons allègrement par rapport à 89: 


al! 
Fr 2E du (47.83) 
48 - + K? à 


Substituons dans l'équation différentielle: 


(af (£a (ee) 


Après simplification, nous obtenons: 


Nous séparons les variables pour intégrer: 
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Nous avons deux solutions suivant le signe que nous choisissons. Cependant, à la fin de la 
résolution, nous remarquons que le seul choix physiquement intéressant est le signe négatif. Nous 
avons démontré dans le chapitre de Calcul Différentiel Et Intégral lors de notre étude des dérivées 
usuelles que: 


4 d'arccos(x) ae | 
dx 1 x? 
| (47.87) 
_d'arcsin(x) 1] 
dx 1- x? 


Nous allons opter pour la primitive en cosinus et dès lors, nous avons: 

arccos(u) = 8-64 —u=cos(8-4) (4788) 
Nous laissons, par approximation, de côté la constante d'intégration qui impliquerait des très faibles 
oscillations sur la trajectoire de l'orbite (si vous faites une étude ou un TP sur le sujet, communiquez- 


moi les graphiques que vous obtenez avec ou sans la constante, cela m'intéresserait). 


Ce qui nous permet d'obtenir: 


Or, nous voyons que notre choix du signe pour l'intégration se justifie pleinement puisque 
maintenant, si nous faisons un petit rappel sur les coniques (cf. chapitre de Géométrique Analytique), 


nous voyons que nous avons: 
FF es (47.90) 
l+ecosé 


où e est l'excentricité (rapport du petit axe & = € fa 1) et p le paramètre focal (2 = b?{a ) d'une 
ellipse. Ce qui correspond bien aux trajectoires que suivent les astres en orbite. 


Nous retrouvons donc bien la première "loi" de Kepler…. 


Dans notre cas, nous avons après simplification: 


DE 
P=—\etle= [l+t——| (4791) 
# # 


où (pour rappel) K est la constante des aires: 


K=E]=fFx5| («4792 
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et £{ la constante de gravitation de l'astre: 


H=GM (4793) 
et enfin E l'énergie spécifique: 


DE (4704 


g=1 
2 Fr 


Le lecteur vérifiera comme nous l'avons vu dans le chapitre de Géométrie Analytique lors de notre 
étude des coniques que si: 


- £ 2 0,e = 1 nous avons une orbite ouverte sous forme de parabole 
- 8 > 1 nous avons une orbite ouverte sous forme d'hyperbole 


- EÊ£0,0£e € 1 nous avons une orbite fermée sous forme d'une ellipse ou de cercle. 


hyperbole 
AT 
T s 
dl oi parabole 
Te 
f Fe a a + 
V4 Pa Pi K, 
À vd PF sRe \ 
d / fm SSeE\ \ | 
1 (l 
[[IL @ cercle 'ellipse 
\ Aù 
. 0, VAL 
\ \N | / 
* Ne _ nd 
\ se ne EE 
N a "S 
NC mn. ORNE 
RL" 
L 
D.” 
ke. 


Figure: 47.6 - Rappels sur les coniques 
Enfin, si nous injectons: 


PE (47.95) 
l+ecos 


dans la première formule de Binet: 
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nous obtenons alors la vitesse en n'importe quel point de l'ellipse en fonction du principal paramètre 
variable qui est donc l'angle. 


DEUXIÈME FORMULE DE BINET 


Voyons maintenant l'approche basée sur l'accélération radiale qui tout en étant plus élégante, nous 
permet d'obtenir un résultat moins fin concernant les paramètres de l'ellipse. 


Nous partons donc l'expression de l'accélération en coordonnées polaires (cf. chapitre de Calcul 


Vectoriel): 
. (a?r (4) _ fodrag d?8). 
G=|—-rl— | fu, H2—=—+r— |tg (4797 
dt? dt dt dt dt? 


Nous pouvons simplifier l'écriture du deuxième terme: 


2 ——+r— = _— 


dr 48 478 af 
dt dt Fa r dt 


r ) 47.98 
ä (47.98) 


Or, nous venons de voir plus haut que: 


24 ge te (47.99) 
dé 
et donc: 
0 F =0 (47.100) 
r dt dt 


L'accélération se réduit alors à: 


a = dr, (4e) , (47.101 
l'ai dé Ds 


et: 


d?r d É 2 


2 d6ld6 à 


Alors nous obtenons: 
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é] . [a Éd (4) : 

rt | = —— rl | |4, 

dt a8\a8 & Ja ‘Va 

{a far «ae _,(&Ÿ|, [afak\x_,fkŸ} 
d8\d8}2}dt 12} |” |d8\d8,2),2 1,2} |? 


4°) (47.104) 
- A 

Ef(a(é+)- r)|_1|; 

2 |48| 46,2 


Et donc il vient pour la norme la "deuxième formule de Binet": 


k(a4/f1\ 1 
= 31 +— (47.105) 
Fr Ld& \r/ Fr 
Or, selon la deuxième loi de Newton et de sa loi de Gravitation, nous avons: 


GMn GM 
Fa D sa + (47.106) 
F 


r r 


Nous avons alors avec la deuxième formule de Binet: 


Hu __K DE (47 107) 
r? lag ir) r | 


Soit après simplification et en choisissant le signe de l'accélération à notre convenance pour se 
débarrasser du signe "-", nous avons: 


2 
een (47.108) 
dir) r 


En isolant les constantes, il vient: 
d?f1) 1 
—| -|+-= Es (47.109) 
agir r K? 
Après un petit changement de variables nous reconnaissons le cas particulier d'une équation 


différentielle du second ordre que nous avons déjà rencontrée plusieurs fois jusqu'à maintenant dans 
les différents chapitres du site et que nous rencontrerons encore: 
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2 
d'u, = À (47110) 
a K? 


Comme il est d'usage, nous montrons toutefois les détails de sa résolution. L'équation sans second 
membre est (cf. chapitre de Calcul Différentiel Et Intégral): 


d?u | 
 +u=0 (47111) 
daë? 


Nous avons alors le discriminant qui est négatif puisque: 


cat Va? -4 . #4 = {1 @7.112 


2 2 


Nous avons alors vu dans le chapitre de Calcul Différentiel Et Intégral, que dans cette situation la 
solution de l'équation homogène était de la forme: 


Yn = C'e*cos(H-$#) (47.113) 
Soit dans la situation qui nous concerne, nous avons: 
üj = Ae® cos! 1:8-&)= Acos(9- 4) (47.114) 
Nous injectons la solution homogène dans l'équation différentielle avec second membre: 


2 75 
ue is EP 7 Er PE CH) 
aë K? 


Et voyons immédiatement que pour que l'égalité soit satisfaite, la solution générale est: 


= 1_ Acosi 9-— & Le (47.116) 
Fr K? 


Soit après réarrangement: 


Le 
X P 
a a—— Li) 
K2A l+ecosig- 4 
1+ cosi9—& à 


Et en choisissant l'angle initial comme étant nul, nous retrouvons donc bien: 


— —__E (47.118) 


l+ecos 8 
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à la différence avec la première méthode de résolution que la valeur de la constante À reste inconnue. 
PÉRIODE ORBITALE KÉPLÉRIENNE 


La loi des aires permet, comme nous le savons ne de AL la DA oee ne ten T. En 


effet, l'aire S de l'ellipse valant S=x'a'à ( )itre sur les Formes Géomt ) et ayant déjà 
déterminé lors de la définition du moment on la relation (ci itre de Mécani. 
que): 
RS 
dé 2 


Il vient naturellement: 


rab _K 
‘à 2 
Par ailleurs, l'étude des coniques (cf. chapitre de Géométrie Analytique) nous a montré que: 
b _ T°K? 
: a : 47 a 
et nous avons défini plus haut: 
x2 
P = —— 
Li 


Nous avons donc la relation: 


4 
Li 


T— 


et nous retrouvons du même coup la troisième loi de Kepler.….: 


a _GM 
T? 4x 


ce qui valide nos calculs précédents. 


DÉFLEXION CLASSIQUE DE LA LUMIÈRE 


Les calculs effectués précédemment peuvent s'appliquer à un cas intéressant: la déviation de la 
lumière par un astre selon une interprétation Newtonienne (bien évidemment!). 


Attention!!! Newton ne savait pas à l'époque que le photon était sans masse. Les développements qui 
suivent sont donc une approche erronée à notre époque et qu'il convient de prendre avec des 
pincettes mais qui reste enseignée aujourd'hui car elle permet à des étudiants n'ayant pas encore 
étudié la relativité générale ou qui ne l'étudieront jamais (dans le chapitre de Relativité Générale, le 
lecteur trouvera la démonstration détaillée contemporaine de la déflexion de la lumière qui est d'un 
tout autre niveau) d'avoir une première approche... C'est comme dans tout en physique! Tant qu'on 


n'a pas atteint le niveau de la licence universitaire, on apprend plein de choses "fausses" car 
simplifiées à l'extrême. Ensuite au Master et Doctorat, on apprend des théories un peu plus réalistes 
et valides. 


Bon ceci étant rappelé (suite à une remarque d'un lecteur), nous avons donc montré plus haut que: 


na. 
1+ecos(8 


Dans le cas d'un photon, nous aurions tendance à poser que >” — ® (donc une trajectoire de type 
hyperbolique) et donc pour cela il faut que dans la relation précédente nous ayons (ce qui est 
équivalent à dire que e est strictement supérieure à l'unité comme l'impose la trajectoire 
hyperbolique): 


cos(# = = 
8 


en posant = 28 —X Jes relations trigonométriques élémentaires ( ) 


nous donnent: 
. [æg le 7 @) 1 
an|—|=sin|®-—|--cos{@) = - 
2? 2 e 


et donc en utilisant encore les relations trigonométriques: 


a? nn =l+cot? we 
sl | 2 
sin 


EARS 


soit: 


et nous Savons que: 


2 
ie 
Li 
donc: 
is 2EK? 
2 e 


en négligeant l'énergie potentielle du photon puisque 7 — ®, nous avons (attention!!! rappelons que 
selon ce que nous avons vu dans le chapitre de Relativité Restreinte, le photon n'a pas de masse 
rigoureusement mais Newton n'en savait rien à l'époque!): 


1 
ÆE=—v" (47132 
( ) 
Donc: 
2 zr2 
cot? (?) = 5 (47.133) 
GMA 
donc: 


S,52 
tan? ( _ (47.134) 
après simplification: 


: æ\ CM 
an|—|=— (47135 
2 vx FER 


et comme © est supposé petit, nous avons à l'aide du développement de Taylor (cf. chapitre sur les 
Suites Et Séries) de la fonction tangente: 


c[? =< (47.136) 


il vient donc finalement: 


Or, nous avons par définition: 
a8 ; 
K=r— = à (47138) 
dt 


et nous savons que y = æ@r = 8r (cf. chapitre de Mécanique Classique). Ainsi il vient: 


. 264 
P= 2. (47.139) 


Si la particule est un photon passant au ras de la surface du Soleil alors: 


une application numérique donne: 


= 4.237 "10 Ÿ [rad] = 2.427107 #=0.87" 
x 360 X6060 (47.141) 
27 


La théorie Newtonienne prévoit donc une déviation de 0.87 secondes d'arc pour un rayon lumineux 
frôlant la surface du Soleil. Ce qui est deux fois moins que ce qui peut être observé 
expérimentalement et que ce que donne la relativité générale ( snérale)! 


PRÉCESSION DU PÉRIHÉLIE 


Avant d'étudier la précession des orbites, nous souhaiterions rappeler que le champ gravitationnel est 
un champ conservatif et central. Ceci implique donc que le moment cinétique ( 

) est constant et que la trajectoire a lieu dans un plan dont le vecteur normal à la 
surface conserve toujours la même direction (le vecteur moment cinétique est constant en norme et 
en direction pour rappel!). 


Nous nous attaquerons à l'analyse de la précession du périhélie en prenant en compte les résultats de 
la théorie de la relativité restreinte (cela permettant d'être plus fin dans les résultats obtenus et de 
pouvoir appliquer ces mêmes résultats aux électrons en orbite autour du noyau de l'atome). 


Définitions: 


D1. Le "périhélie" est le point de l'orbite d'un corps céleste (planète, comète, etc.) qui est le plus 
rapproché de l'étoile autour de laquelle il tourne. 


D2. "L'aphélie" est le point de l'orbite d'un objet (planète, comète, etc.) où il est le plus éloigné de 
l'étoile autour de laquelle il tourne. 


D3. "L'équinoxe" est l'instant où l'étoile centrale traverse le plan de l'équateur de l'objet qui est en 
orbite autour de lui. 


Remarque: Lorsque le Soleil passe de l'hémisphère Sud à l'hémisphère Nord de la Terre (en 
d'autres termes que le Soleil se trouve au Zénith à l'équateur à midi), c'est l'équinoxe de 
printemps (20 ou 21 mars), dans le sens inverse, c'est l'équinoxe d'automne (22 ou 23 septembre). 
À ces dates, il y a égalité du jour et de la nuit sur toute la Terre. 


Évidemment, le résultat que nous obtiendrons ne sera pas complet, puisque comme nous le savons, il 
a fallu attendre le développement de la relativité générale pour donner avec exactitude la précession 
du périhélie de Mercure (nous y reviendrons). 


Pour calculer cet effet de précession, nous allons rechercher l'équivalent des formules de Binet vues 
plus haut sous forme relativiste (nous verrons la forme classique dans le chapitre de Relativité 
Générale). Nous procédons comme suit: 


Le lagrangien relativiste du système ( tiv ): 


L=T+V=ue(y-1)+7 


Remarque: Nous soustrayons l'énergie au repos, car seul nous intéresse ici l'étude de l'énergie 
cinétique et potentielle. L'énergie potentielle est sommée dans le lagrangien ci-dessus (ce qui 
n'est pas conforme à l'usage) mais nous inverserons le signe plus loin lors des développements. 


Avec: 
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1 TL 
r-[-5) | rie) ? (47.143) 
é* ge 


et la masse réduite: 


= sas (47.144) 
= 47 144 
a + 


Remarque: Pour déterminer l'expression de la vitesse en coordonnées polaires, nous avons utilisé 
le résultat de nos calculs du chapitre de Calcul Vectoriel. 


Le moment cinétique: 
b= FX (47.145) 
sous forme relativiste et appliqué à notre étude s'écrit: 
b=(GPrx (XF) = (UN FX(BXF) (47.146) 
En prenant la norme, nous avons sans oublier que dans note étude & LF et donc (& Lr) LF: 
b=(uy)@r? (47.147) 
et rappelons que nous avons adopté l'écriture & = 8. Ce qui nous donne finalement: 
b={(uy}r? 8 (47.148) 
Pour établir l'équivalent relativiste des formules de Binet: 


- nous déduisons de l'expression du moment cinétique: 


b 
8=d;0=—— (47.149) 
uyr 


- nous recherchons une relation du type ” =F(8) (puisque la trajectoire est une conique): 


Pad,re= 


=dor (47.150) 
uyr 


Effectivement car rappelons qu'en coordonnées polaires la vitesse est donnée par l'expression 
suivante: 


V=rer., 


C'est-à-dire que * = f(r, 8). Cette dernière expression permet d'écrire que: 
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pm =à,r à (47.152) 


- nous cherchons ensuite une relation 7 =7 (8): 


. b b 
F=d,(d,r)=d,(d,r)d,8 |. Le = (47.153) 


Soit: 


…_ D b 
me [2°] (47.154) 


À partir des équations obtenues précédemment, nous avons successivement: 


ue{(y-)+#=16 (ir 
LC 


4 
| (47.155) 


Rappelons que nous avions défini en relativité restreinte: 


w _r2+7262 
B=— = (47156) 
€? ce? 


Avec les équations précédentes, cela nous donne: 


2 
al SE RE RE PR DES 
73 7 2 e? (47.157) 

— rs KI ” 2 g w] 

pe (2 2) | w#pe?|li 4 

D'autre part: 
il 
pe = =1+ f =1+R 8 (47.158) 


1-8 1-8 


En introduisant l'avant-dernière relation dans cette dernière: 
p2 1 1 
PP =1+ ——||—4,r| +—1| (47159) 
dr relr"Jr 


l 
En posant # —— et comme: 
r 
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l 1 a -[ d l 
. Fa = D CLR EN PE (47.160) 
au -a,| ar 10 d à Û d ,u 


L'avant-dernière relation devient avec cette dernière expression: 


b? 2 
sie) à: 2 [-2u) ru] (47.161) 


& 


En égalant cette dernière relation avec celle du lagrangien: 


2 
a +u] À + L = (47.162) 
LC 


En dérivant cette dernière relation par rapport à 8: 


4 u(d2u)+ Quid "IE fi —— -—_a, 4 (47.163) 
LE 


Effectivement, le lagrangien étant constant au cours du temps (le système est conservatif !), nous 
avons donc: 


dyL =0 (47.164) 


et également: 


du(8) du(8)\_d’u(8) du(8) , du(8) d’u(8) | _—. 
48 ä8 an d& 48 d8 dà® 2e u(8) ue (47.165) 


Or, si nous continuons: 


av aa 
d8 ad. 


En se référant à: 


l 


—d,r=-d,u — d,r=-rd,u ny 


(47.167) 
r2 


Nous obtenons donc: 


14 
RS 2] (à … d, «| a (47.168) 


Ce qui donne finalement après quelques simplifications: 


b2 
2e? 


Le | I ler 
[deu : a | =|1+ (47.169) 
ue JM LT ar 
mc? 
En multipliant cette dernière par pe 


2 2 
dau tu = LE fr ) 1 1 4 


ge? Juc?u? dr 
(47.170) 
dêu +u = Ab HE 
bu LE r 


Dans un potentiel gravitationnel: 


M d M\ _mM 
Lee (a) GT = Gr? (7171) 
r dr r Fr 


L'équation de Binet en relativité restreinte est alors: 


b? 


Cm L + Gr 
diu+u= e pee (47.172) 
PT 


Pour rechercher une solution à cette équation différentielle, nous allons grouper la variable u dans le 
membre de gauche: 


2,2 112 
fioiue  CnEe Cm M 


p? b?c? Be 
47.173 
2 PrM | CGnMy 0 D 
be b LE 


Nous posons: 


L'équation différentielle s'écrit alors: 


déu+(@u-B\=0 (47175) 


Nous posons: 


(Su -B8)=W (47176) 


En prenant la dérivée seconde: 


Nous trouvons alors une simple équation différentielle dont la solution est bien connue: 
diW+SW=0 (47178) 
Les solutions sont du type: 
HF =Ccos($9)+C', sin(s2 9) =G2u -B 
(47.179) 


E 
> ü = À cos(R + sin(R8) ue 
ce? ce? ce 


Ce qui s'écrit encore puisque $è? est une constante: 
B . 
u = k, cos (62 8) + &, sin($2 8) to (47.180) 


 nte 
avec &,4, = €". 


Pour déterminer les constantes &,£, nous nous plaçons d'abord dans la situation pour laquelle 
8 =0, où rest minimal et donc par définition u maximal. 


Nous dérivons par rapport à 4: 


(du). = |-k£Sèsin(s28) +-k&$ècos(è8g) | = 0 (47181) 
= ee 


Donc #; = Ü ce qui fait que la relation: 
| 8 | 
u = k, cos (629) + &, sin($2 8) ts (47.182) 


devient: 


B B EX, 
=k; cos(s26) +=; "o ET 5 


LR 


cos(£a ) (47.183) 


É crite autrement (en essayant de revenir sur une notation similaire à celle de l'étude des coniques) 
cela donne: 


en 
1 ; F1 L P —. 
ê Fes 1+ecosfng) (77184 
Zi (08) 1+ à cos((28) (8) 


Et l'intérêt d'écrire cela ainsi est de remarquer que nous retombons en fin de compte sur l'équation 
d'une ellipse avec p étant le paramètre focal de la conique, paramètre focal donné par (( 


p= a(l-e°) 


où a est le demi-grand axe de l'ellipse. 


Maintenant posons: 


Au premier passage par le périhélie 8 =0 où: 
cos(6à 8,) = cos(0) =1 


nous avons donc: 


l_pt+e) 
ë 


Au deuxième passage par le périhélie 8 = 27, nous avons: 
cos(6è 8,) = cos(277) =] 


nous avons donc également: 


l_p{i+e) 


Là 
La trajectoire est toujours une ellipse mais l'angle $è & qui était nul au départ est devenu $è4, =2x. 
Soit si nous avons: 
9, =8, +À8 
Alors: 
(8, +A8)-88, =2x 


Ce qui nous donne: 


Ag = 27 2 2 
Q m2 M? 
LE b?e? 


Étant donné que  & e?, un développement en série de Taylor (+ 


_1 3 
(1+x) 2 =1--x+2x2- 
8 
En se limitant à l'ordre 2: 
Cm M? CE m° M? 
AS =27 ve EE = 27 + —— 
2b*c € 


Donc en conclusion, il y a un avancement du périhélie s'effectuant dans le sens de rotation du 
satellite. Pour un référentiel situé dans le plan de rotation du satellite, la trajectoire est toujours une 
ellipse. 


Cette avance est de: 


AC 2 M? 


Â& = CRE 


par période. Soit en explicitant le moment cinétique donné pour rappel par: 


b=r.m.v 


Il vient alors après simplification: 


Nous allons maintenant nous permettre une approximation assez grossière (mélange de relativiste et 
non relativiste). Soit à considérer la dernière relation, nous avons obtenu lors de nos développements 
des trajectoires d'orbitales Képlériennes la relation: 


Dès lors en injectant ceci dans la relation de Â& nous avons: 


nm M? nm M? rOM 
bc? PGM c° pe? 


À & = 


Malheureusement, les valeurs numériques pour Mercure ne donnent qu'une précession de 7" d'angle 
par siècle et non pas les 43" d'angle par SIÈUe attendus (...) il manque un facteur 6 que seulement la 
relativité générale ( ) permet de trouver. Il est néanmoins 
intéressant de constater que la relativité, même restreinte, donne déjà une orbite qui précesse là où 
Newton voit une ellipse stable et que cette approximation fonctionne pour toutes les planètes 
exceptées Mercure (planète la plus proche du Soleil et subissant de plein fouet la courbure de 
l'espace-temps). 


Remarque: En appliquant exactement le même raisonnement pour la physique quantique 
corpusculaire (potentiel électrique) mais avec les constantes ad hoc vues dans le chapitre 
d'Électrostatique, nous trouvons: 


avec à = {{r XŸ étant le moment cinétique et dans le cas de l'atome, nous prendrons ( 


L 
b = uyr?8 = 2h 


avec la masse réduite valant: 


Si les positions du périhélie (et donc de l'aphélie) du barycentre Terre-Lune étaient constantes dans 
le temps, la durée des différentes saisons serait, elle aussi constante. Mais l'orbite du barycentre 
Terre-Lune tourne elle aussi dans son plan dans le sens direct à raison d'environ 12" par an (soit une 
révolution en environ 108'000 ans). 


La précession des équinoxes s'effectue dans le sens contraire (sens rétrograde) à raison d'environ 50" 
par an (soit une révolution en environ 26'000 ans). La combinaison de ces deux mouvements permet 
de calculer la période du passage du périhélie de la Terre par la direction de l'équinoxe de printemps, 
cette période d'environ 21'000 ans est appelée précession climatique. 


En effet, tous les 10'500 ans (demi-période de la précession climatique) l'aphélie passe de l'été à 
l'hiver. Or même si la distance Terre-Soleil n'est de loin pas le facteur prédominant dans la nature des 
saisons, la combinaison du passage de la Terre à l'aphélie en hiver donne des hivers un peu plus 
rudes. La distance Terre-Soleil dépend également de la variation de l'excentricité de l'orbite terrestre 
(due aux planètes extérieures et intérieures). Ainsi, les périodes glaciaires sont corrélées avec les 
minima de l'excentricité de l'orbite terrestre. 


Les travaux de l'institut de mécanique céleste (France), depuis les années 1970, auraient permis de 
confirmer définitivement les prédictions théoriques comme quoi l'excentricité de l'orbite terrestre 
subit de larges variations formées de nombreux termes périodiques dont les plus importants ont des 
périodes voisines de 100'000 ans, et pour l'un d'eux, une période de 400'000 ans. Ces résultats 
confirment les variations climatiques de la Terre au cours de l'ère quaternaire. Les 
paléoclimatologies montrent en effet la corrélation entre les variations des éléments de l'orbite 
terrestre et les grandes glaciations du quaternaire. 
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Remarque: Dans le cas de l'atome d'hydrogène (voir le chapitre de Physique Quantique 
Corpusculaire traitant du modèle relativiste de Sommerfeld) avec: 


et la constante de structure fine égale approximativement à -1/137, nous obtenons pour la 
précession du périhélie de l'orbite donnée: 


2 
Ac=n|L] 2167382:10* [rad-s!] 47204 
137 


selon un point de vue corpusculaire de la matière! (ce qui nous le savons n'est plus à l'ordre du 
jour). 


DURÉE DE L'ARC DIURNE 


Nous allons nous intéresser à la durée du jour, plus exactement à la portion de journée où nous 
sommes éclairés par le Soleil, par rapport à la nuit où nous nous trouvons dans l'ombre. 


Remarque: Merci à Xavier Hubaut pour ces très sympathiques développements. 


Dans la réalité, la Terre tourne autour du Soleil et décrit une orbite presque circulaire en même temps 
qu'elle tourne sur elle-même autour de son axe qui est incliné d'environ 23°27' sur le plan de son 
orbite (l'écliptique). 


équinoxe 
21 septembre 


"a \ 

i Istice 
solstice « D SoISUe 
21 décembre \. © 21 juin 


F. 


7 


équinoxe 
21 mars 


Figure: 47.7 - Représentation de la rotation de la Terre sur son orbite avec les phases majeures 


Remarque: Il est évident qu'étant donnée la complexité du problème, nous le simplifierons en 
considérant une orbite circulaire, sans variations (précession, nutation) de l'axe de rotation de la 
Terre. Nous supposerons que le Soleil se réduit à un point (pas d'aurore, ni de crépuscule, etc.). 


Rappelons que la précession est le changement graduel d'orientation de l'axe de rotation d'un objet 
quand un couple (de force) lui est appliqué alors que la nutation est un balancement périodique de 
l'axe de rotation de la Terre autour de sa position moyenne en plus de la précession. 


Représentons la Terre avec son axe de rotation vertical; en conséquence l'équateur sera situé dans un 
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plan horizontal. 


Supposons que ce jour-là, la Terre soit dans une position telle que les rayons du soleil forment un 
angle & avec le plan de l'équateur (ou que réciproquement l'axe de la Terre forme un angle avec le 
plan de l'équateur). Remarquons que cet angle & sera toujours compris selon les mesures actuelles 
entre -23°27' et + 23°27. 


Pour que les choses soient plus aies, nous avons choisi de porter notre analyse sur un jour où # est 
J 
positif. Ainsi, dans l'hémisphère nord, nous sommes proches du solstice d'été! 


Nous chercherons donc la durée du jour à un endroit situé à une latitude À ? Pour fixer les idées, 
plaçons-nous dans les environs de Bruxelles à 50° de latitude Nord. 


Considérons maintenant les figures ci-dessous où la première correspond à une vue de la Terre de 
côté à un instant t de son orbite lorsque & > 0 et la seconde à une coupure cylindrique de diamètre 
NJ (correspondant au diamètre du parallèle de Bruxelles) du volume de la Terre à ce même instant: 


Sur les figures ci-dessus, C désigne le centre de la Terre, et O le centre du parallèle de Bruxelles. 


Fixons un instant t et désignons par M (matin) et S (soir) les deux points du parallèle de Bruxelles où 
le Soleil se lève et se couche (ces points seront considérés comme fixes quel que soit t pour l'instant, 
ce qui est bien évidemment erroné par rapport à la réalité), tandis que J (jour) et N (nuit) seront ceux 
où il est respectivement midi et minuit. 


P sera le point sur le disque correspondant à la parallaxe de Bruxelles où le plan du méridien de midi 
(le plan dont un des côtés est NJ) coupe la droite MS. 


Enfin, Ÿ désignera l'angle 3405 (où O est donc le centre du disque généré par le parallèle de 
Bruxelles) qui sous-tend la partie éclairée par le Soleil et r désignera le rayon SO = MO. 


Pour simplifier le problème, supposons que pendant 24 heures la Terre tourne sur elle-même sans 
modifier la position de son axe de rotation par rapport au Soleil. 


L'angle Ÿ peut se calculer en remarquant que OP vaut, en valeur absolue: 
PO =S0. co(r-À] = MO. co(r-}] =Fr: cos(x- À) 


où r représente le rayon du parallèle de Bruxelles. 


En utilisant les propriétés des fonctions trigonométriques (cf. chapitre de Trigonométrie), nous 


avons: 
PO = -r.c0s a) 
2 


Or, il nous faut encore injecter le paramètre #. Connaïissant la latitude À de Bruxelles, nous avons: 
r=0J= R-cos() 
où R est le rayon de la Terre. 
Nous avons aussi: 
CO=R:.sn (4) 
et dans le triangle COP: 
PO=CO-tan(a)= R-sin(4) tan(a) 
Enfin, en comparant les valeurs obtenues pour PO, nous obtenons: 


PO =R.sn (4 tan (a) 


son eu) + Rsin(4) tan(a) = -r c08[ 2) 


et comme: 
r=O0OT— R-cos(1) 
Nous obtenons finalement: 


R-sin(A) tan (æ)=-R. cos(4). co(}) 


et donc: 


y =—2 arccos (tan (A) -tan (æ)) 


Aux équinoxes (c'est-à-dire quand l'équateur est confondu avec le plan de l'écliptique), nous avons 
æ = 0 et donc: 


y = —2arccos (tan (4) -tan (a)) = —2 arccos (tan (4) 0) = —2 arccos (0) =—XT (47.214) 
Or, comme nous l'avons spécifié au début, il faut prendre la valeur absolue donc: 
F= AR (47215) 


En d'autres termes, quelle que soit la latitude que nous prenons, l'angle formé par la zone de nuit est 
égal à l'angle formé par la zone de jour (les deux étant égaux à Æ). 


Prenons maintenant le solstice d'été, lorsque &= 23°27' en considérant toujours la latitude de 
Bruxelles À = 50°, nous avons: 


y =—2arccos|{tan(50°i-tan(23°27 11 =—-2arccos(0.516951Z=—-118° (47.216) 
ce qui, traduit en nombre d'heures: 


ge. 4 z—79 (47.217) 
360 


Donc la journée de 24 heures perd 7.9 heures. Ce qui équivaut donc à une journée d'environ 
16 heures. 


En résumé pour calculer la durée du jour, il suffit de connaître deux choses: la latitude du lieu et 
l'angle selon lequel le soleil tombe sur le plan de l'équateur à la date choisie. La valeur de cet angle 
est bien connue aux équinoxes (il vaut 0°) et aux solstices (il vaut +23°27' et -23°27,. 


Mais aux autres dates? 


La réponse est fort simple. Imaginons-nous, assis sur le Soleil regardant tout au long de l'année en 
direction du centre de la Terre. 


Au cours de sa rotation autour du Soleil, l'axe de rotation de la Terre conserve son inclinaison sur 
l'écliptique. Vu du Soleil, cet axe tournera autour d'une normale au plan de l'écliptique et décrira 
donc un cône dont le demi-angle au sommet vaut 23°27' (voir figure plus bas). 

L'angle d'attaque & des rayons solaires sur le plan de l'équateur variera donc en fonction de la date 
(nous associons à la date, l'angle $ parcouru par la Terre sur son orbite, à partir de sa position à 
l'équinoxe de printemps) 

Par conséquent, l'angle & variera en fonction de la date 5 de manière sinusoïdale. 


Pour ceux qui ne seraient pas convaincus par ce raisonnement semi-intuitif, voici une autre approche: 


Pour la lisibilité du schéma, nous avons fortement exagéré l'angle formé par l'axe de rotation de la 
Terre avec l'écliptique. 
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Figure: 47.9 - Cône généré par l'axe de rotation de la Terre (précession) 


Soit C le centre de la Terre, À l'extrémité d'un vecteur unité C'4 dirigé suivant l'axe de rotation de la 
Terre (soit perpendiculaire au plan de l'équateur) et C'$ un autre vecteur unité dirigé vers le Soleil. 
Soit maintenant & l'angle du rayon CS avec le plan de l'équateur et À l'angle entre les vecteurs 
unitaires CA et CS. Nous avons alors: 


CS «A =[PSEAfeos(09- ESIIEAeos(Z- a)=sn(e) 4 
=] =l 


Effectivement, le vecteur C4 étant perpendiculaire au plan de l'équateur, il forme un angle droit 


avec celui-ci. Dès lors puisque l'angle £ est l'angle entre ce vecteur et l'écliptique # en est le 
complémentaire. 


Nous avons donc: 
CSoCA=sin(æ) (47.219) 
Décomposons maintenant C4 en la somme de C4! dirigé perpendiculairement au plan de 
l'écliptique et de £'4" situé dans le plan de l'écliptique: 
CS LCA'=0 = 
= [CA] cos (Fc) = [A] -cos( É}cos (Fc) =cos (- a) cos (FC4") (47.220) 
= 


a — 


= sinfæ)cos (3 4) 
Ainsi: 


CS oCA = sin (aæ) cos (Bc4") in (23927 1 cos (BC4') (47.221) 


Mais: 
ee Æ | 
cos{BCA*)= cos É - ) = sin(6) 
Donc finalement: 
CS oCA = sin(23°27 )sin(&) 
et comme nous avons démontré que: 
CS oCA = sin (æ) 
Nous obtenons finalement: 
sin(æ) = sin(23°27')sin(6)= 0.3979 sin (5) 


À présent le problème est résolu et la durée du jour sera fonction de deux variables: la date & et la 
latitude À. 


Il nous suffit donc maintenant de reprendre la relation: 
y=-2arecos(tan (4) tan (a) 
et d'y injecter le nouveau résultat: 
y = |2arccos{tan ( 4)- tan (arcsin (sin (23°27')sin (3)})} 


Avec les outils informatiques à notre disposition, nous pouvons aisément calculer la valeur de }. 
Nous avons par exemple ci-dessous les variations de la durée du jour sur une année à des latitudes 
allant de 0 à 90° réparties de 10 en 10° 


équinoxe solstice équinoxe solstice équinoxe 


Avr Mai Juin Juil Août Sept Oct Nov Déc Janv Févr Mars 


Figure: 47.10 - Angle de la partie éclairée de la Terre en fonction de la période de l'année 


À partir de la latitude du cercle polaire, nous observons, en été, des périodes avec soleil ininterrompu 
(soleil de minuit) et, en hiver, des journées entières de nuit. 


Pour Bruxelles (latitude=50°) nous voyons sur le graphique que la durée du jour varie 
approximativement entre les valeurs de 16h (solstice d'été) et 8h (solstice d'hiver). 


MOUVEMENTS DES PLANÈTES 


Nous allons brièvement nous intéresser aux mouvements des planètes en situations idéales et 
simplifiées. Nous ne considérerons que des mouvements dans le même plan (coplanaires) 
parfaitement circulaires et constants. 


Définition: Les planètes qui sont plus proches du Soleil que la Terre (dont le rayon est inférieur à 
une unité astronomique), c'est-à-dire les planètes Mercure et Vénus, sont les "planètes inférieures". 
Les autres planètes (Mars et au-delà) sont appelées les "planètes supérieures". 


PÉRIODE SYNODIQUE ET SIDÉRALE 


La "période synodique" d'une planète est le temps mis par cette planète pour revenir à la même 
configuration Terre-planète-Soleil (si nous considérons ce cas particulier), c'est-à-dire à la même 
place dans le ciel par rapport au Soleil, vu de la Terre. Cette durée diffère de la période de révolution 
sidérale de la planète, car la Terre elle-même se déplace autour du Soleil. En conséquence, il s'agit de 
la période de révolution apparente, la durée entre deux conjonctions planète-Soleil, telle qu'observée 
depuis la Terre. 


Le terme désigne de façon générale le temps séparant deux aspects identiques de l'objet (opposition, 
conjonction, quadrature, etc.) et dépend donc des trois corps impliqués. 


Pour étudier mathématiquement le problème en question, considérons le schéma suivant avec deux 


planètes décrivant une orbite parfaitement circulaire à vitesse angulaire constante et dans le même 
plan et dans le même sens et où nous avons & > & (donc la planète intérieure va plus vite que la 
planète extérieure): 


Figure: 47.11 - Schéma de base pour la détermination de la période synodique 


où À et À sont deux planètes quelconques dont nous noterons les périodes sidérales respectives par 
T,7 et dont nous déduisons les vitesses angulaires: 


Si nous prenons comme temps zéro, le temps où les deux planètes sont toutes deux alignées sur l'axe 
X et du même côté de l'axe (donc en conjonction inférieure), alors l'angle formé entre ce même axe et 
chacune des planètes est: 


= @£f p= Mit (47.229) 
Nous avons respectivement: 
2 = = — if = jf (47.230) 
Nous cherchons donc tous les instants t où la relation suivante est satisfaite pour un &3 fixé: 


Ga =(@ —-@)é (47.231) 


Il vient alors: 


7 - 42 43 _ AB; 


a-e ?27_27 2x(R-7%) 
ñ & 


Si nous recherchons à partir du temps zéro la première (prochaine) conjonction (supérieure), cela 
revient à poser que &3 = Æ et donc que: 


7-18 
27-77) 


Si nous recherchons à partir du temps zéro la première (prochaine) conjection (inférieure), cela 
revient à poser que &2 = 27 et donc que: 


Dans le cas où 3 > & (typiquement la Terre et une des planètes extérieures), le même 
raisonnement nous amène à: 


Voici quelques périodes synodiques et sidérales des planètes du système solaire: 


Planète Période synodique [j.] Période sidérale [j.] 


Mercure 115.878 87.969 
Vénus 583.921 224.709 
Mars 779.964 686.960 
Jupiter 398.861 4'335.355 
Saturne 378.094 10757.737 
Uranus 369.654 30'708.160 
Neptune 367.486 60"224.904 


À la vue de ce tableau, nous pouvons faire plusieurs constats empiriques: 


1. Pour les planètes intérieures: Plus nous nous approchons du Soleil, plus la période synodique est 
courte, en effet dans la formule établie, plus T. est petit plus T diminue. Ainsi, s'il existait une 


planète tournant très près du Soleil, les deux périodes sidérale et synodique seraient pratiquement 
égales. 


2. Quand nous nous approchons de la Terre, la période augmente. S'il existait une planète voisine de 
la Terre, nous aurions alors T; voisin de T,, et la période synodique deviendrait très grande. 


3. Pour les planètes extérieures: La période synodique diminue quand la planète est plus loin de la 
Terre et tend vers la période sidérale terrestre de 365 jours. Nous voyons bien pour Neptune, si on 
découvrait une planèête située encore plus loin sa période synodique s'approcherait encore plus de 365 


jours. 
RÉTROGRADATION DES PLANÈTES 


La "rétrogradation" ou "mouvement rétrograde" d'une planète est un mouvement apparent de cette 
planète qui donne l'impression de s'arrêter dans sa course dans le "mouvement direct" pour repartir 
en marche arrière. Ce phénomène est la résultante de la différence entre la vitesse de révolution de la 
planète et celle de la Terre autour du Soleil. 


L'exemple ci-dessous illustre à peu près ce qu'un observateur Terrestre (point jaune) peut observer en 
surveillant mois après mois, le mouvement apparent de Mars (point cyan): 


Figure: 47.12 - Principe de la rétrogradation (source: Wikipédia) 


Pour étudier mathématiquement ce phénomène, nous allons considérer la situation suivante: 
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avec deux planètes décrivant une orbite parfaitement circulaire à vitesse angulaire constante et dans 
le même plan et dans le même sens et où nous avons & > &. Il est clair que la planète intérieure va 
dès lors rattraper la planète extérieure et elle va sembler avoir un mouvement rétrograde comme le 
montre la figure ci-dessous: 


3 6 425 i Fond des étoiles fixe 
5 x {repère de mesure) 


Terrestre 1 \ | 


D 


Figure: 47.14 - Schéma explicatif pour le choix du temps zéro 


Comme le lecteur pourra le vérifier sur la figure ci-dessus nous observons que le mouvement 
rétrograde par rapport aux étoiles fixes commence lorsque l'angle entre les deux planètes est nul et 
qu'il finit lorsque l'angle entre les deux planètes passe par un maximum. 

Dès lors, dans le schéma antéprécédent, nous avons: 


17 _ Msmiii-nsniæf 
X3 — X _ M COS hé l— 7 Cosi | 


tan &i= 


(47.236) 


Donc pour connaître le temps entre le moment où l'angle est nul entre les deux planètes, passe par un 
maximum et diminue à nouveau, il suffit de déterminer quand a lieu la variation de signe de la 
fonction précédente. Pour cela, il suffit de chercher quand la dérivée s'annule: 


d{nsni@éi-n sin! @é  . 
dé remis coli | (4/.453/) 


dt M Cosi@hé— 7 Cosi@É| 


En appliquant les règles de dérivation vues dans le chapitre de Calcul Différentiel Et Intégral, nous 
avons: 


d , | 1 
—|1|# ani BE — A AN BE | ———————————— 
a[r- Fe Sn S er 


1 


= { fi A CA SERRE RE FERRER PEN 4 
d'in nes du D NS Va ec eos æti-n cos(æi) 
: fi-nsinl@é 
Ro sin pti + @ sin | 
(F3 cosidéi-r cosi@éil 


(47.238) 
(5 cosi él — An cos Mél cos Ghéi— A cost éi| 
AR ar TT een 
(F3 Cosi Gin cosi ÉI| 
ir sini@éi-nsini@éiill-"@ sni@éii+n@ sini@éil 
RE 2 
(#3 cCosi @éi— 7 cos! il 
= 0 
D'où après simplification: 
1 Cost él Cosi ŒÉIl|" CoSiÉi— A Cosi Éi| 
(47.239) 


|» sin @éi-n sin @éill-" @ saniéi+ne aniafil=0 
Nous développons un peu cela: 


rèæ cos (@ti-"nnœ cos &h£icosi Giéi-n"& cosi é icosi ti + cos? mé 


+ sin? (@£i- "7 @ sani@éisni@éii-7"@ sani@fiisan mti+ra sin? | @fi (CEA) 
= 0 


et nous simplifions un premier coup: 


rÊ @ A cos @héicosi aii-n"@ cosi @é icosi@ti+n a 


"nn @ sini@éisini @éi-An7@ sin @éisin| fé (47.241) 
= 


et un deuxième: 


@3 cosi @éicosi MÉI+@ cosi MéÉICOs| Hé 


2 2 
+ _ 
FE TA AA"? +@ sini@éisin(@éi+@, sini @éisini@é) 


I Q (47.242) 
et enfin une troisième: 
rè @ +7 nn (& + [cos @éicosi @éi+sini @éisini@æé le O (47.243) 


et après réarrangement: 


rè @ + =" & +@ [cos @ficosi @éi+sini@fisin| œé ] (47.244) 


Nous simplifions en utilisant une des relations trigonométriques remarquables démontrées dans le 
chapitre de Trigonométrie: 


re +n'@ = na +@ icosiia - @ if 
Les valeurs de t qui satisfont cette relation nous donnent le changement de signe recherché. 


Si & est la première valeur de t qui vérifie l'équation, nous avons: 


rr@ +r a 


SLT TC ETS 


La valeur suivante de t sera telle que: 
(ai =2r+tiæ — @ lfn (47.247) 
et donc: 


27 
h =— <tig (47.248) 


l La] _ Lg) l 
Si nous faisons intervenir les périodes de rotation, nous avons: 


ä = 
7, -% 


Pour en revenir à: 


2 2 


il peut être plus commode de l'écrire sous la forme traditionnelle suivante: 


r2 _ 2 D 


M | 
BE ‘T3 


Lens 1j ren F3 +2 

A PEL VA PRE A A AE 0 
FE 
172 TE 


ral 
Le ER ele tr 


FT + 
___ AB __nE+NB 
A+) nn +R 

) 


Jusqu'à maintenant, nous avons fait uniquement de la géométrie. Aucune loi de la gravitation n'est 
intervenue dans les calculs. Comme les rayons sont inconnus ou mal connus (historiquement parlant 
du moins), nous allons utiliser la troisième loi de Kepler (loi des périodes): 


Ti=c#.]) (47.252) 


où pour rappel, D est le demi-grand axe de l'orbite, et si celle-ci est circulaire, cela devient un simple 
rayon. Nous avons donc: 


213 
r = (47.253) 
[te 
Dès lors: 
4,3 4/3 
& T PL T- 
à -% TE +8 ke Je? _DOr+F02 
cos| 27 QE —]_@— —  —— 2551) 
(7 +5 i 
Le ee 
et donc: 


El ————— (47.255) 
TÉSTÉS IT +7 | 


Une application numérique donne pour Mercure avec % 87.95 | j.] et pour la Terre 


7, = 365.25 [ j], nous obtenons: 


# =1144[j] (47256) 


Valeur que nous avons représentée sur le schéma ci-dessous: 


Figure: 47.15 - Représentation du temps calculé 


et donc: 


Figure: 47.16 - In extenso le temps calculé multiplié par deux 


et nous avons donc: 


ZT 
4 7 rit æ115.84+1144 (47,257) 


puis un nouveau cycle: 


A7 
3 = T4 (47.258) 
2 T 1 ( o) 
etc. Ce qui donne sous forme schématique: 


rétro: — 2fÿ sens direct rétro: — 2iÿ sens direct { 
——_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_———f# 


12 j. 12 j. 92 j. 12 j. ii 92 j. 


opposition apposifion 
116i 116i 
Figure: 47.17 - Schéma de principe du cycle 


POINTS DE LAGRANGE 


Un "point de Lagrange" (noté L), ou "point de libration", est une position de l'espace où les champs 
de gravité de deux corps en orbite l'un autour de l'autre, et de masses substantielles, se combinent de 
manière à fournir un point d'équilibre à un troisième corps de masse négligeable, tel que les positions 
relatives des trois corps soient fixes. 


Nous allons dans les développements qui vont suivre nous attarder à démontrer au mieux que de tels 
points sont au nombre de 5 notés respectivement L1à LS. 


Il peut être utile de faire une présentation de ces différents points et de leurs propriétés avant de 
passer à la partie calculatoire. Cela aidant peut-être à la compréhension du sujet. 


Nous allons immédiatement considérer le schéma suivant: 


Soleil : 


Il existe cinq points de Lagrange: 

- L1: Sur la ligne définie par les deux masses, entre celles-ci. 

Exemple: 

Nous considérons un objet orbitant autour du Soleil, plus près de celui-ci que la Terre mais sur une 
même ligne. Cet objet subit une gravité solaire supérieure à celle de la Terre, et tourne donc plus 
rapidement autour du Soleil que ne le fait la Terre. Mais la gravité terrestre contrecarre en partie 
celle du Soleil, ce qui le ralentit. Plus on rapproche l'objet de la Terre, plus cet effet est important. À 
un certain point, le point L1, la vitesse angulaire de l'objet devient exactement égale à celle de la 
Terre. 

- L2: Sur la ligne définie par les deux masses, au-delà de la plus petite. 

Exemple: 

Le principe est similaire au cas précédent, de l'autre côté de la Terre. L'objet devrait tourner moins 
vite que la Terre parce que la gravité solaire y est moindre, mais le champ gravitationnel 
supplémentaire dû à la Terre tend à l'accélérer. À un certain point, le point L2, l'objet tourne 
exactement à la même vitesse angulaire que la Terre autour du Soleil. 

- L3: Sur la ligne définie par les deux masses, au-delà de la plus grande. 


DExemple: 


De manière identique au point L2, il existe un point situé un peu plus loin que l'opposé de la Terre 
par rapport au Soleil, où un objet de masse négligeable serait en équilibre. 


- LA et L5: Sur les sommets des deux triangles équilatéraux dont la base est formée par les deux 
masses. 
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Exemple: 


Il s'agit d'un subtil équilibre entre la force centripète exercée par les deux masses principales et la 
force centrifuge des masses considérées aux points intéressés. L4 est en avance sur la plus petite des 
masses, dans son orbite autour de la grande, et L5 est en retard. Ces deux points sont parfois appelés 
"points de Lagrange triangulaires" ou "points Troyens". 


Fait remarquable, ces deux derniers points ne dépendent en rien des masses relatives des deux autres 
corps comme nous le verrons. 


Pour les trois premiers points de Lagrange, la stabilité n'apparaît que dans le plan perpendiculaire à 
la ligne occupée par les deux masses. Par exemple, pour le point L1, si nous déplaçons un objet 
perpendiculairement à la ligne entre les deux masses, les deux forces gravitationnelles vont jouer 
pour le ramener vers la position initiale. L'équilibre est stable. En revanche, si nous le déplaçons vers 
une des deux masses, alors le champ de celle-ci va l'emporter sur l'autre et l'objet tendra à se 
rapprocher encore plus. L'équilibre est instable. Pour les points LA et LS, la stabilité est obtenue 
grâce aux forces de Coriolis qui agissent sur les objets s'éloignant du point. 


Étant données les questions de stabilité évoquées plus haut, nous ne trouvons pas d'objet naturel 
autour des points L1, L2 et L3 dans le système solaire. Cependant, ils représentent tout de même un 
intérêt pour les réalisations scientifiques, car ils permettent des économies de combustible pour le 
contrôle d'orbite et d'attitude. Ceci n'est pas valable pour le point L3, du fait de son éloignement de la 
Terre dont la seule application était que les auteurs de science-fiction et de bande dessinée aimaient y 
placer une Anti-Terre d'autant plus utopique que la masse de cette planète-jumelle y était bien trop 
élevée par rapport à la théorie énoncée plus haut. En revanche, des missions spatiales utilisent L1 et 
L2: c'est le cas de la sonde SoHO (Solar and Heliospheric Observatory) une station d'observation du 
Soleil située au point L1. 


LA et L5 étant stables, nous y trouvons de nombreux corps naturels. Dans le système Jupiter-Soleil, 
plusieurs centaines d'astéroïdes, appelés astéroïdes Troyens, s'y agglutinent (près de 1800 en avril 
2005). Nous en comptons quelques-uns dans les systèmes Neptune-Soleil et Mars-Soleil. 
Curieusement, il semblerait que le système Saturne-Soleil ne soit pas en mesure d'en accumuler, à 
cause des perturbations joviennes. Nous trouvons également des objets à ces points dans le système 
Saturne-satellites de Saturne: Saturne-Téthys avec Télesto et Calypso aux points LA et LS, et 
Saturne-Dioné avec Hélène au point LA et Pollux au point L5. Dans le système Terre-Soleil, il n'y a 
pas d'objet connu de grande taille aux points Troyens, mais on y a découvert une légère 
surabondance de poussière en 1950. De légers nuages de poussière sont également présents pour le 
système Terre-Lune; cela a fait renoncer à y placer un télescope spatial comme le projet en avait été 
envisagé. Le satellite SOHO occupe depuis 1995 le point L1 à 1.5 million de kilomètres de la Terre. 
En 2007 le point L2 sera occupé par le satellite Planck chargé d'étudier le fond diffus cosmologique à 


2.7 [°K]. 


À strictement parler, ces 5 points existent uniquement pour deux corps en rotation circulaire l'un 
autour de l'autre. Dès que l'orbite des deux corps est elliptique, ces points ne sont plus des points 
d'équilibre. En pratique, si l'orbite est faiblement elliptique, comme c'est le cas pour les planètes 
réelles, on peut trouver des orbites oscillantes stables ne s'écartant pas beaucoup des régions 
correspondant aux points de Lagrange. 


Nous allons donc considérer dans l'espace un système isolé de deux corps À et B, de masse 4 et 


W3, en interaction gravitationnelle. Ces deux corps sont en orbite l'un autour de l'autre, à la manière 
d'un système de deux étoiles (système binaire) ou d'un système planète-satellite (Saturne-Titan par 
exemple). Nous cherchons à déterminer s'il existe des positions d'équilibre par rapport au système 
des deux corps en rotation pour un troisième corps (de masse suffisamment faible pour ne pas 
perturber le mouvement du système des deux corps principaux). 
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Soit O le barycentre (cf. chapitre Técanique Cl e) de ces deux astres. Considérons un repère 
Galiléen (en mouvement rectiligne et uniforme ei) d origine ©. Par rapport à ce repère, nous 


supposerons que l'axe AB tourne à une vitesse angulaire constante & d'axe fixe # (perpendiculaire à 
la page dans la figure ci-dessus et dirigé en direction du lecteur) et que les distances r4 = AO et 


rs = BO restent également constantes. 


Nous savons par notre étude de la mécanique classique que dans un mouvement circulaire la force 
centrifuge est donnée par: 


F=ma-=zm— =m = m@°R 
AR R 


Nous avons donc (équilibre entre forces centrifuge et centripète) pour assurer l'équilibre: 


CM ,4,M CM 4,M 
My@°r,= Ps. mi. À É et Mars — toners de . 
(ratrs) 


En simplifiant et en sommant ces deux relations: 


GMy CM y 
nn 
(ratrs) (ratrs) 
> _ G(Ma+My)_ G(Ma+ M5) 


> = = 
(ratrs) F 


2 2 
D rte rg— 


avec dans la suite AB =r4+rp =R, 


Considérons un repère tournant R' lié à nos astres comme représenté sur la figure ci-dessus: j sera 
un vecteur unitaire colinéaire à AB, À un vecteur unitaire perpendiculaire à à et dans le plan de 


rotation des planètes et finalement £ =i x ; colinéaire à &. 


Nous considérons dans ce repère tournant (avec les astres) un troisième astre S de masse négligeable 
m devant W'4 et MW, soumis à l'attraction gravitationnelle de A et B. 


Maintenant notons 4 l'accélération de S par rapport à R', V# sa vitesse et 2, le vecteur unitaire 


colinéaire à OS" où S ‘est le projeté de S dans le plan Oxy, et r = OS" (dans la figure ci-dessus, nous 
avons supposé S dans le plan Oxy, et donc S et S" sont confondus). 


S est donc soumis à deux forces, l'une #4 dirigée vers A et l'autre F3 dirigée vers B, forces 
d'intensités respectives: 


Dans un repère Galiléen, ces deux forces imposent à S une accélération donnée par B loi de 
composition des accélérations dans un référentiel circulaire ( apitre de A assique): 


Or, dans notre configuration la pulsation est constante et l'accélération d'entraînement est nulle 
puisque nous avons posé R ‘ comme référentiel principal. Il vient donc: 


(Fat Fo)= à, +28x5, +&x(GxF)= np +26Xx5, + &x(&xF) 


Nous avons également: 


or, : | 
&x(&xr)=|-ar, |[=-æ°|r, LE nd 
Fr 
( 0 


(Fa+ Fo)= &p +28XY +äx(&x r)= &p +28XV —@ re 


Écrivons plutôt cette relation sous la forme: 


s ls # Li 
Œp se +F5)+aré,-28x5, 


Nous obtenons alors, en projetant sur les trois axes x, y et z, les dérivées prises par rapport au temps t 
le système suivant: 


GW GMT 
x"=- Pa Éx+ra)- re (x-rs)+ @° x -2@y' 
: GM y GM > 2 , 
=— y— y+ey-2@x 
AS° BS° 
. CM y CM 
= ————— ;Z;— Z 
AS ps 


avec: 


AS = f{x+rsŸ + y? +7? et BS = {x-r,Ÿ ES + 72 


pour que les coordonnées (x,y,z) du point S soient celles d'un point d'équilibre, il est bien 
évidemment que dans le référentiel tournant avec les astres À et B que: 


x"=y"=Z2"=0 et x'=y'=2'=0 


Nous obtenons alors le système suivant: 


GM GM 

_ rc (x+rs)- (x-rs)+@x=0 
GMs GM 

PT LA mn 

_CMa _GMr 
AS BS° 


Il vient par ailleurs immédiatement que la troisième équation a pour seule solution z = Ô et donc 
finalement le système se réduit à: 


GMT G 

_ ae 4)— e (x-r5)+@fx= 0 
CM, GMy 2 

de = + y =0 
AS 5° 7 

z=û0 


La troisième équation signifie simplement que les positions d'équilibre sont dans le plan Oxy (on 
pouvait s'en douter un peu...). Les deux autres, nous le verrons, nous amènent à considérer cinq 
solutions qui sont simplement nos cinq points de Lagrange L1, …, L5. 


Si nous traçons avec un logiciel ad hoc l'accélération (respectivement la force) avec les isoclines 
mises en évidence (courbes sur lesquelles l'accélération a même norme) nous obtenons: 


Figure: 47.20 - Isoclines du système à deux corps 


et en demandant au logiciel de ne tracer que les isoclines projetées sur un plan: 


Figure: 47.21 - Projection des isoclines sur le plan 


où nous avons mis en évidence les cinq points de Lagrange et où les astres sont représentés par des 
points bleus et le barycentre du système par un point vert. 


Le lecteur remarquera qu'il est difficile de deviner intuitivement cette configuration du potentiel. 
Dans le référentiel tournant avec le barycentre des deux corps massifs, le potentiel résultant de la 
combinaison des potentiels gravitationnels et rotationnels présente 3 extrema L1, L2 et L3 sur la 
droite contenant les 2 corps. L'un de ces maxima se situe entre les 2 corps, ce que l'on attend 
intuitivement. Les deux autres maxima se trouvent sur la droite reliant les 2 objets, mais de part et 
d'autre ce qui est plus surprenant. Ils proviennent au fait de la contribution au potentiel du 
référentiel tournant ce qui peut être difficile à modéliser intuitivement. 


POSITIONS D'ÉQUILIBRE DU PREMIER TYPE 


Ce que nous entendons par les positions d'équilibre du premier type sont simplement les solutions 
situées sur la droite AB telles que } = Ÿ ce qui revient à étudier seulement: 


_GMy 
AS° 


(+3) 8 {x-r;)+ ax = O (47.274) 


avec dès lors: 
AS =|x+r4l et PS = x r; | (47.275) 


À cette situation, nous allons considérer trois sous-cas possibles correspondants respectivement à L1, 
L2 et L3äcomme nous allons de suite le voir. 


POINT L1 DE LAGRANGE 


Dans ce premier sous-cas, nous considérons: 


—r4 SX <FR 
Ce qui revient aussi à avoir: 
{x +r 4) > 0 
(x-rs) < 
Ce qui nous permet d'écrire: 
_GMy GW 


Pr {x+r4)- Fe (x-rs)+@x=0 


sous la forme simplifiée suivante: 


+ x= 0 


AS?  B$? 


Maintenant pour dire quelque chose sur les solutions possibles de cette équation dérivons le membre 
de gauche. Nous obtenons alors: 


2H 20 : 
(x+ra) (5-2) 


Ce terme est strictement croissant de —@2 à +0 lorsque x décrit ]-”4,"#[ . Il y a donc une solution 
unique et un point d'équilibre noté L1 (premier point de Lagrange) entre À et B. 


Si nous considérons typiquement le cas Soleil-Terre où 4 > #3 et donc r4 <r# alors en 
x = 0 nous avons: 


GM y Tu. G CM CM 


(0+r4) (0-73) FA FR 


ce qui est immédiatement négatif. La position d'équilibre sera donc obtenue pour une valeur positive 
de x que nous allons devoir déterminer. 


Cette valeur peut être obtenue en considérant un cas limite: lorsque 3 tend vers 0 (correspondant à 
un astre massif À autour duquel tourne un astre B de masse beaucoup plus petit), A tend alors vers O, 


r4 vers 0 et donc: 


avec À = AB. Dès lors, dans ce cas limite: 


CM GM 
= £ + = + x= 0 
AS BS 
devient en approximation: 
GM 
— . + x=0 
x 
et donc: 
_G, n CM , 5 
x? k° 


Donc la seule valeur de x satisfaisant cette relation sera x = À. 
En d'autres termes, le point d'équilibre cherché L1 ici entre A et B se rapproche de B soit de l'astre le 
moins massif (ce qui correspond bien à la première figure que nous avons utilisé pour montrer 


l'emplacement des cinq points de Lagrange). 


De par ce constat nous pouvons effectuer les calculs suivants: 


AM) L  B(M3) 
—————————————————————————— 
A #: 


Nous avons d'après la définition du barycentre: 


_… M aa + M pr 
PES es —— 
Mat 


Comme notre étude se fait par rapport au barycentre nous avons 7# = Ô et donc: 
M 4r 4 + M ra = Ô 
De la relation précédente en prenant la norme, nous avons bien évidemment: 


M3 
PACE 
M y 


La distance entre les deux astres À et B demeurant constante et égalant 7 = 74 +7 nous écrivons: 


Nous en déduisons trivialement deux relations (la deuxième étant obtenue par exactement le même 
raisonnement que la première): 


OB = et OA= _ 
1+—E 1+—4 
M 4 M3 


Mais puisque À 4 >> 3 nous pouvons grossièrement écrire la première relation sous la forme 
approximative suivante (série de Taylor): 


OB= aa we 
M 4 


et puisque: 


A A 

nous avons aussi: 

M M 

O4 = 2 08 = 5 _ 
#2 Mass 
MW 4 
Donc avec À 4 >> M3: 
M 
OAzZ —ÆE AB 
A 


Selon le cas limite étudié précédemment, nous pouvons donc supposer L voisin de B tel 
qu'abusivement il soit possible d'écrire: 


OLz=OB(1-&) 
avec € & 1. 


Soit en utilisant: 


Nous avons alors: 


M3 VW 
OL = AB(1- af = we) aa see Be (47.297) 


en négligeant les infiniment petits d'ordre 2. 


D'où: 
LE = OB - OZ = se- A — sé E— me) EAS 
M y MW 4 
(47.298) 


La=04+ 01% 4p+ 4811-62 
M 4 M 4 


]-480-à 


Maintenant dans la configuration mentionnée l'équilibre est donné par: 


_GMa CM 


Een + 2 + @ OL = 0 (47.299) 


Donc: 


__ GM4 + Se 


M 
+æ ABl1:e-2|20 | 
| we (47.300) 


Maintenant la troisième loi de Kepler (cf. chapitre de Mécanique Classique) nous donne: 


2 


2 2 
_ LA _ CM4 47° (æ) L 7 op? 47301) 
7T 


æ 


Soit: 


CM, CM Pr +0 Ma ani M3 


D = E—-—<|=Û0 (47.302) 
AB°{1- €} AR A 


Après simplification: 


(47.303) 


EE al-e-#e)-c 


Soit: 


M M 
214 2e) af #2) (47.304) 
€ 


Donc: 
1 M 4 
13 3— 


€—-1Z=0 (47305) 
€ M 


Puisque 1}; #° est très supérieur à 1 et en admettant que 34 4 / M3 le soit aussi nous avons: 


L-: M 
— 3€ (47.306) 


€ M3 
Soit finalement: 
W 
es 318 (47.307) 
34 4 


et donc: 


LA= AB(1- #)= AB|1- 3 MR ae (47.308) 
3M 4 3M y 


Si nous prenons le A Soleil et B la Terre, alors: 


M 
823.10 6 R=150.106 [ke] (47.309) 
A 


Nous trouvons que la distance LB vaut à peu près: 


M 
LB = R3]2Æ =1500'000[&] (47310) 
3M y 


qui est le point L1 auquel a été placé le satellite SOHO. 


Un cas particulier du point L1 à considérer est lorsque A4 = M3 = 4 , alors r4 = r8 =r, Oest 
alors le milieu de AB. Nous avons alors: 


Dès lors: 


devient: 


a — À — 
{r+x) {x-r) 8r 


Parmi les quatre racines évidentes de cette équation la seule solution acceptable est x = 0 pour 
satisfaire —74 < x <7g. En d'autres termes, le point d'équilibre situé entre deux astres de même 
masse n'est autre que le barycentre de ces deux astres. 


POINT L2 DE LAGRANGE 
Dans ce deuxième sous-cas, nous considérons: 
X>rR 
Nous cherchons donc les points d'équilibre au-delà de B. 


Dès lors nous avons: 


qui devient simplement: 


Le membre de gauche est une fonction strictement croissante de x de —@ à +9 lorsque x décrit 
}r#,+0[ . Il y a donc une solution unique, et un point d'équilibre au-delà de B. Ce point est noté L2. 


Cette valeur peut être obtenue en considérant un cas limite: lorsque 3 tend vers 0 (correspondant à 
un astre massif A autour duquel tourne un astre B de masse beaucoup plus petite), À tend alors vers 
O, r4 vers 0 et donc: 


2 - Ma 
FE 
avec À = AB. Dès lors, dans ce cas limite: 
Ms _ Se, 0 
AS BS 


devient en approximation: 


et donc: 


Donc la seule valeur de x satisfaisant cette relation sera x = À. Le point L2 finit donc par se 
confondre avec B. 


Connaïissant ce cas limite, faisons une étude plus détaillée. Considérons le schéma suivant 
relativement à notre situation limite précédente: 


AM) B(Mg)L 
*+—— ———————+ 


FA re 


et considérons À 4 # 3 sans oublier que dans ce scénario x > rg 


Nous avons alors quasiment les mêmes développements que pour L1 à la différence que: 


OL=OB(-5) 
Devient: 
OLzOB(1+E) 
et que plutôt que d'avoir: 
- _ +72 +a OL =0 
Nous avons: 
T4 = +@ OL = 0 
et donc: 
LA= AB(1+e) 
Toujours avec: 
2 3 A 


et donc: 


LA= AB(1+e)= AB 1+ 3088 |=rli+ 388 | son 
3M y 3M 4 


ce qui correspond au point de Lagrange L2. 


Un cas particulier à nouveau de L2 est lorsque 4 = M3 = M, alors r4 = rx =r, O est alors le 
milieu de AB. Nous avons alors: 


RÈ : (2rŸ _ Qr3 


Dès lors: 
CM GM 
: A B + x=0 (47329 
AS?  BS? 
devient: 
: — BE + ox = 0 
{r+zx) (x-r) 
| - (47.330) 
= + Fos 


{r+x) (x-r) 8 


Il n'est plus possible d'extraire les racines ici. Il faut passer par une approximation numérique. Dans 
Maple 4.00b, il suffit de mettre: 


>solve(-1/(r+x)2-1/(x-1)12=x/(8*r/3),x);allvalues("); 
et la seule solution admissible dans R est x = 2.8r les autres étant dans €. 
POINT L3 DE LAGRANGE 
Dans ce troisième sous-cas, nous considérons: 
X<—ra (47.331) 
Nous cherchons donc les points d'équilibre au-delà de A. 


Dès lors nous avons: 


qui devient simplement: 


Le membre de gauche est une fonction strictement croissante de x de —@ à +9 lorsque x décrit 
]- 74,09 . Il y a donc une solution unique, et un point d'équilibre au-delà de A. Ce point est noté L3. 


Cette valeur peut être obtenue en considérant un cas limite: lorsque #3 tend vers 0 (correspondant à 
un astre massif À autour duquel tourne un astre B de masse beaucoup plus petit), A tend alors vers O, 
rA4 vers 0 et donc: 


a? = GM y 
R3 


avec À = AB. Dès lors, dans ce cas limite: 


devient en approximation: 


et donc: 


_GM, {are 
R° 


Donc la seule valeur de x satisfaisant cette relation sera x = À. Le point L3 finit donc par se 
confondre avec la position diamétralement opposée à B. 


Connaïissant ce cas limite, faisons une étude plus détaillée. Considérons le schéma suivant 
relativement à notre situation limite précédente: 


L A(M,) B(M3) 
*— EE —— 
FA rs 


et considérons toujours M 1% M3 sans oublier que dans ce scénario À <—”74 
Nous allons considérer d'abord l'approximation suivante: 
AL = AB(1+e)= R(1+E) 


et celle-ci aussi (puisque OA tend vers zéro lorsque l'astre À devient très massif): 


Dès lors: 


M 
OL = OA+ AL = fie) (47.340) 
MW 4 


Nous avons aussi (...): 


@ 1+— 5 47 
= ZE —< 47.341 
R3 R3 M, ( ) 


où à la limite où l'astre À est vraiment massif, nous retombons sur le premier terme... 


Avec ces deux dernières relations, nous avons: 


M3: |GM VW GMT M3 
a OLz R|1+5+—2 214 | Al i+e+2—2 | (4734) 
M} À M k? M) 


si nous négligeons les termes du deuxième ordre. 


Nous avons par ailleurs aussi: 
BL = AB + AL = R+R(1+E)=2R É +2) (47.343) 


Rappelons la condition d'équilibre: 


GM, GW GM, GM 
- A-——E+ox=-—#-—E+x0L=0 (47.344) 
AS BS AË BI? 


Et mettons tout ce que nous avons obtenu avant là-dedans: 


CM, CM 


CM à My 
ECC PEER à +Pafires me )- Ô 
(R(1+5)) fza(+5) R° M 4 (47.345) 
2 


Ce qui devient après simplifications: 


M 
—4 ne fier 2) 
Mg (1+6) (+3) Me M4} (47.346) 


après une petite approximation: 


M M M 
4—24{1-26e)+(1-5)=4—4) 1464225) 37 
PA I EOE) | d . + 


après simplification: 


-126 =7 (47348) 


D'où: 


et finalement: 


VW 7 M VW 5 M 
OL = aise = ee pe = fie) (47.350) 
4 


Remarque: Chez certains auteurs de science-fiction, ce point L3 à l'opposé de la Terre par rapport 
au Soleil nous cacherait une hypothétique planète qui nous serait perpétuellement cachée par le 
Soleil. 


POSITIONS D'ÉQUILIBRE DU DEUXIÈME TYPE 


Les positions d'équilibre du deuxième type sont donc celles pour lesquelles y # Ô. En d'autres 
termes les points situés hors de la droite AB, mais dans le plan Oxy. 


Ainsi, notre système d'équations reste: 


GW GW 
- Fed fx+r4)- es (x-r4)+@fx = 0 

GM GW (47.351) 
TT SES 
z=0 


POINTS LA, L5 DE LAGRANGE 


Pour déterminer les autres points d'équilibre restants, nous pouvons diviser la deuxième équation du 
système par y tel que le système devienne: 


GM GM 
= ri (x+rs)- — (x-r5)+@ x = 0 

CM, CM} : (47.352) 
as a 7 


Retranchons de la première équation la deuxième multipliée par x. Nous obtenons alors pour la 
première: 


_ CM : CM 
AS° BS 
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rp=0 (47.353) 


Soit: 


M M 
LE. FA = —+ g: 


AS ” BS° 
Mais comme 74 4 = rx ceci se simplifie encore en: 


ls 
A8 BS 


Reprenons maintenant, en toute généralité, notre schéma du début en rajoutant quelques éléments: 


où AB est la distance entre À et B et D est le centre de masse du système donné par: 


Mit Mi+M; 


qui sont donc les rayons de giration des corps À et B. 


Il est facile de vérifier que la somme des deux distances précédentes est égale à AB et leur proportion 
M3 {M 4. Une autre forme de DB (qui nous sera utile) s'obtient en divisant numérateur et 


dénominateur par À 4 : 


1+—E2 
| 


Nous savons selon nos calculs précédents que AS = B$ mais cela est insuffisant. Nous voulons 
encore connaître les angles des sommets À, B, S et c'est ce à quoi nous allons nous intéresser 
maintenant. 


Dans ce cadre, si un satellite en S est en équilibre, il restera toujours à la même distance de À ou de 
B. Le centre de rotation des 3 points est le point D, la masse A elle-même tourne autour de lui. Si le 


satellite, en S, reste stabilisé, les trois corps ont la même période orbitale T. Si S est immobile dans 
ce cadre en rotation il ne sera pas soumis à la force de Coriolis mais uniquement à la force 
centrifuge, aussi bien de celle de A que de B. 


Notons v; la vitesse de rotation de B et v; la vitesse de rotation de S. Nous avons alors: 


2R— = v,.T 


27R =vs T et My 


Nous en tirons que: 


on vs 27 Ve (,, Ma 
PR T AB 


Nous pouvons donc égaler ces deux expressions: 


LFP 14 #2 
R AB M, 


Cela exprime simplement le fait bien connu que si deux objets tournent conjointement, le plus 
éloigné de l'axe est le plus rapide. Les vitesses sont proportionnelles aux distances de l'axe. 


La force centrifuge sur B est en équilibre avec la force gravitationnelle de A et cela s'exprime par: 


2 
je ne Le) cha 
AB AB M x AB 
1428 
M 4 


Soit en simplifiant: 


De même, la force centrifuge qui s'applique sur S est: 


2 
V 
Ms 


Elle est équilibrée par les forces d'attraction FF des corps À et B. Néanmoins, seules les 


composantes de ces forces situées sur la ligne R s'opposent efficacement à cette force centrifuge. 
D'où: 


Mo = Fcosa+F, cos 8 


" 
k 


et comme: 


CM M GM;M 
Fa 2 < 2 
ES 
Nous avons alors: 
2 
GW 
_. | 7 dE PA cos # (47.366) 


En outre, les forces s'appliquant à S et perpendiculaires à R doivent s'annuler. Si non, le corps S 
suivrait la masse la plus importante et ne resterait pas en position et ne serait donc plus en équilibre. 
Il faut donc que: 

Fsne=fF;sn f£ 


Soit, après substitution et simplification: 


MW A 
AS? 


| M3 . 
sin = ——sin $ 
BS? 


De toutes les équations obtenues jusqu'à maintenant les seules qui nous dérangent sont celles 
contenant à la fois des vitesses et des angles &, Ë. Il faut donc que nous arrivions à éliminer ce qui 
convient pour n'avoir que les deux derniers paramètres (soit les angles). 


Pour cela, nous portons au carré: 


M > 
Nous multiplions des deux côtés par AB? et divisons par UT : 
A 


2 2 
R2|1+—2 
M y 


qui est à rapprocher de: 


Donc en égalant: 


M3 
Nous avons donc éliminé la vitesse de B. Maintenant, multiplions les deux côtés par QUE 7 et 


divisons par 48? et multiplions par R: 


À 


2 
GM M 
+ = £ R È Be (47.373) 
à rapprocher de: 
2 
Li: 00e a+ 47.374) 
: Z-COS 25 cos # ( 
Donc: 
CM 4 À M GM GM 
FE El + Be = —* cos + me cos Ê (47.375) 


En divisant le tout par C4 nous trouvons: 


Ma 1 
OS Œ + —2 — cos 8 (47.376) 


2 


2 M BS 


Et comme nous avons démontré au début AS = B$ que nous noterons R', nous avons alors: 


RER M M 
————|1+ 2 | =c0s + —2 cos £ (47.377) 
AB? AB M, My 
et rappelons que nous avons: 
M 
À .: B .: 
—<sinæ=—"sin Ê (47278) 
Fra BS? 
Soit: 
M3 : sin æ 
M ss (47.379) 
Ce qui nous permet d'écrire: 
OR M in & 
| 18 | = cit — cos $ (47.380) 
AB? AB My sin £ 


En multipliant par sin 8: 
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k° R(, M 
sin SE) = sin Écosæ+sin cos Ê = sin(æ+ £) 


AB? AB M, 
Soit: 
R'È ee 14 2 _sin(a+£) 
AB ABÛ M, R 


Nous pouvons maintenant remarquer une chose (faut le voir...). Si À'= AB (soit que le triangle ABS 
est équilatéral) la relation précédente se simplifie en: 


RE 
ABÙ M,] R 


Or, si le triangle est bien équilatéral, nous avons alors sin($) = sin( À) _ sin( À) . Dès lors: 


sin Ë sin($) 


Soit ce qui peut s'écrire finalement: 


sin #  sin(À) 
DB R 


Ce qui n'est autre que le théorème des sinus pour le triangle SDB ( il rie) et 
est donc certain. En reprenant en arrière, nous pouvons maintenant prouver que toutes les équations 
précédentes sont satisfaites si et seulement si ABS est équilatéral. Si nous n'avions pas posé ABS 
comme équilatéral, nous aurions obtenu une relation différente du théorème des sinus, sans 
vérification possible, et l'ensemble des équations exigées pour l'équilibre au point S n'auraient pu être 
satisfaites. 


Conclusion de la chose. le système donne comme solution: 
AS=BS=R 
ABS (ou ABL peu importe l'écriture), forme alors un triangle équilatéral. Les deux points d'équilibre 


sont notés L4 et L5. LA est situé en avance par rapport à l'astre de masse la plus petite, et L5 en 
retard. 


+ 
A(My) B(M3) 
FA # : 

4 

Pa 1 


En 2000, 385 astéroïdes en LA et 188 astéroïdes en L5 ont été comptabilisés sur l'orbite de Jupiter, 
mais situés précisément selon un triangle équilatéral avec le Soleil et Jupiter de part et d'autre de 
Jupiter: ce sont les planètes Troyennes. Il a également été observé deux objets au point L5 de Mars 
découverts en 1990 et 1998. 


Notes personnelles: 
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48. ASTROPH YSIQUE 


Le est une branche interdisciplinaire de l'astronomie qui concerne principalement la 


physique et l'étude des propriétés des objets de l'Univers (étoiles, planètes, galaxies, milieu interstellaire 
par exemple), comme leur luminosité, leur densité, leur température et leur composition chimique. Les 
premières démarches scientifiques dans ce domaine dateraient du tout début du 19ème siècle. 


Remarque: Actuellement, les astronomes ont une formation en astrophysique et leurs observations 
sont généralement étudiées dans un contexte astrophysique, de sorte qu'il y a moins de distinction 
entre ces deux disciplines qu'auparavant. 


1. ÉTOILES 


Avant d'aborder le formalisme mathématique relatif à la dynamique des étoiles, nous avons souhaité 
suite à une demande des lecteurs, écrire une introduction vulgarisée afin de compléter la culture 
générale relative à ce domaine. 


Les étoiles sont donc des corps célestes gazeux dont la masse va de 0.05 masse solaire à 100 masses 


solaires. La luminosité d'une étoile (sa puissance) va de 10% à 10° fois celle du Soleil. Grossièrement, 
lorsque la masse double, la luminosité décuple. La plupart des étoiles visibles à l'oeil nu dans notre ciel 


sont des géantes bleues de 104 à 10° fois plus lumineuses que le Soleil ; elles ne représentent cependant 
que 10% des étoiles qui peuplent notre galaxie, les 90% restantes étant moins lumineuses que le Soleil. 


Les astronomes (de Harvard entre 1918 à 1928) ont mis en place une méthode de classification des 
étoiles basée sur la position dans leur spectre, des raies spectrales d'absorption (spectroscopie). 
Autrefois classées de A à Q, l'évolution de la spectrométrie a permis leur regroupement et leur 
réorganisation. Les classes sont aujourd'hui définies par les lettres OBAFGKM, et chacune est divisée 
en 10 sous-classes, notées de 0 à 9. La classification spectrale (tirée d'un spectre continu qui se résume 
seulement à certaines raies du spectre après le passage de la lumière dans un milieu donné) peut être 
croisée avec les classes de luminosité de sorte que nous puissions en inférer la température à la surface 
de l'étoile (nous démontrerons comment obtenir mathématiquement cette information): 
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0 masses solaires 
10 masses solaires rouges 


| masse solaire 


Naines 
blanches 


Figure: 48.1 - Méthode de classification de "Miss Cannon" des étoiles 


Les étoiles O ont été découvertes à la fin du 19ème siècle. Elles sont très chaudes et leurs spectres les 
rapprochent des nébuleuses. Les B sont des étoiles à hélium, les A à hydrogène. L'élément 
prépondérant des F est le calcium. Les G sont du même type que le Soleil et les K en diffèrent assez 
peu. Les M sont caractérisées par l'oxyde de titane et les S par l'oxyde de zirconium, tandis que R et N 
contiennent des hydrocarbures et du cyanogène. 


La grande courbe au centre indique l'évolution d'une étoile de même masse que le Soleil. Après un 
passage sur la séquence principale, elle devient une géante rouge, éventuellement une nébuleuse 
planétaire (éjection du combustible de l'étoile à de grandes distances), avant de terminer sa vie sous la 
forme d'une naine blanche. Par comparaison nous avons indiqué l'évolution d'étoiles 10 ou 30 fois plus 
massives que le Soleil: elles quittent la séquence principale pour devenir des supergéantes puis elles 
finissent en supernovae qui ne peuvent être représentées sur ce diagramme! 
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Figure: 48.2 - Proportion de quelques familles d'astres existant dans l'Univers 


Une étoile est dans un premier temps en équilibre hydrostatique. Les forces gravitationnelles dues à sa 
masse sont compensées par les forces de pression interne dues à la température élevée entretenue par 
des réactions thermonucléaires à basse densité et à la pression de dégénérescence des électrons à 
densité élevée. Une étoile passe 90% de sa vie à fusionner de l'hydrogène en hélium qui s'accumule en 
son centre. Durant cette phase, elle évolue dans ce que nous appelons "la séquence principale" du 
diagramme de Hertzsprung-Russel représenté ci-dessous. Ce diagramme met en relation la température 
de surface (abscisse logarithmique présentée en ordre opposé) et la luminosité (ordonnée 
logarithmique) pour des populations d'étoiles. La séquence principale apparaît comme une diagonale. 
La température de surface et la luminosité étant directement fonction de la masse: 
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Figure: 48.3 - Diagramme de classification de Hertzsprung-Russell 


Chacune des étoiles du ciel trouve sa place sur le diagramme introduit par Hertzsprung et Russell 
(diagramme H-R ci-dessus) dont les diverses régions permettent d'en repérer le stade d'évolution. Il est 
alors possible d'y tracer une courbe représentative de l'évolution d'une étoile donnée à partir de la 
connaissance de son état au moment de l'observation. 


Ainsi, les étoiles massives évoluent plus vite que les étoiles de faible masse, mais ce résultat est déduit 
d'autres considérations que celles permettant de construire le diagramme. Le diagramme sert 
notamment à évaluer l'âge moyen d'un amas d'étoiles à partir de celui de ses composants. De même, il 
permet de caractériser les étoiles variables et leurs composantes telles les géantes rouges qui deviennent 
instables et pulsantes en vieillissant. Cette famille d'objets instables définit une bande d'instabilité sur le 
diagramme. Ce diagramme traduit la classification spectrale des étoiles ou leur température de surface 
en fonction de leur magnitude absolue ou de leur luminosité. 


Ce diagramme, sur lequel toutes les étoiles trouvent leur place dès que nous connaissons leurs 
caractéristiques, fut développé indépendamment en Europe par Ejnar Hertzsprung et aux États-Unis par 
Henry Norris Russell. L'axe horizontal indique la classification spectrale en partant, à gauche, des 
étoiles les plus chaudes, les bleues, pour atteindre les moins chaudes, les rouges, à droite. Les étoiles se 
positionnent en groupes spécifiques sur le diagramme: celles qui évoluent sur leur séquence principale 
se situent sur une courbe incurvée qui commence en haut, à gauche, et se termine en bas, à droite. C'est 
sur cette courbe que se regroupent les étoiles stables qui brûlent leur hydrogène et, parmi elles, le Soleil 
qui se positionne au centre du diagramme. Les géantes et les supergéantes apparaissent dans la partie 
supérieure droite, tandis que les naines blanches se regroupent dans la partie inférieure gauche. Au fur 
et à mesure qu'elle évolue, chaque étoile décrit une courbe particulière: elle commence par suivre la 
trajectoire de Hayashi jusqu'à ce qu'elle atteigne sa séquence principale sur laquelle elle évolue tant que 
son noyau brûle de l'hydrogène. Lorsque commence la combustion de l'hélium, elle remonte vers le 
haut où se concentrent les géantes rouges et y reste jusqu'à ce que la fusion nucléaire s'arrête: elle 
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s'effondre alors sur elle-même pour rejoindre les naines blanches ou dans le cas d'une certaine valeur de 
masses solaires, les étoiles à neutrons, Trous Noirs ou encore, si sa masse est très élevée, explose en 
supernovae. 


_» NE TE ve 


0 


A ni 
Figure: 48.4 - Région du ciel en lumière visible avant et après la supernova de 1987 


Lorsque la masse d'hélium d'une étoile devient suffisante, l'augmentation de pression induit une 
augmentation de la température amorçant ainsi la fusion de l'hélium ("flash de l'hélium") en carbone, 
oxygène et néon créant un second front de combustion à l'intérieur du premier. Pour une étoile de 
masse solaire, les réactions s'arrêtent à ce stade. L'étoile grossit et se refroidit en surface. Elle devient 


une géante rouge 10% fois plus lumineuse qu'auparavant. Elle passe par des phases d'instabilité et finit 
par expulser progressivement ses couches externes en formant une "nébuleuse planétaire". Son noyau, 
dont la densité est de plusieurs tonnes par centimètre cube, se refroidit lentement: c'est la naine blanche 
(nous aborderons ce processus sous forme mathématique plus loin). L'équilibre y est maintenu par la 
pression de dégénérescence des électrons. 


Pour une étoile plus massive, la température interne devient assez importante pour que le carbone et 
l'oxygène puissent fusionner en silicium. À son tour, s'il est en masse suffisante, le silicium fusionnera 
en fer. Les fronts de combustion se développent dans un schéma dit en pelures d'oignon. Le fer est le 
nucléotide le plus stable: il se trouve au fond de la vallée de stabilité (cf. chapitre de Physique 
Nucléaire), Il ne peut ni fusionner, ni fissionner. Lorsque la densité atteint une valeur critique (cela 
correspond à une masse totale de l'étoile de plus de 8 masses solaires), la pression de dégénérescence 
des électrons n'arrive plus à maintenir l'équilibre contre la gravitation. En un dixième de seconde, le 
noyau de fer s'effondre. Les autres couches du coeur se précipitent vers le noyau effondré sous forme 
d'une onde dont le maximum de vitesse correspond au rayon sonique. 


La densité du noyau devient alors énorme. Il se produit des réactions # inverses où les protons 


capturent les électrons en formant des neutrons et libérant un flot de neutrinos. Lorsque le noyau de 
l'étoile atteint la densité nucléaire de 10% [kg :##*], la compaction s'arrête brutalement (rayon 


d'environ 10km !). Les couches externes du noyau rebondissent par un choc superélastique et entrent 
en expansion. Lorsque cette onde de choc réfléchie rejoint le rayon sonique, la température monte 
tellement haut que la chiffrer n'a plus de sens. La matière subit une photodésintégration complète (tous 
les nucléotides sont désagrégés en gaz de nucléons). Finalement par un mécanisme pas clairement 
établi, toutes les couches externes de l'étoile sont éjectées dans l'espace: c'est une "supernovae de type 
IT". 
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Le noyau effondré, presque entièrement constitué de neutrons, sera en rotation rapide si l'étoile initiale 
avait un moment cinétique non nul (conservation du moment cinétique oblige). Le champ magnétique 
est également conservé et dépasse de loin tout ce qui sera probablement jamais réalisable en 
laboratoire. Cela provoque un rayonnement synchrotron qui donne l'illusion que l'étoile clignote. Cela 
provoque un rayonnement synchrotron qui donne l'illusion que l'étoile clignote, c'est pourquoi ces 
jeunes "étoiles à neutrons" sont dénommées "pulsars”. 


Pour les étoiles très massives (plus de 50 masses solaires), la masse totale du coeur qui s'effondre 
pourrait dépasser 3 masses solaires. Dans ce cas, la gravité devient telle que sa masse s'effondre au-delà 
des dernières forces répulsives et se compacte en une singularité. La courbure de l'espace devient telle 
qu'aucune matière, rayonnement ou information ne peut plus s'échapper au-delà d'un volume appelé 
horizon ou sphère de Schwarzschild. C'est un "Trou noir". Tout ce qui y tombe perd son identité. Un 
trou noir ne présente plus que trois propriétés: sa masse, son moment cinétique et sa charge électrique. 
Nous disons qu'un trou noir n'a pas de chevelure. De plus, une telle singularité devrait toujours être 
cachée par un horizon, être habillée. 


1.1. GENÈSE 


Nous allons voir maintenant comment des astres nouveaux peuvent naître à partir d'immenses nuages 
de gaz qui s'étendent entre les étoiles dans les galaxies. Ce milieu interstellaire est une source 
potentielle d'étoiles nouvelles, qui une fois leur vie terminée (sous forme de géante rouge ou de 
supernovae), peuvent réinjecter une partie de leur matériau dans l'espace intersidéral. 


Au fait, personne ne sait vraiment les détails de la façon dont un nuage interstellaire aboutit à une étoile 
car il s'agit d'un problème fort difficile, essentiellement à cause de l'apparition de toute une hiérarchie 
de structures, sous-structures, etc. dans le nuage à mesure qu'il s'effondre sur lui-même. Des 
mouvements turbulents apparaissent, qe ne peuvent être décrits de manière simple par les équations 
hydrodynamiques (cf. cha ). D'autres complications 
apparaissent lorsque nous voulons tenir compte du champ magnétique sur le gaz en contraction, ou 
d'explosions de supernovae dans le nuage. 


Au moins, pouvons-nous donner les conditions nécessaires pour qu'une étoile puisse se former au sein 
d'un nuage interstellaire. Pour cela, plusieurs barrières doivent en fait être franchies. Une première 
barrière est thermique. Une deuxième barrière est rotationnelle: une proto-étoile qui se contracte tourne 
de plus en plus vite et peut littéralement exploser si sa vitesse de rotation devient trop importante 
(conservation du moment cinétique). Examinons ces deux effets. 


1.1.1. EFFONDREMENT D'UN NUAGE INTERSTELLAIRE 


Deux forces opposées sont présentes dans un nuage de masse M et de rayon R: une force 
d'autogravitation, qui tend à contracter le nuage, et une force de pression thermique, qui tend à le faire 
exploser. 


Nous pouvons quantifier ces deux tendances opposées en termes d'énergie: le nuage possède une 
énergie potentielle de gravitation (négative) et une énergie cinétique (positive) due à l'agitation 
thermique de ses molécules. 


Nous savons ( | ) que l'énergie potentielle de gravitation de deux 
particules de masses m et m' séparées de 7 s'écrit —G### " r. Donc l'énergie potentielle d'un nuage 
sphérique (..) de masse M et de rayon R est de l'ordre de: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


GM? 


Ep=- (48.1) 
d R 


Dans un gaz en équilibre thermodynamique, une particule a une énergie cinétique (cf. chapitre de 
Mécanique Des Milieux Continus) de #T {2 par degré de liberté (translation, rotation, etc.). Donc, si Æ# 
est la masse moyenne d'une molécule du nuage, l'énergie cinétique totale de cette dernière aura pour 
expression: 


E, = ST 2x7 (48.2) 
2 {4 Æ 


Le nuage s'effondre alors si son énergie mécanique totale est négative, soit (selon l'approximation 
précédente): 

2 
Li À 


xT (48.3) 


L'équation ci-dessus permet de définir la "masse de Jeans" (dans l'hypothèse d'une distribution 
sphérique et homogène). C'est la masse minimum (limite), à une température T'et une masse volumique 
£ données, pour que le nuage commence son effondrement jusqu'à ce qu'un autre processus physique 
intervienne éventuellement pour stopper la contraction du gaz. 


En éliminant le rayon par: 
M=4moR°i3 (484) 


dans l'équation précédente, nous avons alors: 


133 2 113 312 1/2 
mM> Re AT |3M 3 > ÀT | 3 = À > AT os 1 (48.5) 
CH Gui 47e Gu\470 Je 


ce que les astrophysiciens notent à la suite de toutes les approximations faites: 
—— (48.6) 


où C'est une constante sans unités. En prenant un nuage composé d'hydrogène uniquement avec n 


atomes par mêtre cube (c'est donc une densité!), nous aurons HÆ #1, et 8= x", où #7, est la masse 


du proton. Nous pouvons alors exprimer la masse de Jeans en masses solaires de la manière suivante: 


3/2 


32 3/2 3/2 3/2 
Mae 2C(RE) co) amuse) 50 
P P P P P (48.7) 


73/2 


= CM 
72 Lo) 


où nous avons la certitude que C'':3 1 et où: 
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Ma =1.9891.10 7 [Kg] (488) 


est la masse solaire (unité de masse conventionnellement utilisée pour les étoiles ou les autres objets 
massifs). Cette masse est donc comme le laisse deviner son nom, égale à la masse de notre Soleil. Son 
symbole et sa valeur sont : 


La masse solaire vaut environ 330 000 fois la masse de la Terre. 


Nous voyons que la masse de Jeans varie comme ,,-l/2. Ceci a une conséquence importante: à mesure 
Y # 
que le nuage se contracte, 7 augmente, et donc Af.. diminue. Autrement dit, le nuage peut se 


fragmenter en sous-nuages une fois la masse de Jeans pour ces sous-nuages atteinte. Ces derniers vont à 
leur tour se scinder en sous-nuages, etc. Nous avons donc toute une hiérarchie d'effondrements, depuis 
les grandes masses vers les petites masses. 


La chose importante à noter aussi est que la masse de Jeans d'un nuage est beaucoup plus grande que 
les masses stellaires individuelles (il suffit de voir les constantes contenues dans la relation précédente 
pour se rendre compte que les facteurs sont relativement conséquents!). Donc, les étoiles naissent en 
général par ensemble de plusieurs étoiles: nous ne pouvons pas former en principe un Soleil isolé dans 
une galaxie, à partir d'un tout petit nuage. Une fois formées, les étoiles se diluent dans la galaxie par les 
effets de rotations et de marées galactiques. Ainsi, le Soleil a perdu de vue ses soeurs depuis bien 
longtemps probablement... 


1.1.2. RAYON DE JEANS 


Nous pouvons également exprimer la condition d'effondrement en termes de "rayon de Jeans", toujours 
pour une température T'et une masse volumique © données. Il suffit en fait d'éliminer M dans la 
relation: 


2 
XT — EL (48.9) 
Li R 
Aïnsi, nous avons: 
3 
pa = pe OURÉ SES le ps le Et 
KT3 4G47 47 aG Jo 
Soit: 
ET À 
Retrn: 4G Jp (48.11) 


Ainsi, le rayon de Jeans est le rayon minimal pour qu'une sphère de masse donnée soit stable. Au-delà, 
le nuage stellaire va s'effondrer sur lui-même selon les mêmes conditions que la masse de Jeans. 


Au vu des valeurs des paramètres de la relation précédente, nous voyons alors que les nuages de 
formation stellaire sont en fait immenses en ordre de grandeur. Ces véritables pépinières sont ensuite 
dispersées dans la galaxie par effet de marée galactique, comme nous le soulignions plus haut. 
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1.1.3, TEMPS-DE CHUTE LIBRE 


Nous avons vu pour l'instant que la masse d'un nuage doit être grande par rapport à celle du Soleil pour 
que l'effondrement se produise. Nous allons maintenant estimer le temps que va prendre le nuage pour 
s'effondrer sur lui-même. 


Au début de l'effondrement, rien n'arrête la chute du nuage, la pression interne est encore très faible et 
l'énergie lumineuse provenant de l'échauffement progressif du nuage (lié à la contraction de ce dernier) 
est immédiatement évacuée car le nuage est encore transparent. 


Une parcelle de nuage à la périphérie, in extenso à la distance À du centre du nuage, subit une 
accélération ; = Gi j R2 de la part de ce dernier. Elle commence donc à tomber vers le centre avec la 


loi x = at? 2 (cf. chapitre de Mécanique Classique). La parcelle aura atteint le centre quand x z À. 


É = 2R _ 28 (48.12) 
chiite — : = GM 


Nous pouvons exprimer ce temps uniquement en terme de masse volumique, puisque }f = 47rR° 213: 


Nous obtenons donc: 


À noter que le temps de chute ne dépend pas de la taille de l'objet ni de sa masse, mais uniquement de 
sa masse volumique. 


Une application numérique pour un nuage d'hydrogène donne alors: 


3 1 10 1 , 
— ——=6.5.10 —— |années| (48.14) 
. Nr Nr ns 


Nous remarquons que ces temps restent petits par rapport à l'âge de l'Univers (13-14 milliards 
d'années). Ainsi, la genèse stellaire est un phénomène relativement rapide: plusieurs générations 
d'étoiles ont pu voir le jour depuis la formation des galaxies. 


Il 


Éhte 


1.1.4. DURÉE DE VIE NUCLÉAIRE 


L'âge des étoiles est principalement un problème de calcul du carburant nucléaire. La résolution de ce 
problème a été apportée par la relativité, et en particulier par l'équivalence masse-énergie (cf. chapitre 
de Relativité Restreinte). 


Même si la description détaillée des réactions nucléaires au coeur du Soleil n'a été fait qu'au milieu des 
années 1930 par Hans Bethe, les astrophysiciens ont soupçonné peu après les travaux d'Einstein que 
cette équivalence pouvait expliquer l'éclat du Soleil sur des milliards d'années, par exemple via la fusion 
de l'hydrogène (proton, p) en hélium (deux protons, deux neutrons) via une succession d'étapes 
(l'énergie indiquée est l'énergie cinétique des différents éléments): 


LH +ÏH = ?H+et+042[Mev] (48.15) 
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Le positron s'annihile immédiatement avec l'un des électrons d'un atome d'hydrogène environnant et 
leur masse-énergie est évacuée sous forme de deux photons gamma: 


et+e —2y+102 [WP] (48.16) 


Après ceci, le deutérium produit lors de la première étape peut fusionner avec un nouveau noyau 
d'hydrogène pour produire un isotope de l'hélium: 


FH+oH —ÿHe+y+549[Mev] (4817) 


Finalement, deux isotopes de l'hélium  z;, peuvent fusionner et produire l'isotope normal de l'hélium 
2He ainsi que deux noyaux d'hydrogène qui peuvent commencer à nouveau la réaction de trois façons 
différentes appelées PP1, PP2 et PP3: 


DHet jHe— SHe+cdH+0H+1286[Mev] (48.8) 


Et encore ces réactions ne se produisent pas toutes selon les mêmes probabilités et les mêmes 
températures... 


La mesure de la masse du proton donne », = 1.673. 10727[kg], alors que l'hélium a une masse de 


my = 6.645. 10 [kg] , Soit une perte en masse atomique de (nous négligeons la masse des positrons 


qui est 10'000 fois plus petite ainsi que celle du neutrino): 
4m, — my = 0047.10 [kg] (48.19) 


Donc une perte relative de masse par fusion (c'est la part de la réaction qui s'échappe du Soleil sous 
forme d'énergie cinétique): 


im 0.047.102? | 
— = ———; 20.0072=0.72% (48.20) 
m _4.1673.10 


Nous allons démontrer plus bas que le Soleil émet une puissance de: 
Pz3.861.10% [WF] (4821) 


Donc sa consommation en masse par seconde est de: 


—=—-24410 [kgs] (4822) 
€ 


C'est à dire que sa masse diminue de 4.4 millions de tonnes par seconde... 


Or nous savons que ce nombre correspond seulement à 0.72% de la masse mise en réaction dans la 
fusion. La masse totale mise en réaction est alors (règle de trois): 


44.10 


= 627.101! [&g.s 1] (48.23) 
0.0072 Fe 
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Ainsi, à chaque seconde 627 millions de tonnes d'hydrogène (ionisé) 1 fusionnent en hélium 4 avec une 
perte de masse de 4.4 millions de tonnes qui est transformée en énergie. 


En estimant que seul le centre du Soleil remplit les conditions thermiques pour la fusion, ceci nous 
amène à déterminer son temps de vie nucléaire: 


0.1.4, 


SET 3.17.10/[s] (48.24) 


rmci 


En transformant cela en années nous avons: 


buet = 1.011000 [années] (48.25) 


1.2. TEMPÉRATURE INTERNE 


Les étoiles sont supposées être des amas sphériques d'hydrogène gazeux où les interactions entre 
molécules sont régies par l'attraction gravitationnelle. 


Une étoile n'a pas de paroi qui la délimite, c'est-à-dire qu'il n'y a pas de forces extérieures donc: 
PY =0 (48.26) 
En utilisant le théorème du Viriel vu dans le chapitre de Mécanique Des Milieux Continus: 


E --268, (48.27) 


[a 


Nous avons pour une masse sphérique gazeuse de rayon À de masse M composée de N corps: 


2 
E, = SANT etE, ne —— 


(48.28) 


Remarque: Pour le calcul de l'énergie potentielle, nous renvoyons le lecteur au chapitre de 
Mécanique Classique du site. 


Donc: 
3 13 GW? 
_ = 7 (48.29) 
2 25 À 
où rappelons-le, k est la constante de Boltzmann. 
Ce qui nous donne: 
2 
T = L Ses (48.30) 
5 NER 


Avec pour une étoile donnée W étant le rapport de la masse totale de l'étoile sur la masse moyenne 
d'une molécule. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Pour le Soleil, il vient que T =10°[°K]. 


C'est la température centrale du Soleil. Les mesures optiques mesurées depuis la Terre ne donnent que 
la température en surface (chromosphère), soit 6'000 [°X]. La température interne calculée est donc 
environ 1'600 fois plus élevée qu'à la surface. Des méthodes indépendantes basées sur les réactions 
nucléaires au centre du Soleil (mesure du flux de neutrinos solaires) donnent le même ordre de 
grandeur, mais les valeurs précises diffèrent d'un facteur 2 à 3. 


1.3. TEMPÉRATURE EXTERNE 


Nous avons démontré dans le chapitre de Thermodynamique que la loi de Stefan-Boltzmann, permet de 
calculer la température d'un corps chauffé à partir de son émittance ou de son énergie interne en termes 
de densité tel que: 


PT = sat = 2 ME) (on) 


avec: 


étant la constante de Stefan-Boltzmann. 
Prenons un exemple intéressant qui nous concerne directement: 


L'émittance moyenne dite aussi "émittance moyenne bolométrique" reçue par la Terre hors atmosphère, 
appelée aussi "constante solaire" (qui n'est au fait pas constante. sur une échelle de plusieurs milliards 
d'années), est directement mesurable en orbite et vaut 1373 [WF : #2 ?]. 


Connaissant la distance moyenne au Soleil comme étant d'environ 1.496: 10°? [#] =1 [TA] (Unité 
Astronomique), nous pouvons calculer la surface de la sphère S à R=1 [UA] et donc la puissance 


solaire P. Aïnsi: 
S=A47R? 22812 10 [m?] (48.33) 
et: 
P=S$S:M(T)=3.86110% [I] (48.34) 


Supposant connu le rayon du Soleil comme valant » & 6.9599:1@ [#+], nous pouvons calculer sa 
surface S puis l'émittance radiative solaire M(T). Ainsi: 


S=A47R? 26.087 10% [»°] (48.35) 


et: 


M(T) = : & 6.343107 [W:#°] (48.36) 
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Remarque: La surface rayonnante d'une étoile est appelée "photosphère". 


À l'aide de la loi de Stefan-Boltzmann, nous pouvons maintenant calculer la température 
thermodynamique de la photosphère: 


MT) 


T 


T4 


5780 [K] (48.37) 


La loi de Planck (cf. chapitre de Thermodynamique) appliquée à cette température nous permettrait de 
calculer la distribution spectrale du rayonnement solaire et nous voyons alors que le maximum de 
l'intensité est dans le domaine visible (notre visibilité...) du spectre qui va de 400 [nm] à 700 [nm]. 


1.4. LUMINOSITÉ 


La "luminosité bolométrique intrinsèque" d'une étoile correspond à sa puissance totale rayonnée dans 
tout le spectre électromagnétique dans la direction de l'observateur exprimée de façon relative à la 
puissance totale rayonnée par le Soleil. En supposant toutes les étoiles sphériques et isotropes, nous 
pouvons l'exprimer en unités solaires: 


La puissance rayonnée P se calcule elle, en multipliant bien évidemment l'émittance radiative (loi de 
Stefan-Boltzmann) par la surface de l'étoile: 


P=M(D'S=0'T''477 (48.39) 
La luminosité bolométrique intrinsèque d'une étoile est donc proportionnelle au carré de son rayon et à 


la quatrième puissance de sa température de surface. En prenant le Soleil comme référence, les 
constantes se simplifient. Nous pouvons alors écrire: 


4 2 
Li _. = . | =ce:rt.,2 (4840) 
© o} l'o 


avec r. = 6.959910 [we] et 7 = 5780 [K] d'où c* =1.85:10 7 [K*»? 


En astrophysique, nous utilisons également une échelle logarithmique pour exprimer la luminosité 
bolométrique d'une étoile: la magnitude absolue M. Cette unité a une origine empirique qui sera 
expliquée plus bas. 


1.4.1. ÉCLAT 


"L'éclat" e d'une étoile est sa "luminosité apparente". L'éclat (luminosité apparente) d'une étoile 
correspond à la densité de rayonnement reçu par l'observateur, c'est-à-dire au flux et vaut le rapport 
entre la puissance de l'étoile et la surface de la sphère dont le rayon est égal à la distance d qui sépare 
l'observateur de l'étoile: 
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P P 
- 
S Axd? 


(48.41) 


L'éclat diminue ainsi avec le carré de la distance. Il est important de remarquer que cette grandeur n'a 
aucune relation directe avec les propriétés intrinsèques physiques de l'étoile concernée (contrairement à 
la luminosité bolométrique!). 


En astrophysique, nous utilisons également une autre échelle où la luminosité apparente est donnée par 
une autre grandeur d'origine empirique: la magnitude apparente, qui sera expliquée de suite ci-dessous. 


1.4.2. MAGNITUDE APPARENTE 


Ptolémée en 137 après J.-C. avait défini une échelle de six grandeurs pour exprimer l'éclat des étoiles, 
la première pour les plus brillantes et la sixième pour les étoiles tout juste visibles à l'oeil nu (6 
grandeurs et donc 5 écarts). 


Au cours du 19ème siècle, avec l'arrivée de nouvelles techniques d'observations photométriques 
(photographiques puis photoélectriques), l'échelle de grandeur a été remplacée par celle de "magnitude 
apparente" qui a été définie de telle sorte à ce que cette nouvelle échelle soit proche de l'ancienne. 


La définition est la suivante: 

- L'échelle est logarithmique en base 10 (par commodité des grandeurs manipulées) 

- Il y a 5 écarts de magnitude correspondant à un rapport de luminosité apparente de 1 pour 100 (1:100) 
- L'échelle est inverse (une magnitude élevée correspond à un faible éclat/luminosité apparente). 


À l'aide de ces définitions, nous pouvons construire une règle liant de façon relative les éclats de deux 
étoiles à leur magnitude apparente m. 


Pour une étoile 2, cent fois plus brillante ou éclatante qu'une étoile 1, l'étoile 1 est 5 unités de 
magnitude au-dessus de l'étoile 2 (n'oublions pas que l'échelle est inverse). Donc: 


2 
2 =10? (48.42) 
& 


correspond à: 
m=M-M =3 (48.43) 


Nous pouvons alors poser les relations: 
EX | 
log| <|—2 et #4 -#2 —35 (48.44) 

& 


Par application de la règle de trois, nous construisons: 
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e 
log| 


En simplifiant, nous trouvons la "loi de Pogson" qui exprime la relation entre magnitudes visuelles 
apparentes et éclats de deux étoiles: 


M M = 25 a | 
1 


Ainsi définie, l'échelle de magnitudes visuelles n'est que relative. La référence photométrique est 
similaire à l'éclat de Véga (æ Lyr). 


Pour se faire une idée des magnitudes visuelles voici quelques exemples: Soleil -26.5, Pleine Lune -15, 
Vénus au maximum -4.8, Sirius la plus brillante des étoiles -1.5 (type spectral A1 et distante de 8.6 
années-lumière), limite de la perception à l'oeil nu 6, limite de perception à travers un télescope 
amateur de 15 cm à ce jour (2003) 13, limite de perception du télescope spatial Hubble 30. 


Il faut préciser que la magnitude apparente visuelle ne correspond pas exactement à la magnitude 
apparente réelle, car l'oeil n'a pas la même sensibilité pour toutes les longueurs d'onde. Les étoiles 
bleues ou rouges nous paraissent moins lumineuses à l'oeil qu'elles ne le sont en réalité car une partie du 
rayonnement se trouve dans les ultraviolets, respectivement dans l'infrarouge. 


Il convient donc de préciser s'il s'agit d'une magnitude apparente visuelle ou bolométrique. En général, 
les astrophysiciens utilisent les grandeurs bolométriques dans leurs communiqués. 


1.4.3. MAGNITUDE ABSOLUE 


La magnitude absolue M (ne pas confondre avec la notation de l'émittance..) d'une étoile est une 
grandeur logarithmique aussi, qui exprime cette fois la luminosité Z bolométrique. C'est la grandeur 
présentée en ordonnée du diagramme de Hertzsprung-Russel. L'échelle de cette grandeur est basée sur 
la magnitude visuelle. 


La magnitude apparente et la magnitude absolue sont liées par la distance qui nous sépare de l'étoile. À 
luminosité apparente intrinsèque constante, la luminosité apparente décroît donc évidemment avec le 
carré de la distance comme nous l'avons déjà vu. Afin d'établir une relation, nous avons dû choisir une 
distance de référence par une nouvelle définition. 


Définition: La "magnitude absolue" d'une étoile est égale à sa magnitude apparente si elle est distante 
de 10 parsecs (32.6 années-lumière). 


Soit une étoile placée à une distance quelconque d. Son éclat 2, est fonction de la distance et de son 
éclat #, si elle était située à 10 [pc] selon: 


e, — 10 
e, — d° 


Par application de la règle de trois, nous construisons: 
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1 

EE Ba ——— 

DOI GY «as40 
10 


En reprenant la loi de Pogson et en assimilant ##, à la magnitude apparente "» de l'étoile à la distance 
d quelconque, >, à la magnitude apparente de l'étoile à 10 [pc] (par définition de sa magnitude 
absolue M) ainsi que #, son éclat à 10 [pc] et #, son éclat à la distance quelconque, nous trouvons: 


aYŸ d° 
mm =m-M = 2.510g| 2 | = 25108] 2[ © | |=2510gl _|=25(21og(d)-2) (48.49) 
8, 8, (10 100 
qui peut bien sûr aussi s'écrire: 
à | 
m M = 5log 5 = S{log(d) -1) (48.50) 
En partant de cette définition, la magnitude absolue du Soleil est de 4.7. Sa magnitude apparente vue 


depuis la Terre est de -26.5. Elle est de 4.7 à 10 [pc] donc faiblement visible à l'oeil nu. 


Cette dernière relation de comparaison de la magnitude absolue avec la magnitude apparente (qui est la 
magnitude observée effectivement sur Terre) permet une estimation de la distance d de l'objet en 
astrophysique. 


Remarque: Pour avoir la magnitude absolue, il faut des modèles stellaires, et connaître la 
température de l'étoile comme nous allons de suite le voir. Dans la pratique, la seule quantité 
aisément accessible est évidemment la magnitude observée, qui est en fait la combinaison de la 
magnitude apparente et de l'absorption interstellaire. 


La loi de Pogson exprime de même la relation entre magnitudes absolues M et luminosités 
bolométriques Z de deux étoiles: 


M,-M, = 2s1[% | (48.51) 


Ainsi, Déneb étant 300'000 fois plus lumineux que le Soleil, la magnitude absolue est de -9. 
En reprenant la loi de Pogson, la magnitude absolue peut s'écrire relativement à la luminosité 
bolométrique absolue du Soleil: 


L 
Mio 7 M= 25e (48.52) 
doi,0 


AVeC Mio 


luminosité bolométrique: 


=47 et L,,4 *1,la magnitude absolue bolométrique se calcule ainsi à partir de la 


M=47-25Slog(Z,;) (48.53) 
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En reprenant l'expression de la luminosité bolométrique: 


2 4 2 
Fr 
Te © 


la magnitude (bolométrique) absolue d'une étoile étant directement fonction de sa température et de son 


rayon: 
T\(rŸ T 
M=47-251og[| | || |-47-10102| =—|-510l 7 
To © To Fo 


C'est le résultat que nous voulions montrer depuis le début: la magnitude absolue est directement liée à 
la luminosité bolométrique de l'étoile, raison pour laquelle c'est celle qui intéresse le plus les 
astrophysiciens. 


Remarque: La distance d'étoiles proches a pu être déterminée grâce au satellite Hipparcos. Par 
mesure de la parallaxe (mesures de la position de l'étoile à six mois d'intervalle et par application 
des règles trigonométriques élémentaires). Mais, au-delà de quelques dizaines de parsecs, la mesure 
de la distance d'étoiles par parallaxe devient très imprécise. En étudiant le spectre de l'étoile, nous 
pouvons déterminer sa classe spectrale, sa température de surface et la placer dans le diagramme de 
Hertzsprung-Russel. Il est donc possible d'estimer sa magnitude absolue et de calculer 
approximativement sa distance. 


Cet artifice de mesure est fondamental pour la cosmologie. C'est ainsi que l'on détermine la distance des 
galaxies proches en mesurant la période de certaines étoiles variables (nous y consacrons un petit 
chapitre ci-dessous). 


La distance des galaxies lointaines se calcule en mesurant la magnitude apparente de supernovae qui s'y 
produisent fortuitement. En effet, les magnitudes absolues des supernovae du type la (nous les 
reconnaissons par l'absence de raies d'hydrogène et par la décroissance de leur luminosité) sont bien 
calibrées car l'énergie dégagée par ces explosions stellaires est relativement constante. 


1.4.4. ÉTOILES VARIABLES 


Les étoiles de la séquence principale du diagramme de Hertzsprung-Russel sont des objets très stables. 
La force de gravitation, qui tend à contracter l'astre, est exactement compensée par les forces de 
pression interne, qui tendent à le dilater. C'est au moment où l'étoile devient une géante rouge que 
parfois l'équilibre est rompu. Commence alors une phase d'instabilité qui se traduit par de fortes 
variations de la luminosité de l'étoile. 


La rupture de l'équilibre est provoquée par un phénomène complexe qui met en jeu des variations de 
transparence des couches d'hélium près de la surface de l'étoile. À partir de là, l'astre se met à connaître 
une succession de dilatations et de contractions contrôlées par les forces qui assuraient auparavant 
l'équilibre. Lorsque la force de pression l'emporte, le volume de l'astre augmente. Mais la gravité freine 
le mouvement et finit par provoquer la contraction. Le volume de l'étoile passe alors sous sa valeur 
moyenne, jusqu'à ce que la pression interne s'oppose à la contraction et réussit à provoquer une 


nouvelle dilatation. 
[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Ce ne sont pas les changements de taille qui provoquent les variations de luminosité, mais ceux de la 
température. Effectivement, comme nous l'avons vu précédemment, la luminosité d'une étoile varie 
avec la quatrième puissance de la température, alors qu'elle ne varie qu'avec le carré du rayon. Lorsque 
le volume de l'étoile est cependant plus faible qu'en moyenne, sa température est légèrement plus forte 
et la luminosité maximale. Dans le cas contraire, la température est légèrement plus basse qu'en 
moyenne et la luminosité minimale. L'éclat de l'étoile change donc de façon périodique, d'où le nom 
d'étoile variable. 


Il existe dans le diagramme de Hertzsprung-Russel une bande d'instabilité qui traverse ce diagramme 
presque verticalement dans laquelle se produisent justement les phénomènes thermiques en question. 


Les deux principaux types de variables pulsantes sont les Céphéides et les étoiles RR Lyrae. Ces astres 
jouent un rôle central en astrophysique. Les Céphéides sont des étoiles de quelques masses solaires. 
Elles sont dans la phase de combustion de l'hélium après avoir atteint le stade de géante rouge. Les 
étoiles de masse solaire arrivées à ce stade deviennent des RR-Lyrae. Leur luminosité varie avec une 
période comprise entre un jour et plusieurs semaines. La propriété remarquable des Céphéides est 
l'existence d'une relation entre leur luminosité moyenne et la période de leurs oscillations. Par exemple, 
leur luminosité moyenne est de 1'000 fois celle du Soleil pour une période de quelques jours et de 
10'000 fois cette valeur pour une période de plusieurs semaines. C'est cette relation qui fait des 
Céphéides l'un des outils de base de l'astrophysique. 


Si nous connaissons cette relation pour une étoile variable, il est relativement aisé, par la détermination 
de sa période d'en tirer la magnitude absolue M. En mesurant alors sa magnitude apparente m nous 
pouvons ensuite calculer sa distance d en parsec à l'aide de la relation (démontrée précédemment): 


M =m+5-5log(d) (48.56) 


La figure ci-dessous représente la courbe période-luminosité des Céphéides. 


10 20 30 40 50 69 7% 80 M 
Période en jours 


Figure: 48.5 - Courbe période-luminosité des Céphéides 


L'étalonnage de cette courbe ne peut se faire que par des mesures de parallaxe sur des Céphéides 
proches. Il n'en existe malheureusement pas d'assez rapprochées pour qu'il soit possible d'utiliser la 
parallaxe annuelle. Il faut avoir recours à la parallaxe secondaire qui est basée sur le mouvement du 
Soleil dans la galaxie. 


Exemple: 


Nous repérons une Céphéide grâce à son type de classe spectrale. Sa période est de 50 jours et sa 
magnitude apparente y} = 3 . La figure précédente donne, pour cette étoile, une magnitude absolue 


M = -6. 
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En appliquant ensuite la formule donnée précédemment, nous trouvons: 


d = 10 US 2 1028 = 630 [pc] (48.57) 
Cette Céphéide est donc éloignée de 630 [pc]. 


Grâce aux propriétés des Céphéides, nous disposons d'un instrument de mesure qui porte jusqu'à 
quelques dizaines de millions d'années-lumière. Il est donc applicable au-delà de notre Voie lactée 
jusqu'aux galaxies proches comme les membres du groupe local. Au-delà, il devient difficile de détecter 
des Céphéides aux caractéristiques connues. 


Les étoiles RR Lyrae sont quant à elles des étoiles peu massives et vieilles. Leur période d'oscillation 
est inférieure à un jour. Contrairement aux Céphéides, elles ont toutes la même luminosité moyenne 
(magnitude absolue de 0.5), environ 100 fois celle du Soleil. 


Il existe encore une certaine quantité d'étoiles variables différentes (variables à éclipses, des variables 
explosives, variables binaires,etc.) pour lesquelles nous pouvons trouver une source abondante 
d'information sur l'Internet. 


Il existe d'autres méthodes plus connues de mesure des distances que celle des Céphéides ou de l'effet 
Doppler (voir plus loin pour les développements concernant l'effet Doppler): 


1.5. PARALLAXE TRIGONOMÉTRIQUE 


La méthode de parallaxe trigonométrique est très simple (mais délicate à mettre en oeuvre à la surface 
de notre planète pour les étoiles très distantes). Tout astronome amateur constate la fuite de l'étoile qu'il 
observe dans son oculaire. Ce mouvement se nomme "mouvement diurne”. Il est dû à la rotation de la 
Terre sur elle-même. L'étoile est également animée d'un mouvement elliptique beaucoup moins 
facilement détectable: le "mouvement parallactique"”. 


Il est dû, comme le suggère le schéma ci-contre, à la rotation de la Terre autour du Soleil. Nous 
mesurons donc l'angle I]: 


d 
— =tan(ll) (48.58) 
d 


si l'angle est faible (ce qui est très fréquemment le cas étant donnée la distance des étoiles), nous 
pouvons prendre le premier terme du développement de Taylor (cf. chapitre sur les Suites Et Séries) de 
la fonction tangente: 


x 2x 
tan(x)=x+—+—+,,. 2x (48.59) 


15 


Ce qui nous permet d'écrire: 


où d est la distance du Soleil à l'étoile et a celle de la Terre au Soleil comme représenté ci-dessous: 
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gure: 48.6 - Principe de la parallaxe tri 


1.6. L'EFFET DOPPLER-FIZEAU RELATIVISTE 


L'effet Doppler-Fizeau est le décalage entre la fréquence de l'onde émise et de l'onde reçue lorsque 
l'émetteur et le récepteur sont en mouvement l'un par rapport à l'autre. C'est une technique très utilisée 
en astrophysique pour calculer la distance d'un astre en supposant sa longueur d'onde d'émission 
connue (ou estimée) et en mesurant sa longueur d'onde reçue ou encore pour mesurer la vitesse de 
rotation (vitesse radiale) des étoiles en observant très précisément et successivement leurs bords 
opposés et en mesurant le décalage du spectre obtenu. 


En ce début de 21ème siècle la précision et la finesse des mesures de spectres a atteint un niveau tel 
qu'il permet même d'observer des variations minimes de la distance des étoiles et ainsi de spéculer sur 
d'éventuels satellites planétaires (ceci ne pouvant fonctionner que si le plan de l'orbite passe par la 
Terre). 


L'effet Doppler des ondes électromagnétiques doit être discuté indépendamment de l'effet Doppler 
acoustique (appelé également "effet Doppler-Fizeau Galiléen") démontré dans le chapitre de Musique 
Mathématique. Premièrement parce que les ondes électromagnétiques ne consistent pas en un 
mouvement de matière et que par conséquent la vitesse de la source par rapport au milieu n'entre pas 
dans la discussion, ensuite parce que leur vitesse de propagation est c (la vitesse de la lumière) et reste 
la même pour tous les observateurs indépendamment de leurs mouvements relatifs. L'effet Doppler 
pour les ondes électromagnétiques se calcule donc nécessairement au moyen du principe de relativité et 
est symétrique par rapport aux mouvement relatifs de la source et de l'observateur (contrairement au 
cas acoustique). 


Pour un observateur dans un repère d'inertie, une onde électromagnétique plane et harmonique peut 
être décrite par une fonction de la forme: 


sin(t'x-@'f) (48.61) 


multipliée par un facteur d'amplitude approprié. Pour un observateur attaché à un autre repère 
d'inertie, les coordonnées x et { doivent être remplacées par x' et f', obtenues par la transformation de 
Lorentz (cf. chapitre de Relativité Restreinte), et celui-ci écrira par conséquent pour sa description la 
fonction: 


sin(t"x'-@"£) (48.62) 
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où L'et æ' ne sont pas nécessairement les mêmes que pour l'autre observateur (justement c'est ce que 
nous cherchons à savoir). Par ailleurs, le principe de relativité nous a permis de démontrer dans le 
chapitre de Relativité Restreinte que: 


d ..; d 4 : d 
A2 TE FE E 12 € 12 
dé ax dé ax 


Ce qui impose que l'expression: 
&'x-@'t (48.64) 
reste invariante quand nous passons d'un observateur d'inertie à un autre. Nous aurons alors: 
&'x-@'i=k"x-œ"i (4865) 


En utilisant les relations de transformation de Lorentz (cf. chapitre de Relativité Restreinte), nous 
avons: 


x'+vé £'+v: x' lc? 48.66) 
en = get (86 
1 -v° {0° 41 -v° {0° 
Par identification, il vient immédiatement: 
_&-w'v/e? Ru (48.67) 


k&' 


= ———— (40 LE , 
41 -v° {ec 1-v? {ce 

si nous tenons compte que: 

w=c-X (48.68) 


dans le cas des ondes électromagnétiques, nous pouvons écrire chacune de ces relations sous la forme: 


l=vie 1-vfe (48.69) 


 ———© D D —————— 
ÿ1-v2 {02 \1- v? 0? 


& 


Le rapport: 
1-vie 


11-v? {02 


donne le "décalage spectral" noté Z pour un mouvement de l'observateur par rapport à la source suivant 
la direction de propagation. 


(48.70) 


Par ailleurs, la dernière relation avec les pulsations est plus souvent donnée dans la littérature sous la 
forme suivante: 


l-vic l-vie Vi=- vie 


RS = ——> = I —————© RS ——>© (48,71) 
V1 v? 162 (1-v/c)(1+v{c) Ji+vie 
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Ce qui se note plus couramment sous la forme suivante: 


- 6 . 
f=/f'———>| (48.72) 
+6 


Il faut bien se rappeler que le décalage de pulsation (et donc de fréquence) qui a lieu ici est dû à un 
mouvement relatif de l'observateur par rapport à la source et non à autre chose (ou réciproquement de 
la source par rapport à l'observateur). Effectivement, lors de notre étude la relativité générale ( 

), nous verrons qu'il y a également superposition d'un décalage à cause 
du champ gravitationnel environnant l'émetteur qui sera étudié comme étant causé par la courbure de 
l'espace-temps. 


Enfin, pour les sceptiques qui veulent vérifier d'une autre manière que le phénomène Doppler est bien 
symétrique contrairement à l'effet Doppler acoustique démontré dans le chapitre de Musique 
Mathématique, voici une autre approche: 


Considérons d'abord que c'est la source qui s'éloigne. Si on la calculait par la relation classique 
démontrée dans le chapitre de Musique Mathématique, la fréquence du signal à la réception serait: 


1 1 1, 1 
J'étoignement _ re — > — A1+8 (48.73) 
Vphase € 
et il faut prendre en compte la dilatation du temps pour f avec ( ): 
A = 
1-(v{c)? 


car l'intervalle de temps de l'observateur fixe est plus long que celui de la source (le temps passe plus 
vite pour l'observateur fixe). 


Il vient alors: 


he 1 ie A4, 


Jétoigement = = — 
Â£"  1+ 1+ L+ 
# # À (48.74) 
, [1= 
=’ 1= 8 
1+ 8 


et dans le cas où c'est l'observateur qui s'éloigne de la source nous avions démontré dans le chapitre de 
Musique Mathématique que: 


v v 1 ” 
Jétoignement =ÿ 1-2 =f h-2)- Las (48.75) 
Vphase Le Âé 


et selon les mêmes considérations, nous avons (simplement cette fois-ci c'est l'observateur qui se 
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déplace): 
7. = 1 ge 1 (T6), (TA), AA) 
éloigremert A 1- 82 A Âf£ ñ- #À f— &° Ja1+ 8101-81 _—— 
(48.76) 
Ja- 8° ” Ja- 8° . T-£ 
N1+8)(1- 8) N1+81(1- 8) +8 


Les deux relations sont bien symétriques dans le cas relativiste (donc dans le cadre de 
l'électrodynamique)! 


Remarque: En ce qui concerne la transformation de l'amplitude du champ électrique et du champ 
magnétique, il faut utiliser le tenseur de Maxwell démontré dans le chapitre de Relativité Restreinte. 


Un très bon exemple de l'application de l'effet Doppler consiste à étudier les limites données par la 
mesure de la vitesse apparente. Voyons de quoi il s'agit: 


1.6.1; VITESSE APPARENTE 


En mesurant la vitesse apparente de déplacement d'objets très rapides dans le ciel (jets de plasma, etc.), 
les astrophysiciens ont obtenu des vitesses apparentes de déplacement supérieures à la vitesse de la 
lumière dans le vide! 


Au fait, il s'agit d'une illusion qui peut se produire si la vitesse de l'objet est très proche de celle de la 
lumière qu'il émet, donc assez proche de c. 


objet à l'instant 


v-é-cosiéi 


objet à £ (}---------- 
<———— 


direction de v-£-sini di 


ll 
' 
! 
l 
4 . ' 
déplacement de l'objet 
l 
ll 
y vers l'observateur 
Figure: 48.7 - Principe de mise en situation de la vitesse apparente 


L'objet émet de la lumière à l'instant £,, celle-ci ne nous atteint pas instantanément mais doit parcourir 
une distance d pour arriver à nous. Nous recevons après le temps: 


d 
h =— (48.77) 
[es 


L'objet lui, se déplace à la vitesse v suivant un angle noté 0 avec la direction d'observation, donc à 
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l'instant £, l'objet s'est déplacé d'une distance v:£. La lumière émise par l'objet à l'instant f doit parcourir 
la distance (application de Pythagore): 


d'=d{d-vt.cos D +(v£.sind* (48.78) 


pour nous arriver (l'objet s'est avancé de ».£.c0s5 8 dans la direction d'observation mais s'est éloigné de 
l'axe d'observation de la distance ».£.sin 4), nous recevons donc la lumière qui a été émise par l'objet à 
l'instant { après un temps £; : 


bi ie v-t-cos 8)" +(v-£:sin 8) (48.79) 
C C 


Entre les deux positions de l'objet, il s'est écoulé la durée { mais, vu de l'observateur, l'intervalle de 
temps entre la réception des images de ces deux positions est: 


d-vt.cos8) +(v.t.sin8)? 4 . 
és — à -,-N@=vt'cos6) +(vésing) 4 (48.80) 


[es [es 


différent de f. 


Pour un intervalle de temps f petit, nous avons, en développement limité de Taylor: 


La C 


d? 2.d.vt.cos8 vf? d d? 2.d.vt.cos8 d 
EE 

2 2 2 € cè ec? € 

É = é (48.81) 


ä 2.v.f.cos 8 à à 12.v.£.cosd\ à 
= + + | 54 1 | - — 
à € € 2 à € 


Pendant cet intervalle de temps, toujours vu de l'observateur, l'objet semble s'être déplacé sur le plan du 
ciel de ».f.sin 4. 


Ainsi, la vitesse apparente de l'objet est: 


_vé-sang  vsang 
BRU ER EC De r 
ne 1- cos 8 Co 
€ 


Si nous posons l'angle 8 comme étant très proche d'un angle droit, nous avons alors le deuxième terme 
du dénominateur qui est très petit ce qui nous permet avec un développement de Taylor d'écrire une 
relation que l'on retrouve assez souvent dans les manuels scolaires des petites classes: 


V 
rs fi?) (48.83) 
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Cherchons le maximum de cette fonction pour comprendre comment une telle observation est possible 
en dérivant par rapport à 8 et en cherchant pour quelle valeur la dérivée s'annule: 


AV np vcos® Ov  vsin?6 


J (48.84) 


et cela s'annule après simplification du dénominateur pour: 


2 2 
y y y y 
VCos a[1-20 e) — “ysin? 8 =vcos 9- — (005 8+ sin? 8) =yvcosg-— —=Û0 (48.85) 

c c c c 


d'où: 


y 
cos =— (48.86) 
c 


La vitesse apparente est alors: 


= ere #5 on 


et elle est égale ou supérieure à c si déjà: 


Vayp — 


2 


y y 
D mme 5 6° HS) = 7 = y? = Qp? = 6° 


c (48.88) 


donc: 


v> +, (48.89) 


E 


Nous voyons ainsi qu'il est possible d'observer des mouvements apparents plus rapides que la lumière, 
alors même que l'objet est très rapide, certes, mais plus lent que c. Comme il ne s'agit que d'une illusion, 
il n'y a pas de contradiction avec la théorie de la relativité. 


En connaissant la vitesse de déplacement d'un astre obtenue à l'aide de l'effet Doppler et la vitesse 
apparente à l'aide des observations, il est alors facile pour les astrophysiciens de déterminer l'angle 8 
en faisant un peu d'algèbre élémentaire à partir de la relation ci-dessous: 


: _v-é-sng  vsang 
PP tv 48.90 
1—--cos8 ) 
c 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


1.7. LIMITE DE CHANDRASEKHAR 


Nous avons déjà déterminé dans le chapitre de Mécanique Classique le rayon de Schwarzschild (sous sa 
forme classique) qui exprime le rayon critique d'un corps pour que la vitesse de libération à sa surface 
soit égale à la vitesse de la lumière. Nous avions obtenu la relation ci-dessous qui exprimait 
typiquement le rayon que devrait avoir un astre donné pour avoir une vitesse de libération égale à celle 
de la lumière: 


: 2Gn 


e? 


À 


Dans ce cas particulier l'astre est ce que nous avions appelé un "Trou Noir". Cependant, avant le trou 
noir, une étoile passe comme nous en avons parlé, par plusieurs étapes intermédiaires par lesquelles elle 
peut d'ailleurs se stabiliser. Ainsi, vous avez dû souvent lire dans la littérature que pour qu'une naine 
blanche s'effondre en étoile à neutrons, sa masse devait être supérieure à 1.4 masses solaires mais sans 
démonstration mathématique. Eh bien c'est ce que nous allons démontrer maintenant! 


Nous allons introduire le sujet par l'étude de l'influence du principe d'incertitude sur la taille d'un 
système atomique (il en limite la dimension minimale). Cet exemple est fort puissant car il montre que 
le principe d'incertitude ne régit pas seulement le processus de la mesure mais aussi le comportement 
global des systèmes quantiques. 


Le premier exemple que nous pouvons donner est celui de l'atome d'hydrogène, non que nous 
attendions un résultat nouveau de cette méthode d'analyse, mais plutôt parce que nous pouvons exposer 
l'usage du principe d'incertitude et insister sur sa signification. 


Nous admettons que le proton, dont la masse l'emporte de beaucoup sur celle de l'électron, peut être 
considéré comme fixe. L'énergie de l'électron s'écrit: 


1 2 2 2 
E,=-my- Te EP _ 
2 ATEr 2m, AE 


En physique classique, un système dont l'énergie est donnée par la relation précédente ne possède pas 
de minimum: si nous faisons tendre r vers zéro en conservant la forme circulaire de l'orbite, il est facile 
de voir que Æ,, tend vers -«. En revanche, en physique quantique, cette limite n'a pas de sens: le 


principe d'incertitude s'y oppose. 


Dans ce cas, la recherche du minimum £; de Æ,, prend un sens, car une contrainte apparaît qui 


maintient ce minimum à une valeur finie. Elle se détermine en physique quantique (voir le modèle de 
Bobhr de l'atome dans le chapitre de Physique Quantique Corpusculaire) et impose: 


p'r=n'h=hoùx»eN 


Cependant, cette relation mise à part, si le rayon 7 de l'atome devient trop faible sous des contraintes 
extérieures (attention! nous nous affranchissons des orbites quantifiées du modèle de Bohr de l'atome 
qui impose une contrainte à p) la quantité de mouvement p de l'électron ne peut être inférieure à 
l'incertitude £» qu'impose le principe d'incertitude de Heisenberg, dès lors que Ax est de l'ordre du 
rayon r de l'atome. La forme même de la relation précédente limite la portée de la méthode: nous ne 
pouvons espérer déterminer mieux qu'un ordre de grandeur du minimum de £,,. 
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Afin d'évaluer le minimum Æ; de l'énergie totale, que nous interprétons comme l'état fondamental de 


l'atome d'hydrogène, nous calculons le minimum de Æ,, en éliminant p de l'expression: 


SE 
Ej ——<— par p'r=n'h=h (48.94) 
2m, AJEor 
Nous obtenons: 
h? 2 
E,, = Er) = e ii — (48.95) 
2er  AXEr 


Le rayon >; de l'atome dans l'état fondamental est la valeur de 7 qui donne à E(r) sa valeur minimale: 


dE(r) h_,_æ 
= - = (48.96) 
dr |, ” mr AE 


si bien que: 


(48.97) 


qui est l'expression bien connue du rayon de Bohr vue en physique quantique corpusculaire lors de 
l'étude du modèle de Bohr de l'atome. L'énergie Æ, de l'état fondamental est donc maintenant 


facilement calculable. 


Le but de cet exemple est de montrer qu'avec le principe d'incertitude de Heisenberg nous pouvons par 
un raisonnement très simple retrouver l'état fondamental d'un système. C'est exactement de cette façon 
que nous allons procéder pour déterminer les conditions qui font qu'un astre se retrouve dans son état 
fondamental. 


Attaquons-nous maintenant à l'étude d'une étoile. Schématiquement celle-ci se compose d'un mélange 
de deux gaz: celui qui est formé de noyaux d'une part, le gaz électronique de l'autre. 


Au cours de la vie de l'étoile, de nombreux processus de fusion ont eu lieu. Ils ont accru à chaque fois 
la taille et la masse des noyaux; Fe (le fer) qui est abondant à la fin de la vie d'une étoile, contient en 
moyenne 56 nucléons (voir la partie physique atomique du site). 


Ces noyaux sont de nature chimique ou isotopique variée. Comme ils sont peu nombreux en 
comparaison des électrons, leur pression est celle d'un gaz classique chargé, neutralisé par la présence 
des électrons: elle peut être ignorée, et ce d'autant plus que la température est nulle. 


La charge électronique seule ne permettrait pas aux électrons de résister à l'effondrement d'une étoile 
puisque la matière stellaire est neutre. À très basse température, quand le carburant est épuisé, la seule 
pression que le gaz électronique puisse opposer à la pression hydrostatique due à la pesanteur est 
d'origine quantique. 


En première approximation, les électrons exercent donc l'un sur l'autre une répulsion apparente qui 
n'est pas d'origine Coulombienne (principe d'exclusion de Pauli). En première approximation, ils 
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obéissent à une relation analogue à celle de l'électron atomique et qui s'écrit dans le cas minimal (ou 
maximal de pression): 


p'd=h (48.98) 
où d est la distance moyenne qui sépare deux électrons voisins. 


À température 7 = 0 [Æ], l'équilibre est atteint quand l'énergie (la matière de l'astre) totale du système 
est minimale. 


Que se passe-t-il si nous essayons d'évaluer la variation du rayon r,, de la Naine Blanche en fonction 


de sa masse 7%,» ? 


L'énergie potentielle gravifique d'une étoile est donnée en bonne approximation par (cf. chapitre de 


Mécanique Classique): 


"x étant approximativement donnée par: 
My = MN (48.100) 


où #+, est la masse du proton et N le nombre de nucléons que contient l'étoile: la contribution des 
électrons à la masse de l'astre est négligeable et il n'y a pas lieu de distinguer entre la masse du neutron 


et celle du proton, presque identiques. 


La seconde contribution à l'énergie est essentiellement celle du gaz électronique dégénéré (la 
dégénérescence correspond à l'existence de plusieurs états ayant la même énergie), d'origine cinétique. 
Nous pourrions être tentés d'écrire simplement (en supposant que le nombre d'électrons est égal au 
nombre de nucléons puisque nous sommes pour rappel dans l'hypothèse simplificatrice d'un gaz 
d'hydrogène): 


Cette manière de faire conduit à une impasse. Si nous exigeons que la somme £,,, + Æ;, atteigne une 


valeur minimale, nous aboutissons à une valeur du rayon de l'étoile tellement faible que, par application 
de la relation: 


p'd=h (48.102) 
la vitesse moyenne des électrons v dépasserait celle de la lumière! 


Pour éviter cette contradiction, nous devons recourir à la mécanique relativiste qui nous a montré que, 
dans ce cas (cf. chapitre de Relativité Restreinte), nous pouvons exprimer l'énergie totale comme: 


E = cam, c? +p2 (48.103) 
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si la valeur numérique de l'énergie cinétique l'emporte considérablement sur l'énergie de repos, nous 


avons alors: 
E= Nenfri ce? +2 =N. (Eau +0?) (48.104) 


et donc: 


Ez=E£E 


(3 


n=Nmc=N.pe (48.105) 


La distance moyenne d entre électrons s'évalue en supposant que l'étoile est homogène, approximation 
suffisante dès lors que nous cherchons l'ordre de grandeur d'une moyenne. Nous simplifions encore la 
géométrie en admettant que chaque électron est entouré d'un domaine sphérique de rayon d dans lequel 
il n'y a pas d'autre électron de même spin et où nous ne pouvons compter qu'un électron de spin opposé. 
Dès lors: 


3 
Fr; 
d° DT (48.106) 


Il reste à évaluer le minimum de la somme: 


my N° ue 
£, _ is LA Eu = -G + Mpc (48.107) 
WEB 


compte tenu de la condition: 
My = MN (48.108) 


Il vient encore: 


ñ 1/3 
E—2Z (48.109) 
d à Fe 
puis: 
rm N° h ME 
Ex = Eje(e) © GE + NÉ = —— (ch - GmyN°®) (48.110) 
Fe Fe Fe 


que nous écrivons finalement: 


43 


En = Ewlre) = —(ch-CGmmiy) (48.111) 


Ne 
Face à ce résultat, nous sommes confrontés à une situation inattendue: 


Si le facteur: 


43. 213 
K=ch-Gm, Mie (48.112) 
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est positif, alors l'énergie totale de la naine blanche l'est aussi, ce qui signifie que le système n'est pas 
lié: l'étoile est totalement instable (elle n'a pas atteint son seuil d'énergie minimal). Elle ne peut réduire 
son énergie qu'en augmentant sans limites son rayon r. 


Nous voyons que le facteur K est négatif si: 
3/2 
> ci Es 48.11: 
mm — (48.113) 
PE G me 


Si la Naine Blanche dépasse cette masse alors nous ne pouvons plus traiter le problème avec les 
équations précédentes. Elle satisfait alors aux équations régissant un astre composé de neutrons 
uniquement (étoile à neutrons) et ceci constitue alors un autre problème que nous n'aborderons pas ici 
pour l'instant. 


La masse (approximative) de la fameuse "limite de Chandrasekhar" est donc donnée par: 


chŸ? 1 
My = Me = ) Fr] = 14», | (48.114) 
F3 


Elle constitue la masse au-delà de laquelle une naïne blanche s'effondre en étoile à neutrons. 


Conventionnellement, les astrophysiciens associent cette valeur limite à un facteur multiplicateur de la 
masse du Soleil »#,,. Nous avons effectivement (numériquement): 


Me = 14», (48.115) 


1.8. LIMITE DE RUPTURE DE ROTATION 


Faisons l'hypothèse simplificatrice que la vitesse limite de rotation possible d'un astre (planète ou étoile) 
est celle qui équilibre la force centrifuge et force gravitationnelle à la surface de l'astre telle que nous 
soyons amenés à écrire (cf. chapitre de Mécanique Classique): 


v? : Clan 


——— (48.116) 


ET R2 


Poser cette relation suppose évidemment qu'il n'y ait aucune liaison autre que la gravité qui intervient 
dans la cohésion interne de l'astre. Donc les valeurs de temps de rotation que nous allons obtenir 
représentent une borne supérieure (dans le sens que la valeur réelle est probablement plus petite). 


Il vient alors de la relation précédente: 


Pour obtenir le temps de rotation auquel cela correspond il suffit de diviser le périmètre à l'équateur par 
cette vitesse: 
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27TR 27TR 27TR 


Tv [OM font no 
RON OR 


Ainsi, pour la Terre, nous avons comme période de rotation limite avant rupture: 


. 27.6'378"137 S 64 jhia | 


br ere 
6.674.101.5.9736.10% (48.119) 
\ 6378137 


2x 1392000000 
£, Soieit = —— #78 [hrs.] 


6.674.10711.1 9891.10°0 (48.120) 
1392000000 


Pour le Soleil: 


Maintenant considérons le cas du pulsar NP0532 qui a une rotation de 33 millisecondes. Nous 
souhaiterions en déterminer le rayon. Nous avons alors en utilisant les relations précédentes: 
213 
[A VGM 
27 


FR = (48.121) 


En utilisant la relation théorique de la masse limite de Chandrasekhar (puisqu'un pulsar est une étoile à 
neutrons tournant rapidement sur elle-même): 


ch 
My — Mo G 


342 

1 
= 
7 


l4re, (48.122) 
"a 


Nous avons alors pour le rayon de plus petit pulsar possible selon ces hypothèses: 


213 213 
£ VG-14 “10 1071.14. .1070 
sf: | Æ 10 "46.674.10  .1.4.1.9891.10 | 2172 [bn] (8123) 


. 27 27 


Avec le pulsar milliseconde PSR J1748-2446ad ayant une période de 1.39 millisecondes nous tombons 
alors sur: 


213 
«| = 21[b#] (48.124) 


ce qui est remarquable (même s'il s'agit d'une approximation) de penser qu'une telle masse peut être 
contenue dans un si petit rayon. À noter que pour ce dernier cela correspond à une densité de: 


Le À 15.101 | le 


P= —7 ’ 
1 Fe #. (48.125) 
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Notes personnelles: 
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49. RELATIVITÉ RESTREINTE 


Na avons toujours considéré jusqu'à maintenant lors de tous nos développements que les 


interactions (relations de cause à effet) entre les corps se faisaient instantanément, ainsi que l'observation 
d'un phénomène avait lieu instantanément après que celui-ci avait eu lieu. Or, deux physiciens (Michelson 
et Morley) au cours d'une expérience découvrirent quelque chose qui allait changer radicalement toute la 
physique classique: la vitesse (célérité) de la lumière était invariante (constante) quel que soit le 
mouvement que l'on avait par rapport à elle ! 


Cette observation est d'autant plus importante que nous savons que c'est la lumière qui nous permet de 
percevoir et de ressentir les choses. Il convient également de prendre en considération que les champs 
électrostatique et magnétique sont, comme nous l'avons vu dans le chapitre de Physique Quantique Des 
Champs, véhiculés par le vecteur d'interaction qu'est le photon qui se déplace à la vitesse finie de la 
lumière c. Cette constatation nous permet aussi de supposer que le champ gravitationnel finalement a 
aussi un vecteur d'interaction (qui serait le "graviton" dont l'existence semble prouvée indirectement) qui 
se propage à la vitesse de la lumière. Il convient dès lors de prendre en compte cette non-instantanéité et 
les conséquences que cela entraîne dans les phénomènes observés pour départager finalement ce qui est 
réellement de ce qui semble être. 


Avant de nous attaquer aux calculs, il nous faut définir un petit peu ce qui va être étudié dans ce chapitre 
(qui ne s'applique de loin pas qu'à la cosmologie mais bon. il me semblait préférable de le mettre dans 
cette section plutôt que dans celle de Mécanique). 


Définition: La "relativité restreinte" est une théorie confinée aux référentiels inertiels isolés (Galiléens), 
c'est-à-dire à l'étude de référentiels animés d'un mouvement rectiligne uniforme (inertiels). La raison en 
sera donnée lors de l'énoncé du principe de relativité restreinte (voir plus bas). 


Remarques: 


R1. Restreindre l'étude à des référentiels inertiels n'empêche bien évidemment pas qu'à l'intérieur de 
ceux-ci les corps peuvent être animés d'une vitesse uniforme ou non! 


R2. La relativité générale a pour rôle de prendre en compte des référentiels non inertiels et dans 
n'importe quel système de coordonnées en faisant usage de la puissance du calcul tensoriel pour être 
applicable dans n'importe quel type d'espace (autre que plat donc !). 


La relativité restreinte se base principalement sur trois concepts très importants: 
1. Le postulat d'invariance (de la vitesse de la lumière). 
2. Le principe cosmologique (voir plus bas). 


3. Le principe de relativité restreinte (voir plus bas). 
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Il convient aussi de prévenir le lecteur que nous allons utiliser ici beaucoup de concepts vus dans les 
chapitres d'algèbre linéaire, calcul tensoriel, trigonométrie hyperbolique, calcul différentiel et intégral, 
mécanique analytique, mécanique classique, électrostatique, magnétostatique et électrodynamique. Il est 
fortement conseillé d'avoir parcouru ces différents sujets au risque de décrocher dans la lecture de ce qui 
va suivre. 


1. PRINCIPES ET POSTULATS 


Les lois physiques expriment des relations entre des grandeurs physiques fondamentales. Si les lois 
physiques sont invariantes par changement de référentiel Galiléen comme nous l'avons vu dans le chapitre 
de Mécanique Classique, il n'en est pas forcément de même des grandeurs physiques. Ces dernières 
peuvent se transformer d'un référentiel Galiléen à un autre selon une loi de transformation simple comme 
nous l'avons vu au chapitre de Mécanique Classique. Il en est de même en relativité restreinte, mais nous 
devons maintenant prendre en compte ce que nous avions négligé lors de notre étude des transformations 
de Galilée: le temps qui s'écoule n'est pas le même pour deux observateurs si la vitesse de la lumière est 
finie, par contre l'intervalle de temps est lui est conservé! (trivial) 


1.1. POSTULAT D'INVARIANCE 


Des mesures de laboratoire (expérience de Michelson-Morley comme nous en avons déjà fait mention) 
ont, depuis fort longtemps, montré que la vitesse c mesurée par un référentiel inertiel (en ligne droite et à 
vitesse constante) est bien constante quelle que soit sa vitesse d'entraînement. Nous devons alors postuler 
la propriété suivante: 


Postulat d'invariance: la vitesse de la lumière (vecteur de transport de l'information) ne peut ni s'ajouter, ni 
se soustraire, à la vitesse d'entraînement du référentiel dans lequel nous la mesurons (plus clairement cela 
signifie que quelle que soit la vitesse à laquelle vous vous déplacerez vous mesurerez toujours la vitesse 
de lumière comme valant c numériquement constante et finie!). 


Corollaire: le principe de relativité Galiléen (cf. chap: 6 ue) selon ce postulat est 
complètement pris en défaut et il nous faut alors développer une novel théorie qui prend en compte 
cette propriété de la lumière. 


Remarque: Il est important de noter que nous considérons que la lumière est dans le cadre actuel de la 
relativité restreinte, le messager de l'information d'un corps sur un autre!!! 


1.2. PRINCIPE COSMOLOGIQUE 


Nous supposons que notre position dans l'Univers est typique, non seulement dans l'espace comme 
l'affirme le modèle standard de l'Univers (cf. « tre d'/ ue), mais aussi dans le temps. Aïnsi, 
un astronome situé dans une galaxie éloignée doit observer les mêmes propriétés générales de l'Univers 
que nous, qu'il ait vécu un milliard d'années plus tôt, ou qu'il l'observe dans un milliard d'années. 


En fait, il est relativement naturel d'aller plus loin et d'énoncer que: l'Univers présente le même aspect en 
chacun de ses points, c'est-à-dire qu'il est homogène. Cette homogénéité s'énonce donc sous la forme du 
"principe cosmologique". 
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Ce principe ne repose pas sur les observations, si fragmentaires par rapport à la démesure du cosmos 
qu'elles ne sauraient permettre d'établir sa validité. Il constitue bien un présupposé à toute étude physique 
de l'Univers. Sa raison d'être tient à son caractère, indispensable à toute cosmologie scientifique, et peut- 
être à une certaine réaction par rapport à l'ancienne vision géocentrique ou héliocentrique: il est supposé 
désormais qu'aucun lieu n'est privilégié dans le cosmos ! 


1.3. PRINCIPE DE RELATIVITÉ RESTREINTE 


Rappelons (cf. chapitre de Mécanique Classique) que les transformations Galiléennes nous disent 
qu'aucun Sn S ne peut être considéré comme un référentiel absolu puisque les relations entre les 
grandeurs physiques sont identiques dans tous les référentiels Galiléens ("principe de relativité Galiléen"). 
Le mouvement Galiléen est donc relatif. 


Au 20ème siècle les physiciens constatèrent qu'une importante catégorie de phénomènes physiques violait 
le principe de relativité Galiléen: les phénomènes électromagnétiques. 


En appliquant les transformations Galiléennes aux équations de Maxwell, nous obtenons un jeu 
d'équations différent selon que l'observateur se trouve dans un référentiel fixe ou un référentiel mobile. 


Effectivement, nous avons montré dans le chapitre d'Électrodynamique que l'équation de propagation du 
champ électrique ou magnétique s'écrivait sous la forme unidimensionnelle de l'équation de d'Alembert: 


# mr bee 
a ec & ve 


où # représente l'un quelconque des deux champs. Nous parlons alors très rarement de "l'équation de 
Hertz". 


Nous avions aussi vu dans le chapitre de Mécanique Classique qu'un facteur important de la validité d'une 
théorie était l'invariance de l'expression de ses lois sous une transformation Galiléenne (transformée de 
Galilée) en posant: 


X'=xX-ui,y =y,z =2{'=1 (492) 


Nous avons également montré dans le chapitre de Calcul Différentiel Et Intégral que la différentielle 
totale d'une fonction s'écrivait (exemple à deux variables): 


df(x',y9= “ — dx + — “A -dy' (49.3) 
ax" dy" 
Soit: 
df(x'59 = Dax É (49.4) 
li 


Ce qui nous amène simplement à écrire: 


POLE pu l'E pr 
dx dx âx' ax dé' 


(49.5) 
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Après élimination de f et en utilisant le théorème de Schwarz (cf. chapitre de Calcul Différentiel Et 


Intégral): 
8 1 4 ,, 1 4 ,, 4 8x' à d' à A(x-u,f) à dé 
ee ——_—Qr EE —— EE —— + —— = — ———— + —  — 
Ox 8x x" 0x dé” 0x' 0x Gé'Ox x x dé" àx oe 
_ 4 dut) _ à ai 
9x" üx 0x" 

Si nous écrivons de même avec le temps: 
LES nel 0 grn 9 02, 0 &', 9 (Tu), 9 06 
dé dt Ox' dé dé" Ox' dé dt dé x" dé dé" dé 4 


4 4(x-ut) à 8 à 
mL + = —+ 
8x" dt dt “Ax' à 


En fin de compte la transformation Galiléenne de l'équation d'onde censée avoir une forme invariante 
devient: 


! 43 4) nu # ou & _1  . 
— — — ms me — ( 9.8 
M id ox gs ox? ce? ôx't' c° da” F " 


| — — = 
8x? oc? É dx' dé' 


La forme de l'équation d'onde a donc été complètement altérée par la transformation. Au fait, nous savons 
que cela est dans un sens normal. Effectivement, après tout le champ magnétique, créé par des charges en 
mouvement disparaît quand nous utilisons un référentiel en mouvement avec les charges (ou inversement). 
Cependant, les champs électrique et magnétique ne se transforment pas correctement sous les 
transformations Galiléennes. 


Pour fixer la situation, suite à ces deux exemples, nous avons trois hypothèses: 


H1. Les équations de Maxwell sont fausses. Les équations correctes restent à être découvertes et devront 
être invariantes sous une transformation Galiléenne. 


H2. L'invariance Galiléenne est valide pour la mécanique maïs pas pour l'électromagnétisme (c'est la 
solution historique avant Einstein, un "éther" détermine l'existence d'une sorte de référentiel absolu où les 
équations de Maxwell ne changent pas). 


H3. L'invariance Galiléenne est fausse. Il y a une invariance plus générale, qu'il reste à découvrir, qui 
préserve la forme des équations de Maxwell. La mécanique classique doit être reformulée telle qu'elle soit 
invariante sous cette nouvelle transformation. 


Remarque: Il s'avère que les deux premières hypothèses sont exclues par les faits expérimentaux. De 
plus, les équations de Maxwell intégrant la vitesse de la lumière elle sont implicitement relativistes. 


Albert Einstein n'admettait pas la violation du principe de relativité Galiléenne par l'électromagnétisme. 
De son point de vue, il fallait au contraire le généraliser à toutes les lois physiques. 
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Il postula donc que les lois physiques devaient être identiques dans tous les référentiels Galiléens, ce qui 
implique, implicitement, que du point de vue des lois physiques, il n'est pas possible de distinguer un 
référentiel Galiléen d'un autre. Ce résultat est plus fréquemment formulé sous la forme qu'aucun 
référentiel n'est privilégié. Ce principe fut baptisé "principe de relativité". En effet, cette relativité est 


restreinte aux cas des référentiels Galiléens (dits aussi "référentiels inertiels") exclusivement. 


En d'autres termes, les lois physiques doivent rester inchangées après un changement de référentiel. Il 
nous faut donc déterminer de nouvelles transformations adéquates qui se substitueront aux transformations 
Galiléennes. 


Dans le cas des référentiels non Galiléens les référentiels ne sont plus indiscernables. Effectivement, 
imaginons une personne se trouvant dans un train se déplaçant à une certaine vitesse constante et une autre 
personne sur la terre ferme. Chacun pourra alors dire que c'est l'autre qui est en mouvement (relatif) et ce 
indistinctement. Par contre, si le train se met à accélérer, bien que les deux individus puissent dire que 
c'est l'autre qui accélère, seul celui qui est dans le train ressentira l'effet de cette accélération. ainsi les 
référentiels ne sont plus indistinguables. 


Einstein abolit ainsi aussi l'idée qu'il existe un point de référence absolu qui ne bouge pas et par rapport 
auquel on peut définir un temps absolu, une longueur absolue ou une masse absolue. On peut cependant 
définir un point de référence privilégié pour tout objet dans l'univers. Celui-ci est le référentiel se 
déplaçant à la même vitesse et dans la même direction que l'objet en question. Le temps mesuré dans ce 
référentiel privilégié est minimal et est appelé le "temps propre". Similairement, la dimension de l'objet y 
est maximale, c'est sa "dimension propre" ou "distance propre", et sa masse y est minimale, c'est sa 
"masse au repos" (nous ferons les développements mathématiques correspondants plus loin). 


2. TRANSFORMATIONS DE LORENTZ 


Pour que soit possible l'invariance de c (postulat d'invariance), nous devons admettre que le temps ne 
s'écoule pas de la même manière pour l'observateur immobile O que pour l'observateur O' dans un 
référentiel en translation uniforme en x (soit un référentiel inertiel) à vitesse relative (le terme "relative" 
est important!) v (attention ! la vitesse relative entre les référentiels est souvent notée u dans la littérature). 


Remarque: Un cas particulier de disposition des référentiels dans laquelle les axes d'espaces sont 
parallèles amène à ce que nous appelons les: "transformations de Lorentz pures" ou encore 
"transformations de Lorentz spéciales" et le déplacement relatif selon un axe particulier est souvent 
appelé un: "boost". 


Pour étudier le comportement des lois physiques, nous devons alors nous munir de deux horloges qui 
donnent t et f (le référentiel qui contient son horloge/instrument de mesure est appelé "référentiel propre") 
Mettons en place l'expérience imaginaire suivante: 


Lorsque les observateurs O et O' sont superposés, nous posons t-0 et t'-0 et nous émettons un flash 
lumineux dans la direction d'un point À repéré par Fr pr 
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F 


PA 1 
Figure: 49.1 - Configuration pour l'étude des effets relativistes 


Il est évident que lorsque le flash arrivera en À, l'observateur O mesurera un temps t et O' un temps f. 


L'observateur O conclut dès lors: 


49.9 
r=c't= {x + y" +2° = x° + y? +7 =c?.1? ) 


L'observateur O' lui, conclut: 


AC 
r'=ct'= 2 +52 472 = x+y2+7 = p? 42 (49.10) 


Étant donné que le déplacement de O' ne se fait que selon l'axe OX, nous avons pour les deux 
observateurs: 


y'=»,z"=Z (49.1) 
De plus, si la trajectoire du rayon lumineux se confond dans OX, nous avons: 
y=7'=0,z2=Zz'=0 (4912) 
Ce qui nous donne dès lors x? = «25° et x°° =" d'où: 
x-cf=0 et x°-c#%%=0 (4913) 
Ces deux relations sont donc égales (nulles) en tout x, x, t, entre les deux observateurs. Ce sont les 


premiers "invariants relativistes" (valeurs égales quel que soit le référentiel) que nous retrouvons sous une 
forme plus généralisée lorsque qu'appliquée à tout l'espace: 


2 2 2,12 


x +p + ct = x 4 pc; (40.14) 

Il convient maintenant de se rappeler, que dans le modèle classique (relativité Galiléenne), nous aurions 
écrit que la position du point À pour l'observateur © à partir des informations données par O' serait 
ET réciproquement (cf. chapitre de Mécanique Classique) tel que: 


[e | 
x'=x-vé=z-vs (C0) 
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Dans le modèle relativiste, nous devons par contre admettre que le temps t qui est en relation avec x n'est 
pas le même que f' qui est en relation avec x’, principe de relativité oblige (sinon quoi il serait donc 
impossible d'expliquer l'invariance de la vitesse de la lumière) ! 


Nous sommes alors amenés à poser la relation précédente sous la forme suivante: 
nie 
x'= À: {x-vt) (49.16) 


où x serait une valeur numérique à déterminer. Car pour expliquer la constance de la vitesse de la 


lumière c'est que l'espace doit s'ajuster en permanence en fonction de notre vitesse v. Ce qui est 
révolutionnaire comme nous l'avons déjà mentionné! 


Remarque: Un lecteur nous a demandé pourquoi nous ne pourrions pas écrire la dernière relation sous 
la forme simplifiée suivante (en utilisant la relation x = ct obtenue plus haut) si le point À se trouvait 
sur l'axe X: 


x'= Al X—Vi= a(s-vi)- afi-?] (49.17) 


€ [4 


La seule raison tient au fait que plus tard nous allons introduire une écriture vectorielle (matricielle) de 
ce résultat faisant apparaître le concept de quadrivecteur et que c'est sous la première forme d'écriture 
(celle faisant explicitement référence au temps) que nous pouvons clairement faire apparaître le 
concept d'espace-temps. 


De plus, si nous devons aussi pouvoir exprimer t comme fonction de t et de x sous une forme 


£ “ £' 3 
similaire: 


Résumons la forme du problème: 


à déterminer À. Et ensuite: 
is (e —b:x) (49.20) 
à déterminer: à, b. 


Nous cherchons alors à déterminer la relation permettant de connaître les valeurs des coefficients 34e b 


qui satisfont simultanément: 


et (49.21) 
x? + y? + 7? = p? «#2 x + +7 = c? 42 ( 


Compte tenu de ce qui précède et en se rappelant que y' = y et z' =, la dernière relation devient : 
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Ax-vt) + y? +2? = 0? a? (e =: xŸ 


(49.22) 


Distribuons: 


2 ji 2, 21% 2 2 id: 2 1: 3 2 XV 2,,2 (49.23 
(x SL }x -2 "(x Se 0 Hi - }xé+y +z° =|a- D 20 
Pour satisfaire la relation: 


2 2,,2 (49.24) 


x? + y? +z RCE 


Il faut que: 
(1) 


A?-blat ce? =1 


A'v-b'a te? =0 (2) 


2,.,42 
a -À - =] (3) 
€ 
(49.25) 


Il est facile de résoudre (2): 


: b'a?'c? (49.26) 
v 


A? 


Nous introduisons alors ce résultat dans (1) et (3) et nous arrivons à: 


(49.27) 


Si nous divisons (1) par (2'), nous obtenons: 


V 
=1—= à = 7 (49.28) 
y C 


et en introduisant ce dernier résultat dans la relation . 
a?(1-b:v}=1 (49.29) 


nous obtenons le résultat remarquable suivant: 
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pe (49.30) 


1- 
1- 


[#4 = 
que nous notons souvent: 


l 
2 
ue 
L l 
a (49.31) 
f- # 
et que nous appelons "facteur de Michelson-Morley" avec: 


U032 


En introduisant également: 


__V (49.33) 
b=— 
[es 


dans: 


je bac? (49.34) 


Y 


nous obtenons: 


(49.35) 


ET 
Il 
& 


1-(v/ cY 
Posons maintenant (afin d'être conforme aux notations d'usage): 
ee 
FE (49.36) 
avec donc le paramètre sans dimensions et toujours inférieur ou égal à l'unité: 
B=vlce (4937 
2.1. QUADRIVECTEUR DÉPLACEMENT 


Nous en tirons les relations de "transformation de Lorentz" pour passer des valeurs mesurées par O' à 
celles mesurées par O et inversement: 


x'= YÜx —vé) x = Y(x'+vé') 
7 LR à 
z'=Z g=2" (49.38) 
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qui ont par ailleurs comme propriété d'être covariantes (se traduisent par des relations ayant même 
structure lors d'un changement de référentiel Galiléen). Nous remarquons à travers ces relations que le 
concept de "temps" y est donc quelque chose d'individuel relatif au déplacement que nous avons avons par 
rapport aux autres (il s'agit du "temps propre"). Raison pour laquelle il n'est pas possible de définir un 
"temps commun" entre deux personnes en mouvement relatif qui ne connaissent pas leur vitesse 
respective l'une par rapport à l'autre (et encore nous ne prenons pas ici en compte la gravité qui déforme 
l'espace-temps... nous verrons cela dans le chapitre de Relativité Générale). 


Remarque: Si v est beaucoup plus petit que c, nous retrouvons la transformation de Galilée. 


Nous pouvons aussi écrire les dernières relations sous la forme (le lecteur remarquera que cette fois les 
unités de tous les termes à gauche de l'égalité sont identiques - il s'agit à chaque fois d'une distance!): 


x = y(x"+ Mer) 


L'c= Flte+ Ba 


Bien évidemment la différence est que la quatrième dimension constituant la partie temporelle de 
"l'espace-temps" semble contrairement aux coordonnées spatiales d'usage avoir une direction particulière 
privilégiée: la "flèche du temps" (on ne peut pas revenir à un instant temporel donné dans la réalité alors 
que cela est possible quand on parcourt une distance purement spatiale). Cette direction du temps est 
imposée par le oo PAAGRE de la thermodynamique comme quoi l'entropie ne peut faire 
qu'augmenter (cf. cl edeT ique). Si cela n'était pas le cas alors tous les temps 
existeraient déjà et on pourrait parcourir le temps comme un distance et le futur serait déjà écrit et on 
pourrait revenir dans le passé. Cependant la thermodynamique ne donne pas un direction particulière au 
temps. donc si notre temps à la direction qu'il a... c'est parce que notre Univers était organisé à sa 
création (donc qu'il avait une faible entropie). 


Nous pouvons alors mettre les transformations de Lorentz des coordonnées et du temps sous la forme 
matricielle (cf. L_inéaire) traditionnelle suivante qui définit la "matrice de Lorentz" ou 
de "matrice de Lorentz-Poincaré": 


cé y 78 O0 Olfci' 
x F8 y O0 Oflx' 
0 O0 1 Ol|y' 
Z 0 O0 © 1{[1z' 
et réciproquement: 
cé' y —y8 O0 Olfct 
x'| |-x8 7 0 O0|!x 
y' 0 0 1 Of[y 
à ( 0 O0 11[z 


ce qui donne: 
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fx) 


x'=#y 
y'=}y 
z'=Z 


=Z (49.42) 


L'=y t- x {=} 4x 
c° c° 


sous forme indicielle cela est plus fréquemment noté: 


e Y  -Y8 
x" | |-78 7 
x? Ô Ô 


(49.43) 


RE — 
mm © © © 
5 
ee 


0 ( 


ce qui sous forme tensorielle s'écrit: 


x'* = 1x" |ou|x" = L", x *|] (49.44) 


Il s'agit de la forme traditionnelle chez les physiciens de l'expression de changement de référentiel 
localement inertiel par une transformation de Lorentz. 


Remarque: Nous retrouvons le tenseur (la matrice) de transformation de Lorentz dans certains 
ouvrages sous la forme condensée £(£) voire parfois Æ ou encore A* . 


Le vecteur: 


x" =(ct,x,y,z) = (ct,x)| (49.45) 


est appelé le "quadrivecteur d'espace-temps" ou encore “"quadrivecteur déplacement". 


Remarquons que puisque: 


2 2,1 


À — dE 


x + pt +2 ct = 74 p+ 7 (49.46) 
la transformation par la matrice Z* conserve donc la norme. En termes géométriques il s'agit donc d'une 


"isométrie". 
2.1.1. INVARIANCE DE L'ÉQUATION D'ONDE 


Maintenant que nous avons déterminé les transformations de Lorentz, nous pouvons contrôler si l'équation 
d'onde est invariante relativement à ces dernières (rappelons que nous avons démontré plus haut qu'elle 
n'était pas invariante sous une transformation Galiléenne). 


Partant de la transformation de Lorentz écrite en clair: 
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x'=Yy(x -vé) 


| Y (49.47) 
EC 1 +7 
C 


nous calculons les dérivées partielles par rapport à x et t (l'expression après la deuxième égalité ayant été 
démontrée plus haut dans ce chapitre): 


08,080 ,v 0 
x Ox' x dé' ax ax" c? &' 7. 
2.908,88 9 ,,0 

dé Ôx' dt  dt'ût üx'  dé' 


Ces relations peuvent aussi s'écrire: 


ë à à 
Ê—=e Leg —— 
x | a Par 
(49.49) 
ë ô _à 
NIV an 
ä: & & 


Au carré: 
8? 8? 4? F 
2 21 2 
cg — = — 260 — +  — 
x? | x"? à dx 'd{' dr 
2 2 2 2 
L- . T2 + © 
dé âx dx'dé' dé 


Dans les équations de Maxwell, ou plutôt dans l'équation de propagation du champ électrique ou 
magnétique dans le vide, nous avons montré (cf. chapitre d'Electrodynamique) que l'opérateur suivant 
apparaissait: 


(49.50) 


8 _ ; 4 


a? ; a? ‘ ” æ a? a? j a? a? a? 
— — EL + ON + —— => "+ 2 —_—— —— 
re 7 Le TE 
& & & 8? 
Pl fn te — Do + 2 Be — © + (1 - 82) — 49.52 
/ | ‘ is EL Va Fe 8x "at" Î ) 37 ue. 


Fe. E _ | Mn 
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qui montre qu'une transformation de Lorentz laisse invariant cet opérateur (Jackpot!). Nous avons donc 
obtenu ce que nous cherchions (l'équation d'onde mais dans l'autre référentiel)! 


Le lecteur remarquera aussi que cela ne fonctionne que si et seulement si la vitesse de propagation des 
ondes se fait à la vitesse de la lumière. 


2.1.2. INTERPRÉTATION HYPERGÉOMETRIQUE 


Revenons maintenant à nos transformations de Lorentz. Rappelons que nous nous sommes restreints au 
cas particulier où les axes d'espaces étaient parallèles (ce qui nous avait amené à définir le terme 
"transformations de Lorentz pures"). Cette configuration spéciale a une propriété géométrique intéressante 
dont parfois de nombreux ouvrages font usage. 


Voyons de quoi il s'agit: 


Nous avons vu dans le cadre des transformations de Lorentz des longueurs que nous avions une 
transformation spéciale (boost) selon un axe, à savoir l'axe OX, requérant dans ce cas pour les autres 
composantes : 


Y'=ÿY,Z"=Z (49,54) 


Cela nous permet tout à fait de réduire la matrice de transformation Æ (matrice 4*4 que nous avions 
obtenue plus haut) à une matrice 2*2 de composantes À, B, C et D telle que: 


cé" A Blfcé 
= (49.55) 
x' © DII[x 


Nous remarquons que les composantes À, B, C, D respectent par construction les expressions suivantes: 


2 PC Pre pe) LÉ: 


1 
2 
1- #8" _, (4956) 


D-B=-p-(-x) = -F8 die 


AB-CD=y(-Y8)-y(-18) = -Y 8+Y 8=0 


La première relation peut être mise en relation avec la relation remarquable de la trigonométrie 
hyperbolique (cf. chapitre de Trigonométrie): 


cosh? (8)-sinh?(8)=1 (49.57) 
Et donc: 
A=cosh(æ) et C'=-sinh{æ) (49.58) 
la deuxième qu'il existe &, tel que: 


D =cosh(æ,) et B=-sinh{æ,) (49,59) 
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Remarque: Le choix du signe "-" pour C et B est utile car comme nous avons toujours Æ 2 0 (de 
même pour * qui est strictement positif) cela nous imposera à la fin des calculs d'avoir æ > 0. Dès 
lors, comme -— XË £ Ü et æ > 0 la seule manière pour que C (ainsi que B) puisse être négatif c'est de 
mettre un "-". 


La troisième donne alors la relation d'addition remarquable: 
AB -CD =-cosh(&)sinh(æ) +sinh(æ)cosh(æ,) = sinh(æ -&,) = 0 (4960) 
et donc la différence & -&, que nous noterons plus simplement & est nulle. Ce qui valide les relations: 
A= DS cosh(æ)=cosh(&),B=C< -sinhiæ) = -sinhfæ) (4961) 


La matrice se présente donc comme suit: 


nu cosh(æ) —sinh(d) : cosh(&)) —snh(æ) 7 
: —sinh(æ) cosh(&) u —sinh(æ |) cosh(æ) L 


Finalement, les transformations de Lorentz spéciales de vitesse v suivant l'axe OX peuvent aussi s'écrire: 


ct" = y(ct — Bx) = cosh(aÿet —sinh(a)x » cosh(a)| ce - PC) 
cosh(æ) 
= cosh(@)(cé -tanh(a)x) 
(49.63) 
x'= Vx - Bct) = cosh(@}x -sinh(@)ct = cosh(@)| x - sinh(a) 7 
cosh(e) 
= cosh(@)(x -tanh(acé) 
ce qui nous amène à écrire: 
Li sinh(d) nn 
= =tanh(a) = = =cosh(&) 4064 
8 = “tan (a) mt Le (49.64) 


La quantité & (sans dimensions) est appelée "rapidité" par ceux qui l'utilisent en physique des hautes 
énergies. L'intérêt de travailler avec des angles est de rendre la combinaison de 2 boosts plus aisée. 


Nous nous arrêterons ici en ce qui concerne l'étude géométrique de la relativité restreinte trouvant que cela 
a de moins en moins d'intérêt de procéder ainsi (bien que ce soit fort sympathique). 


22. QUADRIVECTEUR VITESSE 


Nous pouvons de même déterminer les transformations de Lorentz des vitesses. Considérons une particule 
en mouvement dans le référentiel inertiel O' telle qu'au temps f', ses coordonnées soient x", y', z'. 
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F 


PA 1 
Figure: 49.2 - Configuration pour l'étude du quadrivecteur vitesse 


Dès lors, les composantes de la vitesse v' sont: 


Û dx!" : dy" Û dz' 
Vi Œ—— V = — » Ve! ni — (49.65) 


Quelles sont alors les composantes de sa vitesse dans O (rappelons que O' s'éloigne à vitesse v!) ? 


À nouveau, nous écrivons: 


Nous pouvons différencier les équations de transformation des composantes que nous avons obtenues 
avant et ainsi pouvons écrire: 


dx = y(dx'+i #'ci' dt" 


dy = dy' 
49.67 
de = de Do 
dt = yid£'+i Bfcidx' 
Dès lors, nous avons: 
V _& _ az" : 
F dt ylt+(lc)dr) yfi+(8lo)n)d 7(+(8ie) 
et de même: 
v 
Vs 49.69 
j vil+i gfeiv, | FE) 
et: 


dx Vidr'tiBcidt'i ivi+iB'eiidt' vt+iS'ei 
Vy = = ——__——e PES EE . SR Si (49.70) 
dé  yidt'+i Sloidx'\ i1+i8fcividt' 1+18/civ, 
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Et comme la vitesse constante du référentiel O' est donnée par £ =v/c, nous avons alors: 


Vys 


r(1+ (vie }v,.) he 


et inversement: 


(49.72) 


Dans la limite de la mécanique classique, où la vitesse de la lumière était supposée instantanée et donc 
€ — ©, nous retrouvons: 


Ve Vas TV Vy © VyrrVr © Ve (49.73) 


qui sont les transformations de Galilée telles que nous les avons vues dans le chapitre de Mécanique 
Classique. 


Comme nous pouvons le voir, les transformations des vitesses ne suivent pas trop la forme de la matrice 
de Lorentz que nous avions déterminée plus haut pour les coordonnées. Les physiciens, n'aimant pas ce 


qui est inhomogène, ont cherché à avoir les mêmes transformations pour les deux. 


Ainsi, reprenons les relations de transformation des vitesses et réécrivons les telles que ci-dessous: 


y ' 


= 


vu 
+ — un 
La TERRE ê Vr € Ve = € 
nu Le FT 79 
1+6— y 1x] ? 1 #è 
c € c 


Ces relations peuvent s'écrire différemment si nous calculons: 


: 2 Û 2 : 2 
2 ” à 2 48 Vn 1 
ÿ ve + vi + pe à 2. a 
.- PI =1- x y 32 4 Les _ 1: RS DS (49.75) 
ec? c? v « : Vs 
1+8—+ 1+8— 1+8— 
C C 


Soit en simplifiant un peu: 
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CROSS CRC) 
RCE DR 
OO CCI 
HAT) 
LE HAT 


Posons: 
De — 
PF x y Z (49.77) 
EL a-|2| -J2] -1< 
€ CÉ cé CÉ 
et: 
Fév = 
œis 2 2 2 _ 
F f ur y' st (49.78) 
2 AS SI 
€ ci CÉ CÉ 
et: 
1 
Ferie lie 
(49.79) 
1-7 
€ 


Avec cette notation il nous sera aisé de déterminer la composante temporelle, en effet la relation: 


1 - , M 
pH à) fat (49.80) 


s'écrit: 
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FFE ET 


D’; = Ty) 
1 8 


(49.81) 

V L 

- É + #] T0) 
c 

v. 
r'; ui yÜv) Tr; + el à 
Lyc = (Tue + BV, TT) 
En procédant de même pour chacune des composantes spatiales, nous aurons au final: 


De = (Te + Bv,T) 
lv, = (Tv + A yc) 


(49.82) 
_ 1 
pv, = lv y 
1P22 — ve 


et nous avons atteint ici notre objectif d'homogénéisation qui nous permet d'écrire si nous posons 
Ds = 7617, = 70671: 


fre À (el [r 8 0 o1f7FX || y 8 0 Olfr 
po | LM 1x8 7 0 ofrém ll 
x), = y(v) y, "lo 0 10 ee », (49.83) 
pv, v, 0 0 0 1|[rF', 


ce qui sous forme tensorielle s'écrit: 


u'® = Lu'|ou|u" = L',u'*| (49.84) 


Le vecteur: 


u” _ pP)E, v,,v,,v) — ICE, v) (49.85) 


est quant à lui appelé le "quadrivecteur vitesse". 
2.3. QUADRIVECTEUR COURANT 


Nous avons défini naturellement lors de notre introduction du tenseur du champ électromagnétique (cf. 
chapitre d'Électrodynamique) le quadrivecteur courant: 


=(oc,j) (49.86) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


que nous pouvons écrire: 


O4 


j" = p(c,ÿ) (4987) 


Dès lors, en considérant &, comme la densité de charge dans le référentiel propre se déplaçant à la vitesse 
v par rapport au référentiel O' et du fait de la contraction des longueurs dans la direction de la vitesse, le 
volume occupé par une charge donnée sera multiplié par le facteur }{Ÿ) de sorte que: 


j" = AP) (cv) (4988) 


qui n'est autre que le “"quadrivecteur courant" où nous retrouvons le quadrivecteur vitesse déterminé 
précédemment. 


2.4. QUADRIVECTEUR ACCÉLÉRATION 


Ayant obtenu précédemment un quadrivecteur vitesse transformable à l'aide de la matrice de Lorentz 
cherchons aussi l'équivalent pour l'accélération. 


Le quadrivecteur accélération s'exprime naturellement comme la dérivée par rapport au temps propre de la 
quadri-vitesse u tel que: 


a ==" (4989) 


Rappelons que le temps propre d'une particule est le temps mesuré dans le repère de cette particule, c'est- 
à-dire dans le repère où elle est immobile. Le temps propre dans la littérature spécialisée est souvent noté 
L: 


Remarque: Attention!! Si le lecteur a compris les développements jusqu'à maintenant, l'accélération 
que nous cherchons à calculer est celle d'un objet accéléré dans un des référentiels en mouvement 
relatif uniforme par rapport à un autre (ce ne sont donc pas les référentiels qui sont en mouvement 
accéléré ici!!). 


Il faudra d'abord que le lecteur admette (nous le démontrons cependant un peu plus loin) que: 
di 1 
+ 


d£' | v? (49.90) 


Dès lors, nous avons: 


a” hd y L(ey #v) (49.91) 
dt' di °°” 


Si nous introduisons l'accélération ordinaire 4 = dÿ { dt nous voyons que: 


de D Sn LT 
en (Pl) (er)= (Goes +5eg)- Lea (49.92) 
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alors: 


3 3 
LA 


a = 21022) = y 50 ä,yä +6 | (49.93) 


En utilisant la relation (cf. chapitre de Calcul Vectoriel): 
(Fog)r =vx(pxa)+(Voÿ)æ (49.94) 


nous trouvons que le quadrivecteur accélération peut être écrit: 


+(8x(8xa)+(80 6 à) - ALES Ge BF + «(32 (49.95) 


Le vecteur: 


a"=y"(803,4+ Bx(Bxa))| (4996) 


ZOU 


est appelé "quadrivecteur accélération" et se transforme donc aussi à l'aide de la matrice de Lorentz. 


Nous voyons que si Y# € et 4 = a, cette dernière relation se simplifie en: 

=#(B0s 3+ Éxlèxs Box z+0xfüxz\ = f0 

=Yy (80à,à + 8x (8x ä))= 1(0 ä,a+ üx(0 x&)) =(0,3) (4997 
Nous retrouvons donc l'accélération classique. 


En utilisant la métrique de Minkowski (voir sa définition plus loin), notée ?,,, calculons la norme du 
quadrivecteur accélération: 


à 2 
Remarque:ll faut bien comprendre que quand nous écrivons G + ÊX ( ê xà)) il s'agit dans ce cas 


implicitement de la somme des carrés des composantes du calcul entre parenthèses. 


Et comme: 
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Ro F-2 (80 Aoa)As+(80Ë) à 
c =(6oa) 8a -(£0 6) 


(49.99) 


nous rassemblons cela: 
_. [ à (é+2(83) 8-28 8 
a'a, = y |(Boa) - : D (49.100) 
(Bca) F -2(8°8)(Bcà) 
Maintenant, nous développons la somme a, de la grosse parenthèse qui devient dès lors: 


a'a,=ÿ° Ci) L' ‘ +2(8a)(4a')-2(48 ja, & + 
| (ae Ÿ(a2)-2 (a#)a2)(ae}+ (80) a 


| 12 L (49.101) 
= #44 Ÿ - ad +2(8a) -2(88 ja at + 
è (aa Ÿ(a&)-2 (48 (a) +(88Ÿ à a! 
Nous simplifions: 
aa, =h [ae ) (1-2-46 +286 )+a (+288 -(46))] 
(49.102) 


= y [(6-a) (-2-#+2F#)+#(-1+28 -À)] 


a’a A (CE a) (1-2-F +2 #)+3 #(1+28-F)] 
[ee af (i+#)# (128 -8)] 
reset B(-2)] (10 


Or, nous avons la relation: 
PAP -2 8-02) -(a)(48)- (8) coin 
et la propriété du produit vectoriel: 
äxB=-Bxà& (49.05) 


Ce qui nous donne finalement: 
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aa, = RAC -(äx B)) = -y ‘[aoä- (ax É)o(ax 5) = pa -(8xa)) (49.106) 


à : . : : z 212.7 = 212 : 
Imaginons maintenant un objet avec un mouvement relatif uniformément accéléré &; (accélération 
constante) dans notre propre référentiel. Si nous supposons notre référentiel fixe, nous avons 
ÿ =0— 8 = 0. Dès lors: 


aa, =-& =-22 (49.107) 


In extenso, si le mouvement accéléré ne se fait que le long d'une seule composante: 
4 (49.108) 
dé 


Or, nous avons aussi: 


d du . à à ? à UE 
Liyu)= tue fr ]-réh-é]rS (49.109) 


dé u° (49.110) 
Ce qui après intégration donne: 


(49.111) 


Nous voyons que la vitesse u n'atteint jamais c alors que la force est toujours la même! 


Nous avons donc: 


tie 2,2 
c° d X c° dé c? 
x=— [ —=—© dx =—,fl+ 5 -— (49112) 
dj 1+x° &o ë 0 
ce qui nous donne: 
2 

ce? a ct 
Xt— |] —C'é = —+ (49.113) 

dy 4 


x=—|,]+—— + *-: (49.114) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Nous sommes bien loin de la relation du mouvement uniformément accéléré que nous avions en 
mécanique classique. Cependant, pour t proche de zéro, nous retrouvons la relation de la mécanique 
classique en prenant le développement de Taylor au deuxième ordre de la racine (cf. chapitre Suites Et 
Séries): 


2 2,2 2 2,2 
€ dé C dé 1 
=—| + -1le—|1+ 0 -1l = af (49115) 
ë 2c 


Cependant, ceci ne nous donne pas les relations de transformations de composantes de l'accélération sous 
une forme simple. Voyons donc comment les obtenir. 


Rappelons d'abord que nous avions obtenu pour la vitesse: 


1 ! 1 
Vuty Vs V 


: v , "7? |” : v (49.116) 
1+—v x" 100 10e x" 
le É 43 | #] 


Il vient en les différenciant: 


(49.117) 


et donc: 
dv, | 1 dv 1 dt' dv", 
2 CUITE 1 
dt pl] dt A0 dt 
: . 49.118) 
1 dt. . 
€ 


Rappelons maintenant que nous avions démontré que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


c't=y(é"c+ 8x) (49.119) 


en différenciant il vient: 


dt y dt £8°v, 
c'dt=y{dt"c+6' dx )=c —=—{H"ce+6'dx' )= —=7|1+ LS 
p(arte+ Bar )= er = Lacs grar)= À 1 > 
Ca 1 L 1 (49.120) 
c 
d'où finalement: 
PC UE à 
Wave d (49.121) 
F LE +) AL v] 
et pour les composantes y, z: 
v' dv'.. Vi. 
Vis LUF: = dv, . ps : J''E — É 
fees | 1 | fr r | € (49.122) 
2 *' 2 Li TV x 
La c 
et donc: 
dV, 3 L 1 AV sig Vue v dv" dt' 
d£ v , di ; 2e dt |d' 
F 1+—v, F 1+—v!, 
c (49.123) 
_ & VE V'y p'{s' æ " 
_ 2 2? .: 3 
CET te 
c 
Donc finalement: 
= 1 1 
x 3 x 
L L 
4 1», 
. ay VV y d'y 
D T 3 3 
49,12 
A0 pli] us 
c c 
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Rappelons que ces relations s'appliquent lorsque les mouvements des référentiels sont de translation 
uniforme! 


2.5. ADDITION RELATIVISTE DES VITESSES 


Comme la vitesse de la lumière est une vitesse supposée indépassable, nous en venons maintenant à nous 
demander quelle sera alors finalement la vitesse d'un objet lancé à une vitesse proche de celle de la 
lumière (par exemple...) à partir d'un référentiel se déplaçant lui aussi à une vitesse proche de la lumière 
(pourquoi pas non plus...). 


Il nous faut alors trouver une relation qui donne la vitesse réelle V à partir de la vitesse de lancement y, € 
2 


de la vitesse du référentiel 
1 


Nous savons que pour l'objet lancé: 


C p1= 
x'=v (49.125) 
Comme celui qui est intéressé ne connaît pas la vitesse réelle V, il se doit d'utiliser les transformations de 
Lorentz. Ainsi, compte tenu de l'expression de t' que nous avons vue plus haut il vient: 


Lx 


ec? (49.126) 
x'=v, : 


* A-tic} 


et compte tenu de l'expression de x', avons également: 


do 


X=V'É 2e (49.127) 


= : Les 
-G10? L ere 


d'où: 


vx VX v,V 
X—VÉ = ( -#)e x VÉ = VÉ i> f%) ={(v +") (49.128) 
€ € c 


Nous savons que v= x/+t d'où finalement la "loi de compositions des vitesses relativistes": 


(49.129) 


qui est donc la vitesse d'un corps en mouvement dans le référentiel en mouvement par rapport au 
référentiel au repos (ou autrement dit: vu par le référentiel au repos). 


Et réciproquement vu de l'autre référentiel en mouvement, nous avons en faisant les mêmes 
développements (avec inversion des signes et des vitesses bien sûr): 
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(49.130) 


qui est donc la vitesse d'un corps en mouvement dans le référentiel au repos par rapport au référentiel en 
mouvement (ou autrement dit: vu par le référentiel en mouvement). 


2.6. VARTATION RELATIVISTE DES LONGUEURS 


Considérons maintenant que la longueur d'un objet est donnée par la distance entre ses deux extrémités À 
et B. Considérons cet objet AB immobile dans le référentiel O' en translation uniforme et orienté selon 
l'axe O'X. 


FA 1 


Figure: 49.3 - Configuration pour l'étude de la variation relativiste des longueurs 


Sa longueur est donc la distance entre ses deux extrémités: 


+ (49.31 
L'=x,-x, de. 


Pour l'observateur O, l'objet est en mouvement. Les positions de A et B devraient donc être mesurées 
simultanément: 


NS (49.132) 


Il vient donc en utilisant la relation démontrée au début de ce chapitre: 


X —VÉ 
= YA) = ————© (49133 
(wie) 
la différence suivante: 
L'= Ag VE Ka VÉ  _  Xg = X4 (49.134) 


Et (v{ c}? on TE \1- (vlc) etre {v{c}? 


d'où le résultat remarquable: 
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que nous retrouvons aussi fréquemment dans la littérature sous la forme suivante: 


(49.136) 


Ainsi, la longueur d'une règle observée dans un référentiel mobile par rapport au référentiel propre de la 
règle est inférieure à sa longueur propre (que l'on peut assimiler en toute généralité à une "distance 
propre"). En d'autres termes, la longueur d'un objet en déplacement mesuré par le référentiel immobile 
sera plus courte que sa grandeur réelle. Ce phénomène porte le nom de "contraction des longueurs". 


2.7. VARIATION RELATIVISTE DU TEMPS 


Un événement est un phénomène qui se produit en un endroit donné et à un instant donné. L'origine du 
temps étant difficile à préciser, nous préférerons souvent définir la notion d'intervalle de temps comme le 
temps qui s'écoule entre deux événements comme il est fréquemment d'usage. 


Considérons maintenant deux événements À et B consécutifs qui se produisent au même endroit x' (!) dans 
le référentiel en translation uniforme: 


FA 1 


Figure: 49.4 - Configuration pour l'étude de la variation relativiste du temps 


Pour l'observateur O', l'intervalle de temps est simplement: 
Afmp —$". (49187) 
87 A 
Pour mesurer cet intervalle, l'observateur © dans le référentiel fixe, doit aussi imposer que x’ est commun 


aux deux événements. Alors en utilisant la relation démontrée au début de ce chapitre: 


€ (49.138) 


nous obtenons: 
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: + : 
8" 3 AT _ : 
À = Lt. A . At (49.139) 


# Foe Sn Beni TES - {v{c}? HETPÉ (vlc)? 


d'où le résultat remarquable ci-dessous: 


(49.140) 


ce qui se note sous forme condensée traditionnelle: 


t= y (49.141) 


Nous en déduisons aussi en prenant un élément infinitésimal: 


dé _ 1 (49.142) 


d&' fe 


Donc l'observateur O (immobile) mesure un intervalle de temps d'autant plus grand que le référentiel dans 
lequel se déroule le phénomène se déplace rapidement. Le temps dans le référentiel fixe (donc le "temps 
propre" du référentiel fixe!) semble comme dilaté par rapport à celui en vigueur dans le référentiel mobile 
(dont par rapport au "temps propre du référentiel mobile!). 


Voyons un exemple d'application sympathique et (cependant) simplifié à l'extrême: 


En 1971, une vérification expérimentale directe de la dilatation du temps fut effectuée. Deux avions à 
bord desquels avaient été placée une horloge atomique au césium pendant leurs vols commerciaux 
réguliers (l'un vers l'Est, l'autre vers l'Ouest) comparèrent leur horloge à une troisième horloge atomique 
restée au sol. Cette expérimentation devenue célèbre par le temps est appelée "expérience de Hafele- 
Keating". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


L'avion volant vers l'Est perdit 59 [ns] alors que l'avion volant vers l'Ouest gagna 279 [ns] (la Terre tourne 
sur elle-même en un jour, d'Ouest en Est). Il fut donc mesuré une différence totale de: 


ÀE = tps — ones = (59) —(+273)Z —-332[ns] (49.143) 
entre les deux horloges cette différence est nettement supérieure à celle qu'implique la relativité restreinte. 


Analysons l'expérience en considérant que tous les référentiels sont inertiels (ce qui élimine donc la 
relativité générale). 


Remarque: En toute rigueur l'effet de la relativité générale (ralentissement des horloges en fonction de 
l'altitude conformément à l'effet Einstein vu dans le chapitre de Relativité Générale) n'est absolument 
pas négligeable puisqu'il est d'une amplitude équivalente à celle de la relativité restreinte. 


Considérons pour l'étude trois repères inertiels, un situé au pôle Nord, un sur Terre (ailleurs qu'au pôle 
nord dans l'idée!) et un dans un avion. Les intervalles de temps éjma; rer €t Éamon TeSpectivement (que 
nous noterons de manière abrégée éy;,fr .£4 pour la suite), sont reliés entre eux par la relation démontrée 


précédemment (donc le pôle nord est pris comme le référentiel au repos dans cette expérience et donc la 
référence du temps propre!): 


Ény = Frêr = FaËs (49.144) 
où nous avons donc: 


1 1 
VE ————© }y= 


(ve) 1-(varc) (49.145) 


Les repères sur Terre et dans l'avion ont donc des vitesses relatives v- et v4 par rapport au pôle nord. Les 
temps en avion et sur Terre sont donc reliés par: 


1- rie) 

lv fc 

LL AS. LE (49.146) 
y 2 
4 1- (vale) 


Nous allons accepter l'approximation suivante: 


tj = LP - 14] (are) -(» 1) kr (49.148) 
FA 
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où nous avons supposé au dénominateur que: 


2 
(va fe) “& 1 (49.149) 
Pour les racines dont la valeur est de toute façon proche de 1 (puisque c est beaucoup plus grand que les 


vitesses relatives considérées), nous pouvons faire un développement de Taylor au deuxième ordre lorsque 
x tend vers zéro: 


1 1 1 
Vi+x a (+a)+ | (x-a) = se (49.150) 


Ji+a a=0 


Nous pouvons alors écrire: 


2 2 
Hs tre FOR IES £r (49.151) 


Grâce à ces approximations successives, nous pouvons facilement écrire la différence entre les deux 
horloges qui est alors de: 


(are) -(rte) (49.152) 


Selon les hypothèses initiales, la vitesse de croisière des deux avions par rapport au sol est constante et 
sera notée v. La vitesse de chaque avion (non relativiste selon les approximations précédentes!) est alors: 


Va=Vr—v (49.153) 
suivant que l'avion va vers l'Est et: 
Va =Vr +V (49.154) 


suivant que l'avion va respectivement vers l'Ouest. Alors: 


2 2 2 2 
Vr—V : a Vr +v L Vr 
€ € e € 
LE = ps — ouest = | fr on sn | êr 5 
AQ 
2 2 (49.155) 
Vr —V Vr +V 
€ € 


Nous allons considérer que (c'est assez grossier….): 
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vé 2 
TT 3 
c c , | 
(49.156) 
V 2wr 
2 2 
c c 
Donc il reste: 
: 2Wr  2Wwr 
2 2 VV» VW 2vv 
= = € CPE PE ; r |_ 3 : 
hé = Êps — ÉQuest Z Ër D = > = Ër (2-2 PE (49.157) 
c 


Nous voyons bien évidemment qu'avec les approximations effectuées, nous perdons l'asymétrie de la 
dilatation du temps entre l'Est et l'Ouest. Celui que cela dérange peut appliquer alors directement les 
valeurs numériques à la relation antéprécédente. 


Le résultat précédant des approximations successives permet déjà de voir de manière formelle et rapide 
que le signe sera en accord avec le résultat expérimental. 


Pour une application pratique, nous prendrons la vitesse constante des avions commerciaux de l'époque 
qui valait: 


v = 220 Lo. | (49.158) 

et le voyage total des avions dura 41 heures selon la mesure au sol soit: 
tr =147"600[s] (49.159) 

et un point de la surface Terrestre va à la vitesse: 


27TR 


Vr = 


(49.160) 
jour 


où le rayon de la Terre étant de 6371 kilomètres (cela suppose que les avions sont sur le rayon de 
l'équateur!). Nous avons donc en application numérique: 


2.220 2x. 6'371' 000 
2wr 24.60.60 2.220.463 (49.161) 
ÂË=—<{r = —-147'600. —"— = —147 G00——_—_—_—— = —334 [hs] 
c 2997792458 2997792458 


ce qui mène à un résultat très proche de la mesure qui fut effectuée. 


Et en utilisant directement la version non approximée: 
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CE 


ar — Épst — ÉOuest = | Ër RE ns L:: D 


(49.162) 


= -92- (4173) = -265 [#5] 


où nous avons pris cette fois-ci la vitesse de rotation de la terre à la latitude conforme à l'expérience faite 
en 1971: 


Vr = 27R cos(38°) = 365 [#2 s] (49.163) 


Jour 


Donc nous voyons que le résultat n'est dès lors plus très conforme à l'expérience! Effectivement, il faut 
maintenant prendre en compte dans ce cas non approximé l'accélération du temps dû à la gravité. Nous 
allons devoir utiliser la relation de l'effet Einstein démontrée dans le chapitre de Relativité Générale: 


qui exprime donc que le temps au sol s'écoule moins rapidement que le temps à l'altitude h. 


D'après le compte-rendu de l'expérience, les avions ont volé à 10'000 [m] d'altitude. Ce qui donne 
(l'accélération g n'est pas la même au sol qu'à l'altitude pour rappel!) une accélération du temps: 


h _ 9.5.10'000 
At = ty & 1471600 = +156 [ns] (49.165) 
c 2997921458 


Or, nous voyons que les deux avions étant tous deux à la même hauteur, nous avons toujours: 
ÀE = tps — ones = (-92—-156)-(+173—-156) =-265[#s] (49.166) 


Donc, soit il y a d'autres effets, de l'ordre de la Relativité Générale, qui devraient être pris en compte pour 
expliquer les 67 [ns] de différence par rapport à l'expérience, soit il s'agit d'un problème de précision des 
appareils de l'époque. 


Au fait, nous verrons une étude détaillée de cette expérience dans le chapitre de Relativité Générale et 
nous verrons que les valeurs théoriques sont alors en très très bon accord avec les résultats expérimentaux. 


2.7.1. PARADOXE DES JUMEAUX 


Nous pouvons déjà considérer le fameux paradoxe des jumeaux dans le cas de la relativité restreinte pour 
montrer que cette théorie ne s'applique pas aux systèmes non inertiels. Il s'agit d'un approche grossière 
(sachat que la manière rigoureuse sera abordée dans le chapitre de Relativité Générale). 
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Considérons une fusée décollant au temps t nul de la Terre et accélérant à 20 fois l'accélération de la 
gravité terrestre g jusqu'à une vitesse de croisière 90% de celle de la lumière c. Supposons que la fusée 
continue à cette vitesse pendant une année terrestre et décélère avec la même intensité pour reprendre son 
voyage vers la Terre et accélère à nouveau pour lors de son approche vers le Terre décélérer encore une 
fois pour avoir au final une vitesse nulle. 


âÂv=a.At=20g(Ar..)=0.9c = Ar... = ta sd 21.35.10 & 15.6 jours (49.167) 
. #6 A20g VY20-10 


Ainsi, le temps propre passé pour un terrien resté sur Terre est au total de: 


Âér = 15.6-4+365.22 792.4 jours (49.168) 


Pour le voyageur dans la fusée, le temps propre pendant les phases d'accélération sera donné 
grossièrement par: 


2 2 
| v | 1 , 2 | 1 2 | & ,2 _ 
da f = ae Fa dé = 7) dé = D dé (49.169) 


Soit en intégrant (en utilisant la primitive usuelle démontrée dans le chapitre de Calcul Différentiel Et 
Intégral) pour une des phases d'accélération de la fusée cela donne: 


(49.170) 


= 113.105 13.1 jours 


Et le temps propre pour la partie en vitesse de croisière constante: 


365 Î 2 365 Î 365 Î 
Atroisière,f = | 1-—dtz [ Vi-08i4æ=4019 [ &2159.1 jours (19171) 
0 9 0 0 


Et donc le temps propre total dans la fusée est alors: 
At, =13.1.4+159.1.2=370.6 jours (49.172) 


Donc comparé à la personne restée sur Terre, celle qui était dans la fusée à vieilli environ deux fois 
moins!!! Il s'agit d'un paradoxe (plutôt un "sophisme" en réalité) car on ne peut appliquer la relativité 
restreinte à des référentiels non inertiels. Il n'empêche que même avec la Relativité Générale, il y a une 
différence de temps! 
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2.8. VARIATION RELATIVISTE DE LA MASSE 


Bon d'abord attention le titre est abusif par tradition! Nous verrons un peu plus loin pourquoi. 


En attendant, imaginons une collision frontale entre deux objets identiques (1), (2) ayant dans le 
référentiel &, des vitesses égales mais opposées. Nous supposerons que cette collision est élastique, c'est- 
à-dire que l'énergie cinétique et la quantité de mouvement sont conservées. 


Avant le choc, les composantes des vitesses des objets (1) et (2) sont: 


u u 1 
-| | 2-| | | (49.173) 
" Va Yi 


comme indiqué ci-dessous: 


Figure: 49,5 - Configuration pour l'étude de la variation relativiste de la masse 


Après le choc, nous avons: 


u' l u U: 7j 
D a L (49.174) 
La! Yi Va V3 " 


Nous allons maintenant faire la transformation de Lorentz suivante : 


- Nous nous donnons un autre référentiel R et supposons que les référentiels & et R sont en translation 
uniforme de vitesse , selon l'axe OX dans le sens positif (c'est-à-dire dans la même direction et à la 
même vitesse horizontale que la particule 1). 


- Pour notre particule 1 sa trajectoire est devenue telle qu'elle ne présente pas de vitesse selon l'axe OX. 


Allons-y! Plaçons-nous dans un référentiel R qui se déplace par rapport à À, avec la vitesse 4, suivant 
OX, les composantes des vitesses dans ce référentiel sont avant choc: 


D Ü, 
1= 2 = (49.175) 
F F; 


et après le choc: 
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) #4) 


(49.176) 


Nous avons donc trivialement dans le référentiel R: 


U=U=0 Fi=- U=U, V'h=-#, (49.177) 


mais en appliquant la loi de composition des vitesses démontrée plus haut: 


pris CR 
FA 1-3 (49.178) 


e? 


pour les composantes de l'axe horizontal nous avons toujours dans le référentiel R 


Ü,= 0 
Ua —U 4) — 4 2u 
ÙU, = 2 = " situ : : =-—— (49179) 
1- 21 1 1/#1 LT 
F3 me EE 


et pour le mouvement vertical, nous avons vu plus haut que: 


LU y. 
Vu = ca 


y i-Lre),) (49.180) 


Ainsi, il vient: 


r(- (me Ja) (1-uf fe?) (1-u? 1e?) TE 1 
ARR RE à 1 (49.181) 
y(1-(m/c}u,) r(1 mule?) Y j,4 
€ 


En passant de À, à R, la composante suivant y de la quantité de mouvement totale doit rester nulle 
(comme c'était le cas dans À, initialement). Or: 
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% RS | 
tr : 2 ee rh 
ui Yi, (49.182) 


Pour sortir de cette impasse, il faut admettre que les masses respectives #,#2, des objets (1) et (2) ne 


peuvent être identiques dans R. Alors cela nous amène à imposer 
l 


CE | MV, 
bp = s”bp|- 2 2 
y ui y uŸ (49.183) 
ne: 1+— 
€ € 
ce qui entraîne: 
2 
Re 
2 
- x (49.184) 
LL | 1-1 
e 


Dans R, le carré de la norme des vitesses des deux objets donne 


| 2 
du? +v? LP Au? + 
_ ne : Û 4] (49.185) 


2 2 _ = 
is u? 1 13Ÿ 
14% 4 1+ a} #2 
ë € 
La dernière relation peut s'écrire 
2 2 2 2 2 
U2 F 1 u? ue? y? ue? 2 u? y? u? 
+] 24214219 LT 2e LT i- LT + Li - LT (40186) 
À ue ee E me = pe À 
de sorte qu'après réarrangement et factorisation 
2 2 
U3 +} uf u | (5 
nr ES) sf) TI) aie 
€ € € 
Soit: 
3% 
1+ L Fr 
#] Tr r 
FA VÉS 5 7 “5 (49.188) 
-“ -Zt% 
wi e? 


où nous avons posé: 
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1- PF = U3 +2 (49.189) 
c° c? 
Nous trouvons ainsi: 
2 
1+ … r? 
Li 
DE == (0190) 
#4 1-1 F3 FO 
ec? 
Nous poserons maintenant: 
T = el =m(T =1)=#% (49191) 
2 1 


où # est évidemment la masse au repos de l'un ou l'autre des objets identiques (1) et (2). 


Le raisonnement que nous venons de faire sur un exemple simple montre que l'inertie (et non la masse!) 
d'un objet semble dépendre de sa vitesse v dans un référentiel donné. Au fait, pour être plus exact, c'est le 
facteur de Michelson-Morley qui varie et non pas la masse en elle-même car celle-ci est un invariant 
relativiste! 


D'une façon générale, #4 étant la "masse au repos": 


ne 
y? 
os 


(49.192) 


Puisque la masse est donc fonction de v (en apparence), certains physiciens notent la masse au repos 
comme une fonction, c'est-à-dire: m(0). Mais il est plutôt d'usage de la noter #4 afin de ne pas avoir trop 
de parenthèses dans les développements... 


Ainsi, le facteur de Michelson-Morley tend vers l'infini lorsque la vitesse tend vers la vitesse c de la 
lumière dans le vide. C'est une raison supplémentaire pour affirmer que c est la limite supérieure assignée 
à la vitesse de tout objet matériel, ce qui est conforme à la fois à l'expérience et aux conséquences déjà 
formulées de la transformation de Lorentz. 


2.8.1. ÉQUIVALENCE MASSE-ÉNERGIE 


Sous l'action d'une force F, la vitesse d'une masse m augmente ou diminue sur chaque portion de la 
trajectoire. Le travail de la composante g. peut s'interpréter alors en énergie cinétique E : 
[4 €" 


Dans la théorie relativiste, la masse varie avec la vitesse, donc: 


2 


E =l£: 4 re. 1: À +; …, (49.193) 
<= [ff Mn F7 in Le (av) v 
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L'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral): 


fedb-ab-fbda 


nous donne: 


E, = 2 jme 


{ 
Ven —(v/cŸ Tr 


ca cm PT ed 2. "NP rpe” Etc OÙ 


x=(véc ; lit : û VI- x ie £ 
= 2vé {ce 


2 2 2 
À 
RE + Minc ARTE €) LL +mcf fi (v16) -1) a 
dif f1-(vie) 


mpv? 2. f mnv° + mc? (-(v/e | 


2 
———— + "pc VLC = ————————_—_—— — pe 
De di-(vicf 


+ = 
en mpc? = mc? — mpc? = Ame? 
1 1e) \ hier 


Le gain d'énergie cinétique d'une particule peut donc être considéré comme gain de sa masse. Puisque 
est la masse au repos, la quantité men ES appelée "énergie au repos" de la particule. 
0 


2 
2 


#2 
Nous avons donc: 


E =mc? - mc? © mc? = E + mc (49.196) 


où E représente donc l'énergie de mouvement (l'énergie cinétique). 
[a 


La somme: 


E, + mc? (49.197) 
[4 


représente donc l'énergie totale E de la particule en absence du champ de potentiel. Ce qui nous amène à 
écrire: 


2l (49.198) 


me =E +mc =EE=mc 


Finalement nous aurions aussi pu obtenir le même résultat autrement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


DONNE Z-MOÏ UN 


2.8.2. LAGRANGIEN RELATIVISTE 


Les développements suivants vont nous permettre dans l'étude de l'électrodynamique (si ce chapitre n'a 
pas encore été lu), de déterminer l'expression du tenseur du champ électromagnétique ainsi qu'en physique 
quantique relativiste de déterminer l'équation de Klein-Gordon avec champ magnétique. Il faut donc bien 
lire ce qui va suivre. 


En relativité, nous voulons donc que les équations du mouvement aient la même forme dans tous les 
référentiels inertiels. Pour cela, il faut que l'action S (cf. chapitre de Mécanique Analytique) soit donc 
invariante par rapport aux transformations de Lorentz. Guidés par ce principe, essayons d'obtenir l'action 
d'une particule libre. Supposons que l'action soit dans le référentiel O": 


A = fAdé'= met [at (49.199) 


Remarques: 
R1. Le choix du signe moins deviendra évident lors de notre étude de l'électrodynamique. 


R2. La notation Z, au lieu de L pour le lagrangien permet simplement de mettre en évidence qu'il 


s'agit d'un cas d'étude où le système est libre. Cette distinction de notation sera utile lors de notre 
étude de la relativité générale et de la détermination du tenseur du champ électromagnétique. 


R3. Nous ne sommes pas censés savoir à quel type de masse nous avons affaire (masse au repos ou 
inertielle) d'où le fait que dans l'ignorance, nous travaillerons avec la masse inertielle m quitte à 
corriger cette hypothèse plus loin. 


Et rappelons que: 
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dé = res & dt' = J1- v? le? dt (49.200) 
1 {c° 


Dans le référentiel O, nous avons alors "l'action invariante de Lorentz": 
S=-mc|\1-v/eÎdt (49201) 


Donc selon notre hypothèse initiale, nous avons pour le lagrangien relativiste (en l'absence du champ de 
potentiel donc. puisque le système est "libre"): 


LH =-mefi-v/c? (49.202) 


Dans l'approximation non-relativiste Y -# €, nous avons selon le développement de Maclaurin: 


2 
L, = me 1 v/e2 = -me? - 7%) = nc? + sm (49.203) 
C 


Nous retrouvons donc le lagrangien habituel d'un système libre en mouvement mais plus une constante 
(-mc*) qui n'affecte cependant pas les équations du mouvement que nous obtenons en mécanique 
classique mais qui nous sera absolument nécessaire en électrodynamique. 


Rappelons maintenant que le moment généralisé (cf. chapitre de Mécanique Analytique) est défini par: 


a 
Pi = (49.204) 


4; 


Nous allons voir maintenant que cette définition n'est pas fortuite. Effectivement: 


à = 
a 1 1et |» -me à l= le | FAC bé 
dv dv de 1-v?{c? ; 
(49.205) 
FIV 


L'hamiltonien (cf. chapitre de Mécanique Analytique) vaut: 
# 
HQ,p:)= Dir: - EGi.&) (49.206) 
il 


ce qui donne: 
2 2 


MC 
Ho = 0 pe me = D 5207) 
\f1-v? {0° 1-v?/c? 


L'hamiltonien est dans ce cas égal à l'énergie totale de la particule. Son expression nous conduit à changer 
quelque peu notre hypothèse initiale et finalement à écrire ##, au lieu de m dans l'expression de l'action S. 


Ainsi, nous avons finalement: 
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1 = -m,c 1 {ci 


(49.208) 


et: 


À = —=—@© = ME | (49,209) 
1 v°/c? 


Dans l'approximation non relativiste v# €, À, devient avec un développement de Maclaurin (cf. chapitre 


sur les Suites Et Séries): 


1 
H, = mc? + sm (49.210) 


Nous reconnaissons l'énergie cinétique usuelle, plus une constante: l'énergie au repos. Ce qui correspond 


bien aux calculs que nous avions faits avant où nous avons obtenu: 


AQ 9 
meo=E +me=E—EÆ=me (921 


2.9. QUANTITÉ DE MOUVEMENT RELATIVISTE 


L'énergie totale E et la quantité de mouvement p=mY d'une particule peuvent donc prendre n'importe 


quelle valeur positive (si la vitesse tend vers la valeur limite c, la masse s'adapte pour que le produit 
p=mv ne soit pas borné). 


Dans l'expression de E , nous pouvons remplacer la vitesse y? par une fonction de p°: 


E? 2 
p° = y y? — y? = y? =? (49.212) 
C 
introduit dans: 
2 
‘C 
E=m'c? = = — (49.213) 
1-v' {ce 
nous avons: 
2 2 


: és a RL 


| E 
1-(p'et)/(Æc°) NE re (49.214) 


BR pie eme = - pe = mé ct 


d'où (nous reviendrons sur cette relation de la plus haute importance lors de notre démonstration de la 


relation d'Einstein): 
E = cé ct +p?| (49215) 
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Nous n'avons pas gardé la partie négative de l'égalité précédente car elle n'a aucun sens en physique 
classique. Cependant, lorsque nous étudierons la physique quantique relativiste, il s'avérera indispensable 
de la préserver sinon quoi nous arriverons à des absurdités. 


Cependant, nous pouvons bien évidemment écrire cette dernière relation aussi sous la forme: 
E? = mêct + pe? 
ou encore (beurk!): 
? = (Em) + (Etc) 


En d'autres termes, l'énergie totale d'une particule en mouvement est égale à son énergie de masse 
additionnée par son énergie cinétique (rien de fondamentalement nouveau). 


Cette relation présente deux cas limites où nous pouvons réduire la formule: 


C1. Pour une particule au repos (p=0), nous pouvons réduire l'expression à Æ =#,c° (en omettant 
l'énergie négative…pour l'instant). 


C2. Nous pouvons appliquer l'équation à une particule sans masse de manière à éliminer le premier terme, 
ce qui nous donne alors £ = pe .Un photon, par exemple, a une masse nulle au repos mais il n'est jamais 
au repos... Par définition, c'est un quantum d'énergie, son énergie cinétique n'est donc jamais nulle et il a 
donc une masse correspondant à son énergie cinétique. Ainsi, une particule de masse nulle au repos se 
déplace à la vitesse de la lumière, quel que soit le référentiel choisi! À l'inverse, une particule ayant une 
masse au repos non-nulle ne pourra jamais atteindre la vitesse de la lumière dans aucun référentiel. 


Remarques: 


R1. Comme nous le démontrerons plus loin (voir la "relation d'Einstein"), à partir de la définition de 
la loi de Planck, nous pourrons écrire £ = pe = kv. 


R2. La masse du photon peut difficilement être non nulle! Effectivement, la théorie quantique serait 
alors fausse dans le cas contraire. Or, elle n'a jamais été mise à défaut à ce jour (. 
). On aurait également un léger changement sur la loi des forces 
électrostatiques et gravitationnelles selon le potentiel de Yukawa ( 
jet cela se remarquerait. 


Cherchons maintenant les relations entre p et p' ainsi qu'entre E et E’, pour qu'il soit possible à O'd'écrire: 


E'=6 fm + p° 


Nous commençons alors à nous débarrasser de la racine carrée: 
É4 3, 2 à _Æ 2,3 
E=cÿm'e tp pp -—=-m'ec 


€ 


Si O écrit: 
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2 


E | 
pi + r, + pi - — = -mà:c?  (49.220) 
€ 
O' doit pouvoir écrire: 
PatPhtpi- "mc (49221) 
Le 
Nous avons donc: 
2 2 2 FE E 2 "2 d 
Prt Py te” 7 = P3 +2, +p (49.222) 
[eg € 
Si nous comparons: 


Rep. PR, 2mD ét CEE (49.223) 


E 
€ 
nous obtenons des expressions semblables à celles utilisées pour les transformations de Lorentz des 


composantes spatiales et temporelles. Nous pouvons alors écrire, par similitude, que les transformations 
pour la quantité de mouvement et l'énergie sont dès lors données par: 


_. Æ£ rs £ 
: PV : Py TV em: 
P t 
" 1-v° {0° 1-v {0° 
PyT Py © Py  Py (49.224) 
Ps = Ps © Pr Pr 
g'- E-v'p, _ Etv'p, 
1-v° /c° 1-w /c° 
À nouveau, si nous prenons: 
1 


F— te (49.225) 


toujours avec Ê vie. 


Nous avons dès lors en exprimant toutes les relations précédentes de transformation dans les mêmes unités 
en se souvenant que Ë =2'c: 


PL 'c=y(pct8'E" 
Pepe 

Ps C=Pu'e 

E=y(£"* £#'c'p) 


(49.226) 


Nous pouvons alors définir une matrice telle que: 
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E Y 6 
Pre . YË y 

P,C 0 0 

Pc 


oo mm © © 
m1 © © © 


E' 
P # A 
(49.227) 
P FA 
P s La 


0 0 


où nous retrouvons la "matrice de Lorentz" ou "tenseur symétrique de Lorentz" Z ee 


Le vecteur: 


E 
TP Pre] | = my(v)(c,v)| (49.228) 


est quant à lui, appelé le "quadrivecteur d'énergie-impulsion" ou plus simplement "quadrivecteur 
impulsion". Son utilité est que sa valeur est conservée, lors d'une réaction nucléaire. Si nous additionnons 
ces vecteurs sur toutes les particules (sans oublier les photons) avant et après la réaction, nous trouvons 
les mêmes sommes pour les 4 composantes. 


Remarques: 


R1. La transformation inverse étant effectuée bien évidemment avec la matrice inverse que nous avons 


déjà exposée plus haut. 


R2. Nous utilisons en optique relativiste le quadrivecteur (æ! c,k] , où & est la pulsation de l'onde et 


& le vecteur d'onde (cf. chapitre de Mécanique Ondulatoire ou Optique Ondulatoire). Ce 


quadrivecteur est l'équivalent pour une onde électromagnétique du quadrivecteur (£ fé: P) pour une 


particule, multiplié par la constante de Planck à = k/ 2x. En effet, la dualité onde-corpuscule (cf. 
chapitre de Physique Quantique Ondulatoire) attribue à une onde une énergie: 


E = kv = . =h@ (49229) 
237T 


et une quantité de mouvement dont la norme est: 


E & 
p=—=h—=h#% (49230) 
€ [a 


Revenons sur le relation suivante qui est central dans certains domaines de la physique quantique: 


Soit: 


E? , 
p} +ps + pi -—= mp "ec? (49.231) 
Le 


2 
E 
ru | p? + + p} | = mi c? (49.232) 
[a 
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Ce qui peut s'écrire sous forme vectorielle (forme très courante): 


2 
- | FF = mêcl (49.233) 
C 


Cette dernière relation nous sera très utile dans le chapitre de Physique Quantique Relativiste pour 
calculer l'énergie de photons virtuels d'échange. 


Pour les photons, puisque la masse est nulle, nous avons: 
2 
E 2 
7 IP =Û0 (49.234) 


2.9.1. RELATION D'EINSTEIN 
Suivant le principe de relativité, nous souhaitons que la relation entre la quantité de mouvement et 
l'énergie d'une onde électromagnétique s'écrive de la même manière pour deux observateurs d'inertie en 


translation l'un par rapport à l'autre: 


Si O écrit: 
alors O' doit pouvoir écrire: 


Reprenons la première relation ci-dessus et mettons-la au carré sans oublier que le photon à une masse 
nulle #, = 0. Alors: 


EE? = ctm$ + pe? (49237) 
et comme ## = Ü: 
E = pc (49.238) 
Étant donnée connue la relation de Planck (définie en thermodynamique): 
E = hv 


nous sommes amenés à écrire la fameuse "relation d'Einstein" que nous retrouverons très souvent en 
physique quantique ainsi qu'en thermodynamique: 


kv 
p =—| (49.239) 
€ 
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2.9.2. FORCE RELATIVISTE 


Suivant le principe de la relativité, nous voulons que la relation entre la force et la quantité de mouvement 
s'écrive de la même manière par deux observateurs d'inertie en translation l'un par rapport à l'autre: 


Ainsi, si O écrit: 


Ê= (49.240) 
Ê 
O' doit pouvoir écrire: 
+ dd 
F-7 (49.241) 
fà ! 


La relation entre À et F' est assez compliquée dans le cas général. Nous nous limiterons ici au cas 
particulier où un corps est momentanément immobile dans O' et où donc l'observateur O' ne tiendra 
compte que de la force F' qu'il applique. Il l'appellera par ailleurs "force propre", car il n'a pas à se 
préoccuper d'autres forces (comme une force centrifuge, par exemple). 


Il faut substituer p' et t par p et t dans: 


Ûl do ' : 
Pr gr Pr pr Ps 


æ, ; ; (49.242) 
dt" 7 d'° * à 
Puisque: 
dt _ 1 (49.243) 
d' -w1c 
nous aurons: 
Û 1 ee — 
gp dx _ dt dps _ dt à Pa 72 | & à 1 Le 2) 
M nue ml on al ml Ds am 
d' di‘ dt dt'dt| h_,2;,,2 | di'dt h_ Ze c 


2 | 1 al v£)- 1 1 af, 4 (49.244) 
& Î-v2 re? &\°7 2 21e NES Hit à 


1 af, _,E)_ 1 [dr _v 48 
1-v? /c? dt : c? 1- vw? /e? d£ c? dt 


Nous avons par ailleurs vu que: 


dE 
Em sm = En 0 
dé dt dé 


‘y (49.245) 


Il reste donc: 
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1 
FE = ——— ( -xAy) = À, (49.246) 
C 


a 1-v?{c? 


La composante de la force est donc invariante dans la direction du déplacement. 


Pour les directions y, z perpendiculaires au déplacement: 


F' es  ” ces de. À (49.247) 
7 dt' dt' dt fe dt' dit dt fie 


En résumé: 


F'=FRSE =F", 
F 
F'=———2—S Fr, =F' Ni-v/c 
1-v° {0° (49.248) 
F!, ET = F'fi-v ic 
lv ie 


Cependant, pour passer d'un référentiel à un autre, il vaut mieux utiliser le "quadrivecteur force" défini 
comme la dérivée du quadrivecteur impulsion par rapport au temps propre: 


dp" _dtdp" _ dp'_ d([£E Foÿ à 
ele] 7,F || (49240) 
C 


df'  dt' di dt dé 


_ 
A (49.250) 
dé 4 


I 
"jt 
La] 
<H 
"tj 

I 


2.10. ÉLÉCTRODYNAMIQUE RELATIVISTE 


Avec un spectromèêtre de masse, nous établissons que le rapport m/q de la masse m d'une particule par sa 
charge électrique q varie de la même manière que la masse m lorsque la vitesse v de la particule varie: 


"y À Go _i "0 mi 


EE  ———————— | (49251) 
di-vie GAf-v'ie? Go 


m 
q 


Ainsi, il vient que: 
4 = (49.252) 


La charge d'une particule est donc indépendante de sa vitesse comme nous l'avons démontré dans la 
section d'électromagnétisme (cf. chapitre d'Electrodynamique) lors de la détermination de l'équation de 
conservation de la charge. 


Considérons maintenant deux charges q et Q immobiles dans le référentiel O' en translation à vitesse v par 
rapport à O : 
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Z FAN 


Figure: 49.6 - Configuration pour l'étude des transformations des champs électrique et magnétique 


Nous allons nous restreindre au cas où la vitesse Ÿ est parallèle à l'axe OX: 
v =(v,,0,0) (49.253) 
et nous notons le vecteur à l'horizontale pour économiser un peu de papier. 


La charge Q est placée en O' et elle est donc immobile pour O'. L'observateur O' conclut qu'une force 
électrostatique: 


F'=g"£" (49254) 
agit donc sur la charge témoin q placée en F'. 


D PTS LC Me A NT ul (49.255) 


L'observateur © voit également un champ électrostatique À en 7 , mais il voit aussi que Q est en 
mouvement selon l'axe OX. Il en déduit donc l'existence d'un champ magnétique £ en > orienté dans le 
plan YZ: 

B= (0,8,,8,) (49256) 


Il mesure donc la force (cf. chapitre de Magnétostatique) de Lorentz (supposée connue): 


Ê = q(Ë +5x Ë) (49.257) 


Mais: 
v, 0 0-0 0 
VvXB=|01X|B8,|[=10-v,281=|1-v8 | (49250) 
( B v,B, vB, 
Donc: 
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F,=q'E, 
F,=q'CE, -vB) (49259) 
FE, =q'(E, +vB,) 


Nous avons vu maintenant: 


F,-R=QE, 
Fr, : Fr, _4' te, — vE,) 
vie i-vie 
p .__Æ .4&+v8) 
Fo Mi-wie di-v/c 
(49.260) 


La comparaison des expressions ci-dessus donne les transformations relativistes du champ électrique: 


E, -vB, E",+vB", 

E", _ Ed , = } 
1-v2/e? 1-v2/e? | (49.261) 
ÆE +vB E' -v£ 


z lé 


= 7 SE 
: 1 - v° {0° : 1-v° {0° 


Comme pour la transformation de Lorentz des composantes spatiales et temporelles, nous avons obtenu 
les transformations inverses en échangeant les champs et en considérant que O" voit O reculer (nous 
remplaçons donc v par -v). 


Pour obtenir les transformations relativistes du champ magnétique, nous procédons comme ci-dessous: 
E",+vB", _— 
_. E,-vB,  f-yie * (49262) 
ee  ———— 
\1- v?/01 1 - v? /c° 


Après quelques petites manipulations d'algèbre très élémentaire, nous obtenons: 


B'+v/c?E' 
BD ———" (49263) 
\1-v? {6° 
Nous faisons identiquement: 
E, -vB 
2 == + vB 


pe Er vbs i-ve "(9269 
/ 1-v? {0° \1-% /c° 


Après encore une fois quelques petites manipulations d'algèbre très élémentaire, nous obtenons: 
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B, “vie, 
BE ————— (49265) 


1 - v° /c? 


et ainsi de suite. Nous obtenons finalement: 


B',=B &B =8B" 

gp = +yle ke  - B',-vicŸE 

7 = 7  i-wtie | (49266) 

nur 
1-v?/c? 1-v?/c? 


Étudions maintenant le comportement du champ électromagnétique d'une charge en mouvement: 


Soient deux référentiels parallèles O et O', en translation à vitesse constante v selon l'axe XX": 


Fr =vecteur OP dans XYZ 


Z FA 


Figure: 49.7 - Configuration pour l'étude de transformations électrodynamiques 
où une charge immobile Q est placée en O". 


Il est clair alors que l'observateur O mesure Ë'= (0 partout et qu'au point P du plan X'Y', en 
F'=(x",y" 0) il mesure le champ électrostatique (cf. chapitre Électrostatique): 


Ê'=(£",,£",.0) Er = (x,7,0) (49.267) 
Û Û 


Si l'observateur O est informé des valeurs de £' et de Z'= 0, il peut les introduire dans les transformées 
relativistes donnant le champ électrique Æ qu'il observe: 


E, =£", 
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. E',+v8, L E’, 

À di-viet 1-6 

na re Es 

. di-viet 4-2 fc? 
(49.268) 


Pour écrire une expression du champ Æ au point P, l'observateur O doit déterminer, à un instant t de son 
temps local, les composantes du vecteur 7 = (x, y, Ü) qui sépare le point P de la charge Q (en sommant les 
vecteurs positions de ces deux derniers points matériels). 


Les coordonnées du point P et de la charge Q qu'il voit dans le plan XYZ sont données par les 
transformations de Lorentz habituelles: 


_ x'+ vi . 
Rp | et À 


vÉ 
————— , "0 = | ————…— —/, 
1-v 10° d ee 


Il en déduit donc facilement, par sommation les distances x, y. 


0, ) (49.269) 


Une autre méthode, plus simple, est qu'étant donné que la composante x est une longueur, elle subit donc 
les transformations de Lorentz et: 


F=(x,3,2)= (x i-vtfe,y0) (49270) 


Car rappelons-le: 


1 x L 
= ——— et y'=} (49271) 
1-v?/0? 


La transformée relativiste du champ électrique donne alors: 


E,=8,- + pe 7 
j | AEsr ° ARE © N1-v?/c? 
(49.272) 


É 1-v? {6° 1-v? fc? Arr” A vie 
et: 
E,=Æ',=0 (49.273) 
Écrit sous forme vectorielle: 


g-_ LR? 


1 
713 (49.274) 
AE nl wir 


Il nous faut encore déterminer comment exprimer r' en fonction de r : 
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2 2 5; 0 3 2 _# 27.21.32 
pa = gap T4 per Ave) Qr Po 
1-v fe 1-w /c 1-w {oc 


(49.275) 


car (théorème de Pythagore): 


2 


x? +y?=7r (49.276) 


L'écriture se simplifie si nous utilisons l'angle formé par le vecteur champ électrique et l'axe OX. Nous 
notons alors 8' dans O'et 8 dans O les angles donnés par: 


tan d'= y{x' et tan g = y/x (49277) 
avec & > 8" à cause de la dilatation des longueurs selon l'axe OX. 
Nous éliminons y avec: 


2 St (v?{e?)sin? 8]? 


y =r? sin? 8 PT (49.278) 
vw fc 


Ainsi, le champ électrique Æ que voit O est donné par: 


(49.279) 


Le facteur contenant sin 4 montre que le champ électrique Æ d'une charge en mouvement n'a plus la 
symétrie sphérique. Il dépend de la direction du vecteur F. 


À distance égales, le champ électrique est plus intense dans la direction verticale à celle du déplacement 
(8 =x/{2) que dans la direction du déplacement de la charge (8 =0). 


Si v=0, nous retrouvons par ailleurs l'expression classique et connue: 


Q'rF 
AE r 


E = 7 (49.280) 


Remarque: Rappelons que nous avons effectué (et continuons dans ce sens) ici une étude d'une charge 
en mouvement rectiligne uniforme, c'est-à-dire à vitesse constante. 


Pour trouver maintenant l'expression du champ magnétique £, nous introduisons: 
B= (DD ,B)=-000ets,=-6, 
CRE 1 2 
E',=Edi-wic etE',-E-v/c? 
(49.281) 


dans: 
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B',-vE"{c" _B,tvE'ie 


x — x? =———— .b, nr 
L 1-6? 1-v° {0° 


(49.282) 


Nous obtenons dès lors: 


vE vE 
B,=0,B,=-—2,8, =—7 (49.283) 
€ [es 
qui sont les composantes de: 
S LE 
B=ÿx— (49284) 
ec? 


Pour connaître £ en fonction de F , nous substituons l'expression obtenue pour £ : 


_.27 2 
B = o mar. (49.285) 


c'e 4° [1- (7 /e) sin? 9f"* 


Dans le cas où la vitesse est faible, le terme relativiste tend vers 1 et le champ % d'une charge Q se 
déplaçant à la vitesse v devient: 


T'V XF (49.266) 
car comme nous l'avons dans le chapitre d'Électrodynamique: 4 = 1/(c°£,) 


Remarques: 


R1. En chaque endroit, les lignes du champ £ sont contenues dans un plan perpendiculaire à la 
direction de déplacement de la charge Q (produit vectoriel oblige). 


R2. Si la charge en mouvement est vue comme un dQ attaché au point O', nous pouvons interpréter 
son déplacement à vitesse v comme un courant 1 en un point du référentiel O où se trouve O'. Ainsi: 


agp Fer ar 
4 sa (49.287) 
- à 1 . 
= dB = 2 5x p = 0 exp 
4xr 


Cette dernière relation est connue sous le nom de la "loi de Biot et Savart" et nous la retrouverons au 
début de la section traitant de l'électromagnétisme. Cet état de fait valide encore le modèle relativiste. 


Il est intéressant de se rappeler qu'une particule chargée en mouvement sera vue dans le référentiel de la 
particule comme n'émettant aucun champ électromagnétique (il y aura juste un champ électrostatique). Ce 
qui n'est pas le cas pour un référentiel au repos. Il y a donc ici une sorte de contradiction contre-intuitive 
flagrante. 
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Mais cela pose alors un autre problème, dans un référentiel en mouvement accéléré, une particule chargée 
émet normalement un rayonnement d'accélération, ce rayonnement en mécanique quantique doit 
s'accompagner forcément de l'émission d'un quanta, qui lui existe ou n'existe pas (un moyen terme n'existe 
pas). L'existence même des photons serait donc purement relative. Et pourtant c'est le cas! Certaines 
particules n'ont qu'une existence relative. La réponse compliquée, c'est donc de savoir ce que sont devenus 
les photons. 


Mais là, nous touchons à la limite de ce que nous maîtrisons parfaitement dans la physique de la fin du 
20ème siècle, car nous parlons de référentiels accélérés (ce qui implique d'être en relativité générale et 
non restreinte) et de théorie quantique des champs. Le cadre rigoureux pour traiter ça (qui engloberait une 
gravitation quantique) n'existe pas encore. Mais un premier pas a été franchi avec le développement de la 
théorie quantique des champs en espace courbe. 


2.10.1. TRANSFORMATION DU TENSEUR DE CHAMP 


Nous avons vu et démontré dans le chapitre d'Électrodynamique que l'ensemble du champ 
électromagnétique se résumait au tenseur du même nom. Il serait alors bon de regarder comment se 
transforme ce tenseur et s'il le fait correctement relativement aux résultats obtenus plus haut. 


Considérons la transformation (où le tenseur du champ électromagnétique est en unités naturelles!!!): 


FA LLRF% (49.288) 


avec le tenseur du champ électromagnétique en composantes contravariantes dans la métrique de 
Minkowski + —--— : 


0 -Æ, -£, -E, 
F# = Ë 0 "Ëe 5 (49.289) 

5, 2 Du FH 

RE: CR - À 0 

et aussi par construction: 
0 —E, -E, —E, 
1 0 _B: B: 
F'A = L . (49.290) 


Prenons, par exemple, la vitesse parallèle à l'axe OX, alors nous avons démontré plus haut que: 


y —#8y 0 0 
— 0 0 
L = #7 ? (49.291) 
(l (] 1 0 
0 (] 0 1 
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Soit, donc: 


= - 1 1 _ . 

H=7,0=-#.&=-87.L=Y (4929) 
où comme nous pouvons le voir, il est souvent d'usage dans le domaine de la relativité restreinte et de 
l'électrodynamique de numéroter les composantes des matrices/tenseurs à partir de 0 (au lieu de 1 pour 


tous les autres chapitres du site). 


Nous calculons les transformées (se rappeler que le tenseur du champ électromagnétique est 
antisymétrique!): 


FUEL LG = GIE + LG e + QUE +0 = LIEN + HF 


(49.293) 
= & y? #10 PS = & = pl 


Nous en déduisons donc, pour le champ électrique (ce qui correspond parfaitement à ce que nous avions 
obtenu plus haut): 


E,=EÆ, (49294) 
Nous faisons un second calcul pour la composante perpendiculaire: 
FPaLLEEFS = LEFT = ES + LE (49295) 
d'où: 


-E',=y(-8,+88,)= 8, =7y(£,-v8,) (49296) 


ce qui correspond à nouveau parfaitement à ce que nous avions obtenu plus haut (en unités naturelles, ne 
pas oublier que nous avons alors Ë# = v)! 


La vérification se fait de même pour le champ magnétique: 
FF =LLFY=F"=—B=8B, (4297) 
et: 
FV = LISE = LES = LE +LEF = YF -Yy8FT (49298) 


ce qui donne (en unités naturelles, ne pas oublier que nous avons alors Ê = v)!: 
-B! = [= + 8 : = B,=y(8,-vE,) (49200) 


etc. 
3. ESPACE-TEMPS DE MINKOWSKI 


Nous avons démontré plus haut que: 
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£ 1 


É——— (49300) 
V1-v?}6? 
Écrivons cela sous la forme: 
”  . 
—=i-— (49301) 
£ € 
Lo 2 
Multiplions les deux membres par (cé) à 
Bel  , vctfi : 
—@— =c tt -—}—— (49302) 
Ë [a 
ce qui nous donne: 
d a.à,2 5,3 


(49.303) 
Siv=c, l'équation s'annule: 
12, ,2 


£“'c* =0 (49.304) 


Ce résultat traduit, que les dimensions d'espace et de temps sont comme arrêtées dans le référentiel 
relativiste, car la vitesse relative de l'objet est égale à celle de la lumière! 


Imaginons maintenant qu'un faisceau lumineux soit émis à l'instant £ = Q et se propage depuis l'origine du 
référentiel. Nous savons que dans l'espace-temps (application du théorème de Pythagore dans l'espace 
euclidien à trois dimensions) la distance parcourue par le photon lumineux est: 


2 2 2 
\ + y + 
ce = SO UE (49.305) 
Ë 
En changeant t de membre et en portant le tout au carré pour supprimer la racine, nous obtenons: 


CÉ = Je + y +7 8 cf =x+y +7° 


(49.306) 
ct? “(+ + y +2) =0 


Remarque: Nous pouvons assimiler cette équation à la représentation d'un front d'onde sphérique d'une 
onde lumineuse se propageant à la vitesse de la lumière (voir l'équation d'une sphère centrée à l'origine 
dans le chapitre de Géométrie Analytique). 


Considérons maintenant deux événements de coordonnées (x,»,2.4) et (x,3:,Z:,{) et pour éviter la 
confusion changeons de lettre s5:= x. Nous pouvons dès lors écrire l'intervalle spatio-temporel tel quel: 


Gas) =e"(e 4) L (Ca E a) +02 -n} +(2 -z)) (49.307) 


En passant à la limite, nous obtenons la forme quadratique: 
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ds? = c°df? - Cs +dy? + d”) = c?dt? - dE? | (49.308) 


qui a la même forme et même valeur quel que soit le référentiel considéré. L'intervalle infinitésimal 
d'espace-temps 4s? entre deux événements infiniment voisins est donc un invariant relativiste que nous 
appelons souvent "abscisse curviligne d'espace-temps"; c'est l'intervalle d'espace-temps ou, comme le 
disait simplement Einstein, le "carré de la distance"... Le fait que cette grandeur puisse être positive, 
négative (!) ou nulle est lié au caractère absolu de la vitesse de la lumière (nous y reviendrons juste après). 


Nous pouvons aussi maintenant nous intéresser au caractère relativiste de cette métrique. Si elle est 
invariante, c'est qu'elle doit aussi l'être par les transformations de Lorentz. Nous disons alors que "la 
métrique est invariante par transformation de Lorentz". Une telle transformation peut être trouvée en 
s'inspirant de celle utilisée pour le tenseur du champ électromagnétique (voir plus haut). Le lecteur 
vérifiera sans peine en s'inspirant de l'exemple détaillé du champ électromagnétique que pour le tenseur 
métrique, nous avons la relation: 
Û = JA TV ( 2( 

Ro = Lelsny (49.309) 
L'abscisse curviligne peut s'exprimer aussi par la norme du quadrivecteur déplacement que nous avions 
défini plus haut comme étant (£'£,x, y,z). Effectivement, la norme (cf. chapitre de Calcul Tensoriel) 
s'écrit en descendant les indices à l'aide de la "métrique de Minkowski" 7, ou "métrique pseudo- 
riemannienne": 


ds? = dx" (dx )= dax, = Cdt? - dx? - dy - dé? (49310) 


avec par définition (nous reviendrons là-dessus dans les détails au début de notre étude de la relativité 
générale) la "matrice de Minkowski": 


Re: 
D 
Fe ” 0 -1 0 (49.311) 


où comme d'habitude sur ce site nous faisons l'abus de notation (déjà mentioné dans le chapitre de Calcul 
Tensoriel) de ne pas mettre 7, entre crochets (puisqu'un tenseur et sa forme matricielle sont normalement 
deux choses distinctes en toute rigueur). 


Si nous mettons les deux relations suivantes en correspondance: 

cf? 5 + y +2) =0 et ds? = c?: di? - (dr + dy? + dr) (49.312) 
nous avons alors 4s? = Ô lorsque que les deux événements sont reliés à la vitesse de la lumière. 
De plus, si nous posons dx? + dy? + dz? = dr° nous pouvons alors écrire: 


ds? + dr? =c?df? (49.313) 
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Ceci n'est rien d'autre que l'équation d'un cône (cf. chapitre de Géométrique Analytique) d'axe d'ordonnée 
e*dt?… le fameux "cône d'Univers" (auquel nous consacrons une étude plus loin). Tout événement est 
donc par extension dans ce cône et l'évolution de tout système peut donc y être décrit (par sa position 
spatiale et temporelle), par ce que nous appelons sa "ligne d'Univers". La ligne d'Univers d'une particule 
est donc la séquence d'événements qu'elle déroule durant sa vie. 


3.1. QUADRIVECTEURS 


Nous venons de définir ce qu'était la métrique de Minkowski, nous pouvons maintenant définir 
correctement le concept de quadrivecteur que nous avons déjà abordé sans toutefois toujours savoir ce que 
l'on faisait. 


Définition: Dans un espace à quatre dimensions de type Minkowski, quatre grandeurs (&£,. K, FR) 


(peu importe l'ordre des termes pour cette définition ou que les indices soient des chiffres ou des lettres 
correspondant aux quatre composantes spatio-temporelles) forment un quadrivecteur covariant si elles se 
transforment suivant la transformation de Lorentz: 


K,=y(K, -8K,) K,=7(K,.+8K,) 

£, | ” F5 | # (49.314) 
K=Kk K =k . 
K,=y(K -8K,) K=7(k+8Kx) 


La pseudo-norme d'un quadrivecteur dans un espace de Minkowski à métrique 7, est alors: 
2 2 2 2 : 
KEK = KP(n Et )= K &, “hs (49.315) 


où nous voyons que le quadrivecteur contravariant multiplié par la métrique redonne le quadrivecteur 
covariant. 


La quantité suivante étant invariante par changement de référentiel Galiléen comme nous l'avons vu 
presque tout au début de ce chapitre: 


K,K® = Æ",K' (49316) 


Cette propriété d'invariance par changement de référentiel Galiléen des quadrivecteurs est leur propriété 
principale. Ainsi, deux observateurs en mouvement relatif uniforme l'un par rapport à l'autre doivent pour 
comparer les résultats d'une même mesure utiliser la norme des quadrivecteurs. De même, les lois qu'ils 
cherchent à déterminer pour être les plus générales possible doivent utiliser ces quantités invariantes! 


Nous pouvons par ailleurs aussi écrire la norme sous la forme: 
K,KF = KK°+KK +KK°+KK° 
2 2 2 2 
(Ko) -(&) -(K) (6) 
2 2 2 2 (49.317) 
EE) ET) | 
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et les quadrivecteurs sous la forme: 


KA=(ROR) Ki={(ko,-À) uo318) 


3.2. CÔNE D'UNIVERS 


La topologie du cône de lumière trouve son origine dans les relations d'antériorité et postériorité des 
événements relativistes, ce qui permet de faire la distinction entre un événement dans le passé d'un autre 
ou dans le futur de celui-ci. 


Les cônes de lumière ont pour objectif principal dans les ouvrages de vulgarisation de la physique 
théorique de schématiser l'histoire d'impulsions lumineuses émises en un point de l'espace où peuvent 
régner certaines conditions. Les points sont représentés dans l'espace par une série d'instantanés à divers 
instants 4,4 ,£,etc. (voir figure ci-dessous), le front d'onde sphérique de la lumière grossissant dans 
l'espace. Dans l'espace-temps, le même événement (en bas sur la figure) est représenté par un "cône de 
lumière", dont le sommet est le point d'émission. 


Sur une feuille de papier, nous devons supprimer l'une des dimensions spatiales. Les axes spatiaux sont 
dessinés dans le plan horizontal et l'axe temporel dirigé vers le haut. Les sections du cône aux instants 


4,4 ,t3 correspondent aux instantanés de la représentation spatiale: les fronts d'ondes à deux dimensions 
sont des cercles dont le rayon est celui du front d'onde sphérique à l'instant considéré. Le cône de lumière 
montre en un seul diagramme l'histoire continue du front d'onde d'un signal lumineux. 


CÔNE DE LUMIÈRE 


Figure: 49.8 - Principe du cône de lumière 
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Plus rigoureusement, les "instantanés" dont il a été fait mention plus haut sont appelés des "événements 
ponctuels" et ceux-ci apparaissent instantanés (approximation reposée sur l'optique géométrique) à tout 
observateur capable de les voir. Une collision entre deux particules ponctuelles fournit un exemple 
d'événement ponctuel. Il est tout à fait possible qu'un événement instantané non ponctuel apparaisse 
instantané à un certain observateur mais, à cause de la vitesse de propagation finie de la lumière, non 
instantané à un autre observateur. 


Définitions: 


D1. Nous disons par définition que deux événements ponctuels occupent le même point d'espace-temps 
s'ils apparaissent simultanés à tout observateur capable de les voir. 


D2. L'ensemble M de tous les points de l'espace-temps est appelé "l'espace-temps". 
D3. La frontière définie par le cône d'Univers est appelée "horizon cosmologique" 


Rappelons que si aucune force n'agit sur une particule ponctuelle, nous la qualifions "d'inertielle" ou de 
"libre". Nous disons également qu'elle est en "mouvement inertiel". 


Étant donné le point p, N(p) est une structure géométrique absolue, indépendante de l'observateur. Sa 
composante future sera notée À*(p); sa composante passée N° (») et elle sera représentée par le cône 
suivant: 


Effectivement, rappelons que l'équation de Minkowski est invariante puisque: 
cdt®- (dx + dy"?+dz "= ct? - (dx? + dy? +dz?) (49.319) 


Rapporté à trois paramètres (nous enlevons une dimension spatiale) nous avons, si les événements 
ponctuels sont reliés à la vitesse de la lumière (voir plus haut): 


cd? - (dr +dy?)=0 (49.320) 


Ce que nous pouvons aussi écrire sous la forme: 
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cdt® = dx? +dy? (49.321) 


à comparer avec l'équation d'un cône (cf. chapitre de Géométrie Analytique): 
2 
(ztand) =x?+y (419.322) 


lorsque nous posons c=1 (ce qui est fréquent en physique théorique comme nous en avons déjà fait 
mention de nombreuses fois). 


Donc l'équation de Minkowski peut donc bien être représentée par un cône. 


Remarque:Si nous gardions les trois paramètres spatiaux et l'intervalle de temps constant, le lecteur 
remarquera certainement que nous tomberions non plus sur l'équation d'un cône mais sur celle d'une 
sphère. Il s'agit de la "sphère céleste" où à un instant donné, à sa surface, se créent de multiples cônes 
de lumière. 


La ligne d'Univers de tout observateur qui occupe instantanément p et dont la ligne d'Univers passe donc 
par p lui-même, est contenue à l'intérieur de N(p) défini par un point unique sur sa sphère céleste (celle qui 
est donc décrite par le vecteur d'information - qu'est le photon - dans toutes les directions de l'espace). 
Cela veut dire qu'il peut y avoir, in extenso, autant de rayons nuls (foyers des cônes) passant par p que de 
points sur une sphère. 


L'exemple suivant paraîtra plus évident: 


Figure: 49.10 - Principe de ligne d'Univers avec cône associé 


Comme illustré sur la figure ci-dessus, un événement lumineux au point © de l'espace-temps produit un 
faisceau de photons, tous dans le cône nul du futur O, W*(O (ces photons ont été émis par des atomes 
dans des états de mouvement variés, dont les lignes d'univers ! et l' passent par O, maïs sont entièrement 
contenues à l'intérieur de À/*(Q)). La ligne d'univers n peut seulement être décrite par une particule se 


mouvant à la vitesse de la lumière car elle définit la frontière du cône (nous disons alors que la ligne 
d'Univers est "du genre lumière"). 
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Remarque: La représentation des lignes d'Univers dans la partie inférieure (cône renversé) vient du fait 
qu'un événement peut également avoir un passé... donc le schéma généralise l'exemple particulier. 


Soit ?, la ligne d'univers d'un personnage P immobile (d'où la verticalité de sa ligne d'Univers sur la 
figure ci-dessus) et n celle d'un rayon lumineux ayant pour origine ©. Tous deux résident dans l'espace à 
quatre dimensions et ils se coupent selon un point unique P. Les points O et P se situent sur un rayon nul 
(d'un cône du futur), n, de *(O©). En P, le personnage P voit un flash soudain dans la direction définie 
par n, pour lui la direction de l'événement lumineux (décrite uniquement par sa vitesse donc, ainsi une 
ligne d'univers d'une particule inertielle peut être décrite uniquement par le temps et sa vitesse). 


Un atome dont la ligne d'Univers coupe n au point Q, absorbe un photon de l'événement lumineux O et 
réémet peu de temps après un faisceau de photons. Ceux-ci forment alors à leur tour des rayons nuls dans 


N*(Q), mais seuls ceux de direction n atteindront le personnage P et seront vus par lui au point P. 


Si P se trouve à l'intérieur de N(O), le cône nul de O, nous dirons que sa ligne d'Univers est de "genre 
temps". Dans ce cas, O et P sont situés sur la ligne d'Univers d'un observateur ou d'une particule massive. 
Il existe bien évidemment deux types de déplacements de genre temps: 


1. Si P est dans le futur de © (selon un observateur dont la ligne d'univers passe par O et P), nous dirons 
que P "pointe vers le futur”. 


2. Dans le cas contraire, nous dirons bien entendu qu'il "pointe vers le passé". 


Si P se situe sur N(O) - soit à la surface du cône - nous dirons alors qu'il est "nul" ou de "genre lumière" et 
si P n'est ni nul ni de genre temps, alors P se situe à l'extérieur de N(O). Nous disons alors qu'il est de 
"genre espace": 


de genre lumuère 


de genre espace 


Figure: 49.11 - Types de lignes d'Univers 


Cela se traduit mathématiquement par en se rappelant (voir plus haut) que: 
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ds? = dx" (7,47) = dx'dx, = cdt? -dx° -dy° -d? (49.323) 


D1. ds? = 0: la ligne d'Univers est donc de "type lumière" et c'est elle qui décrit la surface du cône par 
définition (selon ce que nous avons démontré précédemment et quel que soit le choix de la métrique) soit 
telle que: 

c?dt? = dx? + dy? +dz? (49.324) 
ce qui est le cas d'un photon de lumière (d'où le nom...). 
D2. ds? < Q : nous disons alors que la ligne d'Univers est de "type espace" soit telle que: 

c'dt? < dx? +dy? +dz? (49.325) 
Deux événements qui ont lieu simultanément mais à des lieux différents sont donc de type espace. 


D3. ds? > 0 : nous disons alors que l'intervalle ou la ligne d'Univers sont de "type temps" soit telle que: 


c'dt? > dx? + dy? +dz? (49.326) 


FUTUR Particule massive 
. Photon 


dilleurs äilleurs 


ct ds?<0 M gs2<0 


pe 


PASSE 


D4. Une "ligne causale" est une ligne de genre lumière ou temps qui est toujours orientée vers le futur. 


Revenons à nos équations après ce petit interlude.. les équations conduisent donc à faire plusieurs 
observations. Ainsi, dans l'Univers euclidien à quatre dimensions de Minkowski, les trajectoires des objets 
dans l'espace-temps sont toujours des droites. Effectivement, l'exemple trivial consiste à considérer que 
l'objet reste au repos, seul le temps continue alors de s'écouler. Nous avons dès lors: 


Le =ctfyfl (49327) 


en posant v = 0 , cela nous nous donne: 
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2e 2. 


e?f 


, ,2 (9328) 
Ce OT 


donc: 


et aussi: 


La primitive étant (constante d'intégration nulle): 
s=c'é£" (49.331) 


qui est bien une droite et représente donc la ligne d'Univers de l'objet considéré dans le cône d'Univers. 
Nous pouvons aussi observer aussi que dans ce cas, l'évolution du phénomène est purement temporelle 
quand l'intervalle est positif (ce qui appuie ce que nous avions dit tout à l'heure). 


Remarques: 


R1. Si la vitesse de la lumière est infinie, nous retrouvons le cas particulier de l'univers newtonien, où 
un phénomène peut instantanément se produire. Le temps y est absolu et il n'existe pas d'horizon 
cosmologique car le cône à une ouverture maximale (angle droit). 


R2. Si nous posons que la vitesse de lumière est égale à l'unité, comme nous l'avons fait, l'axe des 
ordonnées du cône est dit "axe purement temporel". 


R3. Il faut comprendre par soi-même que l'Univers a son propre cône d'Univers (cône... si l'espace est 
de type Minkowskien bien sûr….). 


Enfin, indiquons que la théorie de la relativité restreinte, au même titre que celle de la relativité générale, 
n'impose pas un nombre de dimensions spatiales données pour rester consistante: ce qui est dommage pour 
les physiciens théoriciens qui souhaiteraient une théorie qui s'impose à elle-même un nombre fini de 
dimensions pour rester consistante (ce que par contre la théorie des cordes fait avec 25 dimensions. et 
celle des supercordes avec 11). 
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Notes personnelles: 
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50. RELATIVITÉ GÉNÉRALE 


Come nous l'avons vu dans le chapitre précédent, la relativité restreinte est une réussite 


remarquable d'un point de vue théorique aussi bien que d'un point de vue pratique en formant un 
continuum d'espace-temps où les grandeurs d'espace et de temps se voient donner la même dimension 
physique (celle d'une distance métrique pour rappel!). Cependant, celle-ci s'applique aux repères 
euclidiens seulement et aux référentiels inertiels/Galiléens (à vitesse constante pour rappel... ). Il 
convient donc de généraliser l'ensemble de la mécanique d'abord en exprimant ses principes et ses 
résultats fondamentaux sous une forme généralisée indépendante du type de systèmes de coordonnées 
choisi (in extenso: du type d'espace) en faisant usage du calcul tensoriel et ensuite de prendre en 
compte les systèmes non inertiels. 


Il convient aussi de prendre en compte que le fait que la relativité restreinte ne s'applique qu'aux 
référentiels Galiléens est restrictif car toute masse crée un champ gravitationnel dont la portée est 
infinie. Pour pouvoir trouver un vrai référentiel galiléen, il est donc nécessaire de se situer infiniment 
loin de toute masse. La mécanique relativiste bâtie à partir de la relativité restreinte ne constitue donc 
qu'une approximation des lois de la nature, dans le cas où les champs gravitationnels ou les 
accélérations sont suffisamment faibles. Cette limitation d'application n'est plus adaptée à 
l'astrophysique relativiste donc l'activité s'est intensifiée à la fin du 20ème siècle. 


C'est ici qu'encore une fois intervient Albert Einstein et nombre de ses confrères à travers le temps! 
1. POSTULATS ET PRINCIPES 


Einstein croyait en une physique ne devant privilégier aucun référentiel puisque telle était à ses yeux la 
réalité de l'Univers (nous en avons déjà fait mention). Mais comment se soustraire alors au phénomène 
d'accélération. L'idée géniale fut d'énoncer le "postulat d'équivalence" ci-dessous (qui encore 
aujourd'hui en ce début du 21ème siècle n'est toujours pas pris en défaut par les expériences récentes) 
en plus du postulat d'invariance et du principe cosmologique que nous avons énoncés dans le chapitre 
de Relativité Restreinte et de l'hypothèse selon laquelle le mouvement d'une particule qui ne subit 
aucune autre interaction que la gravitation est une ligne géodésique (voir plus loin la démonstration). 


1.1. POSTULAT D'ÉQUIVALENCE 


Dans un premier temps, Albert Einstein va améliorer le postulat d'équivalence dont les versions les plus 
anciennes sont dues à Galilée et à Newton: 


Postulat: L'accélération (uniforme!) d'une masse (hors champ gravitationnel) due à l'application d'une 
force mécanique et l'accélération de cette même masse soumise à un champ gravitationnel (uniforme!) 
sont supposées parfaitement équivalentes. Ainsi, les résultats des analyses mathématiques dans un cas, 
peuvent s'appliquer dans l'autre (déjà là c'est fort mais cohérent. l'idée est très très bonne encore 
fallait-il l'avoir...!) 


Autrement dit, le champ de gravité possède une propriété fondamentale qui le distingue de tous les 
autres champs connus dans la nature: le mouvement de chute libre des corps est universel, indépendant 
de la masse et de la composition des corps. 


Corollaire: La masse au repos d'un corps doit alors être la même qu'elle soit mesurée dans un référentiel 
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dans un champ gravitationnel ou hors champ gravitationnel (nous parlons alors de masse inertielle et de 
masse pesante comme nous l'avons vu au tout début de notre étude de la mécanique classique). 


Remarque: Il faut bien prendre garde et vérifier que le corollaire du postulat d'équivalence soit vrai 
sinon toute la relativité générale s'écroulerait (en ce début de 21ème siècle des expériences sont 
toujours en cours pour essayer de mettre en défaut cette équivalence)! 


In extenso, tout champ de gravitation statique et uniforme est équivalant à un référentiel accéléré dans 
le vide. Nous pouvons physiquement considérer tout champ de gravitation comme statique et uniforme 
dans une région assez petite de l'espace et pendant un laps de temps assez court pour éviter les effets de 
marées. Nous sommes donc amenés à poser le "principe d'équivalence faible" (PEF): Pour tout 
événement de l'espace-temps dans un champ de gravitation arbitraire, nous pouvons choisir un 
référentiel dit "référentiel localement inertiel" tel que dans un voisinage de l'événement en question le 
mouvement libre de tous les corps (qui sont donc aussi dans le champ de gravité) soit ES et 
uniforme tel qu'on puisse y appliquer les transformations de Lorentz ( 


). 


Si nous mettons expérimentalement PEF en défaut, alors nous mettons en défaut le principe 
d'équivalence lui-même... ce qui n'a jamais pu être réalisé en laboratoire à ce jour! 


Remarque: Le concept de localité est très important car il n'existe pas naturellement de champ de 
gravité uniforme. Par exemple, sur Terre, deux corps ponctuels distants d'une certaine longueur 
lâchés d'une certaine hauteur tomberont au sol avec une distance plus courte que la distance qui les 
séparait au moment où ils ont été lâchés. C'est ce que nous appelons en physique les "effets de 
marées": le champ gravitationnel n'est jamais uniforme (dans la nature en tout cas...). 


Donc le principe d'équivalence (qui inclut le principe d'équivalence faible) affirme finalement que la 
force de Newton: 


F=ma 


et celle de la gravitation selon la forme de la loi de Newton-Poisson ( ): 


sont équivalentes telles que la masse inerte égale la masse pesante et l'accélération égale la pesanteur et 
qu'il n'est pas possible de distinguer les deux: 


A=£ 


En quoi ce postulat permet-il de résoudre toutes les difficultés alors ? C'est simple ! L'idée est la 
suivante: 


Lorsque nous allons considérer un corps en accélération, nous allons d'abord toujours assimiler celle-ci 
à l'accélération due à la chute dans un champ gravitationnel (de par l'application du principe 
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d'équivalence). Ensuite, nous allons supposer, et devrons le vérifier (démonstration plus bas) en 
retrouvant la loi de Newton, que l'accélération due à ce champ gravitationnel n'est pas due au champ 
lui-même mais à la géométrie de l'espace déformé par la présence de la masse (in extenso l'énergie) qui 
crée le champ gravitationnel. Ainsi, l'objet n'est plus en "chute libre" mais sera vu comme glissant sur la 
trame spatiale déformée pour acquérir ainsi son accélération. 


Au fait, l'enjeu est double: 


1. Si le calcul tensoriel permet d'exprimer les lois de la mécanique classique et relativiste restreinte dans 
n'importe quel système de coordonnées, il est alors possible de voir comment le système de 
coordonnées (la métrique) agit sur l'expression des lois de l'Univers (Albert Einstein ne le savait pas tant 
qu'il n'avait pas terminé ses calculs mais le pressentait) ! 


2. Si l'expression tensorielle naturelle des lois de la mécanique fait apparaître le glissement (in extenso 
l'accélération) sur la trame spatiale suivant la métrique (locale) considérée, alors le pari est gagné et 
alors l'accélération peut être vue comme un effet dont la cause est purement géométrique. 


Ainsi, l'extension de la relativité restreinte ne se fait plus en prenant en compte les systèmes non 
inertiels mais la géométrie du système!! Nous pouvons (et arrivons!) ainsi (à) contourner le problème 
initial et le pire. c'est que cela marche!!!! 


® Exemple: 


Supposons que deux fusées, que nous nommerons À et B, se trouvent dans une région de l'espace 
éloignée de toute masse. Leurs moteurs sont arrêtés ce qui se traduit physiquement par un mouvement 
rectiligne uniforme. Dans chaque fusée, des physiciens réalisent des expériences de mécanique avec 
des objets dont ils connaissent la masse inerte. Soudain, le moteur de la fusée A démarre et lui 
communique une accélération dont l'effet ressenti à l'intérieur du vaisseau spatial est une force d'inertie 
qui plaque les objets vers le plancher. Pour les physiciens de la fusée À les lois de la mécanique sont 
alors les mêmes que celles que l'on observe dans un champ gravitationnel. Ils sont donc logiquement 
amenés à interpréter la force d'inertie comme la manifestation d'un champ gravitationnel. À l'aide d'une 
balance, ils peuvent alors peser leurs objets et leur attribuer une masse gravitationnelle. 


Supposons que les physiciens de la fusée B puissent observer ce qui se passe dans la fusée A. Ils savent 
que ce que leurs collègues interprètent comme le poids des objets n'est en fait qu'une force d'inertie. La 
force d'inertie étant proportionnelle à l'accélération et à la masse inerte. Si la masse gravitationnelle 
était différente de la masse inerte les physiciens de la fusée A pourraient distinguer les effets des forces 
d'inertie de ceux d'un champ de gravitation car les masses mesurées seraient distinctes. Or, nous savons 
que la masse inerte et la masse gravitationnelle sont équivalentes (principe d'équivalence Galiléen). Il 
s'ensuit que les physiciens de la fusée A n'ont aucun moyen de faire la différence entre des forces 
d'inertie résultant d'un mouvement accéléré de leur vaisseau spatial et les forces d'attraction 
gravitationnelles. 


Il faut toutefois tempérer les conclusions de cette expérience: les vrais champs de gravitation se 
distinguent d'un référentiel accéléré dans la mesure où l'accélération gravitationnelle varie avec la 
distance qui sépare les corps alors que dans un référentiel accéléré, l'accélération est identique en tout 
point de l'espace. Cependant, localement, un champ gravitationnel et un référentiel accéléré ne peuvent 
être différenciés. 


Nous sommes donc amenés à énoncer le "principe d'équivalence d'Einstein" (PEE) tel que l'a fait 
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Einstein: localement, toutes les lois de la physique sont les mêmes dans un champ gravitationnel et dans 
un référentiel uniformément accéléré. 


Ceci a une conséquence: Si la masse (qui est équivalente à de l'énergie comme nous l'avons vu en 
relativité restreinte) d'un objet n'est pas différenciable que nous soyons dans un champ gravitationnel 
ou dans un référentiel uniformément accéléré c'est que tous les types d'énergie (énergie de cohésion 
nucléaire, énergie électrostatique, énergie gravifique propre de l'objet, etc.) de cet objet ne sont pas 
différenciables. Donc les lois de la relativité restreinte sont valables quel que soit le référentiel 
considéré! 


Si les lois ne sont pas les mêmes, alors PEE est mis en défaut, donc in extenso PEF aussi et plus 
généralement le principe d'équivalence dans sa généralité mais ceci n'est encore jamais arrivé 
expérimentalement. 


Remarque: De par le PEF, il est intéressant de constater que le champ gravitationnel agit aussi sur 
l'énergie potentielle gravitationnelle des autres corps. Nous disons alors que le champ gravitationnel 
est un "champ couplé”. 


Étant donné qu'en relativité générale, le champ gravitationnel est censé être décrit par la métrique g = 


(dont est munie la variété différentiable à 4 dimensions que constitue l'espace-temps), nous pouvons 
voir un référentiel localement inertiel comme un système de coordonnées de l'espace-temps dans lequel 
la métrique g, devient plate (pseudo-Riemannienne): 


Un tel système de coordonnées existe toujours, ce qui traduit l'existence, pour tout champ 
gravitationnel, de référentiels localement inertiels! 


Lorsque la métrique n'est cependant pas plate, les coordonnées sont appelées "coordonnées normales 
de Riemann" et la métrique décrit alors un espace Riemannien (espace courbe) et dépend elle-même de 
manière non triviale des coordonnées du système. 


1.2. PRINCIPE DE MACH 


Si le principe d'équivalence met en évidence l'égalité des masses inerte et gravitationnelle, il ne nous 
éclaire pas sur la nature de ces deux masses. Finalement, que sont les masses inerte et gravitationnelle? 


La nature profonde de la masse inerte devrait nous renseigner sur celle de l'inertie elle-même. L'inertie 
se manifeste sous une forme passive - le principe d'inertie - et une forme active - la seconde loi de 
Newton. D'une manière générale, elle exprime un comportement universel des corps à résister au 
changement du mouvement. Or nous savons que le mouvement inertiel est relatif, c'est-à-dire qu'il 
n'existe aucun référentiel absolu. En est-il de même du mouvement accéléré? Considérons, pour 
illustrer cette interrogation, une fusée dans laquelle se trouve un physicien et réalisons deux 
expériences: 


- Première expérience. La fusée accélère: le physicien est soumis à une force d'inertie orientée dans la 
direction opposée à celle de l'accélération. 


- Deuxième expérience. Maintenant supposons que l'on imprime à l'ensemble de l'Univers - à 
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l'exception de la fusée qui se déplace selon un mouvement inertiel - une accélération exactement 
opposée à celle de la fusée lors de l'expérience précédente. 


Si le mouvement accéléré est relatif alors, pour un observateur, il n'est pas possible de distinguer les 
deux expériences. Notamment, le physicien situé à l'intérieur de la fusée doit observer l'apparition d'une 
force d'inertie absolument identique à celle qu'il a notée lors de la première expérience. La masse inerte 
trouverait alors son origine dans les interactions de la masse gravitationnelle des corps avec l'ensemble 
des masses gravitationnelles de l'Univers! Selon Ernst Mach, un physicien et philosophe du 19ème 
siècle, le mouvement quel qu'il soit, inertiel ou accéléré, serait relatif. 


Cette théorie fut baptisée par Einstein "principe de Mach". Jusqu'à ce jour, le principe de Mach n'a pas 
été confirmé, mais pas davantage infirmé. Il est vrai que sa vérification expérimentale dépasse de 
beaucoup les capacités humaines! 


Tout se passe comme si en déplaçant toutes les masses de l'Univers, celles-ci entraînaient avec elles les 
objets se trouvant dans la fusée, dont le physicien qui ressent alors une force qui le tire dans le même 
sens que l'accélération appliquée aux étoiles. 


2. MÉTRIQUES 


Einstein supposa donc que la gravitation n'était que la manifestation de déformations de l'espace-temps. 
Pour tenter d'illustrer de façon simpliste mais très imagée l'idée d'Einstein, considérons une roue dentée 
roulant à vitesse constante (disons une dent à la seconde) sur une crémaillère. Imaginons que nous 
ayons le pouvoir de modifier simultanément le pas de la crémaillère et celui de la roue quand et où nous 
le désirons. Faisons alors en sorte que le pas de la crémaillère augmente légèrement d'une dent à l'autre. 
Pour des observateurs fixes la roue est alors animée d'un mouvement uniformément accéléré car, en 
effet, à chaque tour celle-ci parcourt une distance toujours plus grande. En revanche, si l'on choisit la 
crémaillère comme référentiel et le pas de celle-ci comme étalon de mesure, le mouvement de la roue 
est alors uniforme (une dent par seconde). L'accélération de la roue est la conséquence de 
l'augmentation du pas de la crémaillère. 


Poursuivons l'analogie: le pas de la crémaillère joue le rôle d'étalon de mesure local dans notre espace à 
une dimension que constitue la crémaillère. En géométrie, il porte le nom de "métrique". La métrique 
est ce qui permet de déterminer la distance entre deux points, elle représente en quelque sorte l'étalon 
infinitésimal d'un espace. En géométrie euclidienne la métrique est une constante, ce qui nous permet 
de créer des étalons de mesure universels. Bernhard Riemann, inventa une géométrie où la métrique 
peut varier d'un point à un autre de l'espace, ce qui lui permit de décrire des espaces courbes comme la 
surface d'une sphère par exemple ( | ) ). 


Lors de notre étude du calcul tensoriel, des géométries non-euclidiennes et de la géométrie 
différentielle (chapitres dont la lecture est plus que recommandée!!!), nous avons vu que la mesure de 
la distance ds entre deux points positionnés dans un espace à deux ou trois dimensions peut s'effectuer 
au moyen d'un grand nombre de système de coordonnées par "l'équation métrique" ( 


): 
ds? = dx, dr" = g,,.dx"dx" 
En relativité générale, l'idée est de rendre le modèle théorique indépendant du fond et donc le 


construire sous une forme covariante (ce que certains assimilent à un postulat sous le nom de "principe 
de covariance"). Un excellent candidat pour ce type de démarche est donc d'utiliser le formalisme 
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tensoriel. Raison pour laquelle l'équation de métrique en constitue aussi un des piliers. 


Exemples: 


E1. Les coordonnées rectangulaires (dans [p? ): 


ds? = dr + dy? +dz°| (507) 


Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat (cf. chapitre de 
Géométries Non-Euclidiennes). 


E2. Les coordonnées polaires (dans p? ): 


x =rcos— dx = drcos$-rsin _. 
y =rsin #— dy = drsin #+rcos #d® Lo. 
d'où: 
ds? = dr? + dy =(drcos -r sin fa)? + (drsin #+ r cos fa)? 


= dr° cos” #- 2rdrsingeosfdf +risin? if + dr? sin? #+ 2rdr singes gag + r? cos? dd # 
= dr° (cos” g+ sin” g) + r° (cos” g+ sin” da # 
(50.9) 


d'où: 


ds? = dr +rdf| (50.10) 


Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat (cf. chapitre de 
Géométries Non-Euclidiennes). 


E3. Les coordonnées cylindriques (dans 1°) pour lesquelles nous avons: 


x=rcos®— dx = drcos®-rsin 
y =rsin #— dy = drsin f+rcosddg (50.11) 
z=2—> dz = dz 


à remplacer dans ds? = dx + dy? + dz? nous obtenons de façon quasiment identique à précédemment: 
ds? = dr? +r?d@ + d7? (50.12) 


Si la distance au carré satisfait à cette relation alors nous sommes dans un espace courbe (de type 
cylindrique) mais qui localement peut être plat (cf. chapitre de Géométries Non-Euclidiennes), En 
réalité, pour avoir la métrique de la surface du cylindre et non pas simplement du plan exprimé en 
coordonnées cylindriques, il faudra prendre la métrique suivante: 


ds? = dr? +r24 | (50.13) 


dont l'origine a été démontrée dans le chapitre de Géométrie Différentielle. 
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E4. Les coordonnées sphériques (dans 1?) pour lesquelles nous avons: 


x =rsin£cos#— dx = drsin 8 cos #+r cos 848 cos Ÿ -rsin Psin À 
y =rsin Osin #— dy = drsin 9sin Ÿ+rcos dE sin Ÿ +rsin Pcos AÂP (50.14) 
z=rcos8 = dz = drcos 8 -rsin 948 


à remplacer dans ds? = dx? + dy? +47? nous obtenons: 


ds? = 

(dr sin Pcos # +r cos Bd Ocos É - r sin Jsin fa)? 
+(dr sin Psin # +r cos 848 sin + r sin Pcos hd )* 
+(dr cos 8 -r sin 8) 


(50.15) 


Petit rappel préalable: 


(a+b-cY = a? +? +6? + 2(ab —- ac -bc) 
(a+b+c} = a +b?+e + 2(ab+ac+be) (50.16) 


(a-b}? = a? -2ab+h 
Donc: 


ds? = 

dr? sin? 8cos? #+ r°? cos? 848? cos #+r? sin? Fsin? Sd 

+2(rdrd 8cos 8 sin 8cos? $ - rdrd bain? Pcos bain # - r°d Hd fcos sin 9 cos psin #) 
+dr? sin? 9sin? #+r°? cos? 84 sin? #+r° sin? Fcos° hd # 

+2(rdrd 8 sin dcos sin? #+ rdrd psin? Jsin #cos Ÿ + rdOdpcos Fsin Jsin fcos 
+dr? cos? 8 - 2rdrd8 cos 8sin 8 +r° sin? 84 


(50.17) 


Après une première série de mise en commun et de simplifications élémentaires des termes identiques, 
nous obtenons: 


ds? = dr? +r°d8? +r° sin? CT (50.18) 


Si la distance au carré satisfait à cette relation alors nous sommes dans un espace courbe (de type 
sphérique) mais qui localement peut être plat (cf. chapitre de Géométries Non-Euclidiennes). En réalité, 
pour avoir la métrique de la surface de la sphère et non pas simplement du plan exprimé en 
coordonnées sphériques, il faudra prendre la métrique suivante: 


ds? = r?48? +r2 sin? 984$ (50.19) 


dont l'origine a été démontrée dans le chapitre de Géométrie Différentielle. Nous avions par ailleurs 
vérifié dans le chapitre de Calcul Tensoriel, que la courbure de Ricci de la métrique sphérique 
antéprécédente était nulle. Par contre, nous avions tout de suite après vérifié que si nous prenions la 
métrique précédente de la surface de la sphère, la courbure de Ricci était non nulle (et c'est encore 
heureux!). 
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Jusque-là, vous vous demandez peut-être où nous voulons en venir. Au fait, nous cherchons à définir à 
partir de ces relations, un être mathématique qui en concordance avec l'hypothèse d'Einstein, exprime 
les propriétés géométriques d'espaces donnés. 


Comment allons-nous faire?: Nous allons d'abord changer d'écriture tout simplement. Au lieu d'utiliser 
les symboles x,y,z,8,@,r nous allons écrire x! x?,x*... Attention! Les chiffres en suffixes ne sont 


pas des puissances. Ce sont des valeurs muettes qui sont là uniquement pour symboliser la x-ème 
coordonnée d'un repère donné. 


Écrivons maintenant à nouveau nos équations métriques avec cette nouvelle notation en considérant 
qu'il ne s'agit que d'exemples particuliers qui n'ont pas nécessairement un sens physique pertinent (nous 


l'avons par ailleurs mentionné précédemment!): 


- Coordonnées rectangulaires: 
ds? = (dr) +{(dŸ +{d8 (5020) 
- Coordonnées polaires: 
ds? = (ar) +{r) (dé)  (Go21) 
- Coordonnées cylindriques: 
ds? =(ar) + (xŸ (ar Ÿ +{(ar) (50.22) 
- Coordonnées sphériques: 
ds? ={a8) +(2) (af +(2) sint{x far) (025) 


Maintenant rappelons encore une fois que le "tenseur métrique" (nommé ainsi car il étalonne l'espace- 
temps) noté: 


E&n  &12 813 
Em = | E21 L22 L23 | (20.24) 
£31 E£32 £3 


intervient dans l'équation métrique de la manière suivante: 
2 tel CNE 
ds” = dx, dx" = g,n@x" 4x" (50.25) 
et remarquez que les composantes de la matrice sont sans dimensions aussi. 


Cet être mathématique qui est un tenseur contient donc les paramètres de la courbure (nous disons 
parfois aussi de la "contrainte" ou de la "tension") dans lequel un espace se trouve. Mais alors que 
contient le tenseur métrique d'espace-temps pour un espace euclidien plat? 


Selon la convention d'écriture de sommation d'Einstein (cf. chapitre de Calcul Tensoriel) par exemple, 
POUT ;# = x = 2 NOUS avons: 
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ds? = g,,dx" dr" = gudx dx + gdx dx + gdx/dx + gdx°dx? (50.26) 


Donc si nous revenons à notre tenseur pour l'espace euclidien plat, nous savons déjà (cf. chapitre de 
Calcul Tensoriel) que m et n vont de 1 à 3 et que nous avons dans notre tenseur g,, = À pour ##7 # x et 


Ewx = l pour # = x (tenseur symétrique). Donc: 


ds? = g .dx"dr = g dx dx + g,dx°dx° + g..dr dx 


1 (a) +1 (at) +1(dr) = (a) + (48) + (a) 


Ainsi: 


En = (50.28) 


OO OO 
OS mm © 
1 © © 


où comme d'habitude sur ce site nous faisons l'abus de notation (déjà mentioné dans le chapitre de 
Calcul Tensoriel) de ne pas mettre g,,, entre crochets (puisqu'un tenseur et sa forme matricielle sont 


normalement deux choses distinctes en toute rigueur). 


Ce résultat est remarquable, car le tenseur métrique va donc nous permettre de définir les propriétés 
d'un espace à partir d'un simple être mathématique facilement manipulable formellement. 


En coordonnées polaires le tenseur g,., s'écrit: 


1 0 
Ms 1 0 
Em D=|" = - (50.29) 
pr Xn 0 (xŸ 0 r° 
Vérification: 
ds? = g,.dx" dx" = gdx dx + g.,dx°dx° = (ar Ÿ + (xŸ (aé} (50.30) 


En coordonnées cylindriques le tenseur s'écrit: 
Y Even 


1 ( ( 
A1 A2 À 1 
112 
&mn(r#2)=|xn %2 4sl=|0 (x) 0[=10 
Xg À 3 (] ( 1 () 


La vérification ne se fait même plus tellement le résultat est évident. 


En coordonnées sphériques le tenseur g,,, est un peu plus complexe et s'écrit: 
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Xn Zn Zn l . 0 : 0 
Zu (7.8.2) =|xn 2n 28|=|0 (x) 0 =|0 r° 0 (50.32) 
2 5.2 
Xs ZX) Zn 0 o (re ae (#)} 0 O0 7rsin°8 


La vérification ne se fait même plus tellement le résultat est évident. 


En relativité restreinte, nous avons vu que les notions d'espace et de temps étaient implicitement liées. 
Ainsi, pour étudier la physique (cela intéresse peu le mathématicien), nous avons besoin d'ajouter à 
notre tenseur métrique la composante du temps pour obtenir ce que nous appelons le "tenseur métrique 
d'espace-temps". 


Pour déterminer l'écriture de ce tenseur, nous allons nous placer dans un premier temps dans un espace 
de Minkowski où nous avions rappelons-le (cf. chapitre de Relativité Restreinte): 


ds? =c?:df?- (dr + dy? + dr) (50.33) 


qui est donc l'intervalle infinitésimal d'espace-temps entre deux événements infiniment voisins (ou 
considérés comme tels à une certaine échelle...). 


Ainsi, en posant: 


Nous avons: 
1 0 0 O0 
_[0 -1 0 0 _— 
8m lo o -1 0] 
O D 6 1 
avec la "signature": 
sign (2,1 = ARS ASS RSS =+—-—— (50.36) 


Remarque: Pour tous les tenseurs métriques que nous avons déterminés avant, si nous les 
exprimons dans l'espace-temps (donc en rajoutant le temps), les composantes spatiales ont toutes un 
signe négatif! 


Nous verrons par la suite d'autres métriques beaucoup moins intuitives une fois que nous aurons 
démontré bien plus loin l'équation d'Einstein des champs. 


2.1. CRITÈRE DE SCHILD 


Nous allons maintenant voir que pour étudier la gravitation, la géométrie courbe est nécessaire après 
quoi (il nous faudra démontrer l'équation des géodésiques avant!) nous montrerons qu'elle est 
également suffisante. Nous verrons que la gravitation telle qu'elle est formulée en mécanique 
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newtonienne est entièrement descriptible à partir d'une formulation de courbure de l'espace-temps. 


Imaginons d'abord une tour d'une très grande hauteur h construite à la surface de la Terre. Un homme À 
se trouve au pied de la tour, et envoie un signal de pulsation &, à son collègue B situé en haut de la 


tour. Il se trouve, et nous allons de suite le démontrer, que la pulsation æ, de l'onde reçue par B diffère 
de &, selon: 


@ hr 
—#=1+ ue (50.37) 


Ds 
D'où: 
AG = @, — @g > 0 (50.38) 


Ce décalage des pulsations (respectivement des fréquences) dans un champ gravitationnel est ce que 
nous appelons "l'effet Einstein", ou encore "redshift gravitationnel". 


Nous allons démontrer cette relation à l'aide d'arguments classiques et connus maintenant. 


Un corps matériel envoyé du sol vers le ciel doit lutter contre la force de gravitation qui l'attire vers le 
bas. Il perdra donc une certaine quantité d'énergie, équivalant à l'énergie potentielle gravitationnelle 
gagnée durant le trajet. L'énergie Æ, du corps au niveau du sol est donc son énergie de masse à laquelle 


s'ajoute l'énergie potentielle à la hauteur de la tour: 


2 


E,=mc +mgh (50.39) 


L'énergie de ce corps une fois arrivé en haut de la tour est simplement son énergie de masse: 


2 


E = c" (50.40) 


car il a dû dépenser la quantité d'énergie mgh durant le trajet. Le rapport des énergies est alors: 


Ce rapport étant indépendant de la masse, on peut prendre la limite # —> Q afin d'avoir la relation pour 
le photon. Nous obtenons alors: 


ce qui implique: 


Nous allons maintenant étudier ce phénomène dans le cadre de l'espace-temps de Minkowski. Nous 
verrons apparaître une contradiction, ce qui motivera le passage vers un espace-temps courbe: c'est 
l'argument en faveur d'une géométrie courbe qui a été utilisé par Schild. 
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Considérons à nouveau le schéma d'expérience de l'homme À qui envoie une onde vers son ami B. Soit 
4, le temps mis par À pour émettre exactement 1 cycle de l'onde (cf. chapitre de Mécanique 


Ondulatoire): 


À 1 
AMy=—#=—— (50.44) 
€ 
et #, le temps mis par B pour recevoir ce cycle: 
À 1 
My = B= (5045) 
CRC 


À cause de l'effet Einstein, nous savons que &, > æ, et donc {f, < /#, en temps propre! Soit en fait 


que le temps passe plus lentement pour quelqu'un au sol (A) que pour une autre personne en haut d'une 
montagne (B)! 


Mais comme nous sommes en géométrie plate et que le champ gravitationnel est supposé statique, nous 
en déduisons que les trajectoires d'espace-temps décrites par les signaux doivent être parallèles. Ceci 
mène à la conclusion que l'intervalle de temps propre serait Â, = f, (selon la relativité restreinte). 


Si nous optons pour un espace courbe, nous pouvons préserver la relation f, < £,, c'est-à-dire le fait 


que le temps avance plus lentement pour À que pour B. Ceci se traduit simplement par le fait qu'en 
géométrie courbe, le temps propre (!) d'un observateur dépend de la métrique. 


Les mêmes développements peuvent être faits en assimilant l'expérience précédente à un train qui se 
déplace avec une accélération constante g. L'observateur À se trouve dans le compartiment arrière 
(équivalant au sol de la Terre dans l'expérience précédente) et envoie une onde à son collègue B situé à 
l'avant du train (à une distance h). 


L'observateur B reçoit l'onde après un temps A+ = k/£. Durant ce laps de temps, le train a accéléré, et 
sa vitesse a augmenté d'une valeur Âv = gÂf = gkfe. Par conséquent, l'onde perçue par B sera altérée 
par l'effet Doppler conventionnel (cf. chapitre de Mécanique Ondulatoire): 


ni 


À3 y 


AA 
— = = -1=—=-1 (50.47) 
À4 À4 A DA 
ce qui donne glorieusement: 
AA _ gh 
À C æ k 
pa : —È =1+ a (50.48) 
AA _ da _ Da c 
Àn Pa 
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Nous retrouvons plus souvent cette relation sous la forme ci-dessous dans la littérature en utilisant les 
relations entre pulsation et fréquence et la force de gravitation de Newton pour expliciter g et en posant 
h comme valant 1: 


Jr fa _ CM 
Ja ce? 


Nous retrouvons également cette dernière relation sous la forme condensée suivante: 


Le même résultat peut être obtenu en utilisant la métrique de Schwarzschild (voir plus loin), d'où le 
nom de cet effet qui peut aussi être obtenu à partir des outils de la relativité générale d'Einstein. Nous 
démontrerons simplement plus tard à l'aide de cette métrique que le temps s'écoule effectivement moins 
vite dans un champ gravitationnel (hypothèse que nous avons faite quelques paragraphes plus haut). 


Nous voyons dans tous les cas que f; > f,4 puisque le terme de droite est positif et non nul. Cela 


signifie simplement que l'onde électromagnétique en analogie au spectre des couleurs se décale vers le 
rouge. Ainsi, l'effet Einstein est bien un redshift gravitationnel. 


La différence de fréquence est très faible et par conséquent difficilement mesurable même avec les 
meilleurs spectroscopes. La moindre perturbation peut totalement masquer l'effet Einstein. Il faudra 
véritablement attendre 1960 pour que l'expérience de Pound et Rebka permette de mesurer un décalage 
de fréquences avec une précision de 1% ne laissant dès lors plus aucun doute quant à la réalité du 
phénomène. 


3. ÉQUATIONS DU MOUVEMENT 


Nous allons démontrer ici que l'équation du mouvement d'une particule libre est constante le long de sa 
ligne d'Univers en nous limitant d'abord au cas d'un espace plat (de type espace de Minkowski). Après 
quoi, nous généraliserons ce résultat à tout type d'espace en utilisant un développement simple, pour 
montrer de manière assez évidente que l'équation du mouvement est indépendante de la masse et suit la 
courbure de l'espace!!! Enfin, nous présenterons une deuxième démonstration dans tout type d'espace 
en utilisant le principe variationnel. 


Commençons donc par démontrer l'équation du mouvement d'une particule libre dans un espace plat. 


Lors de notre étude de la relativité restreinte, nous avons démontré le lagrangien relativiste d'une 
particule libre donné par (attention! la notation m est celle de la masse au repos de la particule 
(l 


conformément à ce que nous avons montré dans le chapitre de Relativité Restreinte!!!): 


L=-mce?4\1-v {0 
et pour cela nous étions partis de l'action (hypothétique): 


S, = "x fé 
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et nous étions arrivés à écrire: 


2 
L CNhE? 
C 


Maintenant, montrons quelque chose d'intéressant. Rappelons que pour l'espace-temps de Minkowski, 
nous avons obtenu: 


ds? =c? df?- (ar + dy? + dé) (50.54) 


en nous restreignant à une seule dimension spatiale, nous obtenons comme relation: 


2 2 
ds? = cat? - dr & ds? = c'dt? L - Se | = ct? [- F | 
C 


c 
2 
ds = cat 1-— 
\ c 


et alors. eh bien voilà au fait, si nous posons: 


(50.55) 


S = rm [ds (50.56) 


nous avons finalement: 


2 2 
S = rc [ds = rc [ct l= LE = me” | 1- at (50.57) 
\ e € 


nous retrouvons donc la même action à partir d'une forme plus générale (pure) de l'action qui est: 
S = rc [ds (50.58) 


résultat que nous avions aussi démontré dans le chapitre d'Électrodynamique!! Nous pouvons même 
faire mieux en termes d'élégance..! Si nous observons bien les développements des lignes précédentes, 


nous observons qu'au fait la relation: 
4 
ds = cdt,|1- NE (50.59) 
€ 


est le cas particulier à une dimension de la relation: 


avec comme défini plus haut: 


x° = ct, x = x, x? = y,x° =z (50.61) 
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et donc: 


A =c, x = v,,7° =, =v, (50.62) 


Effectivement, si nous prenons le cas à une dimension dans un espace plat de Minkowski: 


2 
ds = dt [e,, i%2 = dt fon 20 +R = dt fe? 1. v? PE (50.63) 
C 


Ainsi, nous avons le facteur de Fitzgerald-Lorentz qui est donné en toute généralité par: 


1 NT 
Y=— PRE (50.64) 
(a 


comme généralisation de la Relativité Restreinte! 


Ceci étant fait, revenons à nos moutons... Dans un espace sans champ de potentiel, nous avons 
démontré dans le chapitre de Mécanique Analytique que le lagrangien se réduit à la simple expression 
de l'énergie cinétique tel que: 


Si nous souhaitons généraliser cette relation pour qu'elle soit valable dans n'importe quel type d'espace 
(courbe ou plat), il nous faut introduire les coordonnées curvilignes telles que nous les avons étudiées 
en calcul tensoriel (cf. chapitre de Calcul Tensoriel). 


Dans un premier temps, cela donne: 


2 
L= Le ds (50.66) 
2 dé 


où rappelons-le ds est l'abscisse curviligne de la trajectoire. 
Et nous avons démontré en calcul tensoriel que: 


ef, on 
Eÿ da da 


1/2 
| dæ (50.67) 


Cette dernière relation s'écrit dans le contexte de la mécanique relativiste de manière plus standard: 


" | ôx* dx” 


1/2 
a dt (50.68) 
Es y | 


t étant un paramètre qui correspond en mécanique au temps propre de la particule et qui dans la 
littérature spécialisée est souvent noté T . 


Avant de nous intéresser aux espaces courbes décrits par la métrique g; (ce que nous ferons lors de 
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notre démonstration du lagrangien libre généralisé), restreignons-nous à l'espace euclidien avec la 
métrique (ce sera un bon exercice pour bien comprendre) donnée par la matrice de Minkowski (cf. 
chapitre de Relativité Restreinte): 


1 0 © û 
0 -1 0 

Le DT (50.69) 
Hd € à = 


que nous noterons 7, Pour la différencier des autres (car plus souvent utilisée). Nous avons finalement 


dans l'espace euclidien: 


ôx" à |” 
S = rc [ds = nef + dt (50.70) 


Maintenant, appliquons le principe variationnel: 
ôÊS = crc [5(ds) (50.71) 
La variation de ds peut être trouvée plus simplement à partir de la variation de $? : 


(ds) = ds? = Ts a = 7,8 dx" dx? (50.72) 
£ dé 


nous trouvons: 
S(as) = 2d58(ds) = 7,,6(dx" dx" | = 7,6 6x" +7, çdx" 6df = 27,,6(dx" )dx® (50.79) 


Le facteur "2" provient du fait que par symétrie de l'espace euclidien, les variations de 4x* et 4x° sont 
égales. 


Remarque: Comme nous le verrons après, cette relation de &(ds) ne sera plus identique lorsque 


nous traiterons des espaces courbes. 
En simplifiant un peu, nous obtenons: 
a FT # : 
2d56(ds) = 2, 8(dx* dx" © G(ds) = n,,6(dx Fe (50.74) 
S 
Ce qui est équivalant à écrire: 


(ds) = 7,94 (an . A 


dt (50.75) 
ds Tes dé ds 


Nous pouvons maintenant revenir à l'action: 
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ÔS = me [A (ds) = )= mc [nee = la à (50.76) 


Nous réécrivons l'intégrale précédente (ce sera plus simple à traiter): 


a (8°) 


dt 


ôS = TPE [Te a = meja {ro =} 1 (rer, $£ 7 . (50.77) 


Effectivement, vérifions que cette forme est bien équivalente: 


ÊS = ve ju [ne nn Ss 2 un k 
à 

= — mc | di — mc (dt — — 7 
Il 1e S Î M a || C9 


ôx*) dé 
jure) re] PE Ê Fr 


Donc revenons à notre intégrale: 
à à 
à dx° d dxÿ 
ÔS = —-mc [dt — OX — | + fôx" | mom, —— 50.79) 
Il st. 7 Il | LS 


Nous avons donc deux intégrales qu'il va être un peu plus simple d'analyser. La première intégrale: 


Lt 


me far ose æ]- melnër ST ——| (50.80) 


donne simplement une expression évaluée aux extrémités temporelles (4,4 ). Dès lors, comme les 


valeurs de ;* sont parfaitement connues aux extrémités temporelles, le variationnel 54% est nul aux 
deux bornes et cette intégrale est nulle. 


Il ne nous reste alors plus que l'intégrale: 
d df | à df dx 
ÊS = (dtôx" | rec = (hôOx" ms —|me— | (5081 
Î | 7, 4% [ 7 = du 


Donc pour que le principe variationnel 45 =Q (cf. chapitre de Mécanique Analytique) soit respecté, il 
faut que nous ayons: 


d dx” 
—| ac —— | = 0 (50.82) 
dé ds 


Or, nous pouvons réécrire une partie de cette expression. Effectivement, nous avons: 
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Rappelons par ailleurs que nous avons démontré plus haut que: 
dt l 
ds = cdt 1- 5° bre er: - (50.84) 
et que nous avons: 
dx _ dx di . dt 7 (50.85) 


ds dtds ‘ds © 


Donc: 


= myle,v,,v,.v,) (50.86) 


d(ci) dx dy dz 
mc Sn 0 à € 
ds ds ds ds 


Maintenant, rappelons que lors de notre étude de la relativité restreinte, nous avons démontré le 
cheminement qui nous amenaïit à définir le quadrivecteur d'énergie impulsion: 


» LE E _. 
P | PrPyP ||? =my(c,v) (50.87) 


Donc finalement, ce qui annule le variationnel de l'intégrale d'action peut s'écrire: 


Il 
Len, 


(50.88) 


Nous retrouvons donc l'équation de conservation de la quantité de mouvement (conservation de 
l'impulsion) que nous appelons dans le cadre de la relativité générale "équation du mouvement". Cette 
forme de l'équation du mouvement semble dépendante de la masse mais en fouillant un peu, nous 
verrons qu'il n'en est rien. 


En multipliant cette relation par 7, nous pouvons aussi écrire: 


d 
Fun mu 0| (50.89) 
dt 
et de même pour un autre observateur: 
d d 
Re 0 vu, O (50.90) 
dt y di” 


En d'autres termes, l'impulsion de la particule reste constante sur toute sa ligne d'Univers. 


Mais nous pouvons aussi écrire: 
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dp" _ dp" 
df (£r] (50.91) 
—# 
€ 
donc: 
Li 
Lol (5002) 
ds 


Une forme plus importante encore de l'équation du mouvement peut être obtenue. Effectivement: 


. dx" dp" à dx" a [4x 
p' ="c = = —| 7x = AC — = 0 (50.93) 
ds ds ds ds ds| ds 


alors: 


ru 
dx 0 (£ 
ds 


UT 


0.94) 


cette relation est donc la forme "sans masse" de l'équation du mouvement dans un espace euclidien ou 
autrement dit, dans un espace-temps de type Minkowski. Autrement dit, il existe donc un système de 
coordonnées en chute libre dans lequel le mouvement de la particule est celui d'un déplacement 
uniforme dans l'espace-temps. 


Il sera très intéressant de la comparer avec l'équation du mouvement dans un espace courbe que nous 
verrons plus loin (appelée "équation des géodésiques"). 


Remarque: Il est équivalent d'écrire les relations des équations du mouvement par rapport à 
l'abscisse curviligne propre ds ou au temps propre dt (noté traditionnellement 4+) 


Nous pouvons maintenant montrer que l'équation du mouvement, au même titre que l'équation des 
géodésiques que nous verrons de suite après, est invariante par transformation de Lorentz: 


d?x" L d° (zx) L d?x" L 


7 127% _=9 (5095) 
ds° ds? ds? 


a 


Maintenant, voyons une forme plus générale de l'équation du mouvement pour tout type d'espace. 
L'objectif ici est de mettre en évidence, et ce en quelques lignes de calculs, que le mouvement suivi par 
une particule libre est indépendant de sa masse (vous pouvez déjà anticiper sur l'interprétation de la 
trajectoire d'un photon dans un espace courbe...!). 


Nous avons démontré en calcul tensoriel (et précédemment) que: 


ef, on ou 
Eÿ ad d& 


1/2 
| d& (50.96) 


ce qui donne pour le lagrangien généralisé d'une particule libre avec 4 a = dé,u* = x* u* = xf (nous 
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retrouvons bien l'expression générale de l'énergie cinétique): 


8x* 8x° 


j | 
L=-/m ————| (50.97) 
2 x à 


où t est le temps propre de la particule, c'est un invariant ! 
Remarque: Cette relation est appelée "lagrangien géodésique" par certains auteurs. 


Rappel: Le temps propre est une sorte d'horloge imaginaire qui voyage sur la particule et quels que 
soient les observateurs qui regardent l'horloge, ils seront mathématiquement d'accord sur la valeur de 
l'intervalle de temps entre deux "TIC" de l'horloge. 


Ce qui nous permet d'écrire (attention il faut bien se rappeler des différentes relations que nous avions 
déterminées lors de notre étude du formalisme lagrangien dans le chapitre traitant de la Mécanique 
Analytique): 


Remarque: L'élimination du facteur 1/2 du Lagrangien provient de la symétrie du tenseur métrique. 
Si ce dernier n'est pas symétrique, nous pouvons toujours le caractériser par un tenseur qui l'est. 


Effectivement, soit * un vecteur de coordonnées x,,..,x, et soit: 


4 = A;x%x; (50.99) 


Les À; ne sont pas symétriques a priori, mais nous pouvons écrire: 


Nous posons ensuite: 


Donc: 


et les B;, sont symétriques. 


La forme quadratique q peut donc toujours s'écrire avec une matrice symétrique, il y a même bijection. 
La conclusion étant qu'un tenseur métrique doit être symétrique si l'on veut le caractériser par la forme 
quadratique qu'il définit. 
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L'interlude mathématique étant terminé, continuons notre développement physique. En conséquence de 
la dernière relation, l'expression de l'hamiltonien devient bien évidemment: 


H=p x" LE (50.103) 


puisque nous considérons être dans un espace sans champ de potentiel. Le carré de la vitesse étant dès 
lors constant sur toute la trajectoire, nous avons: 


dH _dL 


— =— = (50.104) 
dt dt 


Établissons maintenant les équations du mouvement de tout corps. Nous avons: 


. -ineerr et = = Mg, (50.105) 

et comme: 

L La 8 a 0 

dx dé dd Gen (69106) 

dt 

alors: 

Ines a 58 = L (me) (50.107) 
d'où: 


d TR ä > E dg £ Fra | L êg 8 e. | 
RCE + 39 — if = me gx" Mure DS (50.108) 


en mettant en CoMMUN: 


à à 
me X FE mi (50.109) 
x x 


que nous pouvons écrire identiquement pour les x“ en procédant de façon identique à ci-dessus. 


La relation précédente donne donc la trajectoire d'un corps en mouvement, dans un espace sans champ 
de potentiel, en fonction de ses coordonnées curvilignes et de la métrique de l'espace considéré. 


Ce qui est particulièrement intéressant dans ce résultat, c'est que la masse m (à nouveau) s'élimine 
identiquement dans cette équation du mouvement: 


.. ôg 10, |: 
P+IL- |; m0) (50.110) 
8 äx* 2 4x’ ° | 


Remarquez, que nous aurions pu utiliser aussi un autre paramètre invariant que le temps propre tel que 
l'abscisse curviligne ds. Dès lors l'équation précédente s'écrirait: 
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3.8 * 4x 
LA Px [0e _1 eue | 8x" êx =0| (50.111) 
8 2 ax* 2 4x" |& d&s 


Nous pouvons encore simplifier cette relation mais nous garderons cette simplification pour la 
deuxième démonstration de l'équation du mouvement dans un espace quelconque (en faisant usage du 
principe variationnel cette fois) juste après. 


Il est très (très) intéressant d'observer que si nous restreignons la métrique à celle d'un espace euclidien: 


dx" (dm _ 1 de | dx 


— — — — =Û0 (50.112) 
Po &° ôx* 2 àx' | ds 

avec: 

es - Vus =0 (50.113) 

äx*  àx” 
Nous obtenons alors la simplification: 

2 À 2 
m, x OZ, Le (014 
E äs? as? 


Nous retrouvons donc la première équation du mouvement obtenue pour un espace plat! Le résultat est 
remarquable ! 


Conclusion: Aux mêmes conditions initiales de position et de vitesse curvilignes dans un espace (plat ou 
courbe) sans champ de potentiel (c'est ce que nous pourrions penser du moins selon nos hypothèses 
initiales….), correspond la même trajectoire quelle que soit la masse m de la particule (même pour les 
photons - la lumière - dont la masse est nulle!!). 


Nous pouvons maintenant étudier le principe de moindre action dans le but de rechercher le plus court 
chemin (aussi bien au niveau spatial que temporel) entre deux points dans un espace de géométrie 
donnée avant de s'attaquer au cas beaucoup plus complexe du lagrangien qui prend en compte le 
tenseur des champs... 


3.1. ÉQUATION DES GÉODÉSIQUES 


Intéressons-nous maintenant à obtenir le même résultat mais en faisant usage cette fois-ci du principe 
variationnel. Nous retomberons sur la même équation que précédemment pour tout type d'espace à la 
différence que cette fois-ci, nous prendrons la peine de la simplifier pour arriver à "l'équation des 
géodésiques". 


En partant de (voir développements précédents): 


ds = (gydx ar! 1 (50.115) 
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avec une paramétrisation telle que ;* et ;# sont fonction d'un paramètre temporel ou spatial. 


Pour une surface donnée sous forme paramétrique, nous cherchons donc à minimiser la longueur d'un 
arc ds en appliquant donc le principe variationnel (non dépendant du temps car les photons ne peuvent 
avoir un chemin plus rapide au sens temporel du terme entre deux points mais uniquement un chemin 
plus court - au sens métrique du terme): 


è è 


ÊS = fa(as) = féas) =0 (50.116) 
à à 
en unités naturelles. Or: 
(ds”) = 2ds6ds = S(g,dr dr) (50.117) 
En développant, et comme les indices ont le même domaine de variation: 


Ê(g;dx dx) = E 6d* | dr dx? + g,dx 6dx + g,dx 6dx? 
(50.118) 


âg.. ee : . 
= E Ga" Java + 2e, dr Gr 
üx 

d'où (nous avons déjà multiplié l'expression après la seconde égalité par ds/ds par anticipation de 
l'intégrale qui va suivre): 


(ds*) _ 1 dx dx ‘y 


ns ds+g ds (50.119) 
24s 2 ds ds | &x* 


2 Eÿ ds FT 


Je di dx 


Ensuite, il nous faut donc introduire ce développement sous l'intégrale: 


è 
[aa pese isa ds s+{a 


dr à 


=0 (50.120) 


En travaillant sur la seconde intégrale (après l'égalité), nous posons: 


u=8; dx et y 2 Sax ds (50.121) 


ds ds 


Donc par l'intégration par partie (cf. chapitre de Calcul Différentiel Et Intégral): 


ë ë è 
dr 6dx 
es äs = L 
[& EE lé vf D dd V (50.122) 
devient: 

è J j 
[as ds = ge 6axt | “1 Eÿ — Sax ds (50.123) 
J ds ds ds 
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Soit finalement: 


à À . 9 . 
fo 5) pese Eÿ —+ 6dx Je +, À sav) FC % Sdx'ds = 0 (50.124) 


Le terme non intégré ci-dessous est négligeable à cause de la présence du facteur 5x : 


Donc nous avons: 


te 


dx 0 (50.125) 


Sÿ Fa Gdx ds 


8x 


21 dr dx 


3 
[as Le. farce Je) Le AL Séxlds 


LL 


ô 
Lar Sel & 5à «|: CE deu be _ 
2 ds ds ds 


(50.126) 


Nous effectuons un changement d'indice: 


è è 
1 dx dx 2 64 
[re Ve D CE —|5ax" Hs =0 (50.127) 


ce qui nous permet de factoriser 5x*: 


: rs 
[ES | ldx dr Le &] Gdx"ds = 0 (50.128) 
5 


2 ds ds 8x" ds 


Comme 54x* et ds sont différents de zéro, c'est l'intégrande qui doit être nulle: 


—|=0 (50.129 
2 ds ds 0x" ds 


En développant le second terme: 


Qui s'écrit encore: 


et qui se simplifie en: 


lar dx' 085 _ des dr NT (50.130) 


2 ds ds 0x" ds ds Ws ds 


1dr dx 08, _ dr des dr d dt 5 (o1s1) 


24 do do d dd 
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d'x | des 108 dr dr 
ds? 8x) 2x | ds ds 


Ex 


Nous obtenons (à nouveau!!!) le système d'équations qui définit les "géodésiques", c'est-à-dire les 
droites de &,. Ces dernières constituent donc les extrémales de l'intégrale qui mesure la longueur d'un 
arc de courbe joignant deux points donnés dans €. 


Cette dernière équation, est celle qui nous intéresse dans le cas du lagrangien libre. Effectivement, si 
nous prenons le cas extrême de la lumière (ou des photons si vous préférez), cette dernière ne va pas 
chercher le chemin le plus rapide (le plus vite) au niveau temporel. Ce serait totalement en 
contradiction avec le postulat d'invariance de voir la lumière accélérer en fonction du chemin!!! Dans 
ce contexte, cela signifie que sur la trame spatio-temporelle, la seule chose qui a un sens est le plus 
court chemin spatial et non le plus court chemin temporel! C'est la raison pour laquelle cette dernière 
équation est appelée "équation des géodésiques" ou encore "équation d'Euler-Lagrange généralisée". 


Cependant, nous pouvons écrire cette dernière équation de façon plus condensée en introduisant les 
symboles de Christoffel si la métrique est un tenseur symétrique tel que g. = g,,. Effectivement: 


(50.133) 


dé, 1[, eu ed dv dr 1[8gu , dns }a an, 
k 


Ext 2|“ox elds ds ds? 2| 8x7 dx 8x" | ds ds 


et comme le symbole de Christoffel de première espèce (cf. chapitre de Calcul Tensoriel) est défini par: 


1 
Diy = 2! À ;Sx + 0,8 _ dre | (50.134) 


Remarque: Il est important de se rappeler que ce symbole contient toute l'information sur la 
métrique de l'espace-temps. Nous verrons un exemple plus bas comme quoi dans un référentiel 
localement inertiel ce symbole de Christoffel est nul. 


Alors l'équation d'Euler-Lagrange s'écrit: 


d°?x dx dx? | 
ar ns) Go 
Ex # ds ds 


La multiplication contractée (cf. chapitre de Calcul Tensoriel) de la relation précédente dans la base 
canonique par gŸ nous donne: 


É Or = a __dr 4 de 
EST E W ds ds Vds ds 
d°x . dé dé 

ds? F ds ds 


dans la littérature un changement d'indice est souvent effectué afin d'avoir au final (c'est toujours la 
même expression étant donné que les indices ont le même domaine de variation!): 
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d°x" epe Lol (0127 


avec T$ étant donc le symbole de Christoffel de deuxième espèce (cf. chapitre de Calcul Tensoriel) 


donné par: 
# = ÇA = 1 50.138 
léee le "5e (OS * Opus  OaSag | (50.138) 


et est appelé dans le cadre de la relativité générale la "connexion affine" ou encore "coefficients de 
connexion" et qui permet de trouver le système de coordonnées (via la résolution d'un système 
d'équations différentielles) en chute libre dans lequel l'équation de la particule est celle d'un 
déplacement uniforme dans l'espace-temps en fonction d'un système de référence (les deux systèmes 
étant donc reliés par la connexion affine!). 


Cette relation, de la plus haute importance, nous permet de déterminer comment un corps en 
mouvement va naturellement se déplacer dans un espace courbe et ce peut-être. indépendamment de 
sa masse !!! Elle nous donne donc la métrique dans laquelle nous devons poser un référentiel pour qu'il 
soit inertiel par rapport au corps considéré. 


L'équation des géodésiques antéprécédente est aussi l'équation différentielle du second ordre que doit 
donc satisfaire la représentation paramétrique d'une ligne sur une surface où s est la longueur le long de 
la ligne afin que sa longueur totale soit extrémale. 


Selon le principe d'équivalence, nous sommes donc en droit d'interpréter cette relation comme 
l'équation du mouvement dans un champ de gravitation quelconque, et donc d'interpréter le deuxième 
terme supplémentaire de l'équation comme l'opposé d'un terme de force gravitationnelle par unité de 
masse, c'est-à-dire comme l'opposé d'un champ gravitationnel. 


Remarque: Nous pouvons également écrire l'équation des géodésiques et utilisant le temps propre: 


a ——_—_— me ES a — 
LE 


=0 
dt'e d dt'clid dt? # dt di (50.139) 
Y à 


ou encore en utilisant la quadrivitesse: 


d?x" CE ON LS: 
É'C 
y 


du” + lé du “du” ={( (50.140) 
dt 


Encore une fois, si nous nous restreignons à un espace-temps plat, nous voyons trivialement que nous 
retombons sur la première équation du mouvement que nous avions obtenue: 
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car les composantes de la métrique de Minkowski étant constantes les coefficients de Christoffel sont 
tous nuls. 


Les solutions de cette dernière équation sont des lignes droites ordinaires données par: 


Bien évidemment, dans un espace-temps courbe général, les géodésiques ne pourront pas être 
globalement représentées par des lignes droites. Cependant avec une approximation au deuxième ordre 
en développement de Taylor (cf. chapitre sur les Suites Et Séries) nous arrivons à nous ramener à des 
droites (ce qui revient à ramener l'espace courbe à un espace plat). 


L'important dans tout cela, c'est que l'équation des géodésiques permet de constater que la courbure de 
l'espace détermine les trajectoires des corps qui s'y meuvent quelle que soit leur masse, qu'ils soient en 
mouvement uniforme ou non (observez la dérivée seconde dans l'équation des géodésiques!). Il ne nous 
reste plus alors qu'à effectuer la fin du travail et de mettre en relation la courbure de l'espace-temps 
avec l'énergie qui s'y trouve ! 


3.2. LIMITE NEWTONIENNE 


Nous avons montré plus haut (argument de Shild) que pour étudier la gravitation (en particulier l'effet 
Einstein), la géométrie courbe est nécessaire. Nous avions promis de montrer aussi qu'elle était 
suffisante. Il est temps maintenant de le faire ! 


Définition: La "limite Newtonienne" est une situation physique où les trois conditions ci-dessous sont 
satisfaites: 


C1. Les particules se déplacent lentement par rapport à la vitesse de la lumière. Ce qui s'exprime 
comme le fait que les variations des composantes spatiales de leur quadrivecteur sont très inférieures à 
celles de la composante temporelle (t étant le temps propre): 


dé dx’ 
— & 


= (50.143) 


d£ dé 


C2. Le champ de gravitation est statique. En d'autres termes, toute dérivée temporelle de la métrique 
est nulle. 


C3. Le champ gravitationnel est faible, c'est-à-dire qu'il peut être vu comme une faible perturbation 
d'un espace plat: 


Le © 70 TAy AVEC | <1 (50.144) 
et où 7, est constant (seul 4, dépend des coordonnées). 


Considérons l'équation des géodésiques obtenue précédemment: 
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La première condition (C1) nous amène à la simplifier sous la forme: 


Les deux autres conditions (C2 et C3 dont l'application a été mise en évidence dans le développement 
ci-dessous) nous offrent plusieurs simplifications dans l'expression du symbole de Christoffel de 
deuxième espèce: 


1 
dû 1 (00810 * oLoa — d1Lo0 ! 
ls 
7 958 18 (C2) (50.147) 


1 1 1 
ST A Ta + Bad [= 57 + 10 & 57" 0 ln 


1 c3) 


L'équation des géodésiques devient alors: 


d?x* _ l 
. : #9 % | — (50.148) 


et vaut alors pour la composante temporelle ( £i = 0): 


dx 1 de Ÿ 
7 57 8/00 wa =(0 (50.149) 


dt? 


Or (rappel de la métrique de Minkowski) #°* = Q pour 4 > 0 et pour à = 0 nous avons (métrique 
statique) 4,4, = 0. Donc obligatoirement, nous devons conclure que 43° ; 4# est une constante (et ce 
quel que soit le choix de la signature de la métrique de Minkowski). 


Quant aux composantes spatiales, nous savons que #* lorsque réduit à sa partie spatiale est une simple 
matrice identité 3x3, ce qui donne pour chaque composante spatiale dans le cas où nous choisissons 
(par tradition uniquement!) la signature - + + + de la métrique de Minkowski: 


Dh fET co cos 


Bien évidemment, le lecteur peut s'amuser à faire le développement qui va suivre avec la signature 
inverse (+ ---) et il verra que cela change seulement le signe du potentiel dans le résultat final du 
développement): 


Notons maintenant le temps propre 47 comme il est d'usage. Nous avons alors: 


dr lan a] (50151 
dr 7 1/00 
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. 2 . 
En divisant par | 4x° / 4r\ et en rétablissant 3x! =, nous obtenons: 


fe] vin 


dr | 
| dx° ” 2 fa 
.: (50.152) 
d°x 1 
- = — 6 #9 
| dé | ‘ 
dx € 
= 3, 
df? 2 10 


À partir d'ici nous posons (car nos illustres prédécesseurs ont tâtonné avant nous): 


2 2GM 
Ho = P=-— > (50.153) 
C FC 


tel que (relation qui nous sera très utile lors de l'étude de la métrique de Schwarzschild plus loin): 


2 2GM 2GM | 
goo = 700 + Ho =1l-—-P=1-—=|1-— | (50.154) 
€ rc 


où & est le potentiel gravitationnel, nous retrouvons l'expression de l'accélération gravitationnelle 
(équation de Newton-Poisson) de la mécanique Newtonienne (cf. chapitre de Mécanique Classique): 


2. .i 
=. _ (2) Ÿ:@ (50.155) 


avec à = 1,2,3. 


Ce développement, simple mais néanmoins remarquable par son interprétation, prouve que la géométrie 
courbe est suffisante pour décrire la gravitation (et donc la théorie de Newton)!! Ce vérification est 
nommée par certains le "principe de correspondance". 


4. TENSEUR D'ÉNERGIE-IMPULSION 


Le tenseur d'énergie-impulsion (T.E.L.) est un outil mathématique utilisé (notamment) en relativité 
générale afin de représenter la répartition de masse et d'énergie dans l'espace-temps. 


Prenons pour exemple le TE.I. qui considère en relativité générale la matière comme pouvant être 
approximée par un fluide parfait. Dans le chapitre de Mécanique Des Milieux Continus nous avons 
démontré: 


M =0G;n; (50.156) 


où À. a les unités d'une force et #; celles d'une surface. Ainsi: 


F, = TA; (50.157) 
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sous forme variationnelle cela donne: 


Ty = à. (50.158) 
Ÿ la,-0 


Calculons maintenant: 


Éd: 
D, = —2 = —— ©" = ——— (50.159) 


Remarque: Nous ne travaillons exprès pas avec des éléments différentiels afin de ne pas être coincé 
plus tard. C'est un peu du bricolage à la physicienne, mais bon cela marche (confirmé par 
l'expérience). 


En supposant que seuls le volume et le temps font que la force varie (ce qui suppose une densité 
constante quand même et que le système est inertiel) nous avons alors: 


A(oPa) 1 (7 1 A7 AxAx;Ax y, 
ÿ = ———— = — à VE ——< Ov, = ———Ûû— 
An ; Ân; é FAYA ; A An ñ 
(50.160) 
Ax;Ax;Ax; v,  Àx; 
= ———— J— = — . = V; M V. 
x, Ax, Fa hf #v; J t ©; è 


Ce qui donne simplement (cf. chapitre de Calcul Tensoriel) le produit tensoriel des vitesses: 
T=0V@V (50.161) 


Si nous généralisons cette relation aux quadrivecteurs-vitesse de la relativité restreinte, nous avons 
alors par définition le "tenseur d'énergie-impulsion": 


T=pi@ (50.162) 
ou sous forme indicielle: 
Fe Put; (50.163) 
soit sous forme contravariante: 

TŸ = puu?| (50.164) 


Cette relation est la justification pour laquelle la relativité générale est aussi indiquée comme étant une 
théorie des milieux continus par certains spécialistes. 


Maintenant démontrons que la dérivée: 


2,7 = à, (ou°u? )= 0 (50.165) 
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Remarque: Ce qui comme nous l'avons déjà signalé dans le chapitre de Calcul Tensoriel s'écrit 


TOI j= 0 dans les vieux livres. 


D'abord, rappelons que (cf. chapitre de Relativité Restreinte): 
= ul un) = pc, v vi, )= pc. v' ww) (50.166) 


et admettons que nous sommes dans les faibles vitesses telles que 7 = 1. Dès lors dans une métrique de 
Minkowski (+, -, -, -): 


5} ip = Ô; (ou) = à; (ocu*) 


= ©) (oru°)+8, (ocu)+0, (ou? )+, (ocu°) 


M PE C4 (50.167) 
_ [2e _#e")_ 8er) 3er) 
CU  &  & 


Or, nous reconnaissons dans les parenthèses l'équation de continuité (conservation de la masse) que 
nous avons démontré dans le chapitre de Thermodynamique et qui nous le savons est nulle! Aïnsi: 


: 6] + 
GP RP -Fe(o5)]-c.0-0 (50.168) 


Regardons par ailleurs ce que contient la composante 7% du TE.L: 
TO = oùu9 = pycyc=c?2p2p (50.169) 


En termes d'unités, il s'agit d'une densité d'énergie (nous voyons directement que cette grandeur ne peut 
être que positive). 


Regardons maintenant les autres composantes avec ; = 0 et j =1,2,3 : 
T0 j 0j j 2, j À cp17 
= ou u* = p{yc)lyv" |= coy'v =cp (50.170) 
où p' a les unités d'une densité de quantité de mouvement. 


Regardons maintenant les composantes du tenseur lorsque à, j = 1...3 (nous omettons donc la première 
ligne et la première colonne): 
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Ti = el ya il yu) | = pVuu) = Gij (50.171) 


Nous retrouvons donc les composantes du tenseur des contraintes d'un fluide parfait. 


Donc finalement, le T.E.I. peut s'écrire sous la forme d'une matrice 4 x4 réelle symétrique: 


go 7 7 76] Loyi? op pyev  pycv 
10 ll 72 #73 % d'A ; Fvf 
ml TT Te |_lore pv ppvv pp 
TO TA 72 | | op oÿvv pywv 


PURE ES PE pp'ev pv" pv pv 


Dans le cas où les vitesses sont faibles, c'est-à-dire 7 — 1, nous avons: 


2 
ec? pe pc pv = pc pc pc 
ri L 2cv* 2v*v° ov'v” ov'v L cv s, r® _ 
pv pv povv ovv pe To, TT 
pev* ov'v" ov ov ; ï 
ÆCV La ET Tor (50.173) 


E,IV jpcv pcv  pcv 


Cv + Ju 
2cv T” T. LH 


J 


PO T7 T7 


Nous retrouvons donc dans ce tenseur les interprétations suivantes des grandeurs physiques (bien que 
rigoureusement toutes les composantes aient des unités qui peuvent être vues comme densité d'énergie 
soit comme une pression). 


- 7 est la densité volumique d'énergie (elle est positive) 
- 710 720 730 sont les densités de moments 


- TA 702 78 sont les flux d'énergie 


Remarque: La sous-matrice des composantes spatiales: 


Th TA 7 
TŸ =|7TA T2 TB] (50174) 
72 78 


est la matrice dite "matrice des flux de moments" (appellation tout à fait discutable..). En 
mécanique des milieux continus (cf. chapitre de Mécanique Des Milieux Continus), nous avons 
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démontré que sa diagonale correspond à la pression, et les autres composantes aux efforts 
tangentiels dus à la viscosité dynamique. 


Bref, pour résumer sous forme covariante: 


densité 


d'énergie flux d'énergie 


viscosité (50.175) 


pression 


densité de flux de 
moment moment 


Montrons que la dérivée covariante (cf. chapitre de Calcul Tensoriel) du tenseur d'énergie-impulsion est 
nulle telle que: 


Var =0 (50.176) 
Donc: 
VAT = Vufoutu)=u"v, (a#)+ou#v, (n°) (50.177) 


Commençons par développer le premier terme: 
u'V (ou*)=u — © — © — — © ——— | (50.178) 
: 


Or, nous avons: 


d'où: 


uv, (ou*)=u Éz W (+ a a+ 12-609) (50.180) 


of æ 


Nous retrouvons entre les crochets l'équation de continuité qui est nulle. Par contre, le premier terme 
entre parenthèses est non nul comme nous l'avons vu lors de notre étude du quadrivecteur accélération 
dans le chapitre de Relativité Restreinte: 
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2y me 
y #1 ,,v SV 
u V,(ou }=u D p[25eà) (50.181) 


Mais selon le principe d'équivalence faible (PEF), nous pouvons toujours nous placer dans un 
référentiel tel que localement l'accélération soit nulle tel que (pour rappel, on ne met pas de flèches de 
vecteur pour les quadrivecteurs): 


a=0 (50.182) 


et il vient alors: 
2'Vy(eu#)=0 (50.183) 
Donc nous avons maintenant: 
VAT = 0" Vi (out )+eu#v(u")=0+ pu vu" )= ou#viu") (60.189 


Regardons ce que donne ce dernier terme mais en rappelant d'abord que dans le chapitre de Relativité 
Restreinte nous avions démontré que la quadri-accélération s'exprimait selon: 


4 4 


"= (sea par E(seays| (50.185) 
€ € 


Soit (nous ne prenons que les deux premières composantes comme exemples): 


a° =2{ Fa”"+v a +v'a) 
€ 
j à y* (50.186) 
a =Yy a + *a*+v a +vrar ]" 
€ 


Nous allons maintenant au fait montrer que: 


uŸV (c° ) =a" (50.187) 


Commençons par montrer que 4*V (2°) = aŸ: 


uXV (1°)= RU ; 2Ûrc) Pre arc) . (rc) 


+YV ———© (50.188) 
ac) 7 & » 7 & 
Or: 
97 9 9 _ GX _X_& (50.189) 
x  & x ©  & 
d'où: 
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o\_. (rc). 8 PS es 
UV y ( }= re (9 "x À 2/0 =—voa=a (50.190) 


Maintenant montrons que 4*V x (2!) = a} (les autres composantes se vérifiant alors automatiquement): 


=0 
Pan y| v CPL ve > _—. (50.191) 
ôt & ôt ec? 
4 
= y'a” {£a} =4 
Ê 
et donc nous avons bien: 
UV à (2° ) =a" (50.192) 


mais selon le PEF ," = Q alors: 
Fi 20 (2) =Û0 (50.193) 


et nous avons donc bien finalement: 


LÉ ju = Ô| (50.194) 


qui est l'expression de la conservation de l'énergie en relativité générale! En abaïissant les indices, il 
vient: 


VTT = 8° Vo (eme T)= V,T# =0 (50.195) 


5. ÉQUATION D'EINSTEIN DES CHAMPS 


Il est temps maintenant de nous attaquer au plus beau, à l'une des équations les plus fameuses de notre 
époque et qui fait briller les yeux de beaucoup de jeunes étudiants: l'équation d'Einstein des champs. 
Celle qui explique pourquoi la matière (l'énergie) courbe l'espace. Il existe plusieurs manières de 
l'obtenir. Les deux plus courantes consistent soit: 


1. À avoir une approche "à l'ingénieur": C'est-à-dire que nous procédons par comparaison avec un 
résultat limite connu qui est la loi de gravitation de Newton (c'est celle que nous avons choisie) 


2. À avoir une approche "matheuse" (très élégante mais un peu tombée du ciel): C'est-à-dire que nous 
utilisons le formalisme lagrangien et cherchons par tatonnements une densité lagrangienne qui nous 
permet de retomber sur quelque chose de connu. 


Bon ceci ayant été dit, rappelons avant de commencer quelques résultats que nous avons obtenus 
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jusqu'ici. Premièrement, nous avons réussi à démontrer avec brio que toute particule (supposée libre 
mais cela est laissé à l'interprétation. dans un espace courbe...) suit l'équation du mouvement des 
géodésiques: 


Dans le chapitre de Calcul Tensoriel, nous avons démontré (non sans peine) que ce que nous appelons 
le "tenseur d'Einstein" (qui est une constante dans un espace Riemannien donné) est donné par: 


G“"=R"- : g''R (50.197 


où &*” est le tenseur de Ricci (cf. chapitre de Calcul Tensoriel). 


Puisque la dérivée covariante du tenseur d'Einstein est nulle et que nous avons démontré que la dérivée 
covariante de T.E.I. l'est aussi, il est tentant de poser: 


Fos = SE = (50.198) 


où # est un constante de normalisation et devant satisfaire la relation pour qu'elle soit homogène au 
niveau des unités. Ainsi, il vient: 


Go = KTox (50.199) 
Pour trouver l'expression de la constante, nous allons nous placer en limite Newtonienne et exiger que 


la relation précédente reproduise l'équation de Poisson pour le potentiel gravitationnel (cf. chapitre 


d'Astronomie): 


Remarque: Cette relation montre que le potentiel de gravitation est relié à la matière de façon 
linéaire par l'intermédiaire de ses dérivées secondes. Einstein pensa donc que le premier membre 
des équations du champ en relativité générale, membre supposé décrire la géométrie de l'espace- 
temps, devait donc inclure d'une manière ou d'une autre les dérivées secondes, non pas du potentiel 
de gravitation, mais des potentiels de la métrique. En fait, Einstein essaya de généraliser le membre 
de droite de l'équation de Poisson: la grandeur recherchée devait inclure non seulement la densité 
de matière mais aussi l'impulsion (dès que le corps est en mouvement, son énergie augmente et donc 
sa masse). Pour évaluer l'effet gravitationnel d'un corps il fallait donc combiner sa masse au repos 
avec son impulsion. Il s'agissait finalement du T.E.I. de rang 2 qui est la généralisation du 
quadrivecteur impulsion de la relativité restreinte. 


Nous avons montré plus haut que dans la limite Newtonienne (approximation du champ faible): 


2® 
oo = Gex (50.201) 


€ 


et dans notre définition du T.E.I., pour une distribution de matière au repos (ou dans un référentiel 
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comobile c'est selon...) seule la composante suivante est non nulle: 


To = pe? (50.202) 


Il vient dès lors que l'équation de Poisson peut s'écrire: 
87C 
4-0 =-—2-/0 (50.203) 
[4 


Maintenant revenons sur la relation: 
(Ep L KT (50.204) 
En contractant les deux membres de la relation précédente, il vient: 
se Ca = «eg Los 


. 1 (50.205) 
g (Re - SRe = kg Te 


Or, le scalaire de Ricci (cf. chapitre de Calcul Tensoriel) est donné par R = g°°R 2 Il vient donc: 


l 
É 3e" ape) =kg Ty (50.206) 


Or dans la métrique de Minkowski (avec la signature -,+,+,+) il est immédiat que: 
g px = 4 (50.207) 


Donc: 


R-2R= Kg Too 


2 
R= kg Tu (50.208) 


En utilisant cette dernière relation, l'équation: 


1 . 
Ros — 37 8 =KTag (50.209) 
qui peut s'écrire aussi: 
Roa = ET, . À 0.210 
og los te &ar (0.210) 


peut finalement se mettre sous la forme: 
1 eœT lu : 
Ro © KTos + (KE 20 )8 0 =X Tas 58 Tog Sp | (50-211) 


Intéressons-nous à la composante & = «= 0 telle que la relation précédente s'écrive: 
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Koo = k[ro 7 (e"%)so) — E[ro (1) o}(-1) 


(50.212) 
: k[To 3) =k 5 Tan 
Explicitons cette dernière relation en utilisant la définition du tenseur de Ricci (cf. chapitre de Calcul 
Tensoriel): 
Re = Rue (50.213) 
Il vient alors: 
Roo = Ruo (50.214) 


Or, le tenseur de Riemann-Christoffel sous forme développée dans ce cas particulier est donné par (cf. 
chapitre de Calcul Tensoriel): 


# _p# Lara j jf CR 
KG 0 L KG u0 cu 8,100 " Sol x Lie Tilt (50.215) 


Remarque: En absence de champ gravitationnel et en coordonnées cartésiennes, il est logique que 
tous les symboles de Christoffel soient nuls. En effet, les symboles de Christoffel ne traduisent rien 
de plus que les forces d'inertie. Mais quand nous avons un champ de gravitation, les trajectoires 
suivies ne sont plus des droites, même dans le cas Newtonien alors les Christoffel sont non nuls... 


À l'approximation du champ faible lentement variable dans le temps, les symboles de Christoffel sont 
d'ordre O et leurs produits sont d'ordre {2 et les dérivées temporelles sont négligeables devant les 


dérivées spatiales. Il reste donc seulement les termes d'ordre O tel que: 
Rio = Ré uo = 9,100 (50.216) 
Or, nous avons vu dans le chapitre de Calcul Tensoriel que: 
RL, (org +8,8u - eg) (50217) 
ÿ = 5€ kEÿ Ex 18% (50.217 
Dès lors: 
at Hi 1 si CN 91Q) 
Roo = xl = 2x 5£ (80850 + Sogor - #£w)| (50218) 


Or dans l'approximation du champ faible la variation de la métrique par rapport au temps étant 
négligeable par rapport à la variation spatiale (l'approximation est un peu tirée par les cheveux il faut 
dire….): 
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Ko = 2,1% = 0, É g” (2x) ai 2, [(r* +h#)8, (700 + bo) | 


1 1 1 1 2Nn910Q 
= 0, (7 2%0) = 57 0 01h00 - > (On )(2,7* )= 7 0,80 (50.219) 
L 5 
=-_V 
Fo 


Par conséquent, la relation: 


devient: 
V?#0 =-{Tp (50221) 


et nous constatons immédiatement qu'il s'agit de l'équation de Poisson si et seulement si: 


__8rC 


5 


Æ 


(50.222) 


constante qui est parfois appelée "constante d'Einstein". Il s'ensuit immédiatement que le scalaire de 
Ricci est positif et donc que nous sommes localement dans un espace à courbure de type sphérique. 


L'équation d'Einstein des champs est donc sous forme définitive: 


ou de manière plus conventionnelle: 


1 res | 
€ 


J1 


0.224) 


La partie de gauche représente la courbure de l'espace-temps telle qu'elle est déterminée par la 
métrique et l'expression de droite représente une modélisation du contenu masse/énergie de l'espace- 
temps. Cette équation peut alors être interprétée comme un ensemble d'équations décrivant comment la 
courbure de l'espace-temps est reliée au contenu masse/énergie de l'Univers. Ces équations, ainsi que 
l'équation de la géodésique, forment le coeur de la formulation mathématique de la relativité générale. 


L'équation d'Einstein est donc une équation dynamique qui décrit comment la matière et l'énergie 
modifie la géométrie de l'espace-temps. Cette courbure de la géométrie autour d'une source de matière 
est alors interprétée comme le champ gravitationnel de cette source. Le mouvement des objets dans ce 
champ étant décrit très précisément par l'équation de sa géodésique. 


Par ailleurs, nous venons aussi de voir que l'équation d'Einstein se réduit aux lois de la gravité de 
Newton en utilisant l'approximation des champs faibles et des mouvements lents. 


Puisque le tenseur d'énergie-impulsion comporte 16 composantes dont au fait 10 sont réellement 
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uniques (indépendantes) puisque le tenseur est symétrique, nous pouvons voir l'équation d'Einstein des 
champs comme dix équations différentielles du second ordre couplées sur tenseur de champ métrique 


Eÿ- 


Ces équations différentielles sont en général cauchemardesques à résoudre, les scalaires et tenseurs de 
Ricci sont des contractions du tenseur de Riemann, qui incluent les dérivées et les produits des 
symboles de Christoffel, qui eux-mêmes sont construits sur le tenseur métrique inverse et sur les 
dérivées de celui-ci. Pour corser le tout, il est possible de construire des tenseurs d'énergie-impulsion 
qui peuvent invoquer la métrique aussi. Il est donc très difficile de résoudre les équations d'Einstein des 
champs dans le cas général et nous devons donc souvent nous appuyer sur des hypothèses 
simplificatrices. 


6. SOLUTION DE SCHWARZSCHILD 


La "métrique de Schwarzschild" (1916) est une solution de l'équation d'Einstein dans le cas d'un champ 
gravitationnel isotrope. Elle fournit les trois preuves principales de la Relativité Générale: le décalage 
des horloges, la déviation de la lumière par le Soleil et l'avance du périhélie de Mercure. Ces trois 
preuves sont très importantes car l'équation d'Einstein n'était pas démontrée expérimentalement à 
l'époque. 


Pour introduire cette métrique imaginons une source (par exemple le Soleil) qui produit un champ de 
gravitation à l'aide de sa masse M. Nous cherchons, pour comparer par rapport à l'expérience, les 
solutions de l'équation d'Einstein (en d'autres termes: la métrique) en dehors de la source (du Soleil 
donc...) de masse M. 


Remarque: Il existe plusieurs techniques mathématiques pour introduire la métrique de 
Schwarzschild. Le lecteur intéressé pourra chercher par exemple dans la littérature our sur Internet 
celle utilisant une transformation de jauge ("jauge d'Einstein" avec la "jauge harmonique") pour la 
contrainte de perturbation locale. Cette deuxième méthode est très élégante mais plutôt "matheuse" 
et nous préférons la méthode "à l'ingénieur". 


En d'autres termes, cela revient à avoir dans la région de l'espace qui nous intéresse (en considérant 
qu'il n'y a que l'astre en question et rien d'autre autour, n'y même l'énergie/masse propre au champ 
gravitationnel) la propriété suivante: 


devient alors: 


Mais nous avions montré plus haut que cette dernière relation peut aussi s'écrire à l'aide de la définition 
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du scalaire de Ricci R=gŸR,, : 


1 l 
R ue PT (etes )- O (50.228) 
et comme la paratnèse n'est pas nulle puisque nous avons démontré plus haut que gg a =4; il reste: 


R,, =0 (50.229) 


et donc in extenso le scalaire de Ricci est nul aussi. 


Nous devons donc trouver la métrique qui satisfait cette relation (en d'autres termes, une métrique qui 
loin de la source correspond à un espace plat puisque le tenseur de Ricci est nul). Comme il y en a 
plusieurs intéressons-nous à un cas particulièrement élégant avec comme les aiment les physiciens. 
plein de symétries. 


L'idée est donc de trouver une métrique si possible indépendante du temps (donc le champ 
gravitationnel aussi) et. à symétrie sphérique (l'astre étant lui-même de cette forme), prenant en 
compte la masse de l'astre central (c'est l'objectif majeur!) et telle qu'assez loin de la source (...) ou 
lorsque la masse est nulle nous retrouvions la métrique classique connue vue plus haut: 


ds? = dr? +r°48° +r°sin° 6d#* (50.230) 


Mais ceci n'est pas totalement exact! Effectivement, nous travaillons dans l'espace-temps. Or, nous 
avons vu que l'équation de la métrique curviligne est donné dans un espace-temps plat par: 


ds? = cat? — (dx? + dy? +47) (50.231) 
en passant en coordonnées sphériques nous avons alors: 


ds? = c°?d8? | dr? +748? +7? sin? 848 | (50.232) 


Et c'est sur cette équation de la métrique que nous devons retomber lorsque nous sommes éloignés de la 
source ou que la masse de celle-ci est extrêmement faible (la métrique de Schwarzschild doit donc être 
asymptotiquement plate, c'est-à-dire correspondre alors à l'espace plat de Minkowski). 


Donc mettons-nous à la tâche. D'abord, nous partons de ce que nous savons (vaut mieux!). C'est-à-dire 
que: 


ds? = Zudx* dx" (50.233) 


et en coordonnées sphériques avec le temps nous avons pour composantes r, 8, #,£. En toute rigueur, 
nous notons: 


(x®) =(cé,r,8,#) (50.234) 


les "coordonnées de Schwarzschild". 
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Sur un total de 16 termes qu'implique la relation antprécédent, nous en retenons finalement 10 à savoir 
les 4 termes de la diagonale et 6 autres termes d'interaction de sorte d'obtenir: 


2 2 2 
ds? = AN = PR OMAUe (50.235) 
+Fdrd8+ Gard + Härdt + 1d 04 + JdOdt + KA bat 


où À, B, C, sont des coefficients à déterminer. 


Avant de s'attaquer à ce travail, nous savons que selon une de nos contraintes de départ, lorsque la 
masse est faible ou que nous sommes éloignés de la source, nous devons donc retomber sur: 


ds? = c°?dt? —| ar? +r2d8? +r? sin? S2# | (50.236) 


dés lors intuitivement nous pouvons déjà écrire: 


ae 4222 ee + CrÂ48? + Dr? sin? 84 | . 


50.237) 
+Fard 9 + Gard + Hardt + 14804 $ + Jdddi + Ka fat 


ce qui admettons-le…. est un net progrès...! 


Si comme nous nous le sommes imposés au début, l'équation de la métrique est indépendante du temps, 
nous pouvons par symétrie du temps (hypothèse...) faire le changement de variable suivant: 


dét=-dft (50.238) 


sans que cela ne change quoi que ce soit dans notre 4,2. Or, nous nous rendons tout de suite compte 
que cela ne sera pas le cas. Immédiatement, pour que cela soit satisfait il faut: 


H=J-K=0 (50.239) 
ce qui nous amène (c'est déjà mieux!) à: 


ds? = Ac°df? - (zar? + Crid8? + Dr? sin? 848 + Fdrd8 + Gard + la 64 6) (50.240) 


Maintenant si le système est bien sphérique, l'équation de la métrique doit être invariante par la 
transformation 4 $ = —-d# (le contraire se saurait depuis longtemps si ce n'était pas le cas 


expérimentalement) et/ou également pour la transformation 489=-48. 


Donc pour que cela soit juste, nous voyons immédiatement que dans la relation précédente, nous 
devons imposer: 


F=G=/=û0 (50.241) 
Donc finalement nous n'avons plus que: 


ds? = Ac?dt? - (zar? +Cr248 + Dr? sin? af) (50.242) 


où À, B, C, D seront bien évidemment indépendants du temps (le contraire contredirait notre contrainte 
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initiale) mais peuvent par symétrie de la sphère être dépendants de r tel que: 


ds? = Afr)c?dt? : (2 (r}ar + C'(r}r{d8? +D(r) r? sin? af) (50.243) 
Maintenant, imaginons-nous sur la sphère (rigoureusement c'est une hypersphère mais cela aide quand 
même.) à une distance r fixe du centre de la source du champ à un instant donné t fixé. Nous n'avons 
alors plus que: 
ds? = C(r}r{4& +D(r) r sin? 864$ (50.244) 
puisque dt est nul (temps fixé) et dr aussi (distance r fixée). 


Nous avons par ailleurs enlevé le signe - car nous avons anticipé le fait qu'il va s'éliminer à la troisième 
égalité qui va suivre et nous le remettrons ensuite. 


Maintenant, imaginons-nous proche du pôle nord de la sphère (8 = 0) nous n'avons alors plus qu'en 


première approximation: 

ds? = C{r)r?d8? (50.245) 
et à l'équateur {8 = xr/ 2): 

ds? = D(r}r°d# (50.246) 


Par symétrie du champ, un déplacement angulaire infinitésimal en chacune de ces deux zones 
particulières doit pourtant être égal. Dès lors, nous ne pouvons que poser: 


Cr)= D(r) (50.247) 
Dès lors, l'équation de la métrique se réduit à: 
ds? = A(r)c?dt? - B(r)ar? -C(r}r? (46? +sin? 849) (50245) 
Montrons maintenant que nous pouvons choisir un système de coordonnées pour lequel Cr) = 1. 
Introduisons pour cela une distance définie par: 
F =JC(r)r (50.249) 
d'où: 
C(r}r? =F? (50.250) 


Il vient dès lors: 


_ C'{r}r? 4 2C'(r}r (50.251) 
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d'où: 


2rdr =C {r)r?dr +2C(r)rdr = 201 + TE ©] (50.252) 


Ce qui se simplifie encore en: 


FAF = Ccorar| + Ed ©] (50.253) 


C'{r) 
Mettons le tout au carré et divisons à gauche et à droite par C'{r}r? = F2: 
2 2 ; 
dr) =C(r)(dr) |1+ 
(ar) = ca ÿ xO | 
(50.254) 
1 2 
= dr? = —|1+ C'{r)| ar? 
Cr) RS 
d'où: 
2 
Bar? = le co) dr? =B(r)dr? (50.255) 
COL 2Ce) 


Dès lors, l'équation de la métrique s'écrit: 
ds? = A(F)c?dt? - B(r)dr?-7?(d46? +sin? 848) (50.256) 
C'est donc comme si C'{r)= 1: 


ds? = A(r)c?at? - B(r}dr? - r? (de? + sin? af) (50.257) 


Donc: 
E = Diag ( A(r),-8(r),-r?,-r? sin? 8) (50.258) 
Soit: 
Ar) O0 0 0 
0 -B(r) 0 0 
= (50.259 
El 6 0 -72 o PO 


0 0 0 -r?sin 28 


et le tenseur métrique contravariant correspondant (dont nous allons avoir besoin plus loin): 
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1/ Afr) 0 0 0 
»_| © -U8@ 0 0 
| & 0  -1/r2 0 ee 
0 0 O  —1/{r? sin? 8) 


tel que (cf. chapitre de Calcul Tensoriel): 
g Zyn = 6 (50.261) 


Maintenant, pour déterminer les coefficients restants (soit À et B) nous allons nous aider de la relation 
que doit satisfaire la métrique: 


- [a 4 _ [e 4 _ 9: 
Re = Rev — Rav =Û0 (50.262) 
Soit sous forme développée (cf. chapitre de Calcul Tensoriel): 
CS & £ ré ra 
Rice _ Dal y 8, Tux + TT ae Lux v£ (50.263) 
Fe : £ - 8 x _ .205 
Loan lool ag — Pal vg © 0 


avec bien évidemment (cf. chapitre de Calcul Tensoriel): 


1] 
g (gx + &u,j — er) (50.264) 


Ur 1 
l'y = 5€ (es +4 ;gu — dy) =S 


C'est dire que l'on a du travail sur la planche... Bon d'abord puisque la métrique est simple les seules 
dérivées non nulles sont: 


Et — À' Er — ni Er — —2r 


- | (50.265) 
= —2r sin? 8 Egpé = Dr? sin 8 cos 8 


Egar 


Nous en déduisons simplement les 9 éléments de la connexion (nous pouvons détailler sur demande...) 
non nuls: 


If, =1}, =-424 ;,=-4%28 T',=-B2B 
A =r, =-lir Pis =ria ré = =-1/r (50.266) 


Trp=rsin 8/8 Dre = py=-cot8 Ti = sin Bcos 8 


Maintenant que nous avons ces termes de la connexion, il nous faut calculer leur dérivée pour pouvoir 
exprimer les deux premiers termes de: 


Lp& D œ 6 rx £ = 
Bu = Ra = lou Ts rl las lulos=t (5026 


Il y a alors 10 termes non nuls qui sont: 
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de 2 n ! 1 
Le, — 1 LAS — L 2 FE , 4° A8 
24 24 2B 28? 
FD FL 8 ” 1 
Le cu DB D 2 l'é r7 © 1 &r = 2 
L #5 1 
867 3 réel = (50.268) 
DRE : 2 0 
r _sin @# rsin 88 T9. =rS = 1 
°N  $ FL PO CR 2 
Cr’ = r2sin 8cos 8 res = cos? 9 sin? 9 
PET D 


Nous avons finalement pour chaque composante du tenseur de Ricci: 


A" A'B" 4 4° A'B" A' À 4 A'B' A' 
Rs = + À (0) + À — 
2B 2B? 2AB 4AB 48° rB 2B 4AB 48? rB 


R, = 2. _ _4", 4° _8" + A7 ,8°,2 _ A'B', 8° ,8' 
2B 928? 24 24 2B 44 AB? y? 4A4B 48? rB 

_4"_AŸ _A'B B' 

7 24 44 A4AB rB 


1 r8 1 à, > Ar Br 2) Ar rB' 1 
= | 4 + cet 8 || + 5 
" 3 me) ) | is ) | 2AB 25? ;) 2AB 25° E 
Rp =(sin?[1/8-78182-2]+1)-(0)+(-sin? [2/8-2]-2) 


- sn 0| À +421 = snte| Hp) 
24B 25 BE 24B 25? B 


Ra =(0)-(0)+{cot8fr)-{cot8/r)=0 
(50.269) 


Les seuls éléments directement non nuls sont: 


R,=—-—-———-—" 
. rB 0 
F F7, 
= _ ——-]|=û 
Ree 2AB 28? B 
Roy = sin? AE pi] sin 8e = 
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Sous une forme plus conventionnelle (conforme à la littérature) nous pouvons simplifier un peu et par 
ailleurs ne garder que les trois premières équations: 


R, = -2rA@ (4)B+r8, (4ÿ B+rA8, (4)9,(8)-448,(A4)B =0 
R, = 2rA@ (A4)B-r8, (AŸ B-r48 (4)9,(B)-4429 (B)=0 (50.271) 
Rs6 = r9, (4)B-r8, (B)A+24B- 2AB? =0 
Si nous additionnons les deux premières équations, il nous reste: 
8,(4)B+A0,(B)=0 (50.272) 
ce qui équivaut à: 
,(4.8)=0,(4)B+40,(B)=0 (50.273) 
et cela nous donne aussi: 
0,(4)B=-A40,(8) (50.274) 
Nous avons donc: 
Re =r0,(A)B-r8, (B)A+2A8B - 2AB? =0 (50.275) 
qui devient: 
r(8,(4)8-8,(2)4)+248-248? =0 
= r(-2,(8)4-28,(8)4)+248 -248? -0 


(50.276) 
= -r8, (8)+B(1-8)=0 


= r8,B(r) = B(r)(1-28(r)) 
où nous avons diviant par 2A lors du passage de la deuxième à la troisième ligne. 


Le lecteur pourra vérifier qu'une solution de l'équation différentielle est: 


=] 
1 

Br =|1+—— (50.277) 

@ | = | 


cr 


où S est une constante réelle non nulle. En conséquence, la métrique pour une solution statique, 
symétriquement sphérique et dans le vide (...), s'écrit: 


—1 
as? = (rjetai -[1+ dr? —r? (48? +sin° 848) (50.278) 


Fr 


Il nous reste à déterminer un coefficient. Mais comme: 
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8,(4-B)=0 (50.279) 


il vient: 
A.B=K=c* (50.280) 


Donc: 


1 
= ef) (50.281) 
S 


Fr 
Donc finalement: 
1 1. 
ds? = e(r+)éaf (4) dr? — r? (a8” +sin’ af) (50.282) 
Sr Sr 


Notons que l'espace-temps représenté par cette métrique est asymptotiquement plat, ou, en d'autres 
termes lorsque 7 —0©, la métrique s'approche de celle de Minkowski, et la variété de l'espace-temps 
ressemble à celle de l'espace de Minkowski. 


Pour calculer les constantes K et S, nous utilisons l'approximation du champ faible. En d'autres termes, 
nous nous plaçons loin du centre, là où le champ de gravitation est faible. Dans ce cas, la composante 
g de la métrique peut être calculée. 


Effectivement, nous avions étudié plus haut la limite newtonienne et avions obtenu la relation suivante: 


2GMW 
Lo = #00 + #00 -{1- , | (50.283) 


avec (cf. chapitre d'Astronomie) o= GW! re?. Donc in extenso nous pouvons poser sans trop de 


crainte: 
1 2GM 
= K|1+—|-|1- (50.284) 
a. | r) | rc? | 
soit: 
Kg=ie = 2% 50205 
= Cie a 2 


Finalement nous avons pour la "métrique de Schwarzschild": 


2 2f302, 2 
dr? (de +sin af) _—_— 


cr 


—— lat? - —_— 
c?r É : 3 


soit en unités naturelles: 
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ds? = i-2%) a® — dr -r? (28 +sin? af) 
oO 


r 


Attention!!! Certains ouvrages de référence ont la métrique de Schwarzschild avec des signes différents 
car ils prennent la métrique -,+,+,+ au lieu de la métrique +,-,-,-. 


Une singularité toute (physiquement) apparente apparaît lorsque: 


2GW 
pe) 
cr 


ou en d'autres termes, lorsque la coordonnée du rayon r vaut: 


_2GM 


e? 


Fr 


Ce rayon, que nous avions déjà déterminé lors de notre étude la mécanique classique, est appelé "rayon 
de Schwarzschild". 


Le rayon de Schwarzschild est défini comme le rayon critique prévu par la géométrie de Schwarzschild, 
en deçà duquel rien ne peut s'échapper: si une étoile ou tout autre objet atteint un rayon égal ou 
inférieur à son rayon de Schwarzschild (qui dépend de sa masse, cf. ci-dessous), alors elle devient un 
Trou Noir, et tout objet s'approchant à une distance de celui-ci inférieure au rayon de Schwarzschild ne 
pourra s'en échapper. Le terme est utilisé en physique et en astronomie pour donner un ordre de 
grandeur de la taille caractéristique à laquelle des effets de relativité générale deviennent nécessaires 
pour la description d'objets d'une masse donnée. Les seuls objets qui ne sont pas des trous noirs et dont 
la taille est du même ordre que leur rayon de Schwarzschild sont les étoiles à neutrons (ou pulsars), 
ainsi, curieusement, que l'univers observable en son entier. 


Remarques: 


R1. La singularité dans la métrique lorsque l'on atteint le rayon de Schwarzschild est apparente car 
il ne s'agit que d'un effet du système de coordonnées utilisées. 


R2. Un théorème remarquable affirme que la métrique de Schwarzschild est l'unique solution aux 
équations d'Einstein dans le vide possédant la symétrie sphérique. Comme la métrique de 
Schwarzschild est également statique, ceci montre qu'en fait dans le vide toute solution sphérique 
est automatiquement statique. Une des conséquences intéressantes de ce théorème est que 
n'importe quelle étoile pulsante qui reste à symétrie sphérique ne peut pas générer d'ondes 
gravitationnelles (puisque la région de l'espace-temps extérieure à l'étoile doit rester statique). 


Maintenant que nous avons la métrique de Schwarzschild revenons sur le critère de Schild que nous 
avions vu lors de notre étude classique de l'effet Einstein. 


Si nous réécrivons la métrique de Schwarzschild pour un corps immobile, nous avons la métrique qui se 
simplifie en: 
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ds? = fr Jeter (50.290) 


2 
c°r 
En faisant intervenir le potentiel gravitationnel (cf. chapitre d'Astronomie): 


GM | 
@=—— (50.291) 
Fr 


la métrique s'écrit: 


d'où en introduisant le temps propre: 

2 

cat = fi + Jar (50.293) 

Fa 

d'où: 
1/2 
dT= É _ # df (50.294) 

soit: 


9 -1/2 
dé = É — 2) dT (50.295) 
€ 


Le développement au deuxième ordre en série de Maclaurin (cf. chapitre de Suite Et Séries) de la 
racine négative donne: 


dé = fi+&) dT (50.296) 
C 
Ainsi, nous avons: 


dé = É + Fée dT (50.297) 
[es 


Donc cela démontre que la courbure (la gravitation) engendre une dilatation du temps d'autant plus 
importante (dans le sens qu'il s'écoule plus vite) que le champ de gravité est intense (la masse M est 
grande) ou que nous sommes près du corps sous l'influence du champ (rayon r petit). 


Or, pour la Terre, le terme: 


p= — 
r 


est relativement faible. Mais pour un Trou Noir ou une étoile à Neutrons, ce n'est plus vraiment le cas 
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et la dilatation devient importante et les effets accessibles à la mesure. 


7. VÉRIFICATIONS EXPÉRIMENTALES 


Nous allons maintenant passer en revue les quatre vérifications expérimentales classiques du 20ème 
siècle de la théorie de la relativité générale qui sont: 


1. La précession du périhélie qui au niveau des résultats numériques nous posait problème avec les 
outils de la mécanique classique (cf. chapitre d'Astronomie). 


2. La déflexion des ondes électromagnétiques (lumière) passant proches d'un corps stellaire massif qui 
au niveau des résultats numériques nous posait aussi problème avec les outils de la mécanique classique 
(cf. chapitre d'Astronomie). 


3. La démonstration du critère de Schild (déjà faite dans les paragraphes précédents) comme seul 
moyen d'expliquer rigoureusement le redshift gravitationnel et l'hypothèse de ralentissement du temps 
dans un champ gravitationnel. 


4. Le retard des signaux électromagnétiques se propageant près du corps massif. Retard désigné sous le 
nom "d'effet Shapiro" dont les applications numériques sont utilisées pour le fonctionnement du G.P.S 
et que nous verrons plus loin. 


7.1. PRÉCESSION DU PÉRIHÉLIE DE MERCURE 


Traitons donc maintenant un des plus fameux exemples de la relativité générale: la précession du 
périhélie de Mercure. Nous avions déjà traité ce cas dans le chapitre d'Astronomie, mais nous avions 
mentionné que le résultat théorique numérique ne correspondait pas à l'expérience. Nous allons voir en 
l'équivalent d'une dizaine de pages A4 de développements détaillés comment la relativité générale 
permet de réconcilier théorie et expérience. 


Pour étudier ce cas, nous allons utiliser le formalisme lagrangien vu dans le chapitre de Mécanique 
Analytique. 


D'abord, rappelons que nous avons obtenu pour la métrique de Schwarzschild: 


(50.298) 


ds? = fi _ Jrad (48 +sin?8af) 
cr fi . | 
cr 


Ce que nous noterons en divisant par 42: 


nt à À (82 +sin? aÿ°) 
ct fr . (50.299) 
c?r 


et pour abréger les notations, nous posons }; = Gif ; -? tel que: 
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1= (-2)4r > F2 7? (e° + sin? a?) 


F3 


Maintenant rappelons que (cf. chapitre de Mécanique Analytique) en unités naturelles: 


(50.300) 


68 = [ô(as)=[6{1.45)=0 (50.301) 


Donc (c'est très grossier mais cela fonctionne. c'est aussi ça parfois la physique.…): 


5$ =[5 CRE _r° (& + sin? a?) ds=0 (50.302) 


£=|I- L a ie ne ET un (e° +sin? &ÿ?) 
(50.303) 


F3 


Les équations de Lagrange nous donnent pour la coordonnée 8: 


d O EL 
= (50.304) 
ds 09 88 
avec donc: 
CA =-2r2à (50.305) 
88 
d'où: 
COLOR (50.306) 
ds 08 
et: 
. = —2r? sin cos Cr (50.307) 


d'où finalement pour la coordonnée 8: 


(ré) = r? sin cos Cr (50.308) 


Faisons de même pour # . Nous avons d'abord: 
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ane 8 (50.309) 
9$ 
et: 
HR 
— = (50.310) 
0$ 


et il vient immédiatement de par l'application de l'équation d'Euler-Lagrange: 


CHERS T . 
al sin &ÿ}= 0 (50.311) 


Faisons de même pour t: 


oE = 2f1- =] 25 (50.312) 
d£ Fr 


et il vient ici aussi immédiatement: 


sf 2} Ô (50.313) 
ds Fr 


Dès lors: 


2e" = À (50.314) 


Fr 


Maintenant nous allons supposer que le mouvement de Mercure est dans le plan équatorial tel que 
8= 37/2. Dès lors, la relation obtenue plus haut: 


dt: it. . 
pal sin &ÿ)= 0 (50.315) 


se simplifie en: 


(à =0 (50.316) 
5 


d'où: 
riÿ=c*=8 (50.317) 


Nous avons aussi dès lors l'expression de la ligne d'Univers qui pour rappel est: 


= h-2)24 on (é? +sin? 8ÿ?) 


Fr 21 
Fr 
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(50.318) 


qui puisque 8= 7j 2 (qui est donc une constante) se simplifie en: 


(50.319) 


ea EE «à ns 
r | 7 
1- 
Faisons mainentenant le remplacement suivant: 


r$= B (50.320) 


qui est donc une constante comme nous l'avons démontré juste plus haut ainsi que le remplacement 
suivant (qui est aussi une constante comme nous l'avons démontré juste plus haut): 


A 


É pi ] (50.321) 
Fe 


dans l'élément de ligne d'Univers et nous obtenons:: 


— - 2 
Î= n-2) e2 4? fn?) F2 37 (50.322) 
F 


Fr 


Considérons aussi r comme fonction # alors: 


är 
_d& de. 050 
dé df | 
ds 


d'où: 


: : B 
Fr =r'f=r— (50.324) 
r 


Ainsi, nous pouvons réécrire la ligne d'Univers sous la forme: 


2 2 
fr 2 = A -r° = Ê - 2 (50.325) 
r r rir 
Faisons un changement de variable en posant: 


1 dr 1 cdi 
F=—-——=-— —dr=-— (50.326) 
du u° u? 


d'où: 
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du 
ou OP in (50.327) 
dé n° 2 


Ce qui donne pour notre ligne d'Univers: 
(1- Qu) =c? 47 -u 2 B?-(1-Quju?B? (50.328) 
ou: 


eg D = ET (50.329) 


en différenciant: 


Qu'u"= Qu + Gun T7 (50.330) 


ou écrit autrement: 


2à 
Qu 'u"+ Quu - 6lu?u'- _ =Û0 (50.331) 
B 
ce qui se simplifie et se factorise en: 
Î 2 
u'| Mer dE — 34" |=0 (50.332) 
B 


La première solution possible est bien évidemment: 

u'=0 (50.333) 
d'où comme r=1/u: 

r=c# (50.334) 


Le mouvement circulaire est donc aussi une solution du problème de Kepler en relativité générale dans 
un champ de Schwarzschild. 


L'autre solution sera: 
+ 2 
u'— — + Hu =0 (50.335) 
p2 


Soit écrit autrement: 
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Î 
u'tu = "+ nu (50.336) 
p2 


elle correspond à l'orbite du problème de Kepler. 


Faisons la comparaison en considérant en mécanique de Newton le mouvement d'une particule de 
masse m dans un potentiel U. Le lagrangien (cf. chapitre de Mécanique Analytique) est alors: 


L=T-V= am —mf(r) (50.337) 


En coordonnées polaires nous avons déjà vu dans différents chapitres (de Calcul Vectoriel et 
d'Astronomie) que la vitesse s'écrit alors: 


2 2 
L= r() +r? (£e) F mf(r) (50.338) 


OZ doL | 
————=0 (50.339) 
&r dt &r 
ce qui donne: 
2 2 
CA = rm (Se) —Rf Cr) et Cl = mit (50.340) 
êr dt dt Or dt? 
d'où: 
2 2 
7 =-r(#) — fr) (60.341) 
dt dé 


et comme nous l'avons vu dans le chapitre d'Astronomie: 
d 
r?2 dÿ _ K (50.342) 
dé 


est la constante des aires. Introduisons: 


d'où: 


u'(#) = (5) (50.344) 


r 


et donc: 
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dr _drdÿ KE 
+ ua (#)-3= Ku'($) (50.345) 
Ainsi: 
dar _ à dé pt ER NlE =RN À 
dat dÿ at 2" (#)] ri BEC de (50.346) 
= -Ku"(g}u? 
L'équation: 
2 
=r(de) — f'{r) (60.347) 


devient alors: 


2 
_x2y “(p}u? = (Se) = f'{r) (60.348) 


dt 
Or: 
LT (50.349) 
Fr 
d'où: 
x2 
KE u"(}u? = .f'{r) (50350) 
Fr 
soit: 
-Kfu"(g}u? = K?u9 — fr) (50.351) 
ou: 
1 fr) 
u"(p)+u(g)=— (50.352) 
(Bru(9= 


Il s'agit donc de la "formule de Binet non relativiste" qui donne donc la relation entre u=1/r et # pour 
une force centrale (cf. chapitre d'Astronomie), Dans le cas d'un potentiel newtonien: 


ftr)= = f'(r)= — = GMu? (50.353) 
Fr r 
d'où: 


u"(#)+u(#)= D (50.354) 
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avec pour rappel: 
à 
pee (50.355) 
dt 
Or, rappelons la forme de celle que nous avions obtenue avec la relativité générale: 


Î 
u'u = — + Nu? (50.356) 
p2 


Ainsi, nous voyons que le terme analogue en relativité est: 


CM 
/ eg? (50.357) 
BD 


et que la relativité générale ajoute le terme 3;,,2. Or, comme en relativité générale: 
B=r?$ (50.358) 


Alors: 


EME 
ds dt ds 


Or, dans le cas de l'approximation des champs faibles: 


Î 2 GM 
_ (50.359) 


1 cdi? _- dé + + dé | (50.360) 


ds 
d'où: 


dé eh #1 ce? (50.361) 


donc finalement: 


ru cM ._ CM _GM 

B? c?rt (4) a) | afdéŸ K? (60362) 
— a Fr = 
dé ds dt 


Ceci dit, il est vraiment intéressant de remarquer que l'équation pour la relativité générale: 
i Î 2 . 
u'+u=—+u" (50.363) 
p2 


peut être interprétée comme l'équation de Binet pour la mécanique classique: 
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il 1! 
u'+u = — _ (50.364) 
Li 
avec le potentiel: 
GM 
ftr)= A (50.365) 
F F 


avec y=/K°. 


Revenons maintenant à notre équation: 
ik Î 2 
u'+u=—+%u" (50.366) 
p2 


Nous aimerions savoir si le deuxième terme à droite de l'égalité est négligeable ou non par rapport au 
premier terme de droite de l'égalité et ce afin de pouvoir appliquer la théorie des perturbations. 


Nous allons d'abord poser à l'aide de l'approximation des champs faibles faite plus haut: 


GW | 
ms (0367) 


8? (50.368) 


Rappelons qu'en coordonnées polaires: 


2 2 
v? = (a) +r (de) (50.369) 
dt dé 


en approximation, nous pouvons grossièrement poser que: 


2 
y? & r2 a (50.370) 
dé 
Dès lors pour Mercure...: 
Fu? v? 4 
= ra 0 (60.371) 
BE? 


Donc nous voyons de suite que nous pourrons appliquer les théories variationnelles sur le terme 3:,2. 
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Ainsi, posons: 


Î GM GM  _GM° 
FOR 7 on 12 


(50.372) 


L'équation: 


prend alors la forme: 


2 


LL E Le 
u'+u = CEE (50.374) 


Pour résoudre cette équation différentielle, nous allons utiliser l'approche de la théorie des 
perturbations (cf. chapitre de Calcul Différentiel Et Intégral), Nous allons donc nous intéresser à une 
solution de la forme d'un développement de Taylor en deuxième ordre seulement en £: 


u =up+em +O(E) (50.375) 


Où #p,#, Sont bien évidemment dépendants de # et devront être déterminés! Pour cela, nous savons 
qu'il faut remplacer l'expression précédente dans l'équation différentielle telle que: 


(0 + Et + O(#)) “+ (29 + Et + O(E)) = C+ 2 (bo + Et + o(&)) (50.376) 


Ce qui se simplifie en: 


2 

Et a 

un +eu! +up + =C+-0+0O(E2) (50.377) 
C 


où rappelons que: 
üg +üp = C (50.378) 


est l'équation classique obtenue plus haut: 


: GM 
u +u = PI (50.379) 
considérons la solution du type: 


y =C+Dcos$ (50.380) 


où D est une constante arbitraire. Or, comme nous l'avons vu dans le chapitre d'Astronomie dans le cas 
de la précession du périhélie: 
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1_ B 
mc +kcos((8) (50.381) 


est au fait une ellipse. Ce qui signifie que toute solution de la forme: 
un =C+Dcos(#) (50.382) 


est aussi une ellipse! 


Pour l'équation en £: 


2 
Eu"+ Et = _ (50.383) 


qui se simplifie en: 


2 
C'+ Dcos 2 
tj + = ad dd =C+2D — cos? g | (50:64) 
C Ê 


Puisque (cf. chapitre de Trigonométrie): 


(50.385) 


2 _ cos(2#) +1 
cos Ce 


Il vient: 


: 26) +1 
üy + = D IT SL a Le a 
C 2 


. e (50.386) 
= fe +] +2D cos p+ COS (24) 


Pour déterminer :,, décomposons-le en trois termes: 
= +A2+43 (50.387) 


Ce qui nous donne immédiatement (en injectant les trois termes respectivement dans la dérivée seconde 
et le terme seul): 
2 2 
A +4 = Re 
20 2C 
À "+ ZX, = 2Dcosf = X, = Désin # (50.388) 
ra D? 

À "+ As = —cos(2#) = À, = -— cosf(2 


Donc finalement: 
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2 
ü = C++ Dpsin d- cos 


2 
(29) (50.389) 


La solution cherchée est finalement: 


2 2 
à tan +006) (0 + Dancge| + D + Dpt D co(26) 
(50.390) 
= cree +2 + Dcosg- #2 co5(24) +EeDésin Ÿ 
b 2e 6C 


C'est donc avec: 
ED? 5 | 
u(#) = CHE + Deos fe cos(24) + EDé sin # (50.391) 


qu'il faut calculer le déplacement du périhélie (on y arrive...). 


Nous voyons relativement vite en observant la relation précédente que le seul terme dont l'amplitude 
n'est pas constante est £D#sin #. 


Rappelons alors que (cf. chapitre de Trigonométrie): 
cos (#- Ef) = cos cos (sg) + sin sin (s#) (50.392) 


Ce qui peut grossièrement s'écrire aussi en première approximation en utilisant les développement de 
Maclaurin au premier ordre (cf. chapitre de Suites Et Séries): 


cos (#- E#) Z cos #+ Ÿ sin SE (50.393) 
d'où: 
u(#}=|C+ 2c+ 2 +| Dcos #— e D cos(26) +sDésin 
| 2C 6C 
eD° D? 
= COLE cos C4) Deos(s- Ef) (50.394) 


2 2 
= C'+Dcos(é-Ef)+ Ce os (2 | 


Nous savons que l'orbite d'ordre zéro est: 
up =C+Dcos(#) (50.395) 


L'effet du dernier terme: 
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eo à 2 
EC + — — — 2 50.396 
| 2 6c°*{ 9) Te 


est donc d'introduire une petite variation périodique dans la distance radiale. Ce terme n'affecte pas le 
déplacement du périhélie. C'est le terme £# dans: 


cos(#— ef) = cos {#(1- £)) (50.397) 
qui introduit une non-périodicité qui peut être non négligeable dans le cas où # est grand. 


Le périhélie (point le plus proche du Soleil) se présente donc quand r est minimum soit x =1jr 
maximum. Or, u est maximum quand le terme qui nous intéresse est maximum, c'est-à-dire: 


f(1-Ee)=27m nEZ (50.398) 


Nous avons approximativement: 


2 
ei = 27n(1l+e) (50.399) 


(1e) 


Pour deux périhélies successifs, nous avons un intervalle: 


Ag=2n(1+e)=27+27E=27+6# (50.400) 


au lieu de 2x. Ainsi, le déplacement pour une révolution est: 
M? | _6r®M? 6x M? 676 M° 


e2K? e2K? È È d® 2 cry (50.401) 
[#4 PF _— 
dé 


Ôÿ = 27E = 2x3 


où K est donc la constante des aires et M la masse de l'astre central et puisque: 


d$ _—. 
v=@r=—".r (50.402) 
dé 
Bref, nous avons au final: 
6x M° 
Âg= —5 53) (50.403) 
Cvr 


Relation à comparer avec celle que nous avons obtenue dans le chapitre d'Astronomie avec un 
traitement newtonien classique: 


rG M? 
LA= 
Cv r 


(50.404) 


Nous retrouvons donc à la perfection le facteur 6 qui manquait dans les traitements classiques! 
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Pour Mercure une application numérique donne: 


- 6x M° 
c?r2w 


et l'expérience donne ä$ = 42.6"+1.0". De l'aveu même d'Einstein, en obtenant ce résultat il eut des 


z 4289" (50.405) 


palpitations et l'impression de frôler la crise cardiaque et satisfait de son effort herculéen qui l'avait 
totalement épuisé il prit une longue période de repos. 


Pour terminer sur ce sujet, signalons une deuxième écriture fréquente dans la littérature concernant le 
résultat obtenu. Effectivement, nous avons démontré dans le chapitre d'Astronomie que le paramètre 
focal était donné par: 


(50.406) 


GM GW 
Il reste donc: 
67 CG 
Âg= œ (50.407) 
CP 


et nous avons démontré aussi dans le chapitre de Géométrique Analytique que: 
A 
p=a (1 — 8 } (50.408) 


Il vient donc au final la forme la plus classique: 


Aÿ= Cali-#) (50.409) 


7.2. DÉFLÉXION DE LA LUMIÈRE 


Nous avons donc montré que: 
LL Î 2 / 
u'+u=—+ 3%" (50.410) 
p2 


en remplaçant les facteurs par leurs valeurs respectives, nous avons: 


GW GM 5 | 
=——+3——"14" (50.411) 


LL 
ü +üu 
c28? c? 


Mais nous avons vu plus haut que: 


2 
B? = LES (50.412) 
GM 


et comme K est la constante des aires donnée par la conservation du moment cinétique lui-même 
constant (cf. chapitre de Mécanique Classique): 
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2 248 _ 


b 
b=mr°@ = mr° = /nk& = K=— (50.413) 
dt D 


Nous avons alors pour un photon 7» — 0 = # —+#0w. 
Finalement l'équation du mouvement d'un photon se résume à: 


: GW 3; 
u'+u=3——u" (50.414) 
eg? 


Posons maintenant pour simplifier les notations: 


G 
re= (50.415) 
€ 
alors: 
à 3 2 
u +u=—-r.u (50.416) 
» LA 


Le terme à droite de l'égalité est petit (vu les constantes qui y interviennent...) si bien qu'une forme 
approchée de l'équation différentielle est: 


u'+u=0 (50.417) 
Dont une solution particulière, qui nous le savons d'avance, est intéressante: 
 =üpcos@ (50.418) 
Nous portons cette solution approximée dans l'équation différentielle initiale et nous obtenons: 
u'"+u = Le uË cos? g (50.419) 
> £ 


Soit: 


3 3 
grd +2 re cos(2g) (50.420) 


e 
E 
e 
| 
; 
e 
= | 
| 
+ 
Di 
Le) 
© 
Le7] 
dm, 
ne 
A, 
Là 
Il 


Soit: 


3 
—+u = ru +3 ug cos(2@) (50.421) 


af 4's 


La suite va être très subtile (comment deviner quelque chose comme cela...?). D'abord nous allons créer 
une nouvelle équation différentielle: 


3 | 
—+v= ru . r.t0 5 sin (2) (50.422) 
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L'astuce consiste à multiplier cette équation par i et la sommer à l'équation différentielle d'origine: 


2 


& 
of 


2 :2œ 


(x +iv)+ (a +iv) = Fra (1+5)+ Érde (50.423) 


Ce que nous noterons: 
= 3 
— +8 = —r uÿ 2e * +7 ue 29 (50.424) 
4 Es 


L'astuce est de chercher une solution particulière de la relation précédente sous la forme: 
a = A+ Be29 (50.425) 


Nous avons alors: 
(50.426) 


Ceci injecté dans notre nouvelle équation différentielle donne: 
Æ 
: « i— : 
—4Be 29 + A+ Be = 2. u2/2e 4 re u2e2# (50.427) 
4 £“0 4 g“0 


Nous en déduisons immédiatement: 


= ne 


(50.428) 


1.2 
B=- 4 ru0 
Une solution particulière de l'équation différentielle d'origine est donc: 


u = R(x)= e Bet re nude 29 = Tru rai cos (24) 
(50.429) 


Soit en utilisant les relations trigonométriques remarquables: 
cos (26) = 1- 2sin? (œ) (50.430) 
Il vient: 


1 


+ | 
ü =—7 u0 (gts g) _ 5'e0 (1+sin? g) (50.431) 
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La solution générale est finalement: 


ü = Un COS LP u2 (1+ sin? (50.432) 
— 0 g 2 g“0 p OS 
Si nous admettons que la lumière est très faiblement déviée par le Soleil, le rayon de courbure (1/r) de 
sa trajectoire sera très faible. 
Ainsi: 
1 | 
#=——0 (50.433) 
Fr 


tel que: 
lg COS P+ ra (1+sin? g) =O0 (50.434) 


Le premier terme est prédominant par rapport au deuxième à cause du facteur r, qui est très petit sur 
le deuxième. Pour la suite, nous procédons comme dans le chapitre d'Astronomie (juste les notations 
changent) pour l'étude de l'angle de déflexion (si vous n'y revenez pas vous ne pourrez comprendre la 
justification de ce qui va être fait!). Nous posons sans perdre en généralité que: 


Soit: 
PL (50.436) 
2 à 
et comme: 
X . (8 
cos @=cos| —+—|=-sin| — 
(+2) (3) 
(50.437) 
sin? @= sin? É 5) = cos? (£) 
4 à 2 
il vient: 


En utilisant les relations trigonométriques à nouveau: 


l+cos (2£) 
2 ] (50.439) 


cos? (2) = ————— 
2 2 


Il vient: 
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8 1 | 
— sin (2) +5 relio É Ses (e)] Z Q (50.440) 


ä étant supposé très petit nous faisons un développement de Maclaurin (cf. chapitre de Suites Et 
Séries) au premier ordre des fonctions trigonométriques: 


8 1 3 1 : 
-—+=rug|=+-|=0 (60441) 
2 2 à 


Ce qui donne: 


4GM 1 
2 (50.442) 
€ 70 


TL reu 0 8=2ru = 


Donc après une série d'approximations... et d'hypothèses limites acceptables..., nous arrivons à: 


Nous trouvons donc le facteur 2 qui faisait défaut au traitement classique du problème, relativement 
aux mesures expérimentales, que nous avons vues dans le chapitre d'Astronomie. 


ô, 


relativiste 


=2.6 


neWwiormen 


= 1.74" (50.445) 


Ce qui est souvent représenté de façon imagé dans les médias par le dessin suivant: 


mirage 


étoile 


Cette déviation a pu être mise en évidence en mesurant la position des étoiles au voisinage du disque 
solaire lors de l'éclipse de 1919 par Arthur Eddington et son équipe. Après l'avance du périhélie de 
Mercure, il s'agissait du second test passé avec succès par la Relativité Générale. C'est cet événement 
qui a rendu Albert Einstein célèbre auprès du grand public. Aujourd'hui, la déviation des rayons 
lumineux a pu être mesurée avec beaucoup plus de précision en considérant les signaux radio émis par 
des sources extragalactiques (quasars, AGN, etc.): la prédiction de la Relativité Générale a été 


confirmée au millième près. 
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La déviation des rayons lumineux est aujourd'hui très importante en cosmologie observationnelle, 
puisqu'elle est à l'origine du phénomène de mirage gravitationnel, encore appelée "lentille 
gravitationnelle". 


Il est intéressant de remarquer que toute la théorie des mirages gravitationnels est basée 
sur la relation: 


4 
p.192 
c°R 


du moins pour un détecteur ponctuel. C'est le seul ingrédient de Relativité Générale utilisé dans le 
calcul des images. 


7.3. EFFET SHAPIRO 


En 1964, Shapiro démontra qu'un rayon lumineux n'était pas seulement dévié en passant près d'une 
masse, mais également que la durée de son trajet était allongée par rapport à une géométrie euclidienne. 
Il calcula que le retard devait atteindre environ 200 microsecondes, donc parfaitement mesurable, pour 
une ligne de visée rasant le Soleil. Il suggéra alors de mesurer systématiquement la durée mise par un 
signal radar pour effectuer le trajet aller-retour entre la Terre et une planète passant derrière le Soleil 
(pour que l'effet soit maximal). Cela fut d'abord accompli avec des échos radar sur Mars, Vénus ou 
Mercure, avec une précision de l'ordre de 20%. Le résultat est très net: la durée nécessaire à un signal 
radar pour faire l'aller-retour Terre-Planète augmente brutalement juste avant que la planète passe 
derrière le Soleil et diminue tout aussi brutalement quand celle-ci réapparaît. 


Remarque: Nous parlons parfois de "ralentissement de la lumière" près du Soleil pour décrire l'effet 
Shapiro mais c'est une expression maladroite et erronée. Comme cela a déjà été mentionné, la 
vitesse de la lumière est constante en relativité générale aussi bien qu'en relativité restreinte. Dans 
le cas de l'effet Shapiro (et dans d'autres cas similaires), ce qui change c'est l'écoulement du temps 
là où passe la lumière, par rapport à ce qu'il est là où se situe l'observateur. 


Bien qu'il s'agisse d'un effet faible, on a pu le vérifier très précisément depuis l'arrivée des sondes 
Viking sur Mars en 1976, à l'aide de signaux envoyés depuis la Terre vers Mars et réfléchis sur cette 
dernière par les sondes (voir le principe de l'expérience sur la figure suivante). En outre, il existe même 
désormais un objet de plus en plus courant pour le fonctionnement duquel l'effet Shapiro doit être pris 
en compte: le "G.P.S." (Global Positioning System). En effet, malgré la faiblesse du champ de 
gravitation terrestre, une précision géographique de quelques mêtres nécessite de tels détails dans les 
calculs. Toutefois, un satellite a été lancé récemment dont le but est de vérifier, dans le champ de 
gravitation terrestre, un effet encore plus faible prédit par la relativité générale et qui n'intervient même 
pas dans le GPS: l'entraînement de l'espace-temps, aussi nommé "effet Lense-Thirring". 


Signalons pour le GPS que deux phénomènes d'erreur sont connus dans le cadre de la relativité: 


1. Les satellites tournant autour de la Terre à une vitesse approximative de 20'000 kilomètres par heure 
retardent alors de 7 millionièmes de seconde par jour (relativité restreinte). 


2. À l'altitude de 20'200 kilomètres, celle de l'orbite des satellites, le champ gravitationnel plus faible 
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fait avancer les horloges satellitaires de 45 millionièmes de seconde par jour. 


La somme des deux corrections donne une dérive de 38 millionièmes de seconde par jour, un chiffre 
ahurissant pour un système GPS dont la précision se doit d'être de 50 milliardièmes de seconde par jour. 


Faisons le calcul pour un rayon frôlant la surface du Soleil. Pour cela, nous reprenons notre métrique de 
Schwarzschild: 


r 
ds? = -T)éar R (6° + sin? af) 


ME 


(50.447) 


avec: 


(50.448) 


Pour un photon, nous savons que 45 = à et donc l'équation de la métrique de Schwarzschild s'écrit 
alors: 


2 : 2 
r(d8 +sin 84 $° 
c?dt? = ne — =: dr? Ua 6) | 
r re (50.449) 
i-Æ 1-— 
r Fr 


La trajectoire du photon ayant lieu dans le plan équatorial du Soleil, nous posons: 


9 =c" = (50.450) 


ce qui simplifie encore l'équation de la métrique en: 


1 2 L 
c?df? = à PAL ES _— [22 + h- 2 Pa | 
r re r Fr ( 
i-Æ É = 4 1-Æ 
Fr F Fr 
Pour simplifier encore plus nous faisons l'hypothèse que la trajectoire (en coordonnées polaires) du 
photon rasant le Soleil est rectiligne telle que (pour une des composantes polaires du plan): 


rcos=rs (50.452) 


où à est le rayon du Soleil. Nous allons utiliser cette hypothèse pour simplifier l'équation de la 
métrique. Pour cela nous réarrangeons: 


r. 
r = 
cos Ÿ 


(50.453) 


Nous dérivons (cf. chapitre de Calcul Différentiel Et Intégral): 
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d@ cos? ré rs (60454) 


Si nous mettons le tout au carré: 


2 | 4 2 Jr. à 
dr | r sin? si (1- cos 6) : rt rt cos? : Fr. à Ed (r 8) (50.455) 
4@ SR ER 5 EE nee D CRE un 
We) Ke) Ke. Ke) Ke. Ke. 
d'où: 
r2 
(e] 2 _ 
Ar BE dd (50.456) 
Nous pouvons maintenant récrire l'équation de la métrique: 
2 
1 Fr. dr? Fr. Le 
Com due. 1+11-<£ —— 
r Fr _ 
re 1 (18) 
Fr r 
5 2 2 2 
L dr? (r el ) +76 Fr F6 : dr? r? : Fe el 
_ 2 7: 2 NE R: n 2l'PE It 13-23 (50.457) 
Le ( -19) (19) É (2-19) r(r-7) 
Fr F 
2 
dr? r? eo 
12 1 3 
1 2 (r r) d 
Fr 
En prenant la racine: 
2 /2 
dr Fr Fer 
| 
z à avr Æ (50.458) 
1-2 (18) 
Fr 
Étant donné que r > r, et que r, & 0 alors: 
Fr r r2 
Lg] 22e) (50459) 
Cd r 


Dès lors nous avons en utilisant les développements de Maclaurin (cf. chapitre de Suites Et Séries) au 
premier ordre: 
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2 
r r Fer 
r ]f2 2112 2 r° | 
(-"8) 
Nous avons alors: 
Fr 1F r2 
F F 
dE a+) 1/2 D 1/2 
C cr (2-72) Fr (r2-73) 
1 Fr Fr r 1 17 rê Fr 
= —_— + Er ——— (50.461) 
c à _ 2 cr $_ à é èr 2 2 
T6 Fr 5 
2 
le 17276 Fr 
‘a 3 172 
cœ 27 a à 
T6 
Nous avons finalement une fois condensé: 
2 2.2 
r r Fr rÉr, 
dé = a ES ES (50.462) 
à av22 à avw/2 a12 au 3f2 aw2 0.462 
cfr -r3) cfr -r8) 2cr (r -r8) 2er (r -r$) 


Ce qu'il est de tradition de noter (nous sortons le 1/c des différents termes): 
l l l 1 | 
dt = —e(r)dr + f(r)dr -—gir)dr -—h(r)dr (50.463) 
€ c € € 


S'il n'y a pas de masse alors l'espace-temps est plat et >, = 0. Dès lors: 


: d 
3 21027 (50.464) 
cf -16) 


Nous pouvons ainsi distinguer le temps classique du temps supplémentaire engendré par l'espace 
courbe. Le "retard" sera donc donné par: 


[a == : Jetr)ar + : [ f{r)dr - LS g(r}dr == [ h(r)dr (50.465) 


Ensuite, pour intégrer les quatre fonctions de r il faut se placer dans un référentiel placé si possible au 
centre de l'astre principal (le Soleil typiquement) puisque la métrique de Schwarzschild est basée sur 
cette hypothèse pour rappel... Ainsi, pour connaître le retard d'un rayon lumineux partant du Soleil 
jusqu'à la Terre, nous choisirons logiquement comme rayon de départ celui du Soleil lui-même et 
comme rayon d'arrivée, la distance Soleil-Terre (donc cela correspondra une fois les primitives 
calculées aux bornes d'intégration). 
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Durée aller-retour 


Espace-temps plat 


Figure: 50.1 - Temps d'aller-retour d'un signal en fonction de la position de Mars 


Bon cela dit c'est bien joli de connaître les notations d'usage, mais c'est encore mieux de faire une 
application numérique! Nous allons donc d'abord déterminer la primitive de chacun des termes 
ci-dessous: 


2 2,,2 
Fr r Fr Fr 
ar, | — dr, | ar, | = —© 
FF = rê dr _ ré 2r? Jr? — rà 2r° ÿr° — ré 


Les deux premières primitives sont simples car il s'agit de primitives usuelles démontrées en détail dans 
le chapitre de Calcul Différentiel Et Intégral: 


dr (50.466) 


Fr 
[dr = Ÿ° 15 
/ 3 2 
F1 


(50.467) 
re r Fr r? 
[= dr = rearccosh — =r,ln —+ [—-] 
2 _,2 r. r r? 


où pour la dernière primitive nous avons préservé la constante d'intégration (contrairement à ce qui a 
été fait dans le chapitre de Calcul Différentiel Et Intégral car #;, # 1). 


Maintenant il nous reste les deux dernières intégrales. Commençons dans l'ordre par: 


Fr 
© 
[ £ dr (50.468) 


2 2 
RC ei) 

2 122,2 2 2 2-2 
2r° air F6 rar — 76 


En posant: 
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r =, cosh(£),£ = sos 


2 dr =r, sinh(f)df (50.469) 
He) 


et en utilisant les résultats démontrés dans le chapitre de Calcul Différentiel Et Intégral, nous avons 


alors: 
Lg r? Fr r2 h 
£'O I l = #0 ( ra sinh(é) F 
2 op fr? 72 2 * r2 cosh? (£) r2 cosh?(#) _ 
Q [e [e] [eo] 
LE i h FA Fr Fr Fr : 
eg RO ef 2 TE tanh( = RO 
2° cosh?(#) ré sinh?(£) 2° cosh“(#) 2 2 cosh(f} 
(50.470) 


A 


sinh| arccosh LE sinh | arccosh _ 
fe Fe 75 


EE V\ 2 r 
cosh| arccosh| — ri 
ro We) 


Puisque nous avons (cf. chapitre de Trigonométrie): 


sinh(x) = cos? (x)-1 (50471) 


sinh [rer ) 
7o 


Alors: 


= 
r 2 à 
Fr. Fr. 
(o] (o] 
(50.472) 
2_ 2 
ro Jr2- ré 
= PE ——— 
r 2r 
Ho! 
Enfin, il reste la dernière primitive: 
r?r2 r?r2 il r?r2 1 
—=— e s dr= #2? LT. dr = = © [——_——ûr 
2r F F5 2 Fr Vr 76 2 2 (50.473) 
4 de 
Fr" [-| — 
Fr 


Nous posons pour la suite: 


Fr Fr 
r=,dr=-<dx (50474) 


X x 
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Il vient alors: 


rs l PE x us xl +, 
2 : rs d 25 1-2 2% MR À 
1-| 2 
: Fr (50.475) 
_l 1-#4x- | ax 
27 1- x 
Dans le chapitre de Calcul Différentiel Et Intégral nous avons démontré que: 
[\i-xax= nn x+2 1-x2 (50.476) 
2 2 
et que: 
[ dx = arcsinx (50.477) 
1- x 
Donc: 
L 1 re [1 x 
— [M-r2-|[ dx = | Sarcsn x+=vl-x -arsnx| 
2r 1- x2 2r, L2 2 
(50.478) 
re [x EE 1 
= ME 1— x ——arcsin x 
2r, L2 2 
Pour revenir à l'intégrale du début on se rappelle que > = ©, Donc: 
x 
Fr sl LE 
| — = 9 p = — 2-75 pacs | (50.479 
2r° Jr? - 15 26 L2r 


Nous avons donc au final en prenant tous les primitives calculés plus haut en en choississant une borne 
de départ et d'arrivée pour le calcul: 


(50.480) 


Nous voyons dans le cas limite Newtonien où r, = 0, cette relation se réduit comme peau de chagrin à: 


1 
Az — fr A, =[/r R-r5- R-r8) (50.481) 
[a 
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Donc pour un aller-retour (entre planète et satellite par exemple), il vient alors dans ce cas simplifié: 


ne [R2 2 Fa 2 
az°| KR -6 — K-%) (50.482) 


7.4. TROUS NOIRS 


En restant toujours à notre métrique de Schwarzschild...Une trajectoire radiale de type lumière 
implique: 


ds?=0 (50.483) 


donc: 
ON Lo le 5 (de? +sin 284) =0 
er É L … (50.484) 
c?r 


et dans une trajectoire radiale directe (par définition) nous avons aussi: 


d8=0etd#=0 (50.485) 


donc: 
a 
c?r fi ra (50.486) 
c?r 
Dès lors: 
1 2 jar = 1 32 
c?r (- ci (50.487) 
c?r 

Il vient alors: 

a 

dr É ou) (50.488) 

e?r 


D'où: 


Posons en unités naturelles & = 1. Il vient alors: 
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Lorsque >» —2GM4 le membre de droite de l'égalité tend vers +, donc l'évolution du temps t 
(observateur extérieur) en fonction de r tend vers l'infini par rapport au temps propre de la lumière. 


La sphère donnée par le rayon: 


2GM 
c2 


Fr — 


définit "l'horizon du Trou Noir de Schwarzschild". 


Vers cette frontière limite, la lumière semble mettre un temps infini par rapport à un observateur 
extérieur à se déplacer lorsqu'elle approche un Trou Noir. Elle ne parvient donc jamais vraiment à 
l'atteindre par rapport à l'observateur, d'où le fait que les Trous Noirs peuvent être entourés en fonction 
de leur environnement d'un halo lumineux aux abords du rayon de Schwarzschild. De plus, puisque le 
temps semble arrêté, la fréquence de la lumière environnant le Trou Noir tend vers zéro et donc vers 
l'infra-rouge. 


Signalons encore un point très important. Avant Einstein, la géométrie était considérée comme partie 
intégrante des lois. Einstein a montré que la géométrie de l'espace évolue dans le temps selon d'autres 
lois, encore plus profondes. Il est important de bien comprendre ce point. La géométrie de l'espace ne 
fait pas partie des lois de la nature. Par conséquent, rien que nous puissions trouver dans ces lois ne dit 
ce qu'est la géométrie de l'espace. Aïnsi, avant de commencer à résoudre les équations de la théorie 
générale de la relativité d'Einstein, nous n'avons strictement aucune idée de ce qu'est la géométrie. 
Nous la découvrons seulement une fois les équations résolues. 


Cela signifie que les lois de la nature doivent s'exprimer sous une forme qui ne présuppose pas que 
l'espace ait une géométrie fixe. C'est le coeur de la leçon einsteinienne. Cette forme se traduit en un 
principe appelé "indépendance par rapport au fond". Ce principe énonce donc que les lois de la nature 
peuvent être décrites dans leur totalité sans présupposer la géométrie de l'espace. 


In extenso, le choix des quatre dimensions fait partie du fond. Serait-il possible qu'une autre théorie 
plus profonde ne nécessite pas de présupposer le nombre de dimensions? 


En résumé, l'idée de l'indépendance par rapport au fond, dans sa formulation la plus générale est une 
façon sage de faire de la physique: faite de meilleures théories, dans lesquelles les choses qui, avant, 
étaient postulées, seront expliquées en permettant à de telles choses d'évoluer dans le temps en fonction 
de lois nouvelles. 


C'est là aussi une difficulté de la théorique quantique. Elle est dépendante de fond contrairement à la 
relativité générale. 
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Notes personnelles: 
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51. COSMOLOGIE 


L. cosmologie s'occupe de comprendre la naissance et l'évolution de l'Univers par la méthode 


scientifique. C'est uniquement par ce jeu entre théories physiques, modélisations et observations que 
nous aborderons cette question ici. Nous éviterons soigneusement toute digression métaphysique. Les 
problèmes spécifiques de la cosmologie tiennent dans sa définition même: la statistique qui est une des 
grandes méthodes scientifiques est apparemment pauvre: nous n'avons qu'un univers à notre 
disposition. En outre, nous n'observons que le passé de l'Univers. Peut-on parler de prédictions dans ces 
conditions? Les théories sont cependant fiables dans la mesure où elles prédisent des comportements 
que des observations peuvent tester. 


La cosmologie utilise principalement l'arsenal des mathématiques, de la physique théorique, de la 
physique des particules, de la physique nucléaire, de la physique des détecteurs et de l'astrophysique. 
Elle est donc interdisciplinaire. La cosmologie traite des échelles supérieures à la taille d'une galaxie 
jusqu'aux échelles définies par elle-même comme les horizons. Encore que la limite soit volontairement 
floue, la cosmologie ne traite pas des détails internes de la naissance et de l'évolution d'objets 
astrophysiques (comme les galaxies, les amas globulaires, ou des amas de galaxies) qui relèvent plus de 
la "cosmogonie". 


1. MODÈLE COSMOLOGIQUE NEWTONIEN 


Un modèle cosmologique est une représentation mathématique de l'Univers qui cherche à expliquer les 
raisons de son aspect actuel, et à décrire son évolution au cours du temps (appelé "temps 
cosmologique") mais pas de sa création! 


Le modèle newtonien s'applique dans le cadre des hypothèses de la mécanique de Newton (action 
instantanée). Les résultats que nous allons étudier ici ont été découverts avant le développement de la 
Relativité Générale mais publiés après! Mais ce modèle présente l'avantage de la simplicité tout en 
étant capable de mettre en évidence et de discuter de la dynamique de l'Univers et de se préparer à 
l'étude des modèles d'Univers faisant usage des résultats de la Relativité Générale. Son inconvénient, 
outre le fait qu'il ne correspond pas tout à fait aux résultats expérimentaux, est de n'être plus valable 
dans des conditions extrêmes donc de ne pas être extrapolable à l'instant du Big Bang. 


Avant de commencer, nous devons définir le "principe cosmologique" formé des deux assertions 
suivantes (en gros, il assure que nous ne sommes pas des observateurs privilégiés, et que ce que nous 
observons est bien représentatif de l'ensemble de l'Univers): 


- L'espace (Univers) est homogène, c'est-à-dire qu'il présente les mêmes propriétés dans toutes ses 
régions. Ceci doit s'entendre à très grande échelle, au-delà du millier de Mpc (Mégaparsecs). Il est clair 
qu'à petite échelle existent des inhomogénéités, nous par exemple. 


- L'espace (Univers) est isotrope, c'est à dire qu'il n'existe pas de direction particulière de l'espace, 
comme une direction d'aplatissement, ou un mouvement d'ensemble à l'échelle universelle par exemple. 
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Remarque: Cette hypothèse de l'isotropie de l'Univers et qui marche relativement bien dans les 
modèles théoriques (voir ci-après) impose une constatation intéressante si nous admettons un 
commencement à l'Univers. Cette constatation implique que l'Univers a eu une phase dans son 
histoire où il n'a pas laissé à la matière le temps de s'agglutiner pour former à ses débuts de groupes 
de matières inhomogènes et anisotropes qui seraient visibles aujourd'hui à nos télescopes. De ceci, il 
découle qu'à un moment de son histoire, l'Univers a eu un taux d'expansion supérieur à celui que 
l'on pourrait faire correspondre à la vitesse de la lumière (c'est mal dit mais j'espère que c'est quand 
même acceptable). 


Nous allons poser quelques autres hypothèses de travail: 


H1. L'Univers est un fluide gazeux non visqueux dont les particules sont les galaxies. Sous l'hypothèse 
du principe cosmologique, le mouvement des galaxies, constituants de ce "fluide" est par construction, 
statistiquement au repos. 


H2. L'Univers est thermodynamiquement un système fermé, sans travail et adiabatique (pas d'échange 
de chaleur avec l'extérieur). 


H3. L'Univers en expansion homothétique (en expansion proportionnelle dans toutes ses dimensions) 
est pris comme ayant une géométrie sphérique avec un centre (eh oui c'est le modèle newtonien...). 


H4. Sa masse volumique est uniquement fonction du temps et il y a conservation de la masse (et donc 
de l'énergie). Donc la quantité de matière y est constante! 


H5. Nous acceptons la dynamique (approximation) newtonienne pour construire les modèles à suivre 
dans ce chapitre. 


H6. L'origine du temps est assimilée à l'origine de création (horizon) de l'Univers et le référentiel 
d'étude est comobile aux particules (et se déplace donc avec les galaxies posées sur la trame de 
l'espace-temps) et appelé "référentiel matériel" (les galaxies sont donc immobiles dans ce référentiel!). 


1.1. LOI DE HUBBLE 


Sous l'hypothèse du principe cosmologique et des hypothèses précédentes, la distance d'un point origine 
O à un point M quelconque de l'Univers peut varier en fonction du temps (de manière indétectable à 
l'échelle humaine) sous la forme: 


OM(9 = OM(E,) FE) 
où F(t) est le "facteur d'échelle" (noté R(t) suivant le contexte.….). 


En écrivant cette relation, nous considérons que les points O et M sont sur un plan à courbure nulle. 
Effectivement, si nous imaginons deux points sur une surface courbe circulaire (par exemple la surface 
d'une sphère) voyons ce qui se passe: 
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Figure: 51.1 - Illustration de la limite de validité du modèle 


La distance entre deux points du cercle (in extenso de l'espace sphérique) est donnée par: 


D=RAa=R(«-a«a)= efsesn(2]- ses(3) L Rfves(%) -areoi[ à) (51.2) 


Nous voyons très bien dans cette relation que si le rayon (de l'Univers sphérique) change d'un facteur F, 
alors la variation de la distance entre les 2 points n'est pas linéairement proportionnelle à ce facteur!! 
Ce qui n'est pas le cas dans un plan à courbure nulle. 


Conséquence: Notre modèle newtonien n'est valable que dans un Univers plat alors que la relativité 
générale ou une approche purement énergétique classique (voir plus loin) peut prendre en compte 
différentes types de courbure ! 


Nous voyons tout de suite que la relation: 


OM(8 = OMK,) F()) 613) 


est indépendante de l'origine choisie, en effet, si nous l'appliquons à deux points A, B quelconques, nous 
avons: 


CA(E) = OA(,) Fe) OB()= OB(,) F( (14) 
Soit par différence: 


AB( = AB(,) F9 (515) 
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Remarques: 


R1. Au temps # =£, = 0 il est évident que la relation précédente s'écrit: 
AB(4) = AB) F4) 619 


et nous impose F(4) = F(0) = 1. Cette remarque est importante et nous y reviendrons plusieurs 
fois pendant les développements qui vont suivre. 


R2. La loi s'applique donc à un segment ‘45 quelconque dans l'Univers. C'est pourquoi l'Univers 


ne comporte pas de centre géométrique et que nous pouvons nous donner une image suggestive 
pour se donner une idée de l'expansion de la trame de l'Univers: soit un ballon mi-gonflé sur la 
surface duquel nous traçons deux repères (par exemple: deux croix tracées à l'encre). En le gonflant 
davantage, nous constaterons que ces deux croix s'écartent l'une de l'autre et donc la distance qui 
les sépare, s'accroître. C'est ce que nous constatons avec les galaxies. 


Dérivons par rapport au temps la relation: 
OM( = OM) FE) (517) 
Le premier membre donne alors la vitesse des particules (ou de tout autre objet) au point F(#) = OM (6): 
V(r,£) = OM(E,) ‘d,F(E)=FG)'d,F6) (618) 


Soit en éliminant Of (£, ) : 


PCF.£) = AUS d,F(£) = rt), d,F(t) = ur (51.9) 
F() F(E) F(e) 
Nous posons pour simplifier l'écriture: 
l 


H(6) = F0 0 (51.10) 


Nous avons donc: 


SF,0) = Hr(g| G111) 


Cette relation est connue sous le nom de "loi de Hubble" (et qui d'après des recherches historiques 
devrait sa paternité plutôt à Georges Lemaître..). 


Avant d'aller plus loin, il convient de s'arrêter sur cette équation pour l'instant présent £, : 
D, 40) = H(to}réo) = Ho (61.12) 


Cette équation dit que les objets de l'Univers s'éloignent avec une vitesse proportionnelle à leur 
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éloignement dans tous les points de l'Univers sans référentiel privilégié (aucune galaxie ne semble être 
fixe alors qu'elles le sont dans le référentiel matériel!). 


Remarque: Cette relation permet d'avoir des vitesses supérieures à celles de la lumière. Mais cela 
n'est pas une violation de la relativité relativement à la constance de la vitesse de la lumière! 
Effectivement, il ne faut pas oublier que la loi de Hubble prend en compte l'expansion de la "trame" 
de l'espace-temps sur laquelle se meut la lumière. Dès lors si la trame s'étend selon un facteur 
d'expansion F supérieur à l'unité, cela donne l'impression que la lumière va plus vite que c et c'est 
ce qui donne des redshift parfois de 4 ou 5! 


La constante Æ{£) étant bien sûr identifiable à la "constante de Hubble" telle qu'elle est mesurée 
actuellement au début des années 2000 et valant environ: 75 [ix: 57! / Mpc]. 


En unités S.I., puisqu'un mégaparsec vaut - 3.085.102 [##+] alors nous avons: 
H5= 2431108 [s7] (5113) 


Ainsi, une estimation actuelle de l'âge (horizon) de l'Univers pourrait être interprétée comme l'inverse 
de la constante de Hubble qui donne le "temps de Hubble": 


ty =1/ Ho & 13-10 années (51.14) 
soit environ 13 milliards d'années (nous verrons une meilleure approche plus loin). 


Inversement, nous pouvons nous amuser à calculer la distance à partir de laquelle nous pouvons 
atteindre la vitesse de la lumière 29979275 = 3997 [pe] avec la relation: 


VF, é0) = H(t}r(éo) =H (Gl15) 


et une application numérique donne grosso modo 13 milliards d'années-lumière. Telle est la distance de 
"l'horizon cosmologique"”. 


1.2. ÉQUATIONS DE FRIEDMANN 


Considérons maintenant un anneau sphérique de matière de rayon r et de masse constante m en 
expansion à la vitesse v, et contenant une boule de matière de masse M (elle aussi en expansion à la 
vitesse v). 


Rappelons que selon le principe cosmologique, M et m n'ont pas la même densité © à cause de la 
masse constante de l'Univers. 


Nous pouvons appliquer à ce système la conservation de l'énergie mécanique car il est isolé (c'est 
d'ailleurs le seul vrai système isolé..). Nous obtenons alors l'équation: 


1 , CMm 
__S _ 


2 Fr 


& (51.16) 


où #, est une constante. En divisant par m chaque membre et en remplaçant M par son expression en 
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fonction de la densité, nous obtenons: 


1-47 Ge 
2 3 7 D 


(51.17) 


Remarque: Si cela peut aider le lecteur à comprendre ce que nous avons fait avec le terme de 
l'énergie potentielle, il peut se référer au chapitre de Mécanique Classique lorsque nous avons 
développé les calculs de l'énergie potentielle d'une sphère de matière. 


Or la loi de Hubble nous donne selon ce que nous avons vu plus haut: 
v=A'r (51.18) 

et: 
r=n'À (5119) 


Nous obtenons: 


que nous simplifions en: 


Or, &,,#1,r, sont des constantes. Nous introduisons une nouvelle constante k définie par (afin de 


simplifier les écritures): 


2% 
k=— (5122) 
PerG 
Nous obtenons donc l'équation: 
H?= 0 &F| (51.23) 


qui est n'est autre que la "première équation de Friedmann”" que nous retrouvons fréquemment dans la 
littérature sous la forme suivante (parmi tant d'autres….): 


Il est possible d'obtenir la même équation à partir de l'équation d'Einstein des champs (cf. chapitre de 
Relativité Générale) et la métrique de Friedmann-Robertson-Walker (je n'ai rien écrit sur cette métrique 
dans le chapitre de Relativité Générale car elle est à ce jour trop compliquée à comprendre pour moi). 
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Signalons quand même une forme très courante de cette dernière relation. Lorsqu'en utilisant 
l'équivalence masse et énergie d'Einstein la densité © n'est plus une densité massique mais une densité 
d'énergie, il faudra la diviser par la vitesse de la lumière au carré pour avoir à nouveau une densité 
massique. Il est en est de même si au dénominateur de la constante k, la masse m est remplacée par 
l'énergie, il faudra alors multiplier k par la vitesse de la lumière au carré. Nous avons alors en notant le 
rayon a (comme cela est souvent d'usage dans les ouvrages spécialisés) et en redistribuant les termes, la 
forme suivante de la première équation de Friedmann: 


a? 3c°? 


Remarque: Einstein rajouta à cette équation pour des raisons de convictions personnelles et quasi 
religieuses une constante cosmologique A, qui lui permettait de rendre statique le facteur d'échelle 
de l'Univers. Nous (les auteurs du site) rejetons cette constante arbitraire, même si dans la physique 
contemporaine, elle est revenue à la mode (sa valeur a été cependant définie mathématiquement 
plutôt que religieusement) car elle permettrait d'expliquer la provenance de la matière sombre, les 
lois actuelles de notre Univers, la période inflationniste de notre Univers ainsi que sa géométrie. 
Ainsi, la première équation de Friedmann avec cette constante cosmologique, qui est un total 
artifice de travail, s'écrit alors: 


gr pps 4 À 
3 3 
avec: 
AC p 


C'est Andreï Sakharov qui a défini la valeur de cette constante cosmologique qui s'apparenterait 
soi-disant à l'énergie quantique du vide (fonction des champs de Higgs). 


Deux idées guident les chercheurs de ce début de 21ème siècle: en physique quantique les 
équations du champ associées aux particules élémentaires servent à définir la théorie du Big Bang. 
La célèbre équation d'équivalence d'Einstein nous dit que l'énergie crée un champ gravitationnel 
comme l'électron en mouvement provoque un champ électromagnétique. Il découle de ces deux 
observations qu'en mesurant le champ gravitationnel nous avons un moyen de déterminer l'énergie 
du vide. Le champ gravitationnel ne concerne plus la matière mais bien la densité d'énergie du vide. 
Or la constante cosmologique est directement proportionnelle à la constante de la gravitation, G. Sa 
mesure est un jeu très dangereux car de sa valeur dépendent plusieurs lois fondamentales de 
physique et des propriétés non négligeables quant à la dynamique de notre Univers. Le débat reste 
donc complètement ouvert et si nous (les auteurs du site) trouvons une démonstration valable et 
rigoureuse de cette constante, nous mettrons à disposition du lecteur les conséquences de cette 
constante sur les modèles que nous allons voir ci-après. 


Utilisons maintenant le premier principe de la thermodynamique (« | ) 
pour un système par définition fermé dont la somme de l'énergie cinétique et potentielle est constante 
(et donc la somme des variations est nulle pour ces deux énergies). Nous avons alors la variation 
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d'énergie totale qui n'est donnée que par la variation d'énergie interne (cas le plus courant en 
thermodynamique pour les objets macroscopiques): 


d(E,,)=d(0) (5128) 


et nous avons également vu dans le chapitre de Thermodynamique l'équation caractéristique du fluide à 
l'équilibre: 


d(Ü) = T4(S)-ÆPd(F) (51.29) 


Si le système est adiabatique (aucun transfert chaleur entre le système et l'extérieur), alors nous avons 
selon ce qui a été vu dans le chapitre de Thermodynamique: 


dS=—==—=0 (51.30) 
ra 


Donc: 
d(U)+P4({/)=0 (5131) 


Puisque l'Univers est supposé sphérique dans notre modèle, nous avons: 
4 
ÿ = 37 (51.32) 


et dans le référentiel matériel où les galaxies (particules du fluide cosmique) sont immobiles: 


Soit: 
a(ove*)+ Pa (are) = d one )+Pà (Gr) =0 (51.34) 
ce qui se simplifie en: 
a(pR°e?)+Pa(8)= 0 (51.35) 


en prenant la dérivée par rapport au temps cosmique t: 


d(er d (R° | | 
PURE EE 
dé dé (51.36) 
= c2 68° +382 (o+P\8=0 


d'où: 
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Reprenons maintenant la première équation de Friedmann, obtenue plus haut, sous la forme: 


et mettons-la sous la forme suivante: 


Si nous différencions: 


Nous obtenons alors: 


8xG{ 240, dR?\ 8rG 
K° — —— R°6+20RR] (51.41 
Le 4 - 3 7 dia ) En 


Injectons: 
Ê= (042) & (51.42) 
JR 
dans la relation: 
2R8R = 


_ (ér° + 2eRÀ) (51.43) 


Nous obtenons alors: 


8AC P\R -| S87G , : P 
2RR = — (045 )È8 +20rû =——RR|-3| 0+—|+20| (5149 
3 ec? À 3 ce? 


Soit: 
stef 30 — 52420) {0432 (51.45) 


La relation suivante: 


À = _47G (e #3À) (51.46) 
Fi 3 | 


est la "deuxième équation de Friedmann”" qui serait aussi appelée parfois "équation de Raychaudhuri". 
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1.2.1. DENSITÉ CRITIQUE 


Revenons à notre première équation de Friedmann sans constante cosmologique. Nous avons donc 
démontré plus haut que: 


Fe dr (51.47) 


Nous obtenons alors en injectant cette dernière relation dans la première équation de Friedmann la 
relation suivante: 


2 _87G 


(4,F) PF? -k (5148) 


qui se réarrange avec: 
P=P%'F* (514) 


en: 
(4FŸ = Go Fl-k (5150) 


L'exposant du terme de gauche impose que le terme de droite soit positif ou nul tel que: 


TGAF* >k (5150 


Rappelons que les conditions initiales nous imposent qu'au temps £, = Ü nous ayons: 
F(G)=1et FL, = AG) (5152) 


Effectivement: 


1 
A0) = 775 al. =d,F|, (5153) 
0 


Il vient alors: 
k = Ga - HS (61:54) 


Ce terme devrait être accessible à l'observation, hélas H? est très mal connu et encore plus. 
0 


Autrement dit, compte tenu du signe "-" dans l'expression de k, nous ne connaissons aujourd'hui même 
pas le signe de cette constante. 


Cependant, il peut être important de noter qu'il existe une valeur &, appelée "densité critique" qui 
annule k et donc aussi (voir plus haut): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


—2À. 
&=——> (5155) 
mari 


ce qui implique que l'énergie totale de l'Univers serait nulle (selon des considérations de la cosmologie 
quantique). 


Cette valeur de a, est donc trivialement: 


_ 34 


279 = (51.56) 
87rG fe 


À 


Pour 4, =75 [k&g'm:s" { Mpe] (valeur actuelle) nous trouvons: 


À titre de comparaison, un atome d'hydrogène pèse 1.7: 107 [Æg], la densité critique correspondrait 
donc à six atomes d'hydrogène par mêtre cube. 


Les physiciens ont défini une constante (variant dans temps) notée par la lettre grecque & et appelée 
"paramètre de densité cosmologique" et donnée par le rapport des densités massiques (ou des densités 
énergétiques puisque le rapport sera la même!): 


Lè = 


2 
% 


souvent les astrophysiciens décomposent le paramètre de densité cosmologique en trois termes: 


(= (1 Fin Ph = F2 (LES) 


matière 
Il est intéressant de travailler avec cette constante car dans le cas où: 
- à =1: 

Nous avons: 


3H? 
& Re 
87C 


(51.60) 

ce qui en remplaçant dans l'équation de Friedmann donne: # = Q (un Univers plat comme nous le 
verrons dans notre étude du modèle relativiste). 

21 


En effectuant le même raisonnement, et toujours en inégalités, nous avons alors: Z > 0 (un Univers à 
courbure positive (fermé) comme nous le verrons dans notre étude du modèle relativiste). 


- SG <1: 
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En effectuant le même raisonnement, mais en inégalités, nous avons alors: x < 0 (un Univers à 
courbure négative (ouvert) comme nous le verrons dans notre étude du modèle relativiste). 


Ces trois situations peuvent se résumer géométriquement à: 


Univers ouvert : 
ressemble à une 


selle de cheval 


Univers fermé : 
semblable à la 
surface d'une sphère 


Figure: 51.2 - Illustration des différents types de courbure 
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Remarques: 


R1. Toutes les mesures qui ont pu être faites jusqu'à présent n'ont pas permis de mettre en évidence 
une courbure de l'Univers. Les mesures du rayonnement fossile par le ballon BOOMERANG et le 
satellite COBE tendent cependant à accréditer l'hypothèse d'un univers plat relativement aux 
simulations numériques: 


25° 


Figure: 51.3 - [lustration de ce que donnerait l'expérience en fonction du type de courbure 


R2. La notion de topologie de l'Univers et son ouverture sont en fait normalement deux notions 
distinctes. Quand nous parlons d'Univers fermé ou ouvert nous ne parlons normalement pas de sa 
topologie mais de son destin. Ainsi, un Univers ouvert est en expansion indéfiniment et un Univers 
fermé se recontracte sur lui-même au bout d'un certain temps. Cela dit, dans les modèles que nous 
étudions dans ce chapitre (à constante cosmologique nulle), la courbure est directement liée à la 
densité, et donc à son ouverture. 


Revenons à l'équation: 
2 877 = | 
(4FY = — CRE —& (51.61) 
Nous pouvons écrire: 


A 
d,F(£) = x (51.62) 


En adoptant la notation: 
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Remarque: Les mesures actuelles donnent: 


AZ 0.2793923067:10% (51.64) 


D'où: 


[A 
dF(E) = + 7 kt (51.65) 


Il convient maintenant pour nous de considérer trois situations: 
&=0 &<0 &>0 (51.66) 


qui correspondent donc respectivement en paramètre de densité cosmolgoique à: 


G=1 Q<1 Q>1 (51.67) 


Remarque: Nous ne pouvons poser &, = Ü car dans nos hypothèses initiales se trouvait le principe 
de conservation de l'énergie. 


2. MODÈLES COSMOLOGIQUES DE FRIEDMANN-LEMAITRE 


Les modèles cosmologiques euclidiens de Friedmann-Lemaître consistent dans la limite newtonienne à 
étudier "l'équation fondamentale des modèles de Friedmann”: 


[A 
dÆF(t)=1+ 7 ki (51.68) 


&=0 &<0 &2>0 (5169) 


en considérant les trois situations: 


Remarque: Il est possible dans le cadre de la relativité générale de trouver rigoureusement une 
solution aux équations d'Einstein des champs appelée "métrique de Robertson-Walker" qui dans le 
cas d'une approximation newtonienne nous redonne les équations de Friedmann obtenues dans le 
présent texte (souvent ce sont ces approximations qui sont utilisées dans la littérature car la solution 
exacte est hors de portée du cadre des cours universitaires traditionnels). 


2.1. ESPACE PLAT (K=0) 


Le modèle d'espace plat (euclidien) consiste à supposer que & = 0. Autrement dit, nous sommes dans 
un Univers dont la densité est dite "densité critique" ou également simplement "plat" (comme nous le 
verrons avec le modèle relativiste). 


Nous avons alors l'équation: 
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MAC ATEREAUEIR [SCIENCES.CH] 
A A 
dF(E) = LS -kdi=+ [dt (51.70) 
F \F 


En disposant les termes de manière adéquate: 


JFaF(t) = +Adt (5170 


et en intégrant, il vient: 


2 Fi = +4 = + nc (51.72) 


Qui se simplifie en (nous élevons au carré d'où la suppression du double signe +): 
F=67Gœt" (5173) 
Nous avons donc dans ce modèle la relation: 
F=367G0 €" (5174) 
à laquelle il nous faut rajouter une constante pour avoir la condition correspondant à aujourd'hui: 
F4) = F(0)=1 (5175) 
qui reste satisfaite: 


Fi) = 167G a," +1 (51.76) 


Ce qui nous donne sur un tracé une fonction à l'allure suivante (ne pas se fier aux valeurs indiquées sur 
l'axe horizontal car elles sont arbitraires): 


! 


| 


Figure: 51.4 - Evolution du facteur d'échelle pour un espace à courbure nulle 


Nous avons mis la zone où F({£) < 1 en évidence pour bien rappeler que cette partie de la solution est à 
rejeter. 
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Nous avons donc un modèle d'Univers dont le facteur d'échelle croit de façon exponentielle et et ce 
indéfiniment. 


Remarque: Plus &, est grand, plus la croissance du facteur d'échelle est grande (sous-entendu que 
la pente est bien évidemment plus grande). 


2.1.1. ESPACE PLAT DOMINÉ PAR LA MATIÈRE 


Il existe également une autre approche beaucoup plus élégante et subtile à mon goût que la 
démonstration précédente (je ne l'ai découverte que de nombreuses années après avoir rédigé la version 
précédente). Elle a en plus l'avantage de mettre en évidence une hypothèse qui n'est pas apparue avec 
les développements précédents. 


Nous partons de la première équation de Friedmann: 


en posant toujours k comme étant nul et ensuite nous utilisons l'astuce qui consiste à partir de la relation 
démontrée plus haut (utilisée pour démontrer la deuxième équation de Friedmann): 


_ P\R 
P=-5| 2+— 2 (51.78) 
€ 


d'imposer que la pression P du fluide (quel qu'il soit: gaz ou radiation!) soit nulle. Nous disons alors que 
l'Univers est un univers dominé par la matière et nous en déduisons: 


kÀ' 
p+30—=0 (5179) 
2 8 
ce qui nous donne: 
Rb+30R°R'=0 =< Roi=0—R o=R@=c" (51.80) 
£ 


Dans ces conditions, la première équation de Friedmann devient: 


en réarrangeant et en simplifiant, nous avons alors: 


3 
[rar | ER à (51.82) 
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ce qui donne: 
3 
2 2312 Lu Éneaer (51.83) 
3 3 


Au temps £ = 0, nous avons le facteur d'échelle qui vaut A = Q et donc la constante est nulle. Nous 


avons alors: 
_ à 1/3 : 1/3 
RG)=(67CAR) = 60 OR] 18-1208) 428 (5184 
87C - 
En posant qu'au temps # = 0 , le facteur d'échelle était unitaire, cette dernière relation se simplifie: 


oH2 13 
ro- [2 PE Giss 


si nous posons que le facteur d'échelle est aujourd'hui pris comme référence unitaire, il vient alors: 
2 
Ê=— (51.86) 


340 


et en y remplaçant les valeurs numériques actuellement connues pour la constante de Hubble, il vient 
que l'Univers est actuellement âgé d'environ 8.6 milliards d'années (à comparer aux 13 milliards du 
temps de Hubble obtenu plus haut!). 


2.1.2. ESPACE PLAT DOMINÉ PAR LA RADIATION 


Nous avons démontré dans le chapitre de Thermodynamique lors de notre étude de la loi de Stefan- 
Boltzmann que la pression était liée à la densité d'énergie par la relation suivante: 


1 
P=-pPp (5187) 
3 
Pour un univers dominé par la radiation, la relation suivante démontrée plus haut: 
P\R 
Ê = -3 P+—|— (5188) 
c“/R 
exprimée avec une densité d'énergie et non une densité de masse devient: 
— 
2 2 Fe À 
@e =-3| 96" +——]|— (5189) 
c? JR 


Soit: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Êe = 35 Pr +PE (51.90) 


et en utilisant la relation liant pression et densité d'énergie, il vient: 


Après un petit réarrangement, nous avons: 


À | 
êr +46 “a (51.92) 


d'où nous tirons que: 


Pr +408 : = 0— R* èg +40ÿRR = 0 = Site ]=0—R* op = RPpp =c" (5193) 


Dans ces conditions, la première équation de Friedmann: 


N2 
(& _ 82e _ & (51.94) 


R 3 R? 


devient d'abord en passant en densité d'énergie et en posant k comme étant nul 


_—— 
& - 876 8 (51.95) 
R 3? 


et nous pouvons donc substituer la densité d'énergie par le résultant obtenu juste précédemment: 


ee 4 
& _ 87280 X (51.96) 
R 3c° R 


Nous avons alors: 


d'où: 


4 
RaR = Eee BoËG à (51.08) 
3? 
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La primitive donne donc: 
4 
DR? Let = fr G 0886 (51.99) 
as 
» 


Au moment du Big Bang en £ = 0, nous avons le facteur d'échelle qui vaut À = 0 et donc la constante 


4 
DR? = 8RGOr0, (51100) 
fr 


En posant qu'au temps £ = 0, le facteur d'échelle était unitaire, cette dernière relation se simplifie: 


2R? = BnGPp, (51.101) 
\ 22 
Dès lors, il vient: 


27rC 
ro (2 | [2 ,) en (| M2 Gao 
C 


est nulle. Nous avons alors: 


Soit après simplification: 
1/2 
R() = 2 #2 (51103) 


Ainsi, un univers plat dominé par la radiation a son facteur d'échelle qui croît légèrement plus lentement 
qu'un univers plat dominé par la matière. 


Pour comparaison avec Maple 4.00b (en bleu: Univers plat dominé par la matière, en rouge: Univers 
plat dominé par la radiation): 


>plot([t/(2/3),t/(1/2)],t-0..2*Pi,0..3,color-[blue,red]); 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


3 


2.5 


0.5 


) 1 2 3 4 5 6 
+ 


Figure: 51.5 - Évolution du facteur R pour un espace à courbure 0 dominé par la matière ou par la radiation 


2.2. MODÈLE SPHÉRIQUE (K>0) 


Dans ce modèle (appelé aussi parfois "modèle elliptique"), nous considérons & > 0. Donc l'équation à 


traiter reste: 
[A 
dÆ(E) = + F — kdt (51.104) 


Ce qui s'écrit aussi: 


+ 
— 


À = + [ar (6) 2 0 


; (51.105) 
= 
F 


Rappelons que nous avions supposé pour £ = £, que F(£,) = 1 si nous effectuons le changement de 
variable © =1/ F(£), nous obtenons l'intégrale suivante: 


L'F ay 
M=t l D Jaut (51.106) 
Nous recherchons donc une primitive de: 
__ (51.107) 


M = ——_—_—— 
[ U? JAU -k 
et nous discuterons du signe + après avoir trouvé la primitive. 


Nous effectuons encore un changement de variable en posant x? = 47}; -x donc 2x4x= AdU ce qui 


nous donne la primitive suivante à calculer: 
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>, 1 2 4° 1 2A 1 
SE  — — _ 
Alec] Te 


ie (51.108) 
— | +] 
Ni 


en refaisant un changement de variable: 


X 
y=——dx= Ed (51109) 
NE 


d'où à une constante multiplicative près: 


2A 
= (51110) 


"2 
nous avons: 


dy 


res; 


= (51.111) 


Dans le chapitre de Calcul Différentiel Et Intégral nous avons vu que cette forme de primitive se résout 
par la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de la physique et il faut 
satisfaire des conditions initiales auxquelles nous ne nous intéressions pas nécessairement en 
mathématiques): 


2Rl © FT +(2n-1)Z, +c* (51.112) 


avec: 
dy 
L=f ju (51.113) 
(1+»°) 
d'où: 
1 y 
1, = — +—1 (51.114) 
? 2G+») 20 


Il nous faut encore calculer Z (cf. chapitre de Calcul Différentiel Et Intégral): 


l 


= = + æ 
é, 5% arctan(y}+e" (51.115) 


Enfin: 


LL > 1 # 
————— +—arctan(y)+e 51.116 
2e) 24 7 
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1, = 


en remettant en place tous les changements de variables et en introduisant à nouveau la constante 
multiplicative, nous avons dans le cas où # > Q: 


Entre les deux bornes d'intégration (1/ F,1) nous avons donc (la constante d'intégration s'annule et nous 
reprenons le + qui se trouvait initialement dans l'intégrale): 


(EURE, 4 (MF) (A ,4 Te 
‘ VF 


pat 


tan |__| Ù- |] + 


E PAIE arc VE Fa PE arc 


(51.118) 


où rappelons que la théorie nous impose 4 > O. 


Si nous traçons cette fonction pour une valeur # > 0 fixe. Nous avons le tracé suivant dans 
Maple 4.00b (nous ne considérerons que le cas avec le signe "-" ci-dessous pour l'instant car le signe 
"+" nous donnerait un tracé dans les différentiels de temps négatifs: Af € O ): 


Figure: 51.6 - Évolution de facteur d'échelle pour un espace à courbure positive 


Remarque: Le temps est ici toujours représenté sur l'axe vertical ainsi que pour tous les diagrammes 
suivants (il vous faut tourner un peu la tête si habituellement vous mettez le temps sur l'axe des 
abscisses.….). 


Nous voyons que plus la constante A est petite, plus l'Univers arrive rapidement à une valeur finale. De 
plus pour une valeur de k fixée, certaines valeurs de A sont interdites (c'est à cause de la condition 
d'intégration). 


En fixant une valeur de A, nous obtenons la représentation bidimensionnelle suivante: 
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in 


j 


Ê 0 


& 


SE 


—— 


MOTTE © CECMROUT “IGEGEICC CAMERA NE 


F 


Figure: 51.7 - Évolution particulière du facteur d'échelle pour un espace à courbure positive 


© 


Si nous effectuons un zoom au niveau £ =£, = Ü, nous avons: 


Figure: 51.8 - Évolution particulière du facteur d'échelle pour un espace à courbure positive (zoom) 


Nous voyons que le critère F(4) = F(0) = 1 est parfaitement et naturellement respecté sans 


introduction d'une quelconque constante. Il suffit par ailleurs de remplacer F par 1 dans l'équation que 
nous avons obtenue pour voir que nous trouvons /# = 0. 


Remarque: Comme nous l'avons déjà précisé, toutes les valeurs de F({£) inférieures à 1 sont à 
rejeter! 


Analysons l'avant-dernier tracé en rappelant que: 


(a FY = Tor -k (51119) 


Fan = 


Donc, si #-l est plus petit que Æ:}, nous ne sommes plus dans un domaine valable (réel) du modèle. 


Il faut donc que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


FT>ÆlouF£<Æ, (51121 


Cette limite a été représentée par une ligne verticale bleue sur l'avant-dernier tracé. Nous y avons 
également représenté par une ligne horizontale verte la limite temporelle temps 4, correspondante à 


Ba: 


Au fait, au-delà de cette limite temporelle, ce que ne sait pas l'ordinateur qui a tracé notre fonction, 
c'est qu'il devrait basculer sur la fonction d'échelle avec le signe "+". Aïnsi, lorsque nous exécutons le 
tracé des deux fonctions avec les bornes adéquates: 


M=-f(F} 
( 
A = +f(F) 


[é 
LL 


51.122) 


nous obtenons alors (le temps est représenté sur l'axe vertical!): 


50 


50 


0 2 à $ 4 10 


Figure: 51.9 - Evolution particulière du facteur d'échelle pour un espace à courbure positive 


Nous voyons que alors que pour £ > #,, l'Univers entre dans une phase de contraction que nous 


appelons communément "Big Crunch". Après cette phase de rétraction, il est possible soit que l'Univers 
disparaisse totalement, soit qu'il entre à nouveau dans une phase dynamique cyclique 
(mathématiquement les deux issues sont possibles). 


2.2.1. ESPACE SPHÉRIQUE DOMINÉ PAR LA MATIÈRE 


Au même titre que pour le modèle à espace plat, il existe également une autre approche beaucoup plus 
élégante et subtile à mon goût que la démonstration précédente (je ne l'ai découverte aussi que de 
nombreuses années après avoir écrit le texte précédent). Elle aussi l'avantage de mettre en évidence 
une hypothèse qui n'est pas apparue avec les développements précédents et permet de tracer plus 
simplement dans Maple 4.00b le comportement du facteur d'échelle de l'Univers. On retrouve ainsi 
exactement le fameux graphique représentant l'évolution du facteur d'échelle de l'Univers disponible 
dans la quasi-totalité des ouvrages de vulgarisation sur le sujet. 


Nous partons toujours de la première équation de Friedmann: 
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12 
(& _82Gp_k Lo 
3 k? 


Il est d'usage pour ce modèle de poser x = 1 (quitte à prendre tout nombre positif au moins en prendre 
un qui est sympathique.) et nous avons montré que lorsque la matière domine, nous avions: 


Ro=Ro=c" (51124) 


Dès lors: 


R? 8xG m) 1 
RD) be 


3 
Eat _] 61126 
dt 3R 


[at = © ñû 
: , (51.127) 
87% À _] 
38 


et il vient immédiatement: 


Soit: 


Si nous passons en temps comobile (déjà vulgarisé tout au début de ce chapitre) défini 
mathématiquement par: 


d7=— (51.128) 
Nous avons alors: 
e 1 
| 47 = ; dR 
" fer (51.129) 
À p_ p2 
3 
Notons cela sous la forme: 
. . 1 
147 = ————2ûR (51130) 


"4 r-R? 
où À est donc strictement positif. Faisons-y la substitution: 


R = x+£ (51.131) 
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nous avons alors: 


pes e—_— 


a (+4)-(44) ARE É a+] 
(51.132) 


et nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que la primitive est: 


Er + = arcsin (2) Let 
A 


42 : (51.133) 
——X 
4 
Donc: 
| Es à L 
ñ = arcsin +c (51.134) 


Pour qu'au temps #7 = 0 nous ayons £& = O, il faut que la constante soit telle que: 


. [2 7 
f = arcsin +5 (51.135) 


Dès lors: 


= sin =) cos(7) (51.136) 
= $i — | =— . 
4 7 g 7 
D'où: 
R= À (1- co5(7)) (51.137) 
Maintenant, rappelons que: 
àn _ = dt= Rin (51.138) 


Dès lors: 


[ at = [Ray = [ (1—-cos(7)id7 (51.139) 


IE 
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Soit: 


£= . 7 —sin(7) J+c% (51.140) 


et comme nous devons avoir au temps £ = 0 le temps comobile qui est aussi nul, la constante est donc 
nulle. Dès lors nous avons au final le système paramétrique suivant: 


= a 1- cos(7)] 
2 (51.141) 


{= 27 -sin(m)) 


avec Maple 4.00b nous avons alors en comparant l'Univers plat dominé par la matière (en bleu), 
l'Univers plat dominé par la radiation (en rouge) et enfin l'Univers à courbure positive dominé par la 
matière (vert) et en mettant des coefficients artificiels pour mieux distinguer les tracés: 


>plot([t/(2/3),t/(1/2),[0.5*(t-sin(t)),0.5*(1-cos(t)),t-0..2*Pi]], 
t=0...Pi,0..3,color-[blue,red,green]); 


3 


2.5 


0.5 


[ 0.5 1 4.5 2 2.5 3 
t 


Figure: 51.10 - Évolution du facteur R pour les configurations d'espace obtenues étudiées jusqu'à présent 


Nous comprenons alors mieux pourquoi le modèle d'Univers à courbure positive est aussi considéré 
comme un modèle d'Univers fermé. 


2.2.2. ESPACE SPHÉRIQUE DOMINÉ PAR LA RADIATION 


Considérons maintenant un univers dominé par la radiation. Nous avons démontré que dans cette 
situation nous avions: 


P= Pa (51.142) 
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et: 


R'pg = A Prg =c" (51.143) 


Dans ce cas l'équation de Friedmann en termes de densité d'énergie s'écrit en posant & = 1: 


2 
(&) = 87Cep + (51.144) 
3? R? 


Ce qui devient: 


Pl Ep) its 


En injectant RP = RPe0 , il vient: 


dR 8208 0 RG a. (51.146) 


dt 362 R2 
Soit: 
n 1 
[at = [2 ar 
870 08 (51.147) 
3c?R? 


Notons cela sous la forme: 


[at = [——— 
E (51.148) 
F- —] 


Si nous passons aussi en temps comobile: 


Nous avons alors: 


[ay = [cr (51.150) 
A—R 


Dans le chapitre de Calcul Différentiel Et Intégral nous avons démontré comment déterminer 
exactement la même primitive (car il s'agit d'une primitive usuelle). Nous avons: 
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: | À | te 
7 = arcsin| ——|+€e (51.151) 


Nr: 


Pour qu'au temps 7 = 0 nous ayons 8 = 0, il faut que la constante soit telle que: 


. [ À 
7 = arcsin| —— | (51.152) 
(3) 


D'où: 
R=JAsin(7) (51153) 
Maintenant, rappelons que: 


à _ = dt = Rdn (51.154) 


Dès lors: 
[ at = [Ray = (A sin(y)an (51.155) 


Soit: 
t=-#Acos()+c (51.156) 


et comme nous devons avoir au temps £ = Q le temps comobile qui est aussi nul, la constante vaut donc 
{A4 . Dès lors nous avons au final le système paramétrique suivant: 


R = Asin(n) 
= JA (1- cos() 


(51.157) 
avec Maple 4.00b nous avons alors en comparant l'Univers plat dominé par la matière (en bleu), 
l'Univers plat dominé par la radiation (en rouge), l'Univers à courbure positive dominé par la matière 
(vert), l'Univers à courbure positive dominé par la radiation (noir): 


>plot([t/(2/3),t(1/2),[0.5*(t-sin(t)),0.5*(1-cos(t)),t=0..2*Pi], 
[0.5*(1-cos(t)),0.5*sin(t),t-0..2*Pi]],t-0...Pi,0..3,color-[blue,red,green,black]); 
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3 


2.5 


15 


0.5 
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2 + 
Figure: 51.11 - Evolution du facteur R pour un espace à courbure 0/+ dominé par la matière ou par la radiation 


Nous avons donc meilleur intérêt à être dans un Univers sphérique dominé par la matière (ou un 
mélange matière-radiation).. 


2.3. MODÈLE HYPERBOLIQUE (K<0) 


Dans ce modèle, nous considérons # < 0. Donc l'équation à traiter peut s'écrire: 


A 
dF(£) = + + ka (51.158) 


Ce qui s'écrit aussi: 


Rappelons que nous avions supposé pour £ = £, que F(£,) = 1. Si nous effectuons le changement de 
variable © = 1} F{£), nous obtenons l'intégrale suivante: 


l'F dU 
= ————2 20 
(auf (51.160) 


Nous recherchons donc une primitive de: 


AM a (51.161) 
U? fAU +x| 


et nous discuterons du signe + après avoir trouvé la primitive. 
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Nous effectuons encore un changement de variable en posant x? = 47}; +x% donc 2x4x= AdU ce qui 


nous donne la primitive suivante à calculer: 


24 1 
= 


PATES (6116) 
(x) 


dx = VEtdy (51.163) 


2 
£f - r- - Tax 
alT FRITES 


en refaisant un changement de variable: 


x 
Y == — 
VE 
d'où à une constante multiplicative près: 


24 
FE 


(51.164) 


nous avons: 


dy dy 


Eee : | mo (51.165) 

bi-Ù “(-») 
Dans le chapitre de Calcul Différentiel Et Intégral nous avons vu que cette forme de primitive se résout 
par la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de la physique et il faut 
satisfaire des conditions initiales auxquelles nous ne nous intéressions pas nécessairement en 
mathématiques): 


Ÿÿ 
2hln = ay + (2-12, +c* (51.166) 
avec: 
dy 
l, a | je (51167) 
(1-°) 
d'où: 
1 y 
À, = — +—} (51.168 
2 2(1-») 1 ( ) 


Il nous faut encore calculer Z : 


l l l 


= -1 a 1 : _ _. Er ” ” 
À Ie: 0 rite sil »l In [1 - yl te" (61160) 


Enfin: 
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1 Ÿ : PAP LP à 1+ y 
2(1-y°) 4 [-y 


L = +c* (51.170) 


en remettant en place tous les changements de variables et en introduisant à nouveau la constante 
multiplicative, nous avons dans le cas où & > 0: 


au +. TRE ie 
kU fra "NE 0 |- fau +ki | 


Entre les deux bornes d'intégration {1/{ F,1) nous avons donc (la constante d'intégration s'annule): 


m-[ HER, 4 AE A, 4, +4 
«- 2kf” en] (2 HA 


(51.172) 


2 rl 


Nous devons évidemment avoir (nous reprenons le + qui se trouvait initialement dans l'intégrale): 


ler 
Fr 


4 LE + 
Pre si >0 (51.173) 
Fe |" 


Si nous traçons cette fonction pour une valeur # > Q fixe. Nous avons le tracé suivant dans Maple 


4.00b (nous ne considérerons que le cas avec le signe "-" car celui avec le signe "+" n'a pas de sens 


physique même translaté): 


Figure: 51.12 - Evolution du facteur d'échelle pour un espace à courbure négative 
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Nous voyons que plus la constante À est petite, plus l'Univers croit indéfiniment rapidement. De plus 
pour une valeur de k fixée, certaines valeurs de À sont interdites (il s'agit au toujours fait de la condition 
d'intégration). 


Nous voyons à nouveau que le critère F(4) = F(0) = 1 est naturellement parfaitement respecté. Toutes 
les valeurs de F(t) inférieures à 1 sont à rejeter ! 


Nous avons donc dans ce modèle hyperbolique un Univers qui croit indéfiniment de façon 
exponentielle (comme le modèle plat de Friedmann-Lemaître) car étant donné que #& < O, il n'y a plus 
de condition limite d'intégration (contrairement au modèle elliptique précédent). 


2.3.1. ESPACE HYPERBOLIQUE DOMINÉ PAR LA MATIÈRE 


Au même titre que pour les modèles à espace plat et sphérique, il existe également une autre approche 
beaucoup plus élégante et subtile à mon goût que la démonstration précédente (je ne l'ai découverte 
aussi que de nombreuses années après avoir écrit la version précédente). Elle aussi l'avantage de mettre 
en évidence une hypothèse qui n'est pas apparue avec les développements précédents et permet de 
tracer plus simplement dans Maple 4.00b le comportement du facteur d'échelle de l'Univers. On 
retrouve ainsi exactement le fameux graphique représentant l'évolution du facteur d'échelle de l'Univers 
disponible dans la quasi-totalité des ouvrages de vulgarisation sur le sujet. 


Nous partons toujours de la première équation de Friedmann: 


Il est d'usage pour ce modèle de poser # =—1 (quitte à prendre tout nombre positif au moins en 
prendre un qui est sympathique...) et nous avons montré que lorsque la radiation domine, nous avions: 


Rp=R M =c" (51175) 


Dans ce cas l'équation de Friedmann en termes de densité d'énergie s'écrit en posant # = —1: 


A2 
(&) _ 82C0g _ 1 1%) 
3?  R? 


La première équation de Friedmann devient alors: 


| 3 
(E)-e+-Ce R},1 (ii 
R 3 Rp 3 


Nous avons alors: 


d'où: 
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ep À 


87G a À . (51.179) 
38 


Il s'agit exactement de la même intégrale que celle de l'univers sphérique dominé par la matière à la 
différence que sous la racine, nous avons +1 au lieu de -1. Nous allons donc procéder de la même 
manière en utilisant le temps comobile: 


dm=— (51.180) 


Il vient alors: 


{= ar 


: 3 
8#G0n À RAR? (51.181) 
\ 3 


[ar=| 


l 
AR (6118) 
VA-R+R 


où À est donc strictement positif. Faisons-y la substitution: 


Notons cela sous la forme: 


R= ei (51.183) 
2 


nous avons alors: 


= fi 2 
A. = + + Free hi 
2 2 2 4 
(51.184) 
| : dx 
A 
2 
Fa —_— 
4 


En utilisant la primitive usuelle démontrée dans le chapitre de Calcul Différentiel Et Intégral il vient: 


Soit en refaisant le changement de variables: 


dx = arccosh (2) Les 
(51.185) 
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A 


R+= 


d| | 
arccosh Lu +e® = arccosh __# +c® = arccosh (A) (51.186) 
4? A A 


Donc: 
7 = arccosh FRA )+er (51.187) 


Pour qu'au temps 7 =0 nous ayons 8 = 0, il faut que la constante soit telle que: 


coshi-c® | 4— A 
2 


=Q (61188) 


Ce qui nous amène à ce que la constante soit nulle et donc: 


7 = arccosh (2 Li # (51.189) 
Dès lors: 
“ou =cosh(7) (51.190) 

D'où: 

À = À cosh{#i—1) (51.191) 
et comme: 

CE _ (51.192) 

Nous avons: 


(at = | Ra? = (icohini -1idn (51.193) 
Ce qui donne: 
Ë = = sinhi7i-7 +7 (51.194) 


Comme au temps £ = 0, nous devons avoir # = Ü, il vient que la constante doit être nulle. Donc pour 
finir, nous avons: 
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R= Éicoshi7)-1) 


(51.195) 
A,. 
£ = 3 \anh(7 i-7| 


avec Maple 4.00b nous avons alors en comparant l'Univers plat dominé par la matière (en bleu), 
l'Univers plat dominé par la radiation (en rouge), l'Univers à courbure positive dominé par la matière 
(vert), l'Univers à courbure positive dominé par la radiation (noir), l'Univers à courbure négative 
dominé par la matière (gris): 


>plot([t\(2/3),t(1/2),[0.5*(t-sin(t)),0.5*(1-cos(t)),t=0..2*Pi], 


[0.5*(1-cos(t)),0.5*sin(t),t-0..2*Pi],[0.5*(sinh(t)-t), 
0.5*(cosh(t)-1),t-0..2*Pi]],t-0...Pi,0..3,color-[blue,red,green,black,gray]); 


2.5 


0.5 
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Figure: 51.13 - Evolution du facteur R pour les configurations d'espace obtenues étudiées jusqu'à présent 


Nous pouvons donc observer que pour une courbure négative (du type hyperbolique), l'expansion croît 
nettement plus vite que pour un univers plat et ce sans fin. 


2.3.2. ESPACE HYPERBOLIQUE DOMINÉ PAR LA RADIATION 


Considérons maintenant un univers dominé par la radiation. Nous avons démontré que dans cette 
situation nous avions: 


P= os (51.196) 
3 


et: 
Rpg = RjPgg =c" (51197) 


La première équation de Friedmann devient alors: 
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a) 8rGor 1 87CPr0 À 1 


Tr 2 nr at (51.198) 


Nous avons alors: 


(51.199) 


d'où: 


(51.200) 


Il s'agit exactement de la même intégrale que l'univers sphérique dominé par la matière à la différence 
que sous la racine, nous avons +1 au lieu de -1. Nous allons donc procéder de la même manière en 
utilisant le temps comobile: 


d£ 
dn=— (51.201) 
è R 
Il vient alors: 
Re : 1 
17 = | mm R 
” lexGoznkf >: (51.202) 
3  tÀ 
3c 
Notons cela sous la forme: 
. . 1 
| A7 = |—-—©dR (51.203) 


"448 


où À est donc strictement positif. Dans le chapitre de Calcul Différentiel Et Intégral nous avons 
démontré comment déterminer exactement la même primitive (car il s'agit d'une primitive usuelle). 
Nous avons: 


. R 
7 = arcsinh ]re (51.204) 


7 


Pour qu'au temps 7 =0 nous ayons 8 = O, il faut que la constante soit nulle. Donc: 


7 | 1 , | (51.205) 
= arcsin —= 21.205 
A 


D'où: 
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R = A sinh (71 (51.206) 


et comme: 
d7=— (51.207) 


Nous avons: 
fat = [Ray = {VAsinh 7\d7 (51.208) 
Ce qui donne: 
t= JAcoshipi+cf® (51.209) 


Comme au temps £ = 0, nous devons avoir # = 0, il vient que la constante doit être égale à —. {A | 
Donc pour finir, nous avons: 


R=YAsinhiri 


(51.210) 
t= JAicoshimi-1| 


avec Maple 4.00b nous avons alors en comparant l'Univers plat dominé par la matière (en bleu), 
l'Univers plat dominé par la radiation (en rouge), l'Univers à courbure positive dominé par la matière 
(vert), l'Univers à courbure positive dominé par la radiation (noir), l'Univers à courbure négative 
dominé par la matière (gris), l'Univers à courbure négative dominé par la radiation (brun): 


>plot([t/(2/3),t(1/2),[0.5*(t-sin(t)),0.5*(1-cos(t)),t=0..2*Pi], 
[0.5*(1-cos(t)),0.5*sin(t),t=0..2*Pi],[0.5*(sinh(t)-t),0.5*(cosh(t)-1),t=0..2*Pi], 
[0.5*(cosh(t)-1),0.5*(sinh(t)),t-0..2*Pi]],t=0...Pi,0..3 
,color-[blue,red,green,black,grey,brownl]); 


2.5 
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Figure: 51.14 - Evolution du facteur R pour un espace à courbure 0/+/- dominé par la matière ou par la radiation 
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Nous pouvons donc observer que pour une courbure négative (du type hyperbolique), l'expansion d'un 
Univers dominé par la radiation croit moins rapidement qu'un Univers dominé par la matière (c'est un 
peu intuitif.…..). 


Soit pour résumer un peu mieux tout cela avec des légendes ce dernier graphique devient (faut quand 
même s'appliquer car l'Univers nous concerne tous..): 


3 
25 Univers atvert (courbure négative/hyperbolique) 
donyx£ par la radiation 
k<0, (à <1 
2 Univers (cowbure nulle/plat 
doruiné parla matière 
&=0, € 
15 


Uryssrstéourbure nullefplat) 
donuné par la radiation 
&=0,=1 


Uruvers fermé (co 
doruné par la matière 


k&>0, >1 


r-pasitivefsphérique) 


fermé (cowbure positive/sphénque) 


par la radiation 


0.5 1 15 2 2.5 3 


+ 
Figure: 51.15 - Résumé des modèles Newtonien d'Univers 


2.4. UNIVERS OBSERVABLE 


Nous avons déterminé plus haut une estimation actuelle de l'âge (horizon) de l'Univers comme pouvant 
être interprétée comme l'inverse de la constante de Hubble ce qui nous a donné: 


ty =1/ Ho = 13-10° années (51211) 


soit environ 13 milliards d'années. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Remarques: 


R1. Nous noterons que les articles populaires et professionnels de recherche en cosmologie 
emploient souvent le terme "Univers" dans le sens de "Univers observable". 


R2. Il faudrait au fait être plus rigoureux lorsque nous parlons d'âge de l'Univers. Au fait, nous 
devrions plutôt dire que l'horizon de l'Univers, pour un observateur comobile depuis les époques les 
plus reculées, est de 13 milliards d'années. En clair, c'est le temps que mesurerait quelqu'un qui 
serait resté observateur inertiel (en chute libre: ne subissant aucune autre force que la gravitation) 
tout au long de l'évolution de l'Univers et dans un référentiel tel qu'il aurait toujours perçu cet 
Univers comme homogène et isotrope. 


À ce jour, nous ne savons pas si l'Univers est fini ou infini, bien que la majorité des théoriciens 
favorisent actuellement un Univers infini. 


L'Univers observable se compose ainsi de tous les endroits qui pourraient nous avoir affectés depuis le 
Big Bang (attention! malgré son nom, cette théorie du Big Bang n'a rien à dire sur le début! Elle se 
contente de décrire l'évolution et l'expansion de l'Univers), en tenant compte que la vitesse de la 
lumière est certainement finie. L'horizon cosmique se trouve quant à lui à une distance de 14 à 15 
milliards d'années-lumière selon les observations expérimentales de la fin du 20ème siècle. 


La taille actuelle (la "distance comobile") de l'Univers observable est plus grande, puisque l'Univers a 
continué de s'étendre pendant le temps que la lumière met à nous parvenir, nous estimons qu'elle est 
d'environ 40 milliards d'années-lumière. 


Ce chiffre peut être obtenu en prenant un objet visible qui est à 13 milliards d'années de notre Terre. 
Celui-ci aura donc mis 13 milliards d'années pour s'éloigner de nous, sa lumière aura mis 13 milliards 
d'années pour arriver jusqu'à nous et pendant ce temps de parcours de la lumière, il se sera éloigné de 
13 milliards d'années (puisque les objets à l'horizon cosmologique vont à la vitesse de la lumière). Soit 
un total de +39 milliard d'années. 


Celui-ci contiendrait d'après des estimations toutes heuristiques environ 7:10? étoiles, répandues dans 
environ 19! galaxies, elles-mêmes organisées en amas et superamas de galaxies (le nombre de galaxies 


pourrait être encore plus grand, selon le "champ profond de Hubble" observé avec le télescope spatial 
Hubble.) 


Cependant il est difficile de s'imaginer ce que cela représente. À ce titre, nous avons trouvé sur Internet 
une magnifique série d'illustrations (http://atunivers.free.fr) que nous vous proposons: 


1. L'Univers jusqu'à 13 milliards d'années-lumière (l'Univers visible): 
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ATEN EEUEIR [SCIENCES.CH] 


http://atunivers.free.fr 


Cette carte essaie de montrer l'ensemble de l'Univers visible. Les galaxies dans l'Univers ont tendance à 
se rassembler en vastes feuilles et " " de galaxies, entourant de grands vides, ce qui confère à 
l'univers une apparence cellulaire. Parce que la lumière dans l'univers ne voyage qu'à une vitesse finie, 
nous voyons les objets sur le bord de l'Univers quand celui-ci était très jeune, il y a 13 milliards 
d'années. 


Quelques chiffres (estimations): 


- Nombre de superamas de l'univers visible = 10 millions 

- Nombre de groupes de galaxies de l'univers visible = 25 milliards 
- Nombre de grandes galaxies de l'univers visible = 350 milliards 

- Nombre de galaxies naines de l'univers visible = 7 trillions 

- Nombre d'étoiles de l'univers visible = 30 milliards de trillions 


2. L'Univers jusqu'à 1 milliard d'années-lumière (les superamas voisins): 


| 
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Quelques chiffres (estimations): 


Les Galaxies et les amas de galaxies ne sont pas distribués régulièrement dans l'Univers. Au lieu de 
cela, ils sont rassemblés en de larges amas, feuillets et murs de galaxies séparés par de larges vides dans 
lesquels peu de galaxies semblent se trouver. La carte ci-dessus montre un certain nombre de ces 
superamas, y compris celui de la Vierge - un superamas plutôt petit dont notre galaxie fait partie. La 
carte entière représente à peu près 7% du diamètre de l'Univers visible. Les galaxies sont trop petites 
pour apparaître individuellement sur cette carte, chaque point y représente un groupe de galaxies. 


Quelques chiffres (estimations): 


- Nombre de superamas jusqu'à 1 milliard d'années-lumière = 100 

- Nombre de groupes galactiques jusqu'à 1 milliard d'années-lumière = 240'000 
- Nombre de grandes galaxies jusqu'à 1 milliard d'années-lumière = 3 millions 
- Nombre de galaxies naines jusqu'à 1 milliard d'années-lumière = 60 millions 
- Nombre d'étoiles jusqu'à 1 milliard d'années-lumière = 250 trillions 


3. L'Univers jusqu'à 100 millions d'années-lumière (le superamas de la Vierge): 
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Notre galaxie n'est qu'une parmi des milliers d'autres qui se trouvent à moins de 100 millions d'années- 
lumière. La carte ci-dessus montre comment les galaxies tendent à s'amasser par groupes, le plus 
important des amas proches étant l'amas de la Vierge (Virgo), une concentration de plusieurs centaines 
de galaxies qui domine les groupes de galaxies environnants. Collectivement, l'ensemble de ces groupes 
est connu sous le nom de Superamas de la Vierge. Le second amas le plus riche de ce volume est l'amas 
du Fourneau (Fornax), mais il est bien moins riche que celui de la Vierge. Seules les galaxies brillantes 
sont dessinées ici, notre galaxie est le point tout au centre. 


Quelques chiffres (estimations): 

- Nombre de groupes de galaxies jusqu'à 100 millions d'années-lumière = 200 
- Nombre de grandes galaxies jusqu'à 100 millions d'années-lumière = 2'500 
- Nombre de galaxies naines jusqu'à 100 millions d'années-lumière = 50'000 


- Nombre d'étoiles jusqu'à 100 millions d'années-lumière = 200 trillions 


4. L'Univers à moins de 5 millions d'années-lumière (le groupe local de galaxies): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 3089/4839 


http://atunivers.free.fr 


La Voie Lactée est une des trois grandes galaxies du groupe appelé "Groupe Local" qui contient aussi 
plusieurs dizaines de galaxies naines. La plupart de ces galaxies sont portées sur cette carte, mais il faut 
noter que beaucoup de ces galaxies naines sont très peu brillantes, et qu'il y en a donc certainement 
d'autres à découvrir. 


Quelques chiffres (estimations): 


- Nombre de grandes galaxies à moins de 5 millions d'années-lumière = 3 
- Nombre de galaxies naines à moins de 5 millions d'années-lumière = 42 
- Nombre d'étoiles à moins de 5 millions d'années-lumière = 700 milliards 


5. L'Univers jusqu'à 500000 années-lumière (les galaxies satellites): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 3090/4839 


al 
mt 


http://atunivers.free.fr 


La Voie Lactée est entourée par plusieurs galaxies naines, qui contiennent chacune quelques dizaines 
de millions d'étoiles, ce qui est insignifiant comparé à la population de la Voie Lactée elle-même. La 
carte ci-dessus montre l'ensemble des galaxies naines les plus proches, elles sont liées 
gravitationnellement à la Voie Lactée, et gravitent autour d'elle en quelques milliards d'années. 


Quelques chiffres (estimations): 


- Nombre de grandes galaxies jusqu'à 500'000 années-lumière = 1 
- Nombre de galaxies naines jusqu'à 500'000 années-lumière = 12 
- Nombre d'étoiles jusqu'à 500000 années-lumière = 225 milliards 


6. L'Univers jusqu'à 50'000 années-lumière (la Voie Lactée): 
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Cette carte montre la Voie Lactée dans son ensemble - une galaxie spirale d'au moins deux cents 
milliards d'étoiles. Notre Soleil est profondément enfoui dans le Bras d'Orion à environ 26'000 années 
lumière du centre. Vers le centre de la Galaxie, les étoiles sont beaucoup plus proches les unes des 
autres qu'à la périphérie où nous vivons. Notez également la présence de petits amas globulaires bien en 
dehors du plan galactique, et la présence d'une galaxie naine voisine - dite du Sagittaire - qui est en train 
d'être lentement avalée par notre propre Galaxie. 


Quelques chiffres (estimations): 
- Nombre d'étoiles jusqu'à 50'000 années-lumière = 200 milliards 


7. L'Univers jusqu'à 5000 années-lumière (le Bras d'Orion): 
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Figure: 51.22 - Illustration simplifiée de l'Univers à une échelle de 5'000 a.-1. (source: http://atunivers.free.fr) 


Ceci est une carte de notre coin de la Voie Lactée. Le Soleil est situé dans le Bras d'Orion - un bras 
assez petit comparé au Bras du Sagittaire, qui se situe plus près du centre galactique. La carte montre 
plusieurs étoiles visibles à l'oeil nu, situées loin dans le bras d'Orion. Le groupe d'étoiles le plus 
marquant est composé des étoiles principales de la constellation d'Orion - de laquelle le bras spiral tire 
son nom. Toutes ces étoiles sont des géantes et supergéantes lumineuses, des milliers de fois plus 
lumineuses que le Soleil. L'étoile la plus brillante de la carte est Rho Cassiopeia - à 4000 années- 
lumière de nous, c'est juste une étoile à peine visible à l'oeil nu, mais en réalité c'est une supergéante 
100'000 fois plus lumineuse que le Soleil. 


Quelques chiffres (estimations): 
- Nombre d'étoiles jusqu'à 5'000 années-lumière = 600 millions 


8. L'Univers jusqu'à 250 années-lumière (le voisinage du Soleil): 
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Cette carte indique les 1'500 étoiles les plus lumineuses situées à moins de 250 années-lumière. Toutes 
ces étoiles sont bien plus lumineuses que le Soleil, et la plupart sont visibles à l'oeil nu. Environ un tiers 
des étoiles visibles à l'oeil nu sont situées à moins de 250 années-lumière, même si cette zone ne 
représente qu'une toute petite partie de notre galaxie. 


Quelques chiffres (estimations): 
- Nombre d'étoiles jusqu'à 250 années-lumière = 260'000 


9. L'Univers jusqu'à 12.5 années-lumière (les étoiles les plus proches): 
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Cette carte montre certaines étoiles jusqu'à une distance de 12.5 années-lumière de notre Soleil (il y en 
aurait 33 d'identifiées à ce jour). La plupart de ces étoiles sont des naines rouges - des étoiles avec une 
masse du dixième de celle du Soleil et une luminosité cent fois moins grande. Environ 80% des étoiles 
de l'Univers sont des naines rouges, et l'étoile la plus proche - Proxima du Centaure- en est un exemple 


typique. 


Cette carte montre toutes les étoiles connues situées à moins de 20 années-lumière. On y trouve un 
total de 77 systèmes contenant 110 étoiles. 
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Les distances entre les étoiles sont énormes. La distance du Soleil à Proxima Centauri est de 4.22 
années-lumière, soit quarante trillions de kilomètres. Marcher sur cette distance prendrait un milliard 
d'années. Même les sondes spatiales les plus rapides mettraient soixante mille ans pour faire le voyage. 
Il y a actuellement quatre sondes qui quittent le système solaire - Pioneer 10 et 11, et Voyager 1 et 2 
mais nous perdrons vraisemblablement le contact avec elles d'ici une vingtaine d'années. Le schéma 
ci-dessous essaie de montrer ces distances en élargissant le champ depuis le système solaire intérieur 
jusqu'à Alpha du Centaure. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


[SCIENCES.CH] 


Elargir 


Elargir 


Ÿ 


x10 


Elargir 


LU 


Elargir 


Ÿ 


x10 


Elargir 


Ÿ 


alt 


http://atunivers.free.fr 
3. RAYONNEMENT FOSSILE 


L'existence et les propriétés du rayonnement cosmique découvert par Penzias et Wilson s'expliquent 
essentiellement par les deux phénomènes physiques que nous allons maintenant décrire dans leurs 
grandes lignes. 


L'expansion de l'Univers a pour conséquence son refroidissement graduel. À partir des valeurs 
fantastiquement élevées qui ont dû régner aussitôt après le Big Bang qui a engendré l'Univers, sa 
température a progressivement décru. Lorsqu'elle atteint environ 3'000 [K] se produit le premier des 
deux phénomènes cruciaux qui nous intéressent ici: le rayonnement, qui jusque-là était en équilibre 
thermique avec les particules matérielles, cesse pratiquement d'interagir avec elles et en devient 
indépendant. Dans le " "d'évolution de l'Univers, nous calculons que ce moment crucial 
se situe 0.68:10$ ans après le Big Bang. 
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Nous pouvons comprendre qualitativement les raisons physiques de ce phénomène. Un peu avant, 
lorsque par exemple la température était de 100'000 [K], l'Univers contenait essentiellement des 
photons, des électrons et des noyaux atomiques nus (principalement des protons, et, dans une moindre 
proportion, des particules & , noyaux d'hélium 4). La température était trop élevée pour que les 
électrons et les noyaux puissent former des atomes, autrement que de manière transitoire et labile. 
L'interaction entre les photons et les particules chargées (surtout les électrons, les plus légères d'entre 
elles) est suffisamment intense, et la densité de ces dernières était alors suffisamment forte, pour que les 
photons soient sans arrêt diffusés, émis et absorbés. Malgré son expansion, l'Univers était alors à 
chaque instant en équilibre; sa température T était constamment bien définie, bien que décroissante au 
cours du temps, l'énergie des photons, c'est-à-dire la pulsation du rayonnement, était donc distribuée 
suivant la loi de Planck correspondant à cette température T. 


La diminution de la température a ensuite permis la formation d'atomes à partir des électrons et des 
noyaux. Ce processus a entraîné une chute rapide de la section efficace moyenne d'interaction entre les 
photons et les particules matérielles (principalement à cause de la disparition des électrons libres), de 
sorte que l'Univers est devenu transparent aux photons. Une évaluation quantitative des caractéristiques 
du phénomène situe ce découplage au moment où la température est descendue à 3000 [K1]. 


Au moment du découplage, la densité volumique d'énergie du rayonnement est distribuée dans le 
spectre des pulsations selon la loi de Planck (cf. | nique): 


RCD) = [J's #1] 
exp| —|-1 
(7) 


où nous admettrons que Test la température (3'000 [K] environ - température d'ionisation des atomes 
les plus simples) à ce moment-là. Cette distribution va ensuite évoluer sous l'influence de l'expansion de 
l'Univers. 


Considérons les photons situés, à cet instant t dans le volume }3, et dont la pulsation est & à 4x près. 
Leur nombre est donc égal à: 


da 


"= 


Comme il n'y a plus d'absorption ni d'émission de photons à cette température (c'est une hypothèse mais 
comme les mesures expérimentales semblent confirmer ce modèle à défaut de mieux...), ce nombre va 
rester constant. Mais à cause de l'expansion de l'Univers, ces photons en nombre constant vont occuper 
un volume plus grand, et acquérir une longueur d'onde plus grande (selon l'expansion de la structure 
même de l'espace due à la valeur positive de la constante de Hubble) c'est-à-dire une pulsation plut 
petite (l'équivalent de l'effet Doppler). Pour préciser, examinons la situation à un instant t' ultérieur. 
Toutes les longueurs de l'Univers ont été multipliées entre, entre t et t', par le même facteur d'échelle F 
selon la loi de Hubble: l'arête r du volume cubique choisi est ainsi devenue: 


aN IL R(o,7 = r 285 


r'=Æ'r 


et la longueur d'onde des photons considérés: 
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À'= F'À (51215) 


de sorte que leur pulsation vaut à l'instant t": 


2  @ 
@'=———=— (51216) 


À" F 


Donc, l'énergie contenue à cet instant dans le volume j7' =; et dans la bande de pulsations 
(@',@'+d@', que nous écrirons >» R'{@',T'dæ' est donnée par: 


Fe 


La densité volumique d'énergie R'{&æ',7 "4 &' à l'instant t', pour la bande de pulsation (&',@+4&, 


r°R(@ Tdæ' =h@'idN\= 


s'écrit donc: 


(aN\ 2, 
R(@'T)da' = ho = he] — gee ec) Ce Pers | 
— 


Il s'ensuit que la distribution spectrale de l'énergie est encore à l'instant t' celle du corps noir: 


12 
R@T = ho" 22, | 


Je ) (51.219) 
exp|— |-1 


où la température correspondante T ‘est telle que: 


Ainsi, après son découplage d'avec la matière, le rayonnement cosmique évolue en conservant la 
distribution d'un corps noir dont la température décroît régulièrement, dans la même proportion que 
s'accroissent les distances au cours de l'expansion de l'Univers (depuis le moment du découplage, le 
facteur F d'échelle est très voisin de 1'000 puisque pour passer de 3'000 [K] aux 2.7 [K] actuels il y a un 
facteur 1000...). Cette valeur de 100'0 nous permet à partir du modèle de Friedmann-Lemaître que nous 
avons démontré en partie ci-dessus de facilement calculer à quel moment de l'âge (horizon) de l'Univers 
ce découplage a eu lieu. C'est ainsi que nous trouvons une valeur d'à peu près 0 68:10$ années. 


C'est en se fondant sur ce raisonnement que divers auteurs furent amenés à prédire l'existence dans 
l'Univers actuel, d'un rayonnement fossile de quelques kelvins. La découverte de Penzias et Wilson, 
confirme parfaitement le plus solide argument en faveur du modèle (cosmologique) standard, qui 
reconstitue l'histoire de l'Univers à partir de la "grande explosion" initiale. 
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4. L'UNIVERS TROU NOIR 


Une hypothèse assez récente dans l'histoire de la cosmologie (quelques décennies) et qui est au coeur 
de nombreuses recherches théoriques (Hawking, Penrose et autres) est la possibilité d'assimiler notre 
Univers à un Trou Noir (cf. chapitre de Relativité Générale). 


L'origine de l'idée peut se faire à partir d'un calcul très simple: 
Nous savons que le rayon de l'Univers (actuel) est donné selon nos calculs précédents par: 
r=ct=cH5 = 12.10% [»] (51221) 


Or, nous avons démontré dans le chapitre de Relativité Générale (et de Mécanique Classique) que le 
rayon de Schwarzschild est donné par: 


ce qui avec les valeurs de la densité critique et du rayon de l'horizon cosmologique calculé plus haut 
donne: 


A . 
266 | —7 
.. a é) 2G- 3.61. 1072 (51.224) 


= 0.53.10% 


Ilè 


Donc grosso modo, connaissant toutes les incertitudes que nous avons accumulées en particulier celle 
sur la constante de Hubble nous voyons que le rayon de Schwarzschild n'est pas très loin du rayon de 
l'Univers actuel. 


Aussi curieux que cela puisse sembler, cette question n'est pas si farfelue et est très sérieusement 
étudiée. Il est donc théoriquement possible que tout notre univers soit encapsulé dans un gigantesque 
Trou Noir (donc de très grande masse et très faible densité comme nous le voyons avec nos valeurs 
numériques) d'un autre univers inaccessible. 


Ce qui est sûr est que si tel était le cas, l'expansion de l'Univers (observée actuellement), ne pourrait pas 
se poursuivre au-delà de l'horizon de ce super Trou Noïr, car rien venant de l'intérieur ne peut franchir 
cet horizon. Or, des observations récentes semblent montrer que l'expansion de l'Univers est loin de 
ralentir et tend plutôt à s'accélérer avec le temps, ce qui est en contradiction avec un tel Trou Noir 
Univers. 
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Notes personnelles: 
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52. THÉORIE DES CORDES 


L faut bien considérer dans le présent chapitre que la théorie des cordes (et in extenso des 


supercordes) est actuellement spéculative et n'a pas pu être vérifiée (confirmée) ni falsifiée par 
l'expérience comme le veut la démarche scientifique. Il convient donc de prendre avec prudence les 
développements qui vont suivre et d'être le plus critique possible ! 


Il s'agit par ailleurs d'une théorie (nous ne pouvons pas parler de modèle actuellement) d'unification des 
forces qui n'est pas nouvelle puisqu'elle a bientôt plus de trente ans et qui tente de combler les défauts 
du modèle standard des particules et aussi de réunir la relativité générale et physique quantique (ce qui 
n'est pas sans mal puisque cette dernière est dépendante du fond contrairement à la relativité générale). 
Elle est une des nombreuses théories qui existent en physique moderne et qui tentent en ce début de 
21ème siècle cette unification (il en existe une dizaine d'autres plus ou moins connues). 


Remarque: Si ce sujet est traité dans la section de cosmologie et non d'atomistique c'est uniquement 
pour une raison pédagogique. Effectivement, le formalisme de base de la théorie des cordes est 
beaucoup plus proche de la mécanique relativiste (relativité restreinte et générale) que de celle de la 
physique quantique ondulatoire ou de la physique quantique des champs. Il nous a semblé donc plus 
adapté, à ce jour (!), de proposer une continuité dans le formalisme mathématique et son 
interprétation plutôt qu'une continuité thématique avec une approche relativement différente de 
celle du formalisme habituel de la physique quantique. 


L'avantage indéniable de la théorie des cordes, outre le fait que mathématiquement elle soit assez 
indigeste mais pas vraiment pire que la relativité générale, est qu'elle permet d'éviter dans un certain 
ordre. de nombreuses singularités dans les calculs à l'inverse d'autres théories contemporaines qui 
considèrent les objets comme des points (donc de volume et longueur nuls...). 


Cette théorie, bien qu'étant esthétique et remarquable dans le sens qu'elle utilise pour ses fondements 
des bases de calculs qui ont plus de 200 ans, a pour défaut selon nous de s'imposer par analogies 
successives, comme nous le verrons, avec les théories relativistes et quantiques actuelles. Même si cela 
n'est pas dramatique en soit, la théorie peut sembler perdre un peu de son autonomie propre même si au 
fait il n'en est rien. Il ne faut donc pas être surpris en mal lors du parcours des développements qui vont 
suivre. 


La principale particularité de la théorie des cordes est que son ambition ne s'arrête pas à cette 
réconciliation, mais qu'elle prétend réussir à unifier les quatre interactions élémentaires connues, on 
parle de théorie du tout, tout en reposant sur deux hypothèses: 


H1. Les briques fondamentales de l'Univers ne seraient pas des particules ponctuelles, mais des sortes 
de cordelettes vibrantes possédant une tension à la manière d'un élastique. Ce que nous percevons 
comme des particules de caractéristiques (masse, etc.) distinctes ne seraient que des cordes vibrant 
différemment. Avec cette hypothèse, les théories des cordes admettent une échelle minimale et 
permettent d'éviter facilement l'apparition de certaines quantités infinies qui sont inévitables dans les 
théories quantiques des champs habituelles. 


H2. L'Univers contiendrait plus de trois dimensions spatiales. Certaines d'entre elles, repliées sur elles- 
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mêmes, passant inaperçues à nos échelles (par une procédure appelée "réduction dimensionnelle"). 


Malgré de premiers résultats partiels très prometteurs ainsi qu'une richesse mathématique remarquable 
la théorie des cordes reste toutefois incomplète. D'une part, une multitude de solutions aux équations de 
la théorie des cordes existe, ce qui pose un problème de sélection de notre Univers et, d'autre part, 
même si beaucoup de modèles voisins ont pu être obtenus, aucun d'entre eux ne permet de rendre 
compte précisément du modèle standard de la physique des particules. 


Ceci étant dit. commençons notre initiation: 
1. ÉQUATION D'ONDE NON RELATIVISTE D'UNE CORDE TRANSVERSALE 


L'objectif ici va être dans un premier temps de déterminer l'équation d'onde non relativiste d'une corde 
excitée transversalement à l'aide des calculs que nous avions effectués dans le chapitre de Mécanique 
Ondulatoire. Une fois ce travail effectué, nous passerons à l'étude des cordes relativistes et nous 
verrons que leur équation d'onde, au même titre que la version non relativiste, peut s'assimiler à 
l'équation de conservation du courant que nous avions démontrée en électrodynamique. 


Nous commençons en rappelant la forme de l'action que nous avions obtenue dans le chapitre de 
Mécanique Ondulatoire pour une corde non relativiste: 


S= jajee(?.2 . 52.1) 
x 


A foY 1 (®Y1, 2, 
-fLe(?) +) ER Hi (52.2) 


Maintenant, de manière identique à ce que nous avons fait dans le chapitre de Mécanique Analytique 
(ainsi que dans celui de Physique Quantique Des Champs), nous allons définir une notation par une 
analogie aux moments canoniques de la corde: 


avec donc: 


dy d 
avec y'= dy} äx. Il s'agit simplement des dérivées de la densité lagrangienne en fonction 


respectivement du premier et second argument. De manière plus explicite, nous avons alors directement 
en faisant le calcul (cf. chapitre de Mécanique Ondulatoire): 


Ainsi, si nous réécrivons le variationnel d'action obtenu dans le chapitre de Mécanique Ondulatoire 
avec cette notation canonique, nous obtenons: 


(8 8(6y}] * 
(8) _ rŸ 20 (as Der | (52.5) 


S = fa fai "fe fes 
dé âx dy" 
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Faisant usage des mêmes méthodes que dans le chapitre de Mécanique Ondulatoire, notre variationnel 
s'exprime après simplification à nouveau sous la forme de trois termes: 


8°y 


68 = IE x] de (+ “l La fafa[a Se rer - 


pole fret a jafé PP | 


Les conditions pour trouver l'extremum (selon le principe de moindre action) restent les mêmes que 
celles vues dans le chapitre de Mécanique Ondulatoire. Ainsi, pour le troisième terme, nous avons bien 
l'équation d'onde d'une corde excitée de manière transversale donnée avec la forme canonique par: 


= 0! (52.7) 


Es . 8P* 
dé üx 


Remarque: Il convient bien évidemment de remarquer que cette forme d'écriture va 
considérablement nous faciliter la tâche! 


Il faut bien observer (car c'est remarquable!) aussi que comme dans le chapitre de Mécanique 
Analytique, le moment canonique P* tel que défini plus haut, coïncide parfaitement (le hasard fait bien 


les choses.) avec la densité de quantité de mouvement que nous avions obtenue dans le chapitre de 
Mécanique Ondulatoire. Effectivement: 


FA 
», -( par) à fa gr = fp'as (52.8) 


Ainsi, par analogie avec la mécanique analytique (où rappelons-le, la dérivée du lagrangien par rapport 
à la vitesse donne la quantité de mouvement), ÿ joue bien le rôle de la vitesse et ainsi la dérivée de la 
densité lagrangienne par celui-ci donne la densité de quantité de mouvement P* !!! 


Rappelons aussi un autre point qui a été vu dans le chapitre de Mécanique Ondulatoire, l'extremum de 
l'action (45 = 0 ) nous impose les conditions de Neumann, ce qui nous amène à écrire P* = (. 


De plus, il convient aussi de rappeler pour ce qui va suivre, que pour les conditions de Dirichlet nous 
avions aussi P* = (. 
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Remarque: Dans le cadre de la théorie des cordes relativistes à plus de 3 dimensions, il est possible 
de généraliser le concept de conditions aux limites en considérant les contraintes dans l'espace 
comme des hypersurfaces nommées Dp-branes à p dimensions. Les conditions aux limites de 
Dirichlet usuelles correspondent alors à la situation où les bouts d'une corde sont contraints par une 
0-brane. La condition de Neumann pour une corde libre dans p dimensions correspond à une corde 
contrainte sur une Dp-brane. 


DÜ-brane 


Di-brane 


D2-brane 


D3-brane 


Figure: 52.1 - Illustration des Dp-branes 


2. EQUATION D'ONDE RELATIVISTE D'UNE CORDE TRANSVERSALE 


Nous allons maintenant déterminer l'action d'une corde relativiste. Nous pouvons, pour poser les bases 
de notre étude, nous rappeler qu'une particule ponctuelle trace une ligne dans l'espace-temps (chaque 
point de la ligne étant repéré par une coordonnée temporelle et trois spatiales). Dès lors, par extension, 
une corde qui est un élément bidimensionnel (si nous la considérons sans épaisseur) trace une surface 
dans l'espace-temps. 


Ainsi, au même titre que la ligne que trace une particule dans l'espace-temps est appelée une "ligne 
d'Univers" (cf. chapitre de Relativité Restreinte), la surface tracée par une corde sera appelée par 
analogie une "surface d'Univers". 


Une corde fermée dans l'espace-temps de Minkowski trace, par exemple, un tube, alors qu'une corde 
ouverte tracera une bande: 


1 Corde ouverte Corde fermée 
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Figure: 52.2 - Surface d'Univers générée par une corde ouverte/respectivement fermée 


Sur la figure ci-dessus, à deux dimensions spatiales et une temporelle, la corde est immobile dans notre 
espace courant. Elle ne se meut que dans l'espace-temps (car le temps s'écoule sur l'axe vertical) mais 
pas dans l'espace dans l'exemple ci-dessus (il faudrait une composante spatiale supplémentaire pour 
voir un tel mouvement). 


Remarques: 


R1. Attention! Rappelez-vous bien que le schéma ci-dessous est dans trois dimensions alors que 
l'espace-temps compte lui quatre dimensions. 


R2. Rappelez-vous également que le vecteur temps de la base orthogonale est toujours 
perpendiculaire à toutes les autres composantes spatiales (cette remarque sera utile lors de notre 
démonstration de l'action de Nambu-Goto). 


Lors de notre démonstration de l'équation du mouvement dans le chapitre de Relativité Générale, nous 
avons reparamétré la ligne d'Univers de la particule à l'aide d'un paramètre qui était le temps propre de 
la particule t. Effectivement, il suffit de se rappeler des équations paramétriques qui représentent des 
courbes. Par exemple avec Maple 4.00b: 


> with(plots): 
> spacecurve([cos(t),sin(t),t],t-0..4*Pi,axes-boxed); 


Figure: 52.3 - Rappel élémentaire illustré de la paramétrisation d'une courbe 
et la même procédure est valable pour une ligne en quatre dimensions (espace + temps). 


Nous étions ainsi arrivés à construire l'expression de l'action S de celle-ci avant d'y appliquer le principe 
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variationnel. 


Nous allons faire de même pour une corde relativiste à la différence que nous allons reparamétrer les 
surfaces engendrées par les cordes cette fois-ci. Les contraintes que nous nous imposerons sont que les 
paramètres choisis devront aussi (en faisant référence au cas de la particule) être des invariants 
relativistes. 


Comme nous l'avons donc vu dans le chapitre de Relativité Générale, une ligne d'Univers peut être 
reparamétrée naturellement en utilisant seulement un paramètre (abscisse curviligne). Une surface dans 
l'espace étant cependant un objet bidimensionnel, nous supposerons qu'il requiert par extension deux 
paramètres £! #? (un de plus) pour être décrit complètement. 


Effectivement, nous devinons, qu'un des deux paramètres sera le temps propre (pour faire évoluer la 
surface dans le temps), le second paramètre permettra de donner une "épaisseur" à ce qui ne serait 
qu'une ligne d'Univers s'il n'existait pas. Il suffirait dans un espace à trois dimensions que ce deuxième 

paramètre ait pour générer une surface les dimensions d'une longueur mais dans l'espace-temps à quatre 


dimensions il faut que second paramètre ait les unités d'une surface. 


Étant donnée une surface paramétrée, nous pouvons dessiner sur celle-ci les isolignes des paramètres 
&l &? (les lignes où les deux paramètres sont constants sur toute la surface). Ces isolignes couvrent la 


surface comme une grille (voir figure un peu plus bas). 


L'équation paramétrique d'un volume requiert dans l'espace trois paramètres comme nous l'avons vu 
dans le chapitre de Géométrie Analytique. Ainsi, si une surface paramétrée peut dans l'espace euclidien 
être représentée par un vecteur du type: 


lors d'une reparamétrisation et en faisant usage de la notation tensorielle de l'espace-temps de 
Minkowski telle que vue dans le chapitre de Relativité Générale, nous aurons (en nous restreignant 
pour l'instant aux cas particuliers de deux dimensions spatiales et une temporelle): 


N 


r(e,8) 
= |2(2,87) 
r (8,6) 


Ainsi, la surface est l'image des paramètres £! #?. Alternativement, nous pouvons voir les composantes 


El, &? comme les coordonnées de temps et d'espace de la surface, au moins localement! 


Nous voulons maintenant calculer la surface d'un élément de n'importe quel type d'espace au même 
titre que nous l'avions fait pour l'abscisse curviligne de n'importe quelle ligne d'Univers dans le chapitre 
de Relativité Générale. Se pose alors la question de la forme de l'élément différentiel de surface ??? 
Faut-il prendre la multiplication du différentiel des deux paramètres choisis précédemment pour un 
carré, un rectangle, un cercle ou autre ? 


Au fait, nous allons reporter notre choix sur un parallélogramme ! Ce choix peut sembler complètement 
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arbitraire pour l'instant mais comme nous allons le voir quelques lignes plus loin, ce choix coïncide pour 
des raisons mathématiques à ce que nous appelons la "métrique induite" de la surface elle-même 
(résultat assez remarquable!). 


Ainsi, notons 4, et dv, les côtés du parallélogramme. Ils sont l'image par * des couples (4,0) et 


respectivement (0, E? ) : 


Figure: 52.4 - Configuration pour l'étude d'un élément de surface élémentaire 
Ainsi, nous pouvons écrire: 


di _8* dù 4x 


—>=— —<+=— (52.11 
dé! GE'det 86? us. 
et donc: 
PR PR: 
dy, "aa 2 se dE (52.12) 


Maintenant calculons la surface dA (nous ne prendrons pas la lettre S pour éviter la confusion avec 
l'action dans ce chapitre) du parallélogramme (cf. chapitre de Calcul Vectoriel}: 


aA = JA |]HFÎfsin 8 = INT cos 8 - 


FIG IR cos 8 6219 


en utilisant le produit scalaire, cela peut se réécrire: 


a — a 
dAÀ = (dv, o dv )(d, ° dv) -(, o dv) (52.14) 
en utilisant, les relations établies précédemment cela peut s'écrire: 


ea ]oe 2e) (ser na] 


cette dernière relation est la forme générale d'un élément de surface d'une nappe paramétrée. La 
surface totale étant évidemment donnée par: 
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dA = dé À 


ns 


(52.16) 
n 7 5e 7 


Au même titre que dans le cadre de l'étude principe de moindre action (cf. chapitre de Mécanique 
Analytique) nous avions cherché le chemin optimum pour une particule parcourant une ligne d'Univers, 


A= fase 


ee 


pour une corde, nous aurons à optimiser la surface A en minimisant la fonction * (#, E? 1. 


Cette dernière forme est cependant un peu lourde et ne fait rien ressortir de particulier ou de similaire à 
quelque forme déjà connue dans un autre domaine de la physique. Nous allons voir cependant qu'en 
creusant un peu il est cependant possible d'obtenir quelque chose de pas mal du tout. 


Considérons maintenant un vecteur 4x et sa longueur (norme) au carré donnée par son produit 
scalaire: 


ds? = (as) =dfod* (52.17) 


Attention à l'avenir de ne pas "voir" le s comme étant élevé au carré dans le ds (comme c'est le cas en 
relativité restreinte et générale) mais rappelez-vous bien qu'il s'agit du ds en entier qui est mis au carré 
(la notation peut amener à confusion...). 


Le vecteur 4x peut être exprimé sous forme de termes de dérivées partielles de 4£!,d4 ?, tel que nous 
obtenions sa différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral): 


_ x 22 52 
dx 3e do + 3e dÊË 3 dé (52.18) 


Ainsi, la longueur au carré de 4x peut s'exprimer sous la forme tensorielle: 


La | 
a [À Rae | [ue Je En das (52.19) 


ce que nous noterons par convention à l'avenir: 
ds = g;(£)dé de (52.20) 


La quantité g; (£&) est appelée la "métrique induite de la surface paramétrée" (car contient un produit 


scalaire ce qui en toute généralité fait appel à une métrique. d'où le terme "induite") et il s'agit donc 
d'une matrice de dimensions 2? x2. Il est évident que le choix de cette dénomination provient de la 
ressemblance avec la métrique habituelle telle que nous l'avons définie lors de notre étude du calcul 
tensoriel et de son utilisation en relativité restreinte et générale. 


La matrice g; a donc par construction et définition la forme: 


RE En 
_ 4€ ge ae! 4€? . 
le & & &l 


28 0€ 4€ 6 
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N 
N 


Revenons maintenant à notre expression de la surface engendrée par la corde: 


et donc quoi ? Eh ben voilà: 


A= (a EE? fg (6224 
Ainsi, le choix du parallélogramme comme surface élémentaire s'explique mieux ici! 


Maintenant, nous allons adopter les écritures traditionnelles de la théorie des cordes relativement à 
l'expression de la surface. Ainsi, au même titre que les coordonnées d'espace-temps sont décrites en 
relativité restreinte par le quadrivecteur temps-espace: 


x* = +) (52.25) 


nous décrirons les surfaces d'Univers par (nous passons maintenant à l'écriture faisant usage des 4 
dimensions de l'espace-temps): 


L'ORÉ) eA TE A) (5226) 


Cette notation nous évitera à l'avenir d'avoir à confondre, si la théorie nous y amène, les coordonnées 
d'espace-temps ;* traditionnelles avec la fonction image de la surface d'Univers x*(r,«) et ce d'autant 


plus que les physiciens étant un peu flemmards abrègent parfois cette dernière ;#.. d'où le choix de la 
majuscule. 


Il est donc beaucoup plus convenable et sage de changer de notation... 
À partir de maintenant, nous appellerons "coordonnées de corde" la surface d'Univers décrite par x». 


Ce petit changement de notation ne change évidemment pas l'interprétation de la fonction image. Étant 
donnée un couple {T,&) associant élément de temps propre dans l'ensemble et élément de surface des 
pré-images, ce point est projeté sur un élément de surface de l'espace-temps de la corde de 
coordonnées: 


(4° (r,0),X'(r. 0)... X°(r,o)) (52.27) 


2.1. ACTION DE NAMBU-GOTO 


Dans le cas d'une surface d'Univers les paramètres sont donc par convention + et &,où comme en 
relativité restreinte et générale le temps propre peut être compris dans l'intervalle: 
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TE |-w,+œ[ (52.28) 


le deuxième paramètre par contre ne pouvant être que positif puisqu'il s'agit d'une surface: 
gel0.a[ (5229 


et les coordonnées de cette surface qui correspondent à l'espace des paramètres étant donc: 


Où encore une fois pour rappel, le paramètre + est considéré comme la variable décrivant 
l'écoulement du temps (il en faut bien une!), et & la variable décrivant l'extension dans l'espace d'une 
corde (i.e. la condition € ]0,&[ impliquant la longueur finie de cette corde). 


Les paramètres {T, a) décrivent ainsi une surface de l'espace des pré-images: 


T 


ao [] 
àT 
€ 
Figure: 52.5 - Paramétrisation d'une surface de l'espace-temps 
Les extrémités de la corde ont une valeur & constante. Cependant, comme le temps s'écoule et que les 


extrémités de la corde sur la surface d'Univers se meuvent il faut noter une condition essentielle de la 
surface d'Univers concernant les deux bouts d'une corde ouverte: 


Remarque: Cette condition se fait sur la composante y? car elle correspond à la composante ;° du 


quadrivecteur d'espace-temps qui n'est autre, en unités naturelles, que t (le temps propre). Dès lors, 
le temps s'écoule et n'est jamais constant d'où le fait d'imposer cette dérivée comme différente de 
Zéro. 


Et en utilisant les conventions habituelles en physique pour la notation des dérivées par rapport au 
temps ou composante spatiale, nous convenons d'adopter aussi maintenant les écritures suivantes: 


où puisque: 
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XA(r.o)= XA(Go)=(ct,Ê(.o)) (5233) 


alors: 


D'ou ax? Le û L' 
ENEr ‘8c 


La surface s'écrit donc: 


A - fdga 


- fo 
OT ÔT oo ÔT 0 


= jezof(x) (XŸ -(Z0xŸ 


Cependant, il y a un problème ici ! Effectivement, regardons si le radicande (terme sous la racine) a une 
réalité physique tangible. 


ES e ax" 8x, L & _ (62.35) 


Pour cela, il faut d'abord considérer la partie gauche de la figure ci-dessous qui représente la surface 
(nappe) décrite par une corde ouverte: 


Figure: 52.6 - Configuration pour l'étude du radicande 
En chaque point P de cette nappe (supposée dérivable en tout point) il existe une infinité de tangentes, 


toutes dans le même plan, que nous noterons pour l'exemple ÿ et qui forment donc une surface 
tangente au point P. 


Maintenant, comme l'espace dans lequel la nappe de la corde est plongée se déroule dans une base 
orthonormale spatiale et temporelle, les vecteurs tangents ÿ peuvent alors à leur tour être décomposés 
dans une base orthogonale spatiale et temporelle locale bidimensionnelle au point P tel que les vecteurs 
de cette base soient deux vecteurs: 
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AX* AK 
QT a 


(52.36) 


tous les autres vecteurs tangents s'exprimant comme combinaison linéaire de ceux-ci. 


Cependant un problème subsiste dans notre décomposition (...): les unités des vecteurs de la base 
orthogonale locale au point P ont des unités qui diffèrent. Pour cela, rajoutons un facteur de 
dimensionnement à la composante spatiale (cela est arbitraire car la conclusion sera identique quelle 
que soit la composante sur laquelle vous mettez le facteur de dimensionnement): 


aX* a 847 
AT a 


ce facteur de dimensionnement peut aussi être utilisé pour obtenir tous les vecteurs tangents tel que: 


.. ax, ax 
AT a 


Effectivement, si ÀA€[-«,+], alors pour À = 0 nous obtenons le vecteur 4##}4+r et pour À = + le 
vecteur 4Y%}j 4er. Et pour toutes les valeurs intermédiaires, nous obtenons tous les vecteurs tangents 
comme indiqué sur la partie gauche de la figure précédente. 


Maintenons, rappelons que nous avons vu dans le chapitre de Relativité Restreinte qu'il existait selon 
l'abscisse curviligne: 


ds? = dx" (7,47) = dx'dx, = cat? - dx? - dy? - dr? (52.39) 


des lignes d'Univers de type lumière (75? = 0), espace (45? < 0 ) ou temps (45? > 0 ) si nous 
considérions les quadrivecteurs x. 


Il doit en être de même par analogie pour les vecteurs tangents à la surface et donc données par: 


yv# = OA? 4 3 847 (52.40) 


AT a 


Ainsi: 


Ja 
. 52.41) 


= [277 _ aX LS 
at 


ce qui correspond à une équation du deuxième degré en 4, doit pour avoir des valeurs négatives 
(surface d'Univers de type temps) ou positives (surface d'Univers de type espace) avoir au moins deux 
racines (voir partie droite de la figure précédente). Cela nous ramène à la condition que le discriminant 
soit strictement positif (cf. chapitre de Calcul Algébrique): 


eo HA HA 
A =? -4ac = v"y, 4 2 - (ee c\[E | >0 (52.42) 
T 
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Soit: 
aX* = # 
AT 


sous forme condensée cela nous ramène à écrire: 


M 
DIE | > O0 (52.43) 


(XX Ÿ -(XŸ(XŸ >0 c24 


La surface doit donc alors s'écrire en fin de compte: 


- fdrda (XX Ÿ -(2Y (XY | 6245 


si nous voulons que le radicande ait un sens physique. 


Rappelons maintenant que l'action S d'une particule ponctuelle est proportionnelle à sa ligne d'Univers. 
Ainsi par analogie, l'action S d'une corde sera proportionnelle à la surface d'Univers: 


Sœ [4 & Sœx À (52.46) 
ce qui donne: 


S'« fdrdo, (xx -(4Ÿ(XY 624 


Ce qui nous amène très fréquemment dans la littérature à trouver l'action d'une corde sous la forme 
suivante: 


S= fdodr£(a, T)| (52.48) 


Relation à comparer avec le lagrangien d'une particule libre (cf. chapitre de Mécanique Analytique) et 
la densité lagrangienne d'un champ (cf. chapitre de Physique Quantique Des Champs): 


te 


S{a,4) = [L(@.dhdt et 5 = [c(æf,b",8,D" hat (524) 
7e 


La fonctionnelle S a pour unités celles d'une surface. Cela parce que les x ont une unité de longueur 
et dans la racine chacun est à la puissance quatrième et que les unités ?,® s'annulent entre l'intérieure 
de la racine et les différentielles en dehors. 


Maintenant, par définition même de l'action, les unités que nous devons obtenir doivent correspondre à 
celle d'une énergie multipliée par le temps, des joules J ou en utilisant le système international, des 
kg mm? * 571. Pour l'instant, nous avons: 


[t]=s [ol=m [X#]=m» [A]=#? (52.50) 


Pour obtenir pour l'action les unités que nous voulons, il nous faut alors multiplier l'expression de la 
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surface A par une quantité ayant pour unités des #g :5"!. Pour choisir ces quantités, nous allons nous 


inspirer de notre étude de la mécanique ondulatoire. Quand nous avions travaillé avec des cordes (non 
relativistes) nous avions vu que les propriétés à prendre en compte étaient la tension et la vitesse de 
l'onde de propagation de la corde. Nous allons donc faire l'essai de prendre le rapport tension/vitesse 
suivant: 


tension __ N _kg'm's? 


Viéesse MS m°E 


où apparaîssent donc la "tension de la corde au repos" et la vitesse de la lumière. 


Remarque: Cela est similaire à la physique du point où dans l'action nous retrouvons la masse au 
repos (équivalente de la tension au repos de la corde) et la vitesse de la lumière (cf. chapitre de 
Relativité Restreinte). 


Ainsi, "l'action de Nambu-Goto" s'écrit maintenant: 


s- À jaraer (Z°xY -(GY GT] 65 


plus loin. Cependant, une 


Remarque: Nous démontrerons pourquoi nous avons posé un facteur 
petite analogie avec l'action d'une particule ponctuelle, pour laquelle nous avons aussi un signe 
(cf. chapitre de Relativité Restreinte), peut facilement déjà se faire. 


Définisson pour la suite: 


ÔT 0 ÔT 0 


ce que nous pouvons aussi écrire sous forme matricielle: 


(52.54) 


Et en utilisant le déterminant de cette matrice il vient: 
y = det(y,,) = (4Ÿ (XY -(ZXŸ (52.55) 


Donc nous pouvons alors réécrire l'action d'une corde relativiste sous la forme finale condensée 
suivante: 


S- 1 facao Fr (52.56) 
[+] 


qui n'est autre que “l'action de Nambu-Goto condensée" d'une corde relativiste. 
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Nous allons maintenant obtenir l'équation du mouvement en faisant varier l'action. Nous allons pour 
cela nous inspirer exactement des méthodes vues lors de la détermination en début de ce chapitre de 
l'équation d'onde non-relativiste d'une corde. 


Ainsi, nous réécrivons l'action de Nambu-Goto en définissant une densité lagrangienne £ telle que: 


AR | ri A RL : 
& 


S= 2 jardoyFr - el do£l — 2) do£( D du 0) (52.57) 


où £ est donc définie par: 


J 


£(X*,x#1) =-10 (XoxY -(4Ÿ (xŸ (52.58) 


€ 


Nous allons maintenant appliquer le principe variationnel sur l'action afin d'en tirer l'équation de 
mouvement d'une corde. Le développement et l'approximation sont parfaitement similaires à ceux vus 
dans le chapitre de Mécanique Ondulatoire pour la corde non relativiste. Rappelons que nous avions 
obtenu comme densité lagrangienne et comme expression de l'action: 


“# 


(à > fe as jajac(2. 2 Po (5,7) (62.59) 


et que l'application du principe variationnel nous avait donné: 


ue 04 2) (52.60) 


OS = jajala® bi re 


Or, ce que nous n'avions pas vu dans le chapitre de Mécanique Ondulatoire, c'est que cette dernière 
relation pouvait facilement s'écrire aussi à partir de la densité lagrangienne: 


L Ë 
a(8 8(5y) a(ô a£ 4(8 
ôS = fa dx _ 8(8y) = [dt rs 2 8(8y) , 80 4(8y) (52.61) 
1?) À — El A “— ! dÿ dé dy' ôx 
Dès lors, pour la corde relativiste, nous avons une forme identique en appliquant des développements 


en tous points similaires (et ce même si la densité lagrangienne a une forme différente): 


ÿ à ac 8(6X*) ac 8(5X*) 
ne GË* dr 4" 40 


(52.62) 


et comme nous l'avons fait au début de ce chapitre pour les cordes non relativistes, nous allons 
introduire les moments canoniques (densités d'impulsion/quantité de mouvement si vous préférez) de la 
corde en optant pour la notation: 
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e Æ pos 
HOOGYA A Km 


où dans les détails, nous obtenons très facilement (c'est une simple dérivée mais si vous le souhaitez en 
nous contactant, nous pouvons vous le détailler) les moments longitudinaux et transverses: 


Pi = EE A EE 
HORS à Pa sc rev 
(Zex') -(4]7 (a) 
(52.63) 
Pi 
en faisant usage de cette notation, nous pouvons alors écrire: 
LR 8(8X*) ,4(5X*) 
6$ = dé PE + PE "| (5264) 
l DE : 4 D nu 


Faisant usage des mêmes méthodes que celles vues dans le chapitre de Mécanique Ondulatoire, notre 
variationnel s'exprime après simplification à nouveau sous la forme de trois termes: 


ÿ a a 3 a(P') a(?° 
se ie hé SEX" PA )+ (GX) )- 6x" LA (52.65) 


Les conditions pour trouver l'extremum (selon le principe de moindre action) restent les mêmes qu'en 
mécanique ondulatoire. Ainsi, pour le troisième terme, nous avons bien l'équation d'onde d'une corde 
excitée de manière transversale donnée avec la forme canonique par: 


a(rs) ,o(r?) 
ÔT CTe 
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= {| (22.66) 


Il s'agit de l'équation du mouvement (ou onde) d'une corde ouverte ou même fermée (car finalement 
dans les développements précédents à aucun moment nous n'avions contraints les termes à être ouverts 
ou fermés). 


Cette équation est horriblement difficile à résoudre mais le choix d'une paramétrisation adéquate peut 
néanmoins simplifier la tâche. 


3. LAGRANGIEN D'UNE CORDE 


Rappelons que nous avons: 


et qu'avec ce choix, nous avons donc: 


s=-“fac (xx Y-(2) (x Ÿ 


2 


| 


(52.68) 


TE 
ES FEÉE 


Maintenant, utilisons ce que nous avons vu dans le chapitre de Géométrie Différentielle avec le trièdre 
de Frenet: 


æ 
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(52.69) 


où F est donc la tangente à la surface d'Univers à un instant t au voisinage d'un point donné. Nous 
avions par ailleurs montré dans ce même chapitre que par définition: 


= EL 1 ro 
ds ds ds ds 


a ai [Ÿ -2E,0f 08 Rfue) Roue) . 


ds __8o 8a oT 3a\ ds 3o 80 ds 


Or, nous pouvons écrire: 


où il ne faut pas oublier que AË ; 3g est pris à un temps t fixé. Comme les lignes de la surface d'Univers 
de constante t décrivent la corde, alors A£ ; 44 est tangent à la corde. 


Et comme: 


Alors 4% / ds est colinéaire à AŸ ; 34 et donc aussi tangent à la corde (information que nous n'avions 
pas quelques lignes plus haut!). Ces petites constatations étant faites, revenons à: 


JE 


Il 


cela devient déjà un peu plus intéressant! 


Considérons maintenant le schéma suivant: 
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& 


Ét 


ÿ # 
Figure: 52.7 - Rappel illustré du produit scalaire 


où # est un vecteur quelconque et * un vecteur unitaire (sans dimensions) et » , la projection 
orthogonale de & sur #. Nous avons alors (cf. chapitre de Calcul Vectoriel): 


30% =|Hfrlcos8 = (élcos8)lAl = Pl: 6279 


Or, si nous recherchons le vecteur ÿ il faudra multiplier le tout par x: 
S=(om2=bll4 75 


enfin, si nous recherchons l'expression du vecteur # il vient immédiatement: 


Es _ 


V+w=umWw=u-v=u-{#on)# (5276) 
Dès lors, par analogie, nous pouvons écrire: 


. …_ 6X (87 dX\ax 
oAR)A = —- —0— |— (52.77) 
dt ds } ds 


où est donc perpendiculaire à 4Ë j 45 et a comme unité celle d'une vitesse. Par construction, w est 
donc la vitesse transversale à la corde à un instant t donné puisque 4% ; 45 est tangent à celle-ci. Nous 
noterons alors: 


(52.78) 


. La (ar af }ar 
dt ds } ds 


Mettons maintenant, pour des besoins ultérieurs, la norme au carré de cette dernière relation (attention 
on fait le traitement des composantes des vecteurs directement en généralisant à la notation 
vectorielle!): 


_ … _ 2 = = 2 = _ = à … … 
2_(a (a? af\af) (a?) _ (af af\{a? of) (of af) af af 
LU x Üa dslas] |& dt ds]l ds dt dt ds) ds ds 


aŒYŸ (af af\{a? af) (a ax YŸ (af\ (af a Ÿ (af a?\ 
=|—| —-2|—0o || 0 |+|— 02 | = | 210 | + — 0 —— 
dé dé ds || ds dt dé ds dé dé ds dé ds 


(52.79) 
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et si nous revenons maintenant à: 


+2 
x = -Ÿ faras fe vi 


(52.80) 


É= -T | =") Gr60 


puisque: 


t t 
D — Ï za = fa face (52.82) 
Ë h 0 


Le lagrangien de la relation antéprécédente est considéré par les spécialistes de la théorie des cordes 
comme la généralisation naturelle du lagrangien de la particule libre obtenu dans le chapitre de 
Relativité Restreinte: 


2 
Pammlle— (5265) 
2 


€ 
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Notes personnelles: 
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Chimie 


53. CHIMIE QUANTIQUE 


À que le lecteur aille plus loin dans la lecture de cette section du site, nous souhaitons rappeler 


que le site traite de mathématique appliquée et de physique théorique. Ainsi, nous traiterons dans cette 
section uniquement de chimie théorique (chimique quantique théorique, thermochimie théorique, chimie 
cinétique théorique, …). 


Ce choix fait suite à l'évolution du visage de la chimie ces vingt dernières décennies: de science en grande 
partie descriptive, elle tend à devenir déductive. C'est-à-dire qu'à côté de l'expérience, la place du calcul 
grandit constamment et ce particulièrement depuis le développement de l'informatique moderne qui aide 
grandement les chimistes à la modélisation numérique. 


La chimie théorique, appelée également "chimie physique" - application des méthodes de la physique à la 
chimie - est trop souvent encore considérée comme une discipline en soi. Au fait, sous ce terme toute la 
chimie moderne est incluse. Ainsi, l'abord d'un problème quelconque de pointe en chimie exige son 
concours (ainsi que souvent celui de la chance...) et le chimiste doit en posséder une connaissance 
approfondie. Au niveau de l'enseignement de la chimie comme branche secondaire, ce rôle de la chimie- 
physique se manifeste déjà: il en résulte un relèvement du niveau, une augmentation du degré 
d'abstraction, et un risque de rebuter l'étudiant moyen. Enfin, il ne s'agit pas d'alourdir les connaissances 
en y incorporant plus d'éléments nouveaux, mais bien de convertir le mode d'approche de cette discipline 
en substituant le plus souvent à l'énoncé de connaissances encyclopédiques un exposé raisonné des 
questions fondamentales. 


Une bonne compréhension de la chimie nécessite selon nous obligatoirement un crochet obligatoire par la 
physique quantique (cf. section d'Atomistique) afin d'avoir au moins une approche de ce qu'est un atome 
et de ses différentes orbites électroniques avant de parler de liaisons, des différentes méthodes de 
remplissage des orbites électroniques, d'oxydo-réduction, de remplissage des couches, et autres. 


Dans ce sens, nous allons commencer par l'étude du cas particulier de l'atome d'hydrogène qui revêt une 
importance capitale pour toute la suite (étude des atomes polyélectroniques). Il convient donc au lecteur 
de parcourir les prochaines lignes avec toute l'attention possible et d'en saisir au mieux les subtilités! 


1. PUITS DE POTENTIEL RECTANGULAIRE TRIDIMENSIONNEL INFINI 


Nous avons étudié dans le chapitre de Physique Quantique Corpusculaire l'atome d'hydrogène de Bohr- 
Sommerfeld en utilisant les résultats démontrés dans le chapitre de Relativité Restreinte. De ce modèle, en 
est ressorti une quantification simpliste (mais pas trop fausse comme nous le verrons plus loin) de 
certaines propriétés de la matière. 


Dans le chapitre de Physique Quantique Ondulatoire, nous avons étudié le puits de potentiel rectiligne 
infini et l'oscillateur harmonique sans donner beaucoup plus d'exemples. Maintenant nous allons nous 
orienter vers la résolution de problèmes plus proches de ceux utiles en chimie avec l'objectif d'étudier 
l'atome hydrogénoïde. 


Nous allons considérer maintenant une particule se mouvant librement dans la boîte tridimensionnelle ci- 
dessous. 
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Z 
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F 


Figure: 53.1 - Boîte tridimensionnelle imaginaire dans laquelle la particule se meut 
L'énergie potentielle de ce système est donnée par: 
Eu(7,z)=0 0<x<a0U<y<8,0<z<e 


En (xy,z)=® ailleurs 


Comme dans le cas unidimensionnel (voir section de physique atomique), les murs de potentiel infini 
empêchent la particule de quitter la boîte, et la fonction d'onde n'est non nulle que pour F7 se trouvant à 
l'intérieur de la boîte. Elle s'annule nécessairement dès que l'un des murs est atteint. L'équation de 
Schrôdinger que nous devons résoudre est donc (cf. chapitre de Physique Quantique Ondulatoire): 


AY + (Eu Eu) =0 (532) 


et les conditions aux bornes se lisent: 


YVix=0,y,z) = Yix=a,y,z) =0 
Yx,y=0,z) = Y(x,y =b,z)=0 (533) 
Px,y,z = 0) = Y(x,y,z=c)=0 


Notons que l'hamiltonien peut s'écrire comme la somme de l'hamiltonien selon chaque axe (nous parlons 
des opérateurs bien évidemment!). Nous avons donc: 


H=H;+tA SH, (534 


-h?) 4° -h?) 4° -h? | 9° 
A,=l— =, H,=l—)—,H, el —|— (635 
' Er ’ E pr [omlar °°° 
relations dont nous avons démontré la provenance dans la section de physique quantique ondulatoire de ce 
site. 
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Une telle forme est dite "forme séparable": l'hamiltonien est la somme d'opérateurs individuels #, chacun 


ne dépendant que d'une seule variable ou degré de liberté g,. Cette forme traduit le caractère indépendant 
des mouvements décrits par les variables &,. 


Rappelons-nous que la probabilité conjointe de deux événements indépendants est le produit des 
probabilités individuelles des deux événements, pris séparément (cf. chapitre de Probabilités). Nous nous 
attendons donc à ce que la densité de probabilité de présence dans l'espace (cf. chapitre de Physique 
Quantique Ondulatoire) de configuration multidimensionnel soit, dans le cas où l'hamiltonien est de forme 
séparable, un simple produit de densités de probabilités individuelles. En fait, la forme séparable de 
l'hamiltonien permet une séparation de variables sur la fonction d'onde elle-même. 


Écrivons donc les solutions de l'équation de Schrôdinger sous la forme: 
Fay.) = GO) (G) (63.6) 
(lire "zêta de x, thêta y, xi z") d'un produit de trois facteurs chacun ne dépendant que d'une coordonnée. 


Substituant cette écriture dans l'équation de Schrôüdinger, on obtient sans développements (algèbre 
élémentaire): 


SONIA ,6001+ ÉG)E CNE, 80) + (2) SOA C2)] = (Ex — Era) GO) (2) (537) 
ou encore, en divisant les deux membres de ceci par (x) y)£(z) : 


1 1 
[#,80)1+ 7© 


l 
PE RAA 30) CHENE (Eu Enr) (63.8) 
ce qui est une forme beaucoup plus esthétique et facile à mémoriser. 


Cette équation demande que la somme des trois termes dans le membre de gauche soit égale à une 
constante dans le cadre d'un système conservatif (c'est ce qui intéresse souvent les chimistes)! Chacun de 
ces trois termes ne dépendant que d'une et une seule variable, pour que leur somme soit égale à une 
constante, il faut que chaque terme soit lui-même constant. En effet, en prenant la dérivée des deux 
membres de la relation précédente par rapport à x, par exemple, nous avons: 


1 
ä 2) 0 (53.9) 


dx 


l 
ce qui signifie que FE ,#(x)] doit bien être une constante que nous noterons Æ, (car ce terme 
x 


exprime une énergie). Nous avons alors (tiens donc.): 
H,6(x) = ÆE, (x) (5310) 
De même, nous obtenons: 


H,9(y) = E,S(y) et H,C(z) = E,G(z) (5311) 
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Notons que chacune des équations séparées que nous venons d'obtenir, pour le mouvement de la particule 
dans les trois directions spatiales, est une équation de Schrôüdinger dans une boîte unidimensionnelle. 
Ainsi, les trois relations obtenues précédemment décrivent chacune indépendamment le mouvement dans 
la direction respective x, y, z, limité aux intervalles respectifs: 


[0,a],[0,2],[0,c] (53.12 


2 


et doit être respectivement résolue avec conditions aux bornes: 


irrDieDei(r=a) 
Hy = 0)=0=Hy =) (5312) 
ÉG=0)=0=6(z=0c) 


Les résultats obtenus dans le chapitre de Physique Quantique Ondulatoire lors de la résolution de 
l'équation de Schrüdinger dans le cas du puits rectiligne nous donnent directement: 


232 
E,G)= Esfe)s. - 17 
a a SPnd 


2. 2 2 
4 ©) = Fe), L a avec 4€ N* 


222 
CG) “fs (Æ)s. I? 
€ € 7 SAC 

(53.14 


/ 


avec 4e N* 


avec ve N* 


En résumé les états stationnaires de la particule dans la boîte tridimensionnelle sont spécifiés par trois 
nombres quantiques entiers strictement positifs À, 4, V. La fonction d'onde est finalement: 


(53.16) 


La technique de séparation de variables détaillée ci-haut, n'est applicable que parce que l'hamiltonien est 
de forme séparable. Il vient automatiquement dès lors que la densité de probabilité tridimensionnelle 

2 
| micr »,2)| est le produit des densités de probabilités |é, Of |£ of |6, @) F, comme nous l'avions 


anticipé. Nous notons aussi que l'énergie de mouvement dans l'espace tridimensionnel est la somme des 
énergies de mouvements dans les trois directions spatiales: l'indépendance de ces trois directions ou 
degrés de liberté, implique donc l'additivité de leur énergie. 
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2. VIBRATIONS MOLÉCULAIRES 


Nous avons étudié dans le chapitre de Physique Quantique Ondulatoire l'oscillateur harmonique. C'est 
maintenant en chimie que l'on va utiliser toute la puissance des résultats obtenus lors de l'étude de ce 
système. 


L'oscillateur harmonique est un modèle des vibrations moléculaires, et est représenté par un potentiel 
parabolique de type: 


pour une molécule diatomique. Mais nous avons vu dans le chapitre de Physique Nucléaire que 


c* =m&% ce qui fait que nous avons finalement pour une molécule diatomique: 


gp -"% 


d 2 


x (53.8) 


Pour une molécule polyatomique, nous aurons in extenso (par l'additivité de l'énergie): 
a id. 
E,:(g;) = 2% g (53.19) 
E 


Les quantités &h et & sont les fréquences (ou plutôt, plus correctement: les pulsations) vibrationnelles 


d'une molécule, diatomique dans le premier cas, et polyatomique dans le second cas. Dans la première 
équation, la variable x représente l'élongation de la liaison entre les deux atomes À et B (comme avec un 


ressort) dans une molécule diatomique, c'est-à-dire x =(R—&,,), où R est la longueur instantanée de cette 


liaison, et À,, est sa valeur d'équilibre. 


Dans le cas d'une molécule polyatomique, le potentiel décrivant les vibrations moléculaires ne prend la 
forme séparable en termes de sommation ci-dessus que si l'on envisage des variables spéciales g; 
dénotant des mouvements collectifs des noyaux, et qui sont appelées "modes normaux de vibrations". 


Nous avons aussi vu dans le chapitre de Physique Quantique Ondulatoire que l'hamiltonien d'une 
molécule diatomique (problème de l'oscillateur harmonique) peut s'écrire sous la forme: 
2 2 2 
= _h à ,mœ x? (53.20) 


2m dx? 2 


Pour une molécule polyatomique cette relation devient logiquement: 
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L'hamiltonien ci-dessus est clairement de forme séparable: c'est une somme d'hamiltoniens 
unidimensionnels, chacun ne dépendant que d'un seul mode g, comme variable, et décrivant ce mode 


comme étant un ressort unique, ou oscillateur harmonique de masse unitaire (#7 = 1) et de pulsation 
d'oscillation &,. Par conséquent, une séparation des variables g; est possible, réduisant l'équation de 


Schrôdinger indépendante du temps en un certain nombre d'équations du même type que celle d'un 
oscillateur harmonique unidimensionnel. Il suffit donc de connaître l'expression de la fonction d'onde pour 
un oscillateur harmonique unidimensionnel, ce que nous avons déjà fait dans le chapitre de Physique 
Quantique Ondulatoire où nous avions obtenu: 


avec #€ N et: 
= -1/2 ,-0*/2 0 
Do = (Ada) PRE (O) (53.23) 
La figure ci-dessous montre le graphique des premières fonctions d'onde de la relation précédente ainsi 


que celui de leurs densités de probabilité de présence respectives. On note les mêmes structures modales 
que celles des fonctions propres d'une particule dans une boîte unidimensionnelle. 


(b) 


-0.4 -0.1 0.2 0.4 


Figure: 53.2 - Fonctions d'onde et de densité de probabilité de l'oscillateur harmonique unidimensionnel 
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Ci-dessus les premiers niveaux d'énergie de l'oscillateur unidimensionnel avec (a) leur fonction propre 
associée, (b) la distribution de probabilité de présence associée. 


Dans la limite des très grandes valeurs de n, la distribution de probabilité se rapproche de plus en plus de 
celle prédite par la mécanique classique, l'oscillateur réside pour la majeure partie du temps au voisinage 


des points de rebroussement définis par l'intersection du potentiel Æ,,, avec le niveau n. Cette tendance 
est illustrée ci-dessous: 


Figure: 53.3 - Fonctions de densité de probabilité de l'oscillateur harmonique unidimensionnel pour de grands n 


Pour une molécule polyatomique l'expression de la quantification d'énergie devient: 


avec AE À, vi =12,3...,x. 


et les fonctions/états propres deviennent: 


g,(@) = Am?) PTT A, @e 8° | 2 
Q, = En (53.26) 


Ces deux dernières relations sont très importantes parce qu'elles permettent parmi tant d'autres de: 


avec: 


- Prédire le spectre de la molécule (spectroscopie) 
- D'étudier les bandes d'énergie (d'où viennent les notions de bande de conduction et de valence) 
- De localiser les liaisons entre atomes et donc les propriétés chimiques 
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3. ATOME HYDROGÉNOÏDE 


Nous considérons ici la quantification d'un système générique comportant deux corps (particules) en 
interaction mutuelle et se mouvant dans l'espace tridimensionnel. On démontrera dans un premier temps 
que, si la séparation des variables dynamiques décrivant individuellement chacun des deux corps est 
impossible, par contre, le mouvement d'ensemble du système (celui du centre de masse) et le mouvement 
interne, dit encore mouvement relatif, sont séparables. En outre, si le potentiel est centrosymétrique, le 
mouvement interne peut encore se décomposer en un mouvement de rotation et un mouvement radial. La 
quantification du mouvement rotationnel est intimement reliée à celle du moment cinétique. 


Nous nous intéresserons ici à la mécanique d'un système atomique ne comportant qu'un seul électron. 
C'est un système à deux particules: un noyau, de masse M et de charge +Zg, , et un électron de masse 


#, et de charge -g,. 
Le système atomique est décrit par l'hamiltonien suivant: 
2 


2 
HER ER EL = D + _ + Eure — R) 


M = À; = 
Tr Éral + Eire — Ry) 
(4 


Rappelez-vous que dans le chapitre de Physique Quantique Ondulatoire, nous avions démontré lors de 
l'étude des opérateurs fonctionnels que: 


_ 


et rappelez-vous aussi pour la suite que # et À; sont respectivement les vecteurs de position de l'électron 
et du noyau dans la relation antéprécédente. 


L'énergie potentielle étant donnée par (cf. chapitre d'Électrostatique): 


En le (53.29) 
Les mouvements des deux particules sont corrélés car les deux charges interagissent à travers leur champ 


électrique mutuel. On ne peut donc pas effectuer une séparation de variables entre * et Re: Par contre, 


une séparation de variables est possible entre la coordonnée du centre de masse (voir la définition du 
centre de masse dans le chapitre de Mécanique Classique): 


et la coordonnée relative de l'électron par rapport au noyau: 


es 


=7,-kÀy (5331) 


… 


Fe 


Nous obtenons dès lors: 
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._ Rs he 0 
Po 7 Vo =—V,+Vy)=2,+PDn (53.32) 
et: 
_ = MF, F8 P ar En 45 
Pyei m, +M (53.33) 


L'hamiltonien dans le référentiel du centre de masse s'écrit donc: 


2 2 
- Po ;Pri ; 


F. (53.34) 
2M, 24 pot (é a) 


où M, =, + M est la masse totale du système, et: 
_"n,M 
tt 
est sa masse réduite. 


Nous voyons clairement que l'hamiltonien H est cette fois mis sous une forme séparable et qu'on peut 
l'écrire sous la forme suivante: 


H = Huy th,a (5336) 


avec: 


- Po 


Chi 


2 
P 
et Hg = 24 


+Æa (ra) (6337) 
bt 


En termes des coordonnées £y, et 7,4, la fonction décrivant un état stationnaire du système à deux corps 


est donc un produit de fonctions d'onde individuelles (rappelons que la probabilité conjointe de deux 
événements est le produit de leur probabilité), l'une pour le mouvement du centre de masse, l'autre pour le 
mouvement relatif: 


Pen (Ro ser) © 'oe (Rose) Free) (53.38) 
et l'énergie de cet état est la somme des énergies de mouvement respectives: 
Es “Es tÆEa (53.39) 


avec: 


H ose E at Rcse) s PA AP et Au T yet Ce) © Eve Er re) (53.40) 
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Remarque: Cette approche qui consiste à séparer la fonction d'onde en la composition d'une fonction 
d'onde du centre de masse et du mouvement relatif est utilisée également dans le cadre de l'étude des 
atomes poly-électroniques mais à une différence près: comme le noyau est alors beaucoup plus massif 
que le cortège des électrons (en approximation...), le centre de masse est assimilé au noyau de l'atome 
et le mouvement relatif à l'ensemble du cortège électronique. Cette approche approximative est très 
connue sous la dénomination "d'approximation de Born-Oppenheimer". 


L'hamiltonien apparaissant dans la première de ces deux relations a été défini plus haut comme valant: 


2 
_ PM 
CM (5 3,4 1 ) 


2, 


Ce mouvement est celui d'une particule de masse À#,, dans une boite tridimensionnelle de volume infini. 


Les fonctions propres et valeurs propres pour ce mouvement ayant déjà été obtenues dans notre étude 
précédente, on se limitera à l'étude de l'équation séparée pour le mouvement relatif, ou mouvement 
interne. Comme aucune confusion ne sera dès lors possible entre les différents hamiltoniens, nous 
laisserons tomber, pour simplifier les notations, la mention rel en indice inférieur. 


Avec Æ#,, donné par la relation que nous avons démontrée précédemment: 


p° 
| _ F, C2? \ 
n. Qu jé Eye ((20) (53.42) 


et la relation (aussi démontrée précédemment): 
Fe re Pre) © Eve Ve ra) (53.43) 
nous obtenons alors l'équation de Schrôdinger pour le mouvement relatif: 
pi 


ri Ent)|8)= ETC) (634 


ou écrit autrement: 
k? 
Sr +E(I PC) =EY(F) (6345) 


Remarquons que dans le cas où l'énergie potentielle Æ,,, est de source centrosymétrique, c'est-à-dire 


qu'elle ne dépend que de la longueur du vecteur position F , et non de son orientation, l'équation 
précédente, telle qu'écrite, en coordonnées cartésiennes, n'est pas séparable: en effet, en coordonnées 
cartésiennes, la longueur de 7 est donnée par: 


FA vx +2 +27 6346) 
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et l'énergie potentielle n'est pas séparable en trois composantes chacune ne dépendant que d'une seule des 
trois variables x, y, z. L'hamiltonien n'est donc toujours pas de forme séparable et nous n'avons donc pas 
atteint notre objectif. Cependant, l'équation précédente est séparable dès lors que nous effectuons un 
changement de coordonnées vers les coordonnées sphériques. En effet, dans ce système de coordonnées, 
le potentiel ne dépend que d'une des trois variables sphériques, le rayon r. Il est indépendant des deux 
angles 8 et ?. 


Si nous nous référons au résultat obtenu lors de l'étude des expressions du laplacien dans différents 
systèmes de coordonnées, dans le chapitre de Calcul Vectoriel, nous avions obtenu pour le laplacien d'un 
champ scalaire en coordonnées sphériques, l'expression suivante: 


sa, - du 1 du 1 du ,cotf du, 1 du 
&? rôr r°48  r? 48 r'sin 94# 


(53.47) 


L'hamiltonien: 


(4 _1à 
no 
ul æ? r&# Qu r2 & 


est l'opérateur énergie cinétique pour le mouvement radial de l'électron par rapport au noyau, et 7? est 
l'opérateur "associé" au carré du vecteur moment cinétique: 


1 4f. _à 1 &? 
—— | sin #— Rdorue HtE ee 
sin 8 48 99] sin 984$ 


Le terme: 


est donc une énergie associée au moment cinétique. 


Pour bien saisir la nature de cet opérateur 7? un crochet par la notion de rotateur rigide s'impose. 
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3.1. ROTATEUR RIGIDE 


AL 


Si nous considérons maintenant le cas d'un système appelé "rotateur rigide" où nous négligeons 
('restreignons" serait un terme plus adapté...) les degrés de liberté d'oscillation (c'est à ce système que l'on 
a affaire dans le cas des molécules diatomiques ou polyatomiques linéaires), les seules coordonnées mises 
en jeu étant les angles 8 et qui fixent l'orientation du rotateur. 


Ainsi, dans ce cas r est fixé et nous avons: 


et au vu des contraintes sur le potentiel, il est normalement assez facile de comprendre pourquoi le 
rotateur est dit "rigide". Dans le cas précité, l'hamiltonien se réduit alors à: 


P 
=— (53.54) 
2) 
où: 
J= pr? (5355) 


est le moment d'inertie (cf. chapitre de Mécanique Classique) de la masse réduite du système. 


Pour la suite, nous associons l'opérateur ;? à un moment cinétique, pour la simple raison qu'il en a les 
unités. Effectivement, rappelons que nous avons démontré dans le chapitre de Physique Quantique 
Ondulatoire que lorsque le spin est nul (donc dans le cadre de notre étude de l'atome hydrogénoïde ici 
présent, le spin ne sera pas pris en compte dans un premier temps) et que nous avons affaire à une seule 
particule alors le moment cinétique (que nous noterons donc L dans ce chapitre au lieu de b) est donné par: 


LS TG + D8 = 2 <[IG+10]8 (6356 
avec { eN et: 
L=hl (6357) 
où les composantes du vecteur } sont aussi des entiers naturels. En faisant cette similitude, nous pouvons 


alors écrire l'équation de Schrüdinger sous la forme: 


(+11 
Pts * Eva 


F=EY (5358) 
2£ir 


Rappelons aussi au passage que nous avions obtenu dans le chapitre de Physique Quantique Ondulatoire 
que: 


k, 
ZL,=—{(y4,-z4,] (53.59) 
3 


par le produit vectoriel. 
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Passons maintenant des coordonnées rectangulaires x, y, z aux coordonnées sphériques r,#,#. Rappelons 
pour cela (cf. chapitre de Calcul Vectoriel) que: 


r= Jr +» +2,0€r<o 


; FARPSEER 9 = arccos 2 0<8<x7 
y =rsin@sing et x? + y? +7? (53.60) 
z=rcos8 x 
ÿ = ATCCOS ———— , 0 £<27 
X +}y 


exprimons les différentielles totales: 


dx = sin #cos fr +r cos fcos ÉdE -r sin Jsin Éd 
dy = sin sin gr +r cos #sin 8 + rsin Pcos AS (53.61) 
dz = cos Or —rsin 848 


Ces relations peuvent être écrites comme une transformation orthogonale des différentielles totales 
dr,rd8,r sin &4$ par: 


dx singcos# cosôcos® —-sin dr 
dy|=|sn8sing cos8sing cosg rd8 (53.62) 
dz cos ÿ — sin 8 (] rsin 8d$ 


ou encore par la transformation inverse (au besoin. il suffit de vérifier que les deux matrices de 
transformation multipliées entre elles donnent la matrice unité): 


dr ain£cos$ snôsing cos8 |[dx 
rd8 = |cos8cos# cosdsang -sind9||dy|] (5363) 
r ain 6d ÿ — sin Ÿ cos @ 0 dz 


Il en résulte par exemple: 


dr = sin cos fx + sin sin fdy + cos Hz => . = sin cos Ÿ 
Æ 


rd8 = cos 8cos dx + cos sin fdy - sind dz = _ = LUE à (53.64) 
x Fr 


r sin dd = -sin Mrbcosapités ing 
x rsing 


et finalement (la méthode pour les deuxième et troisième lignes est la même que pour la première!): 
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520,860 ,09 
0x ôxür x 08 xd 
cosésing à, cosÿ d 

Fr 08 rsn9d$ 


cosdcos ÿ d | sin Ÿ La 
Fr 08 rsan8 d$ 


= sin cos "ie + 
dr 


E = sin Osin — + (53.65) 
dy dr 


Ainsi, en tenant compte de ces relations, nous obtenons par exemple, dans le cas de l'opérateur: 
L, = 4 8, -z,) ( 
. "50 :7Z0,] (53.66) 


les développements: 


PR CNE sin sin PAP LAS RU SA Le 

“4 &æ 08 rsin8 0$ 

= rain Osin be MARS —rcos 8 Snoop MPe Ce? 
or r 08 or Fr 089 rsin9 9$ 


ME )-rcos cosésing 9 , cos? LA 
Fr 08 rsin£9 0$ 


= r sin ÿsin o(- 


= sin ÿsin p[-sia e&)- cos 8] cos sin Para LCA 
08 08 sin8 0$ 


= (-sin 8 sin sin #— cos Fcos Fin "es — cos 8 si AA 
08 sin 8 9$ 


=-sin — cot 8cos ÿ 
98 9$ 
(53.67) 


ce qui donne le résultat suivant: 
L, =ih| sin $— + cot Fcos Êg— 53.68 


En procédant de même avec: 


L, = 2 (22, _ x8, ) (53.69) 


en faisant les développements: 
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8 cosdcos$ 9 sin # 2) a(c056 8 sing =) 


8 6) 
z—-x—=2| sin 8cos #— + —— mme = — 
x ôr Fr 08 rsin 9 0$ or r 08 


= rcos 8 PPT UN Adi A sup La -rsin 8608 {6050 2-#06 ) 
& r 09 rang 0 87 r 08 


coscos$ à sing 4 sin 8 à 
= P COS | — | -rsin8cos#|— — 
r 08 rsin 89 0$ r 08 


= cos 8 don Ce — sin Pcos p-n8 2) 
08 sin 8 0ÿ 98 


= (cos 8 cos 8cos #+ sin Pcos fsin 8 2- cos 8 _ pe 
88 sin 9 0$ 


= C0 g{cos? 9+sin° dE sin #cot De 


= COS 7e — sin cot ee 


(53.70) 


nous avons le résultat suivant: 
L, = fc — — sin foot 2) (53.71) 
98 o$ 
Et pour finir avec: 
L = (x, - y8, ) (53.72) 


en faisant les développements: 
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PART PRET LUN Ris MUR op 
ur & r 08 rsin9 8$ 
cosôcos$ 9 sin >) 


8 
- 8 SR 
y SE F 08 rsin9 0 


= rsin cos gs &sin pe pe hs AC a ÿ > 


Fr 08 rsan8 0$ 


—rsin dsin #| sin cos je ere nee 
ôr Fr 08 rsin8 0$ 


nds cosgsing 0, HUE dédié cosdcosf 9 id “9: 
Fr 08 rang 090$ Fr 08 rang 0$ 
= r sin Ocos Ÿ a AUS — rsin 9 sin Ÿ ee 
r sin 8 0 r sin 8 0 
= cos? se + sin? 2e - e 


(53.73) 


nous avons le résultat suivant: 


Finalement, nous avons donc peu de libertés de mouvement pour notre rotateur rigide (car il est très 
rigide.) et nous pouvons écrire pour l'équation de Schrôdinger: 


E#,,=—— Æ,,Y=EÆE% (5375) 
où À, est rappelons-le, vu comme un opérateur linéaire fonctionnel, et l'énergie totale E comme sa 


valeur propre correspondante. 


Dès lors, nous pouvons écrire que l'opérateur moment cinétique (nous changeons la notation afin de ne 
pas confondre par la suite opérateur et valeur propre conformément aux remarques que nous avions faites 
lors des énoncés des postulats de la physique quantique ondulatoire): 


L,=-ih0, (53.76) 


Ainsi, les fonctions propres Ÿ(#) de A sont solutions de l'équation aux valeurs et fonctions propres: 


1, b(g)=1,b(d)) (53.77 


c'est-à-dire de l'équation différentielle: 


ih2,D(#) = LD (6)] (6:78) 
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où À, est bien évidemment la valeur propre de de Une solution simple de cette équation différentielle 


serait: 


avec comme condition d'uniformité selon les propriétés des formes complexes (cf. chapitre sur les 
Nombres): 


P(g+27)=D(S) (53.80) 
Cette condition mathématique, impose la quantification évidente et remarquable suivante: 
L, = him, avec m, =0,+1+2,.. (53.81) 
où (rappel) #, est le nombre quantique magnétique. 


Sachant que (cf. chapitre de Physique Quantique Corpusculaire): 


Nous pouvons écrire: 


Dès lors, nous retrouvons le(s) résultat(s) que nous avions obtenus dans les chapitres de Physique 
Quantique Corpusculaire et de Physique Quantique Ondulatoire: 


b =hN—b=h} (5384 
Ce qui est assez satisfaisant, même remarquable et jouissif (pour ne pas le dire..). 


Ainsi, la mesure d'une composante du moment cinétique fournit toujours un multiple entier relatif de À 
qui apparaît comme l'unité naturelle du moment cinétique. 


Les fonctions propres communes (!!!) aux opérateurs f? et £, sont dans un cadre plus général 
nécessairement de la forme (méthode de séparation des variables): 


R)P(AO(E) (5385) 


Comme le rotateur est rigide, nous avons Æfr} =c*. Ce facteur s'éliminera de lui-même dans l'équation 


aux valeurs propres et fonctions propres que nous déterminerons plus loin. Donc nous pouvons ne pas le 
prendre en compte. Finalement, nous pouvons écrire au vu des développements qui ont précédé: 


PHO(S = e"#@(8) (5386) 
Ce qui nous amène à l'équation aux valeurs et fonctions propres: 


Bdpe(e - Le"#e(e) (5387 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


C'est-à-dire: 


rares) 1_# Fr jewee - LG (8) (5360) 


sin 8 88 38 18a# 
d'où: 
RE | À sie 8 —— © |+ — | - 22" 0(8) 
sin 8 48 88 sin? 8 ag 
als" | . —_. d(@(4) 
2 LR sin 66(8) | L + sin di 98(8) 4 L Pi (8(8)) 
sin 8 48 88 88 sin? 8 ag | 
_p2 he 7 — = 2" (a 
g(a7 | 
+ B(9) — 
T5 (8) sp 
Fr: ms 888) 1 ca Ci | 
-jà L gin ge OI 4 eg — | pr" 98 
do O2 a À op st à 
1 1888, _ 1 2 i 
-#| n 9-7 | = a(8 
(Es 38° 48 Mer 8 |- PA @ 
es 
NT 30 (Emi = LE(S) 
sain 9 49 48 sin 8 
(53.89) 
En posant: 
8e | 8Ë 
= cos 7 =- = ÿ8=-— 7 
Ê = cos 36 sin(#) in@) (53.90) 
et donc: 


cos 8 +sin?9=1— € +sin? 9 =1— sin? 8=1-É? (5391) 


nous obtenons une équation différentielle du type "Fuchs" donnée par: 
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2 
_pi L 4 4@(8) 20m 
sin 9 48 38 sin 4 


|-2ee- 


2 
TE 
| sintéÿ : ie 
à dé) © 
re 2} == - ss — @(4) = 0 (53.92) 
ÊT #2): 660 - Fe -0 
Go &) me). {ee pe” 0 
a(1- )30(e a ae) |. mé _ 
PRE EE (F ef 


[-2€8'(E) +(1- € OO — LR jee - ( 
D'où finalement: 
u 268 (0), mi _| (6) 
(s) = 3.93 
LE (1-4?) F re. re 


Dont les coefficients présentent des pôles (singularités) en £ = +1. Or, rappelons que nous avons: 
= a £ 
L'=hIG+D—= n = +1) (5394) 


Ce qui fait que nous retrouvons souvent l'équation différentielle précédente sous la forme suivante dans la 
littérature après factorisation élémentaire de certains termes: 


3 d@(E) or 
ao ë* | de 2 un D z po 0 (5395) 


Une solution non triviale étant, connaissant les équations différentielles de type Fuchs, ce qu'il est d'usage 
d'appeler les "polynômes associés de Legendre" (bien que ce ne soit pas un polynôme rigoureusement 
parlant...) car contenant en partie les polynômes de Legendre (cf. chapitre de Calcul Algébrique): 
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ce que vous pouvez vérifier en injectant cette solution dans l'équation différentielle antéprécédente. 


Suite à la demande d'un lecteur voici un exemple de vérification avant de poursuivre: 


Le cas #3 =i =0 avec se vérifie immédiatement. Prenons le cas où #3 =1=1: 


Î 1 ,m,+i 
mi = A1 (1-6 |? ic] 
2° i 
(1. 1 2 l 
nr: n-g 72 tt g Fe re 4 ne d (1 #2| (5397 
2h aë 2! 1Ë 
1  ,2 
1 à. 
= (1-1 ef = 
2 dé 


L'équation différentielle devient elle pour #3 =?=1: 


12 
a 6- 2 \ 2e ra 6-0 (53.98) 


dë aë 


Soit: 


ao 2 ee ÎÆ LE ke TR 


Et nous injectons le polynôme associé de Lagrange: 


[1- AE ÿ . 2 NA =0 (53.100) 


: 


Soit: 


a |. ê 1-28 | 0 
| (1-2) 1 M 82 =0 (53.01) 


nr - 


Ce qui donne après une petite simplification: 


2 ge] EE = | 1-82 =0 (53102) 


Et en dérivant: 
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2 
S _ 1-# 4e 28 . 1- £2 (53.103) 
1 1- €2 


Concentrons-nous sur la partie gauche pour voir ce qu'elle vaut en mettant tout au même dénominateur: 


"He “e ë 2 2 (1-2 )+{1- 222 A ë 2 = e? 
-2/(1-2 


En simplifiant le numérateur, celui-ci devrait donc être nul. Voyons cela en le simplifiant une première 
fois: 


(53.104) 


2... | . 
e2{1-22)-(1- 22) +(1-222){1-22) (63.105) 
et en distribuant: 
Et -et-1+2 8418 267 +264 (53106) 


Ce qui est bien nul!! 


Donc finalement, nous avons des fonctions propres communes (car rappelons que les polynômes de 
Legendre sont orthogonaux entre eux) qui seront: 


3 (8.81 = Msn (1e (53.107) 


Pour normaliser la partie dépendante de #, nous savons que l'exponentielle doit être multipliée par 
1: : . ; VE 
i2771 (voir chapitre de Statistiques, la partie concernant la fonction de distribution de Gauss-Laplace) 


ce qui nous permet déjà d'écrire: 


pi 
Emi (8,@1 = EP (ê Er 4 (53.108) 


27 


Remarque: Il n'est pas besoin de faire de calculs compliqués pour calculer le facteur de normalisation 
de l'exponentielle, car dans le cadre d'une intégration sur tout l'espace, les trois facteurs de fn,; 18 di 


sont indépendants les uns des autres. Aïnsi l'intégrale sera le produit des intégrales (cf. chapitre de 
Calcul Différentiel Et Intégral). 


Finalement, nous devons trouver Mn, ; tel que: 


(En (8,.#f 4e =[# ms (8.81 Fmys (8,448 = 1) (53.109) 


et nous verrrons (ce que nous allons démontrer juste plus bas) que: 
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[+ D" Er)! | 
Mas = 2m (53.110) 


En résumé, nous écrivons (nous devrions plutôt conjuguer au futur...): 


C1 [@7+D Cm) 


Ent 9,$1= (53.111) 


DV 2G+m)l 21 


où nous avons omis le facteur (—1;" puisque de toute façon dans le module de la fonction ce terme se 


multiplie à lui-même et donne alors {-] 2" = 1. 


Vérification la relatione encadrée précédente (attention c'est un peu long et il est conseillé de le relire 
plusieurs fois): 


Nous considérons les fonctions définies par: 


1 (E.D = EE 


Mn. 
27 


En, (cos 8) 8e" (53.112) 


m1) = — - x2ÿ"n2. LS G-2x2ÿ (63113) 
My ol : Îl dx"rt 


avec: 
lEN,-l£m <i et 8E[0,x,#e[0,2A (53114) 


Le but va être donc de montrer que ces fonctions sont d'abord orthogonales et ensuite de trouver les 


constantes Dan, ; telles que En, j | = 1. Bref il va falloir retrousser les manches. du cerveau... 


D'abord, démontrons pour des besoins ultérieurs que: 


" " 


d” î G+m)l d 
OUR RUE 


Em) a 


—(1- x} (53.115) 


Démonstration: 


Si et seulement si ? = #4 = 0 l'égalité est évidente. Supposons j z1 (donc le cas général en dehors du cas 
particulier évident précédent) et soit P un polynôme réel de degré <i-1. 


Posons: 


Z( = (-x 2m. À | a- x?) (63.116) 


dx"#1 


Montrons que (produit scalaire fonctionnel): 
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My 
dx"? 


e) =0 (53.117) 


dans Cixef[-1,1],Ri. 
Effectivement, rappelons que nous avons fait le changement de variable: 


x=cos(8),-x<8£<+7—-1<x£<+1 (53.118) 


En intégrant par parties, nous obtenons: 


lp 12 2: PGO DZ). PU) 1 zu -2pP à 
— = f—_Z(x) P(x)dx = x) P(x)| - (——— Z(x) — P(x)dx 
dx"? Las dxr1 b [as ( dx Go) 
; 

remarquons que pour tout O £ j £ #3 —1, TZ {x) est nul en x = +1. Par suite (par extension), la relation 
précédente se simplifie en: 

di À M] d 

Fa ra P 7 [ar 2@ 2. FG)dx (53.119) 
Après #1, intégrations par parties, nous obtenons: 

di .- dt 

 — =f— È CRETE 2 

(Lz e) a à Fe ra P(x) dx (53.120) 
Si deg(P) < #3 alors l'expression précédente montre trivialement que: 
di 
(Le P) 0 (53.121) 
k 
Si deg(P) 2 #3 alors en posant: 
Fj 
k(n:=(1- 22)" Lies P(x) (53122) 
dx 
Nous obtenons: 
di 1 Pi Ede 
—2|P}h=(-Dfa-xy 1-x2) = P(x)d 
(Le (-1) l x°) PTE x°) P (x)ax 
(53.123) 


Lit 3 
=(-17: 1 x" kx) dx 
CD [Er A AG) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


$ 
remarquons encore une fois que HD s'annule en x= +1 pour tout j £ #7 1. En intégrant ##; fois 


par parties l'expression précédente, nous trouvons: 
d7 
— 7 
dx" t 


or h est un polynôme de degré ## + deg(P . 


l'ai .. di 
Pi={—(-x)  —5Àh(x)dx (53124 
) [ra he (65120 


Effectivement, le premier facteur est de degré 2m et la dérivée ##,-ème de P(x) est de degré P -##,, dès 
lors: 


2mt+tP-m=mtP=mt+deg(P) (53125) 
M, i 


donc À pt) est un polynôme de degré deg(#) £Z —1 et sachant que d_ - x? est à une constante 
dx ? 


dx 


près égal au l-ème polynôme de Legendre (cf. chapitre de Calcul Algébrique) nous avons alors: 


2" 
dx ? 
ul 


Nous venons de montrer que _— Z est orthogonal à tout polynôme de degré <-1. 
dx 


1 ,i m 
d di 
P)- far) AG dx = 0 (53.126) 
1 


x! dx" 


CIC. Q.F.D. 


772 
‘ £Z est un polynôme de degré 1 (il suffit de le vérifier pour quelques valeurs) donc cherchons s'il 


mm 
dx 3 


existe une constante C'e K telle que: 


Î 
D mZ -cTa-r) (53.127) 
x 


avec rappelons-le: 


dt 


FT (1-x2)! (63.128) 
» 4 


Z(:=Q-x)5 


Nous pouvons déterminer la constante C en comparant les coefficients dominants des polynômes: 


Le coefficient dominant de 
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Core, QD G+mm)l 
(1 ml A (53.130) 


; 
et le coefficient dominant de T (A - x? ÿ est: 


{ CE (53.131) 
Ainsi: 
Cp EEE CD Gun 
c'est-à-dire: 
Cacpieml 
Gr) 


Nous aurions donc pour À? 2 #; 2 Q (on intègre par parties autant de fois qu'il le faut à gauche et à droite - 
nécessairement - pour obtenir ce résultat): 


Pin à m, (l +m)l di 


12m. Tr _._2N . 
Z(x) = (1- x<ÿ7 ar U x) =(-Ù G=m)l PVEL x") (53.134) 


Maintenant, établissons une relation remarquable qui existerait entre À m A 2 . (et qui nous sera utile 


par la suite). Supposons pour cela 0 £ #3 £? et rappelons qu'à la base: 
1 nav ET ON pans 
ni (x) T1" x°) arr Q x) (53.135) 


Donc cela nous amène à écrire (rien de particulier): 


1 2, -m,/2 a" 
| = î - 
Em 2) D nt LE, Ée ii” (RE) (53.136) 
remplacé par le résultat obteru plus hat 
Par les résultats précédents ((-1)": = {-1)7"3): 
Er G+m)l 
1- 22ÿ% EN PT CC LL 1- 2Ÿ 
(1 x°) Pa ee Sn TE mil re re ( x") 
(53.137) 
dr m, =»)! CRE 
D (a) 2 GP (x) 
dé" (+) at 


cela nous amène à écrire: 
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LOC Gmm)l, 2-my2 4 2m. dE au 
ED eme CNE Gr a. 
LCD G =»)! mp2. di Lun, Cm) LL 

a y" Ee #2 CD 


Ainsi, nous obtenons: 


TE 2 


mn) mi (53-139) 


PQ) = (D 


Nous allons à présent (enfin !) montrer que les fonctions pi Sont orthogonales. 


D'abord, démontrons que: 


Her dre CD 4 
l (2) X GX BEN (53.140) 


où Æ est le l-ème polynôme de Legendre (d'où le nom d'origine de "polynôme associé de Legendre"). 


Démonstration: 


D'abord, nous avons démontré que les polynômes de Legendre satisfont à la relation de récurrence 
suivante (cf. chapitre de Calcul Algébrique): 


(2+DP4(x) = (22 + DxP (x) -2PB(x) (53.141) 
pour #21. 


En multipliant l'égalité ci-dessus par x"*-! et en intégrant, nous obtenons: 


1 1 
(a + »f Lx" ax = (2n +1) [A Gx ax = 2 [RG dx (53.142) 
L. #3 


1 
[AG ax =0 (53143) 
-1 


Rappelons que les À,,, polynômes forment une base orthogonale dont les polynômes qui l'engendrent sont 
de degré croissant de 0 à n, donc un polynôme d'ordre inférieur - exprimé dans un sous-espace vectoriel - 
sera toujours perpendiculaire aux vecteurs (polynômes) générant les dimensions supérieures. Ainsi, si 


nous prenons l'exemple de R° engendré par la base 124,,8, ,8, |, alors un vecteur Ÿ exprimé par la 


combinaison linéaire de &,,8,, sera toujours perpendiculaire à &, et donc un produit scalaire avec celui-ci. 


Et donc par suite: 
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1 1 
fe (x)x" dx = PES [RGP as (53.144) 


Posons: 


1 
5, = [AG x"ax (53.145) 
-1l 


L'expression précédente devient (pour rappel À {x = 1 ): 
ñ# 

= ———$, 

* @n+1 ” 


1 1 
1 avec & = £, = [5 (x}x° dx = fax =2 (53.146) 
5 “ 


Ainsi par récurrence: 


# LE 3 


À 
“G@n+tD 1357 (nt 


(53.147) 


De plus comme: 
1:2:3.4....n=}xl (53.148) 
Nous avons alors pour la relation antéprécédente le dénominateur qui peut bien évidemment se récrire: 


(2n + D) 


1.3.5.7. (a+ et 
2:46. (2n) 


(53.149) 
Nous avons aussi: 


Lc] 
2:4:6...:(2n) =[ [25=2"#l (53150) 
J=l 


Donc au final nous pouvons simplifier le dénominateur de la façon suivante: 


| | 
Da ae AU 07) (53.151) 
2:46"... (2x) 2" ‘nl 
et: 
12 
S ess 7 = ontl a) (53.152) 
3 5 7 (2x +1) (2n +1)! 


Nous avons donc bien démontré (c'est juste au cas où... vous ne suivriez plus...) que: 


CE | 13 D? ol 
x)'x' dx = (53.153) 
ll d (21 +Dl 
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CIC.Q.F.D. 


Attaquons-nous enfin à ce qui nous intéresse. C'est-à-dire démontrer que: 


2Nngt +) air = jeti=k 
Cala)" 2+1 -#)l Do# (53.154) 


0 sinon 


Démonstration: 
Si M; TL: 


#2# 


À, FA M; À -j 
Ci Fe) É a L [ [r (cos): Ps (cos 8) RQ = 0 (53.155) 


d8 = sin B8d (53156) 


Remarque: Rappelons que le jacobien en coordonnées sphériques est r? sin 8 (cf. chapitre de Calcul 
Différentiel Et Intégral) et comme la fonction intégrée ci-dessus n'est pas dépendante de r, nous avons 
sorti le terme 24 de cette intégrale (par contre nous le retrouverons ce même terme dans la fonction 
R(r) présente dans l'équation de Schrôüdinger). 


Et avec: 


2# ; ; 
[ea =0 (53157) 


Sil>k et #; = j alors d'abord le produit scalaire se simplifie: 
LÉ 
ar e L)= Mn,s Pr [Aus (cos 8: Ex {cos disin 8 (53.158) 
En faisant le changement de variable x = cos& nous obtenons: 
Cas Lenpe ) = Mons * Mn ILE mx (AX (53.159) 


Supposons #% 20: 


CRTC er ne LE TG rÿ =(-D'A-x) 


Le di 


me (x) (53.160) 


où Æ(x) est le l-ème polynôme de Legendre. Ainsi l'expression du produit scalaire devient: 
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EM S DE Ms Nr o- x ne 


M; 


7 AG) “il — mm, À (dx (53.161) 


Si nous posons: 
m,, "3 
kG:=Q- 2) RP.(D (63162) 
dx 3 


alors la relation devient: 
Ces (Es) = CD Mn : Mn, x ; fr B(x) ‘ h(x)dx « (53.163) 
1 
En intégrant m fois par parties l'expression ci-dessus nous obtenons: 
M; 


++ di 
Cas ae) CDN Ne CE rh Gr (55160 


m 
1 : : eo 
Or LT px) est un polynôme de degré k. Sachant que ! > &, cette dernière intégrale est nulle pour les 
dx 
mêmes raisons que celles évoquées précédemment. Donc: 


(Fes Enr) =0 (53165) 


Si #; < 0 alors nous avions démontré que: 


ln 
Em, 3 (2) =(-1ÿ%: ES - DE ml (63.166) 
et donc: 
l 
Cas |En,x) C: [Em (x): Ex (x)dx = 0 (53.167) 
a 
car #3 20. 


Il ne reste qu'à traiter le cas #; = j,? = &. Supposons à nouveau #; 2 Ô . Alors comme avant nous avons: 


En,1 0 = (1 - apr _ P(x) (53.168) 


et: 


di 


1 
Css (Ps) = Nas [As 09 dr = M . je x DCE BG (63160) 
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Posons: 


24m, dt 
h(x)=(1-x 32 BR (53170) 
Ge GER 
La relation devient alors: 
a | Pas lE LEE 1% ETC) h(x)dx (53.171) 
En intégrant m fois par parties, nous trouvons: 


(x (53.172) 


Css ns) = Ms CD CE 


m 
À p(x) est un polynôme de degré I dont le coefficient dominant vaut: 
dx 1 

(2)l (+r)l 
Gp? 2 G-m)l 


CD 


(53.173) 


Æ étant orthogonal à tout polynôme de degré strictement inférieur à L, l'expression peut s'écrire: 


_@Dl G+m)l! 
En (Pay) = Le GYX Ps MA x'dx (53.174) 


Or, nous avons démontré que: 


PR UE 
[5® * CES (53.175) 


donc: 


ls y= Ma DL. +4) CD pra L Nm, +)! 
mi |"m,3 M} GD:2 G-m)l(2 +1)! 2+1 G-#,)l 


(53.176) 


Si ",<0 nous savons que nous obtenons le résultat. 
OC.Q.FD. 


Finalement ce dernier résultat nous donne aussi la condition de normalisation: 


2er CC +m)l CES NES 
‘#4 21+1 G-m)l > di © 2m (53.177) 


Et donc finalement: 
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77 
A ni (cos dre" (53.178) 


Rx 


est bien une famille orthonormale. Soit explicitement: 


Va 
mi 


22 + D — #3 )l mA q'it 1 
Ph rte. di= CPPDEMMN Fr cos? 8| * À 7 1082 8) 45 | (53179) 
(s Art +m)l ol} d'cos gti 


Enfin, après cette interlude fortement mathématique (mais instructif quant à la méthodologie d'approche), 
nous voyons (ce qui est logique) qu'à chaque valeur de 1 correspondent donc 21+1 fonctions propres 


F3! 881. Nous disons encore que la valeur °?11 +11 est 21+1 fois dégénérée puisque: 


la (8, gi= Lt (8, #1 
f (53.180) 
Es (8,p = RU + TP (6,6) 


Voici quelques valeurs de la fonction }, m3! #,$\ qui génère ce que nous appelons communément des 


"harmoniques sphériques": 


l 

7 ar 
Ya = — cos & 
Fa sin 86% 

3 ÿ 
ET ax sin de 

“) . 
Fa = 805 8-1] (53.181) 
Fa = . sin 8 cos 8e” 

7 
F2 = sin 8 cos 8e” 
Le D sin 6% 
se D ju ge 

2 SN 


Voyons quelques tracés de ces magnifiques harmoniques sphériques que l'on peut obtenir avec 
Maple 4.00b en utilisant la commande suivante (il s'agit de la 6ème fonction d'harmonique sphérique ci- 


dessus): 
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>plot3d(Re(sqrt(15/(8*Pi))*(sin(theta)*cos(theta)*exp(l*phi)))\2,phi-0..2*Pi,theta=0..Pi, 
coords=spherical,scaling=constrained); 


- F4 (correspondant à # = 1 !) donne une sphère (valeur constante quels que soient #,#) dont la densité de 
probabilité peut être représentée par la "carte photographique" ou "carte de densité” (la densité dans un 
état donné y est représenté par la densité de points clairs sur un fond foncé): 


Figure: 53.4 - Carte de densité de 15 
Ce qui représente les orbitales 1s possibles. 


- Fa: Fu donnent (pour # = 2 au moins!): 


Figure: 53.5 - Orbitales 2p 


Ce qui représente les orbitales 2p possibles, dont la densité de probabilité peut être représentée par sa carte 
de densité et d'isodensité: 


M 


u 


LL 


| 
| 
L 


-14 -1s . M te 


Figure: 53.6 - Carte de densité et d'isodensité de 2p 


- F2: 22 2:02 (pour # = 3 au moins!): 
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Figure: 53.7 - Orbitales 3d 


Ce qui représente 5 orbitales centrosymétriques 3d possibles, dont la densité de probabilité peut être 
représentée par les (les deux dernières cartes représentent F;;) cartes de densité: 


ant 


Figure: 53.8 - Carte de densité et d'isodensité de 3d 


- Pas Pas Pas Pas Vos ss, dos (pour # = 4 au moins!): 
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Ce qui représente 7 orbitales anti-centrosymétriques 4f possibles, dont la densité de probabilité peut être 
représentée par (dans l'ordre: 3, F3: la3; lez ): 


Figure: 53.10 - Carte de densité et d'isodensité de 4/f 


Les résultats précédents nous amènent donc à écrire: 


Fir,8,8i= RIPDO(E) = RME 8,91 (53182) 


Remplaçant ceci dans l'équation de Schrôdinger: 
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+1 


Nous obtenons (7 = 0 dans le rotateur rigide mais # 0 dans le cas de l'atome hydrogénoïde): 


L+1iR 
ZT dE +E RC Fi (8, gi = ER) Emi (8,$) (53.184) 


Comme il n'y a dans cette relation aucun opérateur qui agit sur y; | #, #1, nous pouvons la simplifier de 


façon à obtenir: 


li1+11#? 
Te + ——— 


’ 2 4er R(r) = ER(r) (1) (53.185) 


ot 


+E, 


où nous voyons dans ce cas général de l'atome isolé que les niveaux d'énergie ne dépendent plus de ##, (en 
raison de la symétrie sphérique du potentiel). Nous disons alors que les niveaux correspondants aux 
mêmes valeurs de n et de 1 sont tous confondus quelles que soient les valeurs de ##,. 


Dans le cas où Æ,. dérive du potentiel de Coulomb en 1/r, cette équation radiale ne donne lieu à une 


solution R(r) normalisable (différente de zéro aussi donc...) que pour des valeurs de l'énergie répondant à 
la loi de quantification suivante (tiens donc. quelle coïncidence, nous retrouvons l'expression démontrée 
dans les vieux modèles de la physique quantique corpusculaire!): 


72 
E, = —hcRy — (53.186) 


où À; est la constante de Rydberg telle que nous l'avons déterminée dans le chapitre de Physique 


Quantique Corpusculaire. Ainsi, dans ce cas les niveaux d'énergie correspondants aux mêmes valeurs de n 
sont tous confondus quel que soit L. 


Pour une valeur donnée du nombre quantique principal n (rappelons que nous avons vu dans le chapitre de 
Physique Quantique Corpusculaire que ? £ #-— 1), il est possible de vérifier qu'il existe plusieurs solutions 
pour la fonction R(r) selon la valeur du nombre quantique azimutal L. D'où l'identification des solutions 
par la paire (n,l). Nous les notons À,;(r). Ce sont des fonctions réelles de la variable r données par (il 
suffit de vérifier. car si elles marchent elles satisfont alors à l'équation de Schrôdinger, nous ferons un 
exemple un peu plus loin): 
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7 3/2 
Ro(r) -() 28 (7!) 
& 


» Z , (#2) 
Ro) | 2) Ft 


: C1 Zr (#24) 
ne) 3e 


_ _4Zr  4Z°r° | {213) 
Li si al cn: 


(53.187) 


8Zr ,427°r° | 4313) 
so-(2]" ae | 

47?r? ,1213&) 
Ry(r) = (2 | + 9,30 a? Ja 


où (attention certains ouvrages le donnent en unités naturelles!): 
k 
An = AE — (53.188) 
Le 


est l'équivalent du rayon de Bohr (pour la masse réduite) que nous avions déterminé dans le chapitre de 
Physique Quantique Corpusculaire avec comme différence que nous avons ici une masse réduite au lieu 
d'une masse simple. 


Voyons cependant si notre équation de Schrôdinger est bien vérifiée (prenons # = 1, = 0): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


li? +1 D. 
Te t————+#,,|R(r) = ÆK(7) 


di 8, (r28, \- 2e (F!æ) = 2e Fa) 
Dur 
# 

Fe 


8, (r°8, ns Ë ris e 774) 2 pe (774) 


FEor 
esta), Ze {7ia) _ p,{51a) 

D . 
_N 3 |_2r, 121) Ga) - 7 ,(3a) 

Qur? ? re de — : 
Ne 27 | _ 214) - (ia) 
2ur° 4 en 

_# | -27 ET 

2ur ES EE ñ 

Ze _  WZ° 

AE r — L 

24 are, À] 
1 Ze 1 Zu à Le : 
- LE =- = -Z = -hcRyZ? = 
Am 2 1678 27 ges "RE È 
47 


Ce qui correspond bien au résultat attendu. 


Ce qui sous forme graphique nous donne pour la partie radiale À, ;(r) : 


(53.189) 
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Figure: 53.11 - Tracé de quelques fonctions radiales 
Étudions un peu plus en détail la fonction radiale dans le cas de l'atome d'hydrogène!: 


Dans le cas de l'orbitale atomique 1s (cas particulier mais nous pourrions faire les mêmes calculs que ceux 
qui suivent avec toutes les autres orbitales!) nous avons donc pour l'atome d'hydrogène: 
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7 Ÿ?2 | Ÿ2 , 
Ro(r) = É De Verte = Ù de A = su (53.190) 
a äÿ a 


C'est donc bien une fonction exponentielle décroissante comme le montraient les graphiques ci-dessus. 
Avant de continuer rappelons (cf. chapitre de Physique Quantique Ondulatoire) que: 


[Igf am = [If dxdyaz =1 (53191) 
co 


co 


Or, en coordonnées sphériques (voir le début de ce chapitre): 
dxdydz = r°drsin 8d84$ (53.192) 
Il vient alors comme nous l'avons vu plus haut: 


D drdydz = [l'E (r, 8, #)À r2dr sin 84 84 #= [|R(r) (8, #)Ê rar sin 8484 $ 
[F1] 
= [RH FC. A rar sin 8484 #= [|RGÉ r?ar [17 (8, Af sin 8484 6 = 


co Le) 


Il s'ensuit que: 


[RG rar =1 


co 


(53.194) 
[IF (8. f sin 8284 6 =1 
Le] 


Avec ce résultat nous allons pouvoir calculer la probabilité radiale de trouver l'électron sur chaque 
orbitale atomique! Ainsi, il vient immédiatement avec le résultat précédent: 


dP 
[RE 72 (53195) 
dr 


Et donc dans le cas de notre orbitale atomique 1s: 


2 
dr, = — Pa l&) r? = 4 ,-(2r l@),2 (53.196) 
dr &ÿ 


Il est maintenant super intéressant de calculer le point r où la probabilité de trouver l'électron est 
maximale sur l'orbitale 1s! 


Li 


fa 


Pour cela, nous remarquons que passe par un maximum lorsque nous avons trivialement: 


2 
cd 7 =0 (53197) 
dr 


soit: 
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dE  d(4 (2ri@) 2 
5 = — 7 € Fr 
dr dr 


E 2 
e (2) 2 r? 2] =0 (53.198) 
aÿ 


sl 
a 
Soit: 

r=aäp (53.199) 
Ce qui est remarquable, car nous retrouvons le résultat du modèle de Bohr. 


Pour résumer un peu tout cela, les états stationnaires de l'atome d'hydrogène sont spécifiés par trois 
nombres quantiques # € N°4 {#-1, (3 | < ? et la fonction d'onde de Schrôdinger étant donnée au final 


par: 
Van (80) = Riez 8,8) (53.200) 


Nous avons alors la nomenclature traditionnelle suivante dans le cas de l'atome d'hydrogène: 


HOEAR TE 


a 
DORE "SEE 


Tableau: 53.1 - Nomenclature des couches et sous-couches de l'atome d'hydrogène 


Nous pouvons inclure le spin de l'électron dans la description de la structure électronique de l'atome. Si 
nous traitons le spin comme un degré de liberté additionnel alors, l'absence de terme d'interaction entre les 
degrés de liberté classiques (positions dans l'espace réel) et le spin, interaction appelée "couplage spin- 
orbite", dans l'hamiltonien précédent, implique que nous pouvons écrire la fonction d'onde totale, spin 
inclus, sous la forme d'un produit: 
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aim, { r,8,#) _ Tai { r,8,$ | D, L Rip { &, ÿ) Dn, (53.201) 


où nous avons ajouté le nombre quantique de spin #, = +1/2 (cf. chapitre de Physique Quantique 
Corpusculaire). 


La même remarque que nous avions faite dans le chapitre de Physique Quantique Corpusculaire s'applique 
dès lors: les niveaux restent 2#° fois dégénérés. 


3.2. PROFIL DE POTENTIEL 


Revenons sur un point important qui est souvent utilisé dans les ouvrages de physique mais quasiment 
jamais démontré: le profil de potentiel quantique de l'atome hydrogénoïde. Beaucoup d'ouvrages parlent 
parfois de "modèle harmonique de liaison atomique" mais il semblerait que cela soit plutôt a priori un 
abus de langage. 


Nous avons donc vu beaucoup plus haut dans le présent chapitre que: 


1(1+1\# 
T+———-+#,, VE (53202) 


2ur? 


Au vu de l'interprétation des trois termes de l'hamiltonien, il est d'usage de dire que les deux termes: 


l(1+11# 
24ir 


constituent "l'énergie potentielle effective" soit explicitement: 


. +1 Ze? 
Œg = tn ET se 
PR 2ur? ÂTE) le — Al (53.204) 
—y— 
20 <0 


Donc le premier terme est (logiquement) répulsif alors que le deuxième est attractif. Un plot sous 
Maple 4.00b de l'énergie potentielle effective donne avec des valeurs expérimentales réelles concernant le 
rayon avec les valeurs réelles des constantes: 


>plot([-2.31E-28/r+6.11E-39*0*(0+1)/r2,-2.31E-28/r+6.11E-39*1*(1+1)/r12,-2.31E-28/r+6.11E-39*2* 
(2+1)/12,-2.31E-28/r+6.11E-39*3*(3+1)//2,-2.31E-28/r+6.11E-39*10*(10+1)/r12] 
=5E-11..10E-10,y=-0.5E-17..0.5E-17,thickness=2); 
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Figure: 53.12 - Plot de l'énergie potentielle effective 


où les légendes ont été rajoutées après coup avec un logiciel de traitement de texte. Le lecteur y 
remarquera plus particulièrement le cas où 1 vaut 1 qui correspond au cas de figure indiqué par la majorité 
des ouvrages de physique de niveau licence. Soit en zoom: 


>plot(-2.31E-28/r+6.11E-39*1*(1+1)/12,r-5E-11..10E-10,thickness=2, color=green); 


Figure: 53.13 - Plot de l'énergie potentielle effective pour 1 valant 1 
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Le premier graphique nous indique aussi assez clairement que pour ! valant 0 l'électron a une énergie 
potentielle négative qui le tient fermement dans l'orbite du proton. Par contre déjà à 1 valant 1 nous 
devinons que le point de stabilité de l'électron se trouve là où la dérivée s'annule. Au-delà de l valant 1, 
dans le cas d'un noyau avec un seul proton, l'électron n'est plus naturellement lié puisque son énergie 
potentielle tend à être positive. Le lecteur pourra d'ailleurs s'amuser avec Maple en faisant varier Z et L. Il 
verra que l'énergie potentielle effective est très sensible à ces deux paramètres. Pour l'exemple, le 
graphique ci-dessous montre l'énergie potentielle effective avec 1=4 et Z= 1 (donc atome instable) et 
ensuite avec |-4 et Z=6 (ce qui correspond plutôt à un état excité): 


> plot([-2.31E-28*1/r+6.11E-39*4*(4+1)/r12,-2,31E-28*6/r+6.11E-39*4*(4+1)/r121 
,=5E-11..10E-10,thickness=2); 


1=1,Z=6 
Figure: 53.14 - Plot de l'énergie potentielle effective pour 1 valant 1 


Il est d'usage dans la pratique considérer que: 


I+1R? Zaè 


# 2 


pot, = (53.205) 


ur 4x0 -À| 


est à un facteur près (facteur de charge électrique) un "potentiel électrique effectif" ou "potentiel 
électrique écranté". Effectivement par la définition du potentiel électrique (cf. chapitre d'Électrostatique), 
il y a seulement un rapport de facteur de charge entre l'énergie potentielle électrique et le potentiel 
électrique. Nous avons donc: 


1 
[4 A = Za pt — Dog œ Ecteff (53.206) 
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Notes personnelles: 
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54, CHIMIE MOLÉCULAIRE 


L. chimie moléculaire est le domaine central qui interconnecte par l'étude des molécules de 


nombreuses techniques de pointe prometteuses du début 21ème siècle qui sont pour ne citer que les 
plus connues: la biologie moléculaire, les matériaux moléculaires, l'électronique moléculaire, les 
polymères... 


Sachant qu'il a été découvert expérimentalement qu'une même molécule peut avoir plusieurs fonctions 
très différentes, son étude théorique permet de bien les utiliser (avec parfois un meilleur rendement en 
termes de R&D) dans ses domaines d'application. Le lecteur aura donc compris que, comme à 
l'habitude sur ce site, nous allons nous concentrer ici uniquement sur l'aspect théorique (mathématique) 
de la chimie moléculaire même si nous allons nous limiter uniquement aux développements théoriques 
effectués entre 1910 et environ 1935 (au-delà la complexité des théories nécessite trop de pages pour 
un site Internet généraliste). 


Nous ne sommes à notre époque qu'aux balbutiements de la découverte de ce que la nature a fait avec 
beaucoup de temps et de hasard: c'est-à-dire des molécules complexes fonctionnant comme des 
nanomachines capables localement (site actif) de filtrer, d'oxyder, de faire de catalyses.. et bien 
d'autres manipulations (y a qu'à observer votre corps!). 


Une molécule est souvent traitée dans les classes d'école avec l'équation de Schrôdinger (donc pas de 
cas relativistes et pas de prise en compte des spins) sous la forme habituelle (cf. chapitre de Physique 
Quantique Ondulatoire): 


HY=EY (41) 


soit sous une forme également stationnaire (indépendante du temps) où pour rappel Y est une fonction 
propre et E une valeur propre de l'application H. 


En réalité, les fonctions d'ondes sont impossibles à calculer formellement avec les outils mathématiques 
contemporains et la seule chose que nous savons faire sont des calculs numériques (méthode des 
perturbations). C'est la raison pour laquelle certains centres de chimie se transforment avec le temps en 
des centres de calculs où le caractère prédictif (et peu coûteux) de la chimie quantique s'affirme de plus 
en plus. 


Il reste cependant bien évidemment indispensable, comme toujours, de comprendre comment les 
modèles théoriques sont construits et leurs hypothèses sous-jacentes. 


Mais nous pouvons quand même avec les calculs prédire la forme de molécules de taille raisonnable, 
l'énergie de leurs liaisons internes, leur capacité énergétique sous l'effort d'une déformation, la forme 
des orbitales moléculaires (O.M.), l'énergie de transitions d'états (lorsque des parties de la molécule se 
déplacent dans celle-ci), leur réactivité vis-à-vis d'un milieu réactionnel... 


Nous distinguons couramment deux cas d'études de la chimie moléculaire: 


- Mécanique quantique: toutes les interactions entre particules sont prises en compte sous l'hypothèse 
de quelques simplifications acceptables. 
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- Mécanique moléculaire: Pour de grosses molécules, nous ne nous occupons plus du problème 
électronique, mais des interactions de certains paramètres sur lesquels nous voulons nous concentrer. 


Par exemple, l'hémoglobine (protéine transportant l'oxygène dans les muscles) est une énorme structure 
moléculaire dont on ne va étudier que le site actif avec les outils de la mécanique quantique. Le 
comportement global de la molécule elle-même sera traité avec les outils de la mécanique moléculaire. 


Il s'ensuit qu'excepté pour les atomes hydrogénoïdes, nous ne pouvons pas décrire analytiquement une 
molécule d'un point de vue purement quantique! Toutes les méthodes quantiques actuelles reposent sur 
une ou plusieurs approximations. Les fonctions d'onde ne sont donc qu'approchées et le niveau de 
calcul est adapté en fonction de ce que nous voulons montrer et de la précision que nous recherchons 
(en cherchant à minimiser le temps de calcul pour des problèmes de coûts...). La bonne compréhension 
des approximations permet de formuler des modèles simples ne nécessitant qu'un minimum de calculs 
(souvent triviaux). 


Nous nous proposons ici de montrer deux modèles courants (et les plus simples): 
1. APPROXIMATION ORBITALAIRE 


Une molécule est bien évidemment un problème extrêmement complexe: N noyaux, n électrons et le 
tout est en mouvement! 


Figure: 54.1 - Exemple de molécule où un peu tout est en mouvement 


L'hamiltonien (cf. chapitre de Physique Quantique Ondulatoire): 


h? … x 2 æ 
He Ent Een NV 4 Vue | ut) (642) 
ci pat D (g 2 ) — 2m, 4 (gi 2 ) 


est alors de la forme cauchemardesque mais intuitive (le G en indice de l'hamiltonien signifie 
Général") suivante: 


nl 2 ñ 2 N n 2 n-l 2 N_17,7 92 
def SES nee) 
ra 2M 3 1 2, list or 51 Ep; =. AFEgrg | (543) 
Joi a 


E 


Ê 
pa 
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où: 


N +52 
LE De ÿ£ est l'énergie cinétique des k noyaux de masse f, de la molécule. 
kml ME 


n 2 
Ÿ2 est l'énergie cinétique des n électrons de masse 1, 


N n 
ca >>, — est l'énergie potentielle due à l'attraction électron(-)/noyaux(+) 


ne est l'énergie potentielle de répulsion noyau(+)/noyau(+) 


Souvent nous retrouvons ces termes sous la forme suivante de l'équation de Schrôdinger dans la 
littérature: 
(és URL ARE 


nn 


€ LA T = ET, Ya (829 

Une première approximation que nous pourrions tenter c'est de découpler le mouvement des noyaux de 
celui des électrons. Effectivement, comme le noyau est beaucoup plus massif (environ 2000 fois) que le 
cortège des électrons, le centre de masse est assimilé au noyau de l'atome et le mouvement relatif à 
l'ensemble du cortège électronique. Cette approche approximative est très connue sous la dénomination 
"d'approximation de Born-Oppenheimer": 


ñ 2 N on Te 2 RS 2 n 2 _ e? N n 7 1 
De + DES | 65 
ja 21 kil px 1 70 1 274 AE | aix 51 
Joi RELA 


qui nous permet alors d'étudier les orbitales moléculaires. Mais malheureusement cette approximation 
n'est pas suffisante à cause du terme de répulsion interélectronique (la double somme) qui empêche 
d'utiliser la technique de séparation des variables comme nous l'avons fait dans le chapitre de Chimie 
Quantique avec l'atome d'hydrogène. 


Par ailleurs, cette dernière équation s'écrit également sous la forme de la première ligne du couple 
d'équation ci-dessous (équation de Schrôdinger des électrons et des noyaux): 
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Ce système d'équations constitue ce que certains appellent "l'approximation adiabatique" (???). 


L'idée qui vient alors à l'esprit va être d'utiliser la propriété suivante: 


Soit deux opérateurs À et B, f(u) et g(v) leurs fonctions propres respectives associées aux valeurs 
propres a et b. Alors f(u)g(v) est fonction propre de l'opérateur somme A+B avec la valeur propre 
associée a+b. 


Ce qui s'écrit: 


Af(u) = af (u) 


Bg(v) = tn) — (A+B)fGU)g0) = (a +B)f@)e() (647) 


Démonstration: 
(A+2)f (gr) =[4f@)]g(v)+[87@&)]g(v) 
= [af(u)]gtr) +[èf@)]e( = (a +2) fu)gtv) 
C.Q.FD. 


Et c'est ce que nous allons faire pour décomposer l'hamiltonien n-électronique À ,; en somme 


d'hamiltoniens monoélectroniques indépendants en sachant de ce qui précède que si nous trouvons la 
fonction propre pour chacun (ce qui est relativement plus facile) il suffira de les multiplier pour avoir la 
fonction propre globale. 


Ainsi, nous écrivons: 


A 


a=AtAot.+A;+..+A4, (549) 
et donc nous devrons trouver pour chaque i: 
A;Ÿ,=E,;V, (5410) 
Pour ensuite avoir: 
Ha Tu = SA, TE SE [I%, =E; Ÿ y (54.11) 
el iAl sl il 
avec donc: 


Vir= V9, 9... .Y (54.12) 


n 


Cette approche par hamiltoniens monoélectroniques va nous amener à remplacer: 


H : kg 225$ Te? FE a? 
CS (54.13) 
i=l Er kil AÆphr il Ep 
Joi 


par la somme des hamiltoniens pour un électron appelés "hamiltoniens effectifs": 
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hu Ze , 7 _ h gs eG-D_ Kg 22 


ol 
À 470" AE 2m, 


(54.14) 
AE, 2 AE 

Cette méthode d'approximation est parfois appelée en chimie théorique "approximation des électrons 
indépendants" ou encore "approximation orbitalaire". Elle consiste donc à globaliser les interactions 
individuelles électron-électron et à écrire que chaque électron évolue dans un potentiel moyen résultant 
de la présence de l'ensemble des autres électrons. 


La "méthode de Slater" consiste par définition à écrire cette dernière relation sous la forme: 


où © est appelée "constante d'écran”. 


Cette méthode de Slater revient en gros à remplacer les termes purement électroniques par une 
constante. Elle peut être considérée comme une méthode paramétrique car les constantes ont été 
déterminées de façon purement expérimentale. 


Le principe de calcul empirique de la constante d'écran est relativement simple. Dans un atome 
poly-électronique, les électrons de coeur sont sur des orbites beaucoup plus contractées alors que les 
électrons de valence qui vont être responsables des propriétés chimiques de l'atome en question sont sur 
des orbites beaucoup plus relâchées. 


L'attraction exercée par le noyau sur ces électrons est beaucoup plus faible que celle exercée sur les 
électrons de coeur et ces électrons ne perçoivent qu'une partie de la charge atomique. 


Slater a alors proposé que cette charge effective, qui est le plus souvent notée 7* pouvait être calculée 
en tenant compte de la constante d'écran. Cette constante représente donc l'effet moyen des autres 
électrons sur l'électron considéré de l'hamiltonien effectif i. 


2“=7-g (54.16) 


Pour un électron périphérique, nous devrons donc considérer que sa constante d'écran est due à tous les 
électrons placés sur des orbites égales ou inférieures. La tradition (ou plutôt le "truc") veut que le calcul 
se fasse en regroupant les orbitales atomiques en plusieurs groupes 1s/2s, 2p/3s, 3p/3d/4s, 4p/Ad/4f/5s, 
op/etc…. 


Ensuite le calcul est simple car il se fait sur la base d'un tableau de valeurs prédéfinies et il suffit 
d'additionner les contributions d'écran de tous les électrons selon le tableau ci-dessous: 


0.30 0 


[ns,np . 1 0.85 |0.35 | 0 
Mama 1 0.35 | 0 


Tableau: 7.1 - Contributions d'écran des électrons 


Ce tableau mérite quelques explications bien évidemment!: 
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L'indice indique le nombre du groupe qui contribue à la constante d'écran alors que n est le nombre du 
groupe de l'électron que nous considérons. 


Exemple: 


Dans le cas du Carbone de configuration 1522s22p?, la charge nucléaire est Z = 6. Un électron 1s n'est 
écranté que par l'autre électron 1s, la charge effective qu'il voit est donc de: 


T'=7-Hm=60-0 202570 Gi) 


Un électron 2s ou 2p est écranté par les deux électrons 1s et par les 3 autres électrons 2s et 2p. La 
charge effective par laquelle il est attiré est alors: 


Z"=Z-o=6-(2.085+3.0.35)= 3.25 (54.18) 
Nous voyons donc bien que la charge effective ressentie décroît assez rapidement! 
2. MÉTHODE C.L.O.A. 


Cette méthode, plutôt qualitative, consiste à considérer que la fonction d'onde moléculaire est une 
"Combinaison Linéaire des Orbitales Atomiques" (C.L.O.A.) contrairement à la méthode précédente où 
nous multiplions les hamiltoniens effectifs. 


Cette méthode est importante car elle est à la base d'une grande partie du vocabulaire courant des 
chimistes dès que la chimie effectuée est assez pointue! 


Basons-nous sur l'exemple de la molécule de dihydrogène Æ,. L'idée est alors la suivante: 


Si nous avons la fonction de l'orbitale atomique 1s, de Æ, et respectivement la fonction 1s, de #3, 


alors nous posons que l'orbitale moléculaire dicentrique (liée à deux atomes) correspondante est donnée 
par: 


Vap=aVatbY (5419) 
qui définit un système quantique à deux états propres. 
Mais comme nous le savons bien, en réalité, seul le carré de la fonction d'onde possède un sens 
physique (probabilité de présence). Ainsi, si nous supposons que la fonction d'onde n'est pas à valeur 
dans €, nous avons pour l'unique électron qui nous intéresse (1s): 

2 ER 
Dap=(aTy+bVn) = a VA +2ab TP +b PE (54.20) 

où nous admettons que: 
- a? gi représente la probabilité de présence d'être près de À 


. pty2 représente la probabilité de présence d'être près de B 


- 2abŸ,Y; représente la probabilité de présence de l'électron qui joue la liaison A-B 
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Dans le cas particulier de la molécule diatomique symétrique que nous avons choisie comme exemple, 
les atomes À et B jouent le même rôle et il n'y a donc pas de raison que l'électron soit plus près de À que 
de B ou inversement. 


Ainsi, la probabilité de trouver l'électron près de À est donc égale à la probabilité de le trouver près de 
B. 


De plus dans ce cas les orbitales Y , et Y, sont totalement identiques (orbitales 1s toutes deux du 


même atome) et il n'y a donc pas lieu de les distinguer. Nous avons donc: 


a?=h—hb=+n (5422) 


Nous avons donc deux solutions pour Y ,, qui sont (ces deux solutions peuvent se trouver sous des 


notations très variées dans la littérature): 

Ylp=aTiytaYr =a(Vi+%) (54.23) 
si b=+a et: 

P=a%Yy-a Tr =a(Vi-%3) (54.24) 


Si b=-4. 


Remarque: Attention! Nous ne pouvons pas poser pour les deux dernières relations que Y , = Y;. 


Cette dernière égalité n'a lieu en tout point que si la distance qui sépare les deux noyaux est nulle 
(ce qui est peu probable) ou, s'ils sont distants d'une certaine valeur D située au milieu de celle-ci. 


Ces deux expressions seront simultanément solutions de l'équation de Schrôdinger. Nous obtenons donc 
deux orbitales moléculaires à partir des deux orbitales atomiques dans le cas de la molécule diatomique 
symétrique. 


La fonction: 


est appelée "fonction liante" car elle correspond à un renforcement de la probabilité de présence de 
l'électron entre les atomes A et B ce qui correspond à la création de la liaison! 


Inversement, la fonction: 
Ya Yan (54.26) 


est appelée "fonction antiliante" car elle correspond à une diminution de la probabilité de présence de 
l'électron entre les atomes À et B ce qui correspond à la destruction de la liaison! 
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En définitive, en se recouvrant, les deux orbitales atomiques de même énergie donnent naissance à 
deux orbitales moléculaires d'énergies différentes, l'une liante stabilisée et l'autre antiliante déstabilisée. 


Nous avons évidemment au vu de ce qui précède que, dans des cas plus complexes, le niveau d'énergie 
de l'orbitale moléculaire liante est plus petit que celle de l'antiliante (nous allons le démontrer 
rigoureusement en détails plus bas). 


Ainsi, il faut respectivement plus d'énergie pour ioniser l'électron de l'orbitale liante & qu'il n'en faut 
pour ioniser l'électron de l'orbital antiliante -*. Donc il est communément admis de dire que l'énergie 
de la liaison liante est plus forte que l'antiliante (mais nous en ferons la démonstration juste un peu plus 
loin). 


Indiquons aussi qu'en chimie, une liaison chimique dans laquelle chacun des atomes liés met en 
commun un électron d'une de ses couches externes afin de former un doublet d'électrons liant les deux 
atomes est communément appelée "liaison covalente". 


Les chimistes disent alors que la liaison covalente implique le partage équitable d'une seule paire 
d'électrons, appelé "doublet liant" (mais dont au fait qu'un seul des électrons l'est vraiment). Chaque 
atome fournissant un électron, la paire d'électrons est alors délocalisée entre les deux atomes comme 
nous l'avons démontré. 


Ce sont les raisons qui font que nous disons couramment que la liaison & est une liaison chimique 
covalente créée entre deux atomes par recouvrement axial d'orbitales. 


Creusons maintenant cette approche! Les orbitales moléculaires doivent être normées. Ce qui signifie 
que: 

Ti 

[ |P dxdydz =1 (5427) 


—© 


Ce qui donne, puisque les orbitales atomiques sont normées pour Y et sont des fonctions réelles: 
Ko +0 2 +0 
[ rs l drdydr = [af va+ 2) dre = [ (0294 +209 49 +075 )drdpd =1 (5425) 
—<o —<0 —o 


Puisque a (nombre réel dans notre cas particulier) est imposé comme étant une constante, il vient 
immédiatement: 


+0 +0 +0 +0 
a? | [ Pédrdyas + | Védrdyas +2 [ V4 sardyar | = a | 2+2 [ WP ,dxdpa : 
E En Er (54.29) 


= a? (2+28,)=1 
D'où pour LUE 


l 


J2(1+82) 
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De manière identique, nous avons pour TE 


l 


—— (5431) 
J2(1-S2) 


Si nous avons Si, # 1 , il vient la forme suivante que nous trouvons dans la littérature: 


Faisons un petit exemple en utilisant comme orbitale, l'orbitale atomique la plus basse (1s) de l'atome 
d'hydrogène dans le cas d'une liaison dihydrogène #; pour laquelle nous avons démontré à la fin du 


chapitre de Chimie Quantique que: 


r 
2 à 1! ER 
LT = À LÉ = —— 8 Ü > = —— —" 0 (54.33) 
0,00 + X1,0/0,0 
ù 7" Jr fa 
Il vient alors que: 
 … 2 3 ... a 
ä a & & 43 
Y,= Te 0 = 19 o ty, = Te 0 — 3 ‘0 (54.34) 
X &ÿ vil 0 
avec pour rappel: 
x? 


EL 
À & &) 
T, = —|2 +e (54.36) 
2 
et pour l'antiliante de niveau s: 
AL 5 
a =——|e * -e (54.37) 
V2 


Nous voyons alors immédiatement que g° s'annule au milieu des deux protons car à cet endroit r = 2. 


L'orbitale moléculaire antiliante présente donc un plan nodal et les électrons sont essentiellement 
localisés sur les protons. 
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Par contre, pour l'orbitale moléculaire & la densité ne s'annule pas. Nous comprenons alors aisément 


qu'un électron de 4x, assure la stabilité de la molécule et qu'il est donc responsable de la liaison 


chimique. 


Nous en déduisons donc que la stabilisation électronique due à l'interaction de deux orbitales identiques 
est proportionnelle à leur recouvrement. Plus le recouvrement est grand, plus la stabilisation est 
importante. 


Il y a une approche encore plus technique utilisant la notation de Dirac et qui a l'avantage de permettre 
la détermination des valeurs propres de l'énergie. 


D'abord nous écrivons l'expression générale de l'équation indépendante du temps de Schrüdinger avec 
la notation Ket-Bra pour une orbitale moléculaire, superposition de deux orbitales atomiques: 


H|Yyp)= Æ|Y up) (5438) 
Soit sous forme explicite: 
HlaP,i+bV)= Ela Ya +b y} (5439) 


Si nous multiplions par le bra (y 4 | à gauche et en tenant compte que a, b ainsi que les valeurs propres 


de l'énergie sont des constantes, nous obtenons l'équation suivante: 
afp, |A|P)+b(P, HP) = asp, [P+8E(Y,]#,) (5440) 
De même, nous obtenons avec le bra {?, |: 
af Pl Pa)+b0 PA |Pr)=aE (Ve [Va)+bE (| PS) (5441) 
Simplifions encore les écritures: 


a 44 +4 = GES 44 +bES 4r 


Par symétrie du problème dans le cas du dihydrogène, nous posons: 
(PalA|Vs)= Hap= (Vs |A|Pa}= Hg (5449) 


qui sont appelées "intégrales de résonance" car il s'agit d'un terme relatif à la combinaison (résonance) 
des deux orbitales atomiques propres aux deux atomes de base de la structure moléculaire. 


Nous avons également: 


(Fa ie |F4) | Fa (54.44) 
CAFTAE 


qui sont appelées "intégrales coulombiennes" car elles correspondent selon le cinquième postulat de la 
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physique quantique ondulatoire (voir chapitre du même nom) à la valeur moyenne de l'énergie totale de 
l'électron. 


Nous avons évidemment aussi: 
(Pal Pa) = Sas = (sl Ps)= Sp =1 (5445) 


qui sont appelées "intégrales de recouvrement" car les deux orbitales atomiques de même type de 
chacun des atomes se recouvrent. 


Et enfin, nous avons toujours par symétrie de notre cas particulier: 
Nous pouvons alors écrire, puisque les intégrales de recouvrement sont unitaires: 


a( Has — E)+b(Hap — ES ap) = 0 
(54.47) 
a (H54 — ESps) +b(Hps — E)= 0 
Ces deux équations sont appelées "équations séculaires". La solution triviale, mais a priori non 
physique car elle signifierait que l'électron aurait une densité de probabilité nulle en tout point de 


l'espace correspond à 4 = à = 0. 


Il existe une solution non triviale, si et seulement si, le déterminant (cf. chapitre d'Algebre Linéaire), 
appelé dans la chimie moléculaire "déterminant séculaire", suivant est nul: 


Hyy-E  Hyp- ES 


FANS PS0 (Ha — E) (Hop — E)- (Has — ESan)(Hna — ESga) = 0 (54.48) 


Comme nous avons par symétrie de notre cas particulier: 
Han = Horn, ap = Hpa,Sar = Spa (54.49) 
Il vient alors: 
(Ha EŸ -(Hap - ESys) =0 (5450) 
D'où: 
(Haa — E) = +(Hup - ESyn) (6451) 


Ce qui nous donne deux solutions (+): 


ya — À 
—E + ESas = Has — Haa © HR (Sas) = Hag = Bag © 5 = (54.52) 
7 PAR 


et (-): 
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À aa + Bar 


A5 


Nous avons donc: 


Mais pour pouvoir faire le calcul des niveaux d'énergie de manière détaillée, encore faut-il avoir la 
forme de l'hamiltonien.. et celui utilisant les deux électrons de la molécule de dihydrogène est déjà bien 
tordu... Pour simplifier l'étude, nous nous réduisons au cas du cation (ion positif) Hi constitué de deux 


protons et un électron: 


Figure: 54.2 - Étude simplifiée du cation hydrogène H, 


Nous avons alors en nous basant sur la relation obtenue au début de ce chapitre: 


kg N n Te? Fe a? 
Me 


À y Lt DD —— 


k=1 i=1 ATEbrx El ARE; 


la relation suivante: 


où les deux premiers termes dans la parenthèse sont pour rappel associés à l'énergie potentielle de 
l'électron et le dernier à l'énergie potentielle de répulsion des protons (le premier terme à droite de 
l'égalité étant l'énergie cinétique de l'électron). 


Essayons maintenant d'ordonner l'énergie de ces deux orbitales moléculaires. Pour cela, écrivons: 


aa + Has _a+f 
1+S ip 1+5 


ë£ = —————————— = et Æ; = = (54.57) 


Rappelons que pour qu'un système soit stable, les énergies E, doivent être négatives, ce qui correspond 


à des états stables (il faut un apport de l'énergie pour les défaire) et nous impose à cause de la forme de 


E; : 
a <0,8<0 (54.58) 


Sachant ceci, il vient: 
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E, <Æ, <0 (5459) 


Dès lors, nous voyons que les notations ne sont pas conformes à l'usage de la physique quantique car 
normalement l'indice 1 est réservé au niveau de plus basse énergie. Nous écrirons donc à l'avenir: 


_ a+ a- 6 


et Es =—— (54.60) 


À 1+S5 1-5 


avec les fonctions propres associées Ÿ, et #, et donc: 


E <EÆE, <0 (5461) 


Nous pouvons également remarquer une chose importante! C'est que si nous considérons les atomes 
isolément, les termes d'interactions s'annulent et nous avons: 


Æ2= (54.62) 
Donc nous avons la différence qualitative entre un atome isolé et un système diatomique simple: 


a+$ 
+S 


<æ<0 (54.63) 


Ce qui signifie que l'énergie du plus bas niveau d'une molécule diatomique est inférieure à l'énergie d'un 
atome isolé qui est proche de &. Cette observation confirme que le système est stabilisé en énergie par 
rapport aux deux atomes isolés, ce qui paraît cohérent avec le constat expérimental de l'existence de 
telles molécules. 


L'usage veut que les chimistes représentent les différences d'énergie sous la forme suivante pour notre 
cas particulier: 
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tend vers O 


tend vers -00 


Figure: 54.3 - Niveaux d'énergie du cation hydrogène H, 


Nous concluons donc que lorsque deux atomes (contribuant chacun avec un électron) s'unissent, leurs 
orbitales atomiques vont se combiner pour générer deux orbitales moléculaires, l'une , d'énergie plus 


basse et une seconde Ÿ, d'énergie plus élevée que celle des atomes isolés. Aïnsi, la rupture qui fera 


partir l'électron avec un des atomes sera exothermique par rapport aux atomes isolés. 
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Notes personnelles: 
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55. CHIMIE ANALYTIQUE 


1 chimie est une science très complexe à n corps que la mathématique ne peut expliquer sans 


l'apport de simulations numériques sur ordinateur ou d'approximations quant à l'utilisation de la 
théorique quantique (voir section d'atomistique). D'ici que ces outils soient suffisamment puissants et 
accessibles à tout le monde, la chimie reste une science principalement expérimentale basée sur 
l'observation de différentes propriétés de la matière dont voici quelques définitions fort importantes 
(que nous retrouvons d'ailleurs dans d'autres domaines que la chimie). 


Définitions: 


D1. Une "propriété subjective" est une propriété basée sur une impression personnelle/individuelle, par 
exemple, la beauté, la sympathie, la couleur, l'utilité, etc. 


D2. Une "propriété objective" est une propriété ressentie (qui ne peut être contredite), par exemple, sa 
masse, son volume, sa forme, etc. 


D3. Une "propriété qualitative" est une propriété descriptive donnée à l'aide de mots. Par exemple: 
forme ovale, magnétique, conducteur, etc. 


D4. Une "propriété quantitative" est une propriété qui se chiffre. Par exemple: sa masse, son volume, sa 
densité, etc. 


D5. Une "propriété caractéristique" est une propriété exclusive qui permet d'identifier une substance 
pure. Elle ne change pas même si l'on transforme physiquement la matière, par exemple, sa masse 
volumique, son point d'ébullition, son point de fusion, etc. 


D6. Un corps est dit un "corps pur" lorsque tout échantillon de ce corps présente des valeurs de 
constantes bien définies et identiques à celles de l'ensemble (densité, point de fusion, point d'ébullition, 
indice de réfraction, etc.). 


Remarque: Nous connaissons environ 2'000'000 de substances pures différentes en ce début du 
21ème siècle (c'est dire...qu'il y a du travail derrière). 


D7. Nous nommons "corps composés", les corps qui, soumis à des procédés chimiques, restituent leurs 
composants sous forme de corps purs. 


D8. Si nous effectuons la séparation des mélanges et la décomposition des combinaisons, nous obtenons 
finalement des corps qui sont indécomposables par les méthodes chimiques classiques; nous les 
nommons "éléments" ou "corps simples”. 


Ainsi, la plus petite partie d'une combinaison chimique présentant encore toutes les propriétés de 
celle-ci est la "molécule" de cette combinaison. La plus petite partie d'un élément ou corps simple est 
"l'atome" de cet élément. 


Quelques rappels d'ordre général au préalable: 
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R1. Un mélange est dit "hétérogène" en chimie si ces constituants sont immédiatement discernables à 
l'oeil nu ou au microscope 


R2. Un mélange est dit "homogène" en chimie si ces constituants ne sont pas discernables à l'oeil nu ou 
au microscope. 


1. MÉLANGES SIMPLES 


Avant de partir dans des équations plus ou moins compliquées, le cas le plus simple d'application des 
mathématiques à la chimie par lequel nous pouvons commencer est la gestion des mélanges pour les 
opérations d'analyse et de contrôle de réactions chimiques simples avec deux mélanges. 


Considérons deux exemples typiques et particuliers: 


1. Soit une solution (jaune) de 10 millilitres d'une solution qui contient une concentration d'acide à 30%. 
Combien de millilitres d'acide pur (bleu) devons-nous rajouter pour augmenter la concentration (verte) 
à 50%? 


Figure: 55.1 - La joie des mélanges. 


Puisque l'inconnue est la quantité d'acide pur à rajouter, nous la noterons x. Nous avons alors: 
10-30%+x=50%.(10+x) (55.1) 
Ce qui donne: 
3+x=5+0.5x (552) 


Il vient alors trivialement: 


Donc 4 millilitres d'acide devraient être ajoutés à la solution d'origine. 


2. Un jerricane contient 8 litres d'essence et d'huile pour faire fonctionner un agrégat. Si 40% du 
mélange initial est de l'essence, combien devrions-nous enlever du mélange (reste en rose) pour le 
remplacer par de l'essence pure (vert clair) pour que le mélange final (vert kaki) contienne 60% 
d'essence? 
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Figure: 55.2 - La joie des mélanges chez les bricoleurs et militaires. 


Nous noterons x l'inconnue qui est le nombre de litres du mélange initial à retirer et à remplacés par 
l'essence pure qui étant de quantité égale est aussi x. Nous avons alors: 


(8-40%-x.40%)+x=8.60% (55.4) 
Ce qui donne: 
0.4 (8- x) +x=8-0.6 (55.5) 
Il vient alors trivialement: 
x=26 (55.6) 
Donc 2.6 litres devraient être enlevés du mélange d'origine et être remplacés par 2.6 d'essence pure. 


Bref voilà pour les mélanges. Nous pouvons aller beaucoup plus loin, et faire beaucoup plus compliqué 
avec plus d'inconnues mais nous nous arrêterons là pour l'instant. 


2. RÉACTIONS 


Puisque l'étude principale en chimie consiste à observer les résultats de mélanges de corps purs et/ou 
composés, il convient d'abord de nous attarder sur les règles de bases qui régissent ces mélanges dans 
des conditions normales de pression et de température (C.N.T.P). 


Il convient au préalable de préciser que nous n'allons pas étudier dans ce chapitre ce qui crée les 
liaisons entre les éléments, car ceci est le rôle de la chimie quantique et moléculaire (voir chapitres 
précédents). De plus, nous insistons sur le fait que chaque élément théorique sera illustré d'un exemple 
pratique auquel il peut être utile de se reporter parfois pour mieux comprendre. 


Considérons maintenant un système chimique fermé (sans transfert de masse donc!). Nous traduisons la 
modification de la composition (s'il y a lieu et si elle existe) du système chimique par une équation de 
réaction de la forme (le système ne va pas toujours dans les deux sens!): 


A4 +... vi d'tv 45 +.) (657 


appelée "équation de bilan" où les coefficients v, € N° sont appelés "coefficients stoechiométriques" 


dans le sens où ils indiquent les "proportions d'or", rigoureusement appelées "proportions 
stoechiométriques", nécessaires telles qu'à des conditions normales la réaction puisse avoir lieu et où les 
A, sont les produits réagissants (purs ou composés) et les 4°, produits formés. 
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Attention! Dans l'écriture de l'équation ci-dessus, nous imposons que tous À, sans exception réagissent 


à la réaction chimique et donc que tous les x sont dépendants. 


Si les proportions d'or sont respectées (tels que les coefficients soient bien stoechiométriques!) et 
existent lors de l'écriture de l'équation de réaction, alors pour tout æ £ N nous avons: 


afn4m4 +.) a(v d'itvl 40+.) (65.8) 


cette proposition n'est démontrable que si les coefficients stoechiométriques d'un côté ou l'autre de la 
réaction varient de manière proportionnelle. L'expérience montre que dans des conditions normales de 
température et de pression (C.N.T.P) cela est bien le cas. 


Dès lors, la stoechiométrie de la réaction impose que s'il disparaît dans le système x, moles de 4 , x, 
moles de À, avec respectivement une variation de matière des produits 4x, ,4#, …, il apparaîtra en 
conséquence x', moles de 4°, x', moles de 4',, … avec respectivement une variation de matière des 
produits 4x',4»',… en respectant les proportionnalités des coefficients stoechiométriques tel que nous 
puissions écrire "l'équation du bilan de matière": 


—d# : —dn; LL dn' _dn'a 
Li Vs vi Va 


ZOU 


où 4£ est appelé "avancement élémentaire de la réaction" (fréquemment on prendra les valeurs 
absolues des rapports pour ne pas avoir à réfléchir sur le signe des variations). 


La division des variations dx,,4d#, et d#",,dn"; par leurs coefficients stoechiométriques se justifie 
uniquement pour des raisons de normalisation ayant pour objectif de rapporter 4£ à une valeur 
comprise entre 0 et 1 (soit entre 0% et 100%...). 


Ces dernières égalités indiquent simplement que si l'un des produits réactif disparaît en une quantité 
donnée, les autres produits réactifs voient leur quantité diminuée en rapport à leur coefficient 
stoechiométrique de manière à conserver la proportion d'or de la réaction. 


L'écriture du bilan énergétique peut être allégée par l'introduction des coefficients stoechiométriques 
algébriques v, tels que: v; > 0 pour un produit formé, v, < 0 pour un produit réagissant. 


Finalement nous pouvons écrire: 


que nous retrouvons également souvent dans la littérature avec la valeur absolue au numérateur! 


Dès lors, avec cette convention algébrique, l'équation de réaction comme elle existe, permet d'écrire: 


> "4 = 0! (51) 


i 


ce qui signifie que la somme algébrique du nombre total de composés purs des réactifs et produits 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


formés est toujours nulle. 


Il est clair qu'à l'instant initial de la réaction nous choisissons pour l'avancement la valeur £ = 0 (sa 
valeur maximale étant égale à l'unité), instant auquel les quantités de matière sont »;, . 


L'intégration de l'expression différentielle du bilan de matière donne bien évidemment: 
t t 
(lu : [a > [SE) — CG)[ = #% © x Go) 
ù ù Cu 


%p (55-12) 
A6 40 ma © a TA nd 


relation que nous retrouvons dans les tableaux d'avancements (voir plus bas) en se souvenant bien que 
v, > O0 pour un produit formé, v, < 0 pour un produit réagissant. 


Se pose alors la question: Quelle est la valeur maximale £,.., de l'avancement d'une réaction ? Eh bien 


la réponse à cette question est ma foi fort simple. La valeur maximale d'avancement d'une réaction 
ayant les proportions stoechiométriques (nous respectons la tradition ainsi plutôt qu'en parlant de 
proportions d'or...) est telle qu'elle a lieu lorsque les réactifs auront tous disparu et dès lors elle est 
nécessairement donnée par: 


pour ce que nous appelons le "réactif limitant", c'est-à-dire le produit réagissant qui disparaît (a toujours 
la plus petite valeur de molarité) en premier et qui arrête la réaction attendue! S'il n'y a pas de réactif 
limitant, c'est qu'à la fin de la réaction tous les réactifs ont été transformés: on dit que les réactifs 
étaient en proportion stæœchiométriques. 


Il peut être utile de définir le "taux d'avancement" 4 donné par la grandeur intensive: 


= quantité de À, ayant réagi 


: —_— (55.14) 
quantité de 4 imitiale 


ce qui de manière formelle donne: 


Exemple: 


Considérons pour illustrer tous ces concepts la réaction (diazote avec hydrogène donnant de 
l'ammoniac): 


N, +34, = 2NA, (55.6) 


où les lettres latines représentent des corps purs (atomes) dont le nom ne nous importe pas (notation 
proposée par Jôns Jacob Berzelius en 1813). Les indices représentent tout simplement la combinaison 
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des atomes pour obtenir une molécule. Nous avons dans cette réaction: 
= = | = = = = 4 ri 
Le lecteur remarque que nous avons bien selon notre convention pour le bilan de masse: 


DA =l'CN)+3 (2H)-2(N)-2(3H)=0 (519 


Si nous considérons qu'il y a une mole de chaque corps composé, cela nous donne pour les proportions 
stoechiométriques (à un facteur x IR° près pour toutes les valeurs): 


A =V'l1=l'1=U#oi],x, = v,'1=3 1= moi],x, =v,'2=1 2=2[moi] (5519) 
Si à un moment £ “ #, donné, nous obtenons par mesure: 
#3 = 0.2[#oi] (55.20) 


Quel est l'avancement de la réaction ? 


soit autrement dit, nous en sommes à 10% (logique!). 


Le taux de conversion de VA, y relatif est donc: 
G=——=——=01 (5522) 


Et quelle est la valeur maximale d'avancement #., du réactif limitant ? 


Donc dans le cadre de l'exemple ci-dessus où nous avons #4 = [##0{] pour le M, alors: 


mx 


= = _ = [mai] (55.23) 
| 1-1 


Les chimistes utilisent également souvent ce qu'ils appellent un "tableau d'avancement". 


Voyons de quoi il s'agit avec notre exemple: 


Équation N, [+342 -2N4; 
#0 1 B 0 
m=mptvé [I-lé sé 0+2.€ 


En 1-1 [3-36 0+2 6 


Tableau: 55.1 - Avancement d'une réaction chimique 
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Recherchons #,.., à partir de ce tableau. Le réactif limitant est donc soit À, soit 3A;. 


Donc pour À, : 


et pour 3À;: 


Chaque réactif possédant le même avancement £#,.., celui-ci est donc aussi le #,.. minimal. En 


conséquence, selon la définition de l'actif limitant, vue que les proportions sont stoechiométriques dans 
l'exemple donné aucun des réactifs n'est limitant. 
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Notes personnelles: 
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56. CHIMIE THERMIQUE (THERMOCHIMIE) 


L. thermochimie est la branche qui s'intéresse, historiquement, aux phénomènes thermiques et aux 


bilans qui accompagnent les réactions chimiques. Elle puise principalement ses fondements dans la 
thermodynamique. 


Nous ne saurions donc que recommander au lecteur d'avoir lu ou parcouru le chapitre traitant de la 
thermodynamique dans la section de mécanique car de nombreuses notions qui y ont été vues seront 
supposées comme connues dans ce chapitre. 


Par ailleurs, il est fortement recommandé de lire le présent chapitre en parallèle de celui de Chimie 
Analytique (cela peut être embêtant mais il faut faire avec). 


1. TRANSFORMATIONS CHIMIQUES 
Soit le système fermé siège de la réaction chimique (cf. chapitre de Chimie Analytique): 
A4 +. vi d'itvo 45 +. (66.1) 


Nous allons pour simplifier... considérer que la réaction chimique est totale et que les produits 
réagissants sont utilisés en quantités stoechiométriques (état 1: Z,) pour donner les produits formés, 


également en quantités stoechiométriques (état 2: 7). 


Si la transformation s'effectue à volume (quasi-)constant, le travail sur l'atmosphère ambiante est nul 
car (cf. chapitre de Thermodynamique): 


2 
A = Fi =0 (56.2) 
L'application du premier principe se réduit et permet alors d'écrire: 
U, -U, = Qy (56.3) 


où ©, est dans le cadre de la chimie thermique appelée "chaleur de réaction à volume constant", 


échangée bien sûr entre le système et le milieu extérieur (nous n'écrivons pas le delta pour indiquer qu'il 
s'agit d'une variation par tradition.….). 


Rappelons que: 


- Si (y > 0, la réaction est dite "endothermique" (le système reçoit de la chaleur du milieu extérieur) 
- Si (7 < 0 la réaction est dite "exothermique" (le système cède de la chaleur au milieu extérieur) 


- Si (y = 0 la réaction est dite "athermique" (pas d'échange de chaleur avec le milieu extérieur) 
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Remarque: Rappelons aussi qu'un système fermé n'est pas un système isolé! Pour un rappel des 
différentes définitions, nous renvoyons le lecteur au chapitre de Thermodynamique. 


Si la réaction se fait à pression constante (cas le plus courant dans la pratique), soit isobare, nous avons 
alors: 


3 
AÏF = Fu =-P(F,-7) (564) 


Remarque: Le choix des indices d'intégration sont différents à précédemment pour différencier le 
fait qu'une réaction à pression ou à volume constant ne sont pas nécessairement identiques. 


L'application du premier principe de la thermodynamique, entre les deux états, permet d'écrire: 
U,-U,=0,-P(F M) (6565) 


où ©, est la quantité de chaleur, appelée "chaleur de réaction à pression constante", échangée entre le 
système et le milieu extérieur (@, est donc une variation... même si la notation traditionnelle 
malheureuse des thermodynamiciens ne le met pas en évidence...). 


En utilisant la définition de l'enthalpie, nous pouvons écrire cette dernière relation sous la forme: 
OP =U,-U+ P(7,-M)=(U;+P7,)-(U +PF)= 4,1 (66.6) 


Si nous travaillons avec les volumes molaires, ceux des phases condensées (solides et liquides donc) 
étant négligeables devant le volume molaire gazeux, seuls les constituants gazeux auront une enthalpie 
très différente de leur énergie interne (voir l'exemple dans le chapitre de Thermodynamique). Nous 
aurions dès lors dans le cadre de l'approximation des gaz parfaits (cf. chapitre de Thermodynamique): 


HA, =U, ART (56.7) 
Dans le cadre des gaz parfaits, la relation antéprécédente peut donc s'écrire: 
OP HA U, -Uit(rs-n)RT =U, 0 +0, +8 -m)RT -U, 
= Qr+(8-n)RT+U, -U, 


(56.8) 


Or, comme (cf. chapitre de Mécanique Des Milieux Continus) £, et TU; sont tous deux les mêmes 


états finaux d'une même réaction complète et que pour un gaz monoatomique: 


U, = 2 MT (56.9) 


donc l'énergie interne {/, et TL; ne dépend que du nombre de constituants mais. ils sont égaux 
puisque même état final d'une même réaction! 


Ainsi, nous avons: 
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Ü, = U; = Us -U; =Û0 


En posant x = #, - x, (différence entre le nombre de moles de gaz des produits formés et ceux des 


produits réagissant), nous pouvons écrire pour une réaction chimique: 


O» = Qy + ÂRRT 


ce qui permet de différencier l'énergie mise en jeu entre réaction isobare et isochore et de chercher le 
meilleur choix à faire en fonction des objectifs industriels. 


Il est intéressant de remarque que si le delta du nombre de moles est nul. Les variations de chaleur 
isobare ou isochore sont égales et qu'il n'y a donc pas de raison de préférer a priori l'une ou l'autre des 
transformations. 


Évidemment dans la pratique le problème consiste à connaître les valeurs des différentes variables de la 
relation. Ces valeurs se trouvant dans d'immenses bases de données auxquelles les chimistes ont accès. 
cette relation n'est que très très rarement utilisée dans la pratique et de toute façon elle est basée sur des 
hypothèses simplificatrices trop contraignantes pour être d'un vrai intérêt pratique. 


2. GRANDEURS MOLAIRES 
Définitions: 


D1. Par convention, la "mole" est la quantité de matière d'un système contenant autant d' Fees 
chimiques qu'il y a d'atomes de carbone dans 12 [g] de carbone 12 (cf. I aire). 


Le nombre d'atomes de carbone contenus dans 12 [g] de carbone est égal au nombre d'Avogadro donné 
approximativement par: 


Nyy. © 6.0221367:107 [mo] 


y. 
Cela signifie in extenso et par construction qu'une mole d'eau, de fer, d'électrons, contient 
respectivement toujours un nombre d'atomes égal au nombre d'Avogadro. 


Remarquons qu'avec un système mélangé c'est un non-sens mathématique de faire la somme des 
masses molaires des constituants pour avoir la masse molaire totale. La masse molaire est donc une 
grandeur intensive! 


D2. La "masse molaire atomique" est la masse d'une mole d'atomes des éléments chimiques concernés. 


Remarque: Nous trouvons ces masses molaires atomiques dans les classifications périodiques. Mais 
il faut surtout savoir que celles qui sont indiquées prennent en compte les isotopes naturels (ce qui 
est bien normal puisque chimiquement ils sont indiscernables à part pour le chimiste nucléaire ou le 
physicien nucléaire). Donc la valeur indiquée dans les tables se calcule comme la somme des 
proportions respectives des masses molaires des différents isotopes (la validité de cette manière de 
calculer est toute relative.…). 


D3. La "masse molaire moléculaire" est égale à la somme des masses molaires atomiques des éléments 


chimiques qui la constitue. 
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Il vient dès lors immédiatement le constat suivant: la masse m d'un échantillon constitué d'une quantité 
de n moles d'espèces chimiques tout identiques de masse molaire 4f, est donnée par la relation: 


De manière un peu plus formelle et sous un aspect thermodynamique, voici aussi comment nous 
pouvons définir la masse molaire: 


Soit X une grandeur extensive relative à un système monophasique (voir le chapitre de 
Thermodynamique pour le vocabulaire dont il est fait usage) et soit un élément de volume dV de ce 
système, autour d'un point courant M et contenant la quantité de matière dn. Nous lui associons la 
grandeur extensive dX proportionnelle à dn tel que: 


dX = X de À, — (56.14) 
# 


ce qui fait que Æ,, est une grandeur intensive (quotient de deux grandeurs extensives selon ce qui a été 


vu dans le chapitre de Thermodynamique) que nous appellerons par définition "grandeur molaire 
associée" à X. 


Nous en déduisons que: 
X= [An dr (56.15) 
l'intégrale portant sur tout le système monophasique. 
Dans le cas d'une phase uniforme, Æ,, étant constant en tout point, nous pouvons simplement écrire: 
À =nÀ, (56.16) 
Remarque: En gros l'idée est de dire que la masse d'un système chimique monophasique est 


proportionnelle à la masse molaire de celui-ci à un facteur entier près représentant le nombre de ses 
constituants (où le nombre de moles pour être plus exact). 


D4. Dès lors que le système est hétérogène, nous utilisons le concept de "titre molaire", défini par: 


== A À ( 56.17) 
# 


À; 


x étant donc le titre molaire d'une espèce À dont la quantité de matière (le nombre de moles par 


exemple) est x, avec # 7 2% étant la quantité de matière totale de la phase envisagée. 
E 


Il en résulte que, pour toutes les espèces de la phase envisagée, 2 x =] ce qui veut dire que, s'ilyan 
1 


espèces chimiques, il suffit de connaître n-1 titres molaires pour toutes les connaître. 
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Si la phase considérée est gazeuse et en considérant un gaz parfait suivant la loi de Boyle-Mariotte 
(approximation de l'équation de Van der Waals démontrée dans le chapitre de Mécanique Statistique) 
nous avons: 


ÆV = x RT et PF =nRT (56.18) 


nous avons dès lors aussi la possibilité dans le cas de phases gazeuses d'exprimer le titre molaire 
comme: 


x == 1 = i) (56.19) 
# ART PF  P 


Remarque: Nous pourrions faire de même avec le volume. 


DS. Nous définissons le "titre massique associée à l'espèce" À par le rapport: 


H; = 7 (56.20) 
Le) 


avec ”? = D,à étant la masse totale de la phase étudiée. Nous avons bien sûr également >wm=1 
E E 


D6. Nous définissons la "concentration molaire volumique" ou "molarité" par le rapport (attention à ne 
pas confondre la notation avec la chaleur massique): 


Remarque: Il existe d'autres grandeurs de composition beaucoup moins utilisées que x ou «,. Nous 
pouvons citer la "concentration massique volumique" #4 /Ÿ°, la "molalité" (quotient de la quantité 
de matière de l'espèce À par la masse du solvant", etc. 


En chimie thermique, nous considérons très souvent les gaz comme parfaits et nous faisons jouer un 
rôle privilégié à une pression particulière appelée "pression standard" Æ° et dont la valeur vaut 


(pression atmosphérique): 
P° =1[bar] =10°[ Pa] I[atmosphère] (56.22) 


D6. Nous disons qu'un gaz (parfait) est dans l'état standard si sa pression est égale à la pression standard 
F° de 1 [bar]. 


D7. Nous appelons "grandeur molaire standard" ZÆ7, d'un constituant la valeur de la grandeur molaire de 


ce même constituant pris à l'état standard, c'est-à-dire sous la pression F*. 
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Remarques: 


R1. Toute grandeur molaire standard est bien évidemment intensive: la pression étant fixée par l'état 
standard, celle-ci ne dépend plus que de la température. 


R2. Toute grandeur standard est notée grâce à l'exposant "°": Fest donc le volume molaire 


standard. Par contre, la grandeur molaire standard n'est pas toujours spécifiée avec le petit m en 
indice, il faut donc parfois être prudent avec ce que l'on manipule. 


Dans le cas du gaz parfait, le volume molaire se calcule grâce à l'équation d'état du gaz parfait. Il en 
résulte: 


Fe = (56.23) 


Nous constatons bien évidemment que le volume molaire standard du gaz parfait dépend de la 
température. 


Si nous faisons ce calcul aux "conditions normales de température et de pression" (abrégé C.N.T:P.), 
c'est-à-dire à une température de 273.15 [K] (soit O [°C]J) et à une pression de 1 [atm] (soit 101.325 
[kPal]), nous trouvons alors un volume de 22.4 [L/mol] qui est une valeur très connue par les chimistes. 


Remarques: 


R1. Dans une large gamme de températures et de pressions, le volume molaire des gaz réels n'est 
généralement pas très différent de celui d'un gaz parfait. 


R2. Dans le cas d'un état condensé, nous ne disposons pas en général d'une équation d'état mais 
nous pouvons néanmoins mesurer le volume molaire. 


Nous pouvons définir ainsi par extension d'autres grandeurs standard découlant de celles que nous 
avions définies dans le chapitre de Thermodynamique: 


- "L'énergie interne molaire standard" (grandeur intensive puisque exprimée par unité molaire) £f, 
- "L'enthalpie molaire standard" (grandeur intensive puisque exprimée par unité molaire) Æ,, avec: 
H,=U,+ PV, =U,+RT (56.24) 


Il est important que le lecteur observe que l'enthalpie ne dépend que de la température (et de l'énergie 
interne). 
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Remarque: Pour les états condensés le volume standard est très faible en unités S.I. ce qui fait que 
H,, = U. Il est cependant très difficile de parler de pression pour les états condensés donc cette 


approximation est à prendre avec des pincettes. 


Si nous considérons maintenant une fonction extensive X (comme le volume par exemple!) définie sur 
un système chimique gazeux en évolution. Nous pouvons a priori, exprimer X en fonction des deux 
variables intensives T, P (car une fonction extensive est soit produit/rapport de deux grandeurs 
intensives, soit une somme de grandeurs extensives) et des différentes quantités de matières x,,#', de 


A,A\ tel que: 
X=X(T,P,..n.) (56.25) 


Si tous les produits (réactifs et formés) sont dans leur état standard la fonction extensive, notée dès lors 
x*,se met sous la forme: 


X'=X'(T,.n.…) (56.26) 


où la pression n'intervient plus puisque fixée à sa valeur standard. Le gaz n'est alors décrit que par sa 
température et de la quantité de ses constituants ! 


Si nous considérons cependant une évolution infiniment petite du système à température et pression 
constantes (car nous supposons les proportions des composants du gaz comme variant toujours en 
proportion) les différentes quantités de matières varient alors selon la différentielle totale exacte (cf. 
chapitre de Calcul Différentiel Et Intégral): 


où n'interviennent bien évidemment par la contrainte précitée (température et pression constantes) que 
les différentielles par rapport aux quantités de matières qui varient. 


Nous pouvons alors être amenés à définir artificiellement (rien ne nous en empêche, ce n'est pas faux!) 
la grandeur molaire standard intensive qui ne dépend que de la température: 


Dès lors: 


mais nous avons aussi défini en dans le chapitre de Chimie Analytique la relation: 
dn = vdé (56.30) 


qui exprimait, rappelons-le, la variation de la quantité de matière d'un des composés de la réaction par 
rapport à sa proportion stoechiométrique (constante) et l'avancement de la réaction. Il vient dès lors: 
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dX, = (Ex VE (56.31) 
i 


ainsi que: 


dXr => D) Ds d&= [Ex Jés 


Par définition, nous appelons cette dernière somme algébrique "grandeur standard de réaction associée 
à la fonction extensive X"' et la notons (notation mal choisie par les chimistes...): 


A,X => Xi (56.33) 
t] 


qui est une grandeur intensive qui ne dépend que de la température et qui représente une variation 
relative (d'où le r en indice!). Cette relation peut aussi s'écrire: 


. aX" _dXr 
EL = K'y (56.34) 
A, 2 MD Sr Je 


De manière générale, les chimistes appellent "opérateur de Lewis", noté À,, la dérivée d'une grandeur 
X (standardisée ou non), par rapport à l'état d'avancement de la réaction £ à température et pression 
constantes. 


Remarque: Le symbole figure avec la lettre r en indice pour bien montrer qu'il s'agit d'une grandeur 
de réaction. En d'autres termes, il s'agit de variation de la grandeur molaire standard considérée au 

cours de la réaction concernée pour un avancement de réaction d'une mole à une pression de 1 bar 
pour un gaz parfait. 


Il ne faut par ailleurs pas oublier que les coefficients stoechiométriques des réactifs sont positifs et ceux 
des produits négatifs (cf. chapitre de Chimie Analytique). 


Il existe deux grandeurs de réaction jouant des rôles importants en chimie: 


1. L'énergie interne molaire de réaction, appelée plus souvent "énergie interne de réaction standard", 
d'un système chimique: 


= SU 0 (56.35) 
i dé 


2. L'enthalpie molaire de réaction, appelée plus souvent "enthalpie de réaction standard", d'un système 
chimique: 


dy 
Ë° H; = T| (56.36) 
AH - in - © 
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2.1. ENTHALPIE STANDARD DE RÉACTION 


Dès lors nous pouvons considérer les deux cas suivants suivant en connaissant la relation (cf. chapitre 
de Thermodynamique): 


1. Siles À sont dans un état condensé, puisque la pression interne ne s'applique pas nous avons: 
H; SU, (56.38) 
qui reste quand même à prendre avec des pincettes suivant les scénarios! 
2. Siles 4 sont à l'état gazeux (supposés parfaits): 
FA = #4 +RT (56.39) 
Il en résulte que seuls les gaz vont intervenir dans cette relation: 


AH - > Aiv =>» (D; L ART) = AU +DvRT (56.40) 
i s 5 


que nous écrivons conventionnellement: 


A,H° = AU" +AvRT| (5641) 


Il en résulte que dans le cas particulier où: 
A,v, =0 (56.42) 


(qui est au fait une notation. malheureuse. pour la somme algébrique des proportions 
stoechiométriques qui serait donc nulle) pour une température donnée alors nous avons: 


AH = AU (56.43) 


où il faut se rappeler que les coefficients stoechiométriques des produits sont comptés comme positifs, 
alors que ceux des réactifs sont négatifs (cf. chapitre de Chimie Analytique). 


Ainsi, la variation de la fonction enthalpie correspond à la variation de la quantité de chaleur mise en 
jeu dans une transformation isobare à une température T donnée. Raison pour laquelle celle-ci est 


parfois notée À, # Lr: 


Une réaction chimique qui a une enthalpie de réaction (qui est pour rappel la variation instantanée de 
l'enthalpie pendant une réaction) négative est dite exothermique, puisqu'elle libère de la chaleur dans 
l'environnement (pression constante oblige par définition de cette enthalpie de réaction!), alors qu'une 
réaction chimique dont l'enthalpie de réaction est positive est dite endothermique puisqu'elle nécessite 
alors un apport de chaleur pour se produire. 
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Ainsi, selon les développements précédents, si nous notons avec un indice p les produits et avec un 
indice i les réactifs, nous trouvons souvent l'enthalpie standard de réaction sous la forme suivante si les 
coefficients stoechiométriques sont tous comptés comme positifs: 


A, Hrp = 2VpHy DV A 
P PF 


sous cette forme, nous voyons alors bien que l'enthalpie standard de réaction correspond donc à la 
différence des enthalpies molaires partielles entre les produits et les réactifs. Il s'agit ni plus ni moins de 
la "loi de Hess" définie au 19ème siècle par le chimiste suisse Henri Hess. 


Puisque dans un système à l'équilibre, l'énergie initiale est toujours supérieure ou égale à l'énergie finale 
(les systèmes tendent toujours à aller vers un état plus stable ayant une énergie minimale), alors 
l'enthalpie standard de réaction A, H° ne peut être que négative ou nulle. 


Si une réaction chimique à pression constante et à une température donnée ne donne qu'un seul et 
unique composé chimique (produit) alors l'enthalpie standard de réaction est appelée "enthalpie 


standard de formation" et notée À f H°. 


Au fait, l'intérêt de la relation antéprécédente est que le chimiste peut simplement, sans avoir à 
connaître les quantités de matières mises en jeu, déterminer juste en connaissant les coefficients 
stoechiométriques d'une réaction chimique gazeuse ou condensée (s'il accepte qu'il s'agira alors d'une 
approximation pour ce dernier cas) isobare si la variation instantanée de l'énergie interne molaire lors 
de l'avancement d'une réaction à une température donnée est égale à la variation instantanée de 
l'enthalpie molaire. 


Deux cas pratiques se présentent alors: 


1. La différence entre la variation instantanée de l'énergie interne molaire et l'enthalpie molaire est 
nulle: Dès lors, la réaction chimique (à la température donnée) n'occupe pas instantanément un volume 
plus grand et ne perd donc aucune énergie à repousser ("inutilement") la pression du gaz environnant la 
réaction étudiée (cela peut être vu comme une économie d'argent en termes énergétiques dans une 
industrie chimique). Dans ce cas, l'enthalpie standard de réaction est égale simplement à la chaleur de 
réaction à pression constante ©. 


2. La différence entre la variation instantanée de l'énergie interne molaire et l'enthalpie molaire est 
positive: Dès lors, la réaction chimique (à la température donnée) occupe instantanément un volume 
plus grand et perd donc une part d'énergie à repousser ("inutilement") la pression du gaz environnant la 
réaction étudiée (cela peut être vu comme une perte d'argent en termes de rendement énergétique dans 
une industrie chimique). 


Remarque: Évidemment, il est tout à fait possible d'imaginer une entreprise qui tire profit de la 
variation du volume d'une réaction (le cas 2) qui repousse le gaz environnant avec un système de 
piston pour produire ensuite de l'énergie mécanique. donc il est serait possible dans certaines 
situations de perdre beaucoup moins d'argent (in extenso d'énergie). 
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Une petite difficulté se présente cependant...l'enthalpie standard d'un corps pur simple (corps formé que 
d'un seul type d'atomes) ne peut être calculée de façon absolue car elle dépend de l'énergie interne qui 
est très difficilement calculable (il faut utiliser les outils de la physique quantique qui soulèvent des 
problèmes insurmontables aujourd'hui). Cela suppose de définir une échelle arbitraire d'enthalpies 
molaires en définissant un zéro arbitraire d'enthalpie et adopté à l'échelle internationale (ce qui n'est 
malheureusement pas le cas à ma connaissance!). 


Ainsi, pour pouvoir dresser des tables d'enthalpies molaires standards, il a été choisi de définir l'échelle 
d'enthalpie de la manière suivante: l'enthalpie molaire standard d'un corps pur simple stable dans l'état 

standard est nulle à 298 [K]. Il s'ensuit que l'enthalpie de formation standard d'un corps pur simple est 

donc toujours nulle. 


Exemple: 
Soit la réaction: 
PCI = PCI +Cl, (56.45) 


C'est-à-dire la dissociation du pentachlorure de phosphore en chlore en et trichlorure de phosphore. Les 
tables nous donnent à la température de 7 = 1'O00 [Æ] la valeur suivante de l'enthalpie standard 
molaire de cette réaction: 


A, H° =156 [&J moi 1] (56.46) 
où nous n'avons pas indiqué le petite m en indice 


La variation de la valeur de l'enthalpie molaire de réaction étant positive, il s'ensuit que la réaction est 
endothermique (puisque nécessite un apport de chaleur d'où la température de dissociation de 1'000 
[KT et donc le produit est plus instable que le réactif initial. 


Nous avons la somme algébrique suivante des coefficients stoechiométriques de la réaction: 

LPC = 1PCZ3 +1C2 (56.47) 
Soit (qui est sans dimensions puisque l'enthalpie est en valeur molaire!): 

A,v, =-1+1+1=1 (56.48) 
donc la réaction fait augmenter la pression en créant une mole supplémentaire par mole de réactif. 
Puisque: 
À,H, =A,U, +A,vRT =A,U" +1.RT (56.49) 

il vient alors: 

A,U° = 148 [&7 moi !] (56.50) 


C'est donc la part d'énergie interne absorbée par le système sur les 156 [&7. moi] . Le reste 
(différence) étant juste passé dans la poussée de l'atmosphère environnante du réacteur chimique. 
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2.1.1. RELATION ENTHALPIQUE DE KIRCHHOFF 


La relation enthalpique de Kirchhoff permet d'exprimer les variations de l'enthalpie de réaction 
(molaire ou non) en fonction de la température à partir de la connaissance de la capacité calorifique à 
pression constante des réactifs gazeux. 


Nous avons donc défini dans les développements précédents la relation: 


+ 


dH 
H'=  Hy = 7 (5651) 
À, 2 iv dË 


qui est donc l'enthalpie de réaction standard à une température donnée dans un système à la pression 
standard. 


Nous avions également mentionné que À, était pour rappel une notation un peu malheureuse pour 
l'opérateur différentiel (de Lewis) d'avancement de la réaction 4 /dé. 


Si nous nous intéressons à l'influence de la température T sur À, Æ° nous n'avons qu'à écrire la 


différentielle exacte: 


puisque la variation algébrique de l'enthalpie standard par définition ne dépend que de la température. 


Les coefficients stoechiométriques v, ne sont pas dépendants de la température tant que cette dernière 
n'arrive pas à un niveau tel qu'elle change l'essence même de la transformation étudiée. 


Nous avons alors dans le cadre de cette approximation: 


aT  aTlé 


Or, nous avons défini dans le chapitre de Thermodynamique la capacité calorique à pression constante 
qui s'écrit: 


Donc si les conditions sont standards (l'enthalpie de dépend donc plus que de la température), il vient la 
différentielle exacte: 


Nous avons alors: 
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d|ÀA, H° aie _ 
A LT RAT = À,C? (56.56) 


Nous pouvons bien évidemment intégrer cette dernière relation pour avoir sa forme commune 
d'utilisation dans la pratique: 


ala,x)=fa,csar (56.57) 
F 


Ce ne Mr | 


Nous avons alors: 


T 
A,H°{(T)= 4, H°(To)+ [ A,ChaT 
ï 


où 7, est une température particulière pour laquelle À, °(Z) est connu. 


Dans un domaine de température très proche de 7; les chimistes approximent parfois la variation 
comme étant linéaire. Ce qui revient à poser: 


A,CS =@ (56.58) 


Il vient alors immédiatement de la relation antéprécédente: 


T 
A,H°(T)=A4,H°(T)+af 47 = A, H°(T)+a(T-T) (56:59) 
à 


Remarque: Assez souvent, la variation de l'enthalpie de réaction avec la température est 
négligeable! 


Exemple: 


Pour la réaction (graphite + oxygène donnant du dioxyde de carbone) nous aimerions connaître A, 4° 
à 1'000 [K]: 


C'+0; CO (56.60) 
Pour cela, il est donné dans les tables pour cette réaction à 298 [K]: 
A,1,(298)= 393.5 [& moi] (56.61) 
et: 


cpe=85[J KT -moi”] cha = 294[J KT. moi] ch co, = 37.1[J KT omon] (56.62) 
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Remarque: Lorsque l'enthalpie de réaction est donnée à la température de référence (à ce jour...) de 
298 [K1 les chimistes parlent alors comme nous en avons déjà fait mention plus haut "d'enthalpie 
standard de formation". 


La valeur de l'enthalpie molaire de réaction étant négative, il s'ensuit que la réaction est exothermique 
(c'est une tendance de la nature à basse température de privilégier les réactions exothermiques pour 
stabiliser énergétiquement le système). 


Nous avons alors immédiatement: 


J 
A, (T)= 4,4 (T)+ [ A,c5aT = AH, (To)+ 
Z 


© ° o 
(he “EPA FRE )aT 


DT ms, ?-3 


T 
= AH, (T)+(chc -cha -chco,)[éT 


û 
= À, A, (To) +(e —CPa CPC NT -%) 
= -393500 +(37.1- 8.5- 29.4). (1'000 — 298) 
= 394 060 [J: moi |] 


(56.63) 


Donc la variation est de -560 [J. moi] soit une variation d'environ +0.1%. Il s'ensuit que plus la 


température augmente, plus la réaction est exothermique. Au fait, le choix de cette température 
particulière de 1'000 [K] n'est pas innocent car à partir de cette température l'expérience montre que la 
réaction produit également du monoxyde de carbone. 


Nous pouvons aussi conclure que certaines réactions exothermiques et ayant une enthalpie de réaction 
qui diminue très vite avec la température peuvent s'emballer! 


Enfin, indiquons que dans la pratique nous utilisons souvent la notion de "pouvoir calorifique" ou 
"énergie spécifique de combustion", qui est au fait simplement. l'enthalpie de réaction par unité de 
masse de combustible ou l'énergie obtenue par la combustion d'un kilogramme de combustible. 


Ainsi, pour l'essence, nous avons selon les tables (sous réserve que ce chiffre soit juste): 
A, H° (298)=-47.3 [247 . kg !] (56.64) 


Et nous pouvons nous amuser à calculer la quantité d'essence nécessaire pour accélérer une voiture de 
1'000 [kg] à 100 [km/h] avec un rendement à 35%. Nous avons donc: 


2 
— AV 3 Je 
? _ 392.10 = 9367 [g] (56.65) 


| A,H°(298).m 473.105 .35% 


et pour obtenir la quantité d'essence en litres les tables nous donnent pour l'essence une densité 
d'environ 700 [#g-#°] ce qui donne au final: 
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L= OO 1000=0033[Z] (56.66) 
700 
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Notes personnelles: 
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Informatique 


théorique 


57. MÉTHODES (ANALYSES) NUMÉRIQUES 


LE numérique est une discipline des mathématiques. Elle s'intéresse tant aux fondements 


théoriques qu'à la mise en pratique des méthodes permettant de résoudre, par des calculs purement 
numériques, des problèmes d'analyse mathématique. 


Définition: "L'analyse numérique" est l'étude des algorithmes permettant de résoudre les problèmes de 
mathématiques continues (distinguées des mathématiques discrètes). 


Cela signifie qu'elle s'occupe principalement de répondre numériquement à des questions à variable réelle 
ou complexe comme l'algèbre linéaire numérique sur les champs réels ou complexes, la recherche de 
solutions numériques d'équations différentielles et d'autres problèmes liés survenant dans les sciences 
physiques et l'ingénierie. 


Certains problèmes de mathématique continue peuvent être résolus de façon exacte par un algorithme. Ces 
algorithmes sont appelés alors "méthodes directes". Des exemples sont l'élimination de Gauss-Jordan pour 
la résolution d'un système d'équations linéaires et l'algorithme du simplexe en programmation linéaire 
(voir plus loin). 


Cependant, pour certains problèmes aucune méthode directe n'est connue (et il est même démontré que 
pour une classe de problèmes dits "NP complets", il n'existe aucun algorithme fini de calcul direct en 
temps polynomial). Dans de tels cas, il est parfois possible d'utiliser une méthode itérative pour tenter de 
déterminer une approximation de la solution. Une telle méthode démarre à partir d'une valeur devinée ou 
estimée grossièrement et trouve des approximations successives qui devraient converger vers la solution 
sous certaines conditions. Même quand une méthode directe existe cependant, une méthode itérative peut 
être préférable car elle est souvent plus efficace et même souvent plus stable (notamment elle permet le 
plus souvent de corriger des erreurs mineures dans les calculs intermédiaires). 


L'utilisation de l'analyse numérique est grandement facilitée par les ordinateurs. L'accroissement de la 
disponibilité et de la puissance des ordinateurs depuis la seconde moitié du 20ème siècle a permis 
l'application de l'analyse numérique dans de nombreux domaines scientifiques, techniques et 
économiques, avec souvent des effets révolutionnaires. 


Lors de simulations numériques de systèmes physiques, les conditions initiales sont très importantes dans 
la résolution d'équations différentielles (voir les différents chapitres du site ou apparaissent des effets 
chaotiques). Le fait que nous ne puissions les connaître avec exactitude implique que les résultats des 
calculs ne peuvent jamais être parfaitement exacts (nous le savons très bien pour la météo qui en est 
l'exemple connu le plus flagrant). Cet effet est une conséquence des résultats de la physique fondamentale 
(basée sur des mathématiques pures) qui démontre que l'on ne peut connaître parfaitement un système en 
y effectuant des mesures puisqu'elles perturbent directement ce dernier (principe d'incertitude de 
Heïisenberg) et ces perturbations font l'objet de la théorie du Chaos (classique ou quantique). 
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Avec les nouveaux outils informatiques à disposition en ce début de 21ème siècle, il est devenu pratique 
et passionnant de connaître les méthodes numériques afin de s'amuser avec certains logiciels (OpenGL, 
3D Studio Max, Maple, Matlab, Mathematica, Comsol, etc.) à simuler des systèmes physiques sous forme 
graphique 2D ou 3D. 


Remarques: 


R1. Beaucoup de méthodes numériques utilisées en informatique se basent sur des raisonnements qui 
ont déjà été étudiés dans d'autres sections de ce site, méthodes sur lesquelles nous ne reviendrons pas. 


R2. Ce chapitre étant à la limite entre l'ingénierie et la mathématique appliquée, nous avons décidé de 
donner parfois des exemples d'applications des outils développés. 


Définition: Un "algorithme" est une suite finie de règles à appliquer dans un ordre déterminé à un nombre 
fini de données pour arriver, en un nombre fini d'étapes (dont la quantité, ou réciproquement le temps 
d'exécution est définie par le terme "coût"), à un certain résultat, et cela indépendamment du type de 
données. 


Les algorithmes sont intégrés dans des calculateurs par l'intermédiaire de "programmes". 


Définition: Un "programme" est la réalisation (l'implémentation) d'un algorithme au moyen d'un langage 
donné (sur une architecture donnée). Il s'agit de la mise en oeuvre du principe. 


Axiomes de la programmation (anecdotiques): 
A1. Plus nous écrivons de code, plus nous produirons d'erreurs. 


A2. Il n'existe pas de programmes sans de possibles erreurs (dues au programme lui-même, à 
l'électronique sous-jacente ou le plus souvent à l'utilisateur même). 


Basiquement voici la démarche minimale à suivre lors du développement d'un produit informatique (au 
niveau du code): 


M1. Auditer les besoins présents et anticiper les besoins futurs. 
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M2. Définir les objectifs. 


M3. Calculer la faisabilité, le risque d'erreur, la durée nécessaire au développement. 
MA. Créer les algorithmes en langage formel (cela comprend la gestion des erreurs!). 
M5. Optimiser la complexité et contrôler les algorithmes. 


M&6. Choisir une stratégie de développement (modulable ou autre). 


M7. Traduire les algorithmes dans la technologie choisie (ce choix est un sujet assez sensible….). 


Remarque: Il faudrait dans l'étape (7) veiller à respecter les normes de nommage et de représentation 
du code ainsi que des conventions (traditions) de fréquence d'insertion des commentaires. 


M8. Tests (maintenance préventive) 


Remarque: Le débogage (la gestion des erreurs) d'un programme et les tests de fonctionnement 
doivent prendre autant, voire plus, de temps que le développement du programme lui-même. 


Lors du développement d'un programme scientifique, il peut être intéressant, voire même rigoureux de 
s'attarder sur la notion de "complexité" de ce dernier. Sans aller trop loin, voyons un peu de quoi il s'agit: 


1. COMPLEXITÉ 


La complexité d'un algorithme est la mesure du nombre d'opérations fondamentales qu'il effectue dans le 
pire des cas sur un jeu de données. La complexité est donc exprimée comme une fonction de la taille du 
jeu de données. 


Les hypothèses permettant un calcul de cette complexité sont: 
H1.+=#*=-2=- (les quatre opérations fondamentales ont le même coût) 
H2. Un accès mémoire # une opération arithmétique 

H3. Un contrôle de comparaison une opération arithmétique 

H4. Un seul processeur 


Nous notons 2, l'ensemble des données de taille n et T{n) le coût (en temps) de l'algorithme sur la donnée 
ou le jeu de données de taille n. 


- La "complexité au meilleur" est donnée par la fonction: 


Tan Cr) = minsen C(a) 


C'est le plus petit temps qu'aura à exécuter l'algorithme sur un jeu de données (des lignes de code) de taille 
fixée, ici à n, dont le coût (la durée) d'exécution est C(d). C'est une borne inférieure de la complexité de 
l'algorithme sur un jeu de données de taille n. 
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- La "complexité au pire" (la plus intéressante pour le praticien): 


Faute) = max;.n, C(d) 


C'est le plus grand temps qu'aura à exécuter l'algorithme sur un jeu de données de taille fixée, ici à n. Il 
s'agit donc d'un maximum, et l'algorithme finira toujours avant d'avoir effectué 7, (#) opérations. 
Cependant, cette complexité peut ne pas refléter le comportement usuel de l'algorithme, le pire cas ne 
pouvant se produire que très rarement, mais il n'est pas rare que le cas moyen soit quasi aussi mauvais que 
le pire des cas. 


Si l'expression de la complexité au pire d'un algorithme contient plusieurs termes (additions ou 
soustractions), on ne garde que le terme qui croît le plus vite. Ainsi, un algorithme ayant une complexité 
du type: 


An + En +al 


se résumera à avoir une complexité d'ordre ©i#li. 


- La "complexité moyenne": 


Ÿ C{a) 


Il s'agit de la moyenne des complexités de l'algorithme sur des jeux de données de taille n (en toute 
rigueur, il faut bien évidemment tenir compte de la probabilité d'apparition de chacun des jeux de 
données). Cette moyenne reflète le comportement général de l'algorithme si les cas extrêmes sont rares ou 
si la complexité varie peu en fonction des données. Cependant, la complexité en pratique sur un jeu de 
données particulier peut être nettement plus importante que la complexité moyenne; dans ce cas la 
complexité moyenne ne donnera pas une bonne indication du comportement de l'algorithme. 


En pratique, nous ne nous intéressons qu'à la complexité au pire, et à la complexité moyenne. 


Définition: Un algorithme est dit "algorithme optimal" si sa complexité est de complexité minimale parmi 
les algorithmes de sa classe. 


Comme nous l'avons fait sous-entendre précédemment, nous nous intéressons quasi exclusivement à la 
complexité en temps des algorithmes. Il est parfois intéressant de s'intéresser à d'autres de leurs 
caractéristiques, comme la complexité en espace (taille de l'espace mémoire utilisé), la largeur de bande 
passante requise, etc. 


Pour que le résultat de l'analyse d'un algorithme soit pertinent, il faut avoir un modèle de la machine sur 
laquelle l'algorithme sera implémenté (sous forme de programme). Nous prenons habituellement comme 
référence, la "machine à accès aléatoire (RAM)" et à processeur unique, où les instructions sont exécutées 
l'une après l'autre, sans opérations simultanées et sans processus stochastiques (contrairement aux 
possibles machines quantiques futures). 


Les algorithmes usuels peuvent être classés en un certain nombre de grandes classes de complexité dont 
l'ordre © varie d'une certaine manière: 
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- Les algorithmes sublinéaires dont la complexité est en général de l'ordre O(log(n)) 


- Les algorithmes linéaires en complexité O(n) et ceux en complexité en O(n log{(n)) sont considérés 
comme rapides. 


- Les algorithmes polynomiaux en O(n*) pour & > 3 sont considérés comme lents, sans parler des 
algorithmes exponentiels (dont la complexité est supérieure à tout en n) que l'on s'accorde à dire 
impraticables dès que la taille des données est supérieure à quelques dizaines d'unités. 


Remarque: Une bonne complexité est du type O(nf) pour # < 3. Une mauvaise complexité est du type 
O(e*],0 (xl) ou O(x#"). 


Exemples: 
E1. Évaluation d'un polynôme: 
P(x)=aptaxtax +..+ax" (575) 


L'évaluation directe de la valeur de P(x) conduit à une complexité 


Cr) = 0 (x) 


aiens 


+ 12+38.+(re0 ED) = Of») (57.6) 


MudpEcaons 


Nous devons à Horner un algorithme plus performant qui utilise une factorisation du polynôme sous la 
forme: 


P(x) = ap +xl4 +xlas +... x(a, +xa, | G7.7) 


Nous pouvons facilement montrer que cette factorisation maintient le même nombre d'additions (*) mais 


réduit le nombre de multiplications à (n). La complexité qui en découle est donc O(n). Le gain est 
incontestablement important. De plus, cette factorisation évite tout calcul de puissance. 


E2. Un autre exemple connu de complexité algorithmique est la recherche d'une information dans une 
colonne triée. Un algorithme simple appelé "recherche dichotomique" consiste à prendre la cellule située 
à mi-colonne et de voir si nous y trouvons la valeur recherchée. Sinon, la recherche doit continuer sur le 
même mode opératoire dans la partie supérieure ou inférieure du tableau (cela dépend de l'ordre 
lexicographique). 


L'algorithme est récursif et permet à chaque étape, de diviser par deux, la taille de l'espace de recherche. 
Si cette taille, initialement, est de n cellules dans la colonne, elle est de n/2 à l'étape 1, #/ 22 à l'étape 2, et 


plus généralement de }# / 2* à l'étape k. 


Au pire, la recherche se termine quand il n'y a plus qu'une seule cellule de la colonne à explorer, 
autrement dit quand k est tel que # < 2*. Nous en déduisons le nombre maximal d'étapes: c'est le plus 
petit k tel que # < 2*, soit log: (x) <&, soit: 


Tax (2) = k=log(#) (578) 
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à comparer avec une recherche séquentielle (utile lorsque le tri est trop coûteux en ressources). Par 
exemple, dans une colonne de 25'000 données dont la complexité linéaire est O(n) soit 25'000 alors 
qu'avec la méthode dichotomique, nous avons une complexité sublinéaire 10g; (25000) = 15. Le gain est 


donc considérable (à condition que les données soient triées)! 


E3. Soient A et B deux matrices carrées de dimension n. Les principales opérations sur ces matrices ont 
des ordres de complexité suivants (nous laisserons le soin au lecteur de vérifier car c'est vraiment trivial): 


- Lecture (itérations): O(n°) 


* 
- Calcul de la trace: # (4) = Sa, — O(x) 


il 


_ . 2 
- Addition: 4+ 8 = C telle que €; =&, +, — Of» ) 


x 
- Multiplication: 4.8 = C' telle que c; = XX “b —> O(x°) 
1 


- Déterminant (par la méthode directe de Cramer). Nous renvoyons le lecteur au chapitre d'Algèbre 
Linéaire pour le détail des méthodes de calcul du déterminant d'une matrice. Nous pouvons alors montrer 
que la complexité d'un déterminant d'ordre n est n multiplications, n-1 additions plus n fois la complexité 
d'un déterminant d'ordre n-1. Par cumul, nous arrivons à: 


det (4) — O(x'#l) (579) 


En faisant l'hypothèse que l'ordinateur utilisé effectue une opération élémentaire en 10° secondes (ce qui 
est déjà une bonne machine), nous obtenons alors les temps de calculs suivants pour plusieurs valeurs de 
n: 


4.8 10 [axs] 


Tableau: 57.1 - Temps de calcul d'un déterminant 


d'où la nécessité de faire un calcul de complexité avant de mettre l'algorithme en route (à moins que vous 
ne travailliez exclusivement pour les générations futures, à condition qu'il y en ait encore...). 


Finalement, pour résumer un peu, nous distinguons quelques types de complexités classiques: O(1) 
indépendant de la taille de la donnée, O(log{(n)) complexité logarithmique, O(n) complexité linéaire, O(n 
log(n)) complexité quasi-linéaire, O(n°) complexité quadratique, O(n) complexité cubique, O(k”) 
complexité exponentielle, O(n!) complexité factorielle. 


1.1. NP-COMPLÉTUDE 


Nous allons introduire pour la culture générale le concept de NP-complétude, c'est-à-dire que nous allons 
tenter de définir sans trop de formalisme (comme à l'habitude) la classe des problèmes dit "NP-complets". 
Ces problèmes sont ceux pour lesquels personne à l'heure actuelle ne connaît d'algorithme efficace (i.e. 
seulement des algorithmes exponentiels). Ce sont des problèmes vraiment difficiles par opposition à ceux 
pour lesquels nous connaissons des algorithmes de complexité polynomiale. 
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Définitions: 


D1. Les problèmes de "classe P" sont de bons problèmes dans le sens où le calcul de leur solution est 
faisable dans un temps raisonnable avec un algorithme à complexité polynomiale. Plus formellement, ce 
sont les problèmes pour lesquels nous pouvons construire une machine déterministe (voir la remarque 
après les définitions) dont le temps d'exécution est de complexité polynomiale (le sigle "P" signifiant 
"Polynomial Time”). 


D2. Les problèmes de "classe E" sont des problèmes dans le sens où le calcul de leur solution est faisable 
dans un temps exponentiel par nature du type &*. Plus formellement, ce sont les problèmes pour lesquels 
nous pouvons construire une machine déterministe dont le temps d'exécution est de complexité 
exponentielle (le sigle "E" signifiant "Exponential Time”). 


D3. Les problèmes de la "classe NP" sont ceux pour lesquels nous pouvons construire une machine de 
Turing non déterministe (voir la remarque après les définitions) dont le temps d'exécution est de 
complexité polynomiale (le sigle "NP" provient de "Nondeterministic Polynomial time" et non de "Non 
Polynomial"). 


Remarque: Contrairement aux machines déterministes qui exécutent une séquence d'instructions bien 
déterminée, les machines non déterministes ont la remarquable capacité de toujours choisir la 
meilleure séquence d'instructions qui mène à la bonne réponse lorsque celle-ci existe. Il va sans dire 
qu'une telle machine ne peut pas exister autrement que dans l'esprit d'un théoricien (à moins qu'avec 
les ordinateurs quantiques..)! Néanmoins, comme nous le verrons par la suite, ce concept abstrait n'est 
pas sans intérêt et constitue en fait la base de toute la théorie de la NP-complétude. 


Il importe de remarquer à ce stade de la discussion que la classe P est incluse dans la classe NP, nous 
écrivons P € WP, car si nous pouvons construire une machine déterministe pour résoudre efficacement 
(en un temps au pire polynomial) un problème, nous pouvons certainement (du moins dans notre esprit) en 
construire une non déterministe qui résout aussi efficacement le même problème. Par ailleurs, il ne faut 
pas croire que ce concept de divination optimale qu'est la machine non déterministe permet de tout 
résoudre puisqu'il existe en informatique théorique d'autres types de problèmes n'appartenant pas à la 
classe NP qui sont les problèmes indécidables. 


Pour savoir si un problème donné appartient ou non à la classe NP, il s'agit simplement de l'exprimer sous 
une forme dont la réponse est soit OUI, soit NON. Le problème appartient alors à la classe NP si par 
définition, nous arrivons à démontrer à l'aide d'un algorithme de complexité polynomiale que n'importe 
quelle instance OUI du problème est bel et bien correcte. Nous n'avons pas à nous préoccuper des 
instances NON du problème puisque la machine non déterministe, par définition, prend toujours la bonne 
décision (lorsque celle-ci existe). 


Par exemple, le problème consistant à trouver un cycle hamiltonien (cycle qui passe une et une seule fois 
par tous les sommets du graphe - voir chapitre de Théorie Des Graphes) dans un graphe appartient à NP 
puisque, étant donné un cycle, il est trivial de vérifier en temps linéaire qu'il contient bien une et une seule 
fois chaque sommet. 
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Un autre exemple de problème difficile des mathématiques est la factorisation d'un entier en produit de 
facteurs premiers. Nous ne savons pas à ce jour s'il existe un algorithme polynomial qui puisse réussir 
cette opération. Autrement dit, nous ne savons pas si ce problème est dans P. En revanche, étant donnés 
des nombres premiers »,,...,p, il est trivial de vérifier que # = ?,...p.,: ce problème est donc dans NP. Il 


semblerait (nous n'avons pas vérifié ce résultat et ni la possibilité de le faire) que la complexité du 
meilleur algorithme de factorisation en nombres premiers soit du type: 


4 exp [Sr | (log (108 e"] 


il resterait donc du travail à faire (si un internaute pouvait nous fournir les détails qui ont amené à ce 
résultat, nous sommes preneurs). 


Remarque: Si un problème est dans NP, alors il existera un algorithme en temps exponentiel pour le 
résoudre mais le contraire n'est pas toujours vrai (il faut donc être prudent). 


Parmi l'ensemble des problèmes NP, il en existe un sous-ensemble qui contient les problèmes les plus 
difficiles: nous les appelons les problèmes "NP-complet" (N.P.C.). Ainsi, un problème NP-complet 
possède la propriété que tout problème dans NP peut être transformé en celui-ci en un temps polynomial. 


La raison essentielle pour laquelle les problèmes NPC sont les plus difficiles parmi les problèmes de NP 
est que ces premiers peuvent toujours servir comme des sous-routines pour solutionner ces derniers. Cette 
réduction à une ou des sous-routines est assez facilement faisable puisque réalisable, si elle existe, en un 
temps polynomial. Un problème NPC est donc complet en ce sens qu'il contient l'essentiel de la 
complexité des problèmes appartenant à NP, et qu'une solution polynomiale à ce problème implique une 
solution polynomiale à tous les problèmes NP. 


Autrement formulé, les problèmes NPC ont une complexité exponentielle et ils ont tous la même classe de 
complexité (modulo les polynômes). 


Finalement, ce qu'il importe de bien comprendre et de retenir de toute cette théorie, son idée maîtresse, est 
que si nous trouvons un jour un algorithme de complexité polynomiale pour un seul de ces problèmes 
vraiment difficiles que sont les problèmes NPC, alors d'un seul coup NP devient égal à P et tous les 
problèmes difficiles deviennent faciles! 


Pour résumer, être dans P, c'est trouver une solution en un temps polynomial, tandis qu'être dans NP, c'est 
prouver en un temps polynomial qu'une proposition de réponse est une solution du problème. Ainsi, tout 
problème qui est dans P se trouve dans NP. Un champ de recherche majeur des mathématiques actuelles 
est l'investigation de la réciproque: et donc finalement a-t-on P-NP? Autrement dit, peut-on trouver en un 
temps polynomial ce que l'on peut prouver en temps polynomial? 


Remarque: Ce problème est si important en informatique qu'il fait partie (arbitrairement) des 7 
problèmes du millénaire, dont la résolution est primée 1 million de dollars par le Clay Mathematic 
Institute. 
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Passons maintenant à l'étude de quelques applications types des méthodes numériques dont il est très 
souvent fait usage dans l'industrie. Nous irons du plus simple au plus compliqué et sans oublier que 
beaucoup de méthodes ne se trouvant pas dans ce chapitre peuvent parfois être trouvées dans d'autres 
sections du site! 


2. PARTIE ENTIÈRE 


Le plus grand entier inférieur ou égal à un nombre réel x est exprimé par [x], qui se lit "partie entière de 


A 


Ainsi, le nombre M est entier si et seulement si [M]-M. De même, le naturel À est divisible dans 
l'ensemble des naturels par le naturel B si et seulement si: 


AA 
B B (57.11) 


Nous notons aussi {x} pour désigner la partie fractionnaire de x. Nous avons ainsi: 
{x}=x-[x] (6712) 
Soit x,y € R. Alors nous avons les propriétés suivantes: 


P1.[x]£x <[x]+1,0£<x-[x]<1, x =[x]+8 où 0<8<1 
p2. [x] = 2 1, lorsque x20 


P3.[x+m]=[x]+tm,simez 
P4. [x]+[y] £[x+y]£[x]+{y]+1 


P5.[-x]= {xl si x EZ,[-x]= {x]-l si x 6Z 


[x] x |. 
P6I—|=|—-|simenN 

ma ma 
P7.Siae N, alors [x/ a] représente le nombre d'entiers positifs inférieurs ou égaux à x qui sont divisibles 
par a. 


Démonstrations: 


La première partie de P1 est simplement la définition de [x] sous forme algébrique. Les deux autres parties 
sont des réarrangements de la première partie. Dans ce cas, nous pouvons écrire 


x=[x]+8 (5713) 
où0<8a<]I. 


Pour P2, la somme est vide (ne contient aucun terme autrement dit) pour x < 1 et, dans ce cas, on adopte 
la convention selon laquelle la somme vaut 0. Alors, pour x > 1, la somme compte le nombre d'entiers 
positifs n qui sont plus petits ou égaux à x. Ce nombre est évidemment [x]. 
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La démonstration de P3 sera supposée évidente. 


Pour prouver P4, nous écrivons: 
x=n+8,)=m+t# (5714) 
où net m sont des entiers et où 0 £ 8 1 et Ü £ #< 1. Alors: 


Cal + LT = #2 +0 = [a+ ve] £ [x + + om + &] = [x + y] 


=n+m+[8+fintmtl=[x]+{y]+] oo 
En écrivant x = # + 9, où 0 £ 8 < 1, nous avons 
-x=-n#2-1+1-8 (5716) 
où0<1-8<1. 
Il s'ensuit que: 
ÉIEl eatl-1ti- lea a PIS TED Gi) 


si 4 =0 et: 


[x]+[-x]=2+[-n-1+1-8]=2-#-1+[1-8]=-1 


si 0 < 8 < 1. Et nous obtenons du même coup la démonstration P5. 
Pour démontrer P6, nous écrivons: 

x=[x]+8 (57.18) 
où0<8g<1,et: 

#=gmtr (5719) 


où Ô £r < »# — 1. Nous obtenons ainsi: 


Ë je] [=] 
—| = |=3+ =g (57.20) 
mi mi mi 


puisque 0 £r +8 £». Par ailleurs: 
—|=|—-|=1g+—|=g (6721 
mi mm LA 


Pour la dernière partie, nous observons que, si &,24,...,#4 sont tous les entiers positifs £ x qui sont 
divisibles par a, il suffit de prouver que [x/a] = #?. Puisque (#2 +1l)a > x, alors: 


et nous avons ainsi le résultat. 


ma£x<(m+la (57.22) 
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c'est-à-dire: 


soit le résultat attendu. 


OIC.Q.F.D. 


Remarque: La méthode d'arrondi de valeurs réelles est donnée dans le chapitre d'Économie. 


3. ALGORITHME D'HÉRON 
Soit à calculer la racine carrée: 


x=4A (6724 


Il existe un algorithme dit "algorithme d'Héron" ou encore "algorithme d'Héron d'Alexandrie" qui permet 
de calculer la valeur de cette racine carrée. 


Démonstration: 


Voici une pseudo-démonstration car historiquement l'algorithme a été construit sur des considérations 
purement intuitives (car 100 ans avant J.C. l'algèbre n'existait pas). Dans les classes le résultat est donné 
en tant que définition et on en étudie la convergence. 


Donc pour la démonstration, nous procéderons ainsi: 


= 2x = 2 + A 
= 2x =(x + A4)/x 
= x= (x + 4)/(2x) = (x+ A/x)/2 


ns 
(ex. 
NI 
N2 
1 
— 


Et l'astuce consiste à poser que: 


où il faut prendre comme valeur initiale x = À (ce qui évidemment est en totale contradiction avec les 


développements mais l'on voit alors mieux pourquoi c'est une pseudo-démonstration.…). 

OC.Q.F.D. 
Exemple: 
Soit à calculer: 


10 =3.162277660168.. (57.27) 
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Nous prendrons donc À = 10 et cela nous donne le tableau d'itérations suivant: 


5 Ces | 160 | 39600508 | 003 | 
a Dasomo | id | 3164562 | 00007. 


rs | 1.58122 1.5810 3.162 277 665  |<05 108 


Tableau: 57.2 - Itérations pour l'algorithme d'Héron 


Dans le cas de la racine cubique, la démonstration est semblable et nous obtenons: 
2x; . A 
ml t—). 672) 
i+l 3 3x 
Signalons encore que le lecteur pourra trouver dans le chapitre de Théorie des Nombres la méthode 
utilisée pendant l'antiquité (du moins une analogie) et utilisant les fractions continues. 


4. ALGORITHME D'ARCHIMÈDE 


Le calcul de la constante universelle "pi" notée # est très certainement le plus grand intérêt de 
l'algorithmique puisque l'on retrouve cette constante un peu partout en physique et mathématique (nous 
pouvons vous conseiller un très bon ouvrage sur le sujet). 


Nous rappelons que nous n'en avons pas donné la valeur ni en géométrie, ni dans les autres sections de ce 
site jusqu'à maintenant. Nous allons donc nous atteler à cette tâche. 


Nous définissons en géométrie le nombre # dit "pi", quel que soit le système métrique utilisé (ce qui fait 
son universalité), comme le rapport de la moitié du périmètre d'un cercle par son rayon tel que: 


Z=—| (57.29) 
AR 


Nous devons le premier algorithme du calcul de cette constante à Archimède (287-212 av. J.-C.) dont 
voici la démonstration. 


Démonstration: 


Soit un n-polygone inscrit dans un cercle: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


PACS 
b 


br 


Figure: 57.1 - Principe illustré de l'algorithme d'Archimède 


Le principe de l'algorithme d'Archimède est le suivant: Soit Æ, le périmètre d'un polygone régulier de n 
côtés inscrit dans un cercle de rayon 1/2. Archimède arrive à montrer par induction que: 


RE DR HD rer (57.30) 
#0 2 
Nous avons pour le périmètre d'un n-polygone: 
| 1. {271 1.{(x 2 
m7 Rsnær sn (Er) 2%) et (au) ui + 4 6730 

Avec: 

1 1 

A=R-Rcos&=—-—cos : (57.32) 
2 2 # 


Donc: 


caf to 2 
PRÉ PRO RN CRIE 


- [7] = (1-47) 
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Il suffit d'un ordinateur ensuite et de plusieurs itérations pour évaluer avec une bonne précision la valeur 
de #7. Evidemment, on utilise l'algorithme d'Héron pour calculer la racine... 


COIC.Q.F.D. 


Remarque: Il existe un très grand nombre d'algorithmes pour calculer Æ. Celui présenté ci-dessus, 
sans être le plus esthétique, serait historiquement le premier. 


5. CALCUL DU NOMBRE D'EULER 


Hors la constante #,, il existe d'autres constantes mathématiques importantes qu'il faut pouvoir générer à 
l'ordinateur (de nos jours les valeurs constantes sont stockées telles quelles et ne sont plus recalculées 
systématiquement). Parmi celles-ci, se trouve le "nombre d'Euler" noté e (cf. chapitre d'Analyse 
Fonctionnelle)., Voyons comment calculer ce nombre: 


Soit la série de Taylor (cf. chapitre sur les Suites Et Séries), pour une fonction indéfiniment dérivable 
f donnée par: 


Jals 0 (57.34) 


5 du" on! 


Comme (cf. chapitre de Calcul Différentiel Et Intégral): 


d”(e") (57.35) 
du” 
nous avons: 
ï LI u* d* 8 u* 
jure So -S Do D 6736 
2 à CET #0 #! #l 


Donc en résumé: 


Cette relation donne un algorithme pour calculer l'exponentielle £* à un ordre n donné de précision. 


Remarque: Pour diminuer la complexité de cet algorithme, la factorielle peut être calculée avec la 
formule exposée ci-après. 


6. CALCUL DE LA FACTORIELLE (FORMULE DE STIRLING 


Évidemment, la factorielle pourrait être calculée avec une simple itération. Cependant, ce genre de 
méthode génère un algorithme à complexité exponentielle ce qui n'est pas le mieux. Il existe alors une 
autre méthode: 


Soit, la définition de la factorielle: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


n\=x(2- Dr -2)..1 (5738) 


Et d'après les propriétés des logarithmes: 


Infrl) = S'n) (57.29) 
Me] 


Si nest très grand (mais alors très...) alors: 
# 
1 


In(x1) = fran = (in(r) -m)[ (5740) 


Lorsque x > 1, la limite inférieure est négligeable et alors (approximation qui nous est très utile dans le 
chapitre de Mécanique Statistique): 


In(xl) = 2in@)-2 = 721 = 6" (6741) 


Après une petite simplification élémentaire, nous obtenons: 


Cette dernière relation est utile si l'on suppose bien évidemment que la constante d'Euler est une valeur 
stockée dans la machine. 


7. SYSTÈMES D'ÉQUATIONS LINÉAIRES 


Il existe de nombreuses méthodes de résolution de systèmes d'équations linéaires. La plupart d'entre elles 
ont été mises au point pour traiter des systèmes particuliers. Nous en étudierons une, appelée la "méthode 
de réduction de Gauss" ou "pivot de Gauss", qui est bien adaptée à la résolution des petits systèmes 
d'équations (jusqu'à 50 inconnues). 


Remarques: 


R1. La validité de certaines des opérations que nous allons effectuer ici pour résoudre les systèmes 
linéaires se démontre dans le chapitre traitant de l'Algèbre Linéaire. Au fait, pour être bref, le tout fait 
appel à des espaces vectoriels dont les vecteurs-colonnes sont linéairement indépendants. 


R2. Les systèmes admettent une solution si et seulement si (rappel) le rang de la matrice augmentée 
est inférieur ou égal au nombre d'équations (cf. chapitre d'Algebre Linéaire). 


7.1. UNE ÉQUATION À UNE INCONNUE 
Considérons le cas le plus simple: celui d'une équation à une inconnue: 


ax =b (57.43) 


a et b sont les coefficients de l'équation et x en est l'inconnue. Résoudre cette équation, c'est déterminer 
x en fonction de a et b. Si a est différent de 0 alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


x=bia (57.44) 


est la solution de l'équation. Si a est nul et si b est différent de 0 alors l'équation n'admet pas de solution. 
Si a et b sont nuls, alors l'équation possède une infinité de solutions. 


7.2. DEUX ÉQUATIONS À DEUX INCONNUES 


Un système (linéaire) de deux équations à deux inconnues s'écrit: 


dit À 


ann + 49% © b 


du: y: .2 Sont les coefficients du système d'équations, zx, et x; en sont les inconnues. 


Remarque: Les notations usitées ci-dessus n'ont rien à voir avec le calcul tensoriel. 


Pour résoudre le système, nous procédons comme suit: 


À l'aide de manipulations algébriques (addition ou soustraction des différentes égalités entre elles - 
manipulations autorisées par l'indépendance linéaire des vecteurs-lignes) nous transformons le système en 
un autre donné par: 


dit À 
(57.46) 


. 1 = 
0'x ta 2% 2 


Ensuite, nous résolvons l'équation &';, x; = b',, ce qui donne: 


Nous en déduisons: 


(à — 43%) 


(a: 


X = (57.48) 


1l 


La transformation entre les deux systèmes: 


dite © À dritenX © À : 
L = | _,, (67.49) 
anA +42 © b 0x tax "bi 
s'effectue simplement en multipliant chaque coefficient de la première égalité par &;,/ 4, et en 
soustrayant les résultats obtenus des coefficients correspondants de la seconde égalité. Dans ce cas, 


AR Li 


l'élément &, est appelé "pivot". 
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7.3. TROIS ÉQUATIONS À TROIS INCONNUES 


Examinons encore le cas des systèmes de trois équations à trois inconnues: 


ann + 2% * 343 © à 
ann * 2% Ÿ@23%3 © bn (57.50) 


din + M9 + M3 © Ds 


Nous pouvons par la suite des opérations élémentaires (cf. chapitre d'Algebre Linéaire) réduire le système 
linéaire précédent en le système suivant: 


dnA + Go 6% à 
‘x ta" px te" 2% "D" (6751) 


: : " = 2! 
0x +0'zx tas x =b", 


et ensuite résoudre l'équation: 


puis la deuxième: 


. (Day 3) 


& 33 


(57.53) 


et enfin: 


- (à —4n7% — dp%) _ 
À = ————— (57.54) 
y 


Revenons à la transformation des systèmes. Elle s'effectue en deux étapes: 


1. Dans la première, nous choisissons &,, comme pivot et nous éliminons les coefficients &;, et &:, de la 
manière suivante: il faut multiplier chaque coefficient de la première égalité par &:, / &, et soustraire les 
résultats obtenus de la deuxième égalité, ainsi &;, devient nul. De même, en multipliant les coefficients de 
la première équation par &;, /&,, et en soustrayant les résultats obtenus de la troisième égalité, 


&3, disparaît. Le système d'équation s'écrivant alors: 


dnA +42 tax © à 
’ 1 1 . 1 EC 


’ 1 1 = 1 
dx ta px tarx b 


2. La deuxième étape consiste à traiter le système de deux équations à deux inconnues formé des 
deuxième et troisième égalités du système précédent, et ce, en choisissant 4, comme pivot. Cette 


méthode de résolution peut paraître compliquée, mais elle a l'avantage de pouvoir être généralisée et être 
appliquée à la résolution de systèmes de n équations à n inconnues. 
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7.4. N ÉQUATIONS À N INCONNUES 


Pour simplifier l'écriture, les coefficients seront toujours notés 4;; et non pas 4 ÿ.4"ÿ, etc. lors de chaque 
étape du calcul. 


Soit le système linéaire (nous pourrions très bien le représenter sous la forme d'une matrice augmentée 
afin d'alléger les écritures): 


AA alt. + dax © À 
An dpt. + 2x © D 

(57.56) 
D PR Tarn FR 


Il faut choisir &, comme pivot pour éliminer &:,,43.,..,4,,. Ensuite, l'élimination de 
33, dy, …, 2 S'effectue en prenant 4, comme pivot. Le dernier pivot à considérer est bien évidemment 


4-1», il permet d'éliminer &,,,. Le système prend alors la forme: 


AA gt. + GaXx © 
d'x tax +... +a,x, “D 

(57.57) 
DE SL à DE 9 Rene Ta "0 


Et de résoudre d'abord la dernière équation, puis l'avant-dernière et ainsi de suite jusqu'à la première. 


Cette méthode, appelée "méthode de résolution de Gauss" ou encore “méthode du pivot" doit cependant 
être affinée pour éviter les pivots de valeur 0. L'astuce consiste à permuter l'ordre dans lequel sont écrites 
les équations pour choisir comme pivot le coefficient dont la valeur absolue est la plus grande. Aïnsi, dans 


la première colonne, le meilleur pivot est l'élément & ; tel que: 


aa] > la Vi (6758) 


Il est amené à &,, par échange des première et j-ème lignes. L'élimination du reste de la première colonne 
11 
peut alors être effectuée. Ensuite, on recommence avec les n-1 équations qui restent. 


8. POLYNÔMES 


L'ensemble des polynômes à coefficients réels a été étudié dans le chapitre d'Analyse Fonctionnelle en 
détails. Nous allons ici traiter de l'aspect numérique de quelques problèmes liés aux polynômes. 


Mises à part l'addition et la soustraction de polynômes que nous supposerons comme triviales 
(optimisation de la complexité mise à part comme le schéma de Horner), nous allons voir comment 
multiplier et diviser deux polynômes. 


Voyons d'abord comment multiplier deux polynômes: 
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Soient: 
JA) = a taxrtar +..+a,x 
(57.59) 
gi) =b+hx+bhx +..+b, 
alors: 
SG) 80) = ab + (aoh + bo) x + (aob2 + Gb + ab) x +. ee. 
À 
JR)'gx)=0© +cx+0x Le 
avec: 


k 
= Dabs (k=0,12...n+m) (5761) 


i=0 
C'était simple. 


Un tout petit peu plus difficile maintenant: la division euclidienne de polynômes (cf. chapitre de Calcul 
Algébrique). 


Reprenons: 


JG) = a taxtar +..+a,x" 


gr) =b+hx+ br +..+b,x" TS 

mais en imposant cette fois-ci # 2 #. 
La division s'écrira donc nous le savons: 

JG = gx) (x) + rx) (57.63) 
avec: 

deg(r(x)) < deg(g(x)) (57.64) 
ou sinon ”{x) = 0, 
Il est normalement connu d'avance (car démontré dans le chapitre de Calcul Algébrique) que nous avons: 

deg(g(x)) =2-m (57.65) 
et: 
degér(x)) < M (57.66) 


Nous avons donc par définition q(x) qui est le quotient de la division et r(x) le reste de la division 
euclidienne de f{x) par g(x). 


Rien ne nous interdit donc de poser de la manière la plus générale qui soit: 
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4x) = 0 Rx +. + um X 
Ml 


rt 


(57.67) 
rentrant. tr 1x 


Pour démontrer l'expression des différents 4; , nous avons préféré pour des raisons pédagogiques de 
passser par un exemple particulier (voir ci-dessous) dont nous généraliserons le résultat. 


Exemple: 
Soient: 


SG) = a +ax+ ax +a,x° +asx 


(57.68) 
80) = + x +bx 


donc de ce que nous avons dit précédemment, il vient (point de départ): 


(x) = Go + Ex + gx? 


(57.69) 
r(x)=rnt+tAx 


En utilisant le fait que (pour rappel): 
fx) = gix)g(x)+r(x) (5770) 
nous avons donc immédiatement: 


4 
3 
b, (57.71) 


(2) = (@3-Gh)r + (a -Gbo)x" +@x + ag = x + ex + x + 
Ensuite (toujours en procédant de façon identique): 


= 


g 
Se (57.72) 


(2 = (@ - Gh)x° + -Hb)x+e ca +cix+chx 
et enfin: 


do — = 
. b, (57.73) 
r302) = rx) = (ci Gh)x + (co Goo) =c'ix te 


Donc de manière générale: 


um (57.74) 


ai À 
be 
comme: 


JFG) 80040) +r@) & rx) = fG)-gG)e(@) (6775) 
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le premier reste est donc: 


n (2) = FR) — un EX) 
= (a —Gu-mbn)2" + (au ne) +(a,2 D T) 1 +. 
— 4 —— 


57.76) 


îi 
… x x] = #1 x-2 
e (és Yn-me Po ) x si CPR US Fu Ag  CyÀ LA Cy-2X +... + Co 
Ensuite: 
€, 
= “#-l 
Tu-w-1 (57.77) 
b 


Le deuxième reste est alors: 


F2) = A2) — Gu-m18(x) 


= . 2-1] … x-2 . X—3 
_ CA di nite ) x + (62 Tn-w-1bu- ) X + (css Tant le ) À +... 
———— 
0 
—" a] 1 x-2 1 3 ' 
+lc BA Fe a + Fee 47 os d +. te) 


am Law x 


etc. 
Nous continuons jusqu'à ce que deg(r; (x)) < #2. 


9. RÉGRESSIONS ET INTERPOLATIONS 


Les régressions (ou "interpolations") sont des outils très utiles aux statisticiens, ingénieurs, informaticiens 
souhaitant établir une loi de corrélation entre deux (ou plus) variables dans un contexte d'études et 
d'analyse ou d'extrapolation. 


Il existe un grand nombre de méthodes d'interpolation: de la simple résolution d'équations du premier 
degré (lorsque uniquement deux points d'une mesure sont connus) aux équations permettant d'obtenir à 
partir d'un grand nombre de points des informations essentielles à l'établissement d'une loi (ou fonction) de 
régression linéaire, polynomiale ou encore logistique. 


Listons les techniques les plus utilisées dans les entreprises et administrations (dont les modèles 
mathématiques ne sont pas tous présentés ici): 


- Modèle de régression linéaire à une ou plusieurs variables explicatives basé sur la méthode des moindres 
carrés avec variables explicatives binaires ou continues avec réponse réelle. Présenté en détails dans le 
présent chapitre. 


- Modèle de régression linéaire gaussien (approche statistique de la régression linéaire basée sur la 
méthode des moindres carrés) avec variables explicatives binaires ou continues avec réponse réelle. 
Présenté en détails dans le présent chapitre. 


- Modèles de régression non-linéaires avec variables explicatives binaires ou continues avec réponse 
réelle. Présenté en détails dans le présent chapitre dans le cas où ils peuvent être ramenés à des cas 
linéaires ou non mais alors sans interactions des variables explicatives. Sinon basé sur des techniques de 
type quasi-Newton ou de Gauss-Newton présentées dans le présent chapitre. 
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- Modèle de régression polynomial par la méthode des B-spline et du polynôme de collocation. Présenté 
en détails dans le présent chapitre. 


- Modèle de régression logistique (régression binomiale) avec variables explicatives binaires, nominales 
(catégorielles) ou ordinales ou continues avec réponse bornée entre 0 et 1. Présenté sommairement et 
naïvement dans le présent chapitre. 


- Modèle de régression de comptage de Poisson (Poisson MLE, PMLE, GLM) ou binomial négatif 
(binomial MLE et QGPMLE) avec variables explicatives binaires, nominales (catégorielles) ou ordinales 
ou continues avec réponse entière positive. 


- Modèle de régression linéaire orthogonal qui est utilisée comme complément au test-T pour données 
appariées pour voir la stabilité des instruments de mesure dans les laboratoires. Il s'agit d'un cas où la 
variable explicative et expliquée sont entachées d'une incertitude (je présenterai la démonstration quand le 
temps me le permettra). 


9.1. RÉGRESSION LINÉAIRE À UNE VARIABLE EXPLICATIVE 


Nous présentons ici plusieurs algorithmes (méthodes) utiles et connus dans les sciences expérimentales 
(nous en avons déjà parlé lors de notre étude des statistiques). L'objectif est de chercher à exprimer la 
relation linéaire entre deux variables x et y indépendantes par un "modèle linéaire" (ML) le plus simple 
possible (sinon quoi il faudrait des centaines de pages pour présenter le sujet!). 


- x est la variable indépendante ou "explicative" appelée aussi "covariable" ou "variable prédictive" (et en 
économie "variable exogène".….). Les valeurs de x sont fixées par l'expérimentateur et sont supposées 
connues sans erreur 


- y est la variable dépendante ou "expliquée" (exemple: réponse de l'analyseur) appelée aussi en éconoome 
"variable endogène". Les valeurs de y sont entachées d'une erreur de mesure. L'un des buts de la 
régression sera précisément d'estimer cette erreur. 


Nous cherchons une relation de la forme: 
y= f(x) =ax+b 


C'est l'équation d'une droite (fonction affine), d'où le terme de "régression linéaire" avec a qui est appelé 
dans ce cadre d'étude: "coefficient de régression". 


Dans la vie réelle, les relations linéaires constituent vraiment une exception car la majorité des relations 
sont non linéaires dans la réalité et même non continues dans certaines situations. De plus, ce n'est pas 
parce qu'elles sont linéaires dans l'intervalle de mesures effectuées qu'elles le sont à plus petite échelle ou 
à plus grande échelle! 


Cependant, dans la pratique nous nous arrangeons pour linéariser les fonctions soit par des transformations 
algébriques élémentaires comme celles qu'utilisent les tableurs (par exemple Microsoft Excel) pour la 
linéarisation d'une fonction logarithmique en faisant un simple changement de variables: 


y=a-inixi+b=ax+b 
CN 
=} 
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ou encore pour les fonctions puissance et exponentielles en faisant aussi une petite manipulation 
algébrique avec les propriétés des logarithmes démontrées dans le chapitre d'Analyse Fonctionnelle (à 
condition que a soit strictement positif): 


y = ax? = in(y)=inlax? | =in(a)+in (x? |=bintxi+in(a) 


(57.81) 


bx 


y = ae —iniyi=inlae |=in(e® |+in(a)=bx+in(a) 


soit en faisant des approximations en série de Taylor (cf. chapitre de Suites Et Séries). 


Remarques: Si nous cherchons à déterminer la valeur de y pour un x non mesuré et se situant au-delà 
de l'étendue de mesure d'origine, nous parlons alors "d'intervalle de prédiction pour x". 
9.1.1. DROITE DE RÉGRESSION 
Il existe aussi une autre manière commune de faire une régression linéaire du type: 
7=f(G=axtb (5782) 


qui consiste à se baser sur les propriétés de la covariance et de l'espérance (cf. chapitre de Statistiques) et 
très utilisée entre autres en finance (mais aussi dans n'importe quel domaine où l'on fait un peu de 
statistiques). 


Soient x, y deux variables dont l'une dépend de l'autre (souvent c'est y qui dépend de x) nous avons selon la 
propriété de linéarité de la covariance qui est, rappelons-le: 


cov(X,7) = E(XY)-E(X)E() (5782) 
la relation suivante: 
cou(X,aX +b)= E(aX° +bX)-E(X)E(aX +b) 
= ElaX°)+E(bX)-E(X)(E(aX) +ÆE(b)) 
= aB(X?)+BE(X)-E(X)(aE(X)+b)=a8(X°?)+bE(X)-aE(X) -bE(X) éd 
= a(e(x°) -E(X)) = acov(X, X) = aVar(X) 


Il vient donc pour la pente (nous réutiliserons cette relation lors de l'étude du rendement d'un portefeuille 
selon le modèle de Sharpe dans le chapitre d'Economie): 


cov(Æ,F) 
= —| (57:65) 
PCA) 


Soit sous la forme plus explicite que nous utiliserons plus loin (cf. chapitre de Statistiques): 
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LEG-D04-7) ZGe-D0%-7) 


_ cov(X,F) E((x 7) —))} 2% _k E6à 
7% # & k 


Pour déterminer l'ordonnée à l'origine nous utilisons les propriétés de l'espérance démontrées dans le 
chapitre de Statistiques: 


E(F) = E(aX +b) = aË(X) +E(b) = aË(x)+b (5787) 


ce qui donne b sous la forme: 


b= E(FY)-aE(X)| (57.88) 


9.1.2. MÉTHODE DES MOINDRES CARRÉS 


Du fait de l'erreur sur y, les points expérimentaux, de coordonnées (x,,»,), ne se situent pas exactement 
sur la droite théorique. Il faut donc trouver l'équation de la droite expérimentale qui passe le plus près 
possible de ces points. 


La "méthode des moindres carrés" (DMC) consistera dans le cadre d'étude particulier qui nous intéresse à 
chercher les valeurs des paramètres a, b qui rendent minimale la somme des carrés des écarts e; résiduels 


(SS,: Sum of Squared Residuals) entre les valeurs observées y, et les valeurs calculées théoriques de y”. 


Nous parlons alors de "méthode des moindres carrés des écarts d'ordonnées": 
* 1,3 
SS, Dre —ÿ,) (57.89) 
El 


où n est le nombre de points et: 
Yy = ax; +b (57.90) 


d'où autrement écrit: 
È 2 
SS, = d'Or ax -B) = Dia,b) (5791) 
k=] 


Cette relation fait apparaître la somme des carrés des écarts comme une fonction des paramètres à,b. 
Lorsque cette fonction est minimale (extrémale), les dérivées par rapport à ses paramètres s'annulent: 


ab x 
—(a,b)=-2d x ax, = bj = 0 

az. ) >x «0 ax, — b) 

3 : (57.92) 
—(a,b) = -29 (y, -ax, -b) = 0 

8b pan 
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Remarque: Cette méthode de recherche de minimum (optimisation) est nommée "méthode des 
multiplicateurs de Lagrange" dans le monde de l'économétrie. Dans notre exemple $$, est la grandeur 


scalaire qui fait office de multiplicateur de Lagrange. 


Soit après simplification: 
x # 2 x 
Data DR 
kl K&l el 
x # 
bntaD x, => y 
&1l #1 


Le système ci-dessus est appelé "système des équations normales". C'est un système linéaire de deux 
équations à deux inconnues. Notons pour simplifier: 


(57.93) 


= 1 * _ 12 
x=— D x) =—) Jr (67.94) 
# Ke] R ke] 
Le système devient: 


_ x x 
bnx+a x = D x 
El El (57.95) 
b+ax= y 
De la deuxième équation, nous tirons: 
b=y-ax (57.96) 
En remplaçant dans la première, nous obtenons: 


# _ 2 # 
(y-ax}nx+a5 x =D x AxY ax +aÿ * =D x" 
pa! El 


Ka El 
x _ # x # 
2, a —AXY #}, x} 2, 22,9 (57.97) 
= Ke = _M1 K=l Kel 
> 2 _— 1 L: 2 
D, 7x u-(5x) 
Le el kel 


De là nous avons: 
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x x* x 1 # 
E> mn sn) 15%, 
kel El El À ke] 

x à x 2 
AD, %k = b D 
kel kel 


Î # 
b= 25 y = 


# à # : Î # # # x Î # 
pu-[jn) n-fan-ain]iia 
LL EI K=l | K=1 KE kel kel (57.98) 


x x* “ 
ùe-[5n) 
Kl Kl 
x i— x # 
PRÉPA D RVR 
El KE El fl 


Ainsi, les expressions de la pente et de l'ordonnée à l'origine de l'équation recherchée sont: 


x x# * Li x # x# 
(DEN Z Dir DE D>X7 : D nd 7% 
a = Kk] k] = -b = kel &=] &=] e 
* Li 
De >| .- Sa] 
k-1 k-1 &=1 k-l 


(57.99) 


Les deux dernières relations sont utilisées par la majorité des tableurs comme par exemple dans la version 
française de Microsoft Excel 11.8346 lors de l'utilisation de la fonction REGRESSION ). Le terme b 
(l'ordonnée à l'origine) peut être obtenu directement avec la fonction ORDONNEE.ORIGINE( } et a avec 
la fonction PENTE( } et l'ensemble avec la fonction DROITEREC ). 


Voici si jamais un petit listing intéressant de quelques cas très pratiques avec ce tableur: 
- Pour une droite: 


a: =PENTE(y,x) 
b: =-ORDONNEE.ORIGINE(y,x) 


- Pour une fonction logarithmique (nous retrouvons le changement de variable donné au début): 


a: =INDEX(REGRESSION(y,LN(x)),1) 
b: =INDEX(REGRESSION(y,LN(x)),1,2) 


- Pour une fonction puissance (nous retrouvons le changement de variable donné au début): 


a: =EXP(INDEX(REGRESSION(LN(y),LN(x),,),1,2)) 
b: =INDEX(REGRESSION(LN(y),LN(x),,),1) 


- Pour une fonction exponentielle (nous retrouvons aussi le changement de variable donné au début): 


a: =EXP(INDEX(REGRESSION(LN(y),x),1,2)) 
b: =INDEX(REGRESSION(LN(y),x),1) 
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Remarque: Il faut bien avoir en tête que la droite des moindres carrés, qui permet de résumer au mieux 
le nuage de points des observations, passe nécessairement par le centre de gravité du nuage, c'est-à- 
dire par un point moyen qui ne correspond que rarement à une observation (moyenne des abscisses et 
moyenne des ordonnées). 


9.1.3. ANALYSE DE LA VARIANCE DE LA RÉGRESSION BIVARIÉE 
Nous avons donc maintenant pour la droite des moindres carrés: 

y=ax+b (57100) 
soit sous forme discrète: 

Yy = 4x, +b (57.01) 

ainsi que par construction de la méthode la relation suivante: 

ÿ=ax+b (57.102) 
Maintenant, nous faisons l'hypothèse que chaque valeur mesurée est entachée d'un résidu tel que: 

JV = 4x, +b+ez (57.103) 
Soit en soustrayant les deux dernières relations: 
(Ye -}) = a(xg — x)+e Ex = (Ye -})-a(x —X) (57.104) 


Maintenant, passons par un résultat intermédiaire. Rappelons que nous avons obtenu plus haut: 


En remplaçant b par sa valeur: 


nous avons alors: 


2% -ax -7+ax)= 7x (0% -7)-a(x -7))= 0 
: : (57.107) 
k 


(x ax -ÿ+ar)= (0x -5)-aûx; -7)) =0 Co 
E 


Multipliant la deuxième relation ci-dessus par x et retranchant de la première, nous obtenons: 


L% (Qi -7)-a(x; -x)) “F2 (0x -ÿ)-a(x -7))=0 (57.108) 
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Soit après réarrangement: 


DE —7)(Or-3)-a(x -7))= 0 (57.109) 


k 


Revenons maintenant à: 


(x -ÿ) = a (xx s x) +æ& (57.110) 


Si nous mettons le tout au carré et en sommant pour toutes les observations, nous avons: 


. 3 - 
D -7) => (x -7) +245 (x -7)e +3 (57.111) 
k k k 


k 


soit: 


> 0% 5) F2 -x) + 22 (x —X)(( -7)-a(x -0)+ Ze (57.112) 


k 


Or, nous venons de montrer avant que le double produit était nul. Donc: 


si 3 
> 0x -?>) => (x-7) +De (57.113) 
k p 


k 


Cette dernière relation est appelée "équation d'analyse de la variance". En fait, il s'agit de sommes de 
carrés. Il faudrait diviser par n pour obtenir des variances biaisées. 


Cette dernière relation s'écrit aussi souvent: 
SCT = SCE+SCR (57.114) 


où SCT est la "somme des carrés totale", SCE la "somme des carrés expliquée" et SCR la "somme des 
carrés résiduelle". 


Cette dernière relation se trouve également souvent sous la forme suivante dans la littérature: 
D'Or) =3 (ax +b-ar- BD = Dax +b-H)HD EE 
PE PA = % k — k Y & (57.115) 
k k k k k 
Notons maintenant les y; sans erreurs d'une manière différente et appelons cela le "modèle linéaire a 
priori": 
Pr = ax +b (57.116) 


Il est effectivement important dans la pratique de différencier le modèle a priori qui ne prend pas en 
compte les erreurs du modèle réel entaché d'erreurs! 


Nous avons alors: 


DOn-7) =D -D)+Te (57.117) 
k & k 
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où la première somme après l'égalité est très souvent appelée "manque d'ajustement" ("lack of fit" en 
anglais). Cette dernière relation peut se représenter graphiquement sous la forme suivante: 


Figure: 57.2 - Représentation graphique de SCT, SCE, SCR 


La dernière relation est souvent notée dans la littérature sous la forme plus pédagogique suivante: 


Z0r-5) = ZA - 7”) +24=204 5) +20 kŸ (57.118) 


qui est simplement une autre manière d'écrire la décomposition de la variance (implicite): 
SCT=SCE+SCR (57.119) 


et il vient alors immédiatement la relation utilisée parfois dans la pratique pour calculer les résidus 
(connaissant les valeurs calculées et les valeurs mesurées): 


Z4 20% ” PE 2) (57.120) 


Il est important de se rappeler (ou de constater) que les relations ci-dessus entre SCT, SCE et SCR ne sont 
valables que dans le cas d'un modèle linéaire! 


Rappelons maintenant que dans le chapitre de Statistiques, nous avions démontré que le coefficient de 
corrélation s'exprimait (était défini) par: 


2 
_. FNrr 2 (corp) 


= = 2 LONAT 
0 Faye 7 VAE 


Ou sinon puisque nous avons démontré plus haut que (se rappeler que la variance indiquée est la variance 
biaisée… ): 


cov(Æ,F) 
= —— (57122) 
F4) 
nous pouvons aussi écrire le coefficient de corrélation sous la forme: 


2. LaV@) 


57.123 
À dl EE (67.123) 


Donc nous en déduisons): 
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VO Ef(n-7))E(04-5)) LE(x-9 250: -5 


PR PR | 


Montrons que ceci est égal à (notation souvent utilisée dans la littérature spécialisée): 


D (57.125) 
FF ET  — 


(57.124) 


Remarque: Cette formulation du coefficient de corrélation est extrêmement utile car, contrairement à 
la formulation statistique, cette dernière se généralise immédiatement à la régression linéaire multiple 


que nous verrons un peu plus loin. 


Démonstration: 


Nous partons donc de: 
= ——— (57.126) 


et puisque nous avons montré que: 


2 (x -7)Or -7) 
Dr -7)(On - 7) - ax -0)= 0 @ = À — 


mr (57.127) 
k D (x si x) 


Donc: 
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et dans le cadre des modèles de régression voici quelques cas typiques de la valeur de ce coefficient avec 
un corrélation linéaire pour les deux premières lignes et non linéaire pour la troisième ligne: 


1 0.8 0.4 0 04 08 5 
1 1 1 1 1 1 


C 0 0 
EF 4 < à = . ÈS = 
F " 


Figure: 57.3 - Quelques valeurs du coefficient de corrélation linéaire (source: Wikipédia) 


Enfin, indiquons que nous retrouvons aussi très souvent le coefficient de corrélation linéaire sous la forme 
suivante dans les logiciels et la littérature: 


k? = re : SCE _SCTSCR _,_SCR (57.129) 
’ SCT SCT SCT 


Cette dernière forme met mieux en évidence que si la somme des carrés des résidus SCR est nulle, le 
modèle est parfaitement modélisable par une relation linéaire dans l'intervalle d'étude considéré. 


Enfin, remarquons que l'ordonne à l'origine n'intervient pas dans la valeur du coefficient de corrélation 
puisque (propriété de bilinéarité de la covariance démontrée dans le chapitre de Statistiques): 


cov(Æ#,F) = cov(ÆA,aX +b) = acov(Æ, À)+bcov(x, D = ao +b-0 (57.130) 


9.2, MODÈLE LINÉAIRE GAUSSIEN 


Nous admettrons que, pour un individu i prélevé au hasard dans la population, x; est connu sans erreur, et 


que y; est une réalisation d'une variable aléatoire que nous noterons dorénavant F, et la droite théorique 
des moindres carrés s'écrira maintenant: 


F, = x + Ê+E, (57.131) 


où £, est par hypothèse un résidu identiquement distribué et indépendant (pas d'autocorrélation) pour 
chaque point i selon une loi Normale centrée (de moyenne nulle et d'écart-type égal pour tout K) tel que: 


& = M(0,a let |cov(s,#,)= 0 Wiæ j| (57.13) 


donc autrement dit: 
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E(&)=0,0(€,)=07 (67133) 


où nous avons le résidu qui est donc donné par la différence entre l'ordonnée théorique et l'ordonnée 
mesurée (expérimentale): 


EE =} (67134) 


et puisque par hypothèse &, = M{0, a), il vient immédiatement que: 


F, = N(ax, +8) (57.135) 


Raison pour laquelle le modèle s'appelle "modèle linaéire gaussien"…. Explicitement, cela donne donc: 


ee 


2 
1. 20 à | (57.136) 


F, = 2 


Ce qui équivaut graphiquement à avoir: 


10 


-5 


-10 -5 0 5 10 


Figure: 57.4 - Représentation graphique du principe de distribution Normale 


Presque tous les logiciels d'analyse statistique proposent de faire un tracé (graphique) des résidus en 
fonction des valeurs de x. Ainsi, deux graphiques du type suivant améneraient à rejeter le modèle linéaire 
gaussien: 
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t&=r-» 


scsi 
* e ® 4 “: % LR Fe 
eee ce." CES 
esse os 
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ee. CE 


Figure: 57.5 - Exemple de "plot" de résidus qui n'annoncent rien de bon. 


Les hypothèses précédentes concernant les moments des résidus sont appelées "hypothèses de Gauss- 
Markov" et l'hypothèse particulière d'égalité des variances s'appelle comme nous l'avons vu dans le 
chapitre de Statistiques "l'homoscédasticité" (tandis que le fait que les variances ne soient pas égales 
s'appelle pour rappel "l'hétéroscédasticité"). 


Remarque: La majorité des logiciels (dont Microsoft Excel 11.8346) proposent un graphique qui 
montre les résidus en fonction des valeurs des ordonnées x. Bien évidemment, il vaut mieux que les 
points représentant les résidus ne soient pas trop divergents.. sinon quoi l'hypothèse 
d'homoscédasticité est violée. 


Nous avons de par la propriété de l'espérance (cf. chapitre de Statistiques): 
F=E(r)-E(an +8+8)-EÆ(ax)+EÆE(8)+ÆE(&)=ax+8 (57127) 
Alors sous les hypothèses ci-dessus, nous allons montrer que a et b sont les estimateurs sans biais (cf. 


chapitre de Statistiques) de & et Æ£ et qu'il est possible d'estimer l'écart-type à partir de SCR ce qui est un 
résultat important appelé "théorème de Gauss-Markov". 
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VO AN erAN ER EEUEIR [SCIENCES.CH] 


Avant de voir la démonstration faisons un rappel et donnons quelques définitions des variables que nous 
avons déjà manipulées et des nouvelles que nous allons manipuler (si le vocabulaire semble technique au 
lecteur alors il devra au préalable lire ou relire le chapitre de Probabilités et de Statistiques): 


Pente (coefficient directeur) du modèle linéaire de la méhode des moindres 
carrés. Il s'agit d'une valeur ponctuelle (déterministe). 

Ordonnée à l'origine du modèle linéaire de la méthode des moindres carrés. 
Il s'agit d'une valeur ponctuelle (déterministe). 

Variable aléatoire de la pente (coefficient directeur) selon l'approche 
statistique du modèle gaussien et dont a est une réalisation. L'espérance de 
A étant un estimateur non biaisé de &. 

Variable aléatoire de l'ordonnée à l'origine selon l'approche statistique du 
modèle linéaire gaussien et dont b est une réalisation. L'espérance de B 
étant un estimateur non biaisé de À 


Espérance non biaisée de la variable A représentant la pente (coefficient 
directeur) dans le cadre de l'approche statistique du modèle linéaire 
gaussien. 


Espérance non biaisée de la variable B représentant l'ordonnée à l'origine 
dans le cadre de l'approche statistique du modèle linéaire gaussien. 


Tableau: 57.3 - Rappel des notations pour l'étude de la régression linéaire 
Oo 


Démonstration: 


Conformément au modèle adopté, a est à considérer maintenant comme une réalisation de la variable 
aléatoire donnée par (démontrée plus haut comme étant le rapport de la covariance et de la variance): 


Dix 7) -F) 
À = E—_—_—__—— 
= (57.138) 


mi 
2x -7) 
k 
et b comme une réalisation de la variable aléatoire donnée par: 


B=f-Ax (57139) 


Donc nous différencions les valeurs aléatoires et non aléatoires des coefficients par le passage de la 
notation minuscule à majuscule. 


Tenant compte de ce que la variable expliquée théorique considérée comme la réalisation d'une variable 
aléatoire est donnée par: 


F, = x; + B+E, (57.140) 


nous pouvons mettre À sous la forme: 
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Dr -r)U -F) Dix -r)(ax +86+a-F) 
Za-7) 


HE -x)(ax, +8+8 - E(F)) 2 —X)(@x, + 8+68 - ax - 8) 


k = 


(x -7) Z(x-7) 


k k 


_ » : L : (57.141) 
D'x-x)(ar+e-ax) ap '(x-7)(m-7)+5 (x -7)& 
= + _ __k k 
EE ER 
2x -7) (x -7) 
k k 
aD(x-7) Zu-7)a DC -7)8 
= ——— + ——© 2 + — 
Dr) (x) 2x 7) 
k k k 
et B: 
B=F-Ax-E(F)- Ax=ax+8-Ax- 8-x(A-@) (57.14) 
Nous en déduisons les espérances pour A: 
2 (x -7)& Dr -7)e 
E(A=E| + |-£(a)+#| 1 _— 
Xg —?) DE” —X) 
d : (57.143) 


ce qui montre que notre hypothèse initiale pour l'expression de À n'est pas trop mauvaise. puisque 
l'espérance de A est visiblement un estimateur non biaisé de a. 


Respectivement, pour B il vient: 


E(B)=E(8-7(4- a)) = E(#)- E(r(4-a))= 8-%xE(4-a) —. 
= B-xE(A)+xE (a) = B-7a+7a= £ D 


avec la même conclusion. 
OIC.Q.F.D. 


Donc l'espérance de À et B sont bien des estimateurs sans biais (donc de variance minimale pour rappel) 
de &, Ë. Comme ce sont des estimateurs, dans la littérature spécialisée, &, £ sont souvent notés &.b et 


dès lors il vient la notation courante alternative: 
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Añ 


Fe 


=âx,+b (57.145) 


Nous devons enfin calculer aussi les variances de À et B en utilisant ces propriétés (cf. chapitre de 
Statistiques) et les hypothèses sur les résidus, nous avons: 


F(4)= | &+-+ —|=7]+ |-—< - 
E 77 2 Et =) | 
k (57.146) 


Comme par hypothèse nous avons tous les F(&) qui sont égaux, et qu'il n'y a pas d'autocorrélation, nous 
pouvons alors écrire: 


Zur) Ve) Fa) Zn -7) 
PCA) = EE 


2 
12 = 
Zm-#] [Ets 
Soit si n est assez grand nous écrirons: 


CS - 
(x _xŸ | n-.V(x) (67.148) 
k 


a (4) =V(4)= 


Avant de déterminer la variance de B, rappelons que par hypothèse: 
F, = N{ax, +8, ) (57.149) 
donc par propriété de linéarité de la loi Normale, les variables aléatoires A et B suivent donc aussi une loi 


Normale. 


Du rappel de cette hypothèse, il découle immédiatement (cf. chapitre de Statistiques): 


V()= eo? =r(F) LS (57.150) 
# 


Dès lors: 
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V(B)=V(F-Ar)=V(7)+747(4)-27 cov(,4)=V(7)+%7 (4) 


: : 


= +7 0 (4)= — + 77 = 
Ed: A FT 


Nous avons finalement: 


DE a 5x? 
(8) =V(B)= ——E = EE 553 
(8) = (8) TPE CRETE (57.153) 
k 


où évidemment la notation de la variance au dénominateur est très abusive (puisque x n'est pas une 
variable aléatoire) mais très pratique pour condenser les écritures. 


Le problème réside maintenant dans la détermination de a? . Évidemment pour ce faire nous allons être 
obligés de passer par un estimateur statistique. 


Nous savons que nous pouvons écrire selon ce qui a été vu dans le chapitre de Statistiques en ce qui 
concerne les estimateurs: 


. = 2(s e) | Le -—E( TT}; Ÿ (67.154) 


puisque la loi Normale est centrée pour les résidus donc & = 0 … et que le résidu est une variable aléatoire 
implicitement dépendante de la somme de deux variables aléatoires que sont A et B d'où la minoration de 
deux fois l'erreur standard. 


Indiquons aussi que dans la pratique nous notons fréquemment ce dernier résultat en mélangeant les 
notations de l'aspect aléatoire et déterministe (donc en notant tout avec des minuscules): 


SUR 


1 2 1]! à 
= =— er = = SEE 57.155 
»r) > k »=2 (57.155) 


= 2" 


où SEE signifie en anglais "Standard Error of Estimate" (Erreur Standard de l'Estimation). Il s'agit en 
français de "l'erreur standard de la régression". 


Nous avons donc les estimateurs non biaisés des variances de À et de B: 


1 2 . 2 1 2 2 
&æ 2 2% 7222 


RQ EE — 
a 2 .V(x) n° V(x) 


(4) _ : (57.156) 
x -V(x) a -V{x) 
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relations qui ne sont donc valables que pour une régression linéaire à une variable explicative (et sous les 
hypothèses de construction du modèle linéaire Gaussien). Sachant par construction de l'hypothèse de 
départ que A et B suivent une loi Normale d'espérance respective &, £ et dont la variance est donnée juste 
ci-dessus, nous connaissons donc entièrement la distribution qui les caractérise. 


Ce qui est sympathique connaissant ces variances, c'est que nous pouvons aussi estimer la variance de la 
variable expliquée de notre régression facilement (en utilisant les propriétés de la variance vues dans le 
chapitre de Statistiques). 


Il serait intéressant aussi de faire de l'inférence statistique sur l'espérance des paramètres À et B (donc la 


pente et l'ordonnée à l'origine) étant donné leur espérance empirique connue. Dès lors, nous avons 
démontré dans le chapitre de Statistiques l'intervalle de confiance suivant: 


= _ 
#-plant-Dsus À +, À (57.157) 
7 


Il s'ensuit en faisant un parallèle digne de l'ingénieur. que comme A est un estimateur non biaisé de la 
moyenne de la pente a et que: 


T2 Î > 52 -— 2) 


et alors (c'est un raisonnement à prendre avec des pincettes et il vaut mieux utiliser les développements 
qui vont suivre par la suite): 


A T552(— 2) 


ce qui donne donc l'intervalle de confiance de la pente d'un modèle linéaire Gaussien à une variable 
explicative (c'est ce que donne Microsoft Excel 11.8346 pour chaque coefficient). La démarche est la 
même pour l'ordonnée à l'origine. 


Dans le cas d'une régression linéaire ayant plusieurs variables explicatives, assimilées alors au concept de 
"degrés de liberté" (d.d.L.) ou en anglais de "degrees of freedom", l'idée est la même maïs les calculs sont 
plus longs (pas le courage de les faire..). 
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Enfin, rappelons que nous avons obtenu pour le coefficient de corrélation empirique: 


2 a aV(X) ) 
À (57.161) 
TT ETC J 
Nous avons alors in extenso le fameux intervalle de confiance du coefficient de corrélation: 


2 2 


1 à 

—S"# 

n=22 À PCA) (57.162) 
aW(x) 60 


_ s,2 


2% 
nn | TO cpe, <| 447, n(4-2 


RON res | 7e n 


Il faut savoir qu'étant donné que calculer l'intervalle de confiance pour la pente ou pour le coefficient de 
corrélation est une démarche équivalente, nombreux sont les logiciels (Tanagra, Minitab, Microsoft Excel, 
etc.) qui donnent la valeur de la distribution de Student et la valeur critique de celle-ci uniquement pour la 
pente et supposent que le lecteur sait qu'il en est de même pour le coefficient de corrélation. 


9.2.1. TEST DU COEFFICIENT DE CORRÉLATION DE PEARSON 


Le calcul obtenu plus haut pour l'intervalle de confiance du coefficient de corrélation est un peu pénible 
dans la pratique. C'est pour cette raison que de nombreux praticiens et logiciels de statistiques 
implémentent une alternative très simple communiquée uniquement sous la forme minimale qu'est la p- 
value. 


Pour voir cette approche, rappelons que nous avons vu dans le chapitre de Statistiques que (cette fois-ci 
nous allons adopter la notation correcte…): 


cov(Æ,r) 


7 rave (57.163) 


Et que nous avons vu juste plus haut que: 


_ cov(#, di aT y 


BUS LÉ D FETE aP D TT (57.164) 


De la même manière, nous avons l'estimateur du coefficient de corrélation de Pearson qui est (en adaptant 
ici aussi les notations d'usage possibles que nous pouvons trouver dans la littérature): 


et donc: 


F 
A=———— (57166) 
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Le test d'hypothèse que nous voulons faire est alors: 


Ho : P=0 (57.167) 
et donc équivalent à: 
Hp:a=0 (57.168) 


l'hypothèse nulle étant évidemment que le coefficient de corrélation de Pearson est statistiquement 
significativement différent de zéro. Il s'agit donc d'un test bilatéral! 


Pour trouver une forme simple du test, rappelons que nous avons obtenu: 


2 
(n-216 => r-»| = VE = SCR (57.169) 
k 
ainsi que: 
RL = SCE _SCT-SCR = 5CR —. 
*YT CT SCT scr (0779 


ce qui nous amène en mixant les deux à avoir: 


SCR = SCTI1-Rbyi= Dix =D (1-Rbyl=in-tiég(1-Rèr| (57.171) 
k 


d'où: 
—1iê$ |1- RÈ 
#3" aa 27 | (57.172) 
A —2 


Or, nous avons aussi montré que si n est assez grand: 


1 Ye 
n=-222"% (57173) 


aV (x) 


Sa A+T, (nr — 2) 


<a<A+T,p(n-2) A 


Donc: 
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T2 — à) 2 
(57.175) 
et avec l'hypothèse nulle & = Ô , il vient: 
Rrrôr Rrrôr 
T2 (x — 2) 2 = = = 
Eu on 
@-Déz V1 


= fr. 
ER (2-18 (1-Rry| Pr 
#—1 #— 2 n—2 


Il faut faire attention à l'utilisation de ce test suivant si le coefficient de corrélation de Pearson est négatif 
ou positif et ne pas oublier qu'il est bilatéral. 


Exemples: 


E1. Nous avons calculé pour une série de données un coefficient de corrélation de Pearson positif R valant 
0.298 et la variable explicative comporte 7 valeurs. Nous avons donc avec la versio anglaise de 

Microsoft Excel 11.8346 la p-value qui est (nous retrouvons exactement la même valeur qu'un logiciel 
comme Minitab 15.1.1): 


=2*(1-T.DIST(0.298/SQRT((1-0.29812y/(7-2));7-2;1))=2*(1-0.741869)-0.51626 


Dans le cas présent nous ne rejetons donc pas l'hypothèse nulle comme quoi le coefficient de corrélation 
de Pearson est nul à un niveau de confiance de 5%. 


E2. Nous avons calculé pour une série de données un coefficient de corrélation positif de Pearson R valant 
-0.084 et la variable explicative comporte 19 valeurs. Nous avons donc avec la version anglaise 

Microsoft Excel 11.8346 la p-value qui est (nous retrouvons exactement la même valeur qu'un logiciel 
comme Minitab 15.1.1): 


=2* T.DIST((-0.084)/SQRT((1-(-0.084}\2)/(19-2)):19-2;1}-2*(1-0.366)-0.74186 


Dans le cas présent nous ne rejetons donc pas l'hypothèse nulle comme quoi le coefficient de corrélation 
de Pearson est nul à un niveau de confiance de 5%. 


Ce petit piège fait que finalement on prend la valeur absolue du coefficient de corrélation de Pearson et on 
fait le calcul toujours d'une seule manière 
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9.2.2. INTERVALLE DE CONFIANCE DES VALEURS PRÉDICTIVES 


Nous souhaiterions pour chaque valeur mesurée de la variable expliquée, connaître l'intervalle de 
confiance. En d'autres termes, nous souhaiterions connaître la variance de l'estimateur statistique de Y 
(nous n'écrivons plus les indices pour gagner du temps): 


WiF)=V(Ax+8B)=V(Ax)+V(B)+2cov(Ax, B) (57.177) 


Malheureusement, nous allons nous casser les dents, car la covariance est difficile à calculer (A et B ne 
sont pas indépendants comme le montrent les expressions que nous avons obtenues plus haut). 


Par contre, en étant bon observateur, nous voyons que si nous utilisons le résultat vu plus haut: 
B=F-Ax (57178) 
alors: 
FF) =V(Ax+8)=ViAx+iF-Axii= VIF +Aix-Xi) (57.179) 
Le problème étant contourné, nous avons maintenant en utilisant les propriétés de la variance: 


VY)=FViF+Aix-Hi= VIF i4+ VIA x-Fil+2coviF, A(x-7il 


——V— 
=0 
_ _ on ci (57.180 
= PE PA Ne PP PA 
À 
> FL qe U 
k 
d'où: 
1 ix— x) 
FEy= | | Gras) 
A 
> Xÿ _ 7)? 
k 
Donc nous avons: 
1 iXx—Xi 
Y=N Ax+B,@ — + —— (57.182) 
# 
x Xÿ 1 
k 
Maintenant, rappelons (cf. chapitre de Statistiques) que: 
K- 
Z = __— (57.183) 
T 
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et comme Ÿ est distribué selon une loi Normale dont l'estimateur non biaisé de la moyenne ainsi que 
l'écart-type sont donnés par la relation antéprécédente il vient immédiatement: 


: Y-(Ax+ 8) __ Y-(4x+8) 


(57.184) 


Dans la pratique il faut aussi vérifier que ce rapport suit effectivement une loi Normale pour pouvoir faire 
les intervalles de confiance et tests statistiques qui s'en suivent. 


Rappelons maintenant que nous avons démontré dans le chapitre de Statistiques que: 


riR)= Le (57.185) 


VU IE 


suit donc une loi de Student de degré de liberté k et U une loi du Khi-deux de degré de liberté k. 


Maintenant revenons à l'expression du Z précédemment obtenue et rappelons que: 


à 1 
&? = ; F (57.186) 
H# — 


Donc: 
ê = 15 a l{{(x—2) (57.87) 

Or comme: 

& = M(0,o?) (57.188) 
Alors: 

Le = (0,1) (57.189) 

T 

et donc: 


correspond à une somme de carrés de lois Normales centrées réduites. Et donc conformément à ce que 
nous avions démontré dans le chapitre de Statistiques il vient que: 
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£ Ÿ 
DIE) = p(n-2)= 722 (67191) 
g 


"1 


Donc: 
VA Z Z 
PQ) = To = — = ——_— = _— 
NUIT: 2 1 > 
x(£) {(#-2) 24 FC 2) 
T (57.192) 
: TZ _ TZ 
JE /G-2 ë 
Soit: 


(57.193) 


C'est une raison pour laquelle beaucoup de statisticiens notent directement et sans détours: 


= T{n-2) = 


(57.194) 


Ce qui n'est pas forcément évident au premier coup d'oeil. Raison pour laquelle, suite à la demande d'un 
lecteur, nous avons détaillé un peu de manière exagérée, le mécanisme qui se cache derrière cette 
implication. 


Bon ceci étant, fait, nous avons donc: 


T{n- 2)= 


(57.195) 
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et il en découle en bilatéral, un intervalle de confiance à un niveau & donné et pour un x fixé par: 


L 1 1X—XI 
F = Ax+B+Tg(n-2) E + (57.196) 


Remarque: Le même type de développement peut être fait pour la pente et l'ordonnée à l'origine. 
Raison pour laquelle des logiciels comme Microsoft Excel, IBM SPSS, Minitab, Statistica, etc. 
donnent la valeur de la distribution de Student ainsi que l'intervalle de confiance à un niveau de & 
choisi. Mais pour que cela ait un sens, il faut que toutes les hypothèses du modèle construit soient 
satisfaites. 


Raison pour laquelle de nombreux logiciels de statistiques donnent le graphique suivant lors de 
régressions linéaires (nous y voyons bien l'intervalle de confiance): 


22.5 


20.0 


le) 


15.0 


12.5 


10.0 


HE) 


5.0 


20 29 30 25 40 45 


Figure: 57.6 - Capture du logiciel Minitab 15 pour l'intervalle de confiance 
Le lecteur aura remarqué que: 


1. Il est fort pénible sans logiciel d'obtenir le tracé de l'intervalle de confiance pour la droite des moindres 
carrés puisqu'il faudrait le calculer pour chaque point. 


2. L'intervalle de confiance est courbe ce qui est parfois considéré comme relevant du bon sens, du moins 
dans la version temporelle de la régression : plus l'échéance de la prévision est lointaine, moins elle est 
sûre. 

La valeur vraie de Y est donc donnée par: 


Y=at+bx+E (57197) 


avec la variance: 
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V(y)=Ee=0? (57.98) 


qui est indépendante de l'estimateur Y. Dès lors, la différence entre Y et y (donc entre estimateur et réel) a 
pour variance: 


1 ix 
V(F-»)= 7) +7 0)= ml 14 + | (57199) 

# _ 2 
> (x 7) 
k 


Dès lors il est d'usage de considérer que "l'intervalle de prédiction" (à ne pas confondre avec l'intervalle de 
confiance de l'estimateur) est pris comme étant: 


1 
Y = Ax+BET 2). 8 f+—-+ 
d af201— 2) # (57.200) 
Ce qui nous donne avec un logiciel comme Minitab 15: 


Droite d'ajustement 
Ventes = 3.020 + 1.220 Mois 


2,24117 
R carré 80,9 % 
R carré (ajust) 78.2 % 


Figure: 57.7 - Capture du logiciel Minitab 15 pour l'intervalle de confiance et de prédiction 


où nous distinguons bien l'intervalle de confiance (en rouge) de l'intervalle de prévision (en vert). 
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9.3. RÉGRESSION LINÉAIRE À UNE VARIABLE EXPLICATIVE FORCÉE PAR L'ORIGINE 


Un cas très fréquent et demandé dans les laboratoires (et globalement dans d'autres départements) des 
entreprises, est de forcer la régression linéaire à passer par l'origine. 


Nous allons voir ici que l'approche est seulement une variante simplifiée de la méthode des moindres 
carrés. 


Nous utilisons comme précédemment: 
x _ 
SS, = (x) (67201) 
1 


où n est le nombre de points. Mais cette fois-ci, nous écrivons: 
Yy =4ZXy (57.202) 


d'où autrement écrit: 
2 2 
SS, = 5 (y, ax) = D(a) (57.203) 
k=1 


Cette relation fait apparaître la somme des carrés des écarts comme une fonction du paramètre a. Lorsque 
cette fonction est minimale (extrémale), les dérivées par rapport à ses paramètres s'annulent: 

9® L 

—(a)=-25" x (y; -ax)=0 (57.204) 

% k=1 


Soit après simplification: 


Enfin: 


Vous pouvez vérifier aussi avec un tableur quelconque (Microsoft Excel par exemple) que les calculs 
correspondent bien. 
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9.4. RÉGRESSION LINÉAIRE MULTIPLE 


Bien évidemment, dans certaines situations la régression linéaire est trop simpliste ou simplement pas 
adaptée. Le cas le plus typique qui nous concerne dans ce qui va suivre étant les situations où nous avons 
plusieurs variables explicatives. 


Le principe de la régression linéaire multiple est relativement simple. Nous voulons déterminer la variable 
expliquée y à partir de p-1 variables explicatives indépendantes (donc en absence de "colinéarité"!) reliées 
par une loi linéaire de la forme générale: 


Y= b+Ânt.+/É,1x,1T+E (57.207) 


Dans un échantillon de n individus, nous mesurons };,%;1,..,%,-1 pour à =1..x: 


ADO AIN BEA 
CT php 


7 pare 
CEE 


Au fait, pour estimer les paramètres #,.., 6,1 (valeurs estimées que nous noterons &,..., 8,2 afin de 


respecter cette fois-ci la tradition) l'approche est très simple car elle consiste juste en une généralisation de 
la méthode des moindres carrés que nous avons vue plus haut pour la régression linéaire simple. 


Donc en fin de compte nous réécrivons la relation du Sum of Squared Residuals vue plus haut en la 
modifiant un tout petit peu puisque maintenant nous avons du multilinéaire: 


2 
SS, = > VA > (57.208) 
avec le modèle théorique estimé: 


= À + x TF1 (57.209) 


Donc il nous faut minimiser: 
k “ Eat #n 2 
SS, = 20 -(À + Éx1 +..+ 8,1% 1) (57.210) 
i=l 


Les parenthèses ci-dessus peuvent être réécrites sous la forme: 


ñ 1%] A,p21 || À & 
= + 
ñ (57.211) 
LA 1 Xl Zn, pl Bo En 
y = X Ê + E 
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Nous avons le vecteur des résidus qui vaut donc: 


É=ÿ-ÿ=ÿ-X8 (57212) 


Comme nous le savons, la méthode des moindres carrés consiste à trouver le vecteur ê qui minimise: 


lEf = ÉoË=Ël of (57.213) 
Soit explicitement: 
2 AT SO +. ri à AT ATr + | 
JEf = € oë=[ÿ-XÔ) (5-x À) - = (xê)-(xà) ÿ+[xô) (xô) (57.214) 


be 
nm: 
be 
To 
Il 
bc 
1 


x À) (57.215) 
et: 
: AT 
ÿ7 (xê)- (x) ÿ (57216) 


puisque chacun des éléments de la multiplication est un simple vecteur. 


Nous avons alors (attention! ne pas oublier que certaines multiplications dans la relation qui va suivre sont 
des produits scalaires!!!) la fonction quadratique multivariée de coefficients de vecteurs: 


El=ses-(5-xA){5-xÂ-5e5-2{x8)o5+{x 8) x) F Gran 


Dérivons cette dernière "fonction objet F” à l'ordre du vecteur & (il s'agit d'une dérivée intérieure 


composante par composante). Ce que nous écrivons: 
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eue 2x )e5+(x5) [xÀ)] 
_ alelré)e+{(xÀ)[xâ) 
=-2(4)05+ 2 ((xé) (x) 
| _ (57.218) 
um C2 {ir T2 


Maintenant, passons d'une écriture vectorielle à une écriture matricielle pure: 


1 Tfyi 
—=-2(Xù) ÿ+2(Xÿ) (x) (57.219) 


Nous cherchons donc ê qui annule cette dérivée. Donc nous devons résoudre l'équation suivante: 


ES 


(x) ÿ +244) (x8)-0 (57.220) 


Soit: 


Rappelons avant d'aller plus loin que: 
(x) = TYT (57229) 
Donc: 
(rar \xÀ (FXT)5 (629) 
Puisque l'algèbre linéaire est associative, écrivons sans les parenthèses: 
g'XTXB=HXTÿ (67224) 
Nous ne pouvons évidemment pas simplifier à droite et gauche par ÿ7 #7 car comme il ne s'agit pas d'une 


matrice carrée, ce terme est obligatoirement non-inversible. La seule chose que nous puissions faire c'est 
identifier les éléments tels que: 
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Pi Es xÀ) =#(X5) 6725 


impose forcément que: 
XTxË = XTÿ (57.226) 
Nous trouvons alors que si la matrice carrée X7T Y est inversible alors: 
ê= E XTÿ| (67.227) 
Pour montrer que cela semble juste, retrouvons les résultats de la régression linéaire simple: 


y= à +Bx (57.228) 


donc en ne supposant que deux observations, nous avons alors: 
B=(rx 1 
r 
ra Æ,1 "fi A] 1 x # 
1 22, 1 1 2, 1 1 X21 Ya 
- 
#21 ][1 5 A1 221/L» (57.229) 
- 
n 1+1. 1 - H +2 
Z1 +21 x +x21 A1" +212 
# 2; x; (E Y 
2, # L L' > x}; 


: 


En utilisant la relation démontrée dans le chapitre d'Algèbre Linéaire pour calculer en toute généralité 


l'inverse d'une matrice A(aÿ) en A7! CE 


h. = l 
Ÿ  det(A) 


‘(-1)*7-det(4;) (67.230) 
Nous avons dans le cas présent: 
2 
det (xTx) = 4 147 _ 243] = Cp Fa > x 2. 4 = no k {> x; | (57.231) 


Nous avons donc: 
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(7 2 - ————— det(XTX;) 
ze fs 
det(XTX;) -det(x'x) 
|] -det(XTX) det( xx) 


nD x? - b £ 


(57.232) 
1 


et Vu que nous avons une matrice carrée de dimension 2 seulement, le calcul des quatre déterminants se 
réduit au fait à sélectionner les composantes de ZT (cf. chapitre Algèbre Linéaire) 


Z# -Zx 


rEé-[5x | 2x 


l 


(ax) E (57.233) 


Donc: 
n ZxN (Sr 
24 2# || | Paz» 

Zx -Zx/fZx 


aile ” fev 


_ 
# 


è- ét XTÿ= 


: 1 
ZFDn-2x Dan 


Eé(5x) x Ent x (57.234) 


> x Dr-2r Dr" 


l 


mel ae 


rDai-ZxZx 
#Dx {> % | 


Donc à un changement de notation près pour les indices et les mesures expérimentales, nous retrouvons 
bien le résultat que nous avions obtenu lors de notre étude de la régression linéaire simple qui était (pour 


rappel...): 
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# * # # à * # * 
DENT D2927 dx D» E DD 
a = fl el hu fl kel fl kel 


EE) EE) 


Maintenant, il nous faut un indicateur de qualité en ce qui concerne notre régression multilinéaire. 
Rappelons que dans le cadre de notre étude de la régression linéaire à une variable explicative, nous avons 
démontré que le coefficient de corrélation linéaire pouvait être écrit sous la forme: 


(57.235) 


LT ES 57.236) 
SCT Sr -ÿ) 
k 


et au fait celui-ci est applicable aussi directement à la régression linéaire multiple puisque qu'il ne 
présuppose pas le nombre de variables explicatives!! 


Remarque: Le lecteur intéressé par la mise en pratique de ces résultats pourra, au même titre que pour 
la régression simple, se référer au serveur d'exercices - section Méthodes Numériques - où il y a des 
exemples pratiques avec Microsoft Excel. 


Évidemment avec la régression linéaire multiple, nous pouvons maintenant, moyennant une astuce, faire 
de la régression linéaire de polynômes (nous verrons plus loin comment appliquer cependant directement 
la méthode des moindres carrés sur un polynôme). Effectivement, considérons un polynôme de la forme: 


Ÿ= ax +bx?+ex+d (57.237) 
Ce que nous pouvons considérer sous la forme: 
J=az+bwWw<+ex+d (57.238) 


Donc dans des tableurs du type Microsoft Excel, il suffit d'utiliser l'utilitaire d'analyse de la régression 
avec en variable d'entrée la colonne x, une deuxième colonne que l'on aura pris soin de créer avec le carré 
de x et qui sera donc considérée comme la variable explicative w et enfin la troisième colonne que l'on 
aura aussi pris le soin de créer comme étant le cube de x et qui sera donc considérée comme la variable 
explicative z. 


Nous pouvons aussi obtenir directement les coefficients de polynômes avec les fonctions déjà 
susmentionnées (mais vous n'aurez pas tous les résultats pertinents de l'Utilitaire d'Analyse). Par exemple 
pour un polynôme du deuxième degré: 


a: =INDEX(REGRESSION(y,x1{1,2}),1) 
b: =INDEX(REGRESSION(y,x1{1,2}),1,2) 
c: =INDEX(REGRESSION(y,x1{1,2}),1,3) 


et pour un polynôme du troisième degré: 
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: =INDEX(REGRESSION(y,x1{1,2,3}),1) 

: =INDEX(REGRESSION(y,x1{1,2,3}),1,2) 
: =INDEX(REGRESSION(y,x{ 1,2,3}),1,3) 
d: =INDEX(REGRESSION(y,x/{1,2,3}),1,4) 


NN © © 


C'est cette astuce qui permet de comprendre pourquoi et comment le coefficient de corrélation linéaire 
s'applique aussi aux polynômes dans la majorité des tableurs. Cependant nous pouvons avoir une approche 
plus directe qui ne nécessite pas de transformation mais qui dès lors est un peu plus longue. 


9.5. RÉGRESSION POLYNOMIALE 


Nous allons voir maintenant comment déterminer par exemple le meilleur polynôme du deuxième degré 

qui passe par un nombre quelconque de points mais sans transformer la fonction contrairement à ce que 

nous venons de faire juste avant! Comme nous aimons bien la physique sur ce site, nous allons reprendre 
un cas classique de la cinématique afin de joindre l'utile à l'agréable. 


Considérons donc que nous recherchons un polynôme du deuxième degré de la forme: 


1 
X = Xp +Wé + (57.239) 


sachant que la méthode est très facilement applicable à des polynômes de degré supérieur. 


Relation qu'il est d'usage d'écrire dans le domaine de la régression polynomiale sous la forme suivante: 
LE — 2 
i=Qq tete (6724) 
où i représente le nombre de points à notre disposition. 


Pour la suite, nous allons nous baser encore une fois sur la méthode des moindres carrés. En d'autres 
termes, nous cherchons les coefficients 4:£2:€3 qui minimisent l'erreur: 


h ñ ñ 2 
1 2 : 2 { 
8, = (di -d') = (dd) = {la +exé tout |-& | = Dia.e2es) (Gran 
i=1 i=1 i=1 
et nous réattaquons avec des dérivées partielles pour chaque coefficient: 
Pb Le! 3 Le! n 3 Le] 
—=9 2{c tot +osf —-d\=2| na +c25 4 #32 4 —- > d;|=0 (57.24) 
i=1 i=1 i=1 
Soit après simplification et un petit réarrangement: 
n ñn 3 n 
RC) +) > ë +3 > Ë = > d, (57.243) 
i=1 i=1 i=1 


De même: 
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8 h n n n Le] 
= ST le tete -di=2la ét NÉ 43 Dh |=0 (5724) 


i=] i=1 i=1 is] i=] 


Soit après simplification et un petit réarrangement: 
ñ ñ 5 ñ 3 ñ 
> 6 H+D>E +32 4 =) dit; (57.245) 


i=1 i=1 i=1 i=1 


Et enfin: 


sy 
Le) 


h h Le] Le! Le. 
ES late te -d\= 24 4 8 430 ST dtf |=0 (57246) 
3 i=1 i=1 i=] i=1 i=1 
Soit après simplification et un petit réarrangement: 

ñ 5 ñ 3 ñ 4 ñn 3 
D É +226 +32 4 =D) dit (57.247) 


i=1 i=| i=1 i=1l 


Donc en utilisant la notation de l'algèbre linéaire, nous avons finalement le système suivant à résoudre: 


ñ ñ 2 ñ 
LE 
n D D 24; 
i= i= {= 
| 
ñ ñ 2 ñ 3 ñ 
24 ZE ZX6lle|=| 2] (6724) 
i=] i=] i=1 c i=1 
ñ 2 ñ 3 ñ 4 ñ 2 
ZE 26 246 2 dif 


i=] i=] i= i=] 


et donc il suffit de résoudre ce simple système linéaire soit à la main en utilisant les relations démontrées 
dans le chapitre d'Algèbre Linéaire, soit avec un simple tableur (du type Microsoft Excel). 


9.6. RÉGRESSION LOGISTIQUE (LOGIT) 


Bien souvent, les données statistiques disponibles sont relatives à des caractères qualitatifs. Or, comme 
nous allons le voir, les méthodes d'inférence traditionnelles ne permettent pas de modéliser et d'étudier ce 
type de caractères. Des méthodes spécifiques doivent être utilisées tenant compte par exemple de l'absence 
de continuité des variables traitées ou de l'absence d'ordre naturel entre les modalités que peut prendre le 
caractère qualitatif. Ce sont ces méthodes spécifiques les plus usuelles qui feront l'objet du texte qui suit. 


Comme nous l'avons vu plus haut, la régression linéaire simple a donc pour but de modéliser la relation 
entre une variable dépendante quantitative (non bornée) et une variable explicative quantitative. 
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Lorsque la "variable de classe" Y à expliquer est binaire (oui-non, présence-absence, 0-1, etc.), l'idée est 
de nous approcher dans un premier temps de celle-ci par une fonction de probabilité P(F = 1), qui nous 
donne à l'opposé la probabilité d'appartenir à la classe F = 0 , que nous nommerons "régression 
logistique" ou "régression logit" ou encore "régression binomiale" (très souvent utilisée dans le cadre des 
réseaux de neurones formels que nous verrons plus loin). Ensuite, dans une deuxième étape, nous 
définissons pour un cas binaire une valeur "cutoff". Par exemple, si nous prenons un cutoff de 0.5 alors les 
cas pour lesquels PCF = 1) > 0.5 appartiendront à la classe 1 (et inversement dans le cas contraire). 


Remarques: 


R1. Au fait, la régression logistique n'est qu'une simple loi de distribution de probabilités dans le cas 
qui nous intéresse (nous verrons une autre régression logistique dans le chapitre d'Economie lors de 
notre étude des séries temporelles et encore une autre dans le chapitre de Dynamique des Populations) 


R2. Il n'est évidemment pas possible d'appliquer systématiquement la régression logistique à 
n'importe quel type d'échantillon de données! Parfois il faut chercher ailleurs. 


R3. Lorsque le nombre de modalités est égal à 2, nous parlons de "variable dichotomique" (oui-non) 
ou d'un "modèle dichotomique"; s'il est supérieur à 2, nous parlons de "variables 

polytomiques" (régression logistique polytomique). Le modèle logit est donc un "modèle 
dichotomique". 


Considérons par exemple la variable dichotomique: fin des études. Celle-ci prend deux modalités: "en 
cours", ‘a fini”. L'âge est une variable explicative de cette variable et nous cherchons à modéliser la 


probabilité d'avoir terminé ses études en fonction de l'âge. 
Exemple: 


Pour construire le graphique suivant, nous avons calculé et représenté en ordonnées, pour des jeunes 
d'âges x différents, le pourcentage de ceux qui ont arrêté leurs études. 


Figure: 57.8 - Partie de la population aux études en fonction de l'âge 
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Mais comment obtenons-nous pareil graphique avec une variable dichotomique??? Au fait c'est 
relativement simple... Imaginez un échantillon de 100 individus. Pour ces 100 individus supposez pour un 
âge donné que 70% "a fini” et 30% sont "en cours". Eh bien la courbe représente simplement la 
proportion des deux classes pour l'âge donné. Il est même parfois indiqué la grosseur des classes avec des 
cercles sur toute la longueur des asymptotes horizontales pour bien signifier qu'il s'agit d'une variable 
dichotomique. 


Les points sont distribués selon une courbe en S (une sigmoïde): il y a deux asymptotes horizontales car la 
proportion est comprise entre 0 et 1. Nous voyons immédiatement qu'un modèle linéaire serait 
manifestement inadapté (d'autant plus que la variable expliquée d'un modèle linéaire balaie tout l'ensemble 
des réels et ne se borne pas à l'intervalle [0, 1]). 


Cette courbe évoquera pour certains, à juste titre, une courbe cumulative représentant une fonction de 
répartition (d'une loi Normale par exemple, mais d'autres lois continues ont la même allure). Ainsi, pour 
ajuster une courbe à cette représentation, nous pourrions nous orienter vers la fonction de répartition d'une 
loi Normale, et au lieu d'estimer les paramètres a et b de la régression linéaire, nous pourrions estimer les 
paramètres #;% de la loi Normale (qui est très similaire à la loi logistique comme nous le démontrerons 
plus loin). Nous parlons alors d'un "modèle Probit". 


La loi qui va nous intéresser cependant est la loi logistique. Contrairement à la loi Normale, nous savons 
calculer l'expression de sa fonction de répartition (probabilité cumulée) qui est du type (c'est son premier 
avantage!): 


pour une variable de prédiction (explicative) x où P est donc une probabilité bien évidemment comprise 
entre 0 et 1. Nous verrons un peu plus loin la raison historique de ce choix. 


Nous voyons immédiatement que cette dernière relation étant la primitive de la fonction de distribution 
(voir la démonstration un peu plus bas) il s'agit donc bien d'une fonction de répartition puisque: 


Fe Ho  eŸ e 
| fax = FL, = an 


—2 


S'il y a plusieurs variables prédictives nous avons alors: 


etat + Hu 


D 
Ou Me à dep de 

Lorsque nous optons pour la fonction de répartition de la loi logistique, nous obtenons le modèle de 
régression logistique ou "modèle Logit" pour le choix de la "fonction de lien" et c'est là son deuxième 
avantage (le plus important!): nous pouvons faire des statistiques sur une variable binaire comme si nous 
faisions une simple régression linéaire! 


Ainsi, nous estimerons la probabilité cumulée d'avoir fini ses études pour un individu d'âge x par (il existe 
plusieurs manières d'écrire cette loi suivant les habitudes et le contexte) la fonction de répartition 
logistique suivante: 
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PE < » = ÉD 1 
_ Lee Cie jet VE) 
at 


il en découle donc la fonction de distribution: 


E —(ax+) 
f(x)= PU Lfi+e 8) l_ ae 


dx dx {+ tof (57.253) 


Évidemment, en fonction de la valeur de la probabilité nous associons à l'âge x le fait de ne pas avoir fini 
ses études (état associé à la valeur binaire: 0) ou de les avoir finies (état associé à la valeur binaire: 1). 
Indiquons que si a est posé comme unitaire, et b comme nul, nous avons alors la "loi logistique standard" 


donnée par: 


PIX £Ex\= 


re (57.254) 
2 


Nous pouvons calculer aussi l'espérance de la fonction de distribution en appliquant ce qui a déjà été vu au 
chapitre de Statistiques mais une partie de cette intégrale ne peut être résolue que numériquement par 
contre. Si nous posons: 


é=ax+b (57.255) 


comme étant la variable aléatoire alors nous pouvons calculer formellement l'espérance de la loi logistique 
(le lecteur aura peut-être remarqué que c'est comme si nous posions a comme valant 1 et b comme valant 
0). Effectivement, partant de: 


PIX < x)= DL 1,2 e” 
SAT en et Tr 67250 
il vient alors: 
+0 +0 a 
E(X) = [  Otat = [ TU (57257) 
—< æ(i+e") 


qui après une intégration numérique donne 0. Nous obtenons alors aussi le résultat suivant (si quelqu'un a 
le résultat analytique détaillé nous sommes preneurs!): 


v(x)= E(X?)-E(x) =E(x°)- T rca = 


—(© 


Ko 
[ maps (57.258) 


Ainsi, nous Voyons que si nous pOsOns: 
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P(X © x) = 7 
nai 
l+e 


1 
(57.259) 


Nous retombons sur une fonction de répartition ayant parfaitement les mêmes paramètres de position et de 
dispersion qu'une loi Normale centrée réduite (moyenne nulle et variance unitaire). 


La fonction de répartition: 


ax+b 


e 
P(X £x)=——— (57.260) 
1+62 


peut par ailleurs être transformée de la façon suivante: 


P.(1+6%%)= 68% = p4 pet = à pee (1- P) 


57.26 
L P (e 1) 


1 


> g2*tb 


d'où: 


P . 
ax +b = [: 5) =logit(P)| (57.262) 


Au fait c'est ici que réside l'astuce d'origine historique de la régression logistique. Nous transformons une 
variable P prenant ces valeurs dans 0 à 1 à l'aide du logarithme du rapport P/(1-P) en une variable prenant 
ses valeurs sur l'ensemble des réels et dès lors il est possible d'y associer une régression linéaire. Certes 
c'est empirique mais l'idée est bonne! 


Ce que certains écrivent aussi...: 
Logit(PP=UX=0)=10g| EVE D | Len 
1-F(F=UZXE= x) 


Le résultat de cette dernière transformation est appelé "logit". Il est égal au logarithme de "l'odds" (sur 
lequel nous reviendrons très vite plus en détails): 


P 
Os = —— (57.264) 


Donc lorsque les coefficients a et b ont été déterminés, l'expression précédente permet de déterminer P 
connaissant x facilement (il s'agit de résoudre une équation linéaire) et inversement! Par ailleurs, puisque x 
est une variable dichotomique les coefficients sont très facilement interprétables. 


À | 


Remarque: L'odds est également appelé "cote" par analogie à la cote des chevaux au Tiercé. Par 
exemple, si un cheval a 3 chances sur 4 d'être gagnant (donc in extenso 1 chance sur 4 d'être non- 
gagnant) sa cote est de 3 contre un 1, soit un odds égal à 3. 
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Revenons un peu sur l'odds car il est possible d'introduire la notion de fonction logistique en faisant la 
démarche inverse de celle présentée ci-dessus (soit de commencer par la définition de l'odds pour aller 
jusqu'au logit) et ceci peut parfois même s'avérer plus pédagogique. 


Supposons que nous partions de la taille (hauteur) d'une personne pour prédire si cette personne est un 
homme ou une femme. Nous pouvons donc parler de probabilité d'être un homme ou une femme. 
Imaginons que la probabilité d'être un homme pour une hauteur donnée est 90%. Alors l'odds d'être un 
homme est: 


odds = 


(57.265) 


1=P 


Dans notre exemple, l'odds sera de 0.90/0.10 soit 9. Maintenant, la probabilité d'être une femme sera donc 
de 0.10/0.90 soit 0.11. Cette asymétrie des valeurs est peu parlante parce que l'odds d'être un homme 
devrait être l'opposé de l'odds d'être une femme idéalement. Nous résolvons justement cette asymétrie à 
l'aide du logarithme naturel. Ainsi, nous avons: 


n()- In(9) = 2.197 et “(CE -d= DROLE 2197 (57266) 


Ainsi, le logit (logarithme de l'odds) est exactement l'opposé de celui d'être une femme de par la propriété 
du logarithme: 


[2 E] -in6-6) = -(n6)-60)=-1n(2 | (57.267) 
sd 


Exemple: 


Imaginons qu'une banque souhaite faire un scoring de ses débiteurs. Comme elle a plusieurs succursales 
elle (la banque) construit les tables de données (fictives..) suivantes pour certaines d'entre elles (toutes les 
succursales ne sont donc pas représentées): 


- 1% succursale: 


27 | 27200 | 
—— | 27700 | 


EEE a no 
| 28400 | 400 
— 900 


sn 57.4 - Scoring ln par montant de crédit succursale 1 


- 2 succursale: 
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DZ DNS D 
PE DE D 


DE E COS MS DE 
DEL A D D 
29900 | 5 | 0 


Tableau: 57.5 - Scoring débiteurs par montant de crédit succursale 2 


- 36 succursale: 


Can | | 8 — 
EE 


sn 7 
7400 
79900 5 | 0 


Tableau: 57.6 - Scoring débiteurs par montant de crédit succursale 3 


Nous pouvons voir que la proportion totale des bons débiteurs dans les trois succursales est de 
91/136 = 0.67. 


Quand le crédit est inférieur à 27'500, la proportion de bons débiteurs est de 2/27 = 0.07. Quand le 
montant des crédits est inférieur à 28'000 la proportion de bons débiteurs est de 19/51 0.37. 


Quand le montant des crédits est inférieur à 28'500, la proportion de bons débiteurs est de 64/108 = 0.59, 
et pour des montants inférieurs à 30'000 la proportion est de 91/136 = 0.67. 


Nous poserons pour cette régression logistique que F = 1 est un bon risque de crédit et F = 0 est un 
mauvais risque. Ensuite, nous créons le tableau suivant qui est un récapitulatif des données de toutes les 
succursales: 


27200 —=2/27-0.0741 
27700 =17/24-0.7083 


28'300 =26/30-0.8667 
28'400 =19/27-0.7037 
29'900 =27/28-0.9643 


Tableau: 57.7 - Proportion des bons débiteurs 


Ce qui donne graphiquement en Kilo-francs: 
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1 
09 
03 
07 
06 
05 
04 
03 
02 
0.1 


27 275 2 25 29 25 30 
Figure: 57.9 - Pourcentage cumulé des bons débiteurs en fonction du crédit 


Une fois ceci fait, nous utilisons la transformation en logit: 


P 
ax tb=h(. )=lei(e (57.268) 


Ce qui donne: 


F Momanterédit | Proportion P | Lot 


Tableau: 57.8 - Proportion des bons débiteurs et Logit 


Une régression linéaire par la méthode des moindres carrés donne: 


LD pe Le] ©, 


Figure: 57.10 - Logit des bons débiteurs en fonction du montant du crédit 


avec pour équation: 
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—51.1116+0.0018371x = u(: 


P 
5) =logit(P) (57.269) 


La fonction logistique avec sa représentation vient alors immédiatement (les unités de x sont en milliers de 
francs!): 


1 
PC £ =: 


+9 CSLI640 0018371x) (57.270) 


0.8 


0.6 


0.2 


28 29 30 31 


Ainsi, il est possible de dire dans cet exemple, quelle est la proportion P de bons ou mauvais payeurs en 
fonction d'une valeur de crédit X plus petite ou égale à une certaine valeur donnée. Puisque 0 est un 
mauvais risque de crédit, nous voyons que plus les crédits sont élevés, moins le risque est gros (dans ce 
cas fictif...). Par ailleurs, avec un logiciel comme Minitab, la différence entre les calculs (grossiers) 
effectués ici à la main et ceux effectués avec l'outil de régression logistique binaire du logiciel sont de 
l'ordre de 10% (car évidemment... Minitab utilise le concept des estimateurs de maximum de 
vraisemblance vus dans le chapitre de Statistiques pour déterminer les coefficients et la constante). 


Remarque: Les logiciels de statistiques n'utilisent pas les méthode des moindres carrés pour déterminer 
les coefficients mais la méthode de la log-vraisemblance (cf. chapitre de Statistiques). 


9.7. COEFFICIENT DE CORRÉLATION (DÉTERMINATION) GÉNÉRALISÉ 


Nous avons vu plus haut ainsi que dans le chapitre de Statistiques plusieurs formulations du coefficient de 
corrélation linéaire, qui mis au carré était alors nommé coefficient de détermination de Pearson. 


Nous avons également vu dans le chapitre de Statistiques le coefficient de corrélation non-paramétrique 
de Spearman mais celui-ci aussi est uniquement valable dans le cadre d'une relation linéaire (affine). 


Afin de généraliser cela, une définition empirique plus générale a été donnée (je n'en ai jamais vu la 
démonstration ni le nom de la personne qui est à l'origine de cette définition.): 
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Ainsi, pour n'importe quelle dépendance, nous cherchons les paramètres des équations souhaitées avec les 
techniques de recherche opérationnelle (voir plus bas dans ce chapitre) qui minimisent le coefficient de 
corrélation. 


Ainsi dans le cas particulier de la régression linéaire puisque nous avons: 
SCT=SCE+SCR (57.272 
Nous retrouvons alors: 


2 _, SCR_, SCT-SCE SCE 
ET: SCT LL SCF 


9.8. INTERPOLATION POLYNOMIALE 


Il existe de nombreuses techniques d'interpolation de polynômes plus ou moins complexes et élaborées. 
Nous nous proposons ici d'en présenter quelques-unes dans un ordre croissant de difficulté et de puissance 
d'application. 


9.8.1. COURBES DE BÉZIER (B-SPLINE) 


L'ingénieur russe Pierre Bézier (Peugeot), aux débuts de la Conception Assistée par Ordinateur (C.A.O), 
dans les années 60, a donné un moyen de définir des courbes et des surfaces à partir de points. Ceci permet 
la manipulation directe, géométrique, des courbes sans avoir à donner d'équation à la machine!! 


Le thème des Courbes de Bézier est une notion à multiples facettes, vraiment très riche, au croisement de 
nombreux domaines mathématiques très divers: Analyse, Cinématique, Géométrie Différentielle, 
Géométrie Affine, Géométrie Projective, Géométrie Fractale, Probabilités, Finance (courbe de Taux), … 


Les Courbes de Bézier sont par ailleurs devenues incontournables dans leurs applications concrètes dans 
l'industrie, l'infographie, … 


Voici l'approche mathématique de cette technique: 


D'abord, nous savons que l'équation d'une droite que nous noterons dans le domaine M (par respect des 
traditions) joignant deux points (x ,»),8(x,»2) est: 


M(t)=t(B-A)+A=(1-{)A+B (57.274) 


Ce qui est juste puisque lorsque £ = 0 nous sommes en A et lorsque £ = 1 nous sommes en B. Donc 
te [0,1] et le point M parcourt tout le segment [AB]. Par construction, si A et B étaient des masses 


physiques égales à l'unité, Af{(£) représenterait le barycentre (centre de gravité) du système pour un t 
donné. 
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Par définition, le segment [AB] est une "courbe de Bézier de degré 1" avec les points de contrôle A et B et 
les Polynômes 1-t et t sont les “"polynômes de Bernstein de degré 1". 


Construisons maintenant une courbe paramétrique en rajoutant une 2ème étape à ce qui précède: 


Figure: 57.11 - Courbe de Bézier avec un point supplémentaire 
1ère étape: 


- Soit Af,(£) le barycentre de (A,1-t) et (B, t) et où A, (£) décrit [AB]. 
- Soit f,(f) le barycentre de (B,1-ô et (C, à) et où Af,(£) décrit [BC]. 


2ème étape: 
- Soit M(?) le barycentre de {A (£),1—£1, M3(£),#1. 


Par construction, M(?) se situe donc à la même proportion du segment [4 (6), M (#)] que Af(£) par 
rapport au segment [AB] ou Àf;(£) par rapport au segment [BC]. 


La courbe obtenue est alors l'enveloppe des segments [4 (8), M ()] : en tout point M, la tangente à la 


courbe est donc le segment [W (8, M (#)]. 


Mb) décrit alors une Courbe de Bézier de degré 2, qui, par construction commence en À et se finit en C, et 
a pour tangentes [AB] en A et [BC] en C. 


C'est en fait un arc de parabole (que nous pourrions noter très logiquement [ABC ): 


(] 


Figure: 57.12 - Arc de parabole [ABC] 


Par le même schéma, nous pouvons définir une courbe de Bézier de n points À soit à =1...#. C'est ce que 
nous appelons "l'algorithme de Casteljau". Ainsi, soit: 
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Vrellx-1] (57275) 


Nous avons: 
B')= (1-84 7 (+4. Hi (6) (67.276) 
La récurrence se terminant pour: 
ao (4)=2 (67277 
Ainsi, pour # = 2 nous avons: 
ME=80 (9=(1-280(0+4.80,() (57278) 


Soit: 


Mo =80 (= (1-2) +4.80(9 =(1-2)8 +4. | (67270) 
Ainsi, nous avons forcément avec deux points l'équation d'une droite. 


Considérons maintenant M(Ô la courbe de Bézier d'ordre 3, nous avons donc les points définis par: 
MO=#"(1=(-298716+4.842(6) (67280) 


Nous avons par la relation de récurrence: 


(t)=8 

#0 = (1-00 (0 +45 0 
Po=a-00 +89 Gen 
(9 =01- FEU (6) 

#7 6)= (1-98 © +80) 

82 6) = A -080 (6 +80) 


9 (9 = 0-88 FA (0) 


où nous avons éliminé les termes contenant des points non déterminés. 


Nous avons donc: 
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HV @= (1-08 +18 
BH E= (1-08 +148 
MODEL HOES M0 
2 €) = (1 D8S (8) +485) (6) 


(57.282) 


Il vient alors: 
M) = (-2)((1-28 + }+(a-928 +48 ) (57.283) 
Et donc: 


M6 = (1-27 8 +24(1-2)B +222] (57.284) 


soit sous forme vectorielle (plus conforme à la notation mathématique d'usage): 


OP = M6) = Ne = OR +2(1-4 0 +08 (57.285) 
Y 


et sous forme matricielle: 


Î 3 ilfR 
M@=[ #1]-2 2 0[|8| 6720 
1 o oll2 


Par le même raisonnement, nous avons pour une courbe de Bézier d'ordre 4: 


M@=Q-1) 28 +3%(1-022 +3%2(1-98+8%2| (57287) 


soit sous forme vectorielle: 


OP = M(t)= Ne A-1) OR +3(1-1) 0 +32(1-10B+#087 (57288) 
Y 


Ce qui correspond de manière générique à: 
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Figure: 57.13 - Courbe de Bézier d'ordre 4 


Et là nous pouvons creuser un peu les coefficients en comparant les coefficients de Bézier des courbes 
d'ordre 2, 3 et 4. 


D'abord, reprenons la courbe de Bézier précédente: 
4 
M)=BE+BE +82 +BP =) BE (57289) 


2=l 


Nous remarquons d'abord aisément la proportionnalité suivante: 


B. 


me". sl {1-4} (57.290) 


et si nous regardons de plus près les coefficients, nous remarquons que nous avons aussi: 


ordre 2: 1 
ordre 3: 121 (57.291) 
ordre 4 1331 


Il ne s'agit ni plus ni moins que du triangle de Pascal!! Et donc les constantes sont simplement les 
coefficients binomiaux (cf. chapitre de Calcul Algébrique) donnés pour l'ordre n dans notre cas par: 


gra =D &-1) 
1 G_Dt-D-G-D) G-Dié-nl 


(57.292) 
Ainsi, les polynômes de Bernstein sont donnés par: 


(2—DI 
G—1)l@r-i)l 


B., 6 = “hi = 7 = Cr (= dé (57.293) 


et finalement les courbes de Bernstein d'ordre n par: 


MO=Y Ce (1- 7 PB (57.294) 
a 
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Au fait, si nous avions noté plus haut la somme sous la forme suivante: 
3 
MG) = BR +BA+BR+BER = TBE (57295) 
10 


Nous aurions alors les polynômes de Bernstein qui seraient donnés (ce qui est plus respectueux des 


traditions.) par: 
(57.296) 


B,,0)= Ce (1-4) 
C'est une relation très pratique car elle permet de calculer facilement et rapidement le polynôme 


correspondant à une courbe de Bézier d'ordre n. 


Nous avons alors: 


LG . 

x@ => c'é (1-6) x; 
10 | 
(57.297) 


rO= > Cr (1-9 y, 
i=0 


Remarque: Une courbe de Bézier est totalement modifiée dès que l'on déplace un point de contrôle. 


Nous disons alors que la méthode de Bézier est une "méthode globale". 


Un exemple très connu des courbes de Bézier d'ordre 3 est l'outil Plume des produits phares Adobe 
Photoshop ou Adobe Illustrator. Effectivement, ces deux outils créent une succession de courbes de 
Bézier d'ordre 3 dont le point À, est défini après coup à la souris en utilisant des poignées appelées 
"torseurs" dans le langage de spécialistes Adobe. Voici un exemple pris d'un de ces logiciels fait avec un 


tracé à la plume de 5 points (soit 4 splines): 
É 


| 


d Î LS | A | 
splines ordre 3 —— | 


Bb DRE 


Figure: 57.14 - Exemples de splines avec un logiciel de dessin 


Tant que l'utilisateur ne bouge pas les poignées de points alors tous les points sont alignés sur la droite 


Nous avons alors l'impression d'avoir une spline d'ordre 2. 


Exemple: 
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Un cercle, dessiné par un logiciel graphique est en pratique composé de 4 arcs de Bézier. Pour observer 
cette particularité, il suffit de dessiner un cercle avec Illustrator par exemple, puis de le sélectionner pour 
voir apparaître les points de contrôle des arcs de Bézier qui le forment. 


Nous allons nous intéresser à la meilleure façon de choisir les points de contrôle de ces arcs de sorte qu'ils 
ressemblent à des quarts de cercle, puis nous observerons la différence entre le dessin produit et un vrai 
cercle: 


Figure: 57.15 - Exemple de construction d'un cercle avec des courbes de Bézier 


Prenons le quart de cercle de rayon 1 centré à l'origine: 


Il est approché par un arc de Bézier dont les points de contrôle sont À ,F,,8,Æ4. Les extrémités de l'arc 


de Bézier étant Æ et À, il est naturel de choisir Æ 1,01 et Æ410,11. 


L'intuition nous amène à choisir 8 11,&i et Bi&,li et il reste à trouver une valeur positive de k de sorte 
que l'arc de Bézier ressemble à un arc de cercle. 


Nous obtenons ainsi l'équation paramétrique de l'arc de Bézier 


1 1 La 0 
fac lex | l+3201-2)° l+8 (57.298) 
y 0 k 1 1 


Soit: 
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x = (12) +312) +38 (1-6) 
3 


(57.299) 
vO= 1-2 & +38 (1—5\+4 


Nous pouvons par exemple chercher la valeur de k pour laquelle l'arc passe par le point: 


P=|—,— 1 (57300) 


2 2 


en £ = 0.5. Il devient alors très simple à partir de l'équation paramétrique de déterminer k. Il s'agit 
simplement pour x (ou pour y) d'une simple équation à une inconnue. 


9.8.2. MÉTHODE D'EULER 
Il s'agit là de la méthode numérique la plus simple (elle est triviale et dans l'idée assez proche de la 
méthode de Newton même si leur objectif n'est pas le même). En fait elle ne fournit qu'une approximation 


(au sens très large du terme) d'une fonction f{x) dont la dérivée est connue. 


Ici les points choisis sont équidistants, c'est-à-dire x, = x, +i# (h étant le "pas"). Nous notons f(x) la 
valeur exacte et y;, la valeur approchée. 


Il y a plusieurs méthodes pour procéder (comme souvent): 
1. Graphiquement: 
Nous nous déplaçons d'un pas h en x en suivant le vecteur de pente f{x,y) 


Par construction, nous savons (cf. chapitre de Calcul Différentiel Et Intégral) que (nous adoptons une 
notation un peu particulière dans ce contexte): 


Pi 2 f(x.) (67.301) 


qui correspond donc bien à la pente (non instantanée bien sûr!) en (x, y) de la "courbe intégrale" passant 
par ce point. D'où: 


Vu = H TA (X,H) (67.302) 
2. Analytiquement: 
Nous remplaçons dans la dernière relation y,,, par y(x; +#). Nous obtenons alors: 
vx +=» +Af x.y) (67303) 
appelée "équation aux différences pour la méthode d'Euler". 


L'application en est triviale et ne nécessite pas d'exemples particuliers. 
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9.8.3. POLYNÔME DE COLLOCATION 


Soit y = f(x) une fonction connue sous forme explicite ou sous forme tabulée, et supposons qu'un certain 
nombre de valeurs: 


fi = JG) 5=0,1..,# (57304) 
en sont données. Les points (x%,./) sont appelés les "points d'appui”. 


"Interpoler" f signifie estimer les valeurs de f pour des abscisses situées entre x, et x,, c'est-à-dire dans 


l'intervalle d'interpolation, par une fonction approximante y = px), qui vérifie les "conditions de 
collocations" (rien à voir avec votre colocataire!): 


y = p(x) 


Figure: 57.16 - Illustration du concept d'interpolation 


La fonction p s'appelle "fonction de collocation" sur les x. Lorsque p est un polynôme, nous parlons de 
"polynôme de collocation" ou de "polynôme d'interpolation". 


"Extrapoler" f signifie approcher f(x) par p(x) pour des abscisses situées "hors" de l'intervalle 
d'interpolation. 


Remarque: Il va sans dire que l'interpolation est un outil très important pour tous les chercheurs, 
statisticiens et autres. 


Quand nous connaissons un polynôme de degré n en n+1 points, nous pouvons donc connaître par une 
méthode simple (mais pas très rapide - mais il existe plusieurs méthodes) complètement ce polynôme. 


Pour déterminer le polynôme, nous allons utiliser les résultats exposés précédemment lors de notre étude 
des systèmes d'équations linéaires. Le désavantage de la méthode présentée ici est qu'il faut deviner à quel 
type de polynôme nous avons affaire et savoir quels sont les bons points qu'il faut choisir. 


Un exemple particulier devrait suffire à la compréhension de cette méthode, la généralisation en étant 
assez simple (voir plus loin). 
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Soit un polynôme du second degré: 


B(X) =@+ax+a@x (57305) 


et nous avons connaissance des points suivants (dont vous remarquerez l'ingéniosité des points choisis par 
les auteurs de ces lignes.…..): 


P(0) = 4,P(D =8,P(-D =2 (57306) 
Nous en déduisons donc le système d'équations: 


& +a0+a,0 = 4 
dj talt+at =2 (57.307) 
ay +a(-1)+a(-1)° =8 


Système qui une fois résolu dans les règles de l'art (cf. chapitre d'Algebre Linéaire) nous donne: 
dp= 4,4=—3,a, =1 (57.308) 
Voyons le cas général: 


Théorème: Soient (x%,/) des points d'appui, avec x; “ x; si î # j. Alors il existe un polynôme p,(x) de 


degré inférieur ou égal à n, et un seul, tel que p,(x%) = f pour à = 0,1,.,x#. 
Démonstration: 
Posons: 
Pa (2) = ay taxt.+a,x" (57.309) 
Les conditions de collocation: 
PP) = i=0,1...,# (57.310) 
s'écrivent donc: 
dy + 2% +432 +. + 4,2% © Je 
de +@% +a x +..+ax = f TT 
ay +, + @p2g + + aan © fe 
Il s'agit d'un système de n+1 équations à n+1 inconnues. 


Son déterminant s'écrit: 
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1% %  % 


D, = det 1 ñ x | le (x —3;) (57.312) 
: ë “ #22> 720 
LR A 2 4 


relation que nous appelons "déterminant de Vandermonde". Nous savons que si le système a une solution, 
le déterminant du système doit être non nul (cf. chapitre d'Algèbre linéaire), 


Montrons par l'exemple (en reprenant un polynôme du même degré que celui que nous avons utilisé plus 
haut) que le déterminant se calcule selon la relation suivante précédente (le lecteur généralisera par 
récurrence ): 


Donc dans le cas # = 2 , nous considérons le déterminant: 


1 2 
1% % 
1 2 
det|1 x x | (57313) 
l 1 
LE # 
qui correspond donc au système (pour rappel): 
&'l+a à + +a,x5 = 


G'ltax tar 


d'l+ax +a,x = 


= f. (67314) 


Î 


Calculons ce déterminant suivant la colonne 1 (en faisant usage des cofacteurs comme démontré dans le 
chapitre d'Algèbre linéaire): 


j, à 
1 % % À x» x À _ 
det|1 x xf]=1det|"t ‘1|-1det|"9 ‘îl+l.de|" 
5 H 2% GX % % A] (57.315) 
1 x x 
Es KA: 141, 11,41 +2 
6 A 49% * Mo LA 4 
Ce dernier polynôme peut s'écrire 
D, =(n-%)( -2%)(0 2%) (67316) 


Ce qui s'écrit: 


Comme les x sont dans l'énoncé de notre problème tous différents tels que x; * x; alors le système a une 
solution unique! Ce qui prouve qu'il existe toujours alors un polynôme d'interpolation. 


CIC.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Il convient cependant de noter qu'il ne s'agit pas d'une méthode de régression polynomiale. Car avec une 
méthode de régression polynomiale, nous pourrions choisir un degré supérieur au nombre de points que 
nous avons! 


9.8.4. MÉTHODE DE LAGRANGE 


La méthode d'interpolation polynomiale de Lagrange (très utilisée dans la pratique car l'algorithme est très 
simple et donc efficace) considère que nous avons initialement n + 1 points tels que: 


ÿ0 = f(x) 
n = f(x) 
(57.318) 
Y: = f(x) 
Ya = F\Xn) 


Et que nous cherchons donc un polynôme de collocation qui passe par tous les points. L'idée de 
l'interpolation polynomiale de Lagrange est alors simple et très astucieuse (comme toujours il fallait y 
penser...). Observez le graphique ci-dessous où nous avons 5 points par lesquels nous cherchons à faire 
passer un polynôme de colocation: 


-2 -1 0 L 2 


Figure: 57.17 - Illustration du concept d'interpolation de Lagrange (source: Wikipédia) 


Pour trouver le polynôme de colocation en rouge (supposez que nous ne le connaissons préalablement pas) 


, l'idée est que pour chaque Z; nous associons un polynôme de degré n et non nul en f { x; | mais nul en 


tous les autres points mesurés Æ; # À; et que tous les autres polynômes associés aux autres points Æ; y 


soient nul. Pour cela, comme nous le voyons dans le graphique ci-dessus, il faut donc que pour chaque 
point i nous ayons un polynôme associé qui ait n racines tel que: 
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= 4Hix-xmiix-xlx-%mlix-x 
AG)= Aix-2xpiix-x3ix-2x3 (x —-x4) 
22 = 4 ix-x0)(x-%)(x-243)(X-Xx4) (57.319) 
Ja) = A(x-xnl(x-%)(x-x l(x- x) 


Ja(x) = Aix-xmiix-mlx-xlx-x% 


Donc nous voyons bien que nous avons 5 polynômes, chacun avec 4 racines (donc de degré 4) et qui sont 
respectivement nuls sur tous les points 4; # 4; (vous pouvez le voir sur le graphique). Les coefficients 


4 sont des constantes à déterminer. 


Maintenant, rien nous nous empêche de sommer puisque pour chaque #; nous aurons toujours la bonne 


valeur f {x | (puisque les autres polynômes y sont nuls). Soit en généralisant l'écriture, la somme devient: 


P(x)=4{x-%)(x-x)(x-%)..(x-x,)+4(x-2%)(x-%)(x-x3).(x-2x,) 
(57.320) 
+A4(x-20).(x-x1)(x-x%u)..(x-2,)+4,(x-2xm)(x-%)i(x-x)..(x-x,1) 


En injectant respectivement 29,2% ;.,24;,..,%, dans la relation précédente, il vient: 


Pixmi=fimi=4i% A Ma -2xl(x-2x3)..(xn — 2%) 
Pln)i=finui=A(x-x0lA-2x2l(4-2x3)..(% —-2,) 
Pixi=fixi= Hz -MUx-2% l(x2-2x31..(x2 2,1) (57.321) 


Pixl=fiami= A (x 0m AUX li, x) 


Nous en déduisons alors immédiatement: 


fix 
_(0-4)(6-2 IX x |... (Zn — Xn | 
f(x) 
À = ——— 
UX —AQ IA Xl X — 43 ll A — An! 
fix) (57.322) 
À = ——————— 
LX3 — Àg IX TX IX T4 1x À, 
FX) 
_ Zn Ag 4 — A MX — À LU Zn — Xp | 


En substituant les valeurs des constantes dans l'expression initiale de la somme, nous obtenons: 
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(X=% (X-HM iX- 2% )..(X—-X, ) 
RQ SN pret 
Uäg — A lg — XX 2% 1... — nl 
(Xx—-xXnlix-xiix-xl.ix—X, |) 
 — 
(4-2 lIX4 —-Xll% —X31..(%4 —X,l 
(x—-zxpl(x-xm l(x-xl...(x-x,) 
FUXn) 


Ca 40) 7 4) 22 Ju  %1 ) 


Ce qui peut s'écrire sous forme condensée: 


de X— 3%; 
P(x)= | II ——|Zfx;)| 6734 
j=0 (0e; A5 À 
Où le terme: 
n 
X=7 
Lix;i= TI] x (67.325) 

i=0i#; "9 2 


est appelé "coefficients d'interpolations de polynômes de Lagrange". 
10. RECHERCHE DES RACINES 


Bien des équations rencontrées en pratique ou en théorie ne peuvent pas être résolues exactement par des 
méthodes formelles ou analytiques. En conséquence, seule une solution numérique approchée peut être 
obtenue en un nombre fini d'opérations. 


Évariste Galois a démontré, en particulier, que l'équation 2. (x) = 0 ne possède pas de solution algébrique 
(sauf accident...) si (x) est un polynôme de degré supérieur à 4. 


Il existe un grand nombre d'algorithmes permettant de calculer les racines de l'équation f (x) = 0 avec une 
précision théorique arbitraire. Nous n'en verrons que les principaux. Attention, la mise en oeuvre de tels 
algorithmes nécessite toujours une connaissance approximative de la valeur cherchée et celle du 
comportement de la fonction près de la racine. Un tableau des valeurs de la fonction et sa représentation 
graphique permettent souvent d'acquérir ces connaissances préliminaires. 


Si l'équation à résoudre est mise sous la forme £(x) = (x), nous traçons les courbes représentant g et h. 
Les racines de l'équation £g(x) = #(x) étant données par les abscisses des points d'intersection des deux 
courbes. 
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Remarque: Avant de résoudre numériquement l'équation f (x) = Ô, il faut vérifier que la fonction 
f choisie satisfasse certaines contraintes. Il faut par exemple, que la fonction f soit strictement 
monotone au voisinage de la racine x , lorsque la méthode de Newton est appliquée. Il est souvent 
utile, voire indispensable, de déterminer un intervalle [a,b] tel que: 


- fest continue sur [&,ë] ou € 
- f (a). f@)< 0 


- 37 unique, 7 E[a.b], f(x) = 0 


10.1. MÉTHODE DES PARTIES PROPORTIONNELLES 


La mise en oeuvre, sur calculatrice, de cette méthode est particulièrement simple. Les conditions à vérifier 
étant seulement: 


- fest continue 
- fest monotone dans un voisinage de la racine x 


Dans un petit intervalle, nous pouvons remplacer une courbe par un segment de droite. Il y a plusieurs 
situations possibles mais en voici une particulière généralisable facilement à n'importe quoi: 


F@ 


fx) 


Figure: 57.18 - Approximation d'une courbe par un segment de droite 


Sur cette figure, nous tirons à l'aide des théorèmes de Thalès (cf. chapitre de Géométrie Euclidienne)}: 


A 74 _An bd . 
f@ +) (57.326) 
d'où: 
= LP AGIR A CES a —(b 210 (57.327) 


F(@) — f(a) F@)- fa) 
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Si |f(&)| «| (B)|, nous pouvons négliger f{(a) au dénominateur et il vient: 


A Ta-(b-a) P =a-(b-a)k& (57.28) 


L'algorithme consiste donc à réaliser les étapes suivantes: 

1. Choisir a et b, calculer f(a) et f{b) 

2. Déterminer 4=a-{b-a)k,Si | fix | est assez petit, nous arrêtons le calcul et affichons x, et 
fix) 

3. Sinon nous procédons comme suit: 

- nous remplaçons b par a et f(b) par f{(a) 

- nous remplaçons a par x, et f(a) par fix 

- nous retournons au point (2) 

10.2. MÉTHODE DE LA BISSECTION 

La condition préalable à satisfaire pour cette méthode est de trouver un intervalle [&4,ë] tel que: 
1. fx) est continue sur [a,b] 

2. fa)". f(b) < 0 

Il faut encore fixer £& > 0 qui est défini comme la borne supérieure de l'erreur admissible. 
La méthode consiste à appliquer successivement les 4 étapes suivantes: 

1. Calcul de x = (& +b)/2 

2. Évaluation de f(x) 

3. Si |[f(n|< # alors le travail est terminé, il faut afficher x et f(x) 

4. Sinon on procède comme suit: 

- on remplace a par x si f(x)" f(a) > 0 

- on remplace b par x si f(x)" f(b) > 0 ou f(x)" fa) < 0 

- on retourne en (1) 


L'étape (3) impose la condition | FE (»| < & pour l'arrêt des calculs. Il est parfois préférable de choisir un 


autre critère de fin de calcul. Celui-ci impose à la solution calculée d'être confinée dans un intervalle de 
longueur € contenant x . Ce test s'énonce comme suit: 
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3. Silb-al< #, le travail est terminé et x = (a +)/{2 est affiché. Il est bien sûr évident que 
[x-x|<e/2 


10.3. MÉTHODE DE LA SÉCANTE (REGULA FALSI) 


La méthode de la sécante (ou "regula falsi" pour: régulièrement fausse) en méthodes numériques, est 
toujours un algorithme de recherche d'un zéro. Pour voir cela, considérons le schéma suivant: 


Figure: 57.19 - Illustration de la méthode de la sécante 


Les conditions préalables sont les suivantes: 
Il faut déterminer un intervalle [a,b] tel que: 
1. f(x) est continue sur [a,b] 

2. (a) f(E) < 0 


Si À est le point de coordonnées (x, ,0), alors les points À, 8,Æ, sont alignés sur la sécante. La 
proportion suivante (Thalès) est donc vraie: 


ab _ f(@)-f@) 


pres F@-0 (57.329) 


nous en déduisons: 


x - 4 @) 7 Ef(a) 
". f(&)-f(a) 


La méthode consiste à appliquer successivement les étapes suivantes: 


af (&) — àf (a) 


1. Calcul de x, = fG)= fa) 
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2. Évaluation de f(x, ) 


3. Si [f(x )l< &, le travail est terminé. Il faut afficher x, < # 

4. Sinon nous procédons comme suit: 

- nous remplaçons a par x, si f(x,)' fa) > 0 

- nous remplaçons b par x, si f(x,)' f(b) > 0 ou f(x,)' fa) < O 
- nous retournons en (1) 


La condition (3) peut être remplacée par la condition: 


3". Si Es = 4 < €, alors le travail est terminé et nous affichons x, 


Remarque: Si l'intervalle [a,b] contient plusieurs racines, cette méthode converge vers l'une d'entre 
elles. Toutes les autres sont malheureusement perdues. 


10.4. MÉTHODE DE NEWTON 


Quelques années après sa découverte de théorie de la gravitation, Newton développa un technique 
extraordinaire qui permet de calculer les solutions d'une équation quelconque avec une rapidité 
(convergence phénomènale). Cette convergence surnaturellement rapide a ét utilisée pour démontrer 
certaines des résultats théoriques les plus marquants du 20ème siècle: le théorème de stabilité de 
Kolmogorov, le théorème de plongement isométrique de Nash... À elle seule, cette technique transcende 
la distinction entre mathématique pure et mathématique appliquée. 


Pour étudier la méthode de Newton (appelée aussi "méthode de Newton-Raphson" ou encore "schéma 
d'approximation de Newton") dans le plan (donc à une variable explicative), considérons la figure 
suivante: 


Ÿ 
FER IT 
fix -- 


4, 

ë 

i 

l 

' 

' 

l 

t 

SN ESS 4 


4 


à 


42 


Figure: 57.20 - Illustration de la méthode de Newton dans le plan 
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Si x, est une approximation de la racine x , nous remarquons que x, en est une meilleure. x, est 


l'intersection de la tangente à la courbe en (x,,.f(x)) et de l'axe des abscisses. x; est encore une 


meilleure approximation de X , x, est obtenu de la même manière que x, mais à partir de (x,,f(x)). 
La méthode de Newton consiste en la formalisation de cette constatation géométrique. 


Pour utiliser cette technique, rappelons que si nous prenons une fonction f qui est dérivable en x,, alors 
nous pouvons la réécrire sous la forme (cf. chapitre de Calcul Différentiel Et Intégral): 


f(x) = f(o)t f(x 2) + x -2%) (57.331) 


où j '(x) est la dérivée de fen x, et S{x- x,) est une fonction qui tend vers 0 comme {x- x,)}* pour 


# 2 2 lorsque x tend vers x, (c'est un terme correctif qui sous-tend la suite des termes du développement 
de Taylor). 


En appliquant ce résultat à la résolution de f(x) = Ô, nous obtenons: 
O= fx) = fit SR - 2) + HT -2) (57332) 


La fonction SX - x;,) empêche la résolution de cette équation par rapport à x . En négligeant le terme 


SX — x), l'équation se réécrit: 
0=f)= f()t FH) 2%) (67333) 


et se résout aisément par rapport à x. Pour voir cela, commençons par X = X : 


Mais x, ne satisfait pas, en général, l'égalité f(x,) = 0. Mais comme nous l'avons déjà souligné, 


| W (x)| est plus petit que | FX } si la fonction f satisfait à certaines conditions. 
La méthode de Newton consiste à remplacer l'équation: 
0= f(x) = fr) + f'o)X -%) (67.335) 
par: 
0O=J(x,) + FX x A) (67.336) 
et à résoudre itérativement cette équation. 


Les conditions suivantes sont suffisantes pour assurer la convergence de la méthode: 
Dans un intervalle [a,b] comprenant x, et x il faut que: 


1. La fonction soit deux fois dérivable 
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2. La dérivée f' ne s'annule pas (monotonie) 


3. La deuxième dérivée soit continue et ne s'annule pas (pas de point d'inflexion) 
Remarque: Il suffit souvent de vérifier les conditions (1) et (2) pour que le processus soit convergent. 


La condition (2) est évidente, en effet si f'(x) = Ô alors l'itération peut conduire à une erreur de calcul 
(singularité). 


La condition (3) est moins évidente, mais le graphique suivant illustre un cas de non-convergence. Dans 
ce cas, le processus a une boucle calculant alternativement x, et x;. 


JU) © 


( 
ES ET RS 


Figure: 57.21 - Exemple de cas de non-convergence avec la méthode de Newton 


Si la fonction f est donnée analytiquement, sa dérivée peut être déterminée analytiquement. Mais dans 
bien des cas, il est utile, voire indispensable de remplacer f '{x,} par le quotient différentiel: 


J'(A) = Fu * #7 F Ga) Ga * É FE) (57.337) 


où h doit être choisi suffisamment petit pour que la différence: 


FE FC +7) 7 FC) : F Ga) (57.338) 


soit elle aussi suffisamment petite. 
L'itération s'écrit alors: 


Fo) 
JG, th) f(x) 
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Si la méthode de résolution est convergente, l'écart entre %,,, et X diminue à chaque itération. Ceci est 


assuré, par exemple, si l'intervalle [a,b] contenant %,,,, voit sa longueur diminuer à chaque étape. La 
méthode de Newton est intéressante car la convergence est quadratique: 


bu -#<alx, -7f (57340) 


alors que la convergence des autres méthodes est linéaire: 


NI 


lu = 71< @lx, -X] (67.341) 


Considérons, par exemple, la méthode de la bissection vue précédemment. À chaque itération la longueur 
de l'intervalle [a,b] diminue de moitié. Ceci nous assure que l'écart 2 = x| est réduit de moitié à chaque 
étape du calcul: 


lu = 71 <0.5k, -X7| (57.342) 


Pour démontrer la convergence quadratique de la méthode de Newton, il faut utiliser les développements 
limités de feet f' au voisinage de x : 


JG) 8 FR) + 40 DS +0 = DJ 
on | | (57.343) 


J') = SR + LG = DJ" 


Mais: 


donc: 


LG DS + EG 77") 


(57345) 


sD+ < is nf" 


En soustrayant x à gauche et à droite de l'égalité et en mettant les deux termes du second membre au 
même dénominateur, il vient: 


. - OSF'"CXx 
Au TE 7) _— (57.346) 
FO) + CG -2)f ER) 
et dès que x, — X est assez petit, le dénominateur peut être simplifié. 
- inst 
Zn FER A) OS (57.347) 
FX) 
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ce qui montre bien que la convergence est quadratique. 


Signalons enfin que nous étudierons la méthode de Newton à plusieurs variables dans le cadre de l'étude 
de la recherche (optimisation) non linéaire. C'est le choix pédagogique qui nous a semblé le plus 
judicieux. 


Voici une application avec Maple 4.00b de cette méthode: 


> with(plots): with(plottools): 

Une fonction quelconque dont on cherche la racine 

> f:=x->exp(x)*x/ 2-36; 

> D); 

> Définition du point de départ 

> x[0]:=3; 

Définition du nombre d'étapes 

> n:=7; 

Équation de la tangente 

> gx fGli-1)+D(GLi-1*(-xi-11); 

> for i from 1 by 1 to n do; 

> x[il:=evalf(solve(g(x)=0,x)); 

> od; 

> lines:={}: 

> for i from 1 by 1 to n do; 

> lines:=lines union {line([xli-1],01,[x[i-1],f(xli-11],color=green), line([x{i-1],f(xfi-11)],[xti],0] 
,color=green)}; 

> od: 

On peut jouer avec le x=.... pour mieux voir les itérations sur le graphique 
> display({plot(f(x),x=2..3.01)} union lines); 


x 
Figure: 57.22 - Application avec Maple 4.00b de la méthode de Newton 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


11. DÉRIVÉES NUMÉRIQUES 


De nombreuses techniques de modélisation ou de résolution numériques que nous verrons plus loin 
utilisent les dérivées comme la recherche d'optimum (voir plus loin), les méthodes des éléments finis (voir 
plus loin). Par exemple, pour ne citer que le cas le plus connu, le solveur de MS Office Excel des versions 
2007 et antérieures propose quelques unes des dérivées numériques que nous allons étudier ici et réutiliser 
plus loin: 


Options du solveur 


Temps max: 100 secondes 


Itérations: 5000 


Précision: 0,000001 


Tolérance: 


Convergence: 0,0001 


[ ] Modèle supposé linéaire Échelle automatique 


[] Supposé non-néaatif  [] Afficher le résultat des itérations 
Estimations Recherche 
@) Tangente À droi © Newton 


© Quadratique (©) Gradient conjugué 


Figure: 57.23 - Capture d'écran du solveur de MS Excel 2003 


Afin de permettre donc un traitement sur calculateur, les différentes dérivées présentes dansde nombreux 
algorithmes doivent être approchées numériquement. Pour ce faire, nous utilisons le principe des 


différences finies centrées qui s'appuie sur les développements en série de Taylor suivants (cf. chapitre 
Suites Et Séries): 


x k # Ji#) 
titi D 1290) = +. = SG) : 1 à (57.348) 


il dx" = kl 


Nous avons alors sur la base de ce principe le développement au deuxième ordre: 


2 
d d d 
(x +%)= 700 + f "(70 +) "x | +. 
(57.349) 
3 
d d d 
A4) bre) 


Il alors en négligeant les termes d'ordre supérieur et en soustrayant et simplifiant les deux séries ci-dessus: 


(57.350) 
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Relation que nous appelons "dérivée centrée avec estimation tangente" (car nous négligeons tous les 
termes non linéaires). Nous retrouvons également souvent cette dernière relation sous la forme suivante: 


F2 +hl- f(x —h) 
| 2h 


(x) +0l#2| (67351) 
FX 


Maintenant, voyons ce que nous appelons les "dérivées à droite" ou aussi "dérivées avant" ("forward 
derivate" en anglais) qui consistent simplement dans l'application de l'algorithme intuitif suivant: 


à — fix) 
fx = FGa)7 70) = (57.352) 
X4 À 


et accessoirement nous pouvons aussi définir les "dérivées à gauche", appelées également "dérivées 
arrières" ("backward derivate" en anglais): 


| _f(%)-f(%1) L 
SUR = (57353) 
À; — À; 


Donc nous voyons que les dérivées centrales nécessitent plus de calculs mais sont aussi plus précises. 


Nous pouvons également développer des relations plus élaborées en prenant des développements de 
Taylor à des ordres supérieurs et donc c'est sans fin. 


12. INTÉGRALES NUMÉRIQUES 


Considérons la figure suivante: 


( a b 


Figure: 57.24 - Illustration d'un intervalle sous une courbe 


Nous désirons calculer l'aire comprise entre l'axe x, la courbe de f et les droites d'équations x = & et 
x =. Nous supposons dans ce cas que la fonction f est à valeurs positives: 


f)20Vxela,b] (57354) 
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Ce problème, dans sa généralité, est difficile voire impossible à résoudre analytiquement. Voici donc 
quelques méthodes numériques permettant le calcul approché de cette aire (ces méthodes sont utilisées 
parfois dans les entreprises par les employés qui n'ont que des tableurs du type Microsoft Excel ou 
OpenOffice Calc pour calculer des intégrales). 


12.1. MÉTHODE DES RECTANGLES 


Nous subdivisons l'intervalle [4,2] en n sous-intervalles dont les bornes sont x;. Les longueurs de ces 
sous-intervalles sont À, = x,,, - %. Nous construisons les rectangles dont les côtés sont # et f(x). 


FSI 


0| Æ=4 x X ZX Xn = D 
Figure: 57.25 - Approche de l'aire sous une courbe par des rectangles inférieurs gauche 


L'aire de ces rectangles vaut: 


#1 LE 
4 =D Ga 2) () DR S(G) (67355) 
i=0 30 


Si les , sont suffisamment petits, 4; est une bonne approximation de l'aire cherchée approchée par la 
gauche. 


Nous pouvons recommencer cet exercice en choisissant 4 et f(x,,,) comme côtés des rectangles (donc 
l'approche par la droite). Nous obtenons alors: 


#1 #1 


An = D in 4) ru) D Aa) (67356) 
iÎÙ i 


La figure correspondante est la suivante: 
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01 Æ0-4 x X À Xn = D 
Figure: 57.26 - Approche de l'aire sous une courbe par des rectangles supérieurs droite 


Encore une fois, l'aire de ces rectangles approche l'aire cherchée. Afin de simplifier la programmation, il 
est utile de choisir des intervalles de longueur identique: 


ka … A =h Vi (57.357) 


Si nous avons n rectangles, h vaut alors (à -a)fx. Les aires 4, et À; deviennent: 


LES #1 
An AD f(x) 4 =hD f(x) (67358) 
30 10 


12.2. MÉTHODE DES TRAPÈZES 


Afin d'augmenter la précision des calculs, il est possible de calculer: 


_ (4, +4,) 


# 2 


(57.359) 


Dans le cas où tous les intervalles sont de longueur égale, 4 vaut: 


#1 #-1 # 4-1 
4e Sy) xl Dre + 70s)| 
2 10 3 2 i=] iÎÙ 


, ii (57.360) 
- A6 +2Ÿ f(x) + ©) 


il 


Il existe une foule d'autres méthodes permettant la résolution de ce problème (dont la méthode de Monte- 
Carlo que nous verrons plus loin). 


Dans le cas où la fonction f n'est pas à valeurs positives, nous ne parlons plus d'aire mais de "somme de 
Riemann". Les sommes à calculer sont alors: 


x] x] 
Sn=hù f(xu) Se=hD f(x) (67361) 
iLÙ 1 


et: 
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x] 
S, = HE + Ja)+f)| 6736) 


il 


Tous les calculs doivent être conduits de la même manière, mais les résultats peuvent être positifs, 
négatifs ou nuls. 


13. PROGRAMMATION (OPTIMISATION) LINÉAIRE 


L'objectif de la programmation linéaire (P.L.) est de trouver la valeur optimale d'une fonction linéaire 
soumise à un système d'équations d'inégalités constitué de contraintes elles aussi linéaires. La fonction à 
optimiser est baptisée "fonction économique" (utilisée en économie dans le cadre d'optimisations) et on la 
résout en utilisant une méthode dite "méthode du simplexe" (voir plus loin) dont la représentation 
graphique consiste en un "polygone des contraintes". 
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Remarques: 


R1. La programmation linéaire est beaucoup utilisée (pour ne citer que les cas les plus connus) dans la 
logistique (problème à flot maximal dit aussi "problème de transport"), la finance d'entreprise ou 
encore aussi en théorie de la décision lorsque nous devons résoudre un jeu à stratégie mixte (voir le 
chapitre de Théorie de la décision et des jeux pour un exemple pratique). C'est pour cette raison que 
Microsoft Excel 12.0 et antérieur intègre un outil appelé le "solveur" dans lequel il existe une option 
appelée "modèle supposé linéaire" qui alors impose l'utilisation du modèle du simplexe que nous 
allons voir ci-après: 


Options du solveur ?1x| 


ES 
Itérations: Foo Annuler | 
Précision: [0,000001 Charger un modèle. 
Tolérance: [5 + Enregistrer le modèle. | 
Convergence:  [o,0001 Aide | 
[reenmene] 1 étuis again 


Rendre les variables sans contraire non négatires 
— ps 


Méthode de résolution 


Sélecticenez le moteur GRG non inéaire pour des problèmes non linéaires simples de soiveur, 
Sélectionnez le moteur Simplex PL pour les problèmes Inésires, ét le moteur Évolutionnaire pour les 
problèmes complexes. 


Crée (rm 
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R2. Dans le cadre de la résolution de problèmes où interviennent des produits de deux variables, nous 
parlons alors logiquement de "programmation quadratique" ou plus simplement de "programmation 
non linéaire", C'est typiquement le cas en économétrie dans la modélisation des portefeuilles (cf. 
chapitre d'Economie) ou dans le prévisionnel. Nous étudierons par ailleurs plus loin une version 
simplifiée et particulière des modèles correspondants qui sont: la méthode de Newton, de quasi- 
Newton, des gradients conjugués et la GRG non linéaire. 


R3. Les programmations quadratique et linéaire sont réunies dans le cadre général de ce que nous 
appelons la "recherche opérationnelle". 


La recherche opérationnelle a pour domaine l'étude de l'optimisation de processus quels qu'ils soient. Il 
existe de nombreux algorithmes s'inspirant des problèmes du type de ceux exposés lors de notre étude de 
la programmation linéaire. Nous nous attarderons en particulier sur l'algorithme le plus utilisé qui est 
"l'algorithme du simplexe". 


Lorsque l'on peut modéliser un problème sous forme d'une fonction économique à maximiser dans le 
respect de certaines contraintes, alors on est typiquement dans le cadre de la programmation linéaire. 


Soit une fonction économique Z telle que: 
seu ron TT Dur (57.363) 

où les x, sont des variables qui influent sur la valeur de Z, et €, les poids respectifs de ces variables 
modélisant l'importance relative de chacune de ces variables sur la valeur de la fonction économique. 
Les contraintes relatives aux variables s'expriment par le système linéaire suivant: 

ann + mt. taux À 

anA + pt. t@,x < B, 4 

Eye À ii Ly2X3 Poe Ex An < By 


Sous forme générale et matricielle ce genre de problème s'écrit: 


Exemple: 


Une usine fabrique 2 types de pièces P1 et P2 usinées dans deux ateliers A1 et A2. Les temps d'usinage 
sont pour P1 de 3 heures dans l'atelier A1 et de 6 heures dans l'atelier A2 et pour P2 de 4 heures dans 
l'atelier A1 et de 3 heures dans l'atelier A2. 
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Le temps de disponibilité hebdomadaire des ressources humaines (ouvriers) de l'atelier A1 est de 160 
heures et celui de l'atelier A2 de 180 heures. 


La marge bénéficiaire est de 1'200.- pour une pièce P1 et 1'000.- pour une pièce P2. 
Quelle production de chaque type doit-on fabriquer pour maximiser la marge hebdomadaire? 
Le problème peut se formaliser de la façon suivante (formulation canonique): 
A1:3x, +4x, <160 
A2: 6x, + 3x, < 180 (57.366) 
Xi, Xa 20 
La fonction économique à maximiser étant: 


Z =1"200x, +1'000x, (57.367) 


Résolution graphique du problème (ou méthode du "polygone des contraintes"): les contraintes 
économiques et de signe sont représentées graphiquement par des demi-plans. Les solutions, si elles 
existent, appartiennent donc à cet ensemble appelé "région des solutions admissibles": 


Ga +3x2 = 180 


Région des 
solutions 
adrnissib les 


X1 +dx3 = 160 


Figure: 57.27 - Illustration d'un problème de recherche opérationnelle simple avec région des solutions admissibles 
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Remarque: Dans le cas général, pour ceux qui aiment le vocabulaire des mathématiciens.., la donnée 
d'une contrainte linéaire correspond géométriquement à la donnée d'un demi-espace d'un espace à n 
dimensions (n étant le nombre de variables). Dans les cas élémentaires, l'ensemble des points de 
l'espace qui vérifient toutes les contraintes est un convexe limité par des portions d'hyperplan (voir le 
cas 2 variables, facile à illustrer). Si la fonction de coût est linéaire, l'extremum est à un sommet (facile 
à voir). L'algorithme du simplexe de base (voir plus loin) part d'un sommet et va au sommet d'à côté 
qui maximise localement le coût. Et recommence tant que c'est possible. 


Pour trouver les coordonnées des sommets, on peut utiliser le graphique si les points sont faciles à 
déterminer. 


Il s'agit donc de chercher à l'intérieur de ce domaine (connexe), le couple (x,,x,) maximisant la fonction 
économique. 


Or, l'équation Z est représentée par une droite de pente constante (-1.2) dont tous les points Eu: %) 
fournissent la même valeur Z pour la fonction économique. 


En particulier, la droite 1°200x, +1"000x, passe par l'origine et celle-ci fournit une valeur nulle à la 
fonction économique. Pour augmenter la valeur de Z et donc la fonction économique, il suffit d'éloigner 
de l'origine (dans le quart de plan x, > 0, x, > 0) la droite de pente -1.2. Évidemment on remarque alors 


très vite que la méthode du simplexe ne fonctionnera plus si le polygone des contraintes ne contient pas 
l'origine! 


Pour respecter les contraintes, cette droite sera déplacée, jusqu'à l'extrême limite où elle n'aura plus qu'un 
point d'intersection (éventuellement un segment) avec la région des solutions admissibles. 


ep? 


1200x1 + 1000xz = 0 1200x1 + 1000xz2 = z0 


Figure: 57.28 - Recherche de solutions graphiquement avec la droite de la fonction économique 
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La solution optimale se trouve donc nécessairement sur le pourtour de la région des solutions admissibles 
et les parallèles formées par la translation de la fonction économique s'appellent les "droites isoquantes" 
ou "droites d'isocoûts"… 


Voyons maintenant comment résoudre ce problème de manière analytique avant de passer à la partie 
théorique. 


Nous avons donc le "système canonique": 


A1: 3x + 4x, <160 
A2: 6x, + 3x, < 180 


(57.368) 


Xi, 2% 20 


avec: 
Z =1"200x, +1'000x, (57.369) 


Nous introduisons d'abord les "variables d'écart" afin de transformer les 2 inégalités en des égalités. Le 
système d'équations prend alors une "forme standard": 


3x + 4x, +a:x3 = 160 
6x + 3x3 +b-x4 = 180 (57.370) 
1'200x +1'000x, =Z 


Donc pour “1° #2 < 0 fixés, les variables d'écarts dont les coefficients sont toujours unitaires, mesurent la 


distance à parcourir jusqu'aux sommets. 


Il va sans dire que la technique des variables d'écart peut être utilisée pour les systèmes linéaires (ou non 
linéaires). Dès lors, un système d'optimisation contrainte avec inégalités, peut toujours être ramené à un 
système d'optimisation avec égalités. 


Remarque: Il y a autant de variables d'écart que d'inéquations! 


Pour la suite, nous avons remarqué, suite à une relecture de ce chapitre, que la technique des tableaux 
souvent présentée dans les livres et sur les sites Internet n'apportait finalement absolument rien à la 
compréhension profonde du mécanisme de résolution (même si pour programmer informatiquement la 
méthode cela est plus pratique). Comme le but de ce site est de démontrer toujours avec le maximum de 
détails le principe de fonctionnement des choses il va donc de soi que nous allons opter pour une approche 
purement algébrique. Voyons donc cela en revenant au système avec les variables d'écart et la fonction 
économique mais un peu réarrangée: 


X3 =160- (3x +4% | 
xa =180-(6% +3x) (57.371) 
Z=1"200x +1'000x;, 


La contrainte A1 devient alors: 
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et la contrainte A2 devient respectivement: 
Xa 20 (57.373) 
Dès lors, le problème se résume à maximiser Z avec les contraintes: 
X,22,233,X4 20 (57.374) 


Partons donc d'une solution réalisable évidente qui au vu des contraintes est trivialement: 


Dès lors, avec le système: 


3 =160-(3% +4) 


SI 
Co 
SJ 
(ep) 
— 


xa =180-(6% +3x) (57: 
Z=1"200x +1'000x;, 


nous trouvons immédiatement: 


x3 = 160 
x4 =180 (57.377) 
Z=0 


Les paramètres dans l'état actuel peuvent se résumer à: 
4 =0,x% =0,x3 =160,x4 = 180 (57378) 


Pour progresser, le but sera de faire croître Z et pour cela nous allons ne faire croître qu'une variable, en 
choisissant celle qui a le plus grand coefficient (poids) dans: 


Z=1"200x +1'000x; (57.379) 


c'est-à-dire 4 (nous pensons que c'est ainsi que Z croîtra le plus vite). Nous parlons alors de À; comme 


"direction du pivot". Nous gardons donc x> = Ü et nous faisons croître # avec le système qui se réduit 


alors à: 
43 = 160 — 3% 
x4 =180-6x (57.380) 
Z=1"200x 


Avec donc x = 0 et pour commencer x; = 1, nous avons: 
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x3 = 160-3=157 
x4 =180-6=154 (57.381) 
Z =1'200 


et nous voyons que les contraintes X,%2,%,%4 > Ü sont toujours respectées, il en va de même si # vaut 


2, 3, 4,5, … et ce jusqu'à 31, car dès lors: 


x3 =160-3.31=67 
44 =180-6-31=-6 (57.382) 
Z =1'200.31= 37'200 


et l'une des variables d'écart étant devenue négative, les contraintes *,%2,%,X4 20 ne sont plus toutes 


satisfaites et donc cette solution n'est pas réalisable. 


La question dans le cas général consiste à se demander jusqu'à combien (la valeur la plus contraignante, in 


extenso la plus petite) nous pouvons faire croître # tout en maintenant la condition ,%2,%3,x4 Z Ù 


lorsque x3 = Ô ? Et la réponse est assez simple: 


X3 =160-3x% — À AL 


xa =180-6% — x = 30 
et donc il s'agit de: 
x = 30 (57.384) 
Nous parlons alors parfois du "pas du pivot". Nous avons alors la solution actuelle: 
x = 30,x2 = 0,x3 = 70,x4 =0 (57365) 
Ce qui donne: 
Z =1'200.30= 36 000 (57.386) 


Graphiquement parlant, voilà à quoi correspond ce que nous venons de faire: 
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6x + 3x) = 180 


Régiondes 
solutions *. 
admissibles +. 
direction et pas du pivot 
Es , 


70 4 


3x +4x = 160 


1200x +1000x = 0 


Figure: 57.29 - Direction du pivot avec arrivée au point (30, 0) 


Pour continuer à faire croître aussi simplement Z (en ne faisant croître qu'une variable), il nous faut 
un nouveau système d'équations similaire au système initial: 


x3 =160-(3x +4x | 
xa =180-(6% +3x2) (57.387) 
Z=1"200x +1'000x;, 


où nous avions exprimé les variables qui prennent une valeur non nulle en fonction des autres qui prennent 
une valeur nulle, c'est-à-dire X3,%4 en fonction de *,X2 puisque nous avions pour rappel: 


4 =0,x% =0,x3 =160,x4 =180 (57.388) 


Pour la suite, il nous faut exprimer :#%3 ainsi que Z en fonction de X3, X4 puisque nous venons d'obtenir 
pour rappel: 


x = 30,x3 = 0,x3 = 70,x4 =0 (57389) 
Avant d'obtenir le nouveau système fonction de : #4, faisons quelques manipulations algébriques: 


X3 =160-(3x +4% | 


— 2x3 — x4 = (320 -(6x% +8x2 1) —(180—-(6x% +3x || 30 
34 =180-(6% +32)]  ” * 17072 1+3x2)) (7300) 
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ce qui nous donne après simplification: 


2x3 — X4 = 140 — 5x3 — X3 = 70 — 2.5x + 0.5x4 (57.391) 
et dès lors, il vient: 


x3 =160—-(3x +4x | 


> Xa — X23 = (160—-(3x +4x 11—-(70—2.5x3 +0.5x4 1 (57.392) 
| ds. hi 


ce qui nous donne après simplification: 
1 
x = 30-0.5x — £ X4 (57.393) 
et nous avons de même: 
1 
Z =1'200x% +1'000x; = 1'200/ 30 0.5x -7a ]#1"000% = 36"000+400x; — 200x (739%) 
Donc au final, le système est: 


1 
A — 30—-0.5x; ve 


23 = 70 2.5x> +0.5x4 on 


Z = 36'000+400x; — 200x4 


à partir duquel nous itérons le processus (nous ne faisons croître qu'une variable dans Z en gardant les 
autres à 0). Quand nous ne pouvons plus faire augmenter Z car tous les coefficients sont négatifs, et bien 
c'est que nous sommes au maximum (merci la convexité). Voyons cela. 


Dans Z le plus gros coefficient est maintenant x> et donc cela nous amène à poser 4 = 0 . La valeur la 


plus contraignante de x qui permet de respecter toujours les contraintes x,X2,%3,x4 2 Ü est dès lors: 
X2 =28 (57.396) 
Et pour cette valeur, nous avons: 
% = 30-0.5x; =30-0.5.28=16 (57.397) 


La fonction économique initiale prend alors la valeur: 
1"200: x, + 1'000'x, = Z —1'200'16+1 000°28=47"200 (57.398) 


ce qui correspond donc graphiquement à: 
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7 


2 


[l 
% : 

Régioñdes 
solutions}, 
admissibles 


direction et pas du pivot 


70 


Æ 


3x +42 = 160 


1200x +1000x = 0 


Figure: 57.30 - Direction du pivot avec arrivée au point (16, 28) pour la deuxième itération 


Donc nous voyons bien ci-dessus que nous sommes arrivés à la valeur optimale visible sur le graphique 
donné au début de l'exercice. Mais comment savoir que nous sommes arrivés au point final si nous n'avons 
pas de graphique ou que nous travaillons dans des dimensions supérieures ? 


Au fait, le processus est terminé soit quand tous les coefficients de la fonction économique sont négatifs 
ou que la valeur la plus contraignante qui respecte les contraintes est nulle!!! Voyons si c'est bien le cas! 
Nous avons donc dans le cas présent: 


x =16,x3 = 28,x3 =0,x4 =0 (57.399) 
Et nous allons donc réécrire le système: 


1 
x = 30-0.5x TEA 


23 = 70 2.5x +0.5x4 08 


Z = 36'000+400x; — 200x4 


avec cette fois-ci 4,2 ainsi que Z en fonction de X3:%4 . Nous avons alors d'abord: 


x = 30-05[ 72 108 1 


1 4 
—— Xy = 16+ x —— 7x (57.401) 
25 6” 5 15 * 


et nous avons: 
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1 1 1 4 1 
% = 30-052 —-—x, = x = 60-2x —--x, =60-2|16+-x —-— x, |-- 
1 2 6 4 2 1 3 4 | 5 3 15 ) 


3 4 
; : (57.402) 
= 28——X%3 +—x 

Se S 


Et donc pour Z il vient (les coefficients y sont tous négatifs donc nous devinons la suite..): 
2 l . 
Z = 36000 +400| 28 — 55 *= Xa |— 200x4 = 47200 —-160x; —-120x4 (57.403) 


Nous avons donc le nouveau système: 


(57.404) 
Z = 47200 — 160x — 120x4 


Comme tous les coefficient de Z sont négatifs, nous sommes bloqués car nous partirions dans la mauvaise 
direction. Il faut donc nous arrêter ici et nous adoptons au final la solution: 


A — 16 

(57.405 
x = 28 
La méthode des tableaux que l'on trouve souvent dans la littérature consiste à ne noter que les coefficients 


des variables du système dans un tableau, mais les transformations que l'on fait sont exactement celles que 
l'on vient de faire algébriquement (à part qu'elle masque le sens de la méthode). 


13.1. ALGORITHME DU SIMPLEXE 


Pour mettre en oeuvre cet algorithme, nous devons poser le problème sous une forme "standard" et 
introduire la notion de "programme de base" qui est l'expression algébrique correspondant à la notion de 
"point extrême du polyèdre des programmes admissibles" étudiée lors de la programmation linéaire (notée 
ci-après P.L.). En effet, nous verrons que la solution d'un problème du type P.L. si elle existe, peut 
toujours être obtenue en un programme de base. La méthode du simplexe va donc consister à trouver un 
premier programme de base puis à construire une suite de programmes de base améliorant constamment la 
fonction économique et donc conduisant à l'optimum. 


Un problème de P.L. est donc mis sous sa "forme standard" s'il implique la recherche du minimum de la 
fonction objectif sous des contraintes ayant la forme d'équations linéaires et de conditions de non 
négativité des variables, c'est-à-dire s'il se pose sous la forme que nous avons vue lors de notre étude de la 
programmation linéaire: 
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C'est-à-dire aussi, en utilisant des notations matricielles: 


min c°x=Z 
Ax =b (57.407) 
x>0 


où les matrices €: #*X1, A'#X}x,b:mX1 correspondent, respectivement, aux coefficients des niveaux 
d'activité dans la fonction objectif, aux coefficients techniques des activités et aux seconds membres des 
contraintes. 


Nous allons voir maintenant comment un problème général de P.L. peut toujours être ramené à une forme 
standard. La notion de "variable d'écart" est essentielle pour effectuer cette "réduction". 


Chercher le maximum d'une fonction f{x) revient à chercher le minimum de la fonction de signe opposé -f 
(x) . D'autre part, une contrainte qui se présente comme une inéquation: 


x 
Ÿ az; £b, (57.408) 
J=l 
peut être remplacée par l'équation: 
x 
D'ayz;+æ =b; (57.409) 
J=l 
impliquant une variable supplémentaire, &;, appelée donc "variable d'écart", et soumise à la contrainte de 


non-négativité, #, 2 O. 


Bien évidemment, dans un cas contraire tel où le système est du type: 
x 
Sax; 2b, (57410) 
J=l 
Nous écrirons: 
x 
D ax; —@ =, (57411) 


J=1 


impliquant donc également une variable supplémentaire et soumise à la contrainte de non-négativité, 
8, 20. 
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Ce travail de mise en forme standard nous permet donc de retrouver un système d'équations linéaires à 
résoudre (nous avons vu précédemment sur le site comment résoudre ce genre de système avec 
l'algorithme du pivot). 


La matrice À qui représente les composantes du système d'équations peut s'exprimer dans différentes 
variantes en fonction de la base vectorielle choisie (voir le chapitre d'Analyse vectorielle dans la section 
d'algèbre). Nous allons introduire la notion de "forme canonique utilisable" associée au choix d'une base 
et nous montrerons que cette reformulation du système de contraintes va nous permettre de progresser 
vers l'optimum. 


La matrice A peut, après introduction des variables d'écart se décomposer en deux sous-matrices [2 | 8], 
une contenant les variables initiales D et l'autre comportant les variables d'écart B tel que: 


A=[D|8] 


Remarque: Les variables d'écart sont des variables et non des constantes!! Il convient dans un système 
où les variables sont au nombre de n et les équations au nombre de m tel qu'une équation du système 
s'écrirait: 


dj + di22a +... + 4,2, £ b, 


d'ajouter une variable d'écart tel que: 


d% + dia + XXe 


où x, = 2, et sur chaque ligne m, la variable d'écart ajoutée devant être différente de celles déjà 
insérées dans le système. C'est la raison pour laquelle nous pouvons décomposer la matrice en deux- 
sous matrices. 


Les colonnes de la matrice B sont bien évidemment, par définition de la méthode, des colonnes unités, 
linéairement indépendantes. Ces colonnes forment une base de l'espace vectoriel des colonnes à 
m éléments (ou dimensions) - le nombre de lignes du système. Nous appelons B la "matrice de la base". 


Les variables associées aux composantes colonnes de la matrice B seront dès maintenant appelées les 
"variables de bases". Dans ce cas, les variables de base sont donc essentiellement les variables d'écart 


x 4% Les Variables associées aux colonnes de la matrice D seront appelées les "variables 


+1” 


hors-base"; il s'agit des variables x,%3,...,2,. 


Kuga 


Remarque: Rappelons que dans l'expression de la fonction économique, seules les variables hors-base 
apparaissent. 


En résumé, toute P.L. une fois mise sous forme standard est telle que: 


- il existe une sous-matrice carrée de la matrice À des coefficients techniques, qui est appelée matrice de 
base et qui est égale à la matrice carrée unité 1 de dimension #* *# (effectivement il y autant de variables 
d'écart que de lignes dans le système d'équations original - au nombre de m - et autant de colonnes puisque 
chaque variable d'écart à un indice différent). 
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- les variables de base associées n'apparaissent pas dans l'expression de la fonction économique. 


- le second membre des contraintes est constitué d'éléments non négatifs. 


Nous disons que le problème est mis sous "forme canonique utilisable associée à la base B, correspondant 


aux variables de base %,,1, Xus2,... Au". 


Remarque: Nous pouvons intervertir les matrices (et donc changer de base canonique) B et D (ce qui 
revient à dire que la matrice des variables de base devient la matrice des variables hors-base et 
inversement). 


Il est maintenant commode d'introduire les notations suivantes: 


À Xy+l 

_ X3 _ Xu+2 on ES 

Xp Xp (57.415) 
À} An 


qui sont respectivement le vecteur des variables de base et le vecteur des variables hors-base. 
Ainsi, le système d'équations décrivant les contraintes peut s'écrire indifféremment: 
Ax =b (57416) 
ou bien aussi: 
Bxg + Dxn =b (57.417) 


/ 


Si la matrice B est une matrice de base, elle est non singulière et admet donc une matrice inverse g-!. En 
multipliant cette équation, à gauche et à droite, par 8”! nous obtenons: 


23 +B7Dx, = Bb (57.418) 
Le système d'équations aura alors été mis sous une forme résolue en x;. 


Pour obtenir une forme canonique utilisable associée à la base B, correspondant aux variables de base, il 
ne reste plus qu'à éliminer les variables de base de l'expression de la fonction économique. 


Écrivons cette fonction en séparant les vecteurs x, et x,, nous obtenons: 
Z=ChxptChXn (67419) 


Nous pouvons alors facilement exprimer x, en fonction de x;. En utilisant le système d'équations mis 


sous forme résolue en x, nous avons dans un premier temps: 
x3 =B7"b-B"Dx, (57.42 
BE p (7.420) 


que nous substituons dans la fonction économique, pour obtenir: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


FT p-1l -1l z ; 
z=c2(B"b-B" Dx,)+cpxp (57.421) 


Nous regroupons les termes en x; et nous avons: 

z=c,B"b+(c5-chB" D)xn (57.422) 
Nous avons alors toujours un système d'équations mais ne comportant plus d'inégalités mais au contraire 
des égalités !!! Reste plus qu'à démontrer que la solution de ce système dit "programme de base" par la 


méthode du pivot est optimale. 


Définition: Nous appelons "coût réduit" de l'activité hors base j, le coefficient correspondant €; —Z; de la 


ligne ec? -c28 "D. 


Soit un problème de programmation linéaire sous forme standard: 


mine?x=7Z 
Ax=b AmXnndm (57.423) 
x>0 


La matrice À à m lignes (autant qu'il y a de contraintes) et n colonnes, avec *# > #1. Si nous sélectionnons 
m variables de base et si nous annulons les # —## variables hors base, la matrice A: 


et le système se réduit à: 


La matrice B est de dimension #**##?. Si elle définit une base, elle admet une matrice inverse 8-1. Une 
solution du système est donc: 


Si l'expression 27là est non négative (2 0}, nous avons une solution admissible qui vérifie les contraintes 
et que nous appellerons un "programme de base": 


x = (Xp, Xp) =(B71b,0)20 (57.427) 


Le problème de programmation linéaire, s'écrit aussi sous la forme suivante, que nous appelons "forme 
canonique utilisable associée au programme de base": 


xx =Bb-B"Dx, 
z=ciB"b+(cr-ciB"D)xn (57428) 


Zn 20,%, 20 


À partir des développements effectués précédemment nous pouvons énoncer le résultat suivant: 
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Proposition 1: Si dans la forme canonique utilisable associée à un programme de base, tous les coûts 
réduits sont > Ô alors le programme de base est optimal. 


Proposition 2: La solution d'un problème de P.L., si elle existe, peut toujours être trouvée en un 
programme de base. 


La démonstration précise de ce résultat est assez délicate. Nous pouvons cependant en avoir une intuition 
en considérant, une fois de plus, la notion de coût réduit. 


En effet, pour un programme de base donné, considérons la forme canonique utilisable associée à la base. 
Sur cette forme nous pouvons vérifier que, ou bien le programme de base est optimal (tous les coûts 
réduits sont > Ô ), ou bien que le programme de base peut être amélioré et remplacé par un nouveau 
programme de base donnant à z une valeur plus petite (un coût réduit est négatif et la variable hors-base 
associée peut être augmentée jusqu'à ce qu'une ancienne variable de base s'annule). Comme il y a un 
nombre fini de programmes de base (au plus égal au nombre €”, ), la solution de P.L. se trouve 


nécessairement en un programme de base. 


14. PROGRAMMATION (OPTIMISATION) NON LINÉAIRE 


Un programme d'optimisation non linéaire (N.L.O.) est une généralisation de la programmation linéaire 
(algorithme du simplexe) mais à des fonctions non linéaires et pouvant comporter aussi des contraintes et 
des fonctions économiques non linéaires. 


Le but de ce qui va suivre est donc de comprendre dans les grandes lignes mais avec un niveau de rigueur 
acceptable les outils d'optimisation que proposent de nombreux tableurs comme les versions antérieurs à 
MS Excel 2007: 


Options du solveur 


Temps max: 100 | secondes 


Itérations: 5000 | 


Précision: 0,000001 


Tolérance: 5 1% 


Convergence: 0,0001 


[ ] Modèle supposé linéaire Échelle automatique 


[] Supposé non-négatif [] Afficher le résultat des itérations 
Estimations Dérivées Recherche 

@) Tangente ©) À droite © Newton 

© Quadratique O© centrée (©) Gradient conjugué 


Nous allons en particulier voir maintenant en quoi consiste la recherche Newton (sous-entendu: Gauss- 
Newton) avec les estimations Tangente et Quadratique. Après quoi nous étudierons la méthode de 
recherche des Gradients conjugués aussi avec les méthodes tangente et respectivement quadratique. 
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Nous le verrons plus loin, mais nous le devinons déjà, que le choix Tangente utilise une approximation 
linéaire de la tangente à la fonction à optimiser au point considéré alors que l'option Quadratique fera un 
estimation d'une fonction du deuxième degré au point considéré (typiquement une parabole). Si au point 
considéré, la fonction se modélise bien par une quadrique, alors l'option Quadratique peut faire 
économiser du temps en choisissant un meilleur point initial qui demandera moins de pas supplémentaires 
à chaque recherche. Si vous n'avez pas d'idée du comportement a priori de la fonction, la méthode 
Tangente est alors plus lente mais plus sure. 


Un exemple connu dans la littérature pour introduire la recherche d'optimum de fonctions non linéaires, 
avant de passer à la partie intégrant les contraintes du système, est la fonction "baleine à bosse" qui 
consiste à trouver le minimum de: 


1 | 
+ (a 2.1 Hat }+a 72 + |[—-4 +474 | (57.429) 


avec les contraintes: 


minimum 


minimum 


x 
2 1 


Figure: 57.32 - Tracé de la fonction baleine à bosse avec minimum déjà visibles 


Comme nous pouvons le voir, cette fonction est également un excellent exemple de minimaux locaux 
multiples. 
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14.1. MÉTHODE DE NEWTON-RAPHSON (NEWTON QUADRATIQUE) 


La "méthode de Newton-Raphson" est une technique permettant de chercher l'extremum d'une fonction ou 
également, comme nous le verrons plus loin lorsque nous comparerons dans un cas particulier 
d'application la méthode de Gauss-Newton à celle de Newton-Raphson, pour la régression non linéaire. 


La méthode de Newton-Raphson, qui dans les versions antérieures à MS Excel 2007 s'activait dans le 
solveur en sélectionnant l'option Newton et Quadratique, utilise les approximations de Taylor au 
deuxième ordre (donc avec les dérivées du deuxième ordre) pour avoir une fonction quadratique 
(parabole) qui converge si le point d'origine de la recherche est proche de l'optimum. Cette approximation 
est réitérée à chaque itération. 


Pour commencer, rappelons que nous avons démontré dans le chapitre de Suites Et Séries qu'un 
développement de Taylor pour une fonction à deux variables pouvait s'écrire en approximation 
quadratique: 


ÿ g 1 h 
FD +4,90 +Æ1= fo: 20 + 20,0 4 + 20,70 IE + (h &IH (67.431) 
& d 2 k 


où pour rappel h et k sont des variables et .Y sont fixés et où nous avons la matrice hessienne: 


PF f 
— — 
8 Oxdy 
H = . 2 (57.432) 
of of 
Oxdy dv? 


que les américains spécialistes du domaine ont pour habitude (malheureuse à mon avis...) de noter: 


a _ … 
Ts = Lea? = Vif (57433) 
0x 0x; ÿ J 


la dernière expression étant la plus courante peut être très trompeuse avec la notation du laplacien. 


Dans le domaine des méthodes numériques il est d'usage d'écrire la série de Taylor ci-dessus avec 
quelques changements de notation en posant d'abord: 


X0+h#=x—h=x- 7% 
Yotk=y=k£=y-y 


do, Pl 7" L 
Y $ Ya + — À] £ — À F = À 0 (57.434) 


Ce qui nous donne une forme plus condensée et technique de la série de Taylor autour de x : 
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fs fm )+V (7 (6 )(r-% +F-%) 


En changeant un peu la notation: 
Mn. sie Sfar 21 ile 2 eue SX 
FG)E SG) VU GE) 4) H(x )(x-%) (57.436) 


Nous retrouvons donc l'expression d'usage d'une fonction de FR? —IR évaluée en série de Taylor centrée 


#1 


en 


Mais si nous cherchons un extrema local (appelé aussi parfois "point critique"), il faudra dans un premier 
temps que la dérivée de l'ensemble de la série de Taylor soit nulle. C'est-à-dire: 


SPRTE ve 
1XI1= 


# l Doris — < 
Y = V RI+HVFIRUX-RLIH IX HI AIX —X)|=0 (57.437 
br . ÉE HA AIE: x | “A % | XX ) (57.437) 


et que le déterminant de la matrice hessienne soit positif (cf. chapitre Suites Et Séries). Et pour savoir si 
nous sommes sur un maximum local où minimul local, il nous faudra regarder le signe de Ch (x): 


Récrivons la relation ci-dessus explicitement comme nous l'avions démontrée dans le chapitre de Suites Et 
Séries pour des raisons pédagogiques: 


f(x +, Yo +k) 


: 1 1 df 

= Goo) Got Go ro)E (67.438) 
êf af Cu 

Mer 77 Goo) +2 ges CODE +7 Goo 


Et rappelons que tous les termes 1.9 sont des constantes car il s'agit soit de la fonction évaluée sur le 


point particulier X9,Y0, soit de la dérivée partielle évaluée en ce même point, soit de la dérivée partielle 


seconde toujours évaluée en ce même point, etc. 


Donc le gradient donnera finalement: 
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Onf \2 +4,Y0 +# | 


Vlfix +k,yo +4il= 
; . Fra +, Yo +) 

Onf | 29 :Ÿ0 +0,10,f(x0;:Y0 A+ (9,5 (x Vo k+ La, (8271 20 :ŸQ #2 | 
——_— 27  ——_——————— à À | 

” Of (x 0] oi CAE AIL 


1, /2 1, {2 2 
+5 On (8 f (2% 90 RE] += 8h (897 (%0:90 1&° | 
a ———_] — —+— 
1 =) 
50» FXo.Y0 Æ 


x (20,20 1 +08, (20.90 14 1+ 05 (0,7 (20.0 &)+10, (82 s x) 0 * 1) 
_ _ = F2 | =0 


1, ls, 
+52 1097 (20.0 VA] + 0x (0,7 (x0.20 1 | 

——,— ———, — 

MES 05 (oo 
2 le 

(2% ,90 )+8/(%,0)4+S PARLE EL EEE b 
= x =Fraoi+#() 

F0 70 1 +0 (geo VE + 20,90 \# 


et en revenant aux notations d'usage du domaine des méthodes numériques, nous avons alors: 
Vif(ri= VIS )I+H(RI(H-#) (67440) 
Et donc le gradient devant être nul, nous avons: 
V(S(&)l+A4(&)(#-#)=0 (67441) 
et après un premier réarrangement: 
A” % VITE }]+x-x%=0 (57.442) 
et un deuxième réarrangement: 


X= 3%; - HE VITE, }} | (57.443) 


ce qui se note souvent: 


Xi = X, — 4°! (x; Vif % 1] (57.444) 
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et par les américains...: 


= El = 
Xu =X [25 x | V(f(x%)) (67.445) 


Enfin avant de passer à un exemple concret il est important que le lecteur se souvienne de la relation vu 
juste plus haut: 


VISA II+A(RI(F-É)=20—-V(F(É)l= H(%I(F-$) (67.446) 


Le fait que la gradient négatif apparaisse fait que la technique de Newton-Raphson (Newton Quadratique) 
appartient à la famille des techniques dites de "descente rapide". 


Cette dernière égalité étant souvent noté chez les américains (... sans commentaires...) par: 
—Vf(x) = V2 X)p (57447) 
Évidemment un tableur comme MS Excel ne pouvant pas déterminer les dérivées il va les calculer en 


utilisant la méthode numérique des dérivées à droite ou centrées comme nous l'avons présenté un peu plus 
haut. 


Exemple: 


Nous cherchons un extrema local de la fonction "baleine à bosse" représentée plus haut: 
l 
Jixyi= “ (a- TU R + }ro4 _4 +45? | (57.448) 
avec le point de départ (arbitraire): 


1 
X0 = F) (57.449) 


Pour effectuer la recherche, nous calculons d'abord le gradient: 


0,f(%)\ (8x -84x +2x +» 
V(f(x%))= += 3 (57.450) 
CPR A À } % — 8»; +16»; 
et la matrice hessienne: 
far) f(x, : ; 4 
H(x)= F7) ps (xi,Y:) _|8-25.2% +10x ) —. 
Sy) SSH.) 0 -8+48y 


Nous avons alors: 
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m_. LA | : | : ls _8.4x2 +2x) Le _ ps) 
9,f (0) 9pf (1) x0-8% +163ÿ 9.00 
tee Go) En 0-0) ne +10 0 | 
Byf (70) 85.f(x0.70) 0 —8+48»0 | (57452) 


_[-720 0 
| 0 4000 


2 [-720 0 T [0138 oo 
A (x%)= — 
0 40.00 0 0.025 


et donc: 


LL x (2 UP LL 1 —0.138 (] 2.60 1.361 (7.453) 
= Xh — x lflanil= _ EE ‘ 
1 D 0 | : 1 (] 0.025 |L 9.00 0.775 


et nous recommençons (bon on va se passer de tous les détails maintenant car faut pas exagérer non 


plus..): 

= 9,f (1.361 —0.17 

VIf(ail= x = 

9,$ (0.775) 2.61 
_. |[8-25.2% +10% 0 -436 0 
H(%i= = (57.454) 
0 _8 +48yÉ 0 20.83 
-1 
y” cr —4.36 () - —0.229 0 
0 20.83 () 0.048 

et donc: 


SR loss er ones [1261 —0.229 (] 0.17 1.321 
2 =% AH (%)V(f(%x))= _ = (57.455) 
0.775 ( 0.048 || 2.61 —0.650 


et nous recommençons (avec encore moins de détails): 


ee 0.01 
Srme( is) 
.. [-552 0 
#2] 0 . (57.456) 
LT RAS A 
0 0.081 
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et donc: 


1305 


=%-H71 (VIF (% fée 


| (57.457) 


et encore une fois (avec encore moins de détails): 


” —0.04 
Vifimil= 
AS (os | 
(57.458) 
Ai 0.167 0 
H 7" (%)= 
0 0.102 
et donc: 
= Lx plis Cr) 1.296 - 
X4=%— x B))= 57.45 
4 3 3 À 3 0.604 ( ) 
et encore une fois (avec encore moins de détails): 
2. SG) 1.296 
= X4 — (X4 1 {xall= ; 
5 — 4 4 44/1 | 0.605 (57.460) 


et les valeurs ne bougeront plus. Mais si nous regardons le graphique d'origine où nous avons mis en 
évidence le point de convergence par un point rouge: 


Figure: 57.33 - Mise en évidence du point de convergence dans la fonction baleine à bosse 
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nous constatons que ce système ne cherche pas un extremum global mais local comme nous l'avions déjà 
spécifié. En réalité, comme le lecteur pourra le tester lui-même, la convergence est très sensible au point 
de départ initial. 


14.2. MÉTHODE DE GAUSS-NEWTON (NEWTON TANGENTE) 


La méthode de Gauss-Newton est une approximation puissante sans les dérivées du deuxième ordre de la 
méthode de Newton-Raphson qui dans les versions antérieures à MS Excel 2007 s'activait dans le solveur 
en sélectionnant l'option Newton et Tangente, 


Pour aborder ce sujet, partons tout de suite accompagnés d'un exemple concret. Supposons que nous avons 
obtenu les données suivantes: 


Tableau: 57.9 - Données mesurées 


et nous supposons que les données suivent le modèle théorique suivant (nous aurions pu faire n'impote 
quel autre choix!): 


= me (57461) 


Nous cherchons donc x ,%3 qui minimisenet la somme des carrés des écarts entre les valeurs 
expérimentales et théoriques tels que: 


5 2 
- | f. 
min f(x,X2)= DETTES —};| (57462) 
Xpr43 i=i 


avec donc: 


7 


fta,mi=fixi= me — y; (67463) 


Notons pour la suite comme le veut la tradition dans le domaine: 


F(x)= (57.464) 
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Nous avons alors la notation courante: 


. | _ AT . 
min f(x,m)= >? min fixi= Fix) FX) (57465) 
Xp #3 ï # 


Maintenant, imaginons que nous ayons trouvé une valeur du couple {x,x3 1 ={x1\ qui donne ce minimum 


et notons le {%* | et en n'oubliant pas évidemment que cela ne sera qu'une solution locale! Considérons un 
cas particulier que nous appelons "solution compatible" et définie par le fait que le couple qui minimise la 
somme des carrées des erreurs est aussi tel que pour tout i nous ayons: 

f.(xx)=0 (57.466) 
Dès lors, il en découle immédiatement que: 


F(xx)=0 (57.467) 


Avant d'aller plus loin, remarquons que par exemple que pour une composante j (ce qui correspond dans 
notre cas à chaque variable de la fonction théorique supposée a priori): 


à 
” 8. 
Er GT rx) 225 2 HA NS B 25 LR 
j x, : 8x; : æ; : üx; —. 
af. i h h 2/.40 
Sin Fr ri 
: x; j 


où la dernière égalité condensée est souvent loi d'être triviale d'autant plus qu'elle fait usage du gradient 
d'un champ de vecteur (cf. chapitre de Calcul Vectoriel) que l'on retrouve rarement dans la pratique. Le 
lecteur déstabilisé pourra se reporter si besoin directement à l'exemple plus bas afin d'éclairer sa lanterne. 


Nous en déduisons donc que: 
PS 2 |=0(ri=20/F FR) 67469) 
: 


et la solution compatible nous amène donc à bien évidemment à: 


De la même manière, nous avons: 
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V2|F(X) F(x) -205s (54 x. | 


: êx j : êx j 


foi er, 


di 1 di ni “1 
ik 0% üx; Oxy à Lk x, x j ik 0x ox; 


air? UVFIRI+S Paix) 
| j 


1 


Nous avons donc au final les deux relations suivantes: 
PS) =201r (2) |F (6 


(57.472) 
ÿ2 af ravir? MAIN Paix) 


1 
Étant donné que pour la solution compatible nous avons: 
fi(%x)=0 (57473) 
Il s'ensuit que dans ce cas que la deuxème relation devient: 


FIFA) F(ñils 2 VFR NIV F(RI4S (& V2 £ (%) 
ï sus: ni m A7 
=0 (57.474) 


si s l 
=20(FR) |V(F(R))= 2/1 |.) 
où H est la matrice Hessienne (cf. chapitre de Suites Et Séries) ce que les américains notent simplement: 


VIF IR f VIF ))z A(%x) (67475) 


Donc nous pouvons approximer dans le cas de la solution compatible, la Hessienne qui contient des 
dérivées d'ordre deux par des dérivées premières. 


Donc nous avons finalement dans ce cas particulier les deux relations qui sont à la base de méthode de 
Gauss-Newton: 


Vifim)= 20 FR) FR) 


(57.476) 
+ = \T)s=, ” = 
VIF (Xl VIF (IRIS) Aix 


Maintenant, rappelons la relation de base de la méthode de Newton-Raphson obtenu plus haut: 
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VIF l=AH(RI(F-%) (67477) 


et pour information, toute technique mathématique (car elles sont nombreuses!) permettant de simplifier 
la matrice Hessien à droite de l'égalité fait alors partie de la famille des "méthodes de quasi-Newton". 


Eh bien la méthode de Gauss-Newton qui nous intéresse ici et qui est donc une des techniques de la 
famille des méthodes de quasi-Newton consiste simplement dans un premier temps à se débarrasser des 
dérivées secondes de la Hessienne de la méthode de Newton-Raphson à droite de l'égalité à l'aide de la 
relation établie précédemment tel que (attention à se rappeler de l'abus d'écriture!): 


V(r(R))e DFA) |V(F(&x))(F-2,) (67478) 


et dans un deuxième temps récrire le gradient à gauche de l'égalité à l'aide aussi de la relation 
précédemment établie. Ce qui nous donne: 


VIF (Xe Fr(R)z VIF (rx 7 VF (Xe ))(f— %x) | (67.479) 


Le facteur 2 n'étant pas très esthétique, la quasi-totalité des ouvrages de référence optimisent le problème 
avec la relation de départ suivante: 


5 F' 


: { X-f: 
min f(x,x2l==0 me 2%) (57480) 
X143 i=l 


Donc en multipliant simplement par un facteur 2 (ce qui ne change rien au résultat). Nous avons alors: 
= | SAT \ 6 - T\é + + + 5 ja 
VIF (xx) FIRE VIF (Gui) |VIF (XX — ZX) (57.481) 


Rappelons encore une fois qu'un tableur comme MS Excel ne pouvant pas déterminer les dérivées il va les 
calculer en utilisant la méthode numérique des dérivées à droite ou centrées comme nous l'avons présenté 
un peu plus haut. 


Revenons maintenant à notre exemple du début! Nous avons donc: 


1 3.2939 

2 4.2699 
t=|4|,y=|7.1749 (57.482) 

5 3.3008 

8 20.259 


Nous commençons avec un couple qui nous semble proche de la solution cherchée: 
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x X1,0* 2.5 
X= : L (57.483) 
3 X3 0* 0.25 


Nous avons alors: 


f 
# 461 | (25021-32959) | use 
Fe ge ri 2.580252 _ 42699 _0 1481 
FiRi=| #4 |[=|0e%8 >, [21250254 7174912) 03792! Gus 


Jal [met | 1256025 93008 | |—0.5743 


FD non y | (256028 -20.259 | TEE 
et donc nous avons: 
5, : 2 
min fix,x= 0 me 2 -y;| =184722 (57.485) 
Met 2; 
Pour la suite, il vient alors: 
5 5 
>'2| me À — } 6" > me” # à PS 
4 À 1 = | = | 
V(Y(&)=S ju = : (57.486) 
Lac hp age | [Eine À - y |x6e"# 


i=l 


… 
Il 
EUR 


Ce que nous pouvons donc récrire sous la forme: 


PIED EAU IET \F(x) 
me y 
me? — }3 


ex e*72 Pre e724 e Ts _ 
= me y 


Xaf x Xaf: x Xaf 
née ?l xée #2 mée 23  xéye #4 Aése 2 he 
1 Ÿa (57.487) 


mes ys 
—0.0838 


—0.1481 
1.2840 16487 27183 34903  7.3891 —16.5888 
= —0.3792 | = 


3.2101 82435 271828 436293 1477811 7 [-300.8722 
—0.5749 


—1.7864 
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Nous avons aussi in extenso: 


PIFAT |P(F(#) 
PC x he’? 


ex e*22 e 23 es es _ 
: fe ** | (57.488) 


fi *#2 438 1f4 Xofs 
APT Xjé2e Xe Xj£4€ Xése sé Pa 


PL. xts PL 
_| 78.5367 1'335.8479 
7 [11335.8479 24'559.9419 


Ensuite, nous appliquons la relation démontrée plus haut: 
ST nl ie nn 
VIF) VFMIE VIF (Zu) VIF (Xm)l(X Ze) (57.489) 


Soit: 


-16.5888 | [ 785367 13358479 mao) 
-300.8722] [13358479 24'559.9419 || x, -xom) 


et après une petite simplification mineure: 


16.5888 | | 785367 1'335.8479 [fx -%,0+ 
300.8722 [ [1'335.8479 2455990419 [| x, -em] 77 


Soit: 


m0) fm) (ao) | 785367 1'335.8479 [| 16.5888 | (0.0381 _——. 
2-20%) Va] Uaox] (13358479 24'559.9419] |300.8722] Vo.0102 


et donc le prochain couple pour l'itération sera: 


m (ai) 00381) (xor | f0.0381) [2.5 Ÿ (25381) 
_ = + _ + = (57.493) 
2] Um] (00102) Uxzox) (0.0102/ Vo.25/  Lo.2602 


Ce qui correspond bien évidemment aux valeurs pour la première itération: 
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A ,1* 2.5381 
= (57.494) 
23 1* 0.2602 


Nous n'allons pas refaire aussi explicitement les autres itérations. Donc voilà ce que cela donne au final: 


min f(x,2% | 
A3 


Tableau: 57.10 - Itérations Gauss-Newton 


avec donc pour solution locale à la 4ème itération: 


X,4* 2.5411 
: (57.495) 
X2 4* 0.2595 
Faisons pour clore une comparaison avec la méthode de Newton-Raphson pour la première itération en 


utilisant le même couple de départ. Rappelons encore une fois que pour cette méthode, les itérations sont 
basées sur la relation: 


VISA = HIER -XR) (57.496) 
Ù x ï 
et nous écrirons la fonction de la façon suivant pour la méthode de Newton-Raphson: 


j 2 
EE ET 
F{%,2 ÉNIHEEMETÉL —y; |] (67.497) 
i=1 


où nous avons donc pour la première itération (nous retrouvons le même vecteur que pour la méthode de 
Gauss-Newton): 


—16.5888 


Fr (R)=v(r F(%)= 
G))= VIE GI) JFG) ee 


| (57.498) 


et: 
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M f(HX) 9,0, /(%.3) 


2, GE) 8 SG) 


Hix%i= 


2 5 2 

Xaf; 1 j X; \ 
En 2 — y; | 9,9, —> [me 7 -x| 
122, | 

2 12 2 

D (ne# =») , 22xe hr] 


= 


1 (57.499) 


5 
di 
É 
. Hf _ of 
2,2% fe Vite 23 
i=1 
Xaf, : 2%Xaf, 
. Lane # - pe D'2xfte Fi — x te 
i=1 
: ps 1'215.4991 
[12154991 22'278.6570 


5 
Ë 9, xl 2 HT *#i — }, \e*2 9, >| me -}, ETC 


Nous avons donc: 
Vif = AH(GI(X-X) (67.500) 


qui devient: 


16.5888 | [ 785367 12154991 no) 
300.8722] [1'215.4991 22'278.6570 || x2 — x2 9x CE 


Soit: 
X — À,0* x X,0* 78.5367 1'215.4991 Fi 16.583838 0.0142 
- - “ - 502 
2-09) Ve) Vrgs] "(12154991 22'278.6570] [300.8722[ (00127) °°” 
et donc le prochain couple pour l'itération sera: 


m (aa) 00381) (ox) foo142\ f25 \ [25142 
> = di = " = (57.503) 
2) Va] (00102) (xg) (0.0127/ (0.25)  (o.2627 


Ce qui correspond bien évidemment aux valeurs pour la première itération: 
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% 1* 25381) 
— (57.504) 
22 1* 0.2602 


Nous n'allons pas refaire aussi explicitement les autres itérations. Donc voilà ce que cela donne au final au 


min f(x,2% | 
XX 


niveau de la fonction à minimiser: 


Tableau: 57.11 - Itérations Newton-Raphson 


donc la méthode de Newton-Raphson converge dans ce cas particulier moins vite que celle de Gauss- 
Newton. 


15. MÉTHODES DE MONTE-CARLO 


La méthode de Monte-Carlo est un moyen très efficace de contourner les problèmes mathématiques et 
physiques les plus complexes. Elle trouve ses applications dans des domaines variés dont voici quelques 
exemples: 


- Problèmes de neutronique liés à la bombe atomique (ou tout autre problème de la même famille) 
- Calculs d'intégrales ou de paramètres divers de variables aléatoires (finance, risque) 

- Résolution d'équations elliptiques ou paraboliques 

- Résolution de systèmes linéaires 

- Résolution de problèmes d'optimisation (recherche opérationnelle, gestion de projets) 

- Création de tests statistiques (Anderson-Darling, Kolmogorov, Levene, Brown-Forsythe, etc.) 


Il existe donc deux types de problèmes qui peuvent être traités par la méthode de Monte-Carlo: les 
problèmes probabilistes, qui ont un comportement aléatoire, et les problèmes déterministes, qui n'en ont 
pas. 


Pour ce qui est du cas probabiliste, il consiste à observer le comportement d'une série de nombres 
aléatoires qui simule le fonctionnement du problème réel et à en tirer les solutions. 
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Pour le cas déterministe, le système étudié est complètement défini et on peut en principe prévoir son 
évolution, mais certains paramètres du problème peuvent être traités comme s'il s'agissait de variables 
aléatoires. Le problème déterministe devient alors probabiliste et résoluble de façon numérique. On parle 
alors d'estimation de "Monte-Carlo" ou d'une approche de "MC élaborée". 


La dénomination de méthode de "Monte-Carlo" date des alentours de 1944. Des chercheurs isolés ont 
cependant utilisé bien avant des méthodes statistiques du même genre: par exemple, Hall pour la 
détermination expérimentale de la vitesse de la lumière (1873), ou Kelvin dans une discussion de 
l'équation de Boltzmann (1901), mais la véritable utilisation des méthodes de Monte-Carlo commença 
avec les recherches sur la bombe atomique. 


Au cours de l'immédiate après-guerre, Von Neumann, Fermi et Ulam avertirent le public scientifique des 
possibilités d'application de la méthode de Monte-Carlo (par exemple, pour l'approximation des valeurs 
propres de l'équation de Schrüdinger). L'étude systématique en fut faite par Harris et Hermann Khan en 
1948. Après une éclipse due à une utilisation trop intensive pendant les années 1950, la méthode de 
Monte-Carlo est revenue en faveur pour de nombreux problèmes: en sciences physiques, en sciences 
économiques, pour des prévisions électorales, etc., bref, partout où il est fructueux d'employer des 
procédés de simulation. 


15.1. GÉNÉRATION DES VARIABLES ALÉATOIRES 


Le mieux pour comprendre la méthode de Monte-Carlo c'est de faire des exemples. Mais pour cela, il faut 
d'abord d'avoir un très bon générateur de nombres aléatoires (ce qui est très difficile). C'est un domaine 
très délicat et sensible donc pour lequel des normes internationales ont été édictées (ISO 28640:2010). 


Prenons comme exemple le générateur de Maple 4.00b: 
>rand(); 

427419669081 
>restart;rand(); 

427419669081 


Nous voyons donc que la fonction par défaut de générateur de nombres aléatoires de Maple 4.00b est à 
utiliser avec la plus grande prudence puisqu'une réinitialisation du système suffit à retrouver des valeurs 
aléatoires. égales. Il s'agit donc d'un "générateur pseudo-aléatoire" permettant de faire des simulations 
appelées parfois "pseudo Monte-Carlo". 


Cependant il existe des libraires spécialisées dans Maple 4.00b telles que: 
>restart;readlib(randomize):randomize():rand(); 

536427565027 
>restart;readlib(randomize):randomize():rand(); 


818686572281 
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Épreuve a priori réussie (au fait, il nous faudrait faire un beaucoup plus grand nombre d'essais afin de bien 
vérifier que le générateur ne suit pas une loi de distribution connue... ce qui n'est malheureusement jamais 
le cas). 


Les fonctions ALEA( ) et ALEA.ENTRE.BORNES ) de la version française de 

Microsoft Excel 14.0.6123 sont aussi des générateurs pseudo-aléatoires dont voici un échantillon de 100 
simulations (évidemment dans Microsoft Excel le graphique ci-dessous changera à chaque fois que vous 
activerez la touche F9 du clavier): 


Figure: 57.34 - Illustration d'une séquence de nombres pseudo-aléatoires avec Microsoft Excel 14.0.6123 


Il peut malheureusement arriver avec les nombres pseudo-aléatoires que les nombres générés se 
présentent en grappes, c'est-à-dire en séries de nombres rapprochés les uns des autres, ce qui nuit à 
l'efficacité de la simulation de Monte-Carlo. 


Une technique empirique consiste à faire appel à des séquences de nombres générés sur la base 
d'algorithmes qui balaient à coup sûr l'intervalle [0,1]. Nous parlons alors de "nombres quasi-aléatoires" 
permettant de faire des simulations appelées parfois "quasi Monte-Carlo". Avec la version française de 
Microsoft Excel 11.8346, il est possible de créer une fonction qui remplacera les générateurs pseudo- 
aléatoires que sont les fonctions ALEA( ) ou ALEA.ENTRE.BORNES }. 


Voici donc un exemple de fonction en V.B.A. (Visual Basic for Application) qui génère des nombres 


quasi-aléatoires appelés "séquence de Fauré": 
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Function SequenceFaure(n) As Double 
Dim f As Double, sb As Double 

Dim i As Integer, n1 As Integer, n2 As Integer 
ni=n 

sb =17/2 

Do While n1 > 0 

n2 = Int(n1 /2) 

i=ni-n2*2 

f=f+sb*i 

sb = sb/2 

ni = n2 

Loop 

SequenceFaure = f 

End Function 


Ce qui donnera la séquence suivante pour un échantillon de 100 simulations: 


Figure: 57.35 - Illustration d'une séquence de nombres quasi-aléatoires avec Microsoft Excel 11.8346 


où nous voyons bien que la séquence couvre bien la surface comprise entre 0 et 1 (nous disons alors 
qu'elle couvre plus rapidement la surface d'intégration). Cette technique est parfois appréciée car elle a 
pour avantage de conserver les valeurs de la simulation à chaque fois que l'on relance la simulation (donc 
dans Microsoft Excel 11.8346 le graphique ci-dessous ne changera pas quand vous activerez la touche F9 
du clavier). 


Par contre les générateurs de séquence ont une grande faiblesse: ils ne sont applicables (à ma connaissance 
du moins) que pour des problèmes de simulations avec une seule et unique variable aléatoire (typiquement 
du pricing d'options selon Black & Scholes). Effectivement si nous avons plusieurs variables aléatoires (et 
c'est le cas le plus courant!), alors les variables sont artificiellement corrélées (coefficient de corrélation 
égal à 1) car elles parcourent toutes la surface comprise entre 0 et 1 de la même manière. Donc une bonne 
simulation avec plusieurs variables est une simulation dont les variables traitées ont un coefficient de 
corrélation qui tend vers zéro. 


De plus, les générateurs de séquence nécessitent des algorithmes qui sont très gourmands lorsqu'il y a de 
nombreuses variables par rapport à un générateur pseudo-aléatoire, raison pour laquelle dans la majorité 
des situations, on préférera cette bonne vieille méthode. 
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Remarque: Se référer à la norme internationale ISO 28640:2010 pour les ingénieurs ayant besoin 
d'implémenter des générateurs de nombres aléatoires dans leurs logiciels. 


Une fois le générateur créé et testé, nous pouvons voir quelques résultats de la méthode de Monte-Carlo. 
Ainsi, dans le calcul des intégrales, celle-ci s'avère très utile et très rapide en termes de vitesse de 
convergence. 


15.2. CALCUL D'UNE INTÉGRALE 


Soit à calculer l'intégrale d'une fonction f définie et positive sur l'intervalle [a,b]: 
è 
1= [7 Goax (57.505) 
2 


Soit: 
m = max(f(a), f(b)) (57.506) 
la valeur maximale de la fonction entre les bornes [a,b|. 


Nous considérons le rectangle englobant la fonction sur [a,b] défini par les points 
(a, 0), (b, 0), CB, #), (@, mi) : 


4 Û 


a b 


Figure: 57.36 - Principe de base du calcul de l'intégrale avec Monte-Carlo 


Nous tirons un grand nombre N de points au hasard dans ce rectangle. Pour chaque point, nous testons s'il 
est au-dessous de la courbe. Soit F la proportion de points situés au-dessous, nous avons: 


L'algorithme Maple 4.00b est donné par: 
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intmonte:=proc(f,a,b,N) 
local i,al,bl,m,F,aleaabs,aleaord,estaudessous; 
m:=round(max(a,b)*10/4); 
al:=round(a*10/4); 
bl:=round(b*10/4); 
aleaabs:=rand(al..bl); 
aleaord:=rand(0..m); 
F:=0; 
for i from 1 to N do 
estaudessous:=(f(aleaabs()/10/4)-aleaord()/10/4)>=0; 
if estaudessous then 
F:=F+1; 


fi 
od: 
RETURN((b-a)*max(a,b)*F/N) 
end: 


Remarque: Pour appeler cette procédure, il suffit d'écrire >intmonte(f,a,b,N) mais en remplaçant le 
premier argument passé en paramètre par l'expression d'une fonction et les autres arguments par des 
valeurs numériques bien évidemment. 


15.5: CALCUL DE PI 


Pour le calcul de # le principe est le même et consiste donc à utiliser la proportion du nombre de points 
dans un quartier de cercle (cela permet de simplifier l'algorithme en se restreignant aux coordonnées 
strictement positives) inscrit dans un carré relativement au nombre de points totaux (pour tester si un point 
est à l'extérieur du cercle, nous utilisons bien évidemment le théorème de Pythagore) tel que: 


F 
JÆ=4'— (57,508) 
NV 


L'algorithme Maple 4.00b est donné par: 


estalinterieur:=proc(x,y) x\2+y12<1 end: 
calculepi:=proc(N) 
local i,F,abs,ord,alea,erreur,result; 
alea:=rand(-1014..1014); 
F:=0; 
for i from 1 to N do 
abs:=alea()/10/4;ord:=alea()/1014; 
if estalinterieur(abs,ord) then 
F:=F+1; 
fi 
od; 
RETURN(4*F/N) 
end: 
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15.4. MODÉLISATION 


L'application la plus courante de la méthode par Monte-Carlo est certainement l'étude de variables 
aléatoires. Par ailleurs, cette méthode fait partie intégrante de la norme ISO 31010 de gestion du risque 
sous le nom "analyse de Monte-Carlo" tellement elle est courante et utile. De nombreuses entreprises font 
de la modélisation de Monte-Carlo avec un tableur comme Microsoft Excel (même les multinationales!) 
et dans une moindre mesure avec des logiciels comme @Risk, CrystalBall, TreeAge ou encore Isograph. 


Les avantages de cette méthode dans la modélisation de variables aléatoires sont les suivants: 

- On peut intégrer n'importe quelle distribution dans une variable d'entrée, y compris des empiriques! 
- Les modèles sont très simples à développer et peuvent être étendus à mesure des besoins 

- Toutes les influences ou relations se produisant dans la réalité peuvent être représentées 

- L'analyse de la sensibilité ( n) peut être appliquée 

- Les modèles sont aisément compréhensibles et fournissent une mesure de l'exactitude d'un résultat 
- De nombreux logiciels sont disponibles et peu onéreux 


Considérons un cas simple mais concret (très utilisé dans les entreprises) d'un petit projet de deux tâches 
notées À et B qui se succèdent sans marge libre. La durée de chacune des tâches a été estimée 
conformément à la recommandation du Project Management Institute avec une loi bêta ( 

) comme l'apprennent tous les responsables de projets lors de leur cursus de formation (ci 


) 


Pour cet exemple, la tâche A a une durée optimiste de 5 jours et pessimiste de 8 jours. La tâche B une 
durée optimiste de 1 jour et pessimiste de 4 jours. Nous souhaiterions dans Microsoft Excel à l'aide d'une 
simulation de pseudo Monte-Carlo (basée donc obligatoirement sur une variable pseudo-aléatoire) 
introduire les trois informations traditionnelles minimales suivantes: 


- Un tableau avec les 3 colonnes (durée de À, de B et somme des deux) de 10'000 simulations 
- La fonction de distribution de la somme des deux variables aléatoires sous forme graphique 
- La convergence du 95ème centile des 100 premières simulations (utile pour le sujet d'après). 


Nous construisons alors le tableau suivant sur 10000 lignes (la capture d'écran ne prend que les 
premières.): 
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F. E & 
IN Täche À Tâche 2 Somme 
2 7.66 3.69 10.58 


4:12 3.53 11.25 
6.82 3.16 9.98 
6.75 3.04 979 
LA 3.36 15 
7.64 2.68 10.31 
7.69 2.95 10.64 
12 3.07 10.78 
2:31 3:35 10.86 
6.76 3.62 10.38 
6.50 3.04 9.54 
6.53 3.68 021 
7.26 2.77 10.02 
6.99 3.54 10.54 
6.19 2.99 9.18 
7.36 3.54 10.90 
RTE CN:Al 11.58 
7.62 3.61 11:23 
7.67 Ce 10.94 
7.59 3.38 10.97 
7.33 3.25 10.58 


Figure: 57.37 - Mise en place d'une petite simulation de Monte-Carlo avec Microsoft Excel 11.8346 


où toutes les cellules de la colonne À contiennent la fonction suivante (version français de Microsoft Excel 
14.0.6123): 


=BETA.INVERSE.N(ALEA.ENTRE.BORNES(1;9999)/10000;3+RACINE(2);3-RACINE(2);5;8) 


et toutes les cellules de la colonne B contiennent la fonction suivante (version français de Microsoft Excel 
14.0.6123): 


=BETA.INVERSE.N(ALEA.ENTRE.BORNES(1;9999)/10000;3+RACINE(2);3-RACINE(2);1;4) 
et enfin la colonne C contient la fonction suivante: 
=A2+B2 


évidemment les valeurs dans Microsoft Excel 14.0.6123 changeront à chaque fois que vous activerez la 
touche F9 du clavier. 


Cela nous donne alors pour l'histogramme (dont je ne vais pas détailler la construction car il s'agit d'un 
sujet élémentaire en bureautique): 
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30% - 


6 65 7 75 8 85 9 95 10 105 11 115 12 125 13 135 14 
jours 


Figure: 57.38 - Distribution obtenue de la somme des variables aléatoires 


et la convergence du 95ème centile sur les 100 premières simulations (car le problème étant simple, le 
système converge suffisamment rapidement pour ne pas avoir besoin d'en prendre plus de 100 pour 
l'exemple): 


12.00 - 
11.50 - Reste 

11.00 - 

10.50 - 


10.00 - 


jours 


9.50 - 


8.00 + T T T T 1 
Ô 20 40 60 80 100 
simulations 


Figure: 57.39 - Illustration de la convergence du 95ème centile 


Évidemment dans Microsoft Excel 14.0.6123 les graphiques ci-dessus changeront à chaque fois que vous 
activerez la touche F9 du clavier. 


Remarque: Dans le cas de simulations de variables aléatoires, on peut dans les cas simples impliquant 
uniquement des sommes ou soustractions de variables aléatoires, comme c'est le cas pour l'exemple ci- 
dessus, déterminer l'espérance et l'écart-type du résultat analytiquement en utilisant la propriété de 
linéarité de l'espérance et de la variance (car normalement pour la variance de deux variables 
aléatoires indépendantes, la covariance est nulle). En analysant la différence entre la valeur analytique 
et celle obtenue par la simulation numérique, on peut corriger le décalage de certains autres 
indicateurs statistiques par simple ajout ou soustraction du différentiel. On parle alors de la technique 
des "variables de contrôle". 
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Il existe d'autres techniques de réduction de la variance (ou in extenso: de l'écart-type) que la méthode de 
quasi Monte-Carlo permettant de réduire la variance des estimateurs de Monte-Carlo dans certaines 
conditions particulières: 


1. Une de ces techniques est l'usage des "variables antithétiques" qui consiste très simplement (la 
programmation de cette technique est du niveau du lycée) à décorréler les simulations pour rendre 
la covariance entre les variables négatives et ainsi de réduire la variance (puisque comme nous 
l'avons vu dans le chapitre de Statistiques, la variance de la somme de deux variables aléatoires fait 
apparaître un terme de covariance). Malheureusement, cette technique ne fonctionne de manière 
satisfaisante qu'avec des distributions symétriques ce qui fait qu'à ma connaissance elle n'est pas 
implémentée dans les logiciels de simulation disponibles sur le marché. 


2. Il existe aussi la technique "d'échantillonnage stratifié" qui consiste à découper l'espace des pré- 
images de la variable aléatoire en intervalles réguliers (la programmation de cette technique est 
aussi du niveau du lycée). Cette technique fonctionne très bien lorsque le nombre de simulations 
doit être faible mais seulement dans le cas d'une unique variable. Raison pour laquelle elle n'est pas 
implémentée à ma connaissance dans les logiciels de simulation disponibles sur le marché. 


3. Il existe une généralisation de l'échantillonnage stratifié (la programmation de cette technique est 
aussi du niveau du lycée) pour les simulations comportant plusieurs variables et qui se nomme 
"Latin Hypercube" (abrégé "LHS" pour Latin Hypercube Stratification). Cette technique assure 
donc que chaque n-uplet de variables aléatoires (correspondant à un espace à n -dimensions) utilise 
une pré-image unique à chaque itération, d'où le nom de la technique (Latin: fait référence aux 
carrés magiques où chaque valeur apparaît de manière unique, Hypercube: car il s'agit d'une 
généralisation à n dimensions d'un carré magique). Certains logiciels de simulation disponibles sur 
le marché implémentent cette technique (@Risk, CrystalBall). 


Pour résumer, que ce soit la technique des générateurs de séquence de Fauré, des variables antithétiques, 
des variables de contrôle, de l'échantillonnage stratifié ou de Latin Hypercube même si ces techniques 
sont toutes faciles à programmer, la méthode utilisant les variables pseudo aléatoires est privilégiée car 
est la plus adaptée à la majorité des situations courantes de l'économie mondiale. 


16. BOOTSTRAPPING 


En Statistiques, les techniques de bootstrap sont des méthodes d'inférence statistique requérant des calculs 
informatiques relativement intensifs. L'objectif est de connaître certaines indications sur une statistique : 
son estimation bien sûr, mais aussi la dispersion (variance, écart-type), des intervalles de confiance voire 
un test d'hypothèse. Cette méthode est basée sur des simulations, comme les méthodes de Monte-Carlo, à 
la différence près que le bootstrap ne nécessite pas d'information supplémentaire que celle disponible dans 
l'échantillon. En général, il est basé sur de nouveaux échantillons obtenus par tirage avec remise à partir 
de l'échantillon initial (on parle de rééchantillonnage). 


Nous distinguons en général, deux types de bootstrap: 


- Les bootstraps qui ne font aucune hypothèse sur la loi de distribution des données analysées. Nous 
parlons alors de "bootstrap non-paramétrique". C'est le cas le plus courant et nous ferons un exemple 
uniquement pour celui-ci. 
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- Les bootstraps qui remplacent chacune des données mesurées par celles correspondantes à l'expression 
analytique de la loi distribution de probabilité supposée. Nous parlons alors de "bootstrap paramétrique". 
Une fois le remplacement de chacune de valeurs d'origine effectué, la démarche est exactement celle du 
bootstrap non-paramétrique. 


Nous allons illustrer le principe du bootstrap (dit aussi "bootstrapping") sur l'exemple de l'intervalle de 
confiance de l'espérance # d'une variable aléatoire. Pour cet exemple, l'intervalle de confiance de 
l'espérance d'une variable aléatoire est parfaitement déterminé à partir de la moyenne et de la variance 
calculées sur l'échantillon (cf. chapitre de Statistiques). 


Nous considérons un échantillon de la variable aléatoire composé de # = 10 estimations: 
À =)16,12,14,6,43,7,0,54,25,13; (57.509) 


La moyenne arithmétique de l'échantillon est: 


ss re Le 
X=-S x=—0) x =19 (57510) 
# ;= 1053 


et son écart-type (estimateur de maximum de vraisemblance non biaisé): 


1 __2 110 2 
g=f—Six-Â)i= fSSix-19=1709 (57511) 
#=15 1 


Comme nous sommes dans la situation d'une moyenne empirique connue et d'une variance empirique 
connue, pour faire le calcul d'un intervalle de confiance, nous avons alors démontré dans le chapitre de 
Statistiques qu'il fallait utiliser: 


mn. 
Z-T  @-DSus À +—=T;2-T (57.512) 


En p 


où S est une autre notation traditionnelle dans certains domaines de la statistique pour la notation de 
l'écart-type empirique (cf. chapitre de Statistiques). Nous avons alors pour l'intervalle de confiance à 95% 
de l'espérance: 


17:09 17.09 


19 - Box (9) < 4 S19 + 
10 


Dsx(9) (57.513) 


Soit: 


1. Pos £ {4 <19+10 226 (57.514) 


V0 V0 


Ce qui donne: 
449<y<3351 (57515) 


L'intervalle de confiance peut être également calculé par bootstrap. Il est alors obtenu par l'algorithme 
suivant: 
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À partir de l'échantillon initial, nous simulons de nouveaux échantillons, appelés "répliques", de taille n, 
par tirages aléatoires avec remise. Par exemple avec la série précédente, nous pourrions obtenir la réplique 
suivante: 


X" ={54,0,16,7,43, 54,0,25,25, 6! 


dans laquelle certaines valeurs de l'échantillon initial ne figurent pas, et où d'autres apparaissent plusieurs 
fois. Plusieurs échantillons sont ainsi simulés. Nous pouvons ainsi former un nombre de répliques 
(arrangements) égal à ( ): 


4 = x" 


Pour chaque échantillon simulé, une moyenne est calculée (plusieurs milliers de moyennes!). L'intervalle 
de confiance à 95% est défini sur cet ensemble de moyennes typiquement à l'aide du calcul des centiles 
(via les fonctions d'un tableur ou d'un langage de programmation). 


Évidemment pour chaque ensemble de plusieurs milliers de valeurs, les centiles ne seront pas les mêmes 
donc il est même possible de créer un intervalle de confiance pour les centiles eux-mêmes! 


Il est très facile (au même titre que la méthode de Monte-Carlo) de créer des répliques avec des tableurs 
(de type Microsoft Excel) sans faire de la programmation informatique! En plus la technique du bootstrap 
est très puissante car elle ne fait appel à aucune hypothèse sur la distribution statistique sous-jacente. Le 
domaine le plus courant et simple d'application du bootstrapping est la gestion de projets où lors de 
réunions avec une dizaine de ressources chacune estime la durée d'une tâche ou d'une phase. 


Le bootstrap peut donc être appliqué à tout estimateur autre que la moyenne, tel que la médiane, le 
coefficient de corrélation entre deux variables aléatoires ou la valeur propre principale d'une matrice de 
variance-covariance (pour l'analyse en composantes principales) et c'est là sa grande force!!! 
Effectivement, pour ces estimateurs, il n'existe pas de relation mathématique qui définisse l'erreur-standard 
ou l'intervalle de confiance. Les seules méthodes applicables sont des "méthodes de 

rééchantillonnage" (resampling) comme en fait partie le bootstrapping. 


Exemple: 


Avec par exemple le tableau Microsoft Excel 14.0.6123 et en s'interdisant de faire de la programmation 
VBA, nous construisons un petit tableau avec l'échantillon: 
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Figure: 57.40 - Échantillon de base 


Nous souhaiterions pouvoir déterminer un intervalle de confiance de la médiane (nous faisons exprès de 
prendre un indicateur statistique pour lequel il n'existe pas d'intervalle de confiance analytique). Pour cela, 
nous calculons la médiane de plusieurs milliers de réplications où chaque réplication correspond à une 
ligne: 


Figure: 57.41 - Médianes de répliques 


avec la longue formule pour la version française de Microsoft Excel 14.0.6123 suivante qu'il faut mettre 
dans la cellule F5 et tirer ensuite jusqu'à la fin de la feuille: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


=MEDIANE(INDEX($SA$5:$A$14;/ALEA.ENTRE.BORNES(1:10);1); 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1;10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS$14;ALEA.ENTRE.BORNES(1:10);1): 
INDEX($SA$5:$AS14;ALEA.ENTRE.BORNES(1;10):1)) 


Nous pourrons donc en avoir 10 milliards pas plus... (comme Microsoft Excel 14.0.6123 est limité à un 
million de lignes, cela coupe net toute discussion). 


Il suffit ensuite dans une cellule de votre choix de mettre: 
=CENTILE(F5:F2003;0.025) 

et dans une autre: 

=CENTILE(F5:F2003;0.975) 

ce qui avec 2'000 réplications donnera respectivement 7 et 29.5. 


Avec des connaissances élémentaires du tableur, il est possible de montrer graphiquement la convergence 
de la moyenne de la médiane en fonction du nombre de réplications (ci-dessous avec les 100 premières 
réplications): 


5 + T T T 
0 20 40 60 80 100 
Figure: 57.42 - Convergence de la médiane en fonction du nombre de réplications 


T 1 


Évidemment, ce graphique aura un aspect différent à chaque fois que vous relancerez la simulation dans 
Microsoft Excel 14.0.6123 en appuyant sur la touche F9 du clavier 
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17. DICHOTOMIE 


La dichotomie consiste pour un objet de taille N à exécuter un algorithme de façon à réduire la recherche à 
un objet de taille N/2. On répète l'algorithme de réduction sur ce dernier objet. Ce type d'algorithme est 
souvent implémenté de manière récursive. Lorsque cette technique est utilisable, elle conduit à un 
algorithme très efficace et très lisible. 


Un exemple simple est la recherche de la racine d'une fonction continue (nous avons déjà étudié 
différentes méthodes plus haut pour résoudre ce genre de problèmes). C'est-à-dire le point pour lequel la 


fonction f s'annule. 


Supposons qu'une fonction soit croissante et continue sur un intervalle [a,b] et telle que la racine cherchée 
soit entre a et b. Nous avons donc par le fait que la fonction soit croissante dans l'intervalle: 


J(a)< f@) (57.518) 
et le fait que la racine se trouve dans l'intervalle: 


Jf(a)-f(b) <0 (57.519) 


Nous calculons: 


Si Àf > O alors la racine est dans l'intervalle [ Î nr”: »| sinon elle est dans l'intervalle [as Tu |. 


Nous avons donc ramené le problème à une taille inférieure. Nous arrêterons l'algorithme quand la 
précision sera suffisante. 


L'algorithme Maple 4.00b est donné par: 


zero:=proc(f,a,b,pre) 

local M; 

M:=f((a+b)/2); 

if abs(M)<pre then 
RETURN((a+b)/2) 

elif M>0 then 
zero(f,a,(a+b)/2,pre) 

else zero(f,(a+b}/2,b,pre) 
fi 

end: 


et ce ne sont que quelques exemples auxquels la méthode est applicable!! 
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18. ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) 


L'analyse en composantes principales (A.C.P.) est une méthode mathématique d'analyse graphique de 
données qui consiste à rechercher les directions de l'espace qui représentent le mieux les corrélations entre 
n variables aléatoires (relations linéaires entre elles). 


Simplement dit, une A.C.P. permet par exemple de trouver des similitudes de comportement d'achat entre 
les classes des données observées. 


Même si l'A.C.P. est majoritairement utilisée pour visualiser des données, il ne faut pas oublier que c'est 
aussi un moyen: 


- De décorréler ces données. Dans la nouvelle base, constituée des nouveaux axes, les points ont une 
corrélation nulle (nous le démontrerons). 


- De classifier ces données en amas (clusters) corrélés (dans l'industrie c'est surtout cette possibilité qui est 
intéressante!). 


Remarque: Il existe plusieurs versions de l'A.C.P. connues sous le nom de "transformée de Karhunen- 
Loëve" ou de "transformée de Hotelling" et qui peuvent aussi bien être appliquées sans 
programmation V.B.A. dans Microsoft Excel que dans des logiciels spécialisés (où le temps de calcul 
sera par contre plus bref... et les résultats plus précis aussi...). 


Lorsque nous ne considérons que deux effets, il est usuel de caractériser leur effet conjoint via le 
coefficient de corrélation. Lorsque l'on se place en dimension deux, les points disponibles (l'échantillon de 
points tirés suivant la loi conjointe) peuvent être représentés dans un plan. Le résultat d'une A.C.P. dans 
ce plan consiste en la détermination des deux axes qui expliquent le mieux la dispersion des points 
disponibles. 


Lorsqu'il y a plus de deux effets, par exemple trois effets, il y a trois coefficients de corrélations à prendre 
en compte. La question qui a donné naissance à l'A.C.P. est: comment avoir une intuition rapide des effets 
conjoints? 


En dimension plus grande que deux, une A.C.P. va toujours déterminer les axes qui expliquent le mieux 
la dispersion du nuage des points disponibles. 


L'objectif de l'A.C.P. est de décrire graphiquement un tableau de données d'individus avec leurs variables 
quantitatives de grande taille: 


Tableau: 57.12 - Représentation-type d'un tableau A.C.P. 


Afin de ne pas alourdir l'exposé de cette méthode et de permettre au lecteur de refaire complètement les 
calculs, nous travaillerons sur un exemple. 
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Considérons pour l'exemple une étude d'un botaniste qui a mesuré les dimensions de 15 fleurs d'iris. Les 
trois variables (p = 3) mesurées sont: 


- x, : longueur du sépale 
- x: : largeur du sépale 
- x: longueur du pétale 


Les données sont les suivantes: 


Tableau: 57.13 - Exemple pratique de données tabulaires A.C.P. 


Pour nous un tel tableau de données sera tout simplement une matrice réelle à n lignes (les individus) et à 
p colonnes (les variables): 


Par la suite l'indice i correspondra à l'indice ligne et donc aux individus. Nous identifierons donc l'individu 
i avec le point ligne x, = (x #5) qui sera considéré comme un point dans un espace affine (cf. 


chapitre de Calcul Vectoriel) de dimension p. L'indice j correspondra à l'indice colonne donc aux 
variables. Nous identifierons la variable j avec le vecteur-colonne: 


c'est donc un vecteur dans l'espace vectoriel de dimension n dans IR”. 
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Nous nous placerons dans la suite suivant deux points de vue: soit nous prendrons le tableau de données 
comme n points dans un espace affine de dimension p, soit nous prendrons ce tableau comme p points d'un 
espace vectoriel de dimension n. Nous verrons qu'il y a des dualités entre ces deux points de vue. 


L'outil mathématique que nous allons utiliser ici est l'algèbre linéaire (cf. chapitre d'Algebre Linéaire), 
avec les notions de produit scalaire, de norme euclidienne et de distance euclidienne. 


Afin de simplifier la présentation, nous allons dans un premier temps considérer que chaque individu, 
comme chaque variable, a la même importance, le même poids. Nous ne considérerons aussi que le cas de 
la distance euclidienne. 


Nous allons commencer en centrant les données, c'est-à-dire mettre l'origine du système d'axes au centre 
de gravité du nuage de points. Ceci ne modifie pas l'aspect du nuage, mais permet d'avoir les coordonnées 
du point M égales aux coordonnées du vecteur G}f et donc de se placer dans l'espace vectoriel pour 
pouvoir y faire les calculs! Comme nous supposons dans toute la suite que les poids des individus sont 
identiques, nous prendrons donc #4, = 1/# avec i=1..#. 


Nous considérons le repère orthonormé (0.à C'PECA dans la base canonique (ä.2....8,) de R?. 
Soit donc G le centre de gravité du nuage de points. Comme chaque variable ou chaque individu est 


supposé avoir le même poids, G a alors pour coordonnées dans le repère (0.à CPE : 


avec: 


Nous avons alors pour l'instant sous forme graphique: 
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Figure: 57.43 - Points de mesures et centre de gravité 


Nous appelons "matrice centrée" la matrice: 


j “ P F2 
A = A Zn 7 ZX 7 Xp An | (67.525) 


Remarque: La matrice des données centrées contient les coordonnées centrées (que nous noterons 
xt ) des individus dans le repère (c,à .& + . Nous nous placerons dans la suite toujours dans ce 
repère pour le nuage de points des individus et nous prendrons 0 =. 


Pour notre exemple, nous avons: 
G=x=-(591306387) (57.526) 


et pour la matrice centrée: 
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—0.8067 04400 —2.4733 
—1.0067 —0.0600 —2.4733 
—1.2067 01400 —2.5733 
—1.3067  0.0400 —2.3733 
—0.9067 0.1400 —-2.4733 
1.0933 05400 08267 
04933 01400  0.6267 
X,=| 09933 00400 10267] (57.527) 
—0.4067 07600  0.1267 
0.5933 -02600 07267 
0.3933 02400  2.1267 
—0.1067 —0.3600 12267 
1.1933 -0.0600 20267 
0.3933 -0.1600 1.7267 
0.5933 -00600 1.9267 


et sous forme graphique: 


Figure: 57.44 - Points de mesures centrés 


Pour donner une importance identique à chaque variable afin que le type d'unités des mesures n'influence 
pas l'analyse, nous travaillerons avec les données centrées réduites (cf. chapitre de Statistiques). Pour cela, 
nous noterons d'abord: 


Y(x -3,) 15.2 =" | (57.528) 


= # ;= # 
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La variance d'échantillon de la variable centrée est donc égale à un facteur 1/n près à la norme de cette 
même variable mais centrée. La matrice des données centrées réduites (sans dimensions) est alors: 


(x -n)/a L (a -x;)!a; Du (x mL 
F=|(m-n}a -- EX -x,)/o, _ las -x,)/o, (57.529) 
(za -n}a (x -7;)/o; . (ee zx, Ne, 


Si nous notons Z};, la matrice diagonale suivante: 


Ua - 0 
Dis s : (57.530) 


Nous avons alors: 


Remarque: Chaque composante de la matrice Y est donc de moyenne nulle et de variance unitaire (ce 
qui revient à dire que la norme de la variable centrée réduite est unitaire comme nous allons de suite le 
démontrer). 


Nous définissons la "matrice des données centrées normées" par: 


Soit encore (il s'agit simplement de l'erreur quadratique moyenne que nous avions introduite dans le 
chapitre de Statistiques): 


La terminologie vient bien évidemment du fait que la somme des carrées des composantes de chaque 
colonne de la matrice Z est de norme unitaire. En effet: 


: ñ nÎx. —X. 1 
ire] nerf et 650 
1= H î 


Ce qui donne: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


—0.2383 03572 —-0.3375 
—0.2974 —-00487 -0.3375 
0.356535 0.11356 —-0.3512 
—0.3861 00324 —0.3239 
—0.2679 04384 —0.3375 
0.3230 01136  0.1128 
0.1457  0.1136  0.0855 
Z=| 02935 00324 0.1401 (57.535) 
—0.1201 -06170 0.0172 
0.1753 —-02110 0.0991 
0.1162  0.1948  0.2902 
—0.0315 -—-02922 01674 
0.3526 -00487 0.2765 
0.1162 -0.1298 0.235356 
0.1753 -00487  0.2629 


Nous avons graphiquement: 


1 
z, —5 z 


1 


Figure: 57.45 - Points de mesures centrés et réduits 


Représenter le nuage de points des données centrées réduites ou centrées normées ne modifie rien à la 
forme de celui-ci. En effet, la différence entre les deux n'est qu'un changement d'échelle. 


L'information intéressante pour les individus est la distance entre les points! En effet plus cette distance 
sera grande entre deux individus z; et z;. plus les deux individus seront différents et mieux on pourra les 
caractériser. Mais il faut d'abord choisir une distance. Nous prendrons la distance euclidienne (cf. chapitre 
de Topologie): 
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Pa) ET) cn 


Les figures suivantes montrent les projections orthogonales dans l'espace de ce nuage de points 
respectivement dans les plans (0,4 ,8),(0,2:,8:) et enfin dans (OQ,% ,%3 ) qui est la meilleure 


projection, appelée "plan factoriel" (ou parfois "diagramme des scores"), dans le sens où elle respecte le 
mieux les distances entre les individus (in extenso, elle déforme moins le nuage de points dans l'espace). 
L'objectif de l'A.C.P. est de déterminer ce meilleur plan et nous démontrerons comment. 


z a. —.5 


Figure: 57.47 - Projection des points sur le plan vertical du repère centré 
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z 1 5 


Figure: 57.48 - Projection des points sur le plan factoriel 


Et la vue plane de chacune des projections: 


individus: plan (0,z ,,z ,) individus: plan (O,z 22 4) 


-0.6 -04 -02 0 02 0.4 


Figure: 57.49 - Vue plane de chacune des projections 


Avant de déterminer le plan factoriel, nous allons maintenant chercher à détecter les liens possibles entre 
les variables. 
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Nous rappelons (ci. chapitre de Statistiques) que la covariance entre deux variables x; et x; est donnée 
par: 


et que le coefficient de corrélation linéaire (cf. chapitre de Statistiques) est: 
cov(x, xÿ) 
TT; 


les matrices des covariances et de corrélations carrées (toutes deux étant pour rappel des matrices carrées 
et symétriques) avec j =1.p,j'=1.p. 


Nous voyons relativement facilement que la matrice des covariances est au coefficient 1/n près, la matrice 
des produits scalaires canoniques des vecteurs de la matrice des données centrées Æ#, (en d'autres termes, 


chaque composante de la matrice des covariances est égale au produit scalaire des variables centrées). 
Nous en déduisons la relation suivante: 


La matrice des covariances-variances (puisque comme nous l'avons vu dans le chapitre de Statistiques, la 
diagonale contient les variances) est un outil connu d'interprétation sur ce site. Par contre, ce qui est 
nouveau et va nous être très utile pour déterminer le plan factoriel est la matrice des corrélations linéaires 
qui peut aussi être écrite sous la forme suivante: 


ER=r.A _lyry pre (57.541) 


EN ñ 


Ce qui donne pour notre exemple où nous avons trois variables (très facile à calculer avec un tableur 
comme Microsoft Excel), la matrice carrée suivante (que les données soient centrées ou non les 
composantes de la matrice sont identiques): 


1 —0.1609 0.8854 
R=|-0.1609 1 —0.3818| (57.542) 
0.8854 —0.3818 1 


Pour continuer, toujours dans le but de déterminer le plan factoriel, définissons le concept d'inertie d'un 
nuage de points. 
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Définition: Nous appelons "inertie d'un nuage de points" la quantité: 


n 
1=—Yd°(G.M;) (57.543) 


# ;2 
où G est le centre de gravité du nuage de points et Af, un point de IR? de coordonnées *. 
Remarque: Le carré de la distance est pris par anticipation des développements qui vont suivre. 


Ensuite, démontrons que nous avons la relation suivante: 


n nn | 
> > d° (M,,M;) = 2nÎ (57.544) 


=] =] 


Démonstration: 


n On 2 | 2  , 
224 (a) - ET - LC +0 


i=1 x" 
2x (prof PTT +200) 


LOECEUE CEE 


“ge 00)-[p#u)220-9 
= 2"! +2n1+0 


= 2n1 


CIC.Q.F.D 


Nous allons dans toute la suite travailler avec les données centrées normées, in extenso avec la matrice Z. 
Les points 4, auront donc ici comme coordonnées 7}. 


Le problème est maintenant de trouver le meilleur espace affine de dimension p dans le sens où il respecte 
au mieux les distances entre les points. Pour cela, nous allons rechercher la meilleure droite vectorielle 


À; qui est parfaitement déterminée par le vecteur #. Appelons À, la projection orthogonale de À, sur la 
droite À;. Alors notre problème est de trouver la droite (in extenso le vecteur # ) qui fasse que la somme 


des carrés des distances entre les points À, soit maximale. Nous écrirons le problème sous la forme d'un 
problème de programmation quadratique: 
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. 57.546 
“eR? ( 2 


Or ici, nous avons: 


En effet, le centre de gravité du nuage de points projetés est aussi l'origine. Par suite, notre problème peut 
s'écrire: 


max / 


GelR? (57.548) 
(= 1 


Lui-même équivalant donc à: 
max > d? (O,A,) 


Es AQ 
Se? (57.549) 


lé] =1 
Résolvons donc ce problème: 


Tout d'abord, puisque À; est la projection orthogonale du point Àf, sur À; nous avons OX, = && pour 


tout i avec &, = OM, où. Par suite les coordonnées des points À; sur la droite À; sont: 


Par suite, nous avons: 
d'(0,H,)= 5 @=|Z.4f =7G02.8 
Za"(0.H4;)=>æ =[Z 4f =27 40274 bn 
è El 
Ici nous cherchons le vecteur unitaire #. La matrice Z nous est parfaitement connue. Or, nous avons: 
(Z-2)o(z 5)=(2"Zi)où =(RS)o (5755) 


La matrice de corrélation R est symétrique donc, selon le théorème spectral vu dans le chapitre d'Algèbre 
Linéaire, elle est diagonalisable dans une base orthonormée de vecteurs propres (théorème d'Eckart- 
Young). Ainsi, nous avions démontré dans le théorème spectral que: 
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A=S TRS (57553) 


est diagonale (libre à nous d'en choisir le contenu) si R est symétrique et S orthogonale (qui est donc dans 
notre exemple une matrice carrée 3x3 !). Alors nous en déduisons la relation suivante qu'il est d'usage 
d'appeler la "décomposition spectrale": 


et comme S avait été démontrée comme étant orthogonale (et qu'il existe une famille de vecteurs propres 
pour cela!), nous avons (cf. chapitre d'Algèbre Linéaire): 


Donc: 


où nous choisissons pour À la matrice diagonale des valeurs propres rangées en ordre décroissant: 
> > 
A2>A..24,. 


Nous avons donc: 


P 


(RGjon= (SAS 5 )on = (As ao ST =(Añ}o= DAME (57.557) 
J=1 


Dans la littérature, cette somme est souvent notée de la manière suivante (très souvent mentionée dans les 
logiciels statistiques): 


Ja 
Sa = Jam Jem … VW) av (57.558) 
ov> 
Mais S étant orthogonale, nous avons par conséquent: 
(5=-s'siter [d=1={5eRr K=Ù 6:59) 


et ceci provient du fait que la matrice orthogonale est comme nous l'avions démontré dans le chapitre 
d'Algèbre Linéaire une isométrie (elle conserve donc la norme!). 


Comme les valeurs propres sont dans l'ordre décroissant, nous écrirons: 


Or le terme entre parenthèses est strictement inférieur ou égal à1 de par l'implication précédente. Donc: 
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Soit: 


Or rappelons que notre objectif est de maximiser cette inégalité. En d'autres termes de chercher w, tel que 
l'égalité soit respectée. Nous voyons assez vite qu'il en sera aïnsi si w = 1 et que les autres termes soient 
nuls. Ainsi, une solution triviale de notre problème de maximisation est donc: 


soit puisque: 
… _ QT el ne ” 57 564 
W=S'u=S u—u=S.Ww (57.564) 


qui est alors le premier vecteur propre de R (puisque R se diagonalise dans cette base) associé à la plus 
grande valeur propre À . D'où le fait que cette solution soit souvent notée sous la forme: 


H=S-"W (57.565) 
toujours avec à = 57125 (il est donc relativement aisé de déterminer S avec des logiciels lorsque R et À 
sont connus). 


Une fois que l'on a trouvé la première droite vectorielle, nous cherchons une deuxième droite dans le sous- 
espace vectoriel orthogonal à la droite vectorielle qui maximise l'inertie du nuage de points projetés. Nous 
démontrons, et devinons, que la solution est donnée par la droite vectorielle dirigée par le vecteur propre 
associé à la deuxième valeur propre de la matrice de corrélation et ainsi de suite... 


Ainsi, nous obtenons une nouvelle base (à Ps ) dont un des plans constitue le plan factoriel. 


Cependant, il nous faut connaître les composantes de Z dans cette base. Comme cette base a été construite 
sous la condition que R y est diagonalisable via la matrice S alors cette dernière matrice est l'application 


linéaire qui va nous permettre d'exprimer Z dans la base (ä ...,#,, | via la relation: 
1 P 
W=Z.S (57566) 


Ainsi, dans notre exemple les trois valeurs propres sont de la matrice de corrélation R sont (cf. chapitre 
d'Algèbre Linéaire): 


A=20303 4 =08846 À =00853 (57.567) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


et donc: 
2.0303 ( 0 
K = ( 0.8846 0 (57.568) 
Ô ( 0.0853 


Remarque: Certains logiciels indiquent les poids en % respectifs et cumulés pour chacune des valeurs 
propres. Ainsi, nous avons dans le cas présent les poids respectifs suivants en % du total: 


2.0303 


Pa= = =6667% P2= 0.0853 
ZA 


EE _oogge Po og 
DE +, (57.569) 


En ayant les trois valeurs propres, pour déterminer les trois vecteurs propres ( Un 43) qui forment la 


base princiaple, il nous faut donc résoudre le système de trois équations à trois inconnues (cf. chapitre 
Algèbre Linéaire) suivant pour chaque valeur propre: 


1-4 -01609 0.8854 Ilæ1 | lo 
—0.1609 1-4 -0.3818||2;2 |=|0 
08854 -0.3818 1-4 |,| [0 
—————ç— 1 — 


R & 


Ce qui donne donc (nous nous passerons de ce calcul élémentaire qui peut être fait à la main ou avec un 
simple tableur): 


0.6410 0.3803 —0.6666 
S=it,u;,u3l=|-03527 09174 01841 (57.571) 
0.6816 01171 0.7222 


qui vérifie donc: 
R=SAST (57572) 
ou autrement écrit (suite à la remarque d'un lecteur qui a voulu vérifier les calculs et qui s'est fait piéger): 


R=S AST | (57.573) 


Nous avons alors comme coordonnées des points Af, dans la base (x ,#:,#3) en utilisant: 


W=Z.S (57574) 


la matrice suivante: 
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—0.5268 (0.2045 -0.0198 
—0.4173 —-0.2043 —-0.0564 
—0.5259 —-00750  0.0052 
—0.4966 —0.1604  0.0305 
—0.5760 02699 00161 
0.2525 02488 —0.1169 
0.1156  0.1757 —0.0150 
#=| 02818 0.1634 —0.0916| (57.575) 
0.157838 —0.6311 —-0.0218 
0.2634 —0.1194 —-00871 
0.2108 0.2660  0.1739 
0.203939 —-0.2697  0.0912 
0.4469 0.1261 —0.0459 
0.2908 —0.0490 00712 
0.3196 00546  0.0663 


Les coordonnées des projections du nuage de points dans le meilleur plan défini par les vecteurs 
( ü) sont donc les deux premières colonnes de la matrice précédente (correspondant donc à la 
longueur du sépale et la largeur du sépale). 


Effectivement, nous voyons immédiatement que ce sont ces deux colonnes qui maximiseront la somme 
des normes dans le plan donné: 


individus: plan factoriel 1-2 


-0.6 -04 -02 0 02 0.4 
Figure: 57.50 - Plan factoriel déjà montré plus haut... 


Un logiciel comme Minitab 15.1 (référence dans l'industrie de la gestion de la qualité) donne les 
informations suivantes pour les valeurs propres (info pas très utile sous forme graphique... à mon avis): 
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Diagramme en cône de Longueur Sépale ; ...; Longueur Pétale 
2.0 
1.5 
[ri] 
L 
© 
[=] 
L 
[eh 
e 1.0 
2 
Ce) 
> 
0.5 
0.0 
1 2 3 
Nombre de composantes 


Valeur propre Z2.0302 0.868646 0.0853 
Proportion 0.677 0.295 0.028 
Cumulatif 0.677 0.972 1.000 


Figure: 57.51 - Valeurs propres pour l'ACP données par Minitab 
et le plan factoriel suivant (resterait à savoir comment les valeurs sont calculées car elles ne sont pas 
identiques à celles que nous avons obtenues ici... mais la forme graphique est bien juste et c'est le 


principal!): 


Diagramme en double projection de LongSép ; .…..; LongPét 


|} 
LongPét 


LangSép 


Seconde composante 


-2 =il (a) 1 2 
Première composante 


Figure: 57.52 - Plan factoriel donné par Minitab 


Pour clore ce sujet, signalons que de nombreux logiciels utilisent le fait que les vecteurs Z ; sont unitaires 


pour faire le produit scalaire qui correspond alors dans ce cas particulier simplement au cosinus entre les 
différents vecteurs tel que: 
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Zj 9Zj— le; Ilzsllcos(z 2; |= cos(z,z;| (57.576) 


# 
et comme nous avons démontré plus haut que: 


1 


R = ri = yly= gg (57.577) 
? A 
Il vient alors: 
R=r;,ju=cos|z;z;1| (57578) 


et comme dans notre exemple, nous avons 3 vecteurs Z ;, il y a donc 3 produits scalaires possibles si nous 
omettons les produits scalaires des vecteurs avec eux-mêmes. Donc la matrice: 


1 —0.1609 0.8854 
=|-0.1609 1 —0.3818| (57.579) 
0.8854 —-0.3818 1 


contient aussi les angles entre les vecteurs Z ;. 


Enfin, signalons que l'A.C.P. étant sensible aux données aberrantes, il vaut mieux parfois transformer les 
valeurs du tableau d'origine en leurs rangs respectifs (cf. chapitre de Statistiques) et appliquer exactement 
le même algorithme. Nous parlons alors d'une "A.C.P. de rangs". 


19. ANALYSE FACTORIELLE DES CORRESPONDANCES (A.F.C.) 


L'analyse factorielle des correspondances, en abrégé A.F.C., est une méthode statistique d'analyse des 
données (très utilisée en biostatistique et dans l'analyse de sondages). La technique de l'A.F.C. est 
essentiellement utilisée pour de grands tableaux de données toutes comparables entre elles (si possible 
exprimées toutes dans la même unité, comme une monnaie, une dimension, une fréquence ou toute autre 
grandeur mesurable). Elle peut en particulier permettre d'étudier des tableaux de contingence (ou tableau 
croisé de co-occurrence) et de décrire la liaison entre deux variables qualitatives. Elle sert à déterminer et 
à hiérarchiser toutes les dépendances entre les lignes et les colonnes du tableau. 


Le cas de plus de deux variables qualitatives est l'analyse de correspondance multiples (A.C.M.) 


Attaquons la théorie directement avec un exemple. Pour cela nous considérons le tableau (avec deux 
variables qualitatives) suivant des superficies des types de peuplements d'arbres en Picardie en 1984 en 
hectares: 


BASE] 106500 3'380 1'470 111'350 
BORN 101700 | 1000 | 0 | 111700 


ESomme 4520 | 4350 291600 
[OC 253400 17730 1'520 272'650 


Tableau: 57.14 - Tableau de contingences (tableau croisé) de l'A.F.C. 
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Les spécialistes du domaine appellent parfois les totaux des lignes et des colonnes respectivement les 
"marges de ligne" et "marges de colonne". Lorsque l'ensemble du tableau est mis sous forme de 
pourcentage, par rapport au total des totaux, on parle de "représentation en fréquences conjointes": 


92.93% 
Tableau: 57.15 - Tableau des fréquences conjointes de l'A.F.C. 


Nous souhaitons analyser s'il existe les degrés de ressemblance et de différence entre les variables. 
Remarquons, que nous ne cherchons pas à comparer l'égalité des moyennes ou des variances donc les 
outils statistiques vus dans le chapitre du même nom ne sont pas adaptés à ce genre d'analyse. 


Si nous choisissons la distance euclidienne: 
? 
2 : 2. 2 
d°(x;xs)= [xx] = HE _ oi (57.580) 
J=1 
sur les données brutes pour mesurer ces différences entre départements, nous obtenons les écarts suivants: 


3 
d(4,0)=5 (n;-2) = (106500101700)? +(3"380—10"000) + (1470 — 0)? 
a | (57.581) 


= 69025300 = 4 (4,0 = 69025300 = 8'308.1 [ha] 
et ainsi de suite pour les autres régions. Nous obtenons alors: 


d(A, 0) = 8308.1 [ka] 
d(A, 5) = 61'324.1 [ka] (57.582) 
d(O,5) = 56781.8 [a] 


Nous voyons en regardant le tableau et avant tout calcul que les départements de l'Aisne et l'Oise se 
ressemblent alors que le département de la Somme se diffère nettement. Les distances obtenues mettent en 
évidence cette observation. 


Mais dans le tableau ci-dessus les profils de l'Oise et de la Somme, avec une forêt mixte très faible, sont 
pourtant très proches en proportion. 


Dans ce contexte, nous voyons que la distance euclidienne transcrit les différences de masse entre les 
départements. En d'autres termes, l'Aisne et l'Oise se ressemblent car leurs superficies sont proches. Pour 
éliminer l'artefact lié aux ordres de grandeur, il nous faut transformer les données en pourcentage 
(pourcentages des régions). Nous obtenons alors: 
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Ê n so») PRE 


Tableau: 57.16 - Transformation du tableau de contingences en pourcents 


où les spécialistes du domaine appellent parfois la colonne en pourcents des régions "profil marginal des 
lignes" ou "masse" (et respectivement quand ils indiquent la ligne des pourcents des arbres). 


Si nous choisissons la distance euclidienne sur les proportions (données relatives), nous obtenons: 


2 


2 
P | X. X1; Fr Z; X; 

d°(p;ps)= Pr: = 2-2) De 2 RE (57.583) 
pr-iC it) 


soit: 


d(A,0) = 7.6% 
d(A,S) = 74% (57.584) 
d(O,5) = 0.2% 


Cette fois, l'Oise et la Somme apparaissent bien comme se ressemblant le plus avec leurs forêts. Nous 
voyons que travailler avec les données relatives semble donc plus pertinent dans ce cas! 


Maintenant, nous allons emprunter une idée aux économistes qui, lorsqu'ils ont des tableaux du même 
genre que le précédent, calculent ce qu'ils appellent "l'index" ou "élasticité" (souvent appelé "indice de 
spécificité" en statistiques et qui est donné par le rapports entre la fréquence conjointe et la fréquence 


marginale: 


+. 

x ZX; 
js À (57.585) 

se À 

x x 


Voici un exemple obtenu avec les tableaux croisés dynamiques de Microsoft Excel 11.8346 
qui inclut la fonction Index. D'abord le tableau de départ: 


Ontario Quebec 


576263 2535.66 | 9577.65 
625.00 675.00 1700.00 


151.24) 53973 1354.25 | 2045.22 

2421.39 1748.48 | 4169.87 
231.12. 1540.32. 36370 | 2135.14 
2486.72 1139.07 6002.09 | 19627.88 | 


Figure: 57.53 - Tableau croisé dynamique Microsoft Excel 11.8346 de départ 


et en activant la fonction Index: 
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inde [Region | 


Ontario Quebec 


Figure: 57.54 - Tableau croisé dynamique Microsoft Excel 11.8346 avec la fonction Index 
Pour voir d'où viennent ces valeurs, regardons par exemple l'article Desk dans la région Alberta. Il a un 


rendement (fréquence conjointe) de: 


= ——2z4852% (57586) 


par rapport à toutes les régions ce qui est au-dessus de la valeur de 33.33% qu'aurait comme rendement cet 
article toutes régions confondues s'il n'y avait pas de préférences de région! 


La région Alberta a elle un rendement (fréquence marginale) de: 


x1 _ 2486.72 
LL LE 12.66% 
x 19627.88 DEN 


par rapport à toutes les régions ce qui est en-dessous des 33.33% de rendement qu'elle aurait s'il n'y avait 
pas de préférences de région. Ainsi, ce tableau d'index permet de savoir si les différences sont 
qualitativement significatives!! 


Le rapport donne donc: 


1 


pe 

1="-2 2383 (57588) 
X] 
ZX. 


ce qui montre un fort décalage entre la valeur obtenue et la valeur que nous aurions si les proportions 
étaient respectées (surreprésentation de 283%). 


C'est donc une sorte de calcul de conformité: si le rapport valait 1, c'est que le rendement régional des 
ventes de cet article particulier serait conforme par rapport à toutes les ventes de cette région relativement 
à un marché national. Il n'y aurait alors pas d'anomalies. Voyons cela par exemple pour nos arbres où nous 
avions les effectifs observés: 


45200 | 4350 
253'400 
Tableau: 57.17 - Tableau de contingences (tableau croisé) de l'A.F.C. 
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et pour lequel nous obtenons le tableau croisé dynamique des index effectifs observés suivant dans 
Microsoft Excel 11.8346 : 


n è . 


Feuillus  Résineux Mixtes 

0.98 1.35 0.18 
L'Aisne (A) 1.03 0.47 2.37 
L'Oise (O 0.98 1:38 - 


Figure: 57.55 - Tableau croisé dynamique Microsoft Excel 11.8346 avec la fonction Index 


et nous voyons encore clairement à l'aide de ce tableau que ce sont l'Oise et la Somme qui se ressemblent 
le plus! 


Avant de continuer, nous pourrions nous poser la question extrêmement importante suivante: Quels 
seraient les effectifs théoriques qui auraient été obtenus si les proportions des arbres dans les régions 
étaient rigoureusement équivalentes à la proportion d'ensemble (soit de telle manière à ce que les index 
soient tous unitaires)? 


Eh bien simplement en faisant le calcul suivant (il s'agit simplement d'une règle de trois calculée dans 
chaque cellule) dont il faut bien - si possible - comprendre le sens sans l'appliquer bêtement: 


=(253'400/272'650)*111'350 =(17730/272"650)*111'350  |H(1'520/272"650)*111'350 
—103'488 =7'241 =621 
=(253'400/272'650)*111"700 =(17730/272"650)*111"700  |H(1'520/272"650)*111'700 
= =7'264 =623 


= (253'400/272"650)*49'600 =(17730/272"650)*49600  |=(1'520/272'650)*49"600 
46 098 53225 276 
[rot 2 53 "400 17730 1520 


Tableau: 57.18 - Respect des proportions de l'A.F.C. 


Et nous obtenons avec ces nouvelles valeurs le tableau des index des effectifs théoriques suivant dans 
Microsoft Excel 11.8346: 


à dl 


La Somme (5) 


Feuillus  Résineux Mixtes 


1.00 1.00 1.00 
L'Aisne (A) 1.00 1.00 1.00 
L'Oise (0 1.00 1.00 1.00 


Figure: 57.56 - Tableau croisé dynamique Microsoft Excel 11.8346 de l'index des effectifs théoriques 


ce qui montre que les proportions sont maintenant respectées! Parenthèse fermée (mais sur laquelle nous 
reviendrons un peu plus loin)! 


Eh bien quand nous voulons faire de l'analyse factorielle des correspondances, notre relation: 


2 
d'(Rri= > 3 2 (57.589) 


A", 


devient alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


2 
LS PRE (57.590) 


soit: 
d(A,0) = 0.30 
d(A,$8) = 0.39 (57.591) 
d(O, 8) = 0.02 


Cette fois encore, l'Oise et la Somme apparaissent bien comme se ressemblant le plus. 


La distance ci-dessus se nomme la "métrique du Khi-deux" car elle ressemble (mais c'est tout!) à la 
distance utilisée dans le test d'ajustement du même nom (cf. chapitre de Statistiques) mais ici, elle permet 
seulement de mettre en place une hiérarchie dans le cadre d'un tableau de contingences et d'observer les 
variables similaires de manière plus aisée!! 


Remarque: Il existe une autre manière de calculer une AFC en se basant sur une distance euclidienne 
mais en ayant pris soin aun préalable de transformer les données du tableau de contingences de 
manière particulière et ce pour que le calcul soit identique qu'en lorsqu'on utilise la métrique du Khi- 
deux. 


20. TEST D'INDÉPENDANCE DU KHI-2 


Pendant l'introduction de la méthode précédente permettant de comparer des effectifs (valeurs) et détecter 
lesquels étaient les plus proches, nous avons donné le tableau des effectifs observés: 


DAnERAME 10650 | 33%0 | 140 | 30 | 


BOOM 10170 | 1000 | 0 | 11700 
DISSHMEN 4520 | 4350 291600 
Ro 253400 17730 1520 272'650 


Tableau: 57.19 - Tableau de contingences de l'A.F.C. 


et nous avons montré comment trouver le tableau des effectifs théoriques (arrondis à l'entier le plus 
proche) dans les cas où les proportions auraient dû éventuellement être respectées: 


23 
46'098 3"225 49'600 
253'400 17730 1'520 272650 


Tableau: 57.20 - Tableau de contingences avec effectifs théoriques 


BOOM 1065 | 725 111700 
La Somme S). 
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La construction du dernier tableau ci-dessus présuppose par exemple que les trois régions sont dans des 
conditions identiques pour tout ce qui concerne la croissance et la multiplication des arbres et que le 
nombre d'arbres est en relation de cause à effet directe! !!! avec les régions et qu'il n'y a pas d'autres causes 
intermédiaires. ce qui est une hypothèse forte! 


Mais sous cette hypothèse, supposons que nous souhaiterions savoir si les différences observées entre le 
nombre d'arbres et les régions sont statistiquement significatives ou purement aléatoires à cause de 
l'échantillon expérimental? En d'autres termes, nous voulons savoir si le nombre d'arbres dépend 
réellement des régions dans lesquelles ils poussent ou si ces valeurs ne sont que dues au hasard de 
l'échantillon? Raison pour laquelle ce test s'appelle le "test d'indépendance du Khi-deux". 


Remarque: Le test d'indépendance du Khi-deux est recommandé en analyse sensorielle par la norme 
ISO 8588-1987 sous le nom de "test A-Non A". 


Pour répondre à cette question il faut d'abord une référence. Et cette référence est justement l'hypothèse de 
lien causal direct (proportions respectées) que nous avons donnée juste précédemment. 


Si nous considérons que chaque case du tableau des effectifs observés correspond à l'issue d'une variable 
aléatoire de loi inconnue et que chaque case du tableau théorique (du moins la classe d'effectifs) est 
considérée comme issue d'une variable aléatoire suivant une loi binomiale (et asymptotique d'une loi 
Normale) alors nous pouvons utiliser le test d'ajustement du Khi-deux: 


2 
N N (k—mp, 
D=V# = Ge) 
i=l i=1 RP; 
( ) pour avoir une bonne idée (mais qui reste quand même très approximative au 


vu des hypothèses!) si les différences entre les valeurs des effectifs observés sont dues au hasard ou sont 
réelles. Or, si D est petit, la probabilité que ce soit dû au hasard est grande mais si D est grand alors nous 
avons une différence réelle (donc nous utilisons le test d'ajustement du Khi-deux mais dans le sens 
inverse!). 


Reste à déterminer le nombre de degrés de liberté de la loi 7 que suit cette somme dans ce type de 
configuration! 


Dans le cas particulier (mais facilement généralisable par récurrence) d'une table à deux entrées avec deux 
variables catégorisées X avec Î niveaux et Y avec c niveaux nous aurons respectivement | lignes et c 
colonnes. 


Ainsi, la table aura bien évidemment / .c cellules. Dans la table des effectifs théoriques (dont chaque 
cellule est considérée comme une variable aléatoire) chaque cellule sera entièrement déterminée par la 
somme des autres de telle sorte que le nombre de degrés de liberté sera alors en toute logique comme nous 
l'avons vu dans le chapitre de Statistiques: 


N—-1=1.c-1 


Ainsi, en prenant notre exemple des forêts, c'est le total des totaux de 272650 qui nous permet d'écrire 
cette dernière relation et ainsi de déterminer la valeur d'une cellule éventuellement vide, toutes les autres 
étant données! 
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Un test du Khi-deux sur ce type de table teste l'hypothèse d'indépendance contre l'hypothèse alternative de 
dépendance. Sous l'hypothèse d'indépendance nous estimons qu'il y a besoin de seulement: 


G—-D+@-1) (57504) 


valeurs sur les N pour pouvoir en déterminer la totalité (en supposant implicitement connues les sommes 
par ligne et par colonne). 


Ainsi, si vous avez une table de 2 lignes par 2 colonnes, il vous suffit si vous connaissez les totaux des 
lignes et des colonnes, d'avoir 2 valeurs (soit (2-1)+(2-1)) pour déterminer les 2 manquantes. Le 
raisonnement s'applique aussi pour une table de 3 lignes par 3 colonnes où il vous suffit d'avoir au moins 4 
valeurs (soit (3-1)+(3-1)) pour déterminer les 5 manquantes. 


Les degrés de liberté pour le Khi-deux sont alors: 
ddl = {.c-D-[G-D+(c-D]=i.c-1-14+1-c+1=ic-1-c+1= 46-71) (57595) 


C'est cette relation qui nous dit (trivialement!) que si dans un tableau de 2 lignes par 2 colonnes 
comprenant donc 4 cellules (totaux des lignes et colonnes étant aussi connus!) qu'étant donnée une seule 
des valeurs (ddl valant 1), nous pouvons déterminer les 3 autres valeurs manquantes. 


Voici donc une définition possible du nombre de degrés de liberté: C'est le nombre maximum de valeurs 
du modèle telles qu'aucune d'entre elles n'est calculable à partir des autres. 


De même, pour un tableau de 3 lignes par 3 colonnes comprenant 9 cellules comme c'est le cas de notre 
exemple dans ce chapitre avec les forêts, la connaissance de 4 cellules seules permet grâce aux totaux en 
ligne et colonnes de déterminer les 5 autres qui seraient éventuellement non connues. 


D'où la relation dans le cadre de l'application du Khi-deux de la relation finale: 


2 
(QE 
P(E-Dc-1)= 72% (67596) 
ij Ë 
en faisant usage des notations utilisées dans l'industrie. Le terme: 
O; -E : 
(CA — #1 
19 V7 (57.597) 
E 
est souvent appelé "carré du résidu standardisé". Et le rapport: 
2 
| Oÿ = Ë;; | 
E; 
7 (67.598) 
< { Oÿ E Ë;; | 
_— 
ÿ BE; 


A LL 


est souvent appelé "contribution au Khi-deux d'indépendance”. 
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Remarque: Pour utiliser ce test à bon escient, il faudrait donc vérifier d'abord que les différences 
(numérateur) suivent une loi Normale ou que l'ensemble des termes de la somme forment une loi du 
Khi-deux ou approximativement (asymptotiquement) une loi Normale centrée réduite. 


Dans le cadre de notre exemple, nous avons: 


2 
3 : 
D=Y D TU) E560235 (7559) 
DS A DE LAS UE D) à 560235 (675% 


et la p-value de cette valeur avec la loi du Khi-deux à quatre degrés de liberté: 


(G-D@C-D)= #/(4) (67.600) 


est tellement proche de zéro (non statistiquement significatif) que nous n'avons aucune chance de nous 
tromper en affirmant que les différences observées dans le tableau sont statistiquement significatives entre 
les 3 forêts et donc qu'il y a très probablement indépendance. 


Nous obtenons un résultat similaire entre l'Oise et la Somme alors qu'avec l'AFC nous avons vu que ces 
deux forêts se ressemblaient beaucoup. 


Remarque: Dans la pratique il est souvent d'usage de prendre le p-value à 5% pour considérer la 
probabilité attachée aux écarts observés comme statistiquement significative ou non significative. 


20.1. V DE CRAMER 


Nous avons vu plus haut que le test d'indépendance du Khi-deux peut être utilisé pour mesurer le degré 
d'association de deux variables catégorielles dans une table de contingences de 1 lignes et c colonnes: 


et que cette distance suit une loi du Khi-deux à (1-1)(c-1) degrés de liberté. Nous allons démontrer de 
façon intuitive que la valeur maximum de la distance D est: 


Dax = Wi(min(,c)—-1) (57.602) 


et que cette valeur maximale n'est atteinte que si et seulement si chaque ligne ou chaque colonne contient 
une et une seule valeur non nulle. Sous cette dernière condition, nous pouvons toujours réarranger le 
tableau de contingences de façon à avoir tous les termes non nuls sur la diagonale du tableau. 


Évidemment, si le tableau n'est pas carré comme ci-dessous: 
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Tableau: 57.21 - Tableau de contingences rectangulaire 


le cas qui maximise D impose donc des termes en diagonale sur la dimension la plus petite en ligne ou 
colonne notée traditionnellement q. Dans le cas présent, nous avons donc: 


g=mnf,c)=c=4 (57603) 


Dans ce cas extrême et bien évidemment théorique, les lignes ou colonnes qui n'ont que des zéros peuvent 
être mises de côté et dès lors tout tableau peut se résumer à: 


Tableau: 57.22 - Tableau de contingences rectangulaire transformé en carré 


Évidemment, faire abstraction des lignes ou colonnes qui n'ont que des valeurs nulles suppose que dans la 
distance D du Khi-deux nous posions que: 


2 
LÉ D =0 (57.604) 


ce qui est tout à fait discutable. Pour la suite, nous allons avoir besoin des relations suivantes: 


q 
N= La (57.605) 
i= 


et: 
2 
2 | $ Lo TS 1, 
N = 24% = 2,4 2,4; = 2,2,&4; = 2,4 +2&a; (57.606) 
1=1 i=i j=1 1=1 j=1 1=1 i#) 


Dès lors, il vient: 
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2 L 2 
(O0; -EÆ, | q NW g N g N 4 &a 
. E; a #j &a, < a # N 
N N N 
gl&lN-& il fa 2 , 4 
= > - +=] >æa;+>a|-—)5a 
i a N W i#j ï i 
N 2 
g |V—@&, | q 4 2 
=" 12 ,1;n Er ess l y2 
F3 N NW N— N— 


(AË —2Na +a@ - a? | (N?-2NMa, | q 
D —+N= IN-2a |+N 


1 
q 

=qgN-25'a; +WN=gN-2N+N=Mig-1i= Wiminf,c)-li 
> 


(57.607) 


Nous définissons alors la valeur suivante: 


24 . 
y = Jp? = D CC (57.608) 


Wig-li 


comme étant le "coefficient V de Cramer" (la majorité des logiciels donnent cependant la valeur de V au 
carré). Ce dernier est tel qu'il ne dépasse jamais 1 et permet une interprétation plus intuitive du degré 
d'association dans un tableau de contingences. 

Dans le cas où le tableau est de dimension 2 en ligne et 2 en colonne, la relation précédente se réduit alors 
immédiatement à: 


W= 14 (57.609) 


Relation qu'il est de tradition de noter dans ce cas particulier sous la forme suivante: 


2 
N 


D 


p= (57.610) 


et de nommer "phi de Cramer". 
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Exemple: 


Considérons le tableau suivant (même si les conditions ne sont pas satisfaites pour un test d'indépendance 
du Khi-deux): 


Tableau: 57.23 - Un exemple de tableau de contingences pour le calcul du V de Cramer 


avec les effectifs théoriques: 


Débisnespectésmnl (12/18)-9-6 | (13 | 9 
Débismonespeaénl (1218)-9-6 | GA893 | 5 
LT RE CE EXC 


Tableau: 57.24 - Tableau de contingences de l'exemple avec effectifs théoriques 


Nous avons alors: 
Oÿ — E; (l 


= Pfi-lfr-D= _s! 
D=7yG-lDée-1=7D=}> &. 


5 
(8-62 (4-6 (1-3) (5-32 
+ + + 
6 6 3 3 

= 0.6+0.6+1.3+1.3 =4 


(57.611) 


Et à un niveau de 95%, nous obtenons avec la version française de Microsoft Excel 14.0.6123: 
20e (1) = LOLKHIDEUX INVERSE(95%; 1) = 3.841 (57612) 
ou avec la p-value: 
=1-LOILKHIDEUX.N(4;1;1)-0.045 (57.613) 


Il vient alors immédiatement: 


| 2 

2 Tic —-1) 4 3 

F = 72 = Toner EE 02204714 (57.614 
VA Nig-1i 1812-11: #2 


Nous sommes un peu limite ici. étant donné que la p-value est toute proche du seuil de 0.05. Cependant, 
prendre une décision dans le cas présent alors que de toute façon les effectifs sont si faibles reviendrait à 
conclure n'importe quoi et ce d'autant plus que l'outil est construit sur une cumulation d'approximations. 
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21. TEST EXACT DE FISHER 


Lorsque les effectifs dans la table de contingences sont trop petits ou que les valeurs sont vraiment trop 
irrégulières, l'utilisation du Khi-deux (test de Pearson) n'est plus possible car les conditions d'application 
ne sont plus valables. Nous allons voir que le test exact de Fisher peut être formalisé analytiquement dans 
des tableaux de contingences de 2 lignes par 2 colonnes (la majorité des logiciels de statistiques ne gèrent 
que ce scénario particulier pour le test exact de Fisher) sinon quoi il faut recourir à des simulations de 
Monte-Carlo. 


Le principe du "test exact de Fisher" (utilisable aussi bien en unilatéral qu'en bilatéral même si ce dernier 
est largement plus courant dans la pratique), basé donc sur la fréquence de croisement, est de déterminer 
si la configuration observée dans le tableau de contingence est une situation extrême par rapport aux 
situations possibles. Comme nous allons le démontrer, ce test a pour propriété particulière que n'importe 
quelle case du tableau peut servir de référence pour le test car les distributions sous-jacentes (lois 
marginales) de probabilité sont équivalentes. 


Pour étudier ce test, comme souvent dans ce chapitre, passons directement par un exemple. Considérons le 
tableau de contingence suivant (qui maintenant nous est connu...): 


Tableau: 57.25 - Tableau de contingences de départ pour l'étude du test exact de Fisher 


qui est donc en réalité pas adapté pour un test d'indépendance du Khi-deux puisque le contenu des cellules 
est inférieur à 10 unités et le nombre de degrés de liberté serait lui égal à l'unité. 


Ce même tableau en pourcentages donnera (même si c'est inutile pour le test que nous étudions il arrive 
souvent que les logiciels de statistiques communiquent ces valeurs): 


88.88% 11.12% 
44.44% 55.56% 
66.66% 33.34% 100% 


Tableau: 57.26 - Même tableau avec les pourcentages marginaux 


Les effectifs théoriques sont donnés par (même si c'est aussi inutile pour le test que nous étudions il arrive 
souvent que les logiciels de statistiques communiquent ces valeurs): 


(12/18)*9-6 | (6/18)*9=3 
[12] 6 | 18 ] 


Tableau: 57.27 - Toujours le même tableau mais avec les effectifs théoriques (règle de trois) 


[anses | Gays | 9 | 
si 
18 
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La question que nous allons commencer par nous poser est la suivante: connaissant les totaux pour chaque 
ligne et chaque colonne, quelle est la probabilité d'avoir les valeurs présentes actuellement dans chacune 
des cases! 


Cette question peut être formalisée si nous changeons le tableau sous la forme générique suivante: 


Da dc ( a oc 


Tableau: 57.28 - Représentation algébrique du contenu du tableau 


Explicitement et relativement à notre exemple en adoptant la notation d'usage de la loi hypergéométrique, 
la question est de savoir quelle était la probabilité d'avoir 8 (a=k) projets parmi les 18 (n) dont les délais 
ont été respectés par des chefs de projets certifiés sachant qu'il y a 9 projets (m) au total dont les délais ont 
été respectés et 12 projets (p) au total gérés par des chefs de projets certifiés. 


Nous avons alors vu dans le chapitre de Statistiques que dans ce cas il s'agit d'un tirage exhaustif, il faut 
donc utiliser la loi hypergéométrique donnée par: 


CA (x — #)l 
P(x,p,m,k) = H(k) = EE = Ce (57.615) 
/ PAP) 


Soit avec la version française de Microsoft Excel 11.8346: 


=LOI.HYPERGEOMETRIQUE(kp;m;n) 
=LOLHYPERGEOMETRIQUE(8;12;9;18)-0.06108597 


où pour rappel (cf. chapitre de Statistiques), K est le nombre de succès dans l'échantillon, p est la taille de 
l'échantillon, m le nombre de succès dans la population et n la taille de la population. 


Au fait les probabilités sont toutes égales quelle que soit la cellule choisie du tableau de contingences!! 
Cela peut se vérifier numériquement pour les sceptiques avec à nouveau un tableur comme la version 
française de Microsoft Excel 14.0.6123 en créant la structure suivante: 


Tableau de contingence: 
=ALEA.ENTRE.BORNES(0;15) =ALEA.ENTRE.BORNES(0;15) =$SOMME(A42:B2) 
=ALEA.ENTRE.BORNES(0;15) =ALEA.ENTRE.BORNES(0;15) =SOMME(43:B3) 
=$SOMME(A2:43) =$SOMME(B2:E3) =SOMME(A4:B4) 


Contrôle: 
= LOIHYPERGEOMETRIQUE(A2;,44:C2:C4) = LOLHYPERGEOMETRIQUE(B2/B4:C2:C4) 
= LOILHYPERGEOMETRIQUE(A43;44:C3:C4) = LOLHYPERGEOMETRIQUE(B3B4:C3:C4) 


et donc à chaque fois que le lecteur appuiera sur la touche F9 de son clavier il pourra constater que toutes 
les probabilités sont toujours égales. 
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Cela peut se vérifier aussi formellement en choisissant une cellule du tableau et en écrivant: 


| (x #1 
klim—-kilip-killiix-#mi-ip-tkiil 
Ep) = —_——— © (57616) 
A| 
plix-pil 


et pour une autre cellule de la même colonne, nous aurons: 


Pin,p,n-m,p-—k\i-= 
(xml iH—ix-miil 
(p-kill(e-mi-(p-kil(p-(p-kill{(e-(n-mil-(p-(p-killl 
EE —_—— —— 
plin-pil (57.617) 
in—m1l mal 


ip-killiinx-mi-ip-kilklim-kil 


A| 


plin-pil 
et donc: 
Pin,p,m,k\i= Pin,p,n-m,p-k\ (57618) 


et ainsi de suite... 


Bref, ceci étant dit, nous avons donc dans la case supérieure gauche la valeur 8 alors que l'effectif 
théorique est de 6. La première chose à laquelle nous pouvons répondre est de savoir si cette valeur de 8 
est anormalement grande ou pas par rapport à l'effectif théorique. Pour cela, nous calculons par exemple 
en unilatéral la probabilité cumulée d'être inférieur ou égal à 8. Nous avons alors avec la version française 
de Microsoft Excel 14.0.6123 et ultérieur (le dernier paramètre à 1 de la fonction permettant d'indiquer au 
logiciel que nous voulons la probabilité cumulée): 


=LOLHYPERGEOMETRIQUE.N(8;12;9;18;1)-0.995475113 


Il apparaît donc avec un seuil de 5% en unilatéral que cette valeur est anormalement grande. Nous 
sommes donc dans une situation extrême. 


Par contre, même si les probabilités sont égales pour toutes les cases, la probabilité cumulée elle ne l'est 
pas! Ainsi, nous avons par exemple pour la valeur de la case inférieure gauche (afin de vérifier si elle est 
anormalement petite par rapport à l'effectif théorique de 6): 


=LOIHY PERGEOMETRIQUE.N(4;12;9;18;1)-0.06561086 


Donc c'est une valeur qui n'est pas anormalement petite. Cependant, nous souhaiterions avoir un test 
permettant de conclure si l'ensemble du tableau est dans une configuration extrême ou pas. Or, en faisant 
le calcul case par case, nous n'allons pas arriver à grand-chose... 
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L'idée consiste alors à construire tous les tableaux dont les fréquences marginales sont de 9;9 et 12;6 et de 
calculer la probabilité d'une case donnée (l'avantage de cette technique est que la conclusion sera la même 
quelle que soit la case prise pour référence du calcul): 


=LOLHYPERGEOMETRIQUE(5:12:9;18)-0.244343891 
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=LOLHYPERGEOMETRIQUE(3:12:9;18)-0.004524887 


Soit pour résumer avec les valeurs de k (correspondantes à la cellule supérieure gauche): 


Re 
[0 | vous | 
DS [om 


Tableau: 57.29 - Probabilités de la loi Hypergéométrique correspondantes à la combinaison 


Comme dans la colonne du tableau original avec laquelle nous venons de travailler la plus petite valeur est 
4 et la plus grande 8, nous allons prendre les probabilités de queues pour savoir quelle est la p-value d'être 
au-dessus ou égal à 8 et en-dessous ou égal 4 (donc il s'agit d'un test en bilatéral). Nous avons alors: 


[ 9]  0.00452489 
0.06108597 


0.06108597 
0.00452489 
0.131221719 


Tableau: 57.30 - Sélection des valeurs d'intérêt 


Donc la p-value est de 13.12%. Nous ne pouvons dès lors pas dire que notre tableau d'origine est dans une 
configuration extrême si par exemple nous choisissons un seuil de 5%. De nombreux logiciels ne donnent 
que la p-value. 
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Remarque: Le choix des bornes est discutable avec ce test car si nous choisissons par exemple de nous 
concentrer sur la probabilité cumulée d'être dans l'intervalle borné fermé de 4 à 8 (donc inclus!), nous 
aurions un résultat de 99.09% et donc il faudrait considérer que nous sommes dans une configuration 
extrême à un seuil de 5%. Donc le choix des bornes avec une loi discrète est toujours délicat dans un 
test contrairement à un test basé sur une loi continue qui ne souffre absolument pas de ce problème. La 
majorité des logiciels de statistiques que nous connaissons prennent un intervalle borné ouvert pour 
l'intervalle (ce qui correspond alors premier calcul que nous avons effectué avec la p-value de 13.12%) 


Enfin, pour clore, le lecteur pourra vérifier qu'il tombera sur le même résultat quelle que soit la case qu'il 
choisit comme référence. 


22. KAPPA D'AGRÉMENT DE COHEN 
Si nos jugements reflètent notre pensée, ils sont plus rarement en accord avec ceux d'autrui. 


Cette variabilité interindividuelle bénéfique pour l'Homme, est cependant pénalisante dans de nombreuses 
disciplines scientifiques, où il est souvent nécessaire d'évaluer et d'améliorer l'accord entre des 
informations de même nature appliquées au même objet dans une exigence de contrôle de la qualité ou 
d'assurance qualité ou encore d'analyse sensorielle. 


Le test non paramétrique kappa de Cohen permet par exemple de chiffrer l'accord binaire (dichotomique) 
entre deux ou plusieurs observateurs ou techniciens lorsque les jugements sont qualitatifs. 


Prenons le cas dans le domaine médical où deux ou plusieurs praticiens examinant le même patient 
proposent des diagnostics différents ou des décisions thérapeutiques différentes. En l'absence d'une 
référence, cette multiplication des avis n'apporte pas la sécurité attendue d'un parfait accord diagnostique 
ou thérapeutique pour le médecin traitant et le patient. Il est donc important que l'accord dans une équipe 
de travail ou entre plusieurs équipes soit le meilleur possible pour garantir la qualité et la continuité des 
soins. 


Une solution consiste ici à réaliser une séance de "mise en concordance” entre les médecins pour estimer 
leur taux d'accord par le coefficient kappa et d'étudier leurs désaccords pour y remédier. 


Plus généralement, le test statistique Kappa est utilisé dans les études de reproductibilité qui nécessitent 
d'estimer l'agrément entre deux ou plusieurs cotations lorsqu'on étudie une variable discontinue. 


Le "Kappa de Cohen" est un indicateur empirique permettant de comparer le degré de concordance entre 
deux observateurs (donneurs d'opinion). C'est un système basé sur l'analyse d'une table de contingences de 
données appariées (puisque les deux observateurs analysent les mêmes objets). 


Pour illustrer le principe, considérons le cas très important où deux responsables qualité ont analysé 11 
pièces pour les rejeter ou les accepter. Ils ont obtenu: 


Tableau: 57.31 - Tableau de contingences dichotomique d'exemple 
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Les fréquences théoriques étant obtenues par une règle de trois (même calcul de règle de trois que pour le 
test d'indépendance du Khi-deux et le test exact de Fisher vus plus haut): 


(4/11*5=1.82 | (7/11)*5=3.18 
(4/11*6=2.18 | (7/11*6-382] 6 | 
as 7 | 1 | 


Tableau: 57.32 - Fréquences théoriques 


Le Kappa de Cohen est défini par le rapport: 


. Observés 4ocrds -Attendus 4oords - (3+5)1-(1.82+3.82\ D 
: Essais -Attendus 4m 11-11.82+ 3.82: | | 


Cette valeur de 0.441 indique un accord modéré entre les deux responsables. 


Si plutôt que d'avoir des fréquences, nous travaillons en pourcents (proportions) du total, le Kappa s'écrit 
alors: 


_ F0Observés drords 0 Attendus 4 cr _ PoA” PaA 


Ke = (57.620) 


1-#Attendus 4 rs 1 péa 
Ce qui donnera avec notre exemple: 


(3+5) 1 
Er td S+ 76) 
11 11 


a 0441 (57.621) 
1-—i4.5+7.6) 
TT 


Ce qu'il est aussi d'usage d'écrire de manière plus condensée sous la forme: 


IE + 
2 Pi 2 Pi+Pi+ 
FAST _ tPo0 *P1117lP0+ Po+ Ÿ Pi+Pi+} 


ee (57.622) 


1 Pure 1204 Po+ + P1+P1+) 
: 


Avec: 

—1<x, 1 (57.623) 
où +1 correspond à un accord parfait et -1 à un désaccord parfait. Évidemment, pour qu'il y ait accord 
parfait, il faut que les cellules (Rejeté, Rejeté) et (Accepté, Accepté) soient égales et que les autres soient 


nulles. 


L'interprétation suivante est d'usage pour la partie positive (la négative ayant aucun intérêt): 
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entre Det 1 
entre 0.6 et 0.8 


Entre 0 e1.0.6 
entre 0.2 et 0.4 Accord faible 
Entre 0,0 et 02 


Tableau: 57.33 - Interprétations d'usage 


Il faut cependant être très critique (comme toujours!) en utilisant ce type d'outil. Comprendre sa 
construction permet aussi d'en identifier les faiblesses et hypothèses qui sont tout à fait discutables. 


23. TEST DE MCNEMAR 

Le test de McNemar pourrait très bien se calculer en même temps que le Kappa de Cohen (le premier 
étant un test d'hypothèse statistiques et le deuxième un uniquement un estimateur ponctuel empirique de 
concordance). L'idée est que sous l'hypothèse nulle (appelée dans ce cas particulier "hypothèse de 


symétrie"), l'une des diagonales du tableau devrait avoir des valeurs égales. En d'autres termes sous la 
forme des proportions et en ne nous concentrant que sur une des deux diagonales: 


Ho:P11 = P22 (67.624) 
ou de fréquences: 

Ho :#1=#2 (57.625) 
Sachant que: 

#1 #22 = A (57.626) 


et sous la condition que n est suffisamment grand, nous pouvons écrire en nous basant sur une loi 
Binomiale dont le comportement est asymptotiquement Normal: 


1 0.5 
# 


0 511-051 1-05) (57.627) 
A 


Nous pouvons nous rendre compte que cela équivaut à écrire: 


#1 _ LA +22 (22) 


-n 2 nn | 2 7 
#1 + #22 a: +#39 (57.628) 
| 4x | 2 
ñ 


Dans la littérature spécialisée, nous retrouvons souvent cette dernière relation sous la forme: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


— (57.629) 


| Vote _ Nb +c 


Pour en revenir à notre relation initiale, certains en prennent le carré et approximent alors le carré de Z 
comme une loi du Khi-deux à un degré de liberté (mais bon dans la réalité approximer une loi Normale 
centrée réduite par une loi du Khi-deux à un degré de liberté c'est un peu n'importe quoi...): 


A 2 
Faso TE 
2 2 LE 2 (1)| 67:30) 


7 051-051  b+e 


Z 


7 


qui est souvent la relation définie dans les livres (sans démonstration.) comme étant le "test de 
McNemar". 


Le test est normalement effectué en bilatéral. L'avantage du test de McNemar est la facilité avec laquelle 
nous pouvons construire un intervalle de confiance de la différence de la diagonale. Effectivement, 
partons de l'estimateur de la différence: 


ñ # 
d=py -Pn 1102 (res) 


Nous avons alors en utilisant l'expression de la variance de la loi Binomiale qui est pour rappel (en 
adaptant juste un peu la notation à ce que nous avions démontré tout au début du chapitre de Statistiques): 


F(k)=»p(l-p) (57632) 


Dès lors en utilisant aussi la covariance démontrée lors de notre étude de la loi multinomiale dans le 
chapitre de Statistiques, il vient: 


a 1 1 
ridi=v(n-2)- ren — #33 = [ia +99 1— 2cov |A 1,#32 | 
ñ 


# # # 


1 

Lim: +223 (1 292 1 2-2 Pa) | 
: (57.633) 
Leu + p22 (1 P22 + 2m1P22 | 


= eur) 2 fm) one 


A| À À À À R A 


et donc nous pouvons faire un intervalle de confiance approximatif si les conditions habituelles sont 


respectées sous la forme: 
d Zn fr d\<d <d+Z,n fià | (57.634) 


Exemple: 
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Lors d'un audit social, un sondage est mené sur 200 salariées à propose de l'organisation du travail. Après 
des réaménagements, la même question est posée. Peut-on considérer qu'il y a eu de réels changements? 


Tableau: 57.34 - Sondage avant/après (apparié) 


Nous avons alors en prenant arbitrairement la diagonale (25, 38) pour l'analyse: 


2 
fo 2 
DS À = @=c) 57.635) 
0.511-0.5: b+c 


A 


La majorité des logiciels de statistique ne vous donneront pas 2.683 car ils appliquent une correction 
empirique à cause de l'approximation grossière qu'est la loi de Khi-deux. Vous aurez alors sur l'écran des 
logiciels la valeur de 2.285. pour 72. 


La p-value sera elle donnée (sans la correction) avec un logiciel comme la version française de 
Microsoft Excel 14.0.6123 par : 


=1-LOI. KHIDEUX.N(2.683;1;1)=-10.14% 


et avec la correction elle donnerait environ 13%. Donc dans les deux cas la p-value étant supérieure au 
seuil de 5%, on rejette l'hypothèse nulle comme quoi la différence des deux valeurs est grande. 


Nous ne calculerons pas dans l'exemple ici présent l'intervalle de confiance de l'écart d car les logiciels de 
statistiques ont presque tous des méthodes différentes de calcul pour cette valeur. 


Enfin, pour clore le sujet concernant le test de McNemar, signalons un indicateur empirique souvent 
utilisé est qui s'appelle le "coefficient de Yule" défini par: 


: PIX et F concordantsi— Pi X et F discordants 
7” PIX et F concordantsi+PiX et Ÿ discordants | 


Q 


57.636) 


Ainsi, si Q vaut 1, il est certain que les valeurs concordent et donc que Y est positivement lié à X. Si Q 
vaut -1, il est respectivement certain que les valeurs sont discordantes et que YŸ est négativement lié à X. 
Lorsque les valeurs sont indépendantes, Q sera nul. 


Encore une fois, insistons sur le fait qu'il faut cependant être très critique (comme toujours!) en utilisant 
ce type d'outil (coefficient de Yule ou test de McNemar). Comprendre sa construction permet aussi d'en 
identifier les faiblesses et hypothèses qui sont tout à fait discutables. 
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24. TEST DE COCHRAN-MANTEL-HAENZEL 


Le "test logarithmique des rangs" appelé aussi "test de (Cochran)-Mantel-Haenzel à temps stratifié" ou 
encore "test de Mantel-Cox", ou encore "test du khi-2 de Cochran-Mantel-Heanzel" ou plus simplement 
encore "test CMH".. a pour objectif (principal dans la pratique) de tester l'hypothèse nulle comme quoi 
deux courbes de survies (groupe Contrôle versus groupe Test), comme celles visibles ci-dessous (où la 
population survivant a été normalisée sur l'axe des ordonnées), sont significativement différentes ou non 
sous les hypothèses que: 


H1. Chaque strate est indépendante de la précédente 


H2. À chaque strate on s'attend à ce que la proportion attendue de survivants/décès soit identique toute 
chose égale par ailleurs (voir plus loin si ce n'est pas clair). 


H3. Chaque strate est distribuée selon une loi hypergéométrique. 


H4. La loi hypergéométrique est approximable par une loi Normale (ce que nous allons le rappeler, ne 
peut être fait que sous certaines conditions). 


Autrement dit, l'hypothèse nulle du test est que le traitement (médical, mécanique ou autre) n'a pas 
d'influence entre le groupe de Contrôle et le groupe de Test. 


NO 
1 


Figure: 57.57 - Courbes de survie type 


Autrement dit, l'hypothèse nulle du test est que le traitement (médical, mécanique ou autre) n'a pas 
d'influence entre le groupe de Contrôle et le groupe de Test. 


Pour introduire ce test, nous créons une table de contingence 2 x2 pour chaque intervalle (strate) de temps 


[&éu] où i=1,2,..,7 (chaque intervalle de temps peut aussi être assimilié à un hôpital différent pour 


une même étude clinique) qui aura la structure suivante: 
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Tableau: 57.35 - Tableau de contingence type pour le test CMH 


Nous parlons alors de table générale stratifiée 2x 2x»# ou de "tableau de contingence à trois 
dimensions". 


Remarque: Rappelons que si nous avons qu'une seule et unique table et que nous voulons seulement 
comparer la proportion de survivants ou morts pour les deux groupes, un test des différences des 
proportions sera appliqué (cf. chapitre de Statistiques). Nous pourrons aussi faire un test du Khi-deux 
si nous avons toujours qu'une seule et unique table (voir plus haut) et que les conditions ad hoc sont 
réunies. Ou encore un test exact de Fisher si les conditions du test du Khi-deux ne sont pas réunies. 
C'est la raison pour laquelle dans les logiciels de statistiques (comme Minitab par exemple), ces trois 
tests sont disponibles les uns à côté des autres. 


Ainsi, sous l'hypothèse que toutes les choses sont égales par ailleurs (H2), et c'est là l'essence même du 
test!, le nombre d'individus attendus pour chaque cellule de la période i sera comme pour le test exact de 
Fisher ou le kappa d'agrément de Kohen égal à: 


Ci (a; +b;)(a; +c;) 


Eas = Li —— 
À; À; 
Ci: . + À. Le 
Dies Le Ar 
À; À; 
(84 { + à (à +d | (57.637) 
; 4; . 
Ep; = Li 2 = a —_— 
1 i 
Cas (c+d;)(è +d,) 
£a ; L Li; Zi = NA "AT d "Ar 
#; À; 


Donc il faut bien comprendre que par exemple, #,; représente alors le nombre d'individus morts 
attendus du groupe Contrôle si celui-ci ce comportait comme l'ensemble des individus Contrôle+Test. 


Donc si les deux groupes (courbes de survie) se comportent identiquement, la valeur attendue devrait être 
alors égale à la valeur observée. 


Pour bien comprendre, illustrons le concept avec un exemple particulier: 


Tableau: 57.36 - Cas particulier de valeurs observées 
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Ici, les valeurs attendues donnent: 


Tableau: 57.37 - Valeurs attentues correspondantes au tableau précédent 


et nous remarquons que dans ce cas particulier, les valeurs attendues sont égales aux observées 
(simplement pour la raison que les rapports 800/1'000 et 1'120/1'400 représentent dans le tableau des 
observations le même pourcentage (la même proportion) de 80%). Évidemment, si la proportion des 
survivants observés pour les deux groupes sont égaux toutes choses égales par ailleurs, il en va de même 
pour les morts observés. Donc ce qu'il faut bien comprendre, quand nous faisons le test de MCH, c'est que 
nous sommes libre de choisir la colonne à analyser (puisque finalement cela revient au même!). 


Nous remarquons que chacune des relations: 


C1. Ci. C'as Ca; 
Es = Li TL Ee = Li; EE = Li; Ed = Li; = (57.638) 


représente en réalité l'espérance d'une loi binomiale ou hypergéométrique (cf. chapitre de Statistiques) 
puisque les deux lois ont la même expression pour l'espérance. Cependant, comme la taille des individus 
dans les cellules pourrait significative par rapport au total des lignes ou des colonnes, les tirages ne 
peuvent pas être indépendants. Nous devons alors nous rabattre sur la loi hypergéométrique (H3). 


Nous voyons aussi que par symétrie des relations ci-dessus, que la variable d'intérêt soit l'attribut de 
colonne ou de ligne ne change absolument rien en réalité au résultat du calcul puisque (par exemple): 


Ci ï Li; 


Eni = Li - Ci: 7. (6763) 
1 ï 


La variance pour chaque cellule sera alors celle de la loi hypergéométrique que nous avons déjà démontré 
dans le chapitre de Statistiques comme étant donnée par: 


PR A —X r\fs\a-k dsian-Xx kirs 
WA) = pq HP (57.640) 


| #}\A n-1 »2(#-1) n° (#1) 


avec pour rappel ? = #—#. Si nous adaptons l'écriture du chapitre de Statistiques au cas de notre tableau 
ci-dessus, cela donne pour toutes les cellules (de par l'écriture de la variance de la loi hypergéométrique la 
variance a la même expression pour chaque cellule!): 


; Li CC 2: . Li LC C2 


= — 57.6 
| #2 (x, —1) "mimi ES 


avec respectivement par exemple (pour ceux qui veulent faire l'analogie avec notre traitement de la loi 
hypergéométrique dans le chapitre de Statistiques): 
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A = 

r=Cx 

s= Ci; (57.642) 
&= 1; 


Î=n-k=n;-l; =; 


Là aussi, nous voyons que peu importe que la variable d'intérêt soit en ligne ou en colonne, la valeur 
calculée de la variance reste la même!!! 


Remarque: Une question qui revient souvent de ceux qui étudient ce test est de savoir pourquoi nous 
ne pouvons pas simplement faire la somme de toutes les strates dans une seule et unique table (car ce 
serait bien plus simple évidemment...)? Eh bien nous ne pouvons mettre réunir les tables dans une une 
seule car elles ne suivant pas forcémement la même loi (non identiquement distribuées dans le sens 
que la loi hypergéométrique n'a pas les mêmes paramètres d'une table à l'autre) et malheureusement la 
loi hypergéométrique n'est pas stable par l'addition. 


Et puis....??? En quoi cela va nous aider à comparer si les deux courbes de survie sont identiques à travers 
le temps (ou à travers différents hôpitaux s'il s'agit d'un test clinique)?! 


Eh bien prenons comme exemple de départ le tableau des valeurs observées suivantes: 


Tableau: 57.38 - re 1 de valeurs 200 750 


Nous avons alors pour les valeurs attendues: 


[Mons obsevés | Sunivans observés [Toul 
EE ET 


Te 2 1131 
DE 


Soit la différence: 


Tableau: 57.40 - Différences entre valeurs attendues et observées 


Nous comprenons alors déjà mieux pourquoi cela n'a aucune influence de choisir une cellule en particulier 
pour faire le test. Nous prendrons simplement celle qui nous arrangera le plus (en fonction de ce qui va 
suivre.…..). 
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Et prenant donc au hasard (puisque le choix n'influence - du moins pour l'instant... - pas le résultat du test 
comme nous l'avons montré dans les calculs précédents) la colonne des Survivants et particulièrement les 
observés du groupe de Test. Sa valeur attendue est alors: 


_ LnCx _ 1'400.2'020 


=1"131.2 


à 2'500 


Tableau: 57.41 - Valeurs attendue de la callule Tests-Survivants 
La différence entre observés et attendus donne: 
1°120—-1"1312=-11.2 (57.643) 
Cette différence serait évidemment nulle si l'observé était égal aux attendus! Avec pour variance: 


ÿ - Li LC Cas _ 480 -2'020-1"100 -1'400 


295.602 (76 
#1) 25002 (2500 1) né, 


Maintenant, sous les conditions 


M C. x, 
> gi à QE | Ze < TT 67645 
Li | C, | La a À 9 (57.645) 


vues dans le chapitre de Statistiques, la loi hypergéométrique peut être approximée par une loi Normale 
(Hd). 


Donc dans notre cas, cette approximation n'est pas acceptable (la troisième condition est disqualifiante) et 
donc le test ne peut être effectué (normalement on s'arrange pour prendre la colonne et la ligne qui 
permettent cette approximation puisque le choix n'influe pas sur la valeur du test mais sur l'autorisation de 
faire l'approximation mentionnée!). Mais si elle l'avait été, nous aurions pu approximer la loi 
hypergéométrique par une loi Normale (cf. chapitre de Statistiques): 


Ce qui peut ce ramener à une loi Normale centrée réduite si nous prenons dans notre cellule du tableau des 
observés: 


= N(0,1) 57647 


Et dès lors il suffit pour une strate i de savoir si nous sommes en dehors de l'intervalle de confiance que 
nous nous sommes fixés. Mais. nous avons plusieurs strates! L'idée est alors soit de sommer sur les T 
strates par indépendance (H1): 
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T 
nn _ DWi0,1=W| 0,7 (57.648) 
1 xx 51 
rÈ (#1 


ce qui est peu pratique (était du moins à l'époque où pas tout le monde avait un ordinateur), raison pour 
laquelle on préfère faire la somme suivante: 


(57.649) 


Soit sous forme condensée (encore une fois! peu importe le choix de la cellule!): 


7: d; — Ba; | 


F 


si 1 


= N(0,1) (57.650) 


Et si les différences entre attendu et observé n'est pas trop grande à travers toutes les strates, la valeur de 
cette expression se trouvera dans un certain intervalle de confiance de la loi Normes. En dehors 
l'hypothèse d'égalité des deux courbes de survie sera rejetée. 


Cependant, la majorité des logiciels de statistique prennent le carré de cette dernière relation. 


Il vient alors que la carré suit une loi du khi-2 à un degré de liberté (nous l'avons démontré dans le chapitre 
de Statistiques) tel que: 


À = … D G7651) 


Pour des raisons pratiques, on ajoute un terme 0.5 à la somme, ceci assure une meilleure approximation à 
la loi Normale. Donc: 


2 
[Sd - Ex; +05] 
SF 


mi ! 


= 67652) 


Exemple: 


Considérons les valeurs observées suivantes de deux hôpitaux À et B pour un test clinique: 
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Tableau: 57.42 - Test clinique stratifié sur deux niveaux (valeurs observées) 


Nous souhaiterions donc non pas savoir si les deux hôpitaux sont différents ou pas (là n'est pas le propos), 
mais de savoir si les différences entre le groupe de Contrôle et de Test sur l'ensemble des hôptiaux est 
significativement différent ou non. 


Bon nous devinons déjà le résultat intuitivement au vu des valeurs... mais faisons quand même les calculs. 


Nous voyons déjà que pour l'hôpital A, la colonne des Survivants satisfait les trois conditions pour 
l'approximation par une loi Normale (ce qui n'est pas les cas pour la colonne des Morts): 


742-450 742 742 
de 2) So 
. | 742 | d x) D 


De même pour l'hôpital B (et c'est heureux car une fois une colonne choisie pour une strate, il faut que la 
condition d'approximation soit applicable à la même colonne de toutes les autres strates): 


—4 
50 > fn) 50 > no) 50 e (57.654) 


300 800 — 490 


Les valeurs attendues respectives donnent pour la colonne d'intérêt: 


Tableau: 57.43 - Valeurs attendues de la colonne d'intérêt du test clinique sur deux niveaux 


Ce qui donne pour les différences: 


Tableau: 57.44 - Différences valeurs observées-attendues de la colonne d'intérêt 
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Nous voyons alors rapidement pourquoi une fois la colonne choisie, celui de la ligne n'a plus d'importance 
(soit une somme des valeurs négatives, soit on somme des valeurs positives et comme on prend le carré de 
la somme, cela ne change rien au final!). Choisissons arbitrairement la deuxième ligne. Nous avons alors: 


| ° : LC | i EC À 
pl dj — E; | b fa = 2e) b (a "2 ] 
_ ES TES 12 


Sy S Loi En Ci Cas Es Lo Lg Ci Ca 
= a (2-1) a ir -l (57.655) 
_ (17.25+9. 387 : 736 = 31 845 
” 292.450. 688. 54 4.310: 490.-750-50  11966+11.139 
742? (742-1) 25822581; 


Et nous avons avec un tableur standard comme Microsoft Excel 14.0.6123 en unilatéral gauche à un seuil 
de risque de 5%: 


185% (D=LOLKHIDEUX.INVERSE(95%;1) z 3.841 (57.656) 


Donc sur le cumul des deux hôpitaux (strates) le groupe de Contrôle est significativement différent du 
groupe de Test. La p-value du test est typiquement donnée avec Microsoft Excel 14.0.6123: 


1-LOI.KHIDEUX.N(31.845;1;1)-0.000002% (57.657) 
25. MÉTHODE DES DIFFÉRENCES FINIES 


Dans le domaine des méthodes numériques, nous pouvons être amenés à rechercher la solution d'une 
équation aux dérivées partielles. Parmi les méthodes de résolution couramment pratiquées, la méthode des 
différences finies ou M.D.F. est la plus facile d'accès, puisqu'elle repose sur deux notions: la 
discrétisation des opérateurs de dérivation/différenciation (assez intuitive) d'une part, et la convergence du 
schéma numérique ainsi obtenu d'autre part. 


Prenons deux exemples fameux (car très scolaires) qui ne sont que des cas particuliers et simplistes 
d'application de la M.D.F. 


25.1. M.D.F À UNE DIMENSION SPATIALE 


Rappelons que nous avons démontré dans le chapitre de Thermodynamique l'équation de la chaleur 
suivante (nous présentons ici cette équation réduite à une dimension spatiale): 


OT(Xt) _ K OT 
G eo, à 
et remarquons que cette équation n'est pas très générale. (elle n'est pas relativiste et ne prend pas en 


compte la chaleur dégagée sous forme de rayonnement par le matériau considéré ni plein d'autres 
facteurs). 


Nous pouvons considérer (cf. chapitre de Calcul Différentiel Et Intégral) que: 
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OT(x5) _ T{x+ht)- Tri) 


x D (57.659) 
et: 
STE) 1 [Te +48)-T(x0 T(x 0 -Ta- 22) 
… _h ' (57.660) 
= ZUG +h,t)-2T(x,5) +T(x- hf) 
De même: 


OT(x5) _ Txt+#)-T(xt) 


57.661 
F* k en 


L'équation de la chaleur devient alors: 


T@i+D TG KE 


1 
: Fri ht) 2T(x,2) +T(x—h,t))=0 (57,660) 


P 


Après réarrangement, nous avons: 


T(x1+E)= ke (T(x+ ht) 2T(x,8) + T(x = h, 6) +T(x6) 
& y k 


. . (57.663) 
= 1 [TD + TG + RE) +T(x- hd) 
2€, h y k 


Si nous regardons cette relation de plus près, nous observons qu'il s'agit d'une simple récursivité. Il suffit 
de connaître la distribution T(x,0) pour déterminer ensuite toutes les autres valeurs puisque: 


rare elt- 7 T(x,0) + (TX +h,0)+ T(x —h,0)) (67.664) 
2€, À 2€, À 


2 
P Pr 


et: 


2 1 

Ta, 22) = [1 | 7x +4 (TG + HE) + TX RE) (67.665) 
2€, ec, h 

etc. Il est possible de mettre en oeuvre une telle simulation rien qu'avec un petit tableau et un peu de 


temps... h est appelé alors le "pas de maillage" du modèle. 


Pour le lecteur souhaitant s'entraîner. une barre de Fer longitudinale de 1 kilogramme a une capacité 
calorifique massique de 450 [J Vu “| , une densité de 7.88 [kg : #2 *] et sa conductivité thermique 


est de 82 EM si 
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25.2. M.D.F SPATIO-TEMPORELLE 


La M.D.F. est donc une méthode numérique très importante dans la pratique car elle permet aussi de 
résoudre par exemple directement les équations de Maxwell dans le domaine temps et dans l'espace. Elle 
se classe alors dans la famille des méthodes 3D (discrétisation tridimensionnelle de l'espace) et 
temporelles et trouve ses principales applications dans les domaines de la conception (antennes et circuits) 
, de la compatibilité électromagnétique, de la diffraction, de la propagation et de la dosimétrie 
électromagnétique (interaction ondes- matière vivante). 


Nous allons présenter ici les bases du concept car dans la pratique, la programmation de la M.D.F. est un 
métier à lui seul (comme tout le reste du site bien évidemment mais il est parfois utile de le rappeler). 


Dans un problème d'électrodynamique traité par M.D.F. la première opération nécessaire consiste à 
délimiter le volume V de l'espace et l'intervalle de temps 1-[0,T] pour lesquels on souhaite effectuer cette 
résolution (il est illusoire d'espérer résoudre les équations de Maxwell dans l'espace infini et pour une 
durée illimitée!). Le volume de calcul contient l'objet (antenne, circuit, ..) que l'on souhaite caractériser, 
en réponse à une excitation donnée. Dans un deuxième temps, il convient de procéder à un 
échantillonnage de l'espace (maillage de V) et du temps (discrétisation de 1) afin de permettre une 
implémentation numérique de la résolution. Le problème devient dès lors celui de la détermination du 
champ en tout point du maillage et pour tout instant discret de l'intervalle d'observation. Les 
échantillonnages spatial et temporel seront précisés dans la suite et découleront naturellement de la 
physique des équations à résoudre. Ils conditionnent bien évidemment à la fois la précision des résultats 
du calcul et les ressources informatiques requises pour le mener à bien. 


La structuration du maillage M.D.F. et le cheminement de la résolution résultent directement des 
équations à résoudre. 


Dans un milieu linéaire, homogène, isotrope, non dispersif et non magnétique (...), celles-ci s'écrivent 
explicitement en se basant sur la troisième équation de Maxwell ( ) que): 


=VxE£E 


SET 


Soit explicitement et avec le signe négatif passé de l'autre côté de l'égalité: 


88, 


=-|0,8#, —-@E, | 


08; 
——=-i@E,-0,8,) 
of 


8B, 


=-|0,E,-0,E,| 


Et nous utiliserons aussi la quatrième équation de Maxwell sans sources: 


Soit explicitement et réarrangé: 
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Soit pour résumer: 


0E, 1 
à = — 19,8, OzBy | 
Mr À =-(8,B,-0,B, | (57.669) 
CH 
0E, 
Al (8,8, —0,8,] 


ILE 1=—|0,Æ, (7,6 - 68, iréil 
28, (ré)=-(QE,(r.t)-0,Æ,(r,6)) 
2B (FÉl=—| 0,8; ir él 0,E, iF,éil 
(57.670) 
DEF = (9,2, (F,1)-0,8, iFéil 
LE 


DE (Fti= Der) rl) 


DEL F0 =-| 9,8% (7,41-0,8, (r,éil 


Dans la suite, nous nous intéresserons uniquement à la première équation, les autres conduisant à des 
développements similaires. 


Afin de permettre un traitement sur calculateur, les différentes dérivées présentes dans l'équation doivent 
être approchées numériquement. Pour ce faire, nous utilisons le principe des différences finies centrées qui 
s'appuie sur les développements en série de Taylor suivants (cf. chapitre Suites Et Séries): 


# & #. ik) 
HOR Le “ar” D (x- %)* (67.671) 


El dx* = kl 


Nous avons alors sur la base de ce principe: 


2 
Fr) 700 4 Sa CE Fig +. 


212 
2 (57.672) 
dy dy : 1 dy " 
An —— = fixni-— i |+—| — ! |— 
1x 2)= 400 > 1% (S) 7x 
Si nous négligeons les termes du deuxième ordre, il vient en soustrayant les deux séries: 
d d 
444 
f'(æ)= | a? | (67.673) 


à 


x 
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. 2 ; he à ; ; 
où £&ld, | est une erreur d'ordre 2, négligée par la suite (nous noterons que c'est le centrage qui , en 


permettant une compensation des dérivées secondes, minimise l'erreur dans l'approximation). 


En appliquant ce principe aux dérivées temporelles et spatiales de: 


2x: (Féi=-|0,8,(r,41-0,8, (7,61 


GA 

à mn ” ” : 

= 7 (F,é)=-(0,Æ, (F,t)-0,Æ,(r,t)l (67.674) 
LA 

6] . . ” 

te mel a (Féi-0,E, (7, il 


nous obtenons: 


d 
#e 273 ne ares) 


ou encore après réarrangement: 


d 
De (are +4) = B, (ares- à) 


d d dy 5 0 
: Ë, fure+%)-8, (unes) [sys] E, fo D ,Z,Ë 


+ä; 


(57.676) 


Cette relation montre que si nous connaissons les composantes Ë, :#, du champ électrique à l'instant t et 
la composante 8, du champ magnétique à l'instant antérieur f— 4} /2, il est possible de déterminer 8, à 


l'instant £+ «4 /’2. Bien évidemment la démarche est parfaitement identique pour toutes les composantes 
et montre le même décalage temporel. Ce résultat suggère donc d'utiliser une résolution numérique 


itérative, dans laquelle les champs électrique et magnétique sont évalués alternativement, respectivement 
aux instants discrets #4 et i#+1/21d,, 4 étant le pas du temps. Il est d'usage dans la littérature 


1 
*##= la composante du champ magnétique à l'instant | # +1/21d,. 


spécialisée de noter B 
x 
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Le même constat s'applique pour la distribution spatiale des points d'observation du champ. Ainsi, 
l'évaluation de 5, au point { x,y,z s'appuie sur la connaissance de Ë, aux points {x,y,z+d, /21 et 


(x,y,z-d, f2\ et de Æ, aux points (x,y+d, /2,ziet |x,y-d,/f2,z\. 


Nous pouvons donc résumer cela sous la forme géométrique suivante: 


Figure: 57.58 - Cellule de Yee 


Les composantes du champ électrique sont évaluées aux centres des arêtes du maillage et les composantes 
du champ magnétique aux centres des faces de façon à garantir l'alternance imposée par les équations (on 
appelle "cellule de Yee" la maille élémentaire dotée de cette répartition de points). 


Et donc globalement, nous avons un maillage de l'espace qui peut être représenté sous la forme suivante: 


SR 


RE 


dy cellule (1,1,1) 


Figure: 57.59 - Exemple de maillage par parallélépipède 
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Évidemment, nous pouvons exécuter les routines de calcul avec une valeur de la permittivité et de la 
perméabilité du vide non forcément égales dans toutes les cellules. Ce qui permet en plus de modéliser la 
propagation d'ondes électromagnétiques dans des milieux hétérogènes et non isotropes. 


Enfin, il est important de noter que le pas d'échantillonnage spatial et temporel doit pouvoir être 
paramétrable par l'utilisateur qui exécute ce type de simulations. Ceci pour des raisons de temps de calculs 
et aussi de précision. Effectivement, nous n'effectuons pas les mêmes modélisations pour un système 
multiphysique dans le vide à basse fréquence que dans la matière non isotrope à haute fréquence et ce, 
que ce soit sur un ordinateur de bureau ou un supercalculateur. 


26. CLUSTERING 


En analyse de données statistiques, le clustering (data clustering pour les anglophones) décrit des 
méthodes empiriques de classification de données (méthode de regroupement hiérarchique ou méthode de 
partitionnement de données). 


Il s'agit de techniques permettant typiquement la segmentation de l'ensemble des clients d'une entreprise 
en fonction de leur démographie ou de leurs habitudes d'achat, de grouper des documents pour des 
présentations, d'identifier de nouvelles espèces animales ou végétales, de regrouper de l'information ou 
des individus par par intérêts. 


Nous allons voir ici quelques techniques triviales que nous compléterons avec le temps... 
26.1. ARBRE DE RÉGRESSION ET DE CLASSIFICATION 


Les arbres de régression et de classification (en anglais CART pour Classification and Regression Tree) 
sont un ensemble d'algorithmes heuristiques très utilisés en marketing ou dans les sciences sociales pour 
discriminer (catégoriser) une très grande population. Bien évidemment, ces algorithmes ne feront jamais 
mieux qu'un être humain... mais demandez aussi à un employé de créer des groupes dans une population 
de 5 millions de clients sur la base d'une dizaine de variables explicatives. Vous allez pouvoir attendre la 
réponse longtemps... 


Bien que ces techniques automatisées de classification soient très utiles dans les situations 
susmentionnées, elles ont cependant un problème majeur qui fait que nous ne nous étendrons pas trop sur 
le sujet: 


1. Ces techniques sont très sensibles à la population analysée et donnent des résultats très différents. 


2. Les différentes techniques de classifications existantes donnent des résultats souvent totalement 
différents pour une même population. 


Il vaut donc mieux être prudent quant aux conclusions que nous pouvons en tirer et comparer les résultats 
de plusieurs méthodes et en fonction du retour d'expérience choisir celle qui subjectivement semble la 
mieux adaptée. 


Considérons un ensemble de variables catégorielles 4 ....,X*,. Le partitionnement récursif a pour but de 
diviser l'espace des p variables en rectangles qui ne se chevauchent pas. 
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Par exemple, soit la variable x; et une valeur s; de cette variable, on trouve que le partitionnement où 


x; <S& et & < x; sépare bien les données en deux ensembles disjoints. Ensuite, une des deux parties est à 
son tour divisée par une valeur de x; ou par la valeur d'une autre variable. Nous aboutissons alors à trois 
rectangles et ainsi de suite. 


L'idée est de créer n rectangles de telle sorte que l'ensemble de données contenues dans un rectangle soit 
homogène (c'est-à-dire ne contienne qu'une seule famille de points). 


Pour traiter de ce sujet, considérons un cas pratique: 


Un concessionnaire souhaiterait pour sa ville trouver un moyen de classer les familles qui sont à même 
d'acheter une voiture (propriétaires) et celles qui ne sont pas prêtes à en acheter (non-propriétaires). Un 
échantillon de 12 propriétaires (valeur "1" dans la figure ci-dessous) et 12 non propriétaires (valeur "2" 
dans la figure ci-dessous) est choisi. Les deux variables indépendantes sont x (revenus en kilo-francs) et 


x (surface de leur habitat): 


Observation Revenus Surface Propriétaire 


l 
2 l 60 18.4 l 
3 2 83.5 16.8 l 
4 : 64.8 21.6 
5 4 61.5 20.8 l 
6 5 87 23.6 1 
7 6 110.1 19.2 il 
ë 7 108 17.6 l 
9 ë 82.8 22.4 l 
10 9 69 20 l 
11 10 93 20.8 1 
11 51 22 l 
IS 12 8l 20 l 
14 13 LE: 19.6 2 
15 14 52.8 20.8 2 
16 15 64.8 17.2 2 
17 lé 43.2 20.4 2 
18 17 84 17.6 2 
19 18 49.2 17.6 2 
20 19 59.4 16 2 
ail 20 66 18.4 2 
22 21 47.4 16.4 2 
23 22 33 18.8 2 
24 23 51 14 2 
25 24 63 14.8 2 


Figure: 57.60 - Données à classifier 


Nous voyons que nous avons autant de propriétaires que de non-propriétaires (fréquence d'apparition égale 
dans toute la population). Dès lors la probabilité d'appartenance à une classe est de 50%. 


Soit graphiquement: 
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25 - 
= 
= 
a a 
a = 
20 + * a a 
+ a 
+ 
= + 
bé + 
15 - + 
E2 
10 1 T T T T 1 
30 sû 70 90 110 130 


mPropriétaire € Nor-Propriétaire 


Figure: 57.61 - Représentation des points (revenus, surface) 
Si nous appliquons l'algorithme CART sur ces données, nous voyons que nous devons choisir 
x3 (Surface) comme premier choix de division avec la valeur de division 19 (nous allons justifier 


pourquoi!). L'espace ‘x,x2 1 est maintenant divisé en deux rectangles (il était facile de deviner cette 
étape de discrimination même sans faire appel aux mathématiques): 


25 - 
= 
= 
a 
L] Le] 
J + 
20 ju + Œü 
Le 7 El 
G 
# bé = 
# 
15 - + 
ES 
10 + T T T T 
30 50 70 90 110 


mPropriétaire € Nonr-Propriétaire 


Figure: 57.62 - Première itération de la classification 


Notez comment la division en deux rectangles a créé deux zones (split) qui sont plus homogènes que le 
graphique initial. Le rectangle supérieur contient des points qui sont davantage des propriétaires tandis 
que le rectangle inférieur contient davantage de non-propriétaires. 


Pour déterminer cette division, l'algorithme CART a examiné chaque variable et toutes les valeurs 
possibles de division pour chaque variable de façon à trouver la meilleure division. 


Ainsi, les points de division possible pour x, sont (remarquez qu'il s'agit à chaque fois de la moyenne de 
deux valeurs connexes du tableau): 


x : {38.1,45.3,50.1,..,109.5} (57.677) 


et Ceux pour x3 Sont: 
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2 : (14.4,15.4,16.2,...,23) (57.678) 


Ces points sont ordonnés par l'algorithme d'après la façon dont ils réduisent "l'impureté" (hétérogénéité de 
composition) dans le rectangle que génère le "split". 


Il existe un grand nombre de façons empiriques de mesurer l'impureté. La plus commune à ce jour est 
l'utilisation d'un indicateur inspiré du coefficient de Gini (cf. chapitre de Techniques De Gestion), Aïnsi, si 
nous dénotons les classes par # = 1,2,3...,C où C est le nombre total de classes à prédire, "l'indice 
d'impureté de Gini" pour le rectangle À est défini par: 


C 
1(4) = - D pf (57.679) 


où ?ÿ est la fraction d'observations dans le rectangle À qui appartiennent à la 


classe k. Dans le cas qui nous concerne, nous avons toujours deux classes: Propriétaires/Non- 
Propriétaires. 


Ensuite, l'indice de Gini global est défini comme la moyenne pondérée des indices de Gini. 
Ainsi dans le cadre de notre exemple, nous avons deux classes, donc © = 2. Avant la séparation, nous 


avons: 


C 2 2 
D=1- D ré =1- (5) (5) =1-2(0.5) =0.5 (57.680) 
Li 24 24 


La séparation trouvée en 19 (voir le deuxième graphique) donne par exemple pour le rectangle supérieur 
de la première subdivision: 


2 : 2 ; 2 
Il Apl=1-Y pi =1- (ee ee) [ee Le | 


per # # 
: à (57.681) 
3 9 
=i-|[— | + — = 0.375 
12 12 
Pour la partie inférieure: 
2 oints bleus : oints rouges . 
ZA i=1- D p£ =1]- ju er | (se) 
per ñ # 
(57.682) 


CIRE 


Le hasard faisant, l'impureté est la même pour les deux rectangles (du haut et du bas). 


Il 
| 
| 
MT 
nt 
D|e 
Là 
[os] 
+ 


L'indice de Gini global est alors donné par: 
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I(A)= 16375 + IL 0.375=0.375 (57.683) 
24 24 


Remarquons avant de continuer que si la subdivision est parfaite (n'avoir qu'une seule famille de points 
dans un des rectangles), nous avons alors: 


2 


11 Arf sup i=1-X 7£ 
k=1 


. 2 ; 2 2 2 
= = es) A [ie Er | + (Fe) . (5) 
ñ# ñ# 12 12 (57.684) 
: à : 2 2 2 
. [ ) ” EE re) =: (5) ” (5) 
12 12 12 12 


=Û 


donc l'impureté est nulle. Et si tous les points apparaissent en proportions égales dans chacun des 
rectangles (pire des cas en quelque sorte), la valeur est alors: 


2 


1 An£ sup | = 1- 2 PE 
k=1 


. 2 | 2 2 2 
4 points bleus j points rouges AIRE: + y 
… A] #3 _ # #3 (57.685) 


C 
Li Anfsu = 1-2 PR =1-2= (57.686) 


ce qui est l'impureté maximale. 


Donc l'impureté est toujours définie par une valeur dans l'intervalle: 
C-1 
I(A)e | (57.687) 


Maintenant, pour continuer avec notre exemple, même sans faire appel à un algorithme informatique et 
sans même calculer l'impureté, il est relativement aisé de deviner où va se trouver la prochaine 
discrimination: elle sera en x = 84.75 (revenus). Ce qui donnera: 
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25 


20 


15 


10 : T T nu: 
30 5sû 70 90 110 


BPropriétaire € Nor-Proprétiaire 


Figure: 57.63 - Deuxième itération de la classification 


Ce qui était aussi facile à deviner même sans faire appel aux calculs (essayez avec votre entourage, vous 
verrez que très souvent ils trouvent les deux premières discriminations). 


L'impureté devra donc être calculée dans la nouvelle zone discriminée mise en évidence par un hachurage. 
Nous y avons donc: 


_ 2 points bleus : points rouges è 
I Agaiche = 1 D PR = ———— | +] ————— 
per # ñ# 


(57.688) 
| 2 - 
ÉE es | n É£ reuges 


2 
T1 Agoite I=1- 5 p£ =l- 
À À 


CRE 


L'indice de Gini global est alors: 


14)=L.018+2.0-015 (57.689) 
12 2 


Nous continuons, mais sachez que la suite est moins facile à deviner. La majorité des individus interrogés 
se trompent sans faire appel à la définition mathématique de l'impureté et proposent intuitivement à tort 
l'une ou l'autre des discriminations suivantes: 
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25 - 


20 - 


15 - 


BPropriétaire € Norr- Propriétaire 


Figure: 57.64 - Troisième itération de la classification 


avec (vous pouvez faire le calcul) une impureté totale de 0.2727. Alors qu'en réalité, la discrimination 
optimale est: 


BPropriétaire € Norr- Propriétaire 


avec une impureté totale de 0.2592. Effectivement: 


2 : 1 2 2 2 : 
Ii A j=1-) =1-||-| +|-| |[=04 
gauche 2 PK (3) (5) 


k=1 
(57.690) 


L'indice de Gini global est alors: 


3 


- OA 0.19720.2592 (57691) 


14=— 


À l'étape suivante, nous avons: 
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25 - 
a 
Œ 
- a 
& [=] ü 
E2 
20 + a + [n] 
= + 
+ + D 
° + 
15 - + 
> 
10 
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Figure: 57.65 - Quatrième itération de la classification 


À l'étape suivante: 


25 - 
a 
a 
» mn] 
2 (e] a 
+ 
20 + a + D 
= + 
& + En 
bé + 
15 - + 
C2 
10 


30 40 50 60 70 80 90 100 110 120 


mPropriétaire € Nor- Propriétaire 


Figure: 57.66 - Cinquième itération de la classification 


etc. jusqu'à obtenir au final: 
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Figure: 57.67 - Résultat final de la classification 
où chaque rectangle est pur (ne contient des données que d'une des deux classes). 


La raison pour laquelle la méthode est appelée algorithme d'arbre de classification est que chaque division 
peut être figurée comme la division d'un noeud en deux noeuds successeurs. La première division est 
montrée comme un branchement du noeud racine de l'arbre. Voici par exemple (faute de place sur la page) 
les six premières itérations de l'algorithme. 


Surface 


Figure: 57.68 - Représentation du résultat sous forme d'arbre/organigramme 


et comme mentionné plus haut, nous nous arrêterons ici puisque l'ensemble des techniques empiriques 
forment un métier à part entier tellement elles sont nombreuses (et presque aucune ne donne le même 
résultat). Indiquons enfin qu'il existe également des réseaux de neurones (voir ci-après) spécialisés dans la 
classification. 
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26.2. K-MEANS 


L'algorithme des K-moyennes ou "K-means" en anglais, appelé aussi parfois "classification avec méthode 
des nuées dynamiques", est en statistiques et en apprentissage automatique (plus précisément en 
apprentissage non supervisé), un algorithme de partitionnement de données, c'est-à-dire une méthode dont 
le but est de diviser des observations en K partitions (clusters) dans lesquelles chaque observation 
appartient à la partition avec la moyenne la plus proche. 


Les étapes de base de l'algorithme sont les suivantes: 

E1. Nous choisissons un partitionnement en K groupes 

E2. Nous générons K moyennes (centres) au hasard 

E3. Les données sont affectées au groupe dont le centre leur est le plus proche 
E4. Nous calcule la moyenne de chaque groupe en utilisant les données affectées 
E5. Nous retournonsà l'étape E3. 


L'algorithme K-means ne converge cependant pas forcément vers une solution optimale. Rappelons qu'un 
calcul d'optimisation globale est incompatible avec les volumes de données utilisés, quelle que soit la 
puissance des ordinateurs. Ainsi, les K-means vont utiliser des algorithmes itératifs permettant d'arriver à 
un optimum local. Ils vont tâtonner pour minimiser des matrices de covariances intra-classes. C'est aussi 
un algorithme qui va tenter de trouver les meilleurs K points initiaux. 


Certains logiciels vous donnent la possibilité de paramétrer les valeurs initiales et cela va influencer la 
qualité finale de la typologie, tout en sachant qu'il n'existe pas UN bon choix initial. Cela varie en fonction 
de la configuration des données et même du hasard... 


Il existe trois solutions fréquentes: 


- 1ère solution: Le logiciel les détermine les K points initiaux aléatoirement. Il peut procéder à un certain 
nombre d'essais et il choisira le plus concluant. 


- 2ème solution: L'avis d'expert, suppose que quelqu'un ait une assez bonne connaissance de la population 
étudiée pour rattacher à chaque classe un type idéal. Ce dernier peut être ou non un individu réel. 


- 3ème solution: Le logiciel répartit les K points initiaux non aléatoirement mais selon certains 
algorithmes empiriques. 


Plutôt que de présenter l'algorithme avec des équations mathématiques, il nous a semblé plus pédagogique 
de montrer comment implémenter cette technique dans un tableur comme Microsoft Excel 14.0.6123 car 
l'expérience nous montre que cela est beaucoup plus parlant et efficace. 


Pour cela, nous allons considérer d'abord la structure suivante dont l'idée est de déterminer 3 centres (donc 
il s'agit d'un 3-means): 
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Figure: 57.69 - Structure de départ de base avec Microsoft Excel 14.0.6123 


où nous avons à gauche des données d'une population basées sur caractéristiques X et Y avec un petit 
tableau qui affichera les coordonnées des trois centroïdes. Nous créons sur la même feuille le tableau 
suivant: 
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0 [s 


Ent 62%! 6276] 62%] 
m2 8713) 8713] 8713) 
BG | 6831) 6831] 6831) 
und, © 6492| ©6492] ©6492 
ES | 2014/9014! 9014 
En 6 | 11176] 11176] 111% 
13 


Da 5 | 2578] 2578] 2578 
uno 7184] 7184] 7184 
CO]  2530/  9530/ 9530 
Du, ©5554! ©5554] 55.54 
QD 12 | 5343] ©2343] 2343 
| 7752] 752] 752 
al © 5675| 5675] 56.75 
MS  6704[ 6704/6704) 
EE] 4777) 4777] 477 
23 
DS] ©5225] ©5225] ©5225 
ER O| © 6152| ©6152] ©6152 
LRO | ©6352] ©6352] ©6852 
Qi 21 | 5016| 5016] 5016 
DD Z2| ©©#3798| ©©#3798| ©3798 
EDS] ©5239] ©5239] ©5239 
Dust] © 6472|  6472[ 6472] Clu 
[1120.61 | 


Figure: 57.70 - Tableau principal dans Micrsoft Excel 14.0.6123 pour l'algorithme 


avec les formules triviales pour les trois colonnes N, O, P où l'on retrouve la norme de la distance 
euclidienne: 


O P 


RACINE(C28-$F#$872+(028-$G$87 2) |=RACINE((C28-$H$872+(028-#I$87 2) 
RACINE(C23-$F$872+(023-$G$87 2) | =RACINE(C29-$H$872+(029-$#87 2) 
=RACINE((C30-$F#872+(030-$G$872) |=RACINE((C30-$H$872+(050-#1$87 2) 


Somme des d 
Figure: 57.71 - Formules correspondantes à la figure précédente 
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et les formules suivantes pour les deux colonnes restantes: 


R 


Figure: 57.72 - Formules pour l'assignation au cluster et la minimisation des distances 


Ensuite, nous lançons le solveur de Microsoft Excel 14.0.6123 avec les paramètres suivants en faisant 
bien attention à prendre l'algorithme évolutionnaire ce qui fait que nous assumons qu'à chaque fois que 
nous pourrions avoir un résultat différent: 


$F#8:$K48 


[4F48:4K$8 <= 110 
$FHSÈKES >= 0 


Pl Rendre les variables sans contrainte non négatives 


Sélect, une résolution : voter _ 


Méthode de résolution 


Sélectionnez le moteur GRG non linéaire pour des problèmes non inéires de solveur. 
Sélectionnez le moteur Simplex PL pour les problèenss bnéaires, et le moteur Évolutionnaire pour les 
problèmes complexes. 


ne Csstente) (rem) 


Figure: 57.73 - Paramétrages du solveur de Microsoft Excel 14.0.6123 
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et nous avons en lançant le solveur: 


109.04453 | 18.37362 | 83.367905 | 20.996669 | 61.470015 | 20.753446 


50 6û 70 80 90 100 110 120 
Ponts de donmées MCentroïde 1 MCentroïde 2 MCemtroïde 3 


Figure: 57.74 - Résultat obtenu après lancement solveur 


avec le tableau: 
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Bt 4904) 23.51) 277) Clust | 27) 
Bu 2360) 471) 2435 | Cinste2 | 471) 

3 
EAN 4761] 2187 RS 
BUS 2266) 447) 2560 | Chste2 | 44) 


Een 
Lo 
E 


D Gunt 134) 2679] 465] | 
BB 26.55] 1.51] 2139] Cste | 
DUO 4008 | 1440! 7.57] Clustes 
MO 1623) 963] 3153] Che? | 
BA | 5816] 3238] 10.54] Cluster | 10.54 
2 2309! 257] 19.54! Cruste | 
St 3407! 84) 1358] Chute | 


en 
Lo 
S 


re 
Lun 
Le 


co [to © | 
8 | Sin 
— Lo | 


D G | 436) 18.58 | 34) 
[006 


BA 5630! 30.57] 867] Cluster | 867] 
DS | 426] 1895 | 487 Cluster | 487 
A6 | 6588 | 4017) 1827] Cluster | 1827 
BUS 5985] 3434] 1267] Cluster | 1267) 
D A9 | 470! 2448 | 518] Cluster | 518) 
D UQ0n|  4304/ 17.56 | 510! Cluster | 510 
D Ant 6168] 3626] 1473] 7 Cluster | 1473 
Bu 7605] 5042] 28.54] Cluster | 2854) 

Sum of Minimum distances 


Figure: 57.75 - Tableau principal correspondant au résultat obtenu après exécution du solveur 


Des logiciels spécialisés de statistiques comme Minitab 15.1.1 ou de Data Mining comme Tanagra 1.4.44 
donnent en comparaison les valeurs des 3 centres et qui sont une fois reportées dans 
Microsoft Excel 14.0.6123: 
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185714 | 91425 | 1975 | 648333 | 185333 


50 60 70 80 90 100 110 120 
Pots de dormées MCentroïde L MCentroïde 2  MCentroïde 3 


Figure: 57.76 - Report du résultat de Minitab 15.1.1/Tanagra 1.4.44 dans Microsoft Excel 14.0.6123 


avec le tableau: 
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DUB 3620! 902! 1838]  Ciuste2 | 502) 
BON 2225] 2243] 442] Cluster | 44) 
BON 4625 | 180] 2826 Chuste | 129) 
Ent 542) 404] 1426) 
BN2N| 3423) 1043) 1623 | Chute? | 104) 


us) 2322] 1643 | 1022 | Cluster | 1022 
A4 640| 3864] 1224) 
ES 1805] 26.75 | 133] Cluster | 133] 
Bé) 4041 4823] 2171 |___404) 
ES 259 | 422%] 1566) 
Bon 1286 3224] 599] Cluster | 599 
Bac 225] 4415] 17.6 
ma 22 | 1380/5843] 3183 | 
pesant 16631 2885 | 416 | Cluster | 416 

Sum of Minimum distances 


Figure: 57.77 - Tableau principal correspondant aux centroïdes obtenus avec Minitab 15.1.1 et Tangra 1.4.44 


La différence s'explique assez simplement! Un logiciel comme Microsoft Excel 14.0.6123 minimise la 
distance des points aux centres mais est incapable en même temps de maximiser la distance entre les 
centres. Par contre les logiciels de statistiques ont les algorithmes qu'il faut pour cela. 


Minitab 15.1.1 ne donne pas de graphique mais Tanagra 1.4.44 lui donne: 


[Revenut #| Ciurter KMeontt 


(A1) Surtace ve. (X2) Revenses by CV) Cluster KMeans 1 


+ C_imeans_1 À C_bméens_2 0 ©_kmeens 3 


Figure: 57.78 - Graphique obtenu avec Tanagra 1.4.44 


Bien évidemment il est possible de trouver des logiciels faisant encore mieux! 
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26.3. DENDROGRAMME 


Pour introduire cette autre technique de clustering, considérons directement l'exemple basé sur le tableau 
suivant: 


À B ie D 

IN) Observation Revenus Surface Propriétaire 
2 l 60 18.4 1 
3 2 85.5 16.8 1 
È 3 64.8 21.6 il 
5 4 61.5 20.8 1 
6 : 87 23.6 il 
7 6 110.1 19.2 1 
8 7 108 17.6 il 
9 8 82.8 22.4 1 
10 9 69 20 l 
11 10 93 20.8 l 

11 51 22 1 
13 12 81 20 l 
14 13 LE 19.6 2 
15 14 52.8 20.8 2 
16 15 64.8 17.2 2 
17 16 43.2 20.4 2 
l 17 84 17.6 2 
19 18 49.2 17.6 2 
20 19 59.4 16 2 
21 20 66 18.4 2 
22 21 47.4 16.4 2 
23 22 33 18.8 2 
24 23 51 14 2 
25 24 63 14.8 2 


Figure: 57.79 - Données de base pour l'étude des dendrogrammes 


Nous souhaitons avoir une organisation hiérarchique de ressemblance des individus en fonction de leurs 
revenus et de leur surface d'habitation. Une technique consiste à définir une distance pour cette mesure de 
ressemblance. Par exemple, la distance euclidienne (si chaque individu à deux coordonnées): 


2 2 
dÿixyi= x —2;| +(r-y;l 


est un choix particulier qui permettra d'associer deux individus dont la distance est minimale. Nous 
parlons alors dans le domaine du clustering de "lien simple". 


Ainsi, nous pouvons facilement avec un tableur comme Microsoft Excel 14.0.6123 créer une "matrice des 
distances" qui est une matrice symétrique à diagonale nulle et qui relativement au tableau donné ci-dessus 
donnera: 
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6 Qi 9 O0 MO 1 1 15 16 ON 19 19 20 21 22 23 4 


MR AN erAN ER EPUEIR [SCIENCES.CH] 
JE 60 #55 6d$ 615 #7 110 108$ 352$ 69 93 Eu #1 75 S2$ 6d.$ 432 %d 492 594 66 d7d 33 51 63 
! 0 (7 | 0 L L 


60 AHSA] 0.00 25.55 5.77 2.53 27.50 50.11 48.01 23.15 9.14 33.09 9.69 21.06 15.05 7.59 4.95 16.92 24.01 10.83 6.00 12.76 27.00 10.02 4.69 
#55 16#125.55 0.00 21.25 24.33 6.96 24.72 22.51 6.22 16.51 5.50 34.89 5.52 10.$#7 32.94 20.70 42.45 D 36.31 26.11 19.57 34.10 52.54 34.61 22.59 
dé 216) 5.77 21.25 0.00 SM 2.2: A5.36 43.38 15.02 d.d9 2$.21 13.51 16.28% 10.39 12.03 d.d0 21.63 19.61 16.10 7.78 3.42 18.16 31.92 15.75 7.03 
24.33 3.40 0.00 25.65 48.63 46.61 21.36 7.54 31.50 10.57 19.52 13.55 #.70 4.858 18.30 22.73 12.71 Sèd 510 14.77 2$.57 12.51 6.18 
nm 2346/2750 6.96 22.29 25.65 0.00 23.52 21.#4 15.36 6.62 36.04 7.00 12.65 34.31 23.10 43.92 6.71 38.27 2$.63 21.63 40.25 54.21 37.26 25.56 
MO AS) 50.11 24.72 45.36 48.63 23.52 0.00 27.49 41.11 17.17 59.17 29.11 35.10 57.32 45.34 66.91 26.15 60.92 50.80 dd.11 62.76 77.10 59.33 47.31 
AOS AT] 45.01 22.51 43.38 dé.61 21.54 0.00 25.65 39.07 15.34 57.17 27.11 33.06 55.29 43.20 64.#6 24.00 5$.$0 48.63 42.01 60.61 75.01 57.11 45.08 
#2% eBd] 23.15 6.22 15.02 21.36 4.37 27.49 2565 0.00 14.01 10.32 1-0 #.29 30.04 18.74 39.65 4.95 33.94 24.26 17.27 35.90 49.93 32.89 21.21 
64 20) 3.14 16.51 d.49 7.54 15.36 d1.11 39.07 14.01 0.00 24.01 18.11 12.00 6.01 16.22 5.05 25.#0 15.19 19.44 10.40 21.30 36.02 18.97 7.34 
63 20#|33.08 #50 28.21 31.500 17.17 15.34 10.32 24.01 0.00 d2.02 12.03 15.04 40.20 2$.43 49.$0 9.55 43.92 33.44 27.11 45.51 60.03 d2.55 30.58 
51 22] 9.69 34.59 13.51 10.57 36.04 59,17 57.17 31.$0 18.11 42.02 0.00 30.07 24.128 14.61 7.96 33.29 4.75 10.32 15.43 6.66 18.2# #.00 13.99 
St 202106 5.52 16.28 19.52 7.00 29.11 27.1 12.00 12.03 30.07 0.00 6.01 28.21 16.dd 37.$0 3.54 31.59 21.97 15.09 33.79 48.01 30.59 18.74 
MS 196) 15.05 10.57 10.39 13.55 12.65 35.10 33.06 #.28) 15.04 24.12 0.00 22.23 10.48 31.41 9.22 25.88 16.01 9.08 27.78 42.01 2d.64 12.92 
52% 20% 7.59 32.44 12.03 #.70 34.31 57.32 55.29 30.04 16.22 40.20 2.21 22.23 0.00 12.53 9.61 31.36 482 #16 13.42 6.97 19.90 7.03 11.83 

L& AT2| 4.95 20.70 d.d0 4.58 23.10 45.34 43.20 18.74 5.05 28.43 14.61 16.44 10.48 12.53 0.00 21.44 19.20 15.61 5.53 17.42 31.54 14.17 3.00 
432 20A| 16.92 42.45 21.63 19.30 43.92 66.91 64.86 39.65 25.80 49.80 7.96 37.80 31.51 9.61 21.54 0.00 d0.90 6.62 16.79 22.89 10.32 10.08 20.53 
#4 17.6 24.01 19.61 22.73 6.71 26.15 24.00 4.95 15.19 9.55 33.29 3.$4 9.22 31.36 19.20 40.90 0.00 3d.$0 24.65 18.02 36.62 51.01 33.20 21.19 
de AT6| 10.53 36.31 16.10 12.71 35.27 60.92 58.50 33.94 19.94 43.92 4.75 31.89 25.$$ 4.852 15.61 6.62 34.50 0.00 10.32 1.2 16.24 4.02 14.08 
26.11 7.7$ 5.24 25.63 50.80 48.63 24.26 10.40 33.94 10.32 21.97 16.01 #16 5.53 16.79 24.65 10.32 0.00 7.02 12.01 26.55 #63 3.79 
66 454) 6.00 19.57 3.42 510 21.63 dd.11 42.01 17.27 3.40 27.11 15.43 15.09 9.0$ 43.42 M 22: 15.02 16.$2 7.02 0.00 18.71 33.00 15.63 4.69 
Amd 164) 12.76 38.10 18.16 14.77 d0.25 62.76 60.61 35.90 21.90 45.51 6.66 33.79 2T.T$ 6.97 17.42 5S.$0 EXT | 12.01 15.71 0.00 14.60 4.33 15.68 
23 M##127.00 52.54 31.92 28.57 Sd.21 77.10 75.01 49.93 36.02 60.03 18.2$ 48.01 42.01 19.90 BE, | 51.01 16.24 26.55 33.00 14.60 0.00 1$.63 30.27 
51 14] 10.02 34.61 15.75 12.51 37.26 59,33 57.11 32.89 18.97 42.55 £.00 30.59 24.64 7.03 14.17 10.09 3.200 #.63 15.63 4.33 18.63 0.00 12.03 
ÉBAAE| 469 22.59 7.03 6.18 25.56 47.31 45.09 21.21 7.94 30.59 13.99 18.74 12.92 HE. FE 21.19 14.0$ 3.79 4.69 15.6$ 30.27 12.03 0.00 


Figure: 57.80 - Tableau des distances euclidiennes avec Microsoft Excel 14.0.6123 


LOURDS SÉSIFMESR +00 0 00 2 w 0 
É 
% 


où nous avons mis dans la cellule D4 le calcul de la distance euclidienne: 
=RACINE(($B4-D$22+($C4-D$3)12) 
que nous avons ensuite tiré sur tout le reste du tableau jusqu'à la cellule AA27. 


Ensuite, nous utilisons la méthode ascendante (agglomération) où nous combinons les groupes jusqu'à ce 
qu'il n'y ait plus qu'un seul groupe (contenant toutes les données). 


Ce qui donnera sous forme tabulaire avec un logiciel comme Minitab 15.1.1.0 (les valeurs n'y sont par 
arrondies au centièmes contrairement au petit tableau donné précédemment): 


Nombre 
d'obs. dans 
Nombre de Niveau de Niveau de Groupes Nouveau le nouveau 


Etape groupes similarité distance liés groupe groupe 
1 23 97.7989 1.697971 15 20 15 2 
2 22 97.7951 1.7000 2 17 2 2 
3 21 97.1942 2.1633 11 14 LL 2 
4 20 97.1942 2.1633 18 21 15 2 
5 19 96.7914 2.4739 l 19 1 2 
6 15 96.5758 Z.6401 6 7 6 2 
7 17 96.3292 2.8302 L 4 1 3 
5 16 96.1090 3.0000 15 24 15 3 
9 15 96.1090 3.0000 8 12 8 2 

10 14 95,.5959 3.3956 1 3 1 4 
11 13 95.5902 3.4000 9 15 9 4 
12 12 95.5674 3.4176 l 9 1 8 
13 11 95.0171 3.8419 2 8 2 4 
14 10 94.7797 4.0249 18 23 18 3 
15 9 94.3346 4.368681 2 5 2 5 
16 8 93.8341 4.7539 11 15 11 5 
17 7 92.4774 5.868000 11 16 11 6 
15 6 92.2007 6.0133 2 13 2 6 
19 5 92.2007 6.0133 ii 2 1 14 
20 4 91.4123 6.6212 1 10 1 15 
21 3 90.156585 7.5895 1 EL 1 21 


où le niveau de similarité du groupe lié i, j est défini empiriquement par: 
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di ix, Vi 


max | di; (x, yil 


Ainsi, pour la première ligne nous avons par exemple: 


520 12.1 __ 16971 


= ]-——— =977939% 
max (di; (x, yii ‘77.10 10 


S520 = 1 


La liste précédente est plus agréable à analyser si, comme il est d'usage, nous la représentons sous forme 
de "dendrogramme" (diagramme d'arrangement) suivant: 


Dendrogramme 
Liaison simple; Distance eucidenne 


15.34 


Distance 


DU 


0.00 
1“19-4— 39115-20242. 17-6-12-5-13"10-11 14-18-21 23-16-22.6- 7 


Observations 


Figure: 57.81 - Graphique obtenu avec Minitab 15.1.1.0 


27. RÉSEAUX DE NEURONES FORMELS 


Les réseaux de neurones, fabriqués à partir de structures cellulaires artificielles, constituent une approche 
permettant d'aborder sous des angles nouveaux les problèmes de perception, de mémoire, d'apprentissage 
et de raisonnement non-linéaires (en d'autres termes. d'intelligence artificielle ou en abrégé "L.A.") au 
même titre que les algorithmes génétiques. Ils s'avèrent aussi des alternatives très prometteuses pour 
contourner certaines des limitations des méthodes numériques classiques. Grâce à leur traitement en 
parallèle de l'information et à leurs mécanismes inspirés des cellules nerveuses (neurones), ils infèrent des 
propriétés émergentes permettant de solutionner des problèmes jadis qualifiés de complexes. 


Cependant, le problème majeur des neurones artificiels (à ma connaissance.…..), c'est qu'ils ne s'auto- 
organisent pas ni ne s'auto-structurent de manière intelligente. Il faut donc à ce jour, procéder de manière 
heuristique pour trouver la meilleure structure de réseau de neurones adaptée à un problème et c'est là leur 
grande faiblesse actuelle (on utilise soit la force brute via une base de données contenant des millions de 
modèles, soit les algorithmes génétiques que nous verrons un peu plus loin). 
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Nous aborderons ici les principales architectures des réseaux de neurones. Il ne s'agit pas de les étudier 
toutes, car elles sont trop nombreuses, mais plutôt d'en comprendre les mécanismes internes fondamentaux 
et de savoir comment et quand les utiliser. Nous aborderons également certaines notions relatives aux 
ensembles flous et à la logique ( )giq} ) dans la mesure où ces dernières sont 
incorporées dans certaines architectures de réseaux de neurones que nous étudierons. 


Le cerveau humain contient environ 100 milliards de neurones. Ces neurones nous permettent entre 
autres, de lire un texte tout en maintenant une respiration régulière permettant d'oxygéner notre sang, en 
actionnant notre coeur qui assure une circulation efficace de ce sang pour nourrir nos cellules, etc. Ils nous 
permettent même de comprendre certaines idées (..….) 


Chacun de ces neurones est par ailleurs fort complexe. Essentiellement, il s'agit de tissu vivant et de 
chimie. Les neuro-physiciens commencent à peine à comprendre quelques-uns de leurs mécanismes 
internes. Nous pensons en général que leurs différentes fonctions neuronales, y compris celle de la 
mémoire sont stockées au niveau des connexions (synapses) entre les neurones. C'est ce genre de théorie 
qui a inspiré la plupart des architectures de réseaux de neurones artificiels (dits "formels"). 
L'apprentissage consiste alors soit à établir de nouvelles connexions, soit à en modifier des existantes 
(nous nous concentrerons en particulier sur cette dernière possibilité). 


Ceci nous amène à poser une question fondamentale: en se basant sur nos connaissances actuelles, peut-on 
construire des modèles approximatifs de neurones et les entraîner pour, éventuellement, réaliser des tâches 
utiles ? Eh bien, la réponse courte est: oui !, même si les réseaux que nous allons développer ne possèdent 
qu'une infime fraction de la puissance du cerveau humain, et c'est l'objectif ici de montrer comment nous 
pouvons y arriver. 


Les réseaux de neurones servent aujourd'hui à toutes sortes d'application dans divers domaines. Par 
exemple, il existe des réseaux de neurones développés pour les autopilotes d'avions, ou encore pour les 
systèmes de guidage pour automobiles, pour les systèmes de lecture automatique de chèques bancaires et 
d'adresses postales, pour le traitement du signal pour différentes applications militaires, pour la synthèse 
de la parole, pour bâtir des systèmes de vision par ordinateur, pour faire des prévisions sur les marchés 
monétaires, pour évaluer le risque financier ou en assurance, pour différents processus manufacturiers, 
pour le diagnostic médical, pour l'exploration pétrolière ou gazière, en robotique, en télécommunication, 
pour la classification et bien d'autres. Bref, les réseaux de neurones ont aujourd'hui un impact 
considérable et, il y a fort à parier, que leur importance ira grandissante dans le futur. 


27.1. MODÈLE DU NEURONE 


Le modèle mathématique d'un neurone artificiel, ou "perceptron", est illustré à la figure ci-dessous. Un 
neurone est essentiellement constitué d'un intégrateur qui effectue la somme pondérée de ses entrées 
(comme l'espérance statistique!). Le résultat n de cette somme est ensuite transformé par une fonction de 
transfert f qui produit la sortie a du neurone. 


Les R entrées du neurone correspondent au vecteur noté traditionnellement en ligne (mais dans la pratique 
on représente sa transposée): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


alors que: 


représente le vecteur des poids du neurone (nous les distinguons pour préparer le terrain à des neurones un 
peu plus complexes). 


R entrées Modèle du neurone 


a= f(wip — b) 


Figure: 57.82 - Exemple de neurone formel à une couche avec vecteur d'entrée et scalaire de sortie 


La sortie n de l'intégrateur est définie (car il s'agit d'une technique de l'ingénieur) par l'équation suivante: 


£ 
# DAT eu War + WP te. + WrP2 —D (57.694) 
J=l 


que nous pouvons aussi écrire sous forme matricielle (on pourrait aussi l'écrire sous forme tensorielle mais 
bon...): 


n=# pb (57.695) 


Cette sortie correspond à une somme pondérée des poids et des entrées moins que ce nous nommons "le 
biais b du neurone" (facteur correctif décidé par tâtonnement et souvent nul dans la pratique). La somme 
pondérée s'appelle le "niveau d'activation du neurone". Le biais b s'appelle aussi le "seuil d'activation du 
neurone". Lorsque le niveau d'activation atteint ou dépasse le seuil b, alors n, l'argument de f, devient nul 
ou bien évidemment positif. Sinon, il est négatif. 


Nous pouvons faire un parallèle entre ce modèle mathématique et certaines informations que nous 
connaissons (ou que nous croyons connaître) à propos du neurone biologique. Ce dernier possède trois 
principales composantes: les dendrites, le corps cellulaire et l'axone: 
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\ 
dendrites * 
>Ÿ$ 4 
su qui 
+. 


synapse 


Figure: 57.83 - Représentation simplifiée du vocabulaire des neurones humains 


Les dendrites forment un maillage de récepteurs nerveux qui permettent d'acheminer vers le corps du 
neurone des signaux électriques en provenance d'autres neurones. Celui-ci agit comme une espèce 
d'intégrateur en accumulant des charges électriques. Lorsque le neurone devient suffisamment excité 
(lorsque la charge accumulée dépasse un certain seuil), par un processus électrochimique, il engendre un 
potentiel électrique qui se propage à travers son axone pour éventuellement venir exciter d'autres 
neurones. Le point de contact entre l'axone d'un neurone et la dendrite d'un autre neurone s'appelle le 
"synapse". Il semble que c'est l'arrangement spatial des neurones et leur axone, ainsi que la qualité des 
connexions synaptiques individuelles qui déterminent la fonction précise d'un réseau de neurones 
biologique. C'est en se basant sur ces connaissances que le modèle mathématique décrit ci-dessus a été 
défini. 


Un poids d'un neurone artificiel représente donc en quelque sorte l'efficacité d'une connexion synaptique. 
Un poids négatif inhibe en quelque sorte une entrée, alors qu'un poids positif vient l'accentuer. Il importe 
de retenir que ceci est une grossière approximation d'une véritable synapse qui résulte en fait d'un 
processus chimique très complexe et dépendant de nombreux facteurs extérieurs encore mal connus. Il 
faut bien comprendre que notre neurone artificiel est un modèle pragmatique qui, comme nous le verrons 
plus tard, nous permettra d'accomplir des tâches intéressantes. La vraisemblance biologique de ce modèle 
nous importe peu. Ce qui compte est le résultat que ce modèle nous permettra d'atteindre. 


Un autre facteur limitatif dans le modèle que nous nous sommes donnés concerne son caractère discret. En 
effet, pour pouvoir simuler un réseau de neurones, nous allons rendre le temps discret dans nos équations. 
Autrement dit, nous allons supposer que tous les neurones sont synchrones, c'est-à-dire qu'à chaque temps 
t, ils vont simultanément calculer leur somme pondérée et produire une sortie 4(£) = f(#(£)). Dans les 
réseaux biologiques, tous les neurones sont en fait asynchrones. 


Revenons donc à notre modèle tel que formulé par l'équation précédente et ajoutons la fonction 
d'activation f pour obtenir la sortie du neurone: 


a=f(n)=f (#5 = b) (57.696) 
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Il est temps maintenant de remplacer (parce que la notation est un peu lourde à la longue) x par une 
matrice d'une seule ligne que nous noterons # = #7. Nous obtenons alors une forme générale que nous 
adopterons tout au long de notre étude: 


a = f(r)= f (HP -b)| (57.697) 


Cette équation nous amène à introduire un nouveau schéma plus formel de notre RNF (ou perceptron): 


Entrée Modèle du neurone 


a=f(Wp-b) 


Figure: 57.84 - Exemple plus abouti du neurone formel 
Nous y représentons les R entrées comme un rectangle noir (le nombre d'entrées est indiqué sous le 
rectangle). De ce rectangle sort le vecteur À dont la dimension matricielle est A x1. Ce vecteur est 
multiplié par une matrice W qui contient les poids (synaptiques) du neurone. Dans le cas d'un neurone 
simple, cette matrice possède la dimension 1* À. Le résultat de la multiplication correspond au niveau 
d'activation qui est ensuite comparé au seuil b (un scalaire) par soustraction. Finalement, la sortie du 
neurone est calculée par la fonction f. La sortie d'un neurone simple est alors toujours un scalaire. 


Pour trouver les composantes de la matrice W (poids d'entrée du neurone), ainsi que le biais b nous 
utilisons des techniques de recherche opérationnelle (méthode du simplexe, méthode des gradients 
conjugués, algorithmes évolutionnaires, etc.) sur un échantillon des données de l'entreprise de taille n afin 
"d'entraîner le modèle du neurone". Il s'agira à l'aide de ce modèle de minimiser l'erreur donnée par: 


(57.698) 


et ensuite de tester le résultat obtenu sur un échantillon test avant de faire de la simulation pour des 
données non encore existantes (nous ferons un exemple détaillé avec Microsoft Excel juste après avoir 
présenté les fonctions de transfert). 


27.2. FONCTIONS DE TRANSFERT 


Jusqu'à présent, nous n'avons pas spécifié la nature de la fonction d'activation & = f(#) de notre modèle. Il 
se trouve que plusieurs possibilités existent et celles-ci sont empiriques et à adapter en fonction des 
situations. Les plus courantes et les plus citées dans la littérature sont énumérées dans la figure ci-dessous: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Nom de la fonction Relation d’entrée/sortie 


seuil symétrique 


a=0 sin <0 


linéaire saturée a=n S0<n<l1 
a=1l sin >l 
= —] sin < -1 


linéaire saturée symétrique n si —-1<n<l1 


=1 sin>1 
linéaire positive a=0 sin<0 
P a=n Sin>0 
[semoide | em | 
tangente hyperbolique | 


_. a=1l sin maximum 
compéte G 


a =0 autrement 


ee" 


a — 
e+e" 


Tableau: 57.45 - Types de fonctions de transfert pour les R.N.F. 


Les trois les plus utilisées dans le domaine de l'ingénierie sont les fonctions "seuil" (a) (en anglais "hard 
limit"), "linéaire" (b) et "sigmoïde" (c) comme représentées ci-dessous: 


a 


Lassopesss-.ss. 


(a) 


Figure: 57.85 - Fonctions de transfert les plus utilisées à ce jour dans le domaine 


Comme son nom l'indique, la fonction seuil applique un seuil sur son entrée. Plus précisément, une entrée 
négative ne passe pas le seuil, la fonction retourne la valeur 0 (faux), alors qu'une entrée positive ou nulle 
dépasse le seuil, et la fonction retourne 1 (vrai). Il est évident que ce genre de fonction permet de prendre 
des décisions binaires (cette fonction peut aussi être assimilée à la fonction de Heaviside pour ceux qui 
connaissent). 


La fonction linéaire est quant à elle très simple, elle affecte directement son entrée à sa sortie selon la 
relation & = f(#) = #. Il est évident que la sortie du neurone correspond alors à son niveau d'activation 
dont le passage à zéro (l'ordonnée à l'origine) se produit lorsque F' 5 =à. 
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La fonction de transfert sigmoïde est quant à elle définie par la relation mathématique: 


a = 


= (57.699) 
l+e 


elle ressemble soit à la fonction seuil, soit à la fonction linéaire, selon que nous sommes loin ou près de b 
respectivement. La fonction seuil est très non linéaire car il y a une discontinuité lorsque #' 5 =, De 
son côté, la fonction linéaire est tout à fait linéaire. Elle ne comporte aucun changement de pente. La 
sigmoïde est un compromis intéressant entre les deux précédentes. Notons finalement que la fonction 
"tangente hyperbolique" est une version symétrique de la sigmoïde. 


27.3. ARCHITECTURE DE RÉSEAU 


Par définition, un réseau de neurones est un maillage de plusieurs neurones, généralement organisés en 
couches. Pour construire une couche de S neurones, il s'agit simplement de les assembler comme dans la 
figure ci-dessous: 


7 À 
a = f(Wp —b) 


Figure: 57.86 - Illustration d'un réseau de neurones formel 


Les S neurones d'une même couche sont tous branchés aux R entrées dans la figure ci-dessous. Nous 
disons alors que la couche est "totalement connectée". Mais c'est un cas particulier et non pas une 
généralité. Souvent, les entrées d'un neurone sont différentes de celles d'un autre neurone, etc. 
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Un poids w; ; est associé à chacune des connexions. Nous noterons toujours le premier indice par i et le 
deuxième par j (jamais l'inverse). Le premier indice (rangée) désigne toujours le numéro du neurone sur la 
couche, alors que le deuxième indice (colonne) spécifie le numéro de l'entrée. Aïnsi, w; ; désigne le poids 


de la connexion qui relie le neurone i à son entrée j. L'ensemble des poids d'une couche forme donc une 
matrice W de dimension S'x A: 


Ms, hé Fa 
w w WW 
21 Wia LR 
F = | . | s (57.700) 
Wei Wen 7 We 


Il faut bien sûr prendre en compte que dimensionnellement nous n'avons pas nécessairement 5 = À dans 
le cas général (les nombres de neurones et d'entrées sont indépendants). Si nous considérons que les S 
neurones forment un vecteur de neurones, alors nous pouvons créer les vecteurs: 


à #] 4 
s-[%l3-l2l,-1% 
be # ds 

) 


(57.701 


Ceci nous amène à la représentation simplifiée illustrée ci-dessous: 


Entrée Couche de S neurones 


Figure: 57.87 - Principe fonctionnel d'un réseau de neurones formel 


Finalement, pour construire un réseau de neurones (ou PMC pour "Perceptron Multi-Couches"), il ne 
suffit plus que de combiner des couches comme ci-dessous: 
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Figure: 57.88 - Principe de construction d'un PMC 


Cet exemple comporte R entrées et trois couches de neurones comptant respectivement $}, 57.5 
neurones. Dans le cas général, de nouveau ces nombres ne sont pas nécessairement égaux. Chaque couche 
possède aussi sa propre matrice de poids *, où k désigne l'indice de couche. Dans le contexte des 
vecteurs et des matrices relatives à une couche, nous emploierons toujours un exposant pour désigner cet 


indice. Ainsi, les vecteurs £* #* 4* sont aussi associés à la couche k. 


Il importe de remarquer dans cet exemple que les couches qui suivent la première ont comme entrée la 
sortie de la couche précédente. Ainsi, nous pouvons enfiler autant de couches que nous voulons, du moins 
en théorie. Nous pouvons fixer un nombre quelconque de neurones sur chaque couche. En pratique, nous 
verrons plus tard qu'il n'est cependant pas souhaitable d'utiliser trop de neurones. Notons aussi que rien ne 
nous empêche de changer de fonction de transfert d'une couche à l'autre. Ainsi, dans le cas général nous 


n'avons pas nécessairement f! = f?= f?. 


Définition: La dernière couche est nommée "couche de sortie". Les couches qui précèdent la couche de 
sortie sont nommées "couches cachées". 


Remarque: Les réseaux multicouches sont beaucoup plus puissants que les réseaux simples à une seule 
couche bien évidemment. En utilisant deux couches, à condition d'employer une fonction d'activation 
sigmoïde sur la couche cachée, nous pouvons "entraîner" un réseau à produire une approximation de 
la plupart des fonctions, avec une précision arbitraire. Sauf dans de rares cas, les réseaux de neurones 
formels exploitent deux ou trois couches. 


Définition: "Entraîner" un réseau de neurones signifie modifier la valeur de ses poids et de ses biais pour 
qu'il réalise la fonction d'entrée sortie ([/0). Nous étudierons en détails différents algorithmes et méthodes 
d'approche heuristiques pour y parvenir dans différents contextes. 


Exemple: 


Une entreprise a mesuré pendant 14 semaines ses ventes réelles (Colonne: Valeur à prédire) en fonction 
des ventes prévisionnelles de cinq de ses succursales (Variable1, Variable2, etc.) et les a reproduites dans 
Microsoft Excel 14.0.6123: 
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20 Valeur à prédire Vanablel Varable2 Vanable3 Vanable4 VarableS 


PAR Semaine 3” x! x? x° x” 
#22 03.01.1997 32.50 9.25 42.50 52.38 3463 57.88 
PER 10.01.1997 33.50 8.883 49.00 54.50 35.75 61.13 
PEn 17.01.1997 33.00 9.00 48.63 55.00 3433 60.13 
24.01.1997 33.63 8.63 45.63 34.25 | 35.25 | 62.50 
2 31.01.1997 32.13 8.38 46.63 54.50 34.88 59.00 
PR 07.02.1997 32,25 8.25 45.50 52.50 34.13 56.75 
PER 14.02.1997 3249 7.75 4475 53.63 34.50 58.75 
PER 21.02.1997 3315 7.88 43.38 53.73 | 235.13 | 56.50 
EUR 28.02.1997 32.88 8.25 42.38 52.75 3400 57.88 
En 07.03.1997 32.29 8.13 42.63 53.38 31883 56.63 
CP 14.03.1997 32.13 8.50 42.50 53.88 30.50 58.00 
ER 21.03.1997 31.75 8.25 40.88 54.50 30.25 57.00 
En 27.03.1997 30.83 8.50 40.13 54.25 30.25 56.25 
En 31.03.1997 31.38 8.25 40.25 52.38 30.00 55.38 


Figure: 57.89 - Données d'entraînement pour le réseau de neurones 


Signalons qu'il n'y a absolument aucune formule dans le tableau ci-dessus! Le retour d'expérience (et 
surtout l'emplacement...) nous dit qu'il vaudrait mieux faire une architecture de réseau à deux neurones, un 
premier avec les succursales {1,2,3} basé sur une sigmoïde et un deuxième avec les succursales {4,5} lui 
aussi basé sur une sigmoïde. De plus, l'ensemble devra avoir un seul et unique biais et les deux neurones 
devraient avoir un poids particulier en comparaison de l'un et l'autre. 


Nous préparons alors le tableau suivant: 


EN Pondérations |4 
14 


Figure: 57.90 - Poids, biais et pondérations à déterminer par recherche opérationnelle 


Une fois le tableau des poids, biais et pondérations construit, nous écrivons notre réseau à deux neurones 
avec la fonction de sigmoïde par exemple juste à côté des données d'entraînement (ce qui facilitera la 
comparaison): 
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Réseau de neurone 
21 y x! x? x° x° x° RNF1 RNF2 
22 32.50 9.25 42.50 52.38 3463 57.88 | 0.500 0.500 
23 33.50 8.88 49.00 54.50 35.75 61.13 | 0.500 0.500 


24 33.00 9.00 48.63 55.00 3438 60.13 | 0.500 0.500 
2 33.63 8.63 435.63 54.25 35.25 62.50 | 0.500 0.500 
26 32.13 8.38 46.63 54.50 3488 59.00 | 0.500 0.500 
27 32.25 8.23 435.50 52.50 3413 56.75 | 0.500 0.500 


28 32.75 775 44.75 53.63 3450 58.75 | 0.500 0.500 
29 33.13 7.88 43.38 53.75 35.13 58.50 | 0.500 0.500 
30 32.88 8.25 42.38 52.75 3400 57.883 | 0.500 0.500 
31 Fa as 8.13 42.63 53.38 3188 56.63 | 0.500 0.500 
32 32.13 8.20 42.50 53.88 30.50 58.00 | 0.500 0.500 
33 31.75 8.25 40.88 54.50 30.25 57.00 | 0.500 0.500 
34 30.88 8.50 40.13 54.25 30.25 56.25 | 0.500 0.500 
35 31.38 8.25 40.25 52.38 30.00 55.38 | 0.500 0.500 


Figure: 57.91 - Poids, biais et pondérations à déterminer par recherche opérationnelle 


Soit avec les formules explicites pour les trois dernières colonnes qui nous intéressent: 


Réseau de neurones 

è RNF1 RNF2 Sortie 

CE) = (EXP (-($022"#0$7+#$E22"#0$8+#F22"#0#9)]]) =W(-EXP(-($8G22"#0$10-$H22"$#041))) =#0$12-#04$13"#122-$0$14"#J22 
CE) = (EXP (-($023"#0$7+$E23"$0$8+#$F23"$0#9))) =W(-EXP(-(#G23"$0$10+$H23"$0#1)]) =#$0$12-#0#13"#123-$0#14"#J23 
CCM = 1(HEXP(-($024"#$0$7+#$E24"#$0$8+#F24"#0#9)]) =W(LEXP(-($G24"#0$10-$H24"$#041))) =#0$12-#0$13"#124+-#0$14"#J24 
A = (HEXP(-($025"$0$7+$E25"#0$8+$F25"#$0#9))]) =1(HEXP(-($G25"#0#10+$H25"#0#$1))) =$0$12+$0#13"#125+$04$14"$J25 
CON) = 1(HEXP(-($026"#$0$7+$E26"#$0$8+#F26"#0#9)]) =W(1-EXP(-($8G26"#0$10-$H26"#04$1))) =#0$12-#04$13"#126-#0$14"#J26 
A = H(HEXP(-($027"#0$7+#$E27"#0#8+$F27"$0#9)]] =W(HEXP(-(#8G27"#$0#10+$H27"#0#$1))) =#0#12+$04$13"#127.$0#14"$J27 


PA -1(-EXP(C($028"#087+$E28"#0884$F28 8049) =W(HEXP(($G28"$0#10-$H28"#0#11))) =$012+#D813"#128-$0414"#J28 
DA -t(LEXP(-($029"$0$7+$E29"$0$8+$F29"#049))) =WHEXP(-($G29"$0$10-$H29 #01) =$0$12-$0413"#129-$0$14"$J29 
TN -1(LEXP(($030$087+$E30"$088+$F 3080891) =W(LEXP(($G30"#0810-$#H30"$081)) =$0$12$0813"#130-$D$14"#J30 
PA -1(-EXPC($001#087-$E 9 #088#F91"#089))) =W(HEXP(-($GS1"#0#10-#H3 8081) =$0#12$0812"#131$0814"#U31 
PA -1/(-EXP(-($092"$0$7+$E32"$0884$F32 8049) =W(HEXP((8G32"$0#10-$H32 #09) =$0124#D813"#122+$0814 8/32 
nl -1(LEXP(($033"#087+$E33"$088+$F33"#089))] =M(LEXP(($G33"#0810-$H33"#081)) =$0$12$0819"#133-$0814"$/33 

=t(HEXP(. (Dos $D$7:$E 34" $D$8«$F34" sDs2)) “MMEXP SG" susnese sDs1) =$D$12-$D$13"$134$D814"$/34 


Figure: 57.92 - Le réseau de neurones avec L us neurones, . fonction endide et la pondération à la sortie 


Pour pouvoir appliquer une technique de recherche opérationnelle, il nous faut minimiser ou maximiser 
quelque chose. Dès lors, nous allons chercher à minimser la somme des erreurs quadratiques en créant la 
colonne suivante: 
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Erreur 


0.500 0Q. : 1'056.2500 
0.500 0. | 1122.2500 
0.500 0Q. | 1'089.0000 
0.500 0Q. 1130.6406 
0.500 Q. 1'032.0156 
0.500 O. | 1'040.0625 
0.500 0Q. 1'072.5625 
0.500 0Q. | 1097.2656 
0.500 0. | 1'080.7656 
0.500 0Q. . 1'040.0625 
0.500 Q. . 1'032.0156 
0.500 0. 1008.0625 
0.500 0.500 0.000 953.2656 
0.500 0.500 0.000 984.3906 


14738.609 


Figure: 57.93 - Ajout de la colonne avec l'erreur quadratique à minimiser 


Soit avec les formules explicites (nous voyons bien que cela correspond au carré de la différence entre les 
mesures et le modèle): 


50 26-5K 26) 2 
A=5C27-$K 27) 2 


=—(C28-FK 28)" 2 


El—(5C33-FK 33) 2 
FA —(5C34-$K 34)" 2 
en —(5C35-$K 35)°2 


Figure: 57.94 - Implémentation de la colonne avec l'erreur quadratique à minimiser 


Il va s'agir maintenant avec le solveur de Microsoft Excel 14.0.6123 de minimiser le contenu de la cellule 
L36: 
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(UT Rendre les variables sans contrainte non négatives 


Sélect, une résolution : GRG non inéare te] | om | 


Méthode de résolution 

Sélectionnez le moteur GRG non inésire pour des problèmes non linéaires si de solveur, 
Sélectionnez le moteur Simolex PL pour les problèenss inéaires, et le moteur Évolitionnaire pour les 
problèmes complexes. 


et il ne faut pas être trop regardant sur la précision des contraintes et il faut jouer un peu 
paramètre pour obtenir un résultat satisfaisant: 


Toutes les méthodes | GRG non linéaire | Évolutionnaire | 
Précision des contraintes 001 


C[] Echelle automatique 

C1] Afficher le résultat des itérations 
Résolution avec des contraintes de nombre entier 
O ignorer les contraintes de nombre entier 


Optimalité des nombres entiers (%) 1 


Résolution des limites 


Lemps max {secondes} 1000 


Itérations 1000 


Évolutionnaire et contraintes de nombre entier 


Sous-problèmes max 


Solutions géalisables max 


Figure: 57.96 - Options de précision des contraintes 


avec ce 
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: 3445/4839 


Pour obtenir un résultat satisfaisant, il faudra mettre dans le cas présent une précision de 0.001. Ce qui 
donnera lors de l'exécution de la recherche par le solveur une erreur quadratique totale de 0.8479 (cellule 
L36) et pour les paramètres du réseau de neurones: 


Pondérations 


Figure: 57.97 - Paramètres du réseau de neurones 


Des logiciels spécialisés feront mieux avec une erreur quadratique totale de 0.8405 (cellule L36) et pour 
les paramètres du réseau de neurones: 


Pondérations |@] 23.334 
85 137.317 


Figure: 57.98 - Paramètres du réseau de neurones 


Nous pouvons comparer graphiquement les mesures utilisées pour entraîner le réseau de neurones et le 
résultat du modèle de réseau de neurones lui-même. Nous avons alors: 
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34 


33,5 


21.12.9631.12.96 10.01.97 20.01.97 30.01.97 09.02.97 19.02.97 01.03.97 11.03.97 21.03.97 31.03.97 10.04.9 


—+— Réseau de neurones —+— Mesures 


Figure: 57.99 - Comparaison réel/modèle 


Ce qui est pas mal du tout pour un modêle non linéaire! Mais une fois le modèle entraîné, il faut voir s'il 
s'applique sur d'autres données: 


| J K 


Mesures Réseau de neurones 


04.04.1997 30.88 
11.04.1997 32.25 
18.04.1997 34.25 
25.04.1997 34.25 
02.05.1997 34.75 
09.05.1997 36.63 


Figure: 57.100 - Données de test pour voir si le modèle est bien entraîné 


Toujours avec les mêmes formules: 


[l Le 
37 
PA 1 EXP(-($038"#0$7+$E38"$088+$F32 #09)  =1(HEXP((#G38"$0#10-$H38 #01) =$0#12$0#13"#188-$0$14"#/38 
PA -1(-EXP((#039"#087+$E39"#088#F39"#049))  =1(LEXP(-(8G39"#0#10-$H39"#0#11))  =$0412-$0#19"#189-$D814"#/39 


D -1(EXP(($040"$0$7+$E40"$0$8$F40 049)  =1(HEXP(($G40"$0#10-$#H40"$0#11)))  =$0#12-$0#13"#40+$D$14"$J40 
=H(LEXP({$ON SDS 7-$E4#D#S$F4"#D#9))  =M(LEXP{ÉGA SDS I0SHISOSN))  =$0$12-$0$13"#I41-$0$14"$U41 
D “M-EXPUISDZ"SD87-E42"40884F42" 8089) =MIEXPIISGAZ"SDSIOSHAZ SDS) | =SDI2-SDSI"SI2-SDEI"SU2 


Figure: 57. 101 - Données de test pour voir si le odele est chien entraîné 


Et si nous comparons aussi graphiquement les données réelles et celles modélisées, nous obtenons: 
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—+— Mesures —+— Réseau de neurones 


Figure: 57.102 - Comparaison réel/modèle 


et là nous voyons que le modèle est nettement moins bon. Mais c'est ainsi! La science prédictive n'est pas 
une science exacte mais une méthode heuristique. 


28. ALGORITHMES GÉNÉTIQUES 


Les algorithmes génétiques (AGSs) sont des algorithmes d'optimisation stochastiques itérés fondés sur les 
mécanismes de la sélection naturelle et de la génétique appartenant à la famille des "algorithmes 
évolutionnaires". Il s'agit d'une technique d'optimisation qui s'est beaucoup répandue depuis le début du 
21ème siècle grâce la version 14.0.6123 de Microsoft Excel où le solveur intègre un algorithme 
évolutionnaire par défaut comme en atteste la capture d'écran ci-dessous: 
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Rendre les varisbles ans corérainte non négatives 
Sélect. une résolution : Évoltionnaire (rl 


Méthode de résolution 


Sélectionnez le moteur GRG non hnésire pour des problèmes non inéaires de sobreur. 
Sélectionnez le moteur Simplex PL pour les problèmes Inéaires, et le moteur Évoktionnaire pour les 
problèmes comçlexes. 


Conte] (rene 


Figure: 57.103 - Capture d'écran du solveur de Microsoft Excel 14.0.6123 


avec les options avancées correspondantes: 


Toutes les méthodes | GRG nonlinésire Evolutionnaire 


Convergence 00001 
Taux de mutation 0.075 
Taille de 12 population 100 
Valeug de départ aléatoire o 


Durée maximale zans amélioration 30 


D Limites sur les variables requises 


Figure: 57.104 - Options avancées de la résolution évolutionnaire du solveur de Microsoft Excel 14.0.6123 


Le fonctionnement des algorithmes génétiques est relativement simple: 
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1. Nous partons avec une population de solutions potentielles (chromosomes) initiales arbitrairement 
choisies 


2. Nous évaluons leur performance (fitness) relative 


3. Sur la base de ces performances, nous créons une nouvelle population de solutions potentielles en 
utilisant des opérateurs évolutionnaires simples: la sélection, le croisement et la mutation. 


4. Nous recommençons ce cycle jusqu'à ce que nous trouvions une solution satisfaisante. 


Les AGs ont été initialement développés par John Holland (1975). C'est au livre de Goldberg (1989) que 
nous devons leur popularisation. Leurs champs d'application sont très vastes. Outre l'économie 
(minimisation du risque des portefeuilles), ils sont utilisés pour l'optimisation de fonctions, en finance, en 
théorie du contrôle optimal (recherche opérationnelle), ou encore en théorie des jeux répétés et 
différentiels (en l'occurrence dans les jeux évolutionnaires et le dilemme du prisonnier) et la recherche 
d'information (Google) ainsi que la recherche des plus courts chemins en théorie des graphes (routages 
Internet ou GPS). La raison de ce grand nombre d'applications est claire: simplicité et efficacité. Bien sûr, 
d'autres techniques d'exploration stochastiques existent, la méthode de Monte-Carlo peut être considérée 
comme un concept similaire. 


Pour résumer, Lerman et Ngouenet (1995) distinguent quatre principales propriétés qui font la différence 
fondamentale entre ces algorithmes et les autres méthodes: 


P1. Les algorithmes génétiques utilisent un codage des paramètres, et non les paramètres eux-mêmes. 
P2. Les algorithmes génétiques travaillent sur une population de points, au lieu d'un point unique. 


P3. Les algorithmes génétiques n'utilisent que les valeurs de la fonction étudiée, pas sa dérivée, ou une 
autre connaissance auxiliaire. 


P4. Les algorithmes utilisent des règles de transition probabilistes, et non déterministes. 


La simplicité de leurs mécanismes, la facilité de leur mise en application et leur efficacité même pour des 
problèmes complexes ont conduit à un nombre croissant de travaux ces dernières années. 


Définitions: 


D1. Un "algorithme génétique" est défini par un individu/chromosome/séquence et une solution 
potentielle au problème donné. 


D2. Une "population" est un ensemble de chromosomes ou de points de l'espace de recherche 
D3. "L'environnement" est assimilé à l'espace de recherche 
DA4. La fonction que nous cherchons à optimiser est appelée "fonction de fitness" 


Avant d'aller plus loin, il faut définir de manière plus formelle les concepts précédents (mais sous 
l'hypothèse particulière ! de codage binaire). 
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Définition: Les organismes en compétition sont appelés "individus". Soit un alphabet 4 ={&,,4,,...,&}, 


nous supposerons que chaque individu peut être représenté par un mot de longueur fixe ! pris dans 4°. Le 
mot À associé à un individu de la population sera appelé "chromosome" ou "séquence" (le terme n'est pas 
tout à fait équivalant à son homonyme biologique, cependant c'est une pratique courante que d'utiliser ce 


terme ici aussi) et donné donc par À de longueur (A) avec Vi € [1,/],a € W = {0,1} (cause: hypothèse du 
codage binaire). 


Dans la mesure où il n'y aura pas de risque de confusion, nous identifierons les termes individu et 
chromosome. 


Les individus forment une population P de taille N, notée: 


Fe (Ain 


Nous allons faire une autre assertion importante, c'est-à-dire, qu'il existe une fonction f d'une séquence à 
valeurs positives que nous noterons (A), dite "fonction de fitness" qui à tout À associe un réel tel que: 


f(4)>F(4)à #5 
si et seulement si 4 est mieux adapté au milieu que 4. 


Remarquons que le terme “adapté” n'est pas défini. Pour cela, il faudrait caractériser le milieu dans lequel 
évoluent les individus, ce que nous ne ferons pas. En fait, puisque nous supposons l'existence d'une telle 
fonction et que nous posons l'équivalence avec le degré d'adaptation, celui-ci est automatiquement défini 
par la donnée de f. 


Nous nommerons "génération" une population à un instant t, ce qu'il faut mettre en relation avec la notion 
de durée de vie ou d'âge. Cependant, nous nous placerons ici dans le cas particulier où chaque individu a 
une durée de vie égale à 1, donc la génération (t+1) est constituée d'individus différents de la génération t, 
nous les appellerons les "descendants". Réciproquement, les individus de la génération t seront les 
"ancêtres" des individus de la génération (t+1). Nous désignerons la génération t par P(#) soit la 
population à l'instant t. 


Ainsi, un chromosome est vu comme une suite de bits en codage binaire appelée aussi "chaîne binaire". 
Dans le cas d'un codage non binaire, tel que le codage réel par exemple, alors la suite A ne contient qu'un 


point, nous avons A={4} avecaeR. 


Remarque: La fitness (efficacité) est donc donnée par une fonction à valeurs positives réelles. Dans le 
cas d'un codage binaire, nous utiliserons souvent une fonction de décodage d qui permettra de passer 
d'une chaîne binaire à un chiffre à valeur réelle: 
i 
d:{0,1} —R 


La fonction de fitness est alors choisie telle qu'elle transforme cette valeur en valeur positive soit: 


f:d{0,} MR! 
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Le but d'un algorithme génétique est alors simplement de trouver la chaîne qui maximise cette fonction f. 
Bien évidemment, chaque problème particulier nécessitera ses propres fonctions d et f. 


Les AGs sont alors basés sur les phases suivantes: 
1. Initialisation: une population initiale de N chromosomes est tirée aléatoirement 
2. Évaluation: chaque chromosome est décodé puis évalué 


3. Sélection: création d'une nouvelle population de N chromosomes par l'utilisation d'une méthode de 
sélection appropriée. 


4. Reproduction: possibilité de croisement et mutation au sein de la nouvelle population 
5. Retour à la phase d'évaluation jusqu'à l'arrêt de l'algorithme 
28.1. CODAGE ET POPULATION INITIALE 


Il existerait trois principaux types de codage: (1) Binaire, (2) Gray, (3) Réel. Nous pouvons facilement 
passer d'un codage à l'autre. Certains auteurs n'hésitent pas, par ailleurs, à faire le parallèle avec la biologie 
en parlant de génotype (cf. chapitre de Dynamique Des Populations) en ce qui concerne la représentation 
binaire d'un individu, et de phénotype (cf. chapitre de Dynamique Des Populations) pour ce qui est de sa 
valeur réelle correspondante dans l'espace de recherche. 


Rappelons que la transformation la plus simple (fonction de décodage d) d'une chaîne binaire A en 
nombre entier x s'opère par la règle suivante (cf. chapitre sur les Nombres): 


i . 
x =d(A)= Sa 2 (57.706) 
iD 


où l est le nombre de chiffres de la chaîne -1. 


Ainsi, le chromosome À = {1,0,1,1} vaut trivialement: 
1: +0:2%+1:2+1:2°=8+2+1=11 (57.707) 


Évidemment, la fonction d sera adaptée (par tâtonnements!) selon le problème. Ainsi, si nous cherchons à 
maximiser une fonction f : [0,1] — [0,1] une méthode possible serait la suivante (la taille du chromosome 
dépendant bien évidemment de la précision voulue): 


+1 : 
x=d(4)=> 2" (57708) 
i=1 


ce qui peut s'assimiler à une série harmonique. Pour une précision au cinquième chiffre après la virgule, 


nous imposerons } =17— 1 puisque: 


d|+1...,1,..,1212 0.999992 71 (57.709) 
——— 
17 
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Une autre façon de faire serait de choisir d telle que: 


Petite explicitation: 


x" -1={(x-1) (+ + x? LE 1 


ls 2: 3 1 Ni 
=ltztr tt pe ÿ x 

LES D ET (57.711) 
#-l #-1 oi 


21-828 1- 
> Ene =1 


Posons i = #-1: 


Ainsi, avec { = 16 nous avons 2° -1=131071 et: 


131071 
9 PER Pa 1 “| GE 


Cette dernière règle peut se généraliser. Ainsi, admettons que nous cherchons à maximiser (normaliser 
serait un terme peut-être plus correct) f en fonction d'une variable réelle x. Soit 2 =[x,,,2x,% ], avec 


D CR, l'espace de recherche permis avec x,,, et x, les bornes inférieures et supérieures. Soit prec la 
précision (chiffre après la virgule) avec laquelle nous cherchons x. Soit: 


dx, 2 (57.714) 
la longueur de l'intervalle D. Nous devons alors diviser cet intervalle au pire en: 
n#=id'10"* (57715) 


sous-intervalles égaux afin de respecter la précision. Par exemple, soit À =[-1,2] nous avons donc {4 = 3 
si nous voulions une précision Pre€ = 6, alors il nous faut diviser cet intervalle en # = 3'000'000 sous- 
intervalles. 


Notons s l'entier naturel tel que 2° > # , ce qui dans notre exemple implique 5 = 22 puisque: 
2% = 2097152 < 3'000'000 < 27 =4194"304 (57.716) 


la transformation d'une chaîne binaire À = {4,,...,a;} en un nombre réel x peut alors s'exécuter en trois 
étapes: 


1. Conversion (base 2 en base 10): 
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2. Normalisation: 


3. Maximisation: 
X=Xn tx" (57.719) 


ou ce qui revient au même directement en une seule étape par: 


i À 
CPP Ce INRP 
at + > Si =] (57.720) 
iÎÙ 


Ainsi pour  : [0,1]— [0,1], et v5,4 = 1 nous retrouvons bien: 


x =0+ Da ee D (57.721) 
2 L Se 


Pour ce qui est de la phase d'initialisation, la procédure est assez simple. Elle consiste en un tirage 
aléatoire de N individus dans l'espace des individus permis. En codage binaire, selon la taille / de la 
chaîne, nous effectuons pour un chromosome | tirages dans {0,1} avec équiprobabilité. 


28.2. LES OPÉRATEURS 


Les opérateurs jouent un rôle prépondérant dans la possible réussite d'un AG. Nous en dénombrons trois 
principaux: l'opérateur de sélection, de croisement et de mutation. Si le principe de chacun de ces 
opérateurs est facilement compréhensible, il est toutefois difficile d'expliquer l'importance isolée de 
chacun de ces opérateurs dans la réussite de l'AG. Cela tient pour partie au fait que chacun de ces 
opérateurs agit selon divers critères qui lui sont propres (valeur sélective des individus, probabilité 
d'activation de l'opérateur, etc.). 


28.2.1. OPÉRATEUR DE SÉLECTION 


Cet opérateur est peut-être le plus important puisqu'il permet aux individus d'une population de survivre, 
de se reproduire ou de mourir. En règle générale, la probabilité de survie d'un individu sera directement 
reliée à son efficacité relative au sein de la population. 


Il existe plusieurs méthodes pour la reproduction. La méthode la plus connue et utilisée est sans nul doute, 
la roue de loterie biaisée (roulette wheel) de Goldberg (1989). Selon cette méthode, chaque chromosome 
sera dupliqué dans une nouvelle population proportionnellement à sa valeur d'adaptation. Nous 
effectuons, en quelque sorte, autant de tirages avec remises qu'il y a d'éléments dans la population. Ainsi, 
dans le cas d'un codage binaire, la fitness d'un chromosome particulier étant f(d(A)), la probabilité avec 
laquelle il sera réintroduit dans la nouvelle population de taille N est: 
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JF (4(4)) 
Es (57.722) 
> (44) 


J=1 


Les individus ayant une grande fitness ont donc plus de chance d'être sélectionnés. Nous parlons alors de 
"sélection proportionnelle". 


L'inconvénient majeur de cette méthode repose sur le fait qu'un individu n'étant pas le meilleur pourrait 
tout de même dominer la sélection (imaginez la recherche du maxima d'une fonction dans KR? , il peut y en 
avoir plusieurs - de maxima - et donc mauvaise sélection...), nous parlerons alors à juste titre de 
"convergence prématurée" et c'est l'un des problèmes les plus fréquents lors de l'utilisation des 
algorithmes génétiques. Elle peut aussi donc engendrer une perte de diversité par la domination d'un super 
individu. Un autre inconvénient est sa faible performance vers la fin quand l'ensemble des individus se 
ressemblent. 


Une solution à ce problème ne tient pas dans l'utilisation d'une autre méthode de sélection mais dans 
l'utilisation d'une fonction de fitness modifiée. Ainsi, nous pouvons utiliser un changement d'échelle 
(scaling) afin de diminuer ou accroître de manière artificielle l'écart relatif entre les fitness des individus. 


Brièvement, il existe d'autres méthodes, la plus connue étant celle du tournoi (tournament selection): nous 
tirons deux individus aléatoirement dans la population et nous reproduisons le meilleur des deux dans la 
nouvelle population. Nous refaisons cette procédure jusqu'à ce que la nouvelle population soit complète. 
Cette méthode donne de bons résultats. Toutefois, aussi importante que soit la phase de sélection, elle ne 
crée pas de nouveaux individus dans la population. Ceci est le rôle des opérateurs de croisement et de 
mutation. 


28.2.2. OPÉRATEUR DE CROISEMENT 


L'opérateur de croisement permet la création de nouveaux individus selon un processus fort simple. Il 
permet donc l'échange d'informations entre les chromosomes (individus). Tout d'abord, deux individus, 
qui forment alors un couple, sont tirés au sein de la nouvelle population issue de la reproduction. Puis un 
(potentiellement plusieurs) site de croisement est tiré aléatoirement (chiffre entre 1 et 1-1). Enfin, selon 
une probabilité À que le croisement s'effectue, les segments finaux (dans le cas d'un seul site de 
croisement) des deux parents sont alors échangés autour de ce site: 


Parents Croisement Enfanes 


ESID LE SRE 


- di = 


| An | 


Figure: 57.105 - Exemple d'opérateur de croisement 
Cet opérateur permet la création de deux nouveaux individus. Toutefois, un individu sélectionné lors de la 
reproduction ne subit pas nécessairement l'action d'un croisement. Ce dernier ne s'effectue qu'avec une 
certaine probabilité. Plus cette probabilité est élevée et plus la population subira de changement. 
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Quoi qu'il en soit, il se peut que l'action conjointe de la reproduction et du croisement soit insuffisante 
pour assurer la réussite de l'AG. Aïnsi, dans le cas du codage binaire que nous avons choisi jusqu'ici, 
certaines informations (in extenso: caractères de l'alphabet) peuvent disparaître de la population. Aïnsi 
aucun individu de la population initiale ne contient de 1 en dernière position de la chaîne, et que ce 1 
fasse partie de la chaîne optimale à trouver, tous les croisements possibles ne permettront pas de faire 
apparaître ce 1 initialement inconnu. En codage réel, une telle situation peut arriver si utilisant un 
opérateur simple de croisement, il se trouvait qu'initialement toute la population soit comprise entre 0 et 
40 et que la valeur optimale était de 50. Toutes les combinaisons convexes possibles de chiffres 
appartenant à l'intervalle [0,40] ne permettront jamais d'aboutir à un chiffre de 50. C'est pour remédier 
entre autres à ce problème que l'opération de mutation est utilisée. 


28.2.3. OPÉRATEUR DE MUTATION 


Le rôle de cet opérateur est de modifier aléatoirement, avec une certaine probabilité, la valeur d'un 
composant de l'individu. Dans le cas du codage binaire, chaque bit &; € {0,1} est remplacé selon une 
probabilité Æ, par son inverse a, = 1-4,. C'est ce qui est illustré à la figure ci-dessous. Tout comme 


plusieurs lieux de croisement peuvent être possibles, nous pouvons très bien admettre qu'une même chaîne 
puisse subir plusieurs mutations. 


La mutation est traditionnellement considérée comme un opérateur marginal bien qu'elle confère en 
quelque sorte aux algorithmes génétiques la propriété d'ergodicité (in extenso: tous les points de l'espace 
de recherche peuvent être atteints). Cet opérateur est d'une grande importance. Il a de fait un double rôle: 
celui d'effectuer une recherche locale et/ou de sortir d'une trappe (recherche éloignée). 


Les opérateurs de l'algorithme génétique sont guidés par un certain nombre de paramètres fixés à l'avance. 
La valeur de ces paramètres influence la réussite ou non d'un algorithme génétique. Ces paramètres sont 
les suivants: 


- La taille de la population N, et la longueur du codage de chaque individu 1 (dans le cas de codage 
binaire). Si N est trop grand, le temps de calcul de l'algorithme peut s'avérer très important, et si N est trop 
petit, il peut converger trop rapidement vers un mauvais chromosome. 


- La probabilité de croisement Æ. Elle dépend de la forme de la fonction de fitness. Son choix est en 
général heuristique (tout comme pour À, ). Plus elle est élevée, plus la population subit évidemment de 
changements importants. Les valeurs généralement admises sont comprises entre 0.5 et 0.9. 
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- La probabilité de mutation Æ,. Ce taux est généralement faible puisqu'un taux élevé risque de conduire à 


une solution sous-optimale. 


Plutôt que de réduire Æ,, une autre façon d'éviter que les meilleurs individus soient altérés est d'utiliser la 
reconduite explicite de l'élite dans une certaine proportion. Ainsi, bien souvent, les meilleurs 5%, par 
exemple, de la population sont directement reproduits à l'identique, l'opérateur de reproduction ne jouant 
alors que sur les 95% restant. Cela est appelé une "stratégie élitiste". 


Partant du constat que les valeurs des paramètres des différents opérateurs sont elles-mêmes inconnues et 
ne peuvent être améliorées au fur et à mesure que de manière expérimentale, certains auteurs, tels que 
Novkovic et Sverko (1997), proposent d'utiliser une sorte de méta-AG: l'un pour trouver l'individu optimal 
et l'autre pour trouver la valeur optimale des paramètres. Ces deux algorithmes tourneraient alors 
simultanément ou séquentiellement. Toutefois, il est inévitable que le temps de calcul (la complexité 
algorithmique) s'alourdisse en conséquence. 


Voyons maintenant un exemple d'AG (exemple de Goldberg - 1989). Il consiste à trouver le maximum de 
la fonction f(x) = x sur l'intervalle [0,31] où x est un entier. La première étape consiste à coder la 
fonction. Par exemple, nous utilisons un codage binaire de x, la séquence (chromosome) contenant au 
maximum 5 bits. Ainsi, nous avons x = 2 — {0,0,0,1,0}, de même x = 31— {1,1,1,1, 1}. Nous recherchons 
donc le maximum d'une fonction de fitness (nous choisirons f(x) lui-même dans cet exemple simple) 
dans un espace de 32 valeurs possible de x. 


1. Tirage et évaluation de la population initiale 


Nous fixons la taille de la population à 4 = 4. Nous tirons donc de façon aléatoire 4 chromosomes 
sachant qu'un chromosome est composé de 5 bits, et chaque bit dispose d'une probabilité 2 d'avoir une 
valeur 0 ou 1. Le maximum, (au hasard) 16 est atteint par la deuxième séquence. Voyons comment 
l'algorithme va tenter d'améliorer ce résultat. 


D'abord, nous obtenons le tableau suivant: 


Tableau: 57.46 - Évolution (mutation) des chromosomes 


Nous tournons donc quatre fois cette roue pour obtenir la séquence suivante: 
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Tableau: 57.47 - Séquence tirage des chromosomes 


Nous voyons bien ici le risque que nous aurions à perdre la séquence N° 2 dès le départ... c'est le 
problème de cette méthode. Elle peut converger moins vite que d'autres. Cependant, le lecteur remarquera 
que nous avons perdu la séquence N°3. 


Nous passons maintenant à la partie du croisement: les parents sont sélectionnés au hasard. Nous tirons 
aléatoirement un lieu de croisement ("site" ou "locus") dans la séquence. Le croisement s'opère alors à ce 
lieu avec une probabilité À. Le tableau ci-dessous donne les conséquences de cet opérateur en supposant 
que les chromosomes 1 et 3, puis 2 et 4 sont appariés et qu'à chaque fois le croisement s'opère (par 


exemple avec À =1). 
| 7 
_ 
© 


Tableau: 57.48 - Croisement des chromosomes 


Nous passons maintenant à la partie mutation: dans cet exemple à codage binaire, la mutation est la 
modification aléatoire occasionnelle (de faible probabilité) de la valeur d'un bit (inversion d'un bit). Nous 
tirons ainsi pour chaque bit un chiffre aléatoire entre 0 et 1 et si ce chiffre est inférieur à Æ, alors la 


mutation s'opère. Le tableau ci-dessous avec À, = 0.05 met en évidence ce processus: 


10001 15 25 26 04 12 10011 
| 00100 | 2689134859 89 13 48 59 [2680134859 À - | oo | 00100 


_. | 3245872265 45 87 2265 [3245872265 À - | oo | 01000 
De 47 | 4701856235 | 85 62 35 [4701856235 | 1 | 10 | | 11100 


Tableau: 57.49 - Mutation des chromosomes 


Maintenant que la nouvelle population est entièrement créée, nous pouvons à nouveau l'évaluer: 
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Tableau: 57.50 - Évaluation de la mutation des chromosomes 


Le maximum est maintenant 28 (N° 4). Nous sommes donc passés de 16 à 28 après une seule génération. 
Bien sûr, nous devons recommencer la procédure à partir de l'étape de sélection jusqu'à ce que le 
maximum global, 31, soit obtenu, ou bien qu'un critère d'arrêt ai été satisfait. 


Remarque: Il est possible de démontrer mathématiquement, ce qui est remarquable !!!, que les 
portions de chromosomes qui se retrouvent chez les meilleurs individus vont avoir tendance à se 
reproduire. 
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Notes personnelles: 
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58. FRACTALES 


L es fractales sont des figures invariantes par changement d'échelle (nous parlons aussi de "structures 


autosimilaires") et sont la représentation graphique de suites récurrentes contractantes (pour les fractales 
IFS que nous verrons plus loin) ou non divergentes (pour les fractales à temps d'échappement que nous 
verrons aussi plus loin). 


L'idée de base - simple et géniale. à la fois - consiste souvent à prendre un point de départ, de construire 
son image via une fonction mathématique donnée, de prendre l'image de l'image et ainsi de suite. Le but 
étant d'étudier comment se répartissent les points successifs dans l'ensemble global, s'ils s'approchent 
d'une limite ou s'ils errent entre diverses valeurs que nous pouvons expliciter, s'il y a plus de points dans 
telle partie de l'ensemble que dans telle autre? 


L'intérêt de ce type de questions concerne aussi bien l'étude de l'évolution de populations biologiques que 
celle de l'avenir du système solaire, la 3D en informatique (l'origine étant la génération de montagnes pour 
des paysages 3D), les variations des cours de la bourse ou la génération de nombres aléatoires dans des 
domaines particuliers ou encore le domaine du diagnostic médical. 


Figure: 58.1 - Génération de pseudo-reliefs à partir d'une fractale aléatoire (probabiliste) 


Pour le commun des mortels, les fractales servent à faire joli. Mais elles ont des applications infiniment 
plus sérieuses: nous avons vu par exemple sur le présent site web que certaines de ces "séduisantes" 
images reproduisaient des phénomènes physiques (dynamique des populations pour la fractale de 
Feigenbaum, turbulences dans un fluide pour l'attracteur de Lorentz, dispositions des galaxies, L- 
Fractales, amas et superamas de galaxies,.…). Les fractales ont également trouvé des applications en 
musique (avec des logiciels générant de la musique fractale) et dans le cinéma (3D). Enfin, dans le 
domaine de l'infographie, les fractales permettent de compresser très efficacement les images, avec une 
qualité constante quel que soit le zoom, elles permettent de créer des textures réalistes, et peuvent 
permettre de tramer une image avec de bons résultats. Les fractales sont aussi utilisées pour réduire la 
taille des antennes de réception et élargir leur spectre de fréquence utile (nos téléphones portables du 
début du 21ème siècle ont des récepteurs fractals de type "tapis de Sierpinski" - voir plus loin - à cause de 
tous les types de fréquences qu'ils doivent pouvoir gérer!). Dans le génie civil les fractales sont utilisées 
pour la construction de certains murs absorbeurs de son. Et bien d'autres choses encore... 
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Cette géométrie fractale se différencie de la géométrie euclidienne par sa définition d'une part: les figures 
de la géométrie euclidienne sont en général déterminées par des relations algébriques, alors que les 
courbes fractales sont définies de façon récursive comme nous l'avons déjà mentionné. Les fractales ont 
aussi des dimensions fractionnaires (nous avons déjà traité ce sujet dans le chapitre de Géométrie 
Euclidienne lors de la définition du concept de dimension). D'autre part, il ne faut pas non plus négliger 
leur aspect autosemblable: chaque partie d'une fractale peut être observée à n'importe quelle échelle: 
chaque partie est (sensiblement) une copie de l'ensemble. 


Remarque: Les développements qui vont suivre auraient très bien pu être mis dans le chapitre de 
Suites Et Séries ou encore d'Analyse Fonctionnelle ou encore vus comme un cas particulier du 
chapitre de Topologie réduit à l'espace euclidien (raison pour laquelle vous y trouverez par ailleurs de 
nombreuses références). Notre choix se veut pédagogique au même titre que pour le chapitre de 
Cryptographie, dans le sens qu'il est beaucoup plus intéressant pour un étudiant d'une petite classe de 
voir une application des concepts abstraits de la topologie dans un cadre pratique (et par ailleurs 
esthétique) où ils sont absolument nécessaires à la bonne compréhension du sujet plutôt que dans un 
cadre où l'on peut très bien s'y soustraire sans avoir à trop en souffrir. Le lecteur retrouvera ici certains 
développements et théorèmes proposés ailleurs sur le site ceci dans le but de lui éviter d'avoir trop à 
"tourner les pages". 


Les objets fractals naturels sont dits "objets non déterministes", car le processus dynamique qui permet 
leur création varie lui-même avec le temps de façon aléatoire (voir le chapitre de Dynamique Des 
Populations pour un excellent exemple). Nous pouvons néanmoins essayer de modéliser des systèmes 
dynamiques permettant d'aboutir à des objets fractals, sous une forme mathématique rigoureuse (c'est 
encore un bon exemple de la façon avec laquelle les mathématiciens arrivent à rendre un concept concret 
simple et intuitif en un modèle mathématique abstrait et un peu confus). 


Dans le cadre de ce chapitre, nous envisagerons l'étude de deux familles de fractales qui seront dans 
l'ordre: 


- Les fractales déterministes basées sur des fonctions itérées qui sont strictement autosimilaires. Elles sont 
générées, comme nous le verrons, par l'application récursive de fonctions contractantes sur des sous- 
ensembles d'un espace métrique. Le théorème du point fixe assurera (comme nous le verrons aussi!) 
l'existence et l'unicité d'un "sous-ensemble fixe" de l'espace métrique, vers lequel tout sous-ensemble 
converge. 


- Les fractales à temps d'échappement (dites aussi fractales par récurrence) qui sont non strictement 
autosimilaires: Elles sont générées comme nous le verrons par des suites récurrentes non divergentes. Le 
théorème du point fixe servant de garantie pour la non-divergence de la fonction relativement aux points 
de départ choisis. 


1. FRACTALES IFS 


Commençons par étudier la première famille de fractales découverte par Michael Barnsley en 1987: les 
"systèmes de fonctions itérées déterministes" ou souvent appelées en anglais "deteministic iterated 
function systems" (IFS). 


De toutes les figures fractales, seules celles construites au moyen de systèmes de fonctions itérées 
affichent habituellement la propriété d'autosimilitude, signifiant que leur complexité est invariante par 
changement d'échelle. 
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Commençons par "borner" la chose... : 


Nous nous donnons un objet géométrique initial Æ#, de l'espace E, une fonction f de E dans E telle que: 


f(&)cE 


(ce qui impose que l'objet initial ne pourra pas sortir de son propre domaine de définition via l'itération à 
travers la fonction f) et nous créons le système dynamique discret défini par: 


Sous certaines conditions que nous allons de suite voir, la suite d'objets géométriques (£, ) "tend" vers 
une limite, qui est souvent un objet fractal (nous en verrons par ailleurs quelques exemples). 


Naturellement, il existe un cadre mathématique rigoureux dans lequel les conditions évoquées et le verbe 
"tendre" ont une définition précise. En particulier, les objets Æ, sont tous des compacts de E, c'est-à-dire 
des sous-ensembles bornés (que nous pouvons inclure dans un segment si E est une droite, un disque si E 
est un plan ou une boule si E est l'espace à trois dimensions) et fermés (toute suite convergente de Æ, a sa 


limite dans E). Nous nous plaçons alors dans l'espace métrique des compacts, muni de la distance de 
Hausdorff (voir plus loin la définition), dont nous allons montrer qu'il est complet lorsqu'il s'agit de 
compacts du plan et de l'espace, et nous vérifierons que f est un "opérateur de Hutchinson", c'est à dire 
une application contractante de l'espace des compacts dans lui-même pour cette distance. Il ne restera alors 
plus qu'à appliquer le théorème du point fixe. 


Des systèmes dynamiques de ce type sont dits déterministes, et donc appelés IFS (deteministic iterated 
function systems). Précisons que la limite de l'IFS s'appelle "l'attracteur de l'IFS". Nous pouvons montrer 
que sous les conditions évoquées plus haut, cet attracteur ne dépend pas de la forme de l'objet 
géométrique initial (nous verrons des exemples pratiques plus bas). 


Dans un premier temps, nous limiterons notre étude à IR (le cas général étant donné dans le chapitre de 
Topologie du site) sachant de toute façon qu'une généralisation à l'espace euclidien de dimension deux ne 
nécessite pas un travail intellectuel trop grand et que l'ensemble des complexes y est isomorphe. 


Définition: Pour nous permettre de définir les frontières de nos fonctions fractales considérons # CR. 
Nous disons que & est le "supremum" de X et nous notons: 


6 =sup(Æ) 
si & est le plus petit des "majorants" de X (un majorant de X est un nombre a qui vérifie Vx€ À#,x £a), 


De la même façon, nous disons que & est "l'infimum" de X et nous notons: 


E=inf(X) 
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si & est le plus grand des "minorants" de X (un minorant de X est un nombre a qui vérifie Vx€ À,a £x), 
Il existe des sous-ensembles de IR qui n'ont pas de supremum (respectivement d'infimum) par exemple 
[0,+e[ (respectivement ]-«,0]). 


Remarque: Nous utilisons souvent la caractérisation suivante du sup: 
G=Sup(X) (585) 
si et seulement si: 


VEe)0 kel é-E<x£<é (586) 


ce qui est évident car nous pouvons nous approcher aussi près que l'on veut de & par des éléments de 
X (penser à & petit). Pour information, nous avons alors aussi dans la même idée: 


G=infX4) (58.7) 
si et seulement si: 


Ve)0,ef é<x<étE (588) 


Nous considérerons comme intuitif que si # CR est majoré, c'est-à-dire s'il existe 4 eR tel que 
Vxe À,x £a (respectivement minoré), alors X possède un supremum (respectivement un infimum). 


Nous verrons plus tard que c'est cette propriété qui permettra de montrer que IR est un "espace métrique 
complet"! 


Remarque: En passant, soulignons l'importance de prendre IR comme espace métrique de définition 
pour que cette propriété soit satisfaite. Nous pouvons effectivement remarquer qu'elle n'est pas vérifiée 
dans l'ensemble Q@ des nombres rationnels avec l'exemple simple suivant: 
2 
À -{xeQ| x 2) (58.9) 


qui est majoré mais n'a pas de supremum dans Q car ce supremum se situe dans IR puisque: 


x£4/2 (58.10) 


donc: 


sup( A) = NE (58.11) 


C'est ce qui fait que Q n'est pas "complet". 


Définition: Nous disons que Ÿ & R est "borné" si X est majoré et minoré. 
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De la définition suit immédiatement que X est borné si et seulement s'il existe 4,2 € R avec z <b tels que 
À c[a,b]. 


Maintenant que le concept de borne est relativement bien défini, voyons comment une suite peut s'y 
comporter: 


Définition: Nous disons qu'une suite (a, h de R est une "suite croissante" (respectivement 
décroissante") si: 

Vre Na, <a,4 (58.12) 
respectivement: 

Vae Na, 24,4) (58.13) 


a 


Nous disons que la suite (a, Je est "monotone" si elle est croissante ou décroissante comme nous l'avons 


déjà vu dans le chapitre de Suites Et Séries. 

Définition: Soit ? ={#,#,#,....} un sous-ensemble infini de N avec #9 <  <.… . Nous disons que la 
suite (a Le est une "sous-suite" de la suite (a, l ; 
Montrons maintenant que toute suite (a, h de IR admet une sous-suite monotone (c'est un peu l'idée de 
fractale!). 

Démonstration: 


Nous disons que &,, est un "pic de la suite" si: 


Va m,a,, 24, (58.14) 


Considérons l'ensemble P des pics de la suite (a, h ; 


- Si P est infini alors la sous-suite (4, ),., est monotone car décroissante. 
- Si P est fini ou vide alors soit: 
mA =max(P) +1 (58.15) 


(si P = nous choisissons #4 quelconque). 4, n'est donc par construction pas un pic, donc il existe 


1 
mA 2 ma tel que 4 < Am. À son tour &, n'est pas un pic, donc il existe ## 2 #1, tel que Ar, < Em, EC. 
Nous voyons que nous définissons ainsi une sous-suite croissante. 


CIC.Q.F.D. 


Définition: Nous disons que la suite (a, ) "converge" vers 4 eR et nous notons lim a, “4 si: 


N 
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VEDOWEN,22 N—la, -al<el (58.16) 


Nous disons dans ce cas que a est la "limite de la suite" (a, ) 


N° 


Dans l'exemple de la figure ci-dessous où la suite semble converger vers 1.13 nous observons que pour un 
& positif non nul particulier donné, il existe un n particulier que nous noterons N (valant 17) à partir 
duquel la suite converge. 


æ3 
1,5 
1.4 
1.3 g 
0 
[#4 
D ER ” 
47} \41/ ns / \ao s 
1.1 ds do 3 \ /A7 E 
FO POS A DA Ep PRO PEER ES LPO ER RER uns 
& 
2 16 
1.0 2 ° 
d] ÿ 
0.9 
44 


Figure: 58.2 - Illustration du principe de convergence d'une suite 


S'il n'existe pas de a (respectivement de N) pour lequel la relation précédente est vraie, nous disons que la 
suite "diverge". 


Démontrons maintenant que toute suite (a, ) croissante (resp. décroissante) et majorée (resp. minorée) 


N 
converge. 


En d'autres termes, nous cherchons à démontrer que toute suite (a, ) monotone et bornée converge 


N 
(forcément... par construction). 


Remarque: Si elle ne convergeait pas, nous pourrions difficilement savoir quel est son minorant et son 
majorant…. d'où le fait que la nécessité du théorème devient triviale. 


Démonstration: 


Ce théorème est au fait assez intuitif. Considérons pour cela une suite croissante. Nous nous doutons que: 


a =sup{a,@,42,..) (58.17) 


est la limite de cette suite. Remarquons tout d'abord que a = sup{a,& 4...) existe car (a, a est. 


majorée (cf. premier théorème). 
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Soit £ > 0. Il existe un &;7 tel que & —£ £ ay £ a. Mais dans ce cas vu que la suite est croissante , nous 


avons Va 2 Na-e<a, £a.C'est-à-dire (a, -a|£ #. Dans le cas où la suite est décroissante en 


procédant de la même façon, nous montrons que 4 =inf{a,,&,4,....} est la limite de cette suite. 


OIC.Q.F.D. 


Et voici maintenant le résultat important à retenir suite à tout cela: Toute suite bornée de nombres réels 
possède une sous-suite convergente (c'est intuitif. mais encore une fois. formalisé cela devient parfois 
moins intuitif.….). 


C'est ce que les mathématiciens appellent le "théorème de Bolzano-Weierstrass" et il est extrêmement 
important dans de nombreux domaines des mathématiques: 


Démonstration: 


Soit (a, je une telle suite. Par une proposition précédente nous savons qu'il existe une sous-suite 


monotone que nous noterons (à, Le (8, ke est donc une suite monotone et bornée et par le théorème 


précédent, (à, ),, converge. 


Donc, si nous n'arrivons pas à déterminer si la sous-suite converge ni sa limite exacte (ce qui dans la 
pratique est souvent très difficile), il nous suffit de savoir que la sous-suite est monotone et bornée pour 
nous assurer qu'elle converge (ce qui est beaucoup plus simple). 


OIC.Q.F.D. 


Rappelons que nous avons vu dans le chapitre de Suites Et Séries qu'une suite de Cauchy, est une suite 
(a) qui vérifie (nous nous restreignons à un rappel particulier sur une distance euclidienne): 


Fed) 0WeN am2N=>le,-a,|<e (58.18) 


La différence entre deux termes d'une suite de Cauchy peut être rendue arbitrairement petite pourvu que 
les indices de ces termes soient assez grands. 


Nous avions aussi démontré (à nouveau dans le chapitre de Suites Et Séries) que dans le cas d'une distance 
dans le sens topologique général toute suite convergente est une suite de Cauchy (par contre la réciproque 
est pas toujours vraie à condition qu'on ne complète pas l'ensemble... sinon la réciproque est toujours 
vraie). Par exemple, une suite de nombres rationnels qui converge vers un réel n'est pas une suite de 
Cauchy, excepté si on complète l'espace des rationnels pour avoir l'espace des réels. 


Refaisons la démonstration restreinte à la distance euclidienne (la méthode est exactement la même 
comme le lecteur pourra le remarquer): 


Démonstration: 


Soit £ > 0, nous devons montrer qu'il existe: 


NeNtelquez,m2N—la, -a,[£e (5819) 
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Mais (4, ), tend vers a donc il existe H € N tel que » 2 N—|a, -a|< #/2. Pour #,#1 2 N nous avons 


donc: 
ke, -a,l<h,-altle-a.|<e/2+e/2=€ (5820) 
OC.Q.-F.D. 


Montrons maintenant que toute suite de Cauchy est bornée (nous n'en avions pas parlé jusque-là où que ce 
soit sur le site d'où la nécessité d'une démonstration). Puisqu'actuellement nous avons juste démontré que 
toute sous-suite convergente est une suite de Cauchy... 


Démonstration: 


Si CR est une suite de Cauchy alors en particulier pour £= 1 (choisi au hasard) nous savons qu'il existe 


NeN tel que #,#2 2 N= {la, -a,,|£1. Donc si nous fixons m, nous obtenons: 
q n y 


Va2Nlka,|<1+h,l (58.21 


OIC.Q.F.D. 


Voici à présent le théorème fondamental (c'est à ce niveau qu'il y a un impact énorme sur la 
compréhension de ce qu'est réellement une fractale!) découlant des quelques lignes précédentes. 


Nous devons démontrer que toute suite de Cauchy de nombres réels est convergente (par construction...). 
Nous disons alors que l'espace métrique IR muni de la distance euclidienne | | (valeur absolue) est un 
"espace complet". 


Remarques: 


R1. La propriété de complétude est liée à la métrique (donc ce théorème aurait tout aussi bien sa place 
dans le chapitre de Topologie!): un même espace peut être complet pour une distance et incomplet 
pour une autre. Il est donc important de toujours préciser la distance que l'on prend quand on parle 
d'espace complet. 


R2. Intuitivement, un espace est complet s'il n'a pas de trous. L'ensemble des rationnels n'est par 
exemple complet que si on lui ajoute les nombres réels. 


Considérons d'abord CR une suite de Cauchy. Nous avons vu que CE est bornée donc par le 


théorème de Bolzano-Weierstrass, il existe une sous-suite (a, ) : convergente. Notons a la limite de la 
2e 


sous-suite (a, } . Nous allons montrer maintenant que la suite Ce est convergente de limite a. 
1e 


Démonstration: 


Soit £ > O0, il existe # e N tel que (application de la définition de la convergence pour une sous-suite): 
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Us k, -al< £l2 (582) 


Pour ce même € il existe 4# > O0 tel que (application de la définition de la convergence pour une suite de 
Cauchy): 


P42M—= la, -a,|< €/2 (58.23) 


Soit C'= 4 + A. Choisissons i > €. Nous avons donc, la, -a|<e{2 etpour 52€, la, a | SEIZ, 


Donc par l'inégalité triangulaire (cf. chapitre de Calcul Vectoriel), pour tout # > €: 


ka, -al£e, -a |+le, -al< Ef2+TE/2=E (58.24) 


Ce qui veut justement dire que (as) converge vers a. 


CIC.Q.F.D. 


Fondamentalement c'est un résultat intuitif mais à l'époque où les nombres réels n'étaient pas connus ou 
pas rigoureusement définis c'était une autre paire de manches. En réalité, il suffit de compléter tout 
ensemble par les nombres réels pour avoir un espace complet. Par ailleurs, certains mathématiciens 
définissent l'ensemble des réels en disant que c'est l'ensemble pour lequel toute suite de Cauchy converge. 


Définition (intuitive): Un "point adhérent" est un point dont nous pouvons nous approcher autant que 
nous voulons à l'aide d'éléments d'un ensemble X donné (nous nous en approcherons par exemple avec une 
suite). Cependant, ce point adhérent peut aussi bien être à l'intérieur qu'à l'extérieur de X (tous les points à 
l'intérieur de X sont bien évidemment des points adhérents). Une bonne image est de voir une suite qui se 
rapproche de ce point adhérent et de définir des cercles autour de celui-ci qui deviennent de plus en plus 
petits contenant des éléments de la suite. 


On peut imaginer comme exemple une suite définie par l'ensemble X des rationnels qui tend vers un 
irrationnel ou vers un nombre transcendant (ces deux points adhérents étant à l'extérieur de l'ensemble des 
rationnels). Donc dans ce cas, le point adhérent est extérieur à X (l'ensemble des rationnels). Par contre, 
tout point adhérent qui serait rationnel pour une suite de rationnels sera forcément... dans X. 


Dès lors, vient la définition suivante: 


Définition (formelle): Soit Y <IR*. Nous disons que ;e [R* est un "point adhérent" à X si pour toute 
boule B(x,r) de rayon r centrée en x nous avons: 


XNnB(xr) #@Q (5825) 


L'ensemble des points adhérents à X est "l'adhérence" de X et est noté X. Nous avons évidemment (il 
suffit de se le conceptualiser de manière abstraite pour toutes les boules possibles) X < X. Sans oublier 
qu'il faut penser en termes d'ensemble de nombres pour X...! 


Exemple: 
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Prenons l'intervalle 10,1] avec la boule B(0,1). L'intersection entre la boule et l'intervalle est non nulle, 
nous pouvons alors dire que 0 est adhérent! Mais maintenant prenons une suite 1/n par exemple, dans 
l'intervalle ]0,1]. Cette suite tend vers zéro mais pourtant 0 n'appartient pas l'intervalle. C'est donc bien un 
exemple qui montre que X € X. 


Nous pouvons faire dès lors la proposition suivante: 


Montrons maintenant que x IE” est adhérent à X si et seulement si il existe une suite (a, de dans X qui 
converge vers x (attention, l'exemple précédent nous montre que x n'est pas nécessairement dans X). 


Au fait, nous allons plutôt démontrer (si l'on peut appeler cela une démonstration...) que si nous 
choisissons un point adhérent x alors nous pouvons toujours trouver une suite (u, k dans X qui converge 
VETS X. 


Démonstration: 


1 
Si xeR* est adhérent à X alors considérons la suite des boules concentriques À (se avec > tel 
# 


que: 
1 

ÆNB|zx-|#@ (58.26) 
À 


et alors il existe toujours des éléments x, qui satisfont: 


PRE = (ros(x})] (58.27) 
ñ 


avec lesquels nous pouvons créer une suite par l'infinité des suites existantes. 
OC.Q.F.D. 
Définition: Nous disons que X CR” est un "espace fermé" si ZX = X. 


Des propositions précédentes découle le fait que dans tout fermé F, une suite (x, … qui converge a sa 
limite dans F. 


Nous considérerons comme trivial que si (Æ) ; est une famille de fermés indexée sur un ensemble 1 
quelconque. Alors [IE est fermé. 

Définition: XZ <R* est un "espace compact" si X est fermé et borné. 

Le théorème suivant donne une caractérisation des compacts à partir des suites: 

X<clR"* est compact si et seulement si toute suite la : de X possède une sous-suite qui converge dans X. 


Démonstration: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Montrons que X est fermé: 


Si X est compact et (z x est une suite de X alors par le théorème de Bolzano-Weierstrass, (z, ke possède 
une sous-suite convergente de limite xe I&*. Mais puisque X est fermé, nous avons xe X. 
Réciproquement, supposons que toute suite (x, À de X possède une sous-suite qui converge dans X. Alors 
X est fermé car si xe X il existe une suite (x 1e de X qui tend vers x. Par hypothèse, (x, LL possède une 


sous-suite qui converge vers VE À. (x, . étant convergente toute les sous-suites convergent vers la 
même valeur, donc x = YE À (c'est pas beau ça ?!!). Ainsi Y = X c'est-à-dire X est fermé. 


Montrons que X est borné: 


Supposons le contraire. Il existe donc une suite (x,),, de X telle que |x,,| > # . Mais dans ce cas, aucune 


sous-suite de (x, . n'est convergente, ce qui est une contradiction. Donc X est borné. En conclusion, X est 
compact. 
Une propriété des compacts est que si nous considérons (An une suite décroissante de compacts non 


vides, c'est-à-dire 4,4, € À,, alors (4 est un compact non vide. Nous nous passerons de la 
n€ 


démonstration qui est relativement triviale de par la définition du concept d'ensemble d'adhérence qui 
oblige qu'un compact soit par construction non vide. ! 


Exemple: 
Nous obtenons l'ensemble C de Cantor de la manière suivante: 


Nous commençons par considérer l'intervalle fermé borné C5 =[0,1] de IR qui est donc un espace 
compact (ensemble borné et fermé). Nous partageons €, en trois parties égales et nous enlevons 
l'intervalle du milieu. Nous obtenons ainsi l'ensemble: 


C =[0,1/3]U[2/3,1] (58.28) 


Le ) 


qui peut être considéré aussi comme l'application d'une homothétie de facteur contractant 1/3 sur 
l'intervalle fermé borné de départ dont on translate le centre d'homothétie. 


Nous recommençons avec les deux intervalles [0,1/3][2/3,1] pour obtenir: 


C, =[0,1/9]0[2/9,1/3]0[2/3,7/9]U[8/9,1] (58.29) 
réunion disjointe de quatre intervalles. Et ainsi de suite. Nous obtenons donc une suite décroissante €, de 
compacts. Nous définissons: 


C= M" Ca (58.30) 


n?0 


Grâce à la proposition précédente, nous savons que C est non vide et qu'il est compact ce qui montre que 
les compacts ne sont pas tous "triviaux" comme des intervalles. L'ensemble de Cantor (car il avait joué 
avec en faisant le dessin comme ci-dessous en partant du bas) est un exemple de fractale (de compact): 
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EL ._ | + 
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En ..- + PR 
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0 __ — _— —_ 
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0 1 


Figure: 58.3 - Ensemble de Cantor avec Maple 4.00b 


qu'il est possible d'obtenir avec le code Maple 4.00b suivant (si le copier/coller de la page web dans 
Maple 4.00b ne marche pas, réécrivez simplement le code): 


>with(plots): 

line := proc(a:: list, b:: list) 

local plotoptionen, n; 

if nargs > 2 then 

plotoptionen := seq(args[n], n=3 .. nargs) 


else 

plotoptionen := NULL 

fi; 

plot([a, b], style-line, plotoptionen); 
end: 


cree_segment := (a,b,h) -> line([a,h],[b,h],color-black): 
fl:=x->x/3: f2:=x->(x+2)/3: 


f:=s->s union map(f1, s) union map(f2, s): 


sequence_de_segments := proc(l,h) 

local accu, j; 

accu := NULL; 

for i to nops(l) by 2 do 

accu := accu,cree_segment(l[i], I[i+1], h) od; 
accu 

end: 
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Cantor := proc(n) local s, i; 

option remember; 

s := sequence_de_segments([0,1], 1); 

for i from 1 to n do 

s := sequence_de_segments(sort([op((f@@i)({0,1}))D), (L-in)), s; 
od; 

display({s}union{seq(textplot([[0,(i+1/2)/n, 'O'], [1, (G+1/2)/n, ‘1']] 
), i<0 .. n)}, color-blue,axes=-NONE, thickness=7) 

end: 


>Cantor(7); 


Il est très intéressant de remarquer que l'on converge vers la fractale de Cantor (en termes de géométrie 
mais aussi de valeurs!) quel que soit le compact de départ choisi (l'intervalle fermé borné) et aussi... quel 
que soit le facteur contractant choisi! 


Mandelbrot observa aussi ce type de structure autosimilaire lors de l'analyse de signaux transmis 
électriquement à l'époque par IBM sur des câbles de cuivre (IBM avait des problèmes de perte 
d'informations par transmission). 


Regardons pour finir comment se comportent les compacts vis-à-vis des applications continues (nous en 
avons besoin pour montrer comment déterminer la distance d'un point à un ensemble ce qui nous sera 
indispensable après pour déterminer les propriétés de la distance de Hausdorff). 


Nous rappelons (cf. chapitre d'Analyse Fonctionnelle) qu'une application f : Æ — IR“ où X <R" est 
quelconque, est continue en un point xe X si: 


Ve >0,36 >0,vye X,d(x y) <6= d(f(n,fO)£<E Ge3n 


Ce qui traduit le fait que pour y assez proche de x, f{y) est arbitrairement proche de f(x). Nous disons aussi 
que f est continue sur X si elle est continue en tout point de X. 


Proposition: Soit f : Æ — IR“ une application continue en xe X et Ce . une suite de X avec: 


imx,=1EX (693) 
= co 


Alors la suite f(x,) converge et (cette proposition est très importante!): 


lim f(x.) = f(2)| (6833) 


En d'autres termes, si nous utilisons en tant qu'ensemble de départ les valeurs d'une suite convergente, 
alors la fonction qui prendra en entrée les valeurs de cette suite convergera elle aussi! 


Démonstration: 


Soit £& > O.fest continue en x, donc il existe £ > 0 tel que: 


d(x,,x)<6= d(f{,)fGR))£SE (583) 
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(x, LL tend vers x donc il existe 4 e N tel que: 


n2N—d(x,x,) <È (58.35) 
Par suite pour # 2 À} , nous avons: 
d(F(x), FX) LE (58.36) 
OIC.Q.F.D. 


Si nous considérons maintenant Y# <]f* un compactet f : X — [R* une application continue. est 
€ P PP 


compact. En particulier sup( f) et inf( f) seront atteints par définition et construction d'un compact 
(ensemble borné et fermé) qui est égal à son adhérence. 


Autrement dit, une fonction à valeurs réelles continue sur un compact y atteint toujours son supremum ou 
son infimum. 


Démonstration: 


- Montrons que f{X) est fermé: En effet, soit f(x,) une suite qui tend vers ye f(X) (nous prenons 
l'adhérence au fait pour espérer montrer qu'elle est égale à l'ensemble lui-même) alors X étant compact, 
(x, x possède une sous-suite (x, | convergente. 


ieN 


Posons: 


fest continue, donc: 


Mais comme: 
p= lim f(x) = lim f(x) (58.39) 
7 1 © 
nous avons y = f(x)E f(Æ). Ceci prouve que: 


FA) = SR) (568.40) 
et donc que f{X) est fermé. 


- Montrons que f{X) est borné: Supposons le contraire. Il existe donc une suite f(x, ) telle que: 


LD] 22 (68.41) 
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pour tout n entier naturel (puisque justement il est supposé non borné). Soit (x hu une sous-suite 


convergente de CE, Le avec: 
lin Xy 7 XE X (58.42) 


ie 


Alors: 

lim f(x, )= FC (584) 
et par suite: 

fr 0 
mais ceci est en contradiction avec: 
in GR Df-Hmm = te ao 
Donc f(X) est borné. Donc f{X) étant fermé et borné il est compact. 
[IC.Q.F.D. 


Appliquons maintenant cela (car c'est ce qui nous intéresse dans le cadre des espaces fractals) au calcul de 
la distance d'un point à un ensemble: 


Soit xe IR”, l'application f : IR° — IR définie par f{y}-d(x, y) est continue. 
Démonstration: 
Pour tout y,z € IR”, l'inégalité triangulaire nous donne: 
d(x,y) £d(x,z) +d(z,y)— d(x,y)-d(x,z) £d(z,y) (5846) 

En changeant les rôles de y, z nous obtenons: 

d(x,z) —d(x,y) <d(z,y) (58.47) 
et donc: 

klx,z) -d(x,y)|< déz,y) (58.48) 
Ainsi pour £& > 0 donné &(z,y) £ & implique: 

l4(x,z) - d(x,y)| £E (58.49) 

c'est-à-dire: 


P@)-fON<E (68:50) 
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et f est donc continue en y. 


OIC.Q.F.D. 
Définition: Pour ;e R* et 4<cIR* nous définissons la distance de x à À comme étant la valeur: 
d(x, À) = inf {d(x,a) la € À} (58.51) 


Si xe À alors 4(x,4) = 0 (trivial). La réciproque n'est pas vraie. En effet dans le cas x = Ü et 4 =]0,1] 
nous avons bien 4(x,4) = 0 mais x& 4. Nous avons donc la proposition (importante!): 


dix, A =0&xeA (5852) 
Démonstration: 
d(x, 4) = Ô entraîne l'existence d'une suite (4, ),, d'éléments de À telle que: 
lim d(x,4,,) = 0 (58.53) 


ce qui veut dire: 


ima,=x (5854) 
7 © 


donc xe 4 (voir développements plus hauts). 


Réciproquement, si xe À alors pour tout £ > 0 il existe & e À tel que 4(x,a) £ £. Mais 
d(x, 4) £ d(x,a) £ &. Ainsi pour tout & > 0, 4(x, À) £ &, C'est-à-dire: 


d(x,4)=0 (5855) 
CIC.Q.F.D. 


En général la distance de x à A n'est pas atteinte. C'est-à-dire qu'il n'existe pas de & « À tel que 

d(x, 4) = d(x,a) il suffit pour cela de considérer l'exemple x = -1 et 4 =]0,1] nous avons 4(x, 4) =1 mais 
pour tout 4 e À, d(x,a) ? 1. Si À est compact, la situation est bien évidemment différente selon la 
proposition (la plus importante pour la distance de Hausdorff) suivante: 


Si AC R" est compact, il existe & € À tel que d(x, 4) = d(x,a). Ainsi: 

d(x, 4) = min{d(x,y)|ye À} (58:56) 
Démonstration: 
L'application f : A— R définie par f(&) = 4(x,&) est continue comme déjà montré. Par conséquent f{A) 
est compact (cf. une proposition précédente). Ainsi, f atteint ses bornes, c'est-à-dire, il existe 4 e À tel que 
f(a)=inf( f(A) ). Donc: 


d(x,a) = fa) =inf(f(4)) = dx, À) (58:57) 
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CIC.Q.F.D. 


Remarque: La proposition précédente ne dit pas que a est unique, d'ailleurs en général, il en existe 
plusieurs. 
1.1. ESPACE MÉTRIQUE DES FRACTALES 


Les fractales sont souvent perçues par les gens comme de jolis dessins sur une feuille, mais lorsque nous 
voulons regarder en détail la géométrie fractale, nous avons besoin d'un espace particulier où l'étudier, un 
peu comme le biologiste qui met des petits vers sur une plaquette pour les observer en détail au 
microscope. Nous allons faire de même pour nos fractales en les plaçant dans un endroit qu'ils apprécient. 


Cet endroit a de fortes chances d'être un sous-espace de KR? ou E°, puisqu'en fin de compte il s'agira de 
produire des dessins, et pour illustrer nos propos nous nous placerons souvent dans le cas X = EF? (avec la 


métrique euclidienne) et sauf mention du contraire, nous considérerons toujours le cas où (X,4) est un 
espace métrique complet. 


Rassemblons différents éléments afin de pouvoir construire cet espace: 


Définition: Nous définissons H{Æ4) comme l'espace dont les points sont les sous-ensembles compacts de 
X, autres que l'ensemble. Désormais nous appellerons "fractale" n'importe quel élément de H(Æ). 


Exemple: 


Il est immédiat que si x,y € H{x), alors x y € H(Æ) , mais X MY n'est pas forcément dans H(Æ). II 
suffit de voir la figure avec les deux ensembles compacts (fermés, bornés donc) ci-dessous de R2. Ce sont 
donc deux points de #{(Æ4). Leur réunion est encore un ensemble compact, et donc: 


z=xUyeH(R*) (5858) 


Par contre, si les ensembles sont disjoints (comme ici), *"1y = # et par conséquent n'est pas un point de 
H{R*} (voir la théorie précédente). 


Figure: 58.4 - Source: IFS et L-Système, V. Rezzonico, C. Hebeisen 
Un autre exemple consiste à prendre la fractale de Cantor. 


Définition: Soit xe X et BE H(X), nous définissons la distance d'un point x à l'ensemble B, et nous la 
notons d(x,B) comme étant: 
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d(x,B) = min{d({x, y) B'2= B} (58.59) 


Remarques: 

R1. Cette définition est tout à fait générale et s'applique à n'importe quel sous-ensemble non vide de X, 
en remplaçant min par inf. Mais dans le cas particulier, nous sommes intéressés à prendre précisément 
H(Æ) comme sous-espace. 


R2. Cette distance est bien définie (elle existe) du fait que B est non vide et compact. 


R3. Il est trivial de voir que si cette distance est nulle, alors xe &. 


Exemple: 


Illustration dans le cas où X = EF°: 


d(x,B) 


X 


Figure: 58.5 - Source: IFS et L-Système, V. Rezzonico, C. Hebeisen 


Définition: Soient 4,8 € H(XZ). Nous définissons la distance de A à B et nous la notons 4(4, 8) comme 
étant: 


d(A,B)=max{d(x,B)|x€ A} (58.60) 


Remarques: 


R1. Comme avant, cette définition a un sens, et en particulier il existe deux points À€ À,ÿ€ 8 tels 
que d(A, 8) = d(£,ÿ). 


R2. Nous constatons que cette distance ne fournit pas de métrique #(X) : en effet, (4, 8) # d(B, A) 
en général (prendre par exemple la fractale de Cantor où pour certains compacts nous avons 4 C B 
avec 4 * 8, nous aurons alors d(A,B)=0 mais 4(8, 4) > 0). 


Définition: Soient 4,8 € H(ÆX). Nous définissons la "distance de Hausdorff" entre deux ensembles 
AÀ,B € H{X), et nous la notons #{4, #\, comme étant: 
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k(A,B) = max{d(A,B),d(8,4)} (5861) 


Cette fois-ci, de par cette dernière définition, nous avons bien une métrique sur H(Æ). 
En effet, vérifions que les 5 propriétés d'une distance soient vérifiées (cf. chapitre de Topologie): 


Soient À,8,Ce H(X). Clairement nous avons sans démonstration (symétrie, nullité sur la diagonale et 
séparation): 


h(A, B\ = k(B, À) 
h(A, A) = d(A,A)=0 (58.62) 


h(A,B)=0& A=8B 


De plus, comme À et B sont compacts, #(4,8) = d(a,b) (cf. une des propositions précédentes) pour un 
certain 4 e À et un certain he B. Or, puisque d(&,b) > O0 par définition nous avons (propriété de 
positivité) finalement (4,8) > 0 tel que 4 € A,aé B: 


k(A,B) = max {d(A,8),d(B, A)} > d(A,B) = max{d(a, B)|a € À} 2 d(a,B) >0 (58.63) 
puisque B est fermé. 


Enfin, puisque #(4,8) = d(a,b) (cf. extension d'une des propositions précédentes), l'inégalité triangulaire 
est alors forcément respectée et alors: 


h(A,8B) < k(A, B) + k(C,8) (58.64) 


Donc h est bien une métrique sur #(ÆX), ce qui fait de (H(X),k) un espace métrique. C'est déjà un 


premier pas dans la direction souhaitée: nous avons désormais les moyens de comparer deux ensembles 
appartenant à #(Æ4) par la distance de Hausdorff qui les sépare. Si les deux ne sont pas "trop différents", 
alors intuitivement cette distance devrait être assez petite. 


Si nous choisissons une fonction f : À — À strictement contractante de constante À. Alors, l'application: 
Ta: HA) — HZ) (58.65) 
définie par 
T3(4)= (A) (58.66) 
est par construction aussi strictement contractante de constante 4. 


Soit j, :IR* —IR*, 1<i £X des applications strictement contractantes de constantes de contraction, 


O0 <À <1. Alors, il existe un unique compact 4€ H(R”) tel que: 
A= T2, (4)= AG U.U RCA) 6867) 


(A est l'unique point fixe de Ta..a, ) et pour tout compact B, on a: 
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lim Ta, (B)= A (58.68) 


où Ta, _ (#) est le m-ième itéré de B par Ta.2, , 


Ce résultat découle du théorème du point fixe (cf. chapitre Suites Et Séries) appliqué à l'espace 
HR”) qui est complet. 


Avec les mêmes notations, nous disons dit que f,...,.f, est un codage IFS (Iterated Function Systems) du 
compact À. Ainsi les fonctions f....,.f, définissent le compact A. Ce qui est surprenant, comme nous 
allons le voir dans les quelques exemples qui suivent, c'est que les #....,.f} sont généralement assez 


simples (comme des homothéties du plan) tandis que le compact À est dans bien des cas relativement 
"compliqué". 


Le cas # = 1 est sans intérêt, on aurait A={x} où x est le point fixe de f. Avec & = 2 nous obtenons 
déjà des résultats non triviaux. 


Remarque: Lorsque les fonctions itératives contractantes sont toutes des homothéties, nous parlons 
alors de "fractale de Sierpinski". Ainsi, la fractale de Cantor appartient à la famille des fractales de 
Sierpinski. 


Une méthode fréquemment utilisée pour générer informatiquement des fractales IFS (comme ce sera le cas 
ci-dessous avec Maple 4.00b) est de considérer un point dans le plan :%,,,y,, ! auquel nous pouvons sans 


autre forme de procès appliquer une transformation affine pour obtenir un nouveau point ! x, , Ya | tel 


que: 
Zn = EXn + +e 
Van = Cn + dat f 
où à, b, c, d,e et f sont des constantes quelconques, et i xÿ, ya ! est donné. 


Nous pouvons dès lors considérer une application W qui décrit notre transformation, et sous forme 
matricielle nous pouvons écrire le système précédent comme suit: 


AE 00) 


ou encore: 


De façon tout à faire générale, le vecteur à décrit simplement une translation, et la matrice A est la 
composition de rotations et d'un changement d'échelle (cf. chapitre de Géométrie Euclidienne), Les 
programmes informatiques (comme ce sera le cas dans les exemples plus bas), ne demandent donc souvent 
que les six paramètres a, b, c, d, e et f. 
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1.2. FRACTALE DE CANTOR 


Revoyons la fractale de Cantor vue plus haut maïs cette fois-ci avec le point de vue de l'application de 
deux fonctions itératives contractantes “,.f; (donc correspondant à k=2). 


Nous partons donc de l'ensemble borné fermé suivant: 
[0,111 (58.72) 


soit: 


Figure: 58.6 - Ensemble de départ de la fractale de Cantor 


Nous partageons donc en trois parties égales et nous enlevons l'intervalle du milieu. Nous obtenons ainsi 
l'ensemble: 


[[0,1/31,[2/3,1]1 (58.72) 


Soit: 


Figure: 58.7 - Première itération de la fractale de Cantor 


Nous pouvons constater que [0,1/3] peut être obtenu par l'homothétie de facteur 1/3 centrée en (0,0) 
suivante: 


À = Ko) = Hop (6874) 


et que [2/3,1] peut être obtenu par l'homothétie de facteur 1/3 centrée en (1,0) suivante: 


f2=h% =D (6875) 


et ainsi de suite, nous obtenons comme nous le savons déjà (voir code Maple 4.00b déjà donné plus haut): 
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0 . _ | ei] 
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0 1 
0 1 


Figure: 58.8 - Attracteur de Cantor après 6 itérations 


Ce qui correspond en reprenant le formalisme vu plus haut à: 


4 =[0.1] 
A =fi[0iliu £i[01l=[[01/31[231]] 670 
4 = fiAiU fiA | =. 


Mais voyons que cela marche avec n'importe quel compact de l'ensemble des réels comme un carré par 
exemple avec le code Maple 4.00b suivant (nous montrerons toujours tous les détails de Maple 4.00b, car 
rien ne dit que les lecteurs le possèdent ni que le logiciel existera toujours dans 50 ans...). 


Attention!!! Si le copier/coller de la page web dans Maple 4.00b ne marche pas, réécrivez simplement le 
code. 


>transforme_point := proc(t, p) 
[LPO 2 PH 5], L3Fp[11+-{4pl21+ 161] 
end: 


>IFSS := proc(n, liste_de_transformations,col) 

local i, j, k, s, seq_square: 

seq_square :=[[0,0],[1,0],[1,1],[0,11]; 

for j to n do 

s := NULL: 

for i to nops(liste_de_transformations) do 
S:= 5, 
seq(transform_square(liste_de_transformations|i], 
op(k, [seq_square])), 
k=1 .. nops([seq_square])) 


od; 
seq_square := 5 
od; 
plots[polygonplot]([seq_square], axes=-none, color-col, scaling=constrained) 
end: 
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>cantor:=[[evalf(1/3),0,0,evalf(1/3),0,0],[evalf(1/3),0,0,evalf(1/3),evalf(2/3),0]]: 


>IEFSS(1, cantor,blue); 


>IFSS(2, cantor,blue); 


>IFSSG3, cantor,blue); 


etc. 


Donc, quel que soit l'ensemble de départ, la suite de compacts obtenue par application successive de ces 
deux homothéties du plan converge toujours (au sens de la distance de Hausdorff) vers le même compact/ 
attracteur (assimilé au point fixe du théorème du point fixe.) appelée fractale de Cantor (appartenant 
donc à la famille des fractales de Serpienski). La dernière figure ci-dessus est une bonne approximation de 
cet ensemble. 


1.3. FRACTALE DU TRIANGLE (TAMIS) DE SIERPINSKI 


Pour construire la fractale de Sierpinski (que l'on retrouve comme curiosité sur le coquillage Cymbiola 
innexa REEVE), basée sur trois fonctions itératives contractantes #,.f:..# (donc correspondant à k=3), 
nous partons par exemple des trois points de fR? suivants: 


[O, OI, [1, 0], [O.5, 11] 
Ce qui donne avec Maple 4.00b: 


>plots[polygonplot]( [[0, O1, [1, 0], [0.5, 1]], axes-none,  color-black, scaling-constrained); 
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c'est un triangle, mais nous pourrions partir de n'importe quelle forme et nous arriverions toujours au 
même résultat que nous allons voir plus loin. 


Nous appliquons sur chaque ensemble une fonction contractante de facteur 0.5, ce qui donne le triangle: 
[[0,01,[0.5,0],[0.25,0.5]] 
et nous noterons cette homothétie de facteur 0.5 et de centre (0,0) sur le triangle d'origine: 
4 1/2 
À = Ko) = on 


Nous effectuons maintenant sur ce triangle une translation de 0.5 dans la direction de l'axe des X, ce qui 
donne le triangle: 


[O.5,0], [1,0], [0.75,0.51] 
ce qui correspond à une homothétie de facteur 0.5 et de centre (1,0) sur le triangle d'origine: 
À 1/2 
J2= 9) = #0 


Nous translatons maintenant [[0,0],[0.5,0],[0.25,0.5]] de 0.25 selon l'axe de X et de 0.5 selon l'axe des Y 
pour avoir: 


[[0.25,0.5], [0.75,0.51, [0.5, 11] 


ce qui correspond à une homothétie de facteur 0.5 et de centre (0.5,0.75) sur le triangle d'origine: 


4 1/2 
Pa y) = KO 5075 


Avec Maple 4.00b cela donne maintenant pour les trois triangles: 


>plots[polygonplot]([[[0,01,[0.5,01,[0.25,0.51],[[0.5,01,[1,0],[.75,0.511,[10.25,0.5],[0.75,0.5] 
,[0.5,1]1], axes=none,color-black, scaling=constrained); 
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et ainsi de suite: 


et ainsi de suite: 


et ainsi de suite: 


AA À À 


LA LA L4 LA 
Là La 44 LA44 A À 
Lä Lä à, À LA LA Lé ” 
LA Ve A À à À LA A4 y LA À A AL: 


et ainsi de suite: 
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AÂÀ 


ë À 


â à 


A À 


À À | 


Figure: 58.17 - Cinquième itération du triangle de Sierpinski 
etc. 


Ce qui correspond en reprenant le formalisme vu plus haut: 


4 =[10.0]{10].{0.5.1)] 
A = f1[0,0)10 £1[1L0]0 [0.5.1] (6884) 


Nous pouvons faire la même remarque que lorsque nous avions présenté la fractale de Cantor la toute 
première fois: quel que soit l'ensemble de départ, la suite de compacts obtenue par application successive 
de ces trois homothéties converge toujours (au sens de la distance de Hausdorff) vers le même compact/ 
attracteur (assimilé au point fixe du théorème du point fixe.) appelé triangle Serpienski. La dernière 
figure ci-dessus est une bonne approximation de cet ensemble. 


Voyons cela avec un code Maple 4.00b (si le copier/coller de la page web dans Maple 4.00b ne marche 
pas, réécrivez simplement le code). 


> transforme_triangle := proc(t, triangle) 
local i; 
[seq(transforme_point(t, triangleli]), i=1 .. 3)] 
end: 


>IFS := proc(n, liste_de_transformations,col) 
local i, j, k, s, sequence_de_triangles: 
options Copyright by Alain Schauber, 1996'; 
sequence_de_triangles := [[0, O0], [1, 0], [0.5, 1]}; 
for j to n do 
s := NULL; 
for i to nops(liste_de_transformations) do 
S:=S5, 
seq(transforme_triangle(liste_de_transformationslil, 
op(k, [sequence_de_triangles])), 
k=1 .. nops([sequence_de_triangles])) 
od; 
sequence_de_triangles := s 
od; 
plots[polygonplot]([sequence_de_triangles], axes-none, color-col, scaling=constrained) 
end: 
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> triangle de_Sierpinski:=[[0.5,0,0,0.5,0,01,[0.5,0,0,0.5,0.5,0],10.5,0,0,0.5,0.25,0.511: 


>IFS(6, triangle_de_Sierpinski,blue); 


Figure: 58.18 - Attracteur du triangle de Sierpinski 


Et cette fois-ci nous partons non plus d'un triangle, mais d'un carré (IFS Square) avec le code Maple 4.00b 
suivant: 


> transform_ square := proc(t, square) 
local i; 
[seq(transforme_point(t, squarelil), i=1 .. 4)] 
end: 


>IFSS := proc(n, liste_de_transformations,col) 

local i, j, k, s, seq_square: 

seq_square :=[[0,0],[1,0],[1,1],[0,11]; 

for j to n do 

s := NULL; 

for i to nops(liste_de_transformations) do 
S:=S5, 
seq(transform_square(liste_de_transformations|i], 
op(k, [seq_square])), 
k=1 .. nops([seq_square])) 


od; 
seq_square := s 
od; 
plots[polygonplot]([seq_square], axes=none, color-col, scaling=constrained) 
end: 


> triangle de_Sierpinski:=[[0.5,0,0,0.5,0,01,[10.5,0,0,0.5,0.5,0],10.5,0,0,0.5,0.25,0.511: 


>IFSS(1, triangle_de_Sierpinski,green); 
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Figure: 58.19 - Première itération du triangle de Sierpinski avec des carrés 


>IFSS(2, triangle de_Sierpinski, green); 


Figure: 58.20 - Deuxième itération du triangle de Sierpinski avec des carrés 


> IFSS(3, triangle_de_Sierpinski,green); 


Figure: 58.21 - Troisième itération du triangle de Sierpinski avec des carrés 
etc. jusqu'à: 


> IFSS(6, triangle_de_Sierpinski,green); 
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Basiquement, le triangle de Sierpinski peut bien évidemment être aussi vu comme un triangle auquel on 
enlève le triangle du milieu et où pour chacun des triangles restants, on recommence la procédure! 


1.4. FRACTALE DU TAPIS DE SIERPINSKI 
Le tapis de Sierpinski est l'attracteur de 8 fonctions itératives contractantes d'homothéties de rapport 1/3 
centrées aux sommets et aux milieux des côtés d'un carré dans lequel peut se trouver n'importe quelle 
forme géométrique. 
Cette fois-ci, dans HR? nous considérons les huit homothéties (h): 
13 1/3 213 21/3 23 ,U3 31/3 1/3 
kao-#a0s-#an-*osn-#10-#%105-410 € Xuso 

et nous partons par exemple des quatre points de JR? suivants: 

[LO, O], [1, OI, (1, 1], [0, 11] 


ce qui correspond à un carré plein (mais nous pourrions choisir n'importe quoi d'autre!): 


Après l'application des huit fonctions d'homothéties (nous laissons le soin au lecteur de faire 
manuellement les calculs comme nous les avons déjà détaillés pour le triangle), nous obtenons la forme 
suivante composée de huit carrés: 
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Figure: 58.24 - Deuxième itération du tapis de Sierpinski 


et en réappliquant les huit homothéties encore une fois (heureusement qu'il y a l'ordinateur..): 


et encore une fois: 


Figure: 58.26 - Quatrième itération du tapis de Sierpinski 
etc. 


Le point fixe obtenu (attracteur) s'appelle donc cette fois-ci "tapis de Sierpinski" et c'est la forme qu'à 
l'antenne réceptrice de la majorité de nos téléphones portables en ce début de 21ème siècle. 


Les figures précédentes peuvent être obtenues successivement avec le code Maple 4.00b suivant (si le 
copier/coller de la page web dans Maple 4.00b ne marche pas, réécrivez simplement le code): 
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>transforme_point := proc(t, p) 
[LPO 2 PTS], 3 FPT 4 pl21+ 61] 
end: 


transform_square := proc(t, square) 

local i; 

[seq(transforme_point(t, squarelil), i=1 .. 4)] 
end: 


>IFSS := proc(n, liste_de_transformations,col) 

local i, j, k, s, seq_square: 

seq_square :=[[0,0],[1,0],[1,1],[0,1]]; 

for j to n do 

s := NULL; 

for i to nops(liste_de_transformations) do 
S:= 5, 
seq(transform_square(liste_de_transformationsfi], 
op(k, [seq_square])), 
k=1 .. nops([seq_square])) 


od; 
seq_square := S 
od; 
plots[polygonplot]([seq_square], axes=none, color-col, scaling=constrained) 
end: 


> dywan:= [[evalf(1/3),0,0,evalf(1/3),0,0]1,[evalf(1/3),0,0,evalf(1/3),evalf(1/3),0], 
[evalf(1/3),0,0,evalf(1/3),evalf(2/3),0], [evalf(1/3),0,0,evalf(1/3),0,evalf(2/3)], 
[evalf(1/3),0,0,evalf(1/3),evalf(1/3),evalf(2/3)], [evalf(1/3),0,0,evalf(1/3),evalf(2/3),evalf(2/3)], 
[evalf(1/3),0,0,evalf(1/3),0,evalf(1/3)],[evalf(1/3),0,0,evalf(1/3),evalf(2/3),evalf(1/3)1]: 


> IFSS(O, dywan, blue); 


> IFSS(1, dywan, blue); 
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Figure: 58.28 - Première itération du tapis de Sierpinski 


> IFSS(2, dywan, blue); 


Figure: 58.29 - Deuxième itération du tapis de Sierpinski 


> IFSS(3, dywan, blue); 


Figure: 58.30 - Troisième itération du tapis de Sierpinski 


> IFSS(4, dywan, blue); 
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1.5. FRACTALE SPIRALE 


Nous avons vu deux fractales de la famille des fractales de Sierpinski basées donc uniquement sur des 
homothéties contractantes. Voyons maintenant une fractale qui combine rotation et homothétie 
contractantes. 


Dans fR* nous considérons les deux applications d'homothéties (h) de rotations (R) suivantes: 


Hs0.5 © RTE 0.9 H5 50.5 °RGS0S) (58-87) 


Avec un triangle et toujours avec Maple 4.00b, cela nous donne (si le copier/coller de la page web dans 
Maple 4.00b ne marche pas, réécrivez simplement le code): 


>transforme_triangle := proc(t, triangle) 
local i; 
[seq(transforme_point(t, triangleli]), i=1 .. 3)] 
end: 


>IFS := proc(n, liste_de_transformations,col) 
local i, j, k, s, sequence_de_triangles: 
options Copyright by Alain Schauber, 1996'; 
sequence_de_triangles := [[0, O0], [1, 0], [0.5, 1]]; 
for j to n do 
s := NULL; 
for i to nops(liste_de_transformations) do 
S:=S5, 
seq(transforme_triangle(liste_de_transformationslil, 
op(k, [sequence_de_triangles])), 
k=1 .. nops([sequence_de_triangles])) 
od; 
sequence_de_triangles := s 
od; 
plots[polygonplot]([sequence_de_triangles], axes-none, color-col, scaling=constrained) 
end: 
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>a:=evalf(5*Pi/6);b:=evalf(Pi/6); 

> c1x:=0.25;c1y:=0.5;c2x:=0.5;c2y:=0.5; 

> h1:=0.2;h2:=0.95; 

> spirale:=[[h1*cos(a),-h1*sin(a),h1*sin(a),h1*cos(a),(1-h1*cos(a))*c1x+h1*sin(a)*c1y, 
-h1*sin(a)*c1x+(1-h1*cos(a))*c1y],[h2*cos(b),-h2*sin(b),h2*sin(b),h2*cos(b), 
(1-h2*cos(b))*c2x+h2*sin(b}*c2y,-h2*sin(b}*c2x+(1-h2*cos(b))*c2y]]: 


>IFS(1,spirale,blue); 


et encore et comme la convergence est très longue, nous allons faire par pas de 5 itérations. 


>IFS(6,spirale,blue); 


>IFS(11,spirale,blue); 
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>IFS(16,spirale,blue); 


Nous obtenons après plusieurs centaines d'itérations le point fixe suivant: 
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1.6. FRACTALE DE VON KOCH 


Toujours, dans les fractales obtenues par homothéties (h) et rotations (R) contractantes mais auxquelles 


nous rajoutons en plus une translation (1), la courbe de Von Koch est une fractale assez connue, elle peut 
être obtenue par les applications suivantes: 


153 153 13 13 V3 _n-23 00 
kdo lin Tan °kon Ron ao io 0ÆRin (669) 


Donnons directement le résultat avec Maple 4.00b (si le copier/coller de la page web dans Maple 4.00b ne 
marche pas, réécrivez simplement le code): 
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>koch := proc(p:: numeric) 
local m, n, k, 1, 5, h, x, y, pts, t, i; 
h := 3(p); 
pts := table([]): # [0, 0]; 
pts[0]:=[0,01]; 


X:=0;y:=0; 

for n from 0 to (4/p) do 
m:= D; 
S:= 0; 


for 1 from 0 to p-1 do 
t:=irem(m, 4); 
m := iquo(m, 4); 
s := stirem((t+1), 3) - 1 
od; # end of for 1 
x := evalhf(x+cos(Pi*s/3)*h); 
y := evalhf(y+sin(Pi*s/3)*h); 
ptsIn+1]:=1[Xx, y]; 
od; 
[seq(ptsli], i-0 .. n-1)]; 
end: 


> plot(koch(0), scaling=constrained, style=-LINE, axes-NONE, color-blue,thickness=2); 


Figure: 58.36 - Ensemble de départ de la fractale de Von Koch 


> plot(koch(1), scaling=constrained, style=-LINE, axes-NONE, color-blue,thickness=2); 


Figure: 58.37 - Première itération de la fractale de Von Koch 


> plot(koch(2), scaling=constrained, style=-LINE, axes-NONE, color-blue,thickness=2); 
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Figure: 58.38 - Deuxième itération de la fractale de Von Koch 


> plot(koch(3), scaling=constrained, style=-LINE, axes-NONE, color-blue,thickness=2); 


Figure: 58.39 - Troisième itération de la fractale de Von Koch 


etc. etc. Jusqu'à obtenir l'attracteur suivant: 


Figure: 58.40 -Attracteur de la fractale de Von Koch 


Ce qui est aussi dérangeant avec la fractale de Von Koch c'est que nous partons d'une ligne de longueur 
finie, pour arriver à la fin à une ligne de longueur infinie si nous réitérons la structure à l'infini. Pourtant 
visuellement elle est finie. c'est une courbe "pathologique" comme disent parfois les mathématiciens 
dans le domaine. 


Effectivement, la première intuition conduit à penser que le périmètre de cette figure tend vers une valeur 
limite finie, puisqu'on ajoute des détails de plus en plus petits au fur et à mesure des itérations successives. 
En réalité, à la première itération la longueur L de chaque côté est remplacée par 4 segments de longueur 
L/3 ; À la deuxième, elle devient 16 L/9... À chaque itération la longueur est donc multipliée par 4/3, ce 
qui signifie que (contrairement à l'intuition première) la longueur d'une courbe de Koch tend vers l'infini 
pour un nombre d'itérations infini (série géométrique de raison 4/3). Et, pourtant, cette courbe ne déborde 
à aucun moment des limites constituées à l'extérieur par le cercle circonscrit au triangle initial, et à 
l'intérieur par le cercle inscrit dans ce triangle! En d'autres termes une surface de dimension finie est 
limitée par une frontière de longueur infinie. 


Cette courbe de Koch est légendaire, car elle a servi à Mandelbrot à écrire un article concernant le 
problème de mesure de la longueur des côtes des littoraux de mer (car plus l'unité de mesure de base prise 
était petite, plus le périmètre du littoral était grand). Il proposa de considérer les littoraux comme des 
fractales dont il est impossible de mesurer le périmètre mais bien "l'arborescence fractale", soit en d'autres 
termes: la dimension fractale. 
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Lorsque nous accolons trois courbes de Koch aux sommets d'un triangle équilatéral, nous obtenons une 
élégante figure à symétrie hexagonale dénommée flocon de Koch (ou Ile de Koch): 


Figure: 58.41 - Exemples de l'île de Koch 


1.7. FRACTALES NATURELLES 


Outre l'aspect purement mathématique des fractales, on peut via des méthodes heuristiques trouver les 
applications contractantes pour des fractales similaires aux formes que nous pouvons retrouver dans la 
nature. Voyons quelques exemples toujours avec Maple 4.00b en prenant d'abord pour base commune de 
toutes les fractales qui vont suivre, les procédures suivantes (si le copier/coller de la page web dans 
Maple 4.00b ne marche pas, réécrivez simplement le code). 


>transforme_point := proc(t, p) 
[LPO 2 FPE 5], L3Fp[11+- {4 pl21+ 61] 
end: 


transforme_triangle := proc(t, triangle) 
local i; 
[seq(transforme_point(t, triangleli]), i=1 .. 3)] 
end: 


transform_square := proc(t, square) 

local i; 

[seq(transforme_point(t, squarelil), i=1 .. 4)] 
end: 
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>IFS := proc(n, liste_de_transformations,col) 
local i, j, k, s, sequence_de_triangles: 
options Copyright by Alain Schauber, 1996'; 
sequence_de_triangles := [[0, O0], [1, 0], [0.5, 1]}; 
for j to n do 
s := NULL: 
for i to nops(liste_de_transformations) do 
S:= 5, 
seq(transforme_triangle(liste_de_transformationslil, 
op(k, [sequence_de_triangles])), 
k=1 .. nops([sequence_de_triangles])) 
od; 
sequence_de_triangles := s 
od; 
plots[polygonplot]([sequence_de_triangles], axes-none, color-col, scaling=constrained) 
end: 


> IFSS := proc(n, liste_de_transformations,col) 
local i, j, k, s, seq_square: 
seq_square :=[[0,0],[1,0],[1,1],[0,11]; 
for j to n do 
s := NULL: 
for i to nops(liste_de_transformations) do 
S:=S5, 
seq(transform_square(liste_de_transformations|i], 
op(k, [seq_square])), 
k=1 .. nops([seq_square])) 
od; 
seq_square := ss 
od; 
plots[polygonplot]([seq_ square], axes=none, color-col, scaling=constrained) 
end: 


1.7.1. RAMEAU 
On part de: 


>rameau:={[.387,.430,.430,-.387,.2560,.52201], [.441,-.091,-.009,-.322,.4219,.50591], 
[-.468,.020,-.113,.015,.4,.41]: 


Et on obtient: 


> IFSS(0,rameau, green); 
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Figure: 58.42 - Ensemble de départ de la fractale du rameau 


à 


Figure: 58.43 - Première itération pour la fractale du rameau 


_# 


Figure: 58.44 - Deuxième itération pour la fractale du rameau 


_® 


Figure: 58.45 - Troisième itération pour la fractale du rameau 


> IFSS(Lrameau, green); 


> IFSS(2,rameau, green); 


> IFSS(3,rameau, green); 


> IFSS(4,rameau, green); 
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Figure: 58.46 - Quatrième itération pour la fractale du rameau 


> IFSS(5,rameau, green); 


Figure: 58.47 - Cinquième itération pour la fractale du rameau 


> IFSS(6,rameau, green); 


Figure: 58.48 - Sixième itération pour la fractale du rameau 
1.7.2. FLOCON DE NEIGE 
On part de: 


> cristal:=[[.255,0,0,.255,.3726,.67141,[.255,0,0,.255,.1146,.22321, 
[.255,0,0,.255,.6306,.2232],[.37,-.642,.642,.37,.6356,-.0061]]: 


Et on obtient: 


> IFSS(O, cristal,green); 
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Figure: 58.49 - Ensemble de départ pour le flocon de neige 


> IFSS(1, cristal green); 


Figure: 58.50 - Première itération pour la fractale du flocon de neige 


>IFSS(2, cristal green); 


Figure: 58.51 - Deuxième itération pour la fractale du flocon de neige 


>IFSS(3, cristal green); 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Figure: 58.52 - Troisième itération pour la fractale du flocon de neige 


>IFSS(4, cristal,blue); 


Figure: 58.53 - Quatrième itération pour la fractale du flocon de neige 


>IFSS(, cristal,blue); 


Figure: 58.54 - Cinquième itération pour la fractale du flocon de neige 
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>IFSS(6,cristal,blue); 


>IFSS(7,cristal,blue); 


1.7.3. ARBRE 
On part de: 


> tree := [[-0.04, 0, -0.23, -0.65, -0.08, 0.26], [0.61, 0, 0, 0.31, 0.07, 2.5], 
[0.65, 0.29, -0.3, 0.48, 0.54, 0.39], [0.64, -0.3, 0.16, 0.56, -0.56, 0.4]]: 


> IFS(O, tree, green); 
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Figure: 58.57 - Ensemble de départ pour la fractale de l'arbre 


> IFS(1, tree, green); 


Æ 


” 


Figure: 58.58 - Première itération la fractale de l'arbre 


> IFS(2, tree, green); 


Figure: 58.59 - Deuxième itération pour la fractale de l'arbre 


> IFS(3, tree, green); 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


> IFS(4, tree, green); 


> IFS(5, tree, green); 


1.7.4. FOUGÈRE 


On part de: 


Figure: 58.60 - Troisième itération pour la fractale de l'arbre 
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Figure: 58.61 - Quatrième itération pour la fractale de l'arbre 
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Figure: 58.62 - Cinquième itération pour la fractale de l'arbre 
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> fougere:=[[0,0,0,0.16,0,0],[0.2,-0.26,0.23,0.22,0,1.6],[-0.15,0.28,0.26,0.24,0,0.44] 
,[0.85,0.04,-0.04,0.85,0, 1.61]: 


> IFS(0, fougere, blue); 


Figure: 58.63 - Ensemble de départ pour la fractale de la fougère 


> IFS(1, fougere, blue); 


Figure: 58.64 - Première itération pour la fractale de la fougère 


> IFS(2, fougere, blue); 


Figure: 58.65 - Deuxième itération pour la fractale de la fougère 


> IFS(3, fougere, blue); 
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Figure: 58.66 - Troisième itération pour la fractale de la fougère 


> IFS(4, fougere, blue); 


Figure: 58.67 - Quatrième itération pour la fractale de la fougère 


> IFS(5, fougere, blue); 


Figure: 58.68 - Cinquième itération pour la fractale de la fougère 


> IFS(6, fougere, blue); 
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Figure: 58.69 - Sixième itération pour la fractale de la fougère 


> IFS(7, fougere, blue); 


Figure: 58.70 - Septième itération pour la fractale de la fougère 


etc. Jusqu'à obtenir: 


Figure: 58.71 - Attracteur de la fractale de la fougère 


et nous allons nous arrêter ici car les exemples sont non dénombrables.. 
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2. FRACTALES À TEMPS D'ÉCHAPPEMENT 


Plusieurs méthodes ont donc été proposées pour construire des images fractales comme nous l'avons 
mentionné tout au début de ce chapitre. Nous allons donc maintenant nous intéresser aux méthodes dites 
"méthodes d'échappement". 


Pour cela, on se place dans le plan complexe formé des points M de coordonnées (x, y) d'affixe: 
Z=X+iÿ (58.89) 


où i représente le nombre complexe tel que: 


On considère une suite complexe définie par: 
u(0) =Zz, (58.91) 
et: 
ur +1)= fu(n)) (58.92) 


f étant une fonction continue complexe. On suppose que f a un point fixe x,, c'est-à-dire qu'il existe x, tel 
que: 


FX) = X (58.93) 


Il s'agit donc simplement de l'application du théorème du point fixe déjà mentionné plusieurs fois 
jusqu'ici. Sous certaines conditions sur f et sur Z,, on constate que la suite des points ne diverge pas (ce 


qui veut dire qu'on ne s'intéresse pas qu'aux points qui convergent mais à tous ceux qui ne divergent pas!). 
Cette méthode est à la base de la construction des ensembles de Mandelbrot et de Julia. 


Construire une image fractale à partir d'un ensemble de suites ainsi définies, revient à étudier pour chaque 
couple (x, y) du plan le comportement de la suite. On associe alors une couleur à chaque suite (c'est-à-dire 
à chaque couple (x, y)) représentant la "rapidité" de divergence de la suite. 


Pour étudier la convergence d'une suite, on regarde ses n premiers éléments, si on détecte que les 
conditions de divergence sont vérifiées alors on peut dire que cette suite diverge, sinon, cette suite est 
potentiellement convergente. On remarque que plus n est grand, plus les résultats seront précis (mais plus 
le temps de calcul sera grand). 


L'algorithme de base est le suivant: 
Fractal=proc(x, y) 


z:= Valeur de 70; 
j:=nombre max itérations 
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Tant que condition_de_divergence non vérifiée(z) et j non atteint faire 
z:=formule_iteration(z) 
changer de couleur; 

Fin Tant que 

Renvoyer couleur finale 


Fin Fractal 
2.1. ENSEMBLE DE MANDELBROT 


On construit l'ensemble de Mandelbrot grâce à des itérations dans le plan complexe (nous parlons alors de 
"dynamique holomorphe"). La fonction est de la forme: 


où c est un paramètre constant tel que « € €. Le premier terme de la suite est nul. On a donc la suite U 
définie par: 


2 _—— 
Z"0etz nu "Z te (5895) 


Pourquoi commence-t-on avec Z = 0 ?: Car zéro est le point critique de z? +&, c'est-à-dire le point qui 
satisfait à l'extremum: 


diz? +c) . 
dz 


0 (58.96) 


Pour chaque point d'affixe x+iy du plan, on étudie la suite U pour € = x +iy. Si la suite diverge, on dit que 
le point testé n'appartient pas à l'ensemble M, si la suite converge, on dit que le point appartient à M. 


Pour reproduire l'ensemble de Mandelbrot, on associe à c des valeurs du plan complexe. On considère 
généralement la portion du plan complexe ayant comme partie réelle, les valeurs entre -2.5 et 1.5 et 
comme partie imaginaire, les valeurs entre -1.5 et 1.5. Cette portion du plan complexe est subdivisée de 
façon à former une grille dont les éléments seront associés à des valeurs de C. Pour chaque valeur de C, on 
obtient une suite dont les modules peuvent converger ou diverger. 


En pratique, on considère que la suite des modules converge si les 30 premiers modules sont inférieurs à 
2. Lorsque la suite des modules converge, on colorie en noir le point de la grille. Après avoir considéré 
tous les points de la grille, on obtient un ensemble de points noircis: "l'ensemble de Mandelbrot" noté M. 
Ce qui constitue un résultat remarquablement curieux! 
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La liste des z; générés par l'itération s'appelle "l'orbite" de z,;. 


On peut colorier les points à l'extérieur de l'ensemble de Mandelbrot en utilisant des couleurs qui 
dépendent du nombre de termes calculés avant d'obtenir un module supérieur ou égal à 2. Les points d'une 
même couleur peuvent être interprétés comme étant des points s'éloignant à la même vitesse de l'ensemble 


de Mandelbrot. 


On peut aussi faire une incursion dans l'ensemble de Mandelbrot en utilisant Maple 4.00b (disponible 
habituellement au collège). Il suffit de copier le programme ci-dessous sur une feuille de travail du 
logiciel et d'indiquer à la place de -2 .. 1, -1.5 .. 1.5 de la dernière ligne, l'étendue des parties réelles et 


imaginaires de c que l'on désire visualiser: 


>restart: with(plots): 

>couleur:=proc(a,b) 

local x, y, xi,yi,n; 

X:=a; 

Yi=b; 

for n from 0 to 30 while evalf(x\2+y12) < 4 do; 
xi:=evalf(x\2-y\2+a); 
yi:=evalf(2*x*y+b); 
X:=Xi; 
Y:=YE 

od; 

n 

end: 


>plot3d(0,-2..1,-1.5..1.5,orientation-[-90,0],style-patchnogrid, 
scaling=constrained,axes-framed,numpoints=20000,color-couleur); 


Vous obtiendrez dès lors le résultat ci-dessous: 
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: 3515/4839 


Figure: 58.73 - Ensemble (fractale) de Mandelbrot avec Maple 4.00b 


Pour information, le domaine de l'analyse complexe qui étudie des systèmes dynamiques s'intéressant 
principalement à l'étude d'itérations d'applications holomorphes (cf. chapitre d'Analyse Complexe) se 
nomme la "dynamique holomorphe". 
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Remarques: 


R1. L'ensemble de Mandelbrot est auto-similaire dans le voisinage de points dits "points de 
Misiurewicz": 


R2. Il paraît qu'on peut démontrer (je cherche la démonstration.) que la fractale de Mandelbrot peut 
être mise en correspondance avec le diagramme de bifurcation que nous avons étudié dans le chapitre 
de Dynamique des populations tel que: 
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2.2. ENSEMBLES DE JULIA 


L'ensemble de Julia se construit presque de la même façon que l'ensemble de Mandelbrot (puisque 
l'ensemble de Julia en est en fait un sous-ensemble!). Dans l'ensemble de Mandelbrot, c balaye le plan. 
Pour l'ensemble de Julia, c est fixé pendant tout le calcul de l'image. À chaque c correspond donc un 
ensemble particulier que l'on notera J(c) et qui est donc "l'ensemble de Julia". Ce qui varie, c'est Z,, qui 


prend la valeur du point à tester. C'est donc z; qui balaie le plan. 


Le point À de coordonnées (x, y) et d'affixe x + iy appartient à J(c) si et seulement si la suite définie par: 


- Ë 1.2 ne 
Zo xXtiV et Z,;y = Z, TE (58.97) 


converge. 


En fait, l'ensemble de Mandelbrot est l'ensemble des points c tels que l'ensemble de Julia de paramètre c 
soit connexe (donc l'ensemble de Mandelbrot généralise tous les ensembles de Julia!!!). Donc la figure de 
l'ensemble de Mandelbrot contient les figures de tous les ensembles de Julia, ce qui est remarquable (mais 
aussi logique...!): 


Si à nouveau nous développons l'algorithme, nous obtenons à un facteur d'échelle près donné, la fractale 
représentée ci-dessous (obtenue grâce au petit programme Maple 4.00b modifié utilisé pour la fractale de 
Mandelbrot): 


restart; with(plots): 

julia:= proc(c,x, y)local z, m; 

z:= evalf(x+y*T); 

for m from 0 to 30 while abs(z) < 3 do 
Z:= ZN2 +0 
od; 
m 

end: 


J:= proc(d) 

global phonyvar; 

phonyvar:= d; 

(x, y) > julia(phonyvar, x, y) 
end: 


plot3d(O, -2 .. 2, -1.3 ..1.3, style-patchnogrid,orientation-[-90,0], grid=[270, 270],scaling=constrained, 
color=J(-1.25)); 
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Ï re: 58.74 - Ensemt 


gt 


et pour montrer que l'ensemble de Mandelbrot contient tous les ensembles de Julia: 


à, 
T2. { y 
y i 
El, N 
7 ag 
4 + 
7 RE A 
; kr. * VA 
€ Ne Q 


Figure: 58.75 - Illustration de la paternité... de l'ensemble de Mandelbro 
Nous devons donc pouvoir écrire un unique algorithme (voir plus bas) qui permette d'obtenir tous les 
ensmbles de Julia en choisissant simplement bien le point de départ comme le montre les figures ci- 
dessous: 
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zy =—0.414 — 0.612; zp = 0.382 + 0.147: 


et ainsi de suite... 


Zo = 0.284 -0.0122: 


Obtenu donc avec l'algorithme Maple 4.00b suivant: 
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couleur:=proc(a,b) 

local x,y,xi,yi,n; 

global reel imaginaire; 

X:=a; 

y:=b; 

for n from 0 to 100 while evalf(x12+y12)<4 do; 
xi:=evalf(x\2-y12+reel); 
yi:=evalf(2*x*y+imaginaire); 
X:=Xi; 

Y:=YE 

od; 

D; 

end: 


reel:=-0.181; 
imaginaire:=-0.667; 


plot3d(0,(-13/10)..(13/10),(-13/10)..(13/10),orientation-[-90,0], 
style=patchnogrid,scaling-constrained,axes-framed,numpoints=20000,color-couleur); 


2.3. ENSEMBLES DE NEWTON 


Les ensembles de Newton sont ainsi appelés car ils découlent de la résolution du problème de la recherche 
des zéros d'une fonction par la méthode de Newton. 


Soit une fonction f à valeur dans €, et dérivable dans €, on prend z; dans € tel que: 


ons 1 @)) oo 

#+1 M pis, | (8.9, 
JF) 

Il y a alors deux manières de procéder: 


1. Soit nous nous intéressons à (20 “E | et alors nous faisons comme précédemment 


2. Soit nous nous demandons vers quel zéro #; la suite converge et nous nous intéressons à {z; - Z | 


Si à nouveau nous développons l'algorithme, nous obtenons à un facteur d'échelle près donné, la fractale 
représentée ci-dessous obtenue à nouveau avec Maple 4.00b: 


restart: 
newton:= proc(x, ÿ) 
local z, m; 


z:= evalf(x+y*T); 

for m from 0 to 50 while abs(z/3-1) >= 0.001 do 
Z:= Z - (Z13-1)/(3*z/2) 

od; 
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plot3d(0, -2 .. 2,-1.5 .. 1.5, orientation=[-90,0],grid=[250, 250], style-patchnogrid, 
scaling=constrained,color-newton); 


Figure: 58.76 - Ensemble de Newton (fractale) avec Maple 4.00b 
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Notes personnelles: 
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59. SYSTÈMES LOGIQUES FORMELS 


2 e lecteur connaissant bien l'objectif de ce site ne doit pas s'attendre à voir ici de quelconques 


schémas de boutons poussoirs, interrupteurs, chronogrammes ou encore de schémas électriques de 
norme MIL ou autres. Nous resterons donc dans un cadre purement formel des systèmes logiques et 
de leurs outils. 


Définitions: 


D1. Nous parlons de "modèle logique asynchrone" (couramment appelé "modèle logique 
séquentiel") lorsque les sorties d'un système dépendent de l'ordre chronologique dans lequel se 
succèdent les entrées. 


D2. Nous parlons de "modèle logique combinatoire" lorsque les sorties d'un système dépendent 
uniquement de la combinaison des variables d'entrées. 


Remarque: Nous différencions la "logique stricte" de la "logique floue" qui seront toutes deux 
définies dans les détails plus loin. 


LOGIQUE STRICTE 


Considérons dans un premier temps un ensemble que nous noterons B à deux éléments {0,1} (plus 


formellement notés {-L T} ). 
Définitions: 


D1. Une "variable logique stricte" ou "variable booléenne" est un élément de B qui ne possède que 
deux états 0 et 1 (à l'opposé d'une variable logique floue dont la valeur peut être comprise entre O et 
1). Elle est représentée par des lettres latines majuscules ou minuscules (au choix). 


D2. Une "fonction logique F" de plusieurs variables applique 8 x & x 8... dans B. Elle associe à un 
n-uplet de variables logiques (à.à.....8,1) une valeur F(&.h...8,2). 


D3. Il existe différentes manières d'exprimer une fonction logique (ou "fonction booléenne"). Une 
fonction de n variables est entièrement décrite par l'énoncé des valeurs de cette fonction pour 
l'ensemble (ou le sous-ensemble de définition) des combinaisons du n-uplet de variables: 


F(0,..,0,0),F(0...,0,1),F(0,..,1,0),.,F(1.,11) (59.1) 


Cet énoncé prend généralement la forme d'un tableau à n+1 colonnes et au plus 2* lignes, chaque 
ligne exposant une combinaison des variables et la valeur correspondante de la fonction. Le tableau 
suivant donne la forme générale d'une "table de vérité" de fonctions de trois variables totalement 
(fonction F) définies: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


C F(A,B,C) 
0 F(0,0,0) 
1 F(0,0,1) 
0 F(0,1,0) 
1 F(0,1,1) 
0 F(1,0,0) 
1 F(1,0,1) 
0 F(1,1,0) 
1 F(1,1,1) 


nihirihleoel sl slt 
=lmlolslrlrls 2° 


Les éléments d'entrées des systèmes seront considérés comme des variables booléennes sur 
lesquelles nous pouvons construire une structure de base en anneau que, par ajout d'un axiome 
particulier, nous pouvons munir d'une "algèbre" (dans le sens calculatoire du terme et non 
ensembliste!) appelée couramment "algèbre de Boole". 


ALGÈBRE DE BOOLE 


L'algèbre de Boole (ou "anneau de Boole" à un axiome près...) est donc une structure qui est le plus 
souvent utilisée en électronique (ou micro-électronique). Ainsi, un processeur est composé de 
transistors permettant de réaliser des fonctions sur des signaux numériques. Ces transistors, 
assemblés entre eux forment des composants permettant de réaliser des fonctions très simples. À 
partir de ces composants il est possible de créer des circuits réalisant des opérations assez complexes. 
L'algèbre de Boole (du nom du mathématicien anglais George Boole 1815 - 1864) est un moyen 
d'arriver à créer plus ou moins facilement de tels circuits. 


L'algèbre de Boole est donc une algèbre sur elle-même (avec une structure d'anneau comme nous 
allons le définir rigoureusement plus loin) se proposant de traduire des signaux dont la valeur est du 
type 0/1 (assimilé à: Vrai/Faux) en expressions mathématiques. Pour cela, nous définissons chaque 
signal élémentaire par des "variables logiques" et leur traitement par des "fonctions logiques". Des 
méthodes ("tables de vérité") permettent de définir les opérations que nous désirons réaliser, et à 
transcrire le résultat en une expression algébrique. Grâce à des règles que nous verrons plus loin, ces 
expressions peuvent être simplifiées. Cela va permettre de représenter grâce à des symboles simples 
un circuit logique capable d'effectuer des opérations arithmétiques élémentaires, c'est-à-dire un 
circuit qui schématise l'agencement des composants de base (au niveau logique) sans se préoccuper 
de la réalisation au moyen de transistors (niveau physique). 


Remarque: Il serait préférable avant de commencer la lecture de ce chapitre, de parcourir la 
partie traitant de la logique au chapitre de la Théorie De La Démonstration et des structures 
algébriques dans le chapitre de Théorie Des Ensembles. 


Il est nécessaire pour obtenir une définition rigoureuse d'une algèbre de Boole de se la donner en des 
termes d'algèbre abstraite. 


Rappel: une "algèbre de Boole" est un ensemble (B,V,A) contenant deux éléments particuliers, 
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T,L, (formes abstraites du 0 et du 1) muni de deux lois de composition internes, A, V (ET et OU 


logiques) et qui vérifie les axiomes suivants pour former une structure d'anneau telle que 
Va.b,ce B: 


A1. (aVb)Vc=aV(BbVe) et (aAb)Ac=aA(bAc) (associativité) 
A2.aVWb=bVa et ahb=Bb/.a (commutativité) 

A3. a A(aVb)=a et a Va Ab)=a (absorption) 

A4. (a VB) Ac =(a Ac) VB Ac et(a Ab) Ve =(aVc)A(bVe) (distributivité) 
A5.aVa=aeta/\a=a (idempotence) 


A6. a possède un complément noté 4 ou 4 (NON) tel que: & Ÿ 4 =T et & À a =L 
(complémentation" ou "inversion" 


Remarque: Les quatre premiers axiomes établissent une structure d'anneau. Le cinquième axiome 
(idempotence) ajouté aux quatre premiers définit le concept "d'algèbre de Boole". 


Rigoureusement, pour former une algèbre de Boole il faut un élément symétrique (cf. le chapitre de 
Théorie Des Ensembles) ce qui n'est pas le cas de l'opération Y. C'est la raison pour laquelle les 


vrais opérateurs d'une algèbre de Boole sont normalement le /\ (ET) et la À (différence symétrique) 
donnée par l'opération logique: 


xl = (x ÿ)V(yAX) (592) 


mais pour simplifier, dans les petites classes, il est fréquent que nous y fassions implicitement 
référence sans entrer dans les détails. 


Il s'ensuit que l'ensemble binaire À = {0,1} constitue donc bien par rapport aux lois /\,V un "groupe 
abélien". Dès lors, (7, } étant un groupe abélien, la loi /\ étant associative et distributive par 


rapport à Ÿ, (8,V,Â) est un "anneau commutatif unitaire" (vu que B possède un élément neutre 
pour la loi W). 


Remarques: 


R1. Ainsi, les opérations /\ et V'admettent chacune un élément neutre tel que le chiffre 1 est 
l'élément neutre de /\ et le chiffre 0 l'élément neutre de 


R2. Les deux opérations que nous utilisons habituellement pour former une algèbre de Boole 
sont le "ou inclusif" noté rigoureusement * mais plus fréquemment par le signe d'addition "+", 
et le et "et inclusif" noté rigoureusement /\ mais plus fréquemment par le signe de 


multiplication ":". 


Les axiomes précédents peuvent cependant se démontrer à partir des "axiomes de la définition": 
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A1. T= 1 

A2.L=-7T 

A3. --a = & = a (double complémentation) 
A4. T est l'élément neutre de la loi /\ 


A5. L est l'élément neutre de la loi V 


A6. {a VB) = a Ab et {a Ab) = a V—b (ces deux dernières formulations forment le 
théorème de De Morgan). 


Remarque: Le théorème de De Morgan se démontre à l'aide d'une simple table de vérité ou 
algébriquement comme nous le verrons juste un peu plus loin. 


Il s'ensuit donc le tableau suivant: 


0‘0=0 
1+1=1 
l'I=i 
Ü+0=0 
1:0=0 
D+i=] 
=] 
( 


Verres on duale 
jerresi duale 


ler sion duale 


expression duale 


LR | 


Nous appelons ces expressions "duales" car en remplaçant dans une même équation logique, les 0 
par 1, les : par des + est inversement, cette équation reste vérifiée. 


Voyons maintenant ce que nous appelons le "théorème des constantes" qui consiste à prouver que: 


a'0=0 
a'l=a 

(59.4) 
a+t0=a 


a+l=]l 
La démonstration est triviale (au besoin faire une table de vérité) car elle provient de la propriété 
même du concept "d'anneau" (de Boole) et de son élément neutre (1) par rapport au /\ et à son 
élément neutre (0) par rapport au VW . 


Démontrons maintenant la relation suivante: 


a+äb=@+b (595) 
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Démonstration: 
La distributivité nous amène à écrire: 

a + ab = (a +a)(a +b) (59.6) 
et en appliquant la complémentation: 

(a+a)(a+b)=1(@+b) (597 
en appliquant la commutativité: 

la +b)=(a+b)l (508) 

et enfin en appliquant le théorème des constantes: 


(atbjl=at+tb (599) 


OIC.Q.F.D. 


Cette démonstration va nous permettre de démontrer le fameux "théorème du consensus": 


g'stbTtg'h=g"xztb"t 
_ (59.10) 
(a+x)'(b+x) (a +b)=(a+x) (b+x) 
Démonstration: 
Pour vérifier le théorème du consensus relatif au produit logique: 


d-x+b X+ab=a.x+b.X7 (59.11) 


nous pouvons faire usage d'un diagramme de Venn où nous voyons bien que le terme & à est 
contenu dans les deux autres: 


Figure: 59.1 - Diagramme de Venn du théorème du consensus 
En procédant de même avec un diagramme de Venn, le lecteur verra sans aucun problème que: 


(a+x) @+x)'(at+b)=(a+x) (B+X) (59.12) 


[IC.Q.F.D. 


Et enfin les très fameux "théorèmes de Shannon" (à ne pas confondre avec le théorème de Shannon 
en théorie du signal!): 


ath=a'b+a b+a'b 


a'b={a +b) (a+B) (a+) 


Démonstrations: 
atb=ab+a b+a'b 
=ab+a b+a b+ab 
=a (b+b)+b (a +a) 
=a'l+b:] 
=at 

et: 


CU CES) 

= (aa + ab + ab +bb):(a +2) 
=(a+a( (+2) }+0): (a +b) (59.14) 

=(a+ta:1+0) (a +b) 


= 4" (a +b)= a'ata'b=a'b 
COIC.Q.F.D. 


Revenons maintenant sur les théorèmes de De Morgan précédemment présentés comme des 
axiomes: 


Ces deux relations expriment donc que l'inverse (ou l'opposé) d'un produit (respectivement de la 
somme) de deux variables est égal à la somme (respectivement au produit) des inverses de ces 
variables. 


Démonstration: 


Supposons (4 +à)=4:à juste. Alors en vertu des relations & +4 =1 et «4 = D (axiome de 
complémentation) nous devons avoir: 


Donc il nous faut prouver que ces deux relations sont exactes: 


(a+b)+a'b =(a+b+a)a+bh+b)=(a+a+bl(a+b+b) —. 
(59.17) 


= (1+b){a +1) =1 


et: 
(a+b):3 b =a a b+a bb =0 (59.18) 


Le deuxième théorème de De Morgan se démontre de la même façon. 
[IC.Q.F.D. 


Remarque: Ces deux théorèmes peuvent s'étendre à un nombre quelconque de variables. 


Corollaires: 
a b=a+b 
at =3"b 
nr 
(59.19) 
atb=at+b 


Les expressions logiques, nous l'avons vu à l'aide des axiomes, propriétés et particulièrement des 
théorèmes précédents, doivent donc toujours pouvoir se mettre sous deux formes (en jouant avec les 


oppositions — aussi donc): 
F1. Sous la forme d'une somme de produits logiques, appelée "forme normale disjonctive F.N.D.", 


tel que (exemple): 


Les termes constitutifs de ce polynôme sont les monômes 4.&.4,4.c.4.Les variables ou 
d. 


complémentaires de ces monômes sont les "lettres" 7,5 ,d,c, 


Remarque: Si chacun (tous) des produits contient toutes les variables d'entrée sous une forme 
directe ou complémentée, alors la forme est appelée "première forme canonique" ou "forme 


canonique disjonctive". Chacun des produits est alors appelé "minterme". 


F2. Sous la forme d'un produit de sommes logiques, appelée "forme normale conjonctive F.N.C.", tel 


que (exemple): 


F-[]D()-(a+e +4) (a+c+d) on 
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Remarque: Si chacune des sommes contient toutes les variables d'entrée sous une forme directe 
ou complémentée, alors la forme est appelée "deuxième forme canonique" ou "forme canonique 
conjonctive". Chacune des sommes est alors appelée "maxterme". 


Ainsi, une forme normale disjonctive est soit un littéral (une lettre), soit une disjonction de formules 
écrites comme conjonctions de littéraux. Une forme normale conjonctive est soit un littéral, soit une 
conjonction de formules écrites comme disjonctions de littéraux. 


Les méthodes de simplification que nous verrons par la suite viseront à minimiser le nombre de 
lettres des expressions de manière à réduire le nombre d'entrées de notre système logique. 


Remarque: La simplification algébrique d'une expression consiste à la transformer de manière à 
réduire au maximum le nombre de ses lettres en lui appliquant les théorèmes vus précédemment. 


Pour simplifier les expressions (ou les déterminer) une technique connue consiste donc à utiliser les 
"tables de Karnaugh" que nous verrons plus loin dans les détails. 


FONCTIONS LOGIQUES 


Donc quand nous parlons d'algèbre de Boole sauf mention contraire, nous faisons référence aux trois 
opérations booléennes élémentaires (ET, OÙ, NON) et quelques autres fonctions logiques qui en 
découlent dont voici les symboles tels que définis en théorie des circuits (norme MIL sauf erreur..): 


DL D D LL À 


Figure: 59.2 - Portes logiques 


ZA 


et leurs "tables de vérité" respectives: 


Tableau: 59.3 - Table de vérité OÙ 
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| Table de vérité NON (7) 


Tableau: 59.4 - Table de vérité NON 


Toutes les autres "fonctions logiques" connues (communes) peuvent être composées de ces deux 
opérateurs fondamentaux. Tels que par définition (données avec leur définition standard dans la 
première ligne et avec leurs différentes formes algébriques sous leur table de vérité respective) 


(aAb)=(ab)=3 +8 


NON-ET (NAND): NON (a ET b) 


Tableau: 59.5 - Table de vérité NON-ET 


“(a Vs)=(a+b)=3"b 
NON-OU (NOR): NON (a OÙ b) 


Tableau: 59.6 - Table de vérité NON-OU 


a®@b={aVB)A-(aAb)=(a+b) (ab) 
a®Dbh=ah b+bAa=a b+bz 
a®b=(ahb+-u A Ë)=ab+ab 
| OÙ EXCLUSIF (XOR): [a OU bJET[ NON (aETb)] 
| RS 
RE © | : 
PT | 1 | 0 


Tableau: 59.7 - Table de vérité OU EXCLUSIF 


où a et b sont, vous l'aurez compris, des variables (ou "bit" de Binary Digit) pouvant prendre 
arbitrairement les valeurs binaires 0 ou 1. 


Remarque: La fonction logique XOR est souvent notée dans la littérature par l'opérateur (Œ) et 
nous considérerons comme évident que le XOR est également une loi de groupe et permet de 


construire ainsi un groupe commutatif abélien. Cette propriété du XOR est particulièrement 
utilisée en cryptographie. 
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TABLES DE KARNAUGH 

À part la table de vérité qui simplifie en général la présentation d'un problème logique 
(mathématique, électronique, micro-électronique, fiabilité des systèmes), il existe d'autres formes 
tabulées en particulier la table de Karnaugh qui est dans de nombreux cas un outil de travail facile à 
manipuler. 

Considérons pour exemple la fonction: 


F=ab+ab+ab 


(sous forme F.N.D) et sa table de vérité respective: 


b 
0 
0 
1 
1 


Holrlols 
ml olnlt 


La table de Karnaugh est définie par une représentation comme celle ci-dessous: 


La table de Karnaugh d'une fonction logique comporte donc autant de cases que de combinaisons 
possibles de variables qui la composent, soit quatre cases pour une fonction à deux variables, et 2* 
cases pour une fonction à n variables. Chaque case, qui se trouve à l'intersection d'une ligne et d'une 
colonne de la table de Karnaugh porte l'état O ou 1 que prend la fonction pour le produit logique 
correspondant des variables (mintermes). 


Dans l'exemple précédent nous pouvons voir cependant quelque chose d'intéressant, la fonction F, 
nous le voyons très bien, peut se simplifier de deux manières: 


F=b+ab 
ou encore: 
F=ab+x 


Cette simplification possible ce fait toujours avec deux mintermes adjacents dans la table de 
Karnaugh tels que: 


Figure: 59.4 - Table de Karnaugh associée 


Nous voyons que le premier regroupement/simplification (horizontal) se fait sur la ligne & et le 
second regroupement/simplification (vertical) se fait sur la colonne b tous deux résultats de la 
simplification algébrique de la fonction. 

Donc nous pourrions émettre l'hypothèse que la table de Karnaugh a pour propriété: 


P1. De nous donner la forme disjonctive normale d'une fonction. 


P2. Que toutes cases adjacentes mises ayant pour valeur 1 peuvent se simplifier en la lettre respective 
de leur réunion. 


C'est donc un outil extrêmement puissant pour simplifier et déterminer des fonctions logiques. 


Voyons un exemple à trois variables: 


ae LL OO [HE 


An. 
"ll | æ&) [le [ae | 
{ l 0 0 fl l 
& = Le = 
abc abc ai abc 


Figure: 59.5 - Table de Karnaugh à trois variables 


La F.N.D est donc F = Ghz + &be + &be + abc + abc +abe mais elle peut se simplifier 
algébriquement sous la forme Æ = 5 + bc + mais nous voyons que ceci peut encore se simplifier 
en F=h+.. où nous voyons que les quatre cases adjacentes sont là où b vaut partout 1. 


Une autre manière de simplifier: 


Figure: 59.6 - Ta de Karnaugh à trois variables avec autre méthode de simplification 
Donne F= +4. 


Une difficulté subsiste cependant avec cette technique: comment choisir la meilleure construction du 


tableau (choix des lettres en colonnes ou en ligne) ? 


Au fait, il existe une manière spécifique qui consiste à associer la règle de complémentation de 
l'algèbre de Boole avec ce que nous appelons le "code de Gray". 


Définition: Dans le code de Gray, deux termes successifs ne diffèrent que par un seul bit. Les termes 
ne différant que par un seul bit sont appelés "adjacents". 


En utilisant le code de Gray nous pouvons créer des tables de Karnaugh optimales. La raison en est 
simple, le code de Gray ne change qu'un bit à la fois à chaque incrémentation. En pratique ceci 
signifie que pour deux valeurs qui se suivent, un et deux par exemple, une des deux variables sera le 
contraire. 


BExemple: 


Soit 1=01 correspondant à ba et 2 = 11 correspondant à ba, la somme (forme disjonctive) nous 


donnerait donc F = ab+ab ce qui se réduit à l'aide de la règle de complémentation directement à 
F=a. 


Tout cela pour dire que quand deux formules se retrouvent côte à côte dans le tableau de Karnaugh, 
nous conservons des éléments semblables seulement. 


Les règles sont telles que nous pouvons réduire quand (voir l'exemple concret précédant): 


R1. Deux 1 sont juxtaposés dans le tableau: 


© [00 [01 [112467 


Le TT | | 
11,2. 11 1 


Figure: 59.7 - Premier type de réduction possible 


1 


R2. Quand deux 1 sont aux extrémités du tableau: 


[__IBAIBA]BA]BA| 
CE [00 Loi Li Lio 
D'ou 
RL 


Figure: 59.8 - Deuxième type de réduction possible 


R3. Quand une rangée pleine fait disparaître les deux variables BA dans ce cas: 


L11111]13 
Mb mai LS amd 


Figure: 59.9 - Troisième type de réduction possible 


R4. Une colonne pleine fait disparaître deux variables DC dans ce cas: 
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et sauf erreur... c'est tout mais c'est déjà pas mal. 


OPÉRATIONS ARITHMÉTIQUES 


À l'aide de tous les éléments démontrés et donnés précédemment, nous sommes maintenant capables 
de déterminer rigoureusement la fonction logique permettant l'addition et la soustraction booléenne. 
Rappelons aussi que ceci étant fait, nous pouvons construire la multiplication et la division à l'aide 
respectivement de l'addition et de la soustraction. 


Cependant, nous ne pouvons avec les systèmes numériques formels construire des éléments 
permettant l'intégration et la différenciation. Pour cela, nous renvoyons le lecteur au chapitre 
d'Électrocinétique où il est montré comment utiliser des inductances et des condensateurs pour 


effectuer de telles opérations avec des signaux. 


Remarque: Nous travaillerons sur des nombres entiers mais le lecteur doit se rappeler que les 
nombres rationnels peuvent toujours être augmentés en puissance pour être représentés de 
manière entière (reste après à effectuer l'opération inverse au besoin). 


La somme de deux bytes sera notée S, la retenue €, (retenue sortante) et la retenue reportée €, 
(retenue entrante). 


La table de vérité sera construite avec pour astuce que les entrées du système (4,2, C, ) prennent 
toutes les valeurs possibles sur 3 bits (trois lettres) soit 2° = 8 lignes que nous avons représentées 
dans la table suivante: 


Tableau: 59.9 - Identifications des retenues reportées pour la somme de bits 
et maintenant l'idée consiste à rajouter la colonne constituée par la somme: 


S=C,tatb (5925) 


ligne par ligne (sans penser à la retenue sortante €; que nous allons voir un tout petit peu plus loin): 
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Tableau: 59.10 - Retenues reportées pour la somme de bits 


Maintenant, ligne par ligne, nous rajoutons la retenue sortante €; (qui n'est autre que la valeur qui 
est envoyée à la retenue entrante de la ligne suivante) de la somme S: 


DODDDER 


Tableau: 59.11 - Identification des mintermes de la somme 


Il vient alors quatre mintermes (c'est-à-dire les termes pour lesquels S est non nul aux lignes 2,3,5,8) 
tel que la F.N.D s'écrive: 


S = Cab+Cab + Cab + Cab (5926) 
Une simplification possible est: 
S=C,(ab +ab)+C,(ab +ab)=C, a+Ca=C®a=C,Ba®b (5927 
Il vient également pour la retenue sortante les mintermes suivants: 
C, = Cab + Cab + Cab +Cab=ab+C: (ab +ab) =ab+C'a@b (59.28) 
Donc finalement nous avons: 


S =C, Da ®b 


C, =ab+C,ra@b °°°? 


5 


Remarque: La table de vérité de l'addition sans retenue entrante est appelée "demi-additionneur". 


La soustraction (différence) de deux bytes sera notée D, l'emprunt #, (emprunt sortant) et l'emprunt 
reporté & (emprunt entrant). La table de vérité sera construite avec dans un premier temps comme 
pour l'addition. C'est-à-dire que les entrées du système (4,, €, ) prennent toutes les valeurs possibles 
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sur 3 bits (trois lettres) soit 2° =8 lignes. Ainsi: 


Tableau: 59.12 - Identifications des emprunts reportés pour la soustraction de bits 


Mais nous allons rajouter une petite subtilité. Plutôt que de nous ennuyer à calculer D =a-b-e,, 
nous allons calculer = 4 +(-à)+(-e,) de manière à travailler avec la table de vérité ci-dessous: 


Tableau: 59.13 - Inversion des emprunts reportés pour la soustraction de bits 


et maintenant l'idée consiste à rajouter la colonne de différence 2 = & + (-à)+(-e,) ligne par ligne 


(sans penser à l'emprunt &, ) qui sera strictement identique à la table de vérité de la somme: 


Tableau: 59.14 - Emprunts reportés pour la soustraction de bits 


Maintenant, ligne par ligne, nous rajoutons l'emprunt sortant de la différence À = & +(-b)+(-e,) 
qui écrite ainsi, devient donc une somme S: 


Tableau: 59.15 - Identification des mintermes de la soustraction 


Il vient alors quatre mintermes (c'est-à-dire les termes pour lesquels D est non nul aux lignes 2,3,5,8) 
tel que la F.N.D s'écrive: 


D =&,ab +8,ab +e,ab +e,ab (5930) 
Une simplification triviale possible est: 
D=E, (ab +ab) +e, (a + ab) =e Da@b (5931) 


Il vient également pour l'emprunt sortant les mintermes suivants: 


8, =&,äbt+te ab +te,äb+teab=äbte, ‘(a GE) 


Donc finalement: 


D=e Oa@b 
e,=äabte, (a®b) 


Remarque: La table de vérité de la soustraction sans emprunt entrant est appelée "demi- 
soustracteur". 


LOGIQUE FLOUE 


La plupart des problèmes rencontrés sont modélisables mathématiquement. Mais ces modèles 
nécessitent des hypothèses parfois trop restrictives, rendant délicate l'application au monde réel. Les 
problèmes de ce monde doivent tenir compte d'informations imprécises, incertaines. Prenons 
l'exemple d'une climatisation: si nous voulons obtenir une température fraîche, nous pouvons nous 
demander quelle gamme de températures conviendra (la demande est imprécise); de plus la fiabilité 
des capteurs entre en jeu (la mesure de la température ambiante est incertaine). Nous voyons 
apparaître la difficulté d'interprétation des variables linguistiques comme frais, chaud, ainsi que du 
traitement de ces données entachées d'incertitude. 


Une approche fut développée à partir de 1965 par Loft. A. Zadeh, professeur à l'Université de 
Californie à Berkeley, basée sur la théorie des sous-ensembles flous ("fuzzy sets" en anglais), 
généralisant la théorie des ensembles classiques. Dans la nouvelle théorie de Zadeh, un élément peut 
plus ou moins appartenir à un certain ensemble. Les imprécisions et les incertitudes peuvent ainsi 
être modélisées, et les raisonnements acquièrent une flexibilité que ne permet pas la logique 
classique: la "logique floue" était née. De nombreuses applications se sont alors développées dans 
divers domaines, là où aucun modèle déterministe n'existe ou n'est pratiquement implémentable, 
ainsi que dans des situations pour lesquelles l'imprécision sur les données rend le contrôle par des 
méthodes classiques impossible. 


Dans ce qui suit, nous développerons d'abord la théorie des sous-ensembles flous, puis nous 
préciserons le raisonnement en logique floue, nous examinerons les méthodes d'exploitation des 
résultats obtenus, et enfin nous verrons une application effective. 


Avant de passer au côté formel de la chose (mathématiquement parlant) il peut être préférable 
(puisqu'il s'agit quand même d'une technique de l'ingénieur) de présenter brièvement les concepts de 
la logique floue de manière imagée. 


La logique floue est une technique utilisée dans des domaines aussi variés que l'automatisme (freins 
ABS), la robotique (reconnaissance de formes), la gestion de la circulation routière (feux rouges), le 
contrôle aérien, l'environnement (météorologie, climatologie, sismologie), la médecine (aide au 
diagnostic) et bien d'autres. 


À l'inverse de la logique booléenne, la logique floue permet à une condition d'être en un autre état 
que vrai ou faux. Il y a des degrés dans la vérification d'une condition. 


Considérons par exemple la vitesse d'un véhicule sur une route nationale. La vitesse normale est de 


90 [km/h]. Une vitesse peut être considérée comme élevée au-dessus de 100 [km/h], et comme plus 
du tout élevée en dessous de 80 [km/h]. La logique booléenne envisagerait les choses de la manière 


suivante: 
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100% 
0% 
80 90 100 Km/h 
Figure: 59.14 - Application de la logique booléenne 


La vitesse est considérée à 100% comme élevée à partir de 100 km/h, et à 0% en dessous. 


La logique floue, à l'inverse, permet des degrés de vérification de la condition " La vitesse est-elle 
élevée? " selon: 


100% 


(y 
si 80 90 100 Kr/k 


Figure: 59.15 - Aspect flou de la logique. floue 


La vitesse est considérée comme pas du tout élevée en dessous de 80 km/h. On peut donc dire qu'en 
dessous de 80 km/h, la vitesse est élevée à 0%. La vitesse est considérée comme élevée au-dessus de 
100 km/h. La vitesse est donc élevée à 100% au-dessus de 100 km/h. La vitesse est donc élevée à 
50% à 90 km/h, et à 25% à 85 km/h. 


De même, la fonction "La vitesse est-elle peu élevée?" sera évaluée de la manière suivante selon: 
100% 


0% 
7 80 90 100 Km/h 


Figure: 59.16 - A l'inverse... le flou demeure. 


La vitesse est considérée comme peu élevée en dessous de 80 km/h. Elle est donc peu élevée à 
100%. La vitesse est considérée comme pas du tout peu élevée au-dessus de 100 km/h. Elle est donc 
peu élevée à 0%. La vitesse est donc peu élevée à 50% à 90km/h, et à 75% à 85 km/h. 


Nous pouvons également définir une fonction "La vitesse est-elle moyenne?" selon: 


100% 


80 90100 Krn/h 


Figure: 59.17 - Application pertinente de la logique floue 


La vitesse est moyenne à 90 km/h. À cette allure, la vitesse est moyenne à 100%. La vitesse n'est pas 
du tout moyenne en dessous de 80 km/h et au-dessus de 100 km/h. Hors de cet intervalle, la vitesse 
est moyenne à 0%. La vitesse est donc moyenne à 50% à 85 km/h et 95 km/h. 


Il n'est pas obligatoire que la transition soit linéaire. Des transitions hyperboliques (comme une 
sigmoïde ou une tangente hyperbolique), exponentielles, gaussiennes (dans le cas d'un état moyen) 
ou de toutes autres nature, sont utilisables telles que les méthodes que nous avons vues lors de notre 
étude des réseaux de neurones dans le chapitre de Méthodes Numériques: 
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LA CT . 
0% 


P— 20 90 100 Kmk 22 80 90 100 Km/h 80 90 100 Km/h 


Figure: 59.18 - Exemples de transitions non linéaires 


Une fois évaluée la valeur de l'entrée ("La vitesse est-elle élevée?"), une valeur peut être déterminée 
pour une fonction de sortie. Considérons la fonction " Si la fièvre est forte, alors administrer de 
l'aspirine ". Une telle fonction est appelée "commande floue". Elle est composée de deux parties: 


1. Une entrée: "La fièvre est-elle forte?". Nous considérons qu'une fièvre n'est pas forte en dessous 
de 38°C, et qu'elle est forte au-dessus de 40°C. 


2. Une sortie: "Administrer de l'aspirine" 
Ces deux parties sont liées. Nous pouvons les représenter ensemble comme ci-dessous: 
VI. LT. 
0% 
Figure: . 19 - ne loue 


Il existe plusieurs techniques pour déterminer la valeur de la sortie (dans l'exemple: la quantité 
d'aspirine à administrer): 


Un exemple consiste à prendre l'horizontale passant par le point d'ordonnée correspondant sur la 
courbe de départ à l'abscisse de la valeur de l'entrée et de regarder où cette horizontale coupe la 
courbe de sortie. L'abscisse de ce point d'intersection est une valeur de sortie possible comme 


représenté ci-dessous: 
| 4. LT. 
0% 


38 38.5 40 


Figure: 59.20 - Transposition 


Un deuxième exemple consiste à prendre comme valeur de sortie possible le centre de gravité du 
trapèze en grisé délimité par l'horizontale et la courbe de sortie comme représenté sur la figure ci- 


dessous: 
| _11- LA. 


3838.5 40 


Figure: 59.21 - Autre ie 


De par ces deux exemples, nous voyons bien que nous sommes à la frontière science/ingénierie 
puisqu'il y a un choix technique ou/et statistique à faire dans la méthode à choisir. 
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ENSEMBLE FLOU 


Définition: Soit X un ensemble. Un "sous-ensemble flou" À de X est défini par une fonction 
d'appartenance f, sur X à valeurs dans l'intervalle [0,1]. 


Remarque: La fonction d'appartenance peut être fixée arbitrairement. Un problème des 
applications pratiques est pour l'ingénieur de définir ces fonctions (nous faisons généralement 
appel à des données statistiques ou à l'avis d'un expert). 


La notion de sous-ensemble flou englobe celle de sous-ensemble classique pour laquelle f, est la 
fonction indicatrice: 


Définition: Si À et B sont deux ensembles, tels que À est inclus dans B, nous appelons "fonction 
indicatrice" de A (relativement à B), la fonction 1, définie dans {0,1}, et telle que: 


14(x) = 1 si x est dans A 
14(x) = 0 si x n'est pas dans A 
(59.34) 


Les fonctions indicatrices sont souvent des intermédiaires techniques très pratiques! 
BExemple: 


Une fonction caractéristique possible pour définir le sous-ensemble À flou "avoir une vingtaine 
d'années" sur l'ensemble X des réels: 


Figure: 59.22 - Fonction floue centrée 


Les notions suivantes sont caractéristiques de A: 
Définitions: 

D1. Support de A: supp(A)={xe X, f,(x) # 0) 
D2. Hauteur de A: #(A) = sup,.z ax) 


D3. A est dit normalisée si #(4) = 1 
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Remarque: Les sous-ensembles flous considérés seront tous supposés normalisés, in extenso de 
hauteur égale à 1. 


D4. Noyau de A: xoy(A)={xe X, f(x) =1) 
D5. Cardinalité de A: |A|= © f(x) 

*eX 
DExemple: 


Avec l'exemple de la figure précédente: 


Ja) 


Figure: 59.23 - Décomposition de la fonction floue centrée 


D6. Si À et B sont deux sous-ensembles flous de l'ensemble X, nous disons que: 
1. A est "plus spécifique" que B si: 
noy (A) G nay(B) et supp(A) CsuppB (59.35) 
2. À est "plus précis" que B si: 
noy(A) = nay(B) , et supp (A) SE suppB (59.36) 
D7. Il y a égalité entre deux sous-ensembles flous si et seulement si: 
VreX,falx)= f(x) (5937 
D8. Il y a inclusion si et seulement si: 
vieX,fs (x) £ fa (x) (59.38) 
D9. L'intersection ÀAn£ est définie par: 
Fans: x min (fax), 32) (59.39) 


D10. L'union AB est définie par: 
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Jos: x > max( f(x), fa (x)) (59.40) 


BExemple: 


Reprenons le cas déjà envisagé. Nous considérons les personnes ayant une "vingtaine d'années", et 
celles "ayant la majorité” (c'est-à-dire celles qui sont majeures) (en pointillés sur la figure: nous 
considérons celle-ci comme un sous ensemble non-flou!): 


5 10 15 20 25 30 


Figure: 59.24 - Décomposition de la fonction floue centrée 


Selon les définitions de l'intersection ("ET logique" ou multiplication logique selon l'algèbre de 
Boole) et de l'union ("OU logique" ou addition logique selon l'algèbre de Boole), nous pouvons 
caractériser les sous-ensembles flous correspondant aux personnes "ayant une vingtaine d'années et 


la majorité” (figure de gauche ci-dessous) ainsi que celui des personnes "ayant une vingtaine 
d'années ou la majorité” (figure de droite ci-dessous): 


Figure: 59.25 - Résumé des résultats des différentes opérations logiques 
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Notes personnelles: 
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60. CODES CORRECTEURS 


S, la première moitié du vingtième siècle a été celle de la révolution analogique par la radio et la 


télévision, la seconde moitié de ce siècle est celle de la révolution numérique et de l'utilisation 
systématique de l'algèbre dans la transmission de données. 


Les codes correcteurs d'erreurs sont utilisés pour ajouter de la redondance aux données pour les rendre 
tolérantes à la transmission (jusqu'à un certain degré). Basiquement, l'idée est d'encoder d'une manière 
ou d'une autre une séquence d'information et d'ajouter de l'encodage aux données d'origine en guise de 
contrôle de l'intégrité des données. Ainsi, même si une certaine partie de l'information est corrompue, 
mais pas trop... la redondance permettra d'identifier les parties erronées du message. 


Ainsi, après l'apparition du CD audio dans les années 1980, il faut compter sur le développement de la 
diffusion par satellite et de nouveaux moyens de communication tels la télécopie, le réseau Internet ou 
le téléphone numérique qui utilisent tous les codes correcteurs d'erreurs (C.C.D). Même la photographie 
et la radio deviennent par ailleurs numériques. 


Les techniques de restitution d'images ou de sons sont liées à la transmission et à la lecture correcte de 
nombreux messages numériques, encore appelés "mots". Un message est formé de mots, eux-mêmes 
constitués de symboles (un exemple particulier étant le "bit" qui est pour rappel, la contraction du 
terme "binary digit") pris dans un alphabet. Si l'alphabet est binaire alors chaque symbole sera donc un 
bit. 


Prenons le message 00101 formé de 5 bits valant chacun 0 ou 1. Si nous transmettons le message tel 
quel, une erreur de transmission ou de lecture peut avoir lieu et rendre le message inintelligible. 
Décidons de répéter ce message trois fois et d'envoyer: 


001010010100101 (60.1) 


Si le message reçu comporte une erreur, cette erreur peut être corrigée. S'il comporte deux erreurs, le 
récepteur est capable de détecter qu'il y a eu erreur mais ne peut pas toujours récupérer le message 
originel. Enfin, s'il se produit plus de deux erreurs pendant la transmission, le récepteur peut ne pas les 
détecter. 


Nous venons ainsi de voir un premier exemple de C.C.D., appelé "code à répétition". Ce code, qui 
corrige une erreur et en détecte deux, est utilisé dans certains lecteurs de CD Audio possédant trois 
têtes de lecteur. Le signal 0 ou 1 est lu indépendamment par chacune de ces trois têtes pour donner un 
mot de trois chiffres, et une erreur de lecture peut être corrigée. 


Remarquons qu'il est naturel d'allonger un message pour le protéger. Prenons les mots d'un langage. Ils 
sont en général très éloignés les uns des autres, deux mots différant selon leurs longueurs et selon les 
lettres et les syllabe utilisées. Ainsi, nous confondrons difficilement les mots "bibliothèque" et 
"armoire" même si ces mots sont mal prononcés ou entendus, et nous reconstituerons naturellement le 
message dans une conversation quand bien même certains sons seraient supprimés ou déformés. Les 
militaires quant à eux épellent leurs numéros d'immatriculation en disant "alpha zoulou" pour "AZ"... 


Un deuxième exemple de détection d'erreurs largement utilisé en informatique est l'adjonction d'un "bit 
de parité”. Reprenons le message 00101 et ajoutons-lui un dernier bit obtenu en additionnant les cinq 
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bits du départ modulo 2. Le message devient 001010 et permet de détecter une erreur sans toutefois 
pouvoir la corriger. Pour cela, nous faisons la somme de tous les bits pour obtenir 0 s'il n'y a pas eu 
d'erreur, et 1 dans le cas contraire. Ce code appelé "code de parité" est utilisé un peu partout: dans les 
numéros de sécurité sociale où l'on rajoute la clé, dans ceux des comptes bancaires ou encore dans les 
code-barres des supermarchés où c'est le 13ème chiffre qui constitue la clé de contrôle (Voyager II est 
l'un des nombreux utilisateurs des codes de parité pour communiquer de manière fiable ainsi que le 
8ème bit de l'ASCII qui est utilisé comme bit de parité). 


Pendant de nombreuses années, les boîtiers de DRAM géraient des mots d'un bit ; il fallait donc placer 
sur la carte mémoire 8 boîtiers pour travailler avec des octets (8 bits). Pourtant, de nombreuses cartes 
comportaient non pas 8, mais 9 boîtiers ! Le neuvième boîtier était destiné à stocker un bit de parité lors 
de chaque mise en mémoire d'un octet. Lors de la lecture d'un octet, on vérifiait si, entre le moment de 
l'écriture et celui de la lecture, la parité n'avait pas été modifiée (suite à un parasite, par exemple). 


Figure: 60.1 - Exemple de boîtier de DRAM 


Enfin, voyons un troisième exemple utilisé sur certains serveurs informatiques qui utilisent des disques 
parallèles en RAID4 ou RAÏID6, ce dernier utilisant les codes de Hamming que nous verrons plus loin. 


Supposons que nous ayons trois disques durs de données, et que le contenu du premier octet de chaque 
disque soit le suivant: 


21:11110000 
D2:10101010 (60.2) 
D3:00110011 


Alors il suffit de prendre chaque colonne et de compter le nombre p de 1 dans la colonne. La valeur du 
bit de parité est alors p modulo 2. Nous avons pour la première colonne p qui vaut 2. Donc le bit de 
parité vaut 0, etc. Nous avons alors sur le disque de contrôle DC: 


DC':01101001 (60.3) 


Dès lors, dès qu'un des trois disques tombe en panne il devient aisé de le restaurer grâce au disque de 
contrôle en faisant la procédure inverse. 


Ces trois exemples fondamentaux sont à la base de la théorie du codage et montrent que nous pouvons 
maîtriser l'apparition d'erreur en allongeant volontairement le message avant sa transmission ou sa 
lecture. Des techniques algébriques plus sophistiquées sont ensuite utilisées pour améliorer les 
performances du codage, le but étant de: 


- savoir si des erreurs se sont produites (problème de la détection); 


- retrouver le message correct à partir du message reçu (problème de la correction); 
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- corriger le plus d'erreurs possible tout en utilisant le moins de bits supplémentaires possibles (problème 
de la performance du codage). 


Du point de vue mathématique, l'un des intérêts de la théorie des codes est de montrer que l'algèbre 
s'applique fondamentalement dans notre vie de tous les jours dès que nous écoutons de la musique ou 
que nous nous installons devant notre téléviseur, et que des notions aussi abstraites que celles d'espaces 
vectoriels ou de polynômes sur des corps finis nous permettent de lire des messages, d'écouter de la 
musique ou de regarder des films dans des conditions optimales. 


Nous distinguons les deux classes suivantes de C.C.D.: les codes en blocs et les codes en treillis. La 
figure ci-dessous donne un simple aperçu de la grande famille de codage. Dans la première classe (à 
droite sur la figure), citons les codes les plus célèbres comme les codes BCH, Reed-Solomon et Goppa, 
Golay et Hamming. La deuxième classe (à gauche sur la figure) est moins riche en variété mais présente 
beaucoup plus de souplesse surtout dans le choix des paramètres et des algorithmes de décodage 
disponibles. Citons par exemple, les codes convolutifs binaires systématiques récursifs très utilisés dans 
les modulations codées (TCM) et les codes concaténés parallèles (Turbo Codes). 


Les Codes Correcteurs 


Les Codes en Blocs 


Modulations Codées en Blocs 
Les Codes Linéaires 


Les Codes Cycliques 


Figure: 60.2 - Organigramme des codes correcteurs 


Modulations Codées en Treillis 


Les Codes Non-Linéaires 


Les Codes Non-Récursifs Les Codes Non-Cycliques ) 
Le 


Remarque: Pour aborder les fondements de la théorie des codes correcteurs, nous conseillons au 
lecteur d'avoir parcouru au préalable les chapitres de Mécanique Statistique (où se trouve la théorie 
de l'information), des systèmes numériques formels, et de topologie. 


1. CHECKSUM 


Avant de commencer la partie de mathématiques pures, nous souhaiterions faire une petite introduction 
sur le "checksum" (somme de contrôle) qui est un outil très fréquemment utilisé dans les entreprises 
lors de l'échange de fichiers de plus de quelques GB entre deux ordinateurs ou encore lors du 
téléchargement sur Internet. 


La somme de contrôle, parfois appelée aussi "empreinte", est un concept de base de la théorie des 
codes utilisé pour les codes correcteurs. Elle correspond à un cas particulier de contrôle par 
redondance. Elle est largement utilisée en informatique et en télécommunications numériques. 


Les codes utilisant les sommes de contrôle permettent de valider un message. Si le nombre d'altérations 
durant la transmission est suffisamment petit, alors elles sont détectées. L'utilisation d'une unique 
somme de contrôle permet la détection mais non la correction des erreurs. 
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La technique de base consiste à prendre la somme de certaines longueurs de bits (octets, word ou 
autres.) et de calculer le modulo 255 (FF). Par exemple, si nous prenons deux mots et nous basons sur 
leur code ASCII hexadécimal (vous pouvez trouver les tables ASCII un peu partout sur Internet): 


48 + 65 + 6C + 6C + 6F = F4 mod FF 48 + 65 + 6C + 6C + 61 = E6 mod FF 
48x1+65x2+6Cx3+6Cx4+6Fx5 = 31 modFF 48x1+65x2+6Cx3+6Cx4+61x5 = EB mod FF 


Figure: 60.3 - Principe du Checksum (source: Wikipédia) 


Certains utilisent aussi le MD5 (Message Digest 5) pour avoir une empreinte d'un message (cf. chapitre 
de Cryptographie). 


2. ENCODEURS 


Soit Q un ensemble fini à q éléments (bits, alphabets). Soient k et n deux entiers naturels non nuls avec 
k < n. L'ensemble des messages sera une partie E de Q*, et nous introduisons une application bijective 


(du moins c'est le but): 


J: E — Q° 


(60.4) 
a=(a,,a.….a)—c={c,c.…c, 


appelée "application de codage" ou "encodeur". Le message ou mot a est un élément de E. Il est 
modifié pour fournir le mot f (a) = ce @". C'est le mot c qui sera transmis et lu par un système 


quelconque pour donner un message reçu x = (He. x) éventuellement entaché d'erreurs. 


Notons € = f(Æ\ l'image de f. Comme f est injective, f réalise une bijection de E sur C et C peut être 


considéré comme l'ensemble de tous les messages possibles. C est appelé "code de longueur n", et les 
éléments de C s'appellent les "mots" du code. Le cardinal du code est par définition celui de C. Nous le 
noterons #C ou M. Pour mesurer le degré de différence entre deux mots x et y de @*, nous utilisons la 


"distance de Hamming" d définie par: 
Vz,yeQ" dix. y)=#GEeNIx #7} (605) 
Démonstration: 


Sur un ensemble Q quelconque, nous définissons donc l'application 4 :Q*x@*—IR par: 
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d(x.y)=#{ieN|x “};} (60.6) 


Si nous notons par à, la fonction caractéristique de x: 


lay=x 
HO (60.7) 
Ô sinon 


alors: 
an =Ù(1-6,0D) (60 
il 


Montrons que d est une distance (cf. chapitre de Topologie): 
1. Il sera requis que: 

Vr,yeQ”,d(x,y)20 (60.9) 
est évident. 
2. Il sera requis que: 

Vx,yeQ",d(x,y) =d(y,x) (60.10) 

est évident aussi. 
3. Il sera également requis que: 

VxeQ”,d(x,x)=0 (60.11) 
est évident aussi. 
4. Nous avons aussi: 

Vx,yeQ”,.d(x,»»=0—x=y (60.12) 


où d(x,y) = 0 signifie que x, = y, pour i = 1..." donc que x =. 


5. Enfin: 
Vx,y,zeQ",d(x,z) <d(x,y)+d(y,z) (60.13) 
En effet: 
d(x,2) = > - 8, ()) (60.14) 
i=l 5 
mais comme: 
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(1 -6,(4)) < (1 - &,0%))+ (1 -6,(&)) (60.15) 


car (1 ô,, (&)) vaut 1 si x, “*z, et O sinon, alors: 
d(x,7) = Dé 2, ()) { D à O)) + (1 e, (&)) =d(x.y)+d(y,z) (60.16) 
En | 2=1 


OIC.Q.F.D. 


Par exemple, la distance de Hamming entre les mots "ramer" et "cases" ou entre "0100" et "1001" est 
de 3. 


Remarque: Attention les vecteurs seront notés sans la flèche par respect de la tradition dans ce 
cadre d'étude. 


La distance de Hamming (notée 4,, dans certains ouvrages) est bien une métrique (cf. chapitre de 


Topologie) comme nous venons de le démontrer et nous appelons alors "espace de Hamming" sur Q 
l'ensemble @* muni de la métrique 4. 


Définition: Si Q est un groupe, le "poids de Hamming" w,,(x) d'un mot xe Q" est le nombre de ses 
coordonnées non nulles: 


Wy(x) =d(x,0) (60.17) 


où 0 est le mot (vecteur) de {* ayant toutes ses coordonnées égales à l'élément neutre de Q. Nous 


avons par ailleurs la propriété triviale suivante: 


d(x,y) = d(x-y,0) = w(x-y) (60.18) 


Remarque: Lorsque © = {0,1} nous parlerons de "code binaire" (nous allons voir de suite plus loin 
une autre forme d'écriture pour cet ensemble binaire) de dimension n égale à 2. 


La "distance minimale" du code C est la distance. minimale entre deux mots distincts de ce code. 
Nous notons ce nombre entier d(C) ou simplement d et donc: 


d = min { d(x, y) |x,yeC'etx # y} (60.19) 
ou encore en utilisant la propriété du poids de Hamming &{x,y) = wix- y) = w(z): 
d =min{w(z)|z€e C‘} (60.20) 
Exemple: 


Considérons le code redondant noté (5, 4) pour 4 mots codés de longueur 5 suivant: 
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00 


00000 0 C1 
01 01110 3 C2 
10 10011 3 C3 
11 11101 4 C4 


Distance de Hamming de chacun des couples du code: 


d(C1,C2)=3 d(C2C3)=4 
d(C1,C3)=3 d(C2,C4)=3 (60.21) 
diC1,C4i=4 diC3,C4i=3 


Le plus petit poids minimum non nul est donc 3 et la distance de Hamming la plus petite est 3. 
Définitions: 


D1. Un code C de longueur n, de cardinal M et de distance minimale d est appelé "code (n, M, d)". Les 
nombres n, M, d sont les "paramètres du code". Ainsi, le code (7, 4, 3) est un code de longueur sept, 
c'est-à-dire que le récepteur reçoit sept bits, de longueur quatre c'est-à-dire qu'une fois décodé, le 
message contient quatre symboles (lettres) et la distance minimale entre chaque mot de code est de 
trois. 


D2. Nous appelons "poids minimum" d'un code C l'entier: 
min{wy(x)|xEC,x #0} (60.22) 


d joue un rôle important car il se trouve en relation étroite avec le nombre d'erreurs susceptibles d'être 
corrigées. Supposons que le message codé soit & =(c,,...,c,) et qu'il y ait eu moins de e erreurs de 
transmission ou de lecture. Le message obtenu x =(x,..,x,) vérifie 4(x,c) £ e. Nous pouvons 
retrouver c à partir de x si, et seulement si, il existe un seul mot de code situé à une distance de x 
inférieure ou égale à e (donc que la distance centre à centre entre deux boules soit égale à 2e). 
Autrement dit, il faut et il suffit que les boules fermées de rayon e et centrées sur les éléments du code 
C soient disjointes. Un code corrigera e erreurs si cette condition est vérifiée. 


Ainsi, un code C de distance minimale d corrige au plus: 


ES (60.23) 
g=| — 60.23 
2 


erreurs (où | ] représente la partie entière d'un nombre réel). 


Effectivement, si un message du code se trouve à d/2 nous ne pourrons savoir à quel message du code 
(centre de boule) il appartient puisque se trouvant (de manière imagée) à la tangente de deux boules. 


c' . 1: - _— —— . 
est la raison pour laquelle nous prendrons ——— qui représente alors la "distance sûre" pour corriger 
2 


au mieux un message erroné du code. De plus, comme le nombre d'erreurs est un entier, il vient 
naturellement l'écriture: 
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É — | 
e=|-—| (60.24) 
2 


Il est clair que le code permet de détecter au plus d-1 erreurs. Effectivement, sinon comment distinguer 
un code erroné d'un code juste (code = message codé) ? Mis à part le fait que chaque élément du code 
soit différent (application injective de l'ensemble des messages dans l'ensemble des messages codés) il 
faut en plus pouvoir différencier parmi ceux-ci, ceux qui sont des codes erronés de ceux qui ne le sont 
pas. D'où le d-1. 


Exemple: 


Considérons le code redondant noté (5, 4) pour 4 mots codés de longueur 5 suivants dont la distance 
minimale était donc de 3: 


00 


00000 0 C1 
01 01110 3 C2 
10 10011 3 C3 
11 11101 4 C4 


Ce code ne permet donc de détecter au plus que: 


d-1=3-1=2 (60.25) 


HET ee 


2.1. CODES EN BLOCS - LINÉAIRES 


erreurs et d'en corriger au plus: 


Définition: Un "code en bloc" de taille M et de longueur n défini sur un alphabet de q symboles (1 et 0 
pour le langage binaire par exemple) est un ensemble de M vecteurs appelés "mots du code". L'idée est 
que chaque mot d'information composé de k symboles est associé à un mot de code unique composé de 
n symboles. Les vecteurs sont donc de longueur # > & et leurs composantes sont q-aires (donc 
"2-aires" dans le cas du langage binaire). 


La linéarité des codes en blocs signifie que les n symboles du mot code sont obtenus par une 
combinaison linéaire des k symboles du mot d'information. 


Exemple: 


Partons des M vecteurs suivants basés sur q = 3 symboles binaires (donc k = 2). Dans ce cas, nous 
avons 4 = g“: 
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Nous choisissons alors n comme valant 6 et nous définissons une application bijective telle que: 


000 000000 
100 110100 
010 011010 
110 101110 
001 101001 
101 011101 
011 110011 
111 000111 


Comme le montre cet exemple du code en bloc particulier noté traditionnellement (n, k) = (6, 3), le 
code ne présente aucune structure particulière. L'opération de décodage implique de faire la 
comparaison exhaustive du mot reçu en sortie du canal avec l'ensemble des modes de code avant de 
déterminer le mot de code le plus probable. 


Ainsi, selon la définition ci-dessus, un code en blocs C est la résultante d'une application bijective qui 
associe à chaque vecteur formé de k symboles q-aires (k symboles d'information), un vecteur image de 
longueur n avec des composantes dans le même alphabet (n symboles codés). Le codage ajoute au débit 
initial n-k symboles supplémentaires. La quantité: 


À = # (60.27) 


est appelée le "rendement de C"', ou encore "taux de codage". L'opération de codage en blocs est "sans 
mémoire", in extenso les blocs sont codés de manière indépendante sans aucune corrélation entre deux 
blocs consécutifs. 


Maintenant il convient de revenir un peu sur les algèbres de Boole (cf. chapitre de Systèmes Logiques). 
Aux cinq axiomes qui définissent une algèbre de Boole ajoutons en un sixième qui lui confère une 
structure de corps: 


A6. L'algèbre de Boole (extension d'un anneau unitaire par un axiome) munie de la loi * (À, ) est un 
groupe. 
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Rappel (théorie des ensembles): un corps est un anneau non nul dans lequel tout élément non nul est 
inversible. 


Si nous prenons l'algèbre de Boole formée des 4 = 2 éléments {0,1} formant un ensemble binaire, nous 
avons effectivement 1 qui est inversible puisqu'il existe x tel que 1* x= 1 qui est 1 lui-même. 


Ce corps est noté F, = E,. Dans les codes correcteurs, nous travaillons souvent dans FE, (unique corps à 


deux éléments) où pour rappel l'addition est définie par: 
0+0=0, 1+1=0 (donc 1=-1), 1+0=1 
La multiplication étant définie par: 
l'1=1,1:0=0,0'0=0 


Pour en revenir à notre théorie des codes: l'ensemble des messages Æ = F, peut être muni d'une 
structure d'espace vectoriel de dimension k sur E, ( | S les). 


Effectivement, il suffisait pour cela que (E,+) soit un groupe abélien et * une loi externe définie par 
F; XF, — F,. Si nous décidons de n'utiliser que des encodeurs qui sont (des applications) linéaires, le 


code C'= f (F*) devient un sous-espace vectoriel de F, (car même si l'application est bijective, 


comme le corps des messages est fini, nous avons nécessairement un sous-espace vectoriel de l'espace 
vectoriel de tous les messages codés possibles). 


Définition: Un "code linéaire" de dimension k et de "longueur" n est un sous-espace vectoriel de 
dimension k de F, (c'est ainsi que cela se dit….). Si la distance minimale de C est d, nous disons que C 


est un "code [n, k, d]" ou simplement "code [n,k]". 


Remarque: Les codes linéaires sont donc un cas particulier des codes en blocs comme le montre le 
schéma hiérarchique au début de ce chapitre. 


L'ajout de la contrainte de linéarité pourrait nuire à la qualité du code recherché, mais heureusement 
l'étude des performances montre que les codes linéaires sont très proches des meilleurs codes en blocs. 
Ainsi, la linéarité facilite l'étude des codes en blocs et permet l'utilisation d'outils algébriques très 
puissants, sans réduire la classe des blocs linéaires à une classe inefficace. 


Notons G la matrice de l'application linéaire f : F, — F,. Gest du type # x £ et tout mot c de C 
s'obtient à partir de tout mot x de E par € = f(x) = Gx où c =(e,,..,c,)e F, etx=(x,.,2%)€ F, 


sont des vecteurs-lignes avec toujours # > k&. Ainsi, f (F; ) =C. 


Remarque: Les bases de F;,F sont les bases canoniques courantes (celles dont nous avons 


souvent fait usage dans le chapitre de Calcul Vectoriel). 


Définition: soit C un code linéaire [n,k] et soit {8,,g,....,&,} la base de C. Une "matrice génératrice" 


de C est donc une matrice # x & dont les colonnes sont formées par les vecteurs g, de la base. 
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Soit 4 = (#,,...,4,) le mot d'information, in extenso le vecteur contenant les k symboles d'information. 


Alors, nous pouvons écrire la relation matricielle liant le mot de code c et le mot d'information u: 
c=Gu (60.30) 


Définition: Soit C un code en blocs [n,k]. Ce code est dit "code systématique", si l'ensemble des mots 
de code contient les k symboles d'informations non modifiés. Les n-k symboles restants sont appelés 
"symboles de parité”. 


Remarque: Le "code de Hamming” est un tel code. Par ailleurs, les codes systématiques sont des 
cas particuliers des codes en blocs et nous reviendrons sur leur étude plus loin. 


Définition: Soit H une matrice (x -&)xx à éléments dans F,, qui vérifie Æe = 0 pour tout mot c d'un 


code linéaire C (en d'autres termes: dont le noyau est C). Alors, H est dite "matrice de contrôle" du 
code C. Réciproquement, c appartient au Code si et seulement si Æ£ = 0 . Sinon quoi il y a une erreur ! 


Remarque: Il est facile de trouver H car celle-ci est "orthogonale" à G puisque la définition 
ci-dessus implique Æ (Gu) = (GA ju = 0 donc GH# = 0 (évidemment il ne faut pas prendre H=0...). 


Voyons un exemple de tout cela avec le code de Hamming qui est un code en blocs systématique 
(attention !! il existerait plusieurs définitions d'un "code de Hamming!): 


Cette méthode consiste à doubler l'information, en envoyant autant de bits de parité que de bits de 
données. Ainsi, à l'aide de matrices, il est possible de détecter et corriger les erreurs qui figurent dans 
les quartets. Une première matrice est : 


(60.31) 


Di oO = © © © = 
0 SC mr OS OS — © 
See Se ee So 
oo Se S © 0 


Celle-ci est la matrice de codage G. Elle est de dimension » x #, où n est le nombre de bits reçus par 
paquet, et k le nombre de bits par message contenant l'information (ici » = 8 et & = 4 ). Elle permet de 
générer automatiquement les bits de parité propres à un message. Par exemple pour envoyer le message 
1101, il faut, pour respecter la règle de multiplication des matrices, considérer ce quartet comme un 
vecteur-colonne: 
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1 

1 . 

ob (60.32) 

1 

Donc en multipliant, nous obtenons: 
1 0 O0 0 l 
0 1 O0 O0 l 
0 O0 1 01f1 0 
0 O0 0 1111 1 
c=CGms= . = (60.33) 

1 1 O0 O![10 0 
0 O0 1 1 | 1 
1 O0 1 0 1 
0 1 0 1 0 


Nous enverrons donc l'octet 11010110, dont les quatre premiers bits forment le message et les quatre 
derniers les bits de parité, qui servent à vérifier la véracité/intégrité du message. 


La matrice de contrôle correspondante H est: 


(60.34) 


a 
© ee © 
OS mm © © 
He © © 


1 1 0 
() 0 1 
() 0 0 
| 0 0 


OO mm © 


Ainsi lorsque le destinataire reçoit l'octet 11000110 au lieu de 11010110, le décodage donne comme 
"syndrome": 


1 

l 
1 1 0 0 1 0 0 OJ]0! [0 

RL _—. 

1 0 1 0 0 0 1 Of[]0| 10 
0 1 0 1 0 0 O0 1111] |1 

l 

0 


Le vecteur-colonne obtenu n'est donc pas nul. Il y a donc une erreur. Avec la matrice de contrôle, la 
théorie permet d'affirmer que comme le vecteur obtenu est le même que celui qui est en quatrième 
position dans la matrice de décodage, l'erreur est due au quatrième bit. Comme nous sommes en base 2, 
il suffit de changer le 0 en 1. Ce codage de l'information est coûteux, car il occupe deux fois plus de 
bande passante. Cependant c'est l'un des moyens les plus efficaces pour sécuriser l'information. 


Pour montrer que le syndrome d'un code de Hamming correspond à une des colonnes de la matrice de 
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contrôle, notons &, les vecteurs-colonnes de la base canonique sur F*, 8; = (0,...,0,1,0,...,0) avec 1 à 


la i-ème place. Soit x un mot de code. Nous avons donc par définition de H, Æx = 0. Supposons que le 
mot reçu, que nous noterons %, soit entaché d'une seule erreur et que cette erreur soit sur le j-ème bit. 
Nous avons donc: 


X+ x=8, et He, = H(x+ x)= Hx+ Hx= Hx (60.36) 
ainsi il vient que H#x= He,, mais #e, est le j-ème vecteur colonne de la matrice H. 


Ceci nous montre bien que, lorsque nous recevons + et que nous calculons x} nous obtenons le 
vecteur-colonne de la matrice H situé exactement à l'emplacement de l'erreur (en l'occurrence j). 


Remarque: Un syndrome nul ne signifie pas l'absence d'erreur(s). Il existe donc des configurations 
d'erreurs indétectables. 


Notons maintenant: 


0 PS (60.37) 


D = © 
= D OO 
OO mm mm © 
= OO — © 
Oo oO © 
Oo © mm © 
> Er © ,0 
mm © © © 


alors nous remarquerons que G et H sont formées par les blocs I et A de la manière suivante: 
= (2,14 = (414) (60.38) 
et: 
H=(A Z) (60.39) 
Ainsi: 
HG = (A on = Al,+/,4= A+A=A(l+1)=0 (60.40) 


car 1+1=0 dans F;.. 


De façon générale, si nous travaillons avec l'alphabet EF, et si G = où À est une matrice {x —#&)*xk 


alors 4 =(A -/,) est aussi une matrice de contrôle car de nouveau: 


1 
HG = (4 1] =Al,-1,4=0 (60.41) 
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Remarque: Dans F;, Z,= -7, car 1=-1, c'est pour Ça que nous avions écrit # = (A 1) dans 


l'exemple précédent. 


2.2. CODES SYSTÉMATIQUES 


Construire un code systématique consiste à adjoindre à chaque mot x =(x,..,x,) du message n-k 


symboles £,,1,...,€,,, dépendants linéairement des x pour obtenir le mot de code € = f(x). 
Les symboles sont appelés "bits de contrôle" et (nous en verrons un exemple juste plus bas): 
C Xe. ApeCpuoeCuex ) = Ci | AG...,xx) (60.42) 


où, pour rappel, (7, |A) désigne la matrice # x # obtenue en écrivant l'une en dessous de l'autre, la 
matrice identité Z, de taille k et une matrice quelconque A. 


Nous dirons qu'un code C est systématique s'il possède une matrice génératrice de la forme & = (1, | À) 
Exemple: 


Nous nous proposons de construire un code linéaire systématique avec n=k=3. Nous notons 4,4, ,&, 
les bits d'information. Les bits de contrôle 4, ,4,,4, seront définis par: 


ds = di +43 (60.43) 


La matrice génératrice G est telle que sa partie supérieure est la matrice identité de dimension 3 (nous 
avions la même chose pour le code de Hamming). La première ligne (110) de la matrice À correspond à 
l'expression du bit de contrôle à, : 


a; =l'a +l'a, +0'a; (60.44) 
etc. pour chaque bit de contrôle. 


La matrice génératrice G s'écrit alors: 


G = (60.45) 


le 
A 


En multipliant cette matrice par les 2 = 8 vecteurs possibles (les mots constitués de trois bits 
d'information), nous obtenons les mots code: 
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1 OO mm OO © 
OO mm © mm © 
= mm © mm © © 


Lai | 22 [ 23 | a | 25 | 26 
0 0 0 0 0 0 
0 0 1 0 ié 1 
0 1 0 1 1 0 
0 1 1 1 0 1 
1 0 0 1 0 1 
1 0 1 1 f 0 
1 1 0 0 L 1 
1 1 1 0 0 0 


Tableau: 60.1 - Exemples de mots code 


Nous constatons donc que le poids minimum des mots code est 3. Donc le code détecte 3-1=2 erreurs 


É _ | 
et peut en corriger Ed LS 
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Notes personnelles: 
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61. CRYPTOGRAPHIE 


L. cryptographie est une des disciplines de la cryptologie s'attachant à protéger des messages 


(assurant confidentialité et/ou authenticité) que deux personnes souhaitent s'échanger à travers un canal 
peu sûr en s'aidant souvent de secrets ou clés. 


L'histoire de la cryptographie est déjà longue et passionnante (puisque c'est en quelque sorte un "jeu"). 
Nous rapportons son utilisation en Égypte il y a 4'000 ans. Toutefois, pendant des siècles, les méthodes 
utilisées étaient restées souvent très primitives. D'autre part, sa mise en oeuvre était limitée aux besoins 
de l'armée et de la diplomatie. Ainsi, les méthodes de chiffrement et de cryptanalyse (le casse de code) 
ont connu un développement très important au cours de la seconde guerre mondiale et ont eu une 
profonde influence sur le cours de celle-ci. 


À la fin du 20ème siècle (en particulier !), avec la prolifération des ordinateurs et des moyens 
électroniques de communication, il était devenu de plus en plus important d'utiliser des codes secrets 
pour la transmission des données entre les organismes à caractère militaire ou privé. Ainsi, les 
ingénieurs ont dû chercher à cette même époque des méthodes numériques solides et dont la mise en 
oeuvre et l'usage était à portée de presque tout un chacun (nation, entreprise et individu) tout en faisant 
en sorte que les attaques extérieures nécessitent des outils hors d'atteinte d'un individu ou groupe 
d'individus équipé d'outils informatiques standards ou performants (en puissance de calcul donc). Les 
ingénieurs et chercheurs se sont alors plongés dans la mathématique pour chercher les outils satisfaisant 
ce cahier des charges et pour les systèmes les plus connus, les théories mathématiques qui furent 
adoptées avaient plus de 200 ans (cryptographie quantique mise à part) d'ancienneté. 


Les techniques de stéganographie (art de dissimuler un message dans un autre, ou dans une image) 
doivent toutefois être préservées car rien ne nous dit que la puissance de calcul de l'informatique sera 
toujours disponible en temps de guerre. Il convient de souligner aussi que la stéganographie déploie des 
trésors d'imagination. Signalons par exemple: les permutations de lettres, les formatages spéciaux et 
subtiles de caractères, l'utilisation de synonymes, les messages cachés dans la virgule d'un texte ou 
derrière un timbre-poste, dans des coups de jeux d'échecs (d'où le fait que ces jeux aient été interdits 
par les américains pendant quelques années après l'attaque de Pearl Harbor), dans des images/dessins, 
dans des partitions musicales, etc. Toutes ces techniques font que pendant la deuxième guerre 
mondiale, l'office de censure aux États-Unis occupait 10'000 employés à plein temps qui analysaient le 
courrier des citoyens, les petites annonces, les textes radios, etc. 
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Remarques: 


R1. Pour aborder les fondements de la théorie de la cryptographie, nous conseillons au lecteur 
d'avoir parcouru au préalable les chapitres de Théorie des Nombres, Théorie des Ensembles, de 
Méthodes Numériques (surtout la partie traitant de la complexité algorithmique), des Systèmes 
Numériques Formels, de la Mécanique Statistique (où se trouve la théorie de l'information) et pour 
la partie de la cryptographie quantique: le chapitre d'Informatique Quantique du site. 


R2. Il faut rester conscient à nouveau que la cryptographie étant plus une science de l'ingénieur 
qu'une science du physicien (mis à part en ce qui concerne la cryptographie quantique) il ne faut 
pas s'étonner alors de voir apparaître des algorithmes tombés un peu de nulle part et adoptés par 
l'industrie parce qu'ils marchent bien. par ailleurs il est certain que seulement quelques années 
après avoir écrit ce texte il soit déjà considéré comme obsolète (c'est tout l'art de l'ingénierie. 
l'obsolescence programmée) 


1. SYSTÈMES CRYPTOGRAPHIQUES 

Définitions: 

Un "système cryptographique" est composé de: 

D1. Un ensemble fini P appelé "l'espace des textes clairs" 

D2. Un ensemble fini C appelé "l'espace des textes chiffrés" 

D3. Un ensemble fini K appelé "l'espace de clés" 

Pour chaque clé & « Æ , nous cherchons une fonction de chiffrement: 
e:P—C (611) 

et une fonction de déchiffrement (decryption): 
D'ÉSE (61 


telles que (cf. chapitre de Théorie Des Ensembles): 


d, 0e, = >| (61.3) 


Autrement dit, ces deux fonctions doivent être injectives! 


Pour arriver à ce résultat, deux types de techniques cryptographiques se distinguent , englobant toutes 
les méthodes de cryptage modernes connues (pour les détails voir plus loin): 


1. Les premières concernent les systèmes de chiffrement "symétriques à clé secrète". 


Remarque: Les clés publiques font souvent référence au protocole D.E.S. (voir plus loin): Data 
Encryption System. 
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2. Les secondes concernent les systèmes de chiffrement "asymétriques à clé publique". 


Remarque: Ce type de clé fait souvent référence par exemple au protocole R.S.A., du nom des 
personnes à qui on en a attribué le développement: Rivest, Shamir et Adleman. Elles sont beaucoup 
utilisées de par la rapidité du temps de cryptage et de décryptage ainsi que de leur grande entropie 
(voir définition plus loin). 


Par nature, ces deux types de clés sont très différents. Essayons d'en comprendre les raisons: 


Un chiffrement symétrique désigne un système où la clé utilisée dans l'opération de chiffrement est 
aussi celle utilisée dans l'opération de déchiffrement. Dans ce cas, lors d'un échange sécurisé (supposé), 
les deux parties de la correspondance doivent partager un secret: la clé utilisée ou "clé de session". 


Un chiffrement asymétrique désigne un système de chiffrement où la clé utilisée pour le chiffrement 
(clé privée de l'expéditeur) diffère de celle utilisée pour le déchiffrement (clé privée du destinataire). Le 
seul échange qu'il y a entre les membres du groupe est la clé publique, qui permet à chacun des 
membres d'adapter son chiffrement (ou cryptage) en fonction de la clé privée des autres membres 
(parmi les nombreux systèmes asymétriques qui ont été proposés, l'un des plus répandu en ce début de 
21ème siècle est le R.S.A.). 
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Remarques: 


R1. En 2001, MS Internet Explorer (navigateur internet de Microsoft) fonctionnait avec un système 
asynchrone de 1024 bits certifié par un système synchrone et Adobe Acrobat (PDF) en 2004 avec 
un système A.E.S. (Advanced Encryption System) de 128 bits pour les protections basses de même 
que pour l'iPhone 45 et 5. 


R2. MS Windows et son système E.F.S. (Encryption File System) utilise une clé symétrique (pour 
chiffrer le fichier) appelée "File Encryption Key" et la cryptographie asymétrique pour coder la clé 
symétrique dans l'en-tête du fichier selon le schéma suivant (les clés étant mises à jour 
régulièrement via les certificats racines de Windows Update): 


CHIFFREMENT DU FICHIER 


GE 


Æ Ne = 


Fichier non chiffré Fichier chiffré 


EL publique 


@— ns 
CE | chiffrée 
Fichier chiffré 
avec FEK en en-tête 


DÉCHIFFREMENT DU FICHIER 


En 


————— Ê privée 


utilisateur 
Figure: 61.1 - Principe de l'E.F.S. dans l'O.S. Microsoft Windows (source: Wikipédia) 


Ces méthodes demeurent toujours déchiffrables, à condition que l'intercepteur possède "assez de temps 
et de papier" (exception à ce jour pour le cryptage quantique). 


Voici un petit tableau résumé des clés cassées et de leur taille respective pour chacun des deux 
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systèmes classiques: 


40 Cassée en 1995 
56 Cassée en 1998 
64 Cassable 

128 Cassable en -2100 
256 fl 


256 Cassée en 1985 
512 Cassée en 1999 
1024 Cassée 2010 
2048 Cassable en -2100 
4096 Fr 


Tableau: 61.1 - Systèmes de clés et cassages récents 


1.1. PRINCIPE DE KERCKHOFFES 


La première fonction de la cryptographie consiste donc à assurer la confidentialité d'un échange 
d'informations. Deux parties d'un échange confidentiel s'accordent d'abord sur une convention secrète 
pour rédiger leurs messages, et si elles l'ont soigneusement choisie, personne d'autre ne devrait pouvoir 
saisir leur échange. 


Si le caractère secret de telles conventions est envisageable entre quelques personnes isolées pour une 
période limitée, il est inconcevable à grande échelle et pour une durée assez longue. C'est ce qu'avait 
compris Auguste Kerckhoffs lorsqu'il établit les principes de base de la cryptographie pratique dont un 
principe fondamental exige un système de chiffrement: "qui n'exige pas le secret, et qui puisse sans 
inconvénient tomber entre les mains de l'ennemi”. 


Un autre principe précise que: "la clé doit pouvoir être changée ou modifiée au gré des 
correspondants". 


Le premier de ces deux principes, connu aujourd'hui sous le nom de "principe de Kerckhoffs", stipule 
donc que la sécurité d'un système de chiffrement n'est pas fondée sur le secret de la procédure qu'il suit, 
mais uniquement sur un paramètre utilisé lors de sa mise en oeuvre: la clé. Cette clé est le seul secret de 
la convention d'échange. 


Ce principe a cependant été reformulé par Claude Shannon: "l'adversaire connaît le système". Cette 
formulation est connue sous le nom de la "maxime de Shannon”. C'est le principe le plus souvent 
adopté par les cryptologues, par opposition à la sécurité par l'obscurité. 


1.2: TRAPPES 


Il existe parfois ce que nous nommons des "trappes" dans les clés publiques et secrètes. Ceci est dû au 
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fait que lors de la génération de la clé, qui doit se faire aléatoirement en respectant certaines contraintes 
théoriques prédéfinies, le générateur aléatoire peut avoir un défaut (parfois le défaut est volontaire de la 
part du fournisseur... espionnage oblige). 


Dans les clés secrètes, les trappes se situent au niveau de "l'entropie de la clé" ( 

), directement liée à l'entropie du générateur aléatoire. Nous pouvons de manière 
simpliste définir l'entropie d'un générateur de clés par le nombre moyen optimal de questions binaires 
(c'est-à-dire donnant lieu à des réponses du type Oui/Non) qu'il faut poser à quelqu'un connaissant une 
clé produite par ce générateur, pour la déterminer. Plus l'entropie d'un générateur de clé est élevée, plus 
il faut de questions pour déterminer cette clé. À l'inverse, plus l'entropie est faible, moins il faut de 
questions, de sorte que la recherche d'une clé est facilitée. 


L'introduction de trappes dans les clés de systèmes asymétriques est beaucoup plus difficile, puisque ce 
type de clé possède déjà une structure mathématique intrinsèque: leur construction n'est pas due au 
hasard, mais résulte de règles mathématiques. Le hasard est ici dans le choix des grands nombres 
premiers utilisés. Le fait que les systèmes asymétriques puissent être aisément calculés, mais difficiles à 
inverser font qu'ils sont parfois appelés "fonctions trappes à sens unique". 


Remarque: Si le générateur aléatoire qui engendre ces nombres premiers est biaisé (« 
), ce biais facilitera la recherche des nombres premiers ayant servi à l'élaboration de la 
clé qu'un attaquant tente de casser. 


2. SYSTÈME DE CHIFFREMENT A CLÉ SECRÈTE 


Le "chiffre à usage unique" est un algorithme de chiffrement à clé secrète prouvé inconditionnellement 
sûr. Correctement utilisé (et c'est un point important), il fournit un chiffrement incassable en des temps 
raisonnables. 


Les bases théoriques de ce système de cryptage sont les suivantes: 


Soit un message M sous forme binaire à transmettre entre des personnes A (créateur et expéditeur du 
message M) et B ( lecteur et destinataire). Nous engendrons une grande quantité de bits "réellement 
aléatoires" qui forment une clé secrète K de même taille que le message à transmettre (les programmes 
informatiques, déterministes par essence, ne peuvent engendrer des bits vraiment aléatoires). 


Cette clé sera transmise à B par un canal supposé sûr... Un laps de temps donné après la transmission de 
cette clé, À va encoder son message en C en effectuant l'opération: 


C=KxM 


où * est un opérateur qui doit satisfaire à une loi de groupe (: [h ( ) sur 
un ensemble fini (qui contient un nombre fini d'éléments). 


L'intérêt en informatique est d'utiliser la loi de groupe XOR (aussi nommée OÙ EXCLUSIF) notée & 
par la suite ( iques). 


Finalement, l'expéditeur A transmet la version cryptée C de son message par une voie pas 
nécessairement sécurisée. B retrouve le message original M en utilisant l'opération inverse (x)-} de * 


(l'opérateur XOR est son propre inverse comme le montre sa table de vérité dans le chapitre de 
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Systèmes numériques). Ainsi B va effectuer l'opération suivante: 
M=C@E%Æ (615) 


Sous réserve que la clé K ait bien été engendrée de façon totalement aléatoire et que chaque bit la 
composant n'ait été utilisé qu'une seule fois pour crypter le message, un intercepteur n'obtient aucune 
information sur le message clair M s'il intercepte C . En effet, dans ces conditions, on ne peut établir 
aucune corrélation entre M et C sans la connaissance de K. 


Même avec de futurs ordinateurs quantiques ultra-puissants, le problème est insoluble, car rien ne relie 
les informations dont on dispose et le problème à résoudre. En conséquence, le "chiffre à usage unique" 
est un algorithme de chiffrement "inconditionnellement sûr". La preuve de sa sécurité ne fait pas appel 
à des conjectures mathématiques non démontrées et les tentatives de déchiffrement d'un intercepteur 
muni d'une puissance de calcul infinie sont vaines. 


Cependant, chaque étape du chiffrement est source d'erreurs possibles. En effet, la clé K peut avoir été 
mal élaborée. La moindre déviation statistique sur K par rapport à du "vrai" aléatoire fourni des 
informations sur le message clair M à partir de sa version cryptée. C'est la raison pour laquelle les bits 
de K ne doivent servir qu'une seule fois. 


Effectivement, supposons qu'une même clé ait servi à chiffrer les messages de langue française Af, et 
W, et qu'une personne malveillante arrive à intercepter les deux messages correspondants cryptés € 
et C,. À partir de C; et C, l'intercepteur peut facilement obtenir des informations sur M, et Af, du 
fait des particularités des langues. En effet, puisque: 


C=MOKeC, =-W, ®K (61.6) 
alors l'intercepteur connaît un résultat simple qui fait intervenir À#, et Af,, sans la clé K: 
CC = M SM, (61.7) 
car: 
ÊÉŒEK=Û0 (61.8) 


(au besoin faire la table de vérité pour s'en convaincre). Or, si Æf, et Af, sont dans la même langue, on 


saura en général, grâce aux redondances des langues (par exemple la lettre "e" apparaît très souvent 
dans la langue française), retrouver à partir de , @f, , chacun des deux messages (le travail est 


quand même laborieux). 


Imaginons que nous souhaitons envoyer un tout petit message codé en binaire par 1101 et que nous 
avons généré une clé aléatoire qui a donné 0101. 


Nous avons alors: 
C=M@K=1101@0101=1000 (612) 


et donc: 
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M=C@X=1000@0101= 1101 


Évidemment dans ce genre de petites situations on peut deviner sans trop de difficultés M rien qu'en 
ayant C s'il n'y a comme ici qu'une seule étape de chiffrement. Raisons pour lesquelles il existe des 
schémas comme nous allons le voir maintenant. 


Le problème principal de cette technique est donc la création d'une clé aussi aléatoire que possible. 
Pour pallier à cela, les mathématiciens font passer la clé par une série de fonctions imbriquées, dont le 
résultat, après un grand nombre d'itérations, devient "pseudo-aléatoire". 


Construire une itération pseudo-aléatoire est une chose, construire une bijection pseudo-aléatoire en est 
cependant une autre. En effet, il faut pouvoir décrypter le message par la suite, c'est pourquoi l'on a 
absolument besoin d'un système bijectif (qui a tout élément d'arrivée - message crypté - fait 
correspondre un unique élément de départ - message décrypté - et inversement). 


2.1. SCHÉMA DE FEISTEL 


Même si les algorithmes de chiffrement de fin du 20ème siècle et du début du 21ème siècle se 
contentent d'une clé à nombre de bits fini, l'objectif demeure l'élaboration à partir d'un message M d'une 
suite aléatoire de chiffres, ou, à défaut, qui paraisse aléatoire, que la détention de la clé K permet de 
déchiffrer. Concrètement, cet objectif demande de construire ou d'identifier une fonction qui, d'une 
part, fasse correspondre à chaque chiffre de M un chiffre de C qui semble tiré au hasard (mais dont la 
valeur dépend en réalité de la clé) et, d'autre part, qui autorise le cheminement inverse, c'est-à-dire qu'à 
partir d'un chiffre de C, on puisse remonter de façon univoque au chiffre correspondant de M (donc une 
fonction bijective!). Nous désirons ainsi trouver une bijection pseudo-aléatoire. 


Dans les années 1950, un mathématicien (Horst Feistel) a montré qu'une fonction pseudo-aléatoire se 
transforme, par une méthode relativement simple, en bijection. Aujourd'hui, la "méthode de Feistel" est 
la plus utilisée dans les chiffrements à clé secrète et est aussi à la base du D.E.S. (Data Encryption 
System). Comment fonctionne-t-elle ? 


En voici le principe: 


Le message initial à chiffrer a une taille de 2n bits. On sépare le message M en deux blocs, G et D, de 
longueurs égales (G regroupe les n premiers bits et D les suivants) et on construit la transformation # 
qui associe à G et D les nombres S et T telle que: 


S=DeT-G@ (2) 


où le signe & représente toujours l'opération XOR bit à bit et f; une fonction quelconque, pas 
nécessairement bijective, de n bits vers n bits qui utilise la clé secrète K. 


La transformation g&@, D) = (S,T) est bien bijective, car on remonte de façon univoque (unique) à 
partir de S et de T à G et D par les opérations: 


D=SetG=T@/j(S 


On ne doit évidemment pas s'arrêter-là puisque la partie droite du message, D, n'a pas été chiffrée, elle 
est simplement passée à gauche. Cependant, comme & est bijective, on peut réitérer le processus. Un 
schéma de Feistel où l'on applique n fois la fonction # est nommé "schéma à n étapes". 
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Exemple: 


Nous allons chiffrer par la méthode de Feistel à deux étapes un message constitué de quatre bits (donc 
16 possibilités de messages), ce qui vient à construire une bijection de quatre bits vers quatre bits à 
partir de deux fonctions f,.f, de deux bits vers deux bits. Les fonctions #,.f, possèdent en entrée à la 


fois le message à chiffrer et la clé secrète. Nous considérerons que pour une certaine clé entrée, ces 
fonctions sont les suivantes: 


Entrée | jf |Sortie | Entrée | j, | Sortie 
00 |; | 01 00 | —> | 11 
01 |—> | 11 01 |——> | 00 
10 | —> | 10 10 |——> , 00 
11 —> | O1 LL — | O1 


Tableau: 61.2 - Correspondances entrées/sorties de clés par fonctions 


Notons que ni f#, ni j, ne sont des bijections (#{00) = # (11) = 01 £(01 = 5, (10) = 00). À titre 
d'exemple, chiffrons le message 1101. G désigne la moitié gauche du message à chiffrer, D la moitié 
droite: 


Message 1101 


Séparation G=11 


Ï 


1è étape D=01 G@ f(D)=(11)@(11) = 00 


2ère étape D@/ (G®A(D)) = DE, (00) 


=01@11=10 


Figure: 61.2 - Chiffrement de 1101 par la méthode de Feistel 


Le résultat est 0010. Nous calculerons l'image des 15 autres messages possibles et nous vérifierions qu'il 
y ait une correspondance univoque entre chaque message et son image par le schéma de Feistel: nous 
avons construit une bijection à partir de deux fonctions qui n'en sont pas. 


Des résultats théoriques complexes garantissent la sécurité cryptographique des schémas de Feistel à 
partir de quatre étapes lorsque n est assez grand et lorsque les fonctions #,f,,f.%, sont 


indiscernables de fonctions réellement aléatoires. En pratique, plutôt que d'utiliser quatre étapes et des 
fonctions f; qui ont l'air aléatoires, on préfère en général utiliser plus d'étapes et des fonctions f, plus 
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simples. Au bout de quelques étapes, la bijection obtenue devient souvent très difficile à distinguer des 
bijections aléatoires. Et pour des paramètres bien choisis, on ne sait plus du tout comment les distinguer 
de bijections réellement aléatoires !!! 


La plupart des algorithmes à chiffrement à clé secrète utilisés actuellement dans le monde civil sont des 
schémas de Feistel. En particulier, l'algorithme D.E.S. (Data Encryption System) qui est un schéma de 
Feistel à 16 étapes comme représenté dans la figure ci-dessous et l'algorithme Triple DES (TDES) qui 
est un schéma de Feistal à 48 étapes et l'algorithme Blowfish (que nous n'aborderons pas ici). 


Remarque: Il y a, par exemple, dans beaucoup de cartes bancaires, une clé DES (ou TDES depuis 
octobre 2001) qui apporte la preuve de la légitimité de la carte entre le centre de contrôle de la 
banque et le terminal du commerçant en plus de la partie publique d'une clé RSA pour s'assurer de 
la saisie du code utilisateur (contrôle fait par une puce interne à la carte dont la fabrication doit 
alors se faire dans des locaux très sécurisés). 


Rigoureusement le schéma de Feistel est un peu autre car il fait intervenir des clés, ce que nous n'avons 
pas utilisé dans l'exemple cité précédemment. Voici au fait en un peu plus détaillé en quoi consiste ce 
schéma de Feistel (voir figures ci-dessous). 


Principe du schéma: Un message à chiffrer est découpé en blocs de 64 bits, chacun d'eux étant séparé 
en deux sous-blocs de 32 bits, le bloc de gauche (G) et le bloc de droite (D). À chaque itération, 
l'ancien bloc droit devient le nouveau bloc gauche et le nouveau bloc droit résulte de la combinaison 
par l'opération XOR de l'ancien bloc droit, dont les bits sont mélangés par une fonction de confusion, et 
de l'ancien bloc gauche. On répète l'itération 16 fois. 


ITÉRATION 
OUTOUR | 


Figure: 61.3 - Schéma de Feistel un peu plus réaliste 
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La fonction de confusion (f), qui agit sur les blocs de 32 bits, mélange les bits selon les processus 
suivants (à droite sur la figure). D'abord, elle transforme le bloc de 32 bits en un bloc de 48 bits par 
duplication de certains bits (expansion). Ensuite, elle ajoute à ce bloc, une sous-clé de 48 bits (clé de 
tour) extraite de la clé secrète de 56 bits puis elle transforme chaque ensemble de 6 bits en 4 bits par 
des transformations locales (transformation S). On aboutit à un bloc de 32 bits que l'on mélange enfin 
suivant une permutation fixe. 


SOUS-BLOC DE 32 BITS 


CID 1 Œ CT 


| 
| 
A EXPANSION 
| | \ / (DUPLICATION 
À DEBITS) 


CLÉ DE TOUR 


TRANSFORMATION 
S 


32 


F Ê “ / k PERMUTATION 


| | | | | 
| | | | | 32 


Figure: 61.4 - Schéma de la fonction de confusion 


3. SYSTÈME DE CHIFFREMENT A CLÉ PUBLIQUE 


En 1975, W. Diffie et M.E. Hellman révolutionnaient la science de la cryptographie en démontrant 
l'existence d'un protocole qui ne pouvait être déchiffré par un intercepteur à moins que ce dernier ne 
disposât de conséquentes ressources informatiques. Le plus fascinant dans leur méthode - dont le 
principe est encore en usage aujourd'hui - c'est que le code utilisé ne nécessite pas le camouflage de la 
méthode employée et qu'il peut servir à maintes reprises sans aucune modification (principe de 
Kerckhoffs). Ils ont à l'époque tout simplement créé le concept de cryptographie à clé publique, ou 
cryptographie asymétrique (dont nous avons déjà fait mention au tout début de ce chapitre), invention 
qui suscita l'émergence d'une communauté universitaire et industrielle dynamique. 


Remarque: Contrairement à ce que l'on pourrait croire, la cryptographie à clé publique n'a pas 
relégué la cryptographie à clé secrète aux oubliettes, bien au contraire: ces deux types de 
cryptographie s'utilisent le plus souvent conjointement dans des cryptosystèmes hybrides où 
l'authentification des clés publiées est assurée par une "autorité de certification". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Avant d'exposer dans le détail le protocole de Diffie-Hellman, rappelons que le protocole d'échange des 
"clés secrètes" n'était fiable à l'époque (et ne l'est toujours pas aujourd'hui ) puisqu'il voyage/transite 
entre les interlocuteurs, l'élément permettant de crypter et donc décrypter les messages. De plus, même 
si rien qu'une seule clé venait à voyager, toute personne ayant une puissance de calculs suffisante 
pourrait briser le code. D'où la nécessité qu'il y avait de changer (malheur de plus!) périodiquement les 
clés (cryptopériode). Deux solutions s'offrent alors: 


S1. Ne pas échanger de clé (c'est possible mais c'est long comme nous allons le voir dans la figure 
ci-dessous) 


S2. Échanger une clé secrète utilisant une fonction mathématique non inversible ou très difficilement 
inversible (c'est le protocole de Diffie-Hellman que nous verrons également dans une figure plus bas). 


Voyons en quoi consiste la première solution et son désavantage flagrant: 


| CADENAS CADEN2AS 
| ÿ CODE ALICE CODE BEHNAAN 
| 
1 
| 
[l | 
} 
| | 
f 
CADENAS CADENAS BERNARD | 
CODE ALICE CODE BÉHNARD ÿ | 
ET | 


BERNARD | 


ET 
CADENAS 
CODE BERNARD 


Figure: 61.5 - Principe du chiffrement à clé publique 


Explication: Alice et Bernard veulent transmettre un message sur une ligne non sécurisée et sans 
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échanger de clé. Pour cela, Alice met sa lettre dans un coffre qu'elle ferme avec sa clé et l'envoie à 
Bernard. Ce dernier renvoie le coffre à Alice où il a ajouté son propre cadenas qu'il a fermé avec sa 
propre clé. Quand Alice reçoit le coffre, elle ôte son cadenas et renvoie à Bernard un coffre qui ne 
comprend plus que le cadenas de Bernard fermé avec la clé de Bernard. Celui-ci n'a donc plus qu'à 
ouvrir le coffre pour lire la lettre. Cette opération est sûre et ne nécessite pas d'échange de clé. En 
revanche, elle requiert plusieurs trajets (l'ensemble est représenté par les 4 premières transactions de la 
figure ci-dessus). 


Le principe de la clé publique doit autoriser des échanges sécurisés, sans clé secrète, en un seul trajet. 
Bernard distribue largement des exemplaires de son cadenas public. Alice s'en procure un, mais 
n'importe qui pourrait faire de même. Alice place le message dans le coffre et le ferme avec le cadenas 
code de Bernard, puis elle lui envoie le coffre (représenté par la cinquième transaction de la figure 
ci-dessus). En recevant le coffre, Bernard peut ouvrir le coffre, puisque lui seul détient la clé qui ouvre 
ce cadenas. Le transfert est sûr en un seul voyage. En cryptographie, la clé publique équivaut au 
cadenas code, qui est disponible par exemple dans des annuaires, tandis que la clé qui ouvre ce cadenas 
est la clé privée, détenue uniquement par leur propriétaire et qui n'est jamais divulguée. Les clés privée 
et publique (le "trousseau de clé" comme on dit...) sont construites à partir d'une fonction 
mathématique supposée "à sens unique". 


Voyons donc maintenant la deuxième solution faisant usage de clé publique selon le protocole de 
Diffie-Hellman: 


3.1. PROTOCOLE DE DIFFIE-HELLMAN 


Comme son nom l'indique, une fonction à sens unique donne un résultat facilement, mais l'opération 
inverse est très difficile. Trouver de telles fonctions dans le monde mathématique semblait fort ardu aux 
mathématiciens. Comment imaginer une fonction qui soit à sens unique pour tout le monde, excepté 
pour son créateur qui peut l'inverser grâce à la connaissance d'une information particulière. Ainsi, W. 
Diffie et M. Hellman ont été les premiers à proposer publiquement une fonction à sens unique pour 
résoudre le problème de la mise en accord sur un secret commun. L'idée de base consiste à calculer des 
valeurs du type: 


æ mod(p) 


où & et a sont imposés comme étant des entiers et p un nombre premier. 


Les mathématiciens appelant ce genre d'opérations une "exponentiation modulaire" ou "exponentielle 
discrète" et il est d'usage de noter le corps fini des entiers modulo p (où p est un nombre premier) par 
GF(p) en l'honneur d'Évariste Galois. 


Pour expliciter un tel calcul (pour rappel de ce qui a été vu dans le chapitre de Théorie Des 
Nombres...), nous élevons un nombre & à la puissance a, puis nous divisons le résultat par un grand 
nombre premier p et nous conservons finalement le reste de cette division (opération modulo p). 


L'opération inverse est un problème redoutable: même si nous connaissons les valeurs numériques de 
æ,depet de &* modfp), il est extrêmement difficile en pratique de retrouver le bon nombre a. Les 


fonctions à sens unique telles que celle ci-dessus provenant de l'arithmétique modulaire se comportent 
de manière très irrégulière comme l'atteste le tableau avec l'exemple particulier ci-dessous: 
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a at=3 | &% mod(p) =3 mod(?) 
0 1 1 
1 3 3 
2 9 2 
3 27 6 
4 81 4 
5) 243 5) 
6 729 1 
7 2187 à 
8 6561 2 
Tableau: 61.3 - Exemple d'application de l'exponentiation modulaire 


Donc même s'il est facile de calculer une exponentielle discrète, il est presque impossible de retrouver 
le nombre de départ a à partir du résultat et ce particulièrement quand cette fonction modulaire 
s'applique à des nombres premiers p très grands. 


La sécurité de ce protocole est calculatoire. Elle se fonde sur l'hypothèse qu'avec une puissance de 
calcul et un temps limités, un adversaire ne peut inverser la fonction exponentielle modulaire (en 
faisant usage des propriétés des logarithmes avec les fonctions exponentielles comme nous l'avons vu 
dans le chapitre d'analyse fonctionnelle) et donc ne peut trouver le secret a à partir des éléments 
échangés. Cette difficulté calculatoire est due au fait que le temps de calcul nécessaire à l'inversion 
d'une fonction à sens unique n'a pas une complexité algorithmique (cf. chapitre de Méthodes 
Numériques) polynomiale mais exponentielle avec p. 
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Voyons un exemple schématique: 


On choisit un nombre arbitraire commun: p = 419 et un nombre aléatoire 


commun inférieur à p: æ = 7. On suppose que ces deux valeurs sont secrètes. 


Bernard choisit un 


nombre aléatoire secret: 
b= 344 


Alice choisit un nombre 
aléatoire secret: 4 = 178 


Avec le nombre b 
Bernard génère l'élément 
public: 

k, = mod(p})= 351 


Avec le nombre a Alice 
génère l'élément public: 
k, = &* mod(p) =181 


Envoi du résultat à 


= ———+# k, = 181 
Bernard-%e ” 181 
Envoi du résultat à Alice: 
= A ———————— 
k, = 351 k = 351 
Le secret partagé est Le secret partagé est 
alors: alors: 
K=(k, ÿ mod{p) = 493 £= (4) mod{p) = 493 


—— Les échanges sont alors chiffrés avec la clé secrète K —- 


Tableau: 61.4 - Exemple d'échange de clé entre Alice et Bernard 
Alice et Bernard ont calculé le même secret commun: 493. On se sert de 493 pour chiffrer les données 
échangées (dans la pratique, on utilise des nombres beaucoup plus grands). L'espion n'est supposé 


pouvoir intervenir qu'après l'échange du choix commun de p et &. 


Rappel: La clé K est obtenue par le fait que l'opération puissance est compatible avec la relation 
d'équivalence modulo p (cf. chapitre de Théorie Des Nombres) telle que: 


x mod{y)=z<e (x mod{y)}" = (x* mod(y)] =Zz (61.14) 
Exemple: 
5 mod(3) = 2, alors qu'avec w = 2 nous avons 5? mod{3?) # 2 ? alors que 5? mod(3) = 2°. 
Ainsi, puisque X $ ?, le second modulo n'a plus de sens donc nous pouvons écrire: 
(&) mod(p) = (a? mod(p)) mod(p) =(@ mod(p)}] = @*® mod(p) (6115) 
de même: 


(&) mod(p) = (af mod(p)) mod(p) = (af mod(p)) = d% mod(p) (6116) 
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et donc: 


(4) mod(p)=(&,) mod(p) =K 


Malgré ces précautions, des experts ont établi au début du 21ème siècle un record en utilisant un 
nouvel algorithme, ils ont réussi à inverser la fonction exponentielle modulaire pour un nombre p de 
120 chiffres (environ 400 bits), à l'aide d'un ordinateur intégrant quatre processeurs de 525 MHz. Ce 
record montre que la sécurité du protocole dépend grandement des progrès constants réalisés dans le 
domaine de la complexité algorithmique. 


L'astucieux schéma de Diffie-Hellman reste un schéma de principe. Son principal inconvénient est qu'il 
ne permet pas d'assurer les services de sécurité classiques: authentification des deux intervenants, 
contrôle de l'intégrité de la clé et anti-rejeu ( vérification qu'une information déjà transmise ne le soit 
pas à nouveau). Il s'ensuit qu'un attaquant peut, par exemple, usurper l'identité d'Alice en remplaçant 
l'élément public d'Alice par son propre élément public. Pour pallier à cet inconvénient, des versions 
sécurisées de ce protocole générique ont été publiées, par exemple un protocole nommé "STS" (Station 
To Station) qui utilise notamment la signature électronique pour assurer l'authentification des 
intervenants (voir plus loin). Cette stratégie est à la base de la connexion Internet sécurisée (IP Sec). 


Le protocole de Diffie-Hellman a ouvert la voie à toute une série d'algorithmes, celui du chiffrement à 
clé publique étant le premier. L'idée était de rompre la symétrie du chiffrement et du déchiffrement en 
utilisant les fonctions à sens unique. 


3.2. SYSTÈME RSA. 


Curieusement, le système de chiffrement R.S.A. le premier apparu dans la littérature est 
conceptuellement assez éloigné du protocole de Diffie-Hellman: il n'utilise pas l'exponentielle discrète, 
mais la factorisation des grands nombres. Ce système à clé publique a été inventé en 1977 par Ron 
Rivest, Adi Shamir et Leonard Adleman. Vite devenu un standard international, la technique R.S.A. a 
été commercialisée par plus de 400 entreprises et nous estimons que plus de 400 millions de logiciels 
l'utilisent. Elle est implémentée dans les navigateurs Web, comme Netscape Navigator, Microsoft 
Internet Explorer ou encore dans certaines cartes à puce bancaires, comme les cartes VISA. 


Le système RSA est fondé sur la difficulté de factoriser des grands nombres et la fonction à sens unique 
utilisée est une fonction "puissance". Le protocole de chiffrement R.S.A. se décompose en trois phases: 


1. Création des clés (publiques et privées) 
2. Chiffrement à l'aide de la clé publique du destinataire 
3. Déchiffrement à l'aide de la clé privée 


Zu 


Ce concept repose sur un théorème fameux appelé "théorème d'Euler" (rien à voir avec le théorème du 
même nom vu dans les chapitres de Théorie Des Graphes ou Formes Géométriques). Voyons de quoi il 
s'agit (attention c'est relativement long!). 


3.2.1. THÉORÈME D'EULER 


Avant de voir en quoi consiste le théorème d'Euler, il nous faut définir deux éléments qui y sont inclus. 
Outre le concept de congruence que nous avons déjà étudié dans le chapitre de Théorie des Nombres, il 
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reste une fonction spéciale appelée "indicatrice d'Euler" et définie en toute généralité par: 


PC) = >. 1 (61.18) 


Autrement dit, la fonction # du nombre entier m a pour résultat un nombre n strictement inférieur à m, 
donné par le nombre d'éléments compris entre 1 et m dont le p.g.c.d. (cf. chapitre de Théorie Des 
Ensembles) avec m est 1. Nous avons déjà donné un exemple pratique de l'utilité de cette fonction 
indicatrice dans le chapitre de Théorie Des Nombres dans le cadre des systèmes réduits de résidus et 
qui sont au centre de la démonstration du théorème d'Euler. 


Ce qui peut encore se formuler sous la forme suivante: l'indicateur # du nombre entier m est défini 
comme le nombre d'entiers positifs inférieurs ou égaux à m et premiers avec m. 


Cette fonction a donc la propriété remarquable de compter le nombre d'entiers positifs plus petits que m 
et "relativement premiers" (c'est-à-dire qui ont le p.g.c.d. égal à 1) avec m. 


Voici quelques valeurs de 0 à 19: 


#0 DAS EE 56 
CO RAMIATAIIT 
Ho + hol4 12/1618 /8/h16/6 /18 


Tableau: 61.5 - Valeurs de l'indicatrice d'Euler 


P1. Nous remarquons la propriété (triviale) de cette fonction lorsque nous notons un nombre premier 
(se rappeler que 1 n'est pas un nombre premier!) quelconque par la lettre p alors: 


gp) = p-1| (61.19) 


Remarque: Cette fonction se trouve parfois dans la littérature sous la dénomination "indicateur 
d'Euler" au lieu de "fonction phi d'Euler". 


P2. L'indicatrice d'Euler peut s'écrire aussi sous la forme suivante si p et q sont premiers (il s'agit du 
cadenas du système R.S.A qui est plus compliqué que la simple multiplication de p et q): 


ÊCr) = ÉCpa) = Ep) a) = Gp —D(g -1)] (61.20) 


cette dernière relation peut se vérifier aisément (sans démonstration) en prenant quelques valeurs du 
tableau précédent. 


Ceci fait, soit (&,#2) = 1 (le p.g.c.d. de a et m), le "théorème d'Euler" dit que si m est un entier naturel et 
a est relativement premier avec m alors nous avons: 


a%*) =1]mod(»)| (61.21) 


dans laquelle nous voyons apparaître l'indicatrice d'Euler définie juste plus haut. C'est une relation assez 
surprenante. Voyons si elle marche avec 7 et 2 qui sont premiers entre eux: 
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2809 21 mod() = #0) =2% =64=9.7+1 (6122) 


le reste étant donc bien 1 quand on fait 64 modulo 7. 
Démonstration: 


Rappelons d'abord (cf. chapitre de Théorie Des Nombres) qu'un système réduit de résidus modulo m est 
un ensemble d'entiers 7; qui satisfont les trois propriétés: 


P1. (n,m)=1 
P2. r; n'est pas congru >; modulo m lorsque i * j 
P3. Chaque entier x relativement premier avec m est congru à un certain 7; modulo m. 


Par exemple, l'ensemble {1,5} est un système réduit de résidus modulo 6 ou autre exemple; 
{1,2,3,4,5,6} est un système réduit de résidus modulo 7. Nous vérifions également pour le premier 
exemple, que 1 n'est pas congru 5 modulo 6 (effectivement, 6 ne divise pas (5-1)) et que 5 qui est 
relativement premier à 6 est congru à lui-même. 


Pour le deuxième, exemple, nous remarquons que le cardinal de l'ensemble de résidus correspond à la 
valeur de l'indicateur d'Euler pour le nombre 7. 


Ainsi, soit {nor ni un système réduit de résidus modulo m. Nous avons besoin pour la 


démonstration du théorème d'Euler, de démontrer au préalable que {ar,.ar, dt) est aussi un 


système réduit de résidus modulo m. 


Remarque: Comme nous en avons déjà fait mention dans l'exemple précédent, vous pouvez 
observer que le cardinal de l'ensemble des résidus correspond, pour un modulo m premier donné, au 
résultat défini par la propriété P1 de la fonction # d'Euler. Cette propriété n'est à ce jour qu'une 


"conjecture", c'est-à-dire une supposition fondée sur des probabilités (car non démontrée paraît-il! ). 


Pour cela, rappelons-nous que par la propriété d'un système réduit: 
et par hypothèse: 


alors nous voulons démontrer que: 
(ar,m)=1 (61.24) 
est aussi satisfait. 


Posons pour cela 4 =1 (par tradition...). Nous avons alors puisque (x ,##) = d que d | et dm et 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


identiquement pour (4,2) =d que 4 |a et que 4 | #7. Maintenant si d divise bien a ou r; dans ce cas 


nous avons que 4 |r(a) ou autrement 4 | af). Donc 4 |a'r# et 4 | #7 ce qui nous permet d'écrire: 


(ar,m) =(ra,m)=1 (61.25) 


Revenons à notre théorème d'Euler... si vous suivez toujours... Nous venons de démontrer qu'il y a 
bijection entre les deux ensembles de résidus. C'est-à-dire que pour chaque résidu 7; du système réduit 


modulo m, nous aurons un résidu &r, du système réduit modulo m selon la propriété fondamentale de la 


congruence qui rappelons-le dit que: nous pouvons multiplier les deux membres d'une congruence par 
un même nombre entier et il restera congru modulo m et modulo m multiplié par ce nombre entier. 


Exemple: 
Prenons: 

35 =5 mod{é) (61.26) 
effectivement: 

6|(35-5=30) (61.27) 
car le reste de la division de 30 par 6 est bien nul. Si nous prenons par exemple: 

2:35=2:5 mod(2'6) (61.28) 
alors nous avons également: 
121(70-10=60) (61.29) 

et le reste est aussi nul... 


Petit rappel sur la bijection (cf. chapitre de Théorie Des Ensembles): nous disons que nous avons une 
bijection, si à chaque élément d'un ensemble de départ correspond un et un seul élément dans 
l'ensemble d'arrivée (s'il y avait pour chaque homme sur Terre une femme - à proportions égales donc - 
il y aurait bijection entre l'ensemble des Hommes et des Femmes). 


Bref, comme il y a bijection entre les deux ensembles de résidus, nous pouvons écrire: 


Exemple: 


L'ensemble {1,5} est un système réduit de résidus modulo 6 comme nous l'avons déjà vu. Nous avons 
donc: 


(n,#i=(16)=1 
(n,m)=(5,6)=1 
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(61.31) 


Nous avons alors: 


gQm) #(6) 2 
[I % modé»r)=[ [7 mod(é) =] [x mod(é) =1.5=5 (6132) 


i=1 i=1 i=l 
Si nous prenons un a tel que {&,##2) = 1, par exemple 4 = 7 car effectivement (7,6) = 1, alors: 
7:5=5 mod(é) (61.33 
car 6[(35 - 5 = 30). Effectivement 6 divise bien 30 avec un reste nul. 


Donc revenons à notre bijection qui peut s'écrire par les règles élémentaires de l'algèbre: 


go gi] 
a] Tr = [[ mod{m) (61.34) 
il ii 


Puisque: 


(vous pouvez vérifier mais cela découle de la définition même d'un ensemble de résidus!), nous sommes 
bien obligés de conclure que: 


a%*} =1]mod(r”) (61.36) 


et de toute façon, même si cela ne vous semble pas évident, vous n'avez qu'à multiplier chacun des 
membres de l'égalité de la congruence par: 


im) \7! 
[] ñ (61.37) 
i 


comme nous l'autorise une des propriétés intrinsèque de la congruence démontrée précédemment. 


OIC.Q.F.D. 


Cet interlude théorie étant fait, considérons un nombre N dont nous souhaitons décider s'il est premier 
ou non. 


Nous savons d'après le théorème d'Euler et de la propriété P1 de l'indicateur d'Euler, que si N est un 
nombre premier et si 4 e N, où 4 < W, alors: 


a"? =1 mod(W)| (61.38) 


qui est appelé le "petit théorème de Fermat". 
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Remarque: Cette relation découle des propriétés que nous avons exposées lors de notre 
démonstration du théorème d'Euler: 


a%*} = 1 mod(r#) 
et de la propriété P1 de la fonction #{##) pour un nombre p premier: 


gp) =p-1 


Le petit théorème de Fermat est cependant également valable pour quelques nombres N qui ne sont pas 
premiers. Mais les nombres qui vérifient ça sans être premiers sont rares, et du coup ça vaut la peine de 
déclencher un algorithme plus sophistiqué pour savoir si N est réellement premier ou non (disons que 
dans ce cas, N est un bon candidat à la primalité et est alors appelé "nombre pseudo-premier"). Pour 
tester si le nombre, le cas échéant N non-premier est "suffisamment premier", on essaie avec un 
algorithme de tester le petit théorème de Fermat pour un nombre maximal de 4 « N avec 4 M. 


D'après la propriété de la congruence (voir plus haut), nous avons également: 
a a"T=g:] mod(N) = a" = a mod(WN) 


Nous pouvons appliquer ce dernier théorème sur un nombre N à propos duquel nous aimerions savoir 
au mieux s'il est premier ou non. 


Il existe une grande quantité d'autres méthodes non optimales pour déterminer si N est premier; dont les 
essais préliminaires de division par 2, 3, 5, 7, 11 et des nombres premiers petits jusqu'à » < 3 selon la 
méthode du crible d'Ératosthène qui est la plus connue dans les petites écoles. 


Remarque: En fait, avec l'aide d'un ordinateur assez puissant, nous pouvons décider si un nombre 
naturel de l'ordre de 109%? (10 suivi 300 zéros) est premier ou non en l'espace de quelques minutes 


voir secondes. Ce qu'il est important de savoir, c'est que, étant donné un nombre naturel N, on peut 
décider en relativement peu de temps s'il est premier ou non, sans pour autant connaître ses facteurs 
premiers. 


Cependant, selon le théorème fondamental de l'arithmétique nous avons que: 


Tout nombre naturel x > 1 peut s'écrire comme un produit de nombres premiers, et cette représentation 
est unique, à part l'ordre dans lequel les facteurs premiers sont disposés. 


Démonstration: 


Si n est premier, alors la preuve est terminée. Supposons que n n'est pas premier et considérons 
l'ensemble: 


D={d|d|neti<d<xr) 


Alors, D cN et, puisque n est supposé composé, nous avons que D # {i, D'après le principe du 
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bon ordre (tout ensemble non vide contient un plus petit élément), D possède un plus petit élément p, 


qui est premier, sans quoi le choix minimal de p, serait contredit. Nous pouvons donc écrire # = p,. 
Si », est premier, alors la preuve est terminée. Si x, est composé, alors nous répétons le même 
argument que précédemment et nous en déduisons l'existence d'un nombre premier », et d'un entier 
#, < », tels que x = »,p,#,. En poursuivant ainsi, nous arrivons forcément à la conclusion que #, sera 


premier. 


OIC.Q.F.D. 


Donc finalement nous avons bien démontré qu'un nombre quelconque est décomposable en facteurs de 
nombres premiers à l'aide du principe du bon ordre. Il existe dans l'ensemble des nombres naturels, 
certains qui peuvent s'exprimer, ou qui s'expriment tout court, uniquement par 2 facteurs premiers notés 
traditionnellement p et q. Ce sont ces nombres que nous utilisons en cryptographie à clé publique selon 
le protocole R.S.A. 


Remarque: Nous ne connaissons pas à ce jour de loi qui permette de calculer facilement et 
rapidement le n-ième facteur premier {p,) d'un nombre. En fait, même avec les ordinateurs les plus 


puissants d'aujourd'hui, il faudrait plusieurs années pour arriver à trouver les deux facteurs premiers 
p et q d'un nombre Ÿ = »g où p et q sont de l'ordre de 19° chacun. Et il semble peu probable que 
l'on découvre dans un avenir proche un algorithme assez efficace pour améliorer de façon 
appréciable ce temps de calcul. Notons qu'il est possible de déterminer en moins de 5 minutes (en 
2002) si un nombre de 200 chiffres est premier ou non. Cependant, pour factoriser un nombre de 
200 chiffres en deux nombres premiers, il faudrait au moins 100 ans. Chose merveilleuse: les 
théories qui permettent ces exploits sont très profondes et ont été élaborées en partie il y a 
longtemps dans un cadre très différent. 


Le fait qu'il soit beaucoup plus difficile de trouver les facteurs premiers d'un nombre N que de 
découvrir si N est premier ou composé, est précisément ce qui a permis d'élaborer cette méthode très 
ingénieuse de codage et décodage de messages selon le protocole R.S.A. 


Exemple: 


Considérons maintenant un groupe d'individus qui se transmettent régulièrement des messages par 
courrier électronique et pour lequel il est important que les messages ne soient connus que de 
l'expéditeur et du destinataire. Alors, le membre du groupe (ici Alice) qui souhaite recevoir des 
informations cryptées, se trouve deux nombres premiers p et q très grands de l'ordre de 19%°. Pour 
trouver de si grands nombres premiers, nous choisissons au hasard un nombre de 100 chiffres et nous 
vérifions par un des algorithmes connus s'il est premier ou non et nous répétons l'expérience jusqu'à ce 
que nous obtenions ainsi un nombre premier. Une fois ceci fait avec ces deux nombres premiers, nous 
calculons l'expression: 


# pq 
appelée "modulus". 


Ensuite, Alice qui souhaite recevoir les informations cryptées (qui est la seule en possession du nombre 
n pour l'instant) choisit un entier positif a tel (p.g.c.d.) que: 
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(a, @(n)) = 1 (61.44) 


Donc a (souvent noté e dans la littérature) est un entier premier avec #{x#) appelé parfois le 
"générateur". 


Et comme: 
dx) = SCpg) = Sp) ag) = (p— lg -D (6145) 


par conséquent, par essais répétés, il est facile de trouver un tel nombre a. Le membre principal, trouve 
donc un n et un a pour son contact, qu'il lui envoie sans aucune protection. Car, même dans le cas où il 
y aurait d'éventuels intercepteurs à l'affût sur la ligne, il leur sera extrêmement difficile de retrouver les 
facteurs premiers de n dans un laps de temps relativement bref. 


Supposons qu'une agence secrète souhaite recevoir un message d'un de ses agents. 


L'agence envoie la clé publique, définie donc par le couple: 


“ {a,#} (61.46) 


à l'agent. 


L'agent reçoit la clé publique et souhaite envoyer le message "déclencher l'opération rouge". Pour ce 

faire, l'agent transforme d'abord le message en chiffres en utilisant la convention que chaque lettre est 
remplacée par sa position correspondante dans l'alphabet en commençant à compter à partir de 01 (le 
caractère "espace" sera chiffré "27"). 


Ainsi le message clair noté M par la suite devient: 


M =04050312051403080518 27 ls 27 151605180120091514 27 1815210705 6147) 
1 | Re ner | (OL. 
DECLENCHER OPERATION 2GUGEF 


Point technique: il faut que M et n n'aient pas de diviseur commun autre que 1 (sinon quoi, un éventuel 
espion pourrait réduire le problème de deux très grands nombres difficilement manipulables à celui de 
plus petits nombres, plus facilement manipulables). Sinon quoi, on ajoute à la fin de M des chiffres sans 
valeur, comme 01 (par exemple), pour finalement avoir M et n sans diviseur commun autre que 1. On 
peut aussi briser M en morceaux Àf, dont le nombre de chiffres n'excède pas 99 (rappelez-vous que 


nous avions fixé une limite inférieure d'une puissance de 100 pour p et q et qu'il suffirait donc qu'un des 
deux nombres premiers soit 1 et l'autre exactement un nombre avec un exposant 100 pour être à limite 
du nombre n comportant alors au pire 100 chiffres), auquel cas on aura toujours: 


(M,,p) = (M,,g) = (M,,n) =1 (61.48) 
On découpe M en morceaux, chacun étant plus petit que n: 


Dee en Pa ARE us Se es seen 0705 (6149) 


Ms Ds Mo Mo Mi M 


M =04050312051403080518 27 ls 27 151605180120091514 27 1815210705 
DECLENCHER OPERATION ROUGE 
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et on travaille successivement avec chaque morceau f,,M,,...,M,, du message. 


On considère la puissance a de À4,, c'est-à-dire A7. On remplace À, par le nombre Àf,, qui est le 
reste de la division par n du nombre 447. On procède de même pour tous les autres morceaux Àf, tels 
que: 


M, = M? mod{x)| (61.50) 


L'agent envoie alors le message codé à l'agence: 


MAS à eu EN RE | RÉRRE | RER CARRE REY SRE À LÉRET E ER | (61.51) 
Dé D Dés Dés M MG D Ms M Mo di da 


Un intercepteur (non-mathématicien) du message codé et de la clé publique, connaissant l'algorithme de 
chiffrement, aurait donc à résoudre le problème d'une équation à deux inconnues (équation obtenue 
simplement à partir de l'expression mathématique du chiffrement): 


M, = tag + M, (61.52) 
Problème évidemment indéterminé ! 


Pour voir comment l'agence décrypte le message, on a besoin d'un outil mathématique supplémentaire. 


Rappelons que l'agence choisit a de telle que sorte que (a, #{x)} = 1, ce qui implique, d'après le 
théorème de Bézout (cf. chapitre de Théorie Des Nombres), que si a et gx) sont premiers entre eux 
(que leur plus grand diviseur commun est 1) il existe des entiers x et y tels que (on peut supposer que 
x > 0, auquel cas y < 0): 


ax + @(n)y =1 (61.53) 


ou autrement écrit: 


ax = 1 mod{#{#))| (61.54) 


C'est ainsi que nous allons déterminer la valeur de x (il faut utiliser des algorithmes pour trouver la 
solution x à cette équation). 


Ce qui signifie: 


1. Que si a est premier avec #{x) alors par les propriétés de la congruence il l'est également avec p-1 et 
q-1. 


2. Que a est inversible modulo #{x#) 
Effectivement, car: 
ax -1l=@(n)y (61.55) 


et d'après la définition de la congruence (## | (& —à) ) nous avons effectivement: 
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ax =1l mod{#{x#}) (61.56) 


puisque #{#) divise le membre de droite de 4x -1 = #{#}y et donc de par l'égalité, le membre de 
gauche. 


Seule l'agence, qui reçoit le message, peut facilement calculer le nombre x < 4 utilisé ci-dessus. Car 
pour cela, il faut pouvoir calculer la valeur de la fonction # indicatrice d'Euler et donc connaître p et q. 


Si M, est le message (valeur numérique) d'origine et Àf, est le message (valeur numérique) codé reçu, 


alors nous avons la relation suivante: 


MS = M, mod(x)| (61.57) 


Ce qui est complètement logique puisque la différence 47 - 


i 


où rappelons-le, Àf, est le reste de 


la division de À4Ÿ par n, ne peut donc qu'être divisible par n. 


L'agence reçoit donc le message codé j7 et élève à la puissance x les nombres Àf, et obtient ainsi le 


message initial. 


En effet, elle va appliquer pour chaque Àf, la propriété mathématique suivante de la congruence: 


M} = MF = M} = M, mod(x)| (6158) 


La clé privée (permettant de décrypter le message et qui peut être connue facilement uniquement par 
l'agence) est donc définie par le couple: 


“ {x,A} (61.59) 


Explications: 
Nous avions déjà montré que: 


M? = M, mod(x) (61.60) 


et selon la propriété de symétrie de la congruence (cf. chapitre de Théorie Des Nombres), nous pouvons 
écrire: 


M} = M, mod(») & M, = M} mod(»)| (61.61) 


Effectivement: 


MF = MF mod(x) (61.62) 


selon la deuxième principale propriété de la congruence qui dit que l'on peut élever à une même 
puissance les deux membres d'une congruence. Ce qui nous donne aussi directement: 


ME = MFP mod(x) (61.63) 
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puisque nous avons démontré précédemment que: 


ax + @{n)y =1 (61.64) 
donc que: 

ax =1-@{n)y (61.65) 
Reste à démontrer que: 

MF = M} mod(x) (61.66) 

où l'on peut écrire A}%%*} sous la forme: 

M, (4% ÿ” (61.67) 
Or, rappelez-vous que nous avons démontré le théorème d'Euler: 

M) =1 mod(x) (61.68) 


et qu'une des propriétés de la congruence nous donne le droit d'élever à une puissance quelconque les 
deux membres de la congruence tel que: 


—} - \ 

(4%) ={1)7 mod(x) (61.69) 

Mais comme 1 élevé à n'importe quelle puissance fait 1, nous avons: 
gui : 
(MA) #1 mod(x) (6170) 
Cette dernière relation nous permet donc de vérifier que l'on peut s'autoriser à écrire: 
M, (MSN) = M, modéx) (61.71) 
1 1 1 


Puisque les deux membres de gauche sont bien modulos n. 


Donc si on reprend tout ça, l'agence reçoit un morceau Âf, et l'élève par automatisme à la puissance x 
pour obtenir un nombre qui selon elle devrait être le Af, véritable. Pour en être sûr, elle applique la 
vérification imparable: 


MF = M, mod(x) (61.72) 


Il est facile de voir que tout intercepteur ne peut décoder et en plus vérifier si le décodage est bien le 
bon, car pour cela il devrait connaître la valeur de x, laquelle à son tour dépend de #{x#), qu'il ne 
connaît pas non plus, parce qu'il ne connaît pas les facteurs premiers de n. 


Il est d'usage de dire que le système RSA utilise les nombres p, q (secrets), n (publique), a (publique) et 
x (secret). Le tout se résumant au triplet n, a, x noté parfois dans la littérature n, e, d. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Clé publique: (a,#) 

avec x =p4,la,@{n)\=1 
Clé privée: (x,x#) 

avec ax = lmodi gx) 


= 


Agent >. 2 I 


Lx 
Message M Ha M mod) NET 200 


if 


Figure: 61.6 - Principe du chiffrement à clé publique RSA 
Et une petite application pratique avec Maple 4.00b: 


> #initialisation du générateur aléatoire de Maple 4.00b 
> randomize(): 

> #définition de la taille souhaitée du modulus (c'est un nombre pair) 
> t:=30: 

> #génération de deux entiers de t/2 bits 

> x:=rand(2/(t/2-1)..2/(t/2))(); 

> y:=rand(2/(t/2-1)..2/(t/2))(); 

> #calcul des nombres premiers qui suivent 
> p:=nextprime(x); 

> q:=nextprime(y); 

> #modulus public de la clé RSA 

7 RE=p*q; 

> phi=(p-1)*(q-1); 

> #on choisit a empiriquement 

> a:=65537; 

> #on vérifie qu'il est premier avec phi 

> igcd(a,phi); 

> #on calcule l'inverse de a modulo phi 

> x:=1/a mod phi; 

> #on choisit un message comme étant 1234 
> m:=1234; 

> # on code 

> c:=m&/a mod n; 

> # on décode 

> c&/x mod n; 


Suite à la demande d'un lecteur voici un résumé littéral de ce que nous avons vu jusqu'à maintenant 
pour les premières étapes de l'algorithme ci-dessus: 


1) Nous choisissons p et q premiers suffisamment grands: 
p=5939=613 (6173) 


nous avons alors: 
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n=p.4=593.613= 363 509 


2) Nous calculons l'indicatrice d'Euler: 
g(n)=(p-1l.(g—-11=(593-11.(613-11= 592.612 = 362'304 
3) Nous choisissons le générateur a tel que: 
(a, g(n)l=1 


et pour cela nous prendrons a = 5. Le couple (n, a) est la clé publique (peut être distribuée à tout le 
monde pendant un temps déterminé). 


4) Ensuite, nous calculons: 


._ imod gr) _ 362'304+1 


& 


=72'461 


Donc le couple (x, a) est la clé privée (à garder secrète). 


Pour des raisons de sécurité, la cryptographie à clé publique est utilisée conjointement avec la 
cryptographie à clé secrète. Par exemple, au jour de l'écriture de ces lignes, le protocole SSL pour les 
pages Internet utilise le RSA pour échanger une clé secrète (système symétrique) et crypte ensuite les 
données grâce à un algorithme symétrique classique. 


Signalons en terminant cette brève présentation du codage des messages, que le gouvernement 
américain surveille de très près les activités des mathématiciens qui travaillent sur la factorisation des 
grands nombres. En effet, si un de ceux-ci arrivait à trouver un algorithme permettant de factoriser en 
peu de temps un nombre de deux cents chiffres (supérieur à 524 bits non signé), cela mettrait en péril le 
caractère secret de plusieurs communications d'ordre militaire. Cette surveillance a d'ailleurs soulevé 
aux États-Unis un mouvement de protestation de la part des hommes de sciences, qui voient ainsi 
brimer leur liberté professionnelle (Notices of American Mathematical Society, janvier 1983). 


Pour information technique, le logiciel PGP (Pretty Good Privacy) du MIT, utilise un système de 
chiffrement RSA. 


4. FONCTIONS DE HACHAGE 


Une fonction de hash (anglicisme) ou fonction de hachage est une fonction qui associe à un grand 
ensemble de données un ensemble beaucoup plus petit (de l'ordre de quelques centaines de bits) qui est 
caractéristique de l'ensemble de départ . Cette propriété fait qu'elle est très utilisée en informatique, en 
particulier pour accéder rapidement à des données grâce à des "tables de hachage". En effet, une 
fonction de hachage permet d'associer à une chaîne de caractères un entier particulier. Ainsi, si nous 
connaissons l'empreinte des chaînes de caractères stockées, nous pouvons rapidement vérifier si une 
chaîne se trouve ou non dans cette table (en O(1) si la fonction de hachage est suffisamment bonne). 
Les fonctions de hachage sont aussi extrêmement utiles en cryptographie pour accélérer le cryptage. 


Les 2 algorithmes de condensation les plus utilisés sont le "SHA"' (Secure Hash Algorithm) qui calcule 
un résumé de 160 bits, et le MD5 (Message Digest 5 - Run Rivest 1992), qui calcule un résumé de 128 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


bits nommé "Message Digest". 


4.1. FONCTION DE CONDENSATION MESSAGE DIGEST MD5 


Cet algorithme est (était) surtout utilisé pour les signatures numériques (notion utilisée, lors de la 
validation de certificats d'authenticité comme nous le verrons plus loin). 


Voici les différentes étapes de son fonctionnement: 
Étape 1: Complétion 


Le message est constitué de b bits. On complète le message par un 1, et suffisamment de 0 pour que le 
message étendu ait une longueur multiple de 512 bits. Après ce traitement initial, on manipule le texte 
d'entrée par blocs de 512 bits divisés en 16 sous-blocs Mfi] de 32 bits. 


Étape 2: Initialisation 


On définit les variables de chaînage de 32 bits À, B, C et D initialisées ainsi (les chiffres sont 
hexadécimaux): 


A=01234567, B-89ABCDEF, C-FEDCBA98, D-76543210 


On définit aussi 4 fonctions non linéaires F, G, H et I, qui prennent des arguments codés sur 32 bits, et 
renvoient une valeur sur 32 bits, les opérations se faisant bit à bit. 


F(X, Y,Z) = (X AND Y) OR (NOT(X) AND Z) 
G{X, Y,2) = (X AND Z) OR (Y AND NOT(Z)) 
H(X, Y,Z) = X XOR Y XORZ 

I(X, Y,Z) = Y XOR (X OR NOT(Z)) 


Ce qu'il y a d'important avec ces 4 fonctions est que si les bits de leurs arguments X, Y et Z sont 
indépendants, les bits du résultat le sont aussi. 


Étape 3: Calcul itératif 


La boucle principale a 4 rondes qui utilisent chacune une fonction non linéaire différente (d'où le fait 
qu'il y en ait 4...). Chaque ronde consiste donc en 16 exécutions d'une opération (car 16 sous-blocs). 


Chaque opération calcule une fonction non linéaire de trois des variables À, B, C et D, y ajoute un 
sous-bloc Mi] du texte à chiffrer, une constante s prédéfinie (codée sur 32 bits) et effectue un décalage 
circulaire vers la gauche, d'un nombre variable n de bits. Voici l'exemple pour A: 


- A =B + À + F(B,C,D) + Mfi] + s | décalé circulairement de n vers la gauche 
- À =B + À + G(B,C,D) + Mfi] + s | décalé circulairement de n vers la gauche 
- A =B + À + H(B,C,D) + Mfi] + s | décalé circulairement de n vers la gauche 
- A =B + À + I(B,C,D) + Mfi] +s | décalé circulairement de n vers la gauche 


Cette nouvelle valeur de A est ensuite sommée avec l'ancienne. 
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Étape 4: Ecriture du résumé 


Le résumé sur 128 bits est obtenu en mettant bout à bout les 4 variables de chaînage A, B, C, D de 32 
bits obtenues à la fin de l'itération. 


La fonction MDS5 n'est pas sûre et pas unique (deux entrées différentes peuvent donner la même 
signature: nous parlons alors de collision). Cependant, la fonction MD reste encore largement utilisée 
comme outil de vérification lors des téléchargements et l'utilisateur peut valider l'intégrité de la version 
téléchargée grâce à l'empreinte. Ceci peut se faire avec un programme comme md5sum pour MDS et 
shalsum pour SHA-1. ( | e rrecteurs). 


Voici l'empreinte (appelée abusivement "signature") obtenue sur une phrase (que nous avons pris sans 
accents): 


MDS5("Wikipedia, l'encyclopedie libre et gratuite") = d6aa97d33d459ea3670056e737c99a3d 
En modifiant un caractère, cette empreinte change radicalement: 
MDS5("Wikipedia, l'encyclopedie libre et gratuitE") = 5da8aa7126701c9840f99f8e9fa54976 


Très concrètement, la vérification de l'empreinte ou somme de contrôle MDS peut être réalisée de la 
façon suivante: lors du téléchargement d'un programme, nous notons la série de caractères indiquée sur 
la page de téléchargement. Quand ce téléchargement est terminé, nous lançons un des utilitaires 
susmentionné. 


5. FONCTION DE CONDENSATION SECURE HASH ALGORITHM SHA:-1 


Le SHA-1 est (était) utilisé en concurrence du MD pour les signatures numériques (Digital Signature 
Algorithm) comme spécifié par le Digital Signature Standard (DSS). Pour un message de longueur 
inférieure à 2, le SHA-1 génère un condensé de 160 bits du message appelé "hash". À nouveau, à 
l'identique du MD5, une modification infime du message d'origine doit avoir une grosse répercussion 
sur le message condensé et il ne doit pas exister de Message Digest identique pour deux messages 
d'origine différente. 


Comme pour le MD5, on travaille sur des messages dont la longueur est un multiple de 512 bits. 
Étape 1: Complétion 


Si le message n'a pas une longueur de 512 bits, on rajoute autant de 1 que nécessaire à la fin de ce 
dernier. Les derniers 64 bits du bloc de 512 bits sont utilisés pour définir la longueur d'origine du 
message. On transforme ensuite le bloc de 512 bits en sous-blocs MT i ] de 32 bits chacun exprimés en 
hexadécimal (0 £i £15). 


Étape 2: Initialisation 


Comme pour le MD, on définit cette fois 80 variables de chaïînage de 32 bits K{i] initialisées ainsi (les 
chiffres sont hexadécimaux): 


KI[t] =01234567 |0 £# 19 
KIt] =89ABCDEF | 20 £ # < 39 
K[t] =FEDCBA9B8 | 40 £ £ < 59 
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K[t] =76543210 | 60 < £ < 79 


On définit aussi 80 fonctions non linéaires F[0],F[1] , F[2], …, F[79] qui prennent des arguments codés 
sur 32 bits, et renvoient une valeur sur 32 bits, les opérations se faisant bit à bit. 


FTtI(X, Y,2) = (X AND Y) OR (NOT(X) AND 2) | 0 <££ <19 

Ft] (X,Y,2) = (X XOR Y) XOR D | 204 < 39 

Flt] (X,Y,2) = (X AND Y)OR(XANDZ)OR(Y ANDZ)|40£#£ 59 
Ft] (X,Y,Z) = X XOR Y XOR Z| 60 £ 5 £ 79 


Ce qu'il y a d'important avec ces 80 fonctions est que si les bits de leurs arguments X,Y et Z sont 
indépendants, les bits du résultat le sont aussi. 


Étape 3: Calcul Itératif 


L'itération utilise deux buffers, chacun consistant en l'utilisation de 5 variables de chaînage. Les 
variables de chaînage du premier buffer sont notées À, B, C, D, E. Le second paquet de 5 contient les 
variables de chaînage notées H[0], H[1], H[2], Hf3], Hf41]. 


Par ailleurs, notons S° le décalage circulaire de n bits vers la gauche 
Voici l'algorithme SHA-1: 


Pour t = 16 à 79 faire 
Mt] = S'(MIt-16] XOR Mt-15] XOR M [t-14] XOR M [t-13]) 
Fin Pour 
A = H[0]; B = H{1]; C = H[2]; D = H[3]; E = Hf4] 
Pour t = 0 à 79 faire 
TEMP = S°(A) + F[t](B,C,D) + E + M{t] + KIt] 
E =D; D=C;C=S(B); B= A; À = TEMP 
Fin Pour 
H[0] = H[0] + A; H[1] = H[1] + B: H[2] = H[2] + C, H[3] = H{3] + D, H[4] = H[4] +E 


Après l'exécution de cet algorithme, on obtient un message 160 bits (5x32) représentés par les 5 
variables de chaînage H[0], H[1], H[2], H{3], Hf4]. 


6. CERTIFICATS D'AUTHENTIFICATION 


Nous avons vu lors de la cryptographie à clé publique et à clé secrète, qu'il subsistait une faille dans le 
système de transmission des clés au début de la communication. 


Ainsi dans les deux systèmes, la faille réside dans le fait que quelqu'un de malveillant puisse se 
substituer à l'interlocuteur réel et envoyer ainsi soit une fausse clé secrète, soit une fausse clé publique 
(en fonction des cas). 


Ainsi, un certificat d'authenticité permet d'associer une clé à une entité (une personne, une machine, ….) 
afin d'en assurer la validité (l'association à la "vraie personne"). Le certificat est en quelque sorte la 
carte d'identité de la clé ou la "signature numérique", délivrée par un organisme appelé "autorité de 
certification". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


La technologie faisant usage des signatures numériques fait partie d'un ensemble plus vaste connu sous 
l'acronyme "PKI" (Public Key Infrastructure). L'ensemble se déroule moyennant des certificats que 
vous pouvez obtenir auprès d'une Autorité de certification (voir exemple plus bas). Lorsque vous 
demandez votre certificat, votre ordinateur crée la paire de clefs composées d'une clé privée (la jaune 
sur le schéma) et une clé publique (la noire). Votre clé privée est secrète et c'est seulement vous qui y 
avez accès alors que la clé publique est librement disponible pour tout le monde. Votre clef publique 
sera attachée à votre certificat que vous obtiendrez de la part de l'autorité de certification à qui vous 
avez remis Votre demande de certificat. 


Le PKI (sur lequel est basée la connexion IPSec) vise essentiellement 4 points importants: 


1. l'authentification (le destinataire de votre courriel doit pouvoir vérifier que c'est bien vous qui avez 
envoyé l'objet et pas un autre). Une personne peut intercepter votre mail, extraire votre mot de passe, 
etc. 


2. l'intégrité (s'assurer que le contenu n'a pas été changé en chemin). 
3. la confidentialité (s'assurer que le contenu n'est lisible que par le destinataire). 
4. la non-répudiation (découlant des 3 premiers points) 


L'autorité de certification est chargée de délivrer les certificats, de leur assigner une date de validité (1 
jour), ainsi que de révoquer éventuellement des certificats avant cette date en cas de compromission de 
la clé. 


Les certificats sont de petits fichiers divisés en deux parties: 
- La partie contenant les informations 
- La partie contenant la signature de l'autorité de certification (voir Internet Explorer) 


La structure des certificats est normalisée par le standard X.509 de l'Unition Internation des 
Télécommunication (UIT), qui définit les informations contenues dans le certificat: 


- Le nom de l'autorité de certification (VeriSign par exemple) 

- Le nom du propriétaire du certificat (la banque UBS par exemple) 
- La date de validité du certificat (1 jour à partir de la date courante) 
- L'algorithme de chiffrement utilisé (MD5SRSA) 

- La clé publique du propriétaire 

Voici un très bon exemple: 


Pour signer le message que vous expédiez (point (5) sur le schéma ci-dessous), il suffit en effet de lui 
appliquer une fonction de hachage (point (1)) qui produit un résumé (code haché) du message (les 
algorithmes de hachage les plus connus sont le MD5 (128 bits (Message Digest 5)) et le SHA-1 (160 
bits (Secure Hash Algorithm 1)). Le résumé obtenu est propre à chaque message, à l'image d'une 
empreinte digitale. Cet algorithme assure que si un seul bit du texte original est modifié et si l'on 
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refaisait un nouveau hachage (empreinte), ce dernier serait radicalement différent du premier. Le code 
haché peut ensuite être chiffré à l'aide de votre clé privée et annexé à votre message (points (2) et (3)). 
C'est ce code qui constitue la signature numérique. Le destinataire du message (point (6)) peut ensuite 
vérifier que vous en êtes bien l'expéditeur en déchiffrant la signature numérique (point (7)), au moyen 
de votre clé publique (point (8)), que vous lui avez transmis automatiquement avec le mail (point (4)), 
pour obtenir le code haché (point (9)). Le destinataire applique ensuite la même fonction de hachage au 
message reçu (point (10) sur le schéma); si les deux codes (points 11 et 12 sur le schéma) sont 
identiques, vous êtes bien l'expéditeur du message (authentification) et le message n'a pas été altéré 
(intégrité). 


Md5gou Shc1 


Figure: 61.7 - Principe des certificats d'authentification 1/2 


Tout cela a l'air bien compliqué, mais en pratique, vous n'avez qu'à cliquer sur une icône à l'écran pour 
lancer tout le processus. 


Sinon voyons un autre schéma peut-être un peu plus clair: 


Autorité de certification 


Figure: 61.8 - Principe des certificats d'authentification 2/2 (source: Dossier Pour La Science) 


1. Alice utilise une clé secrète (a) ainsi qu'une clé publique (b) reçue d'une autorité de certification qui 
a transmis par courrier classique les clés privée et publique à Alice dans une carte à puce contenant un 
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certificat numérique (c). Sur ce certificat, se trouve aussi la signature de l'autorité de certification, 
laquelle peut être vérifiée par toute personne (ou logiciel) connaissant ou pouvant accéder à la clé 
publique de cet organisme. 


2. Le clé publique (d) de l'autorité de certification est fournie à ceux qui en ont besoin, Bernard par 
exemple. Cette clé peut être incluse dans les programmes de navigation sur le réseau Internet et dans 
d'autres logiciels utilisés pour les communications informatiques sécurisées. 


3. Alice signe numériquement le message qu'elle envoie à Bernard. Tout d'abord, elle crée un condensé 
du message en lui appliquant une fonction de hachage. Le condensé ainsi créé est ensuite chiffré à 
l'aide de la clé secrète d'Alice ce qui donne la signature numérique du message (e). Cette signature est 
envoyée à Bernard en même temps que le message crypté ( f ) et la clé publique. 


4. Bernard utilise la clé publique de l'autorité de certification pour vérifier si la signature numérique 
officielle apposée sur le certificat est authentique et que la clé publique qui l'accompagne est celle 
d'Alice. Il utilise alors cette clé pour déchiffrer la signature numérique d'Alice et obtient le condensé du 
message. Enfin, Bernard applique la fonction de hachage au message envoyé par Alice et obtient ainsi 
un condensé du message. Si ce condensé est identique à celui qui est obtenu par le chiffrage numérique 
d'Alice, Bernard est certain que le message provient bien d'Alice et qu'il n'a pas été altéré par une tierce 
personne. 


7. CRYPTOGRAPHIE QUANTIQUE 


La "cryptographie quantique" est une expression médiatique, mais quelque peu trompeuse: en effet, il 
ne s'agit pas de chiffrer un message à l'aide de la physique quantique, mais d'utiliser celle-ci pour 
s'assurer que la transmission de la clé n'a pas été espionnée. Comme nous l'avons déjà expliqué en 
informatique quantique, la transmission d'un message, chiffré ou non, peut se faire en utilisant les deux 
états de polarisation linéaire orthogonaux d'un photon, par exemple |x},|y}. Nous pouvons décider 


d'attribuer par convention la valeur 1 à la polarisation |x} et la valeur 0 à la polarisation |y}: chaque 


photon transporte donc un bit d'information. Tout message chiffré ou non peut être alors écrit en 
langage binaire, comme une suite de 0 et 1, et le message 1001110 sera codé par Alice grâce à la 
séquence de photons xyyxxxy, qu'elle expédiera à Bob par exemple par une fibre optique. À l'aide d'une 
lame biréfringente, Bob sépare les photons de polarisation verticale et horizontale et deux détecteurs 
placés derrière la lame lui permettent de décider si le photon était polarisé horizontalement ou 
verticalement: 
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axe optique 


O0 


lame 
biréfringente 


Figure: 61.9 - Expérience de pensée pour la cryptographie quantique 


il peut donc reconstituer le message. S'il s'agissait d'un message ordinaire, il y aurait bien sûr des façons 
bien plus simples et efficaces de le transmettre! Remarquons simplement que si Eve s'installe sur la 
fibre, détecte les photons et renvoie à Bob des photons de polarisation identique à ceux expédiés par 
Alice, Bob ne peut pas savoir que la ligne a été espionnée. Il en serait de même pour tout dispositif 
fonctionnant de façon classique (c'est-à-dire sans utiliser le principe de superposition): si l'espion prend 
suffisamment de précautions, il est indétectable. 


C'est ici que la physique quantique et le principe de superposition viennent au secours d'Alice et de 
Bob, en leur permettant de s'assurer que leur message n'a pas été intercepté. Ce message n'a pas besoin 
d'être long (le système de transmission par la polarisation est à ce jour très peu performant). Il s'agira en 
général de transmettre une clé permettant de chiffrer un message ultérieur, clé qui pourra être 
remplacée à la demande. Tout ceci satisfaisant le principe de Kerckhoffs. 


Avant de passer à la partie très formelle, voyons le principe (vulgarisé) de fonctionnement de ce 
système: 


Dans le transport de "clé quantique", l'information est donc transportée par les photons. Chaque photon 
peut être polarisé, c'est-à-dire que l'on impose une direction à son champ électrique (cf. chapitre 
d'Optique Ondulatoire). 


La polarisation est mesurée par un angle qui varie de 0° à 180°. Dans le protocole que nous décrivons la 
polarisation peut prendre 4 valeurs: 0°, 45°, 90°, 135°. Pour les photons polarisés à 0° et à 90°, nous 
parlons de "polarisation rectiligne", pour ceux polarisés à 45° et à 135°, de "polarisation diagonale": 


Polarisation : 0° 00° 135° 


Figure: 61.10 - Rappels de quelques polarisations classiques 


Il nous faut pouvoir détecter la polarisation des photons. Pour cela, nous utilisons un filtre polarisant 
suivi d'un détecteur de photons. Si un photon polarisé à 0° rencontre un filtre polarisant orienté à 0°, il 
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traverse ce filtre polarisant et est enregistré par le détecteur placé juste après. Si un photon polarisé à 
90° rencontre le même filtre, il est immédiatement stoppé, et le détecteur n'enregistre rien. Maintenant, 
si le photon est polarisé diagonalement (45° ou 135°), une fois sur deux, il traverse le filtre 
(superposition de deux états polarisés de manière rectiligne), et une fois sur deux, il est stoppé. Si nous 
pouvons distinguer entre une polarisation à 0° et à 90°, il est impossible de distinguer en même temps 
entre une polarisation à 45° et à 135°! De la même façon, on peut utiliser un filtre polarisant orienté à 
45°: il laisse passer les photons polarisés à 45°, stoppe ceux polarisés à 135°, et se comporte 
aléatoirement avec ceux à 0° et 90°! 


Rien 


V4 — 


Traversée d'un filtre rectiligne 


Figure: 61.11 - Passage à travers un filtre polarisant 


Décrivons alors le protocole qu'Alice et Bob doivent respecter pour qu'Alice envoie à Bob une clé 
secrête constituée de O0 et de 1; ils disposent de 2 canaux d'échange: un "canal quantique", où ils 
peuvent s'échanger des photons polarisés, et un canal radio (non protégé) par lequel ils peuvent 
discuter. Ils conviennent avant que les photons polarisés à 0° ou 45° représentent 0, et ceux polarisés à 
90° ou 135° représentent 1. Alice émet, sur le canal quantique, une suite de photons polarisés au hasard 
parmi 0°, 45°, 90° et 135°. À l'autre bout, Bob reçoit les photons et mesure aléatoirement ou leur 
polarisation rectiligne (filtre placé à 0°), ou leur polarisation diagonale (filtre placé à 45°). Si le photon 
traverse le filtre, Bob note 0, sinon il note 1. 


Bien sûr, certaines mesures de Bob (en moyenne, une sur deux) n'ont pas d'intérêt (c'est là que toute 
l'astuce réside !!!): il a pu essayer de mesurer la polarisation rectiligne d'un photon polarisé à 45°, ce qui 
n'a pas de sens et donne un résultat aléatoire (par exemple, le photon a été bloqué par le filtre, Bob note 
donc 1 alors qu'Alice avait envoyé 0). Pour éliminer ces bits sans sens, il indique à Alice, par le canal 
radio, quel type de mesure (rectiligne ou diagonale) il a faite pour chaque photon. Par le même canal 
radio, Alice lui indique quelles sont les mesures correctes (photon polarisé à 0° ou 90° avec filtre 
rectiligne, photon à 45° ou 135° avec filtre diagonal), dans l'exemple ci-dessous la 1, la 3, la 4, et la 7. 
Les bits 1,3,4,7 sont désormais connus à la fois de Bob et d'Alice, et constituent leur clé secrète 
commune. 


Dans la figure ci-dessous qui représente donc de façon schématique le concept, il ne faut pas oublier 
que la valeur peut être correcte mais non fiable. Ainsi, l'arbre de décision est le suivant (afin que les 
choses soient bien claires!): 


- soit la valeur fournie par Bob est incorrecte et on élimine la colonne 
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- soit la valeur est correcte et le filtre est adéquat: cela devient une valeur de la clé 
- soit la valeur est correcte mais le filtrage est aléatoire: pour toute sûreté on élimine la colonne. 


Alice met des 
photons 


Voleur en bit : 


Bob reçoit les 
photons à travers 
un filtre 


Le photon passe? 
Valeur en br 


Canal radio 
Bob : ma mesure 
Alice : fiéble 


Cié 
reconstituée 


Figure: 61.12 - Principe général résumé 


Il faut encore vérifier que ce protocole est sûr. Si Caroline écoute le canal quantique, elle peut faire la 
même chose que Bob: intercepter les photons en plaçant un filtre polarisant tantôt rectiligne, tantôt 
diagonal. Pour que Bob ne se doute de rien, elle doit réémettre un photon polarisé. Elle va essayer 
d'envoyer le même photon qu'Alice, mais comme elle a une chance sur deux d'avoir choisi le mauvais 
filtre, elle a une chance sur deux de se tromper. Quand Bob reçoit le photon, s'il est mal polarisé par 
Caroline, il a une chance sur deux d'avoir un résultat différent d'avec le photon original, et finalement, 
pour chaque photon intercepté par Caroline, il y a une chance sur 4 que Bob reçoive une information 
erronée. 


Alice et Bob décident alors de "sacrifier" une partie de leur clé commune. Parmi tous les bits qu'ils ont 
en commun, ils en choisissent quelques-uns au hasard, et les compare publiquement par le canal radio: 
s'ils sont différents, ils ont une preuve qu'ils ont été écoutés, et ils oublient vite cette clé. En comparant 
suffisamment de bits, ils ont une garantie presque absolue de ne pas avoir été écoutés. 


Alice émet des 
photons 


Voleur en bit : 


5 == Z 4 === 
1 (e] | 
© 


Elle lt: 


0 0 ) ) 1 | 
et réemer : 0 nn @) =) Ÿ bd Î ) 
| Z%==E=|=E=# 


Le photon passe? OUI NON NON gr té HOW + OUI 7 
Valeur en bit 0 1 1 


{Canal radio» 
Bob : mo mesure 
Alice : fidble 


Cw 
réconstrtute 


Figure: 61.13 - En cas d'interception 
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Puis... Bob: j'ai peur que nous ayons été espionnés, sacrifions le premier bit de notre clé - j'obtiens 1. 
Alice: je t'avais envoyé O0, nous avons été espionnés.. 


Remarquons que même non repérée, Caroline n'avait pas la bonne clé, puisque le troisième bit de la clé 
qu'elle obtient (par rapport à la clé reconstituée d'Alice et Bob) est 0 alors qu'Alice avait envoyé 1 ! 


Remarque: Le protocole décrit ci-dessus est appelé BB84, du nom de ses inventeurs Bennett et 
Brassard. 


Passons maintenant à la partie formelle (il faut si possible avoir parcouru le début du chapitre 
d'informatique quantique au préalable). 


Les états du système quantique sont les états de polarisation d'un photon: les mesures (de l'observable) 
auront aussi pour valeur ses états de polarisation. Les mesures possibles seront du type: 


nous noterons les états correspondants |v, },| } (base orthonormée de l'espace des états (de 
polarisation): c'est la base H/V (Horizontale/Verticale). 


Prenons plusieurs cas: 


C1. Soit un photon dans l'état |[w} = |v,} alors comme nous l'avons vu en informatique quantique, nous 


aurons: 


P(T=1)=P(1=4) 


| 
P(T=0)=P(A=4)-0 (61.79) 


C2. Soit un photon dans l'état: 


Remarques: 


R1. Cette (fameuse) valeur est choisie à des fins de normalisation telle que dy =]!!! Beaucoup 
de gens se posent la question d'où vient la racine carrée en informatique quantique. La réponse est 
simplement pour la normalisation. 


TRES 


R2. Notons que ce photon n'est pas polarisé dans la direction "v, +" (c'est-à-dire dans la direction 


oblique) mais est dans une superposition quantique de ces deux polarisations. 


Alors (nous appliquons comme nous l'avons vu dans le chapitre d'Informatique Quantique, le test [vo ) à 
l'état [y : 
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Sctences.cH 
OO 


m)tlv 1 
Cr ] = 1 pe)+Gbof 


HT 


Remarque: Rappelons que sur ce site, nous notons en physique quantique le module d'un nombre 
complexe et la norme, indistinctement par le symbole | || donc attention aux confusions! 


Pc = 6h - éebe)+ Gb 


PL | 


(61.81) 


ne 


et: 


PO = [ta ll - 


8. CRYPTOGRAPHIE ALTERNATIVE 


Les mathématiciens s'aventurent parfois hors des sentiers battus de la théorie des nombres: ils inventent 
des cryptosystèmes fondés sur des tresses ou des réseaux (théorie des noeuds et des graphes). Les 
physiciens ne sont pas en reste et proposent des méthodes de chiffrement qui utilisent la théorie du 
chaos ou la physique quantique. Cette dernière apporterait une solution définitive au délicat problème 
de l'échange de clés et mettrait en péril les cryptosystèmes fondés sur la factorisation. 


La plupart de ces méthodes sortent pour l'instant du contexte du contenu de ce site mais on peut citer 
cependant: 


- l'algorithme LLL basé sur la structure en maille d'ensembles de nombres et se basant sur le théorème 
de Minkowski assurant que le contenu d'un disque de rayon donné en un point contient au moins un 
autre point du réseau 


- la cryptographie ultravariable dans laquelle les données passent par des systèmes d'équations 
quadratiques superposées. 


- l'hyperchaos optique, obtenu par le passage d'un LASER dans un anneau d'IKEDA dans lequel se 
présente un matériau non linéaire en longueur d'onde. 


- la cryptographie quantique, basée sur le principe d'incertitude de Heisenberg et l'implication de 
l'annulation des transferts de données. Les scientifiques cherchent aujourd'hui des moyens de 
communication moins onéreux des clés quantiques en utilisant entre autres, les propriétés du condensat 
de Bose-Einstein qui permettrait de contrôler l'émission de photons ainsi que la transmission 
instantanée d'un message sans liaison physique. 


L'avenir nous dira le reste! 
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Notes personnelles: 
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62. AUTOMATES (THÉORIE DES LANGAGES) 


L. propos de ce chapitre est d'étudier le fonctionnement théorique du concept ordinateur, ou 


machine. Nous nous situons ici au niveau des mathématiques et de la logique mathématique, 
indépendamment de toute référence à une machine (ou un logiciel) concrète existante. Nous nous 
pencherons sur la façon dont cette machine théorique va prendre connaissance de données numériques, 
de quelque nature qu'elles soient, pour en effectuer un traitement, en vue de résoudre un problème 
d'ordre général. Nous serons alors amenés à constater que, de ce point de vue, toute machine théorique 
est réductible, dans son principe de fonctionnement, à une machine idéale. Aïnsi, nous pouvons dire 
que tous les ordinateurs, ou tous les programmes, sont équivalents entre eux, puisque le propre d'un 
ordinateur, dans sa définition théorique, est l'universalité, c'est-à-dire la capacité à traiter tous les 
problèmes traitables effectivement. 


Remarque: Ce chapitre aurait normalement sa place en tout premier de la section d'informatique 
théorique maïs il nous a semblé plus judicieux de se faire au préalable la main sur des exemples 
concrets de l'informatique théorique avant de passer au formalisme abstrait de leurs exécutions. 
C'est une des raisons pour lesquelles nous reviendrons ici brièvement sur les concepts d'algorithmes, 
de complexité, de systèmes logiques formels, de théorie de la démonstration et de l'information 
(voir les chapitres du même nom). Par ailleurs, pour ce chapitre, une expérience dans le 
développement de logiciels informatiques est un grand plus pour comprendre certaines notions (ou 
pour s'imaginer les applications pratiques). 


Avant de commencer, il convient de faire un tour d'horizon très sommaire des questions mises en jeu 
par ces premiers mots. Mais d'abord citons quelques domaines où la théorie du langage et les automates 
sont utilisés: spécification des langages de programmation, compilation, recherche de motifs (dans un 
texte, dans une base de données, sur le web, dans les gènes, .…), compression de textes, preuves de 
programmes, électronique des ordinateurs, codage pour la transmission, cryptographie, décodage du 
génome, linguistique, sciences cognitives, etc. 


1. MISE EN PERSPECTIVE 


L'informatique moderne est née de la recherche entreprise au début du 20ème siècle par Bertrand 
Russel et Alfred North Whitehead pour constituer la mathématique en un système formel où toute 
proposition pourrait être démontrée par un calcul logique (cf. chapitre de Théorie De La 
Démonstration). David Hilbert et Kurt Güdel accomplirent des pas décisifs dans l'exploration de ce 
programme. En 1931, Güdel démontre que (rappel): 


1. Il se peut que dans certains cas, nous puissions démontrer une chose et son contraire (inconsistance) 


2. Dans tout système mathématique formel, il existe des vérités mathématiques qu'il est impossible de 
démontrer (incomplétude) 


Le théorème de Güdel ruine ainsi le rêve de réunir la mathématique en un système déductif 
parfaitement cohérent, mais de l'effervescence intellectuelle autour du projet des Principia de Russel et 
Whitehead vont sortir les idées fondatrices de l'informatique. Cela amène en 1936 Alan Turing, à la 
suite de Güdel, à s'attaquer au problème de la décidabilité. 
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Définition: Un système est appelé "système décidable" s'il existe une procédure effective pour 
distinguer les propositions démontrables des autres. Pour définir plus rigoureusement la notion de 
procédure effective, Turing élabore le concept "d'automate", appelé par la suite "machine de Turing" 
(voir exemple plus bas), qui lui permet de préciser la notion d'exécution d'un "algorithme" (cf. chapitre 
de Méthodes Numériques). 


Inventer des procédures effectives (des algorithmes) consiste à déterminer un enchaînement 
d'opérations élémentaires qui exécuteront les calculs nécessaires à la solution de problèmes pour 
lesquels existent des solutions calculables (il y a des problèmes sans solution et des solutions 
incalculables comme nous l'avons vu lors de notre étude de la complexité dans le chapitre de méthodes 
numériques). Turing démontre en outre que son modèle de calcul est universel, c'est-à-dire que toutes 
les machines de Turing sont équivalentes (nous le démontrerons plus loin). Il formule l'hypothèse selon 
laquelle tout algorithme est calculable par une machine de Turing. Ces idées fondent la théorie de la 
programmation des ordinateurs. 


1.1. MACHINE DE VON NEUMANN 


Il revient à von Neumann de concevoir en 1945 l'architecture générale des appareils concrets qui vont 
réaliser les calculs selon le modèle de Turing, architecture si efficiente et élégante que les ordinateurs 
d'aujourd'hui sont encore construits, pour l'essentiel, selon ces principes. 


Remarque: Nous pouvons d'une certaine façon dire que cette décennie entre 1936 et 1945 a vu la 
naissance de l'informatique, qui est passée du stade de construction intellectuelle mathématique et 
logique à celui de l'application de ces idées à la réalisation de systèmes physiques concrets. 


Voici le schéma de l'architecture de von Neumann: 


von Neumann Computer 


Arithmetic-Logcal Unit 
Control Utit 
[_cœmux | 


Figure: 62.1 - Principe de la machine de von Neumann 


Les unités de contrôle (Control Unit), arithmétique (ALU) et de mémoire primaire (Primary Memory) 
constituent à elles trois l'unité centrale, ou le "processeur" de l'ordinateur. Le processeur est constitué 
de circuits électroniques qui peuvent exécuter des actions. L'ensemble des actions câblées dans le 
processeur constitue le jeu d'instructions du processeur et détermine le langage élémentaire de son 
utilisation, appelé "langage machine”. 


Le rôle de l'unité de contrôle consiste à permettre le déclenchement de l'action (l'instruction) voulue au 
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moment voulu. Cette instruction peut appartenir à l'unité arithmétique, à l'unité de mémoire ou à l'unité 
de contrôle elle-même. Une instruction peut en outre consulter le contenu de la mémoire (la "lire") ou 
modifier le contenu de la mémoire (y "écrire"). De façon générale, une action consiste soit à consulter 
ou à modifier l'état de la mémoire ou d'un des registres (qui sont des éléments de mémoire spéciaux 
incorporés à l'unité centrale), soit à déclencher une opération d'entrée-sortie (communication avec le 


monde extérieur et notamment l'utilisateur humain). 


Exemple: 


Comment indiquons-nous à l'unité de contrôle le moment voulu pour déclencher telle ou telle action?: 
C'est écrit dans le texte d'un programme. Où est le programme ?: Dans la mémoire. 


La mémoire est constituée d'éléments susceptibles de prendre des états. Un élément de base de la 
mémoire peut prendre deux états distincts et peut servir à représenter une donnée élémentaire, ou bit 

( ). Cette représentation d'une donnée par un élément de mémoire 
s'appelle un "code". Une mémoire avec beaucoup de bits permet le codage de données complexes, dans 
la limite de la taille de la mémoire. 


Le chemin par lequel unité centrale, mémoire et organes d'entrée-sortie (Devices) communiquent 
s'appelle de façon générique un "bus" (c'est en quelque sorte l'autoroute où circulent des données d'un 
point à un autre à l'aide d'adresses). De façon un peu formelle, un bus est un graphe connexe complet 
( ), ce qui veut dire en langage courant que tous les éléments 
connectés au bus peuvent communiquer entre eux. 


Remarque: Le codage fait correspondre des groupes de bits à des symboles. Les symboles les plus 
simples sont les chiffres et les lettres. Pour représenter des données complexes on peut définir des 
méthodes, des règles pour regrouper des symboles puis associer un élément de données à un groupe 
de symboles construit selon les règles. 


Définition: Nous appellerons "langage" un ensemble de symboles ou de groupes de symboles, 
construits selon certaines règles, et qui sont les mots du langage. La "syntaxe du langage" est l'ensemble 
des règles de construction des mots du langage. 


La mémoire de l'ordinateur (c'est l'idée fondamentale de von Neumann) contient des informations de 
deux types: des programmes et des données. Les programmes et les données sont représentés avec les 
mêmes symboles, seule la sémantique permet d'interpréter leurs textes respectifs. D'ailleurs, le texte 
d'un programme peut parfois être envisagé comme des données pour un autre programme, par exemple 
un programme de traduction d'un langage dans un autre. 


1.2. MACHINE DE TURING 


Il importe de se convaincre (ce ne sera pas en un jour) que tous les programmes que nous pourrons 
écrire dans différents langages sont équivalents. La machine de Turing est un modèle d'automate dont 
on trouvera ci-dessous une description très terre à terre (avant de passer à une définition beaucoup plus 
formelle). L'architecture de von Neumann, conçue pour réaliser efficacement les traitements décrits par 
une machine de Turing, engendre les langages impératifs (voir définition en R1 ci-dessous). Tout 
programme, fonctionnel ou impératif, destiné à être exécuté, sera traduit dans un langage impératif, le 
langage machine de l'ordinateur utilisé. La cohérence de l'informatique, et l'équivalence sémantique des 
programmes écrits en divers langages, qui assurent la validité de cette opération, sont le fruit non pas du 
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hasard, mais d'une conception théorique originelle commune. Güdel, Church, von Neumann et Turing 
étaient tous à Princeton en 1936. 


Remarques: 


R1. Les premiers langages évolués qui apparurent sont des langages dits "langages impératifs", 
fondés sur la notion d'état de la mémoire (c'est l'assembleur au fait!). Ces langages, inspirés du 
modèle de John von Neumann, comportent comme le langage machine des instructions qui 
produisent des modifications de la mémoire (instruction d'affectation). La rédaction d'un 
programme en langage impératif consiste à écrire la suite des instructions qui vont causer les états 
successifs par lesquels devra passer la mémoire pour que, en partant d'un état initial permettant 
l'initialisation du programme, elle arrive dans un état final fournissant les résultats recherchés. 


R2. Outres les langages impératifs, en informatique, nous distinguons les langages séquentiels, 
interprétés et compilés. 


Un modèle formel pour une procédure effective (pour décrire un algorithme) doit posséder certaines 
propriétés. Premièrement, chaque procédure doit recevoir une définition finie. Deuxièmement, la 
procédure doit être composée d'étapes distinctes, dont chacune doit pouvoir être accomplie 
mécaniquement. Dans sa simplicité, la machine de Turing composée des éléments suivants répond à ce 
programme: 


1. Une mémoire infinie représentée par un ruban divisé en cases. Chaque case du ruban peut recevoir 
un symbole de l'alphabet défini pour la machine ; 


2. Une tête de lecture capable de parcourir le ruban dans les deux sens ; 


LEA 


3. Un ensemble fini d'états parmi lesquels on distingue un état initial et les autres états, dits "états 


accepteurs" 


4. Une fonction de transition qui, pour chaque état de la machine et chaque symbole figurant sous la 
tête de lecture, précise: l'état suivant, le caractère qui sera écrit sur le ruban à la place de celui qui se 
trouvait sous la tête de lecture, le sens du prochain déplacement de la tête de lecture. 


On peut doter sa Machine de Turing de l'alphabet fini de son choix. Son ruban peut être infini dans les 
deux sens ou dans un seul. Elle peut même avoir plusieurs rubans. On montre que ces diverses 
machines sont équivalentes. 


Nous sommes alors amenés à la définition simpliste suivante: 


Un automate fini est un modèle mathématique des systèmes ayant un nombre fini d'états et que des 
actions (externes ou internes) peuvent faire passer d'un état à un autre. Les actions externes sont 
représentées par les symboles d'un alphabet À ; les actions internes (invisibles, silencieuses, ou 
spontanées) sont représentées par un symbole n'appartenant pas à l'alphabet précité. 


Un automate est représenté par un graphe ( ) dont les sommets sont 
des états et à chaque arc est associée la reconnaissance d'une ou plusieurs lettres. 


Les automates finis permettent de modéliser et de contrôler des systèmes à nombre d'états finis et de 
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résoudre des problèmes courants: analyse lexicale, recherche de motifs dans un texte, analyse du 
génome, etc. 


Exemples: 


E1. Automate fini et déterministe qui reconnaît tous les entiers dont l'écriture est normalisée (langage 
régulier), c'est-à-dire ne commençant pas par 0 (les chiffres dans les cercles sont juste là pour décrire 
l'ordre dans lequel l'automate exécute l'opération): 


Figure: 62.2 - Premier exemple d'automate fini 


Explication: L'automate reçoit dans l'entrée (1) un nombre entier, il regarde si ce nombre commence 
par un 0 ou est un nombre compris entre 1 et 9. Si le nombre commence par zéro, l'automate sort et 
s'arrête en (3). Sinon, l'automate va en (2) et analyse les chiffres du nombre les uns après les autres 
jusqu'à ce qu'il arrive à la fin après quoi il s'arrête et sort en (3). 


E2. Automate fini et déterministe qui reconnaît une entrée numérique dans un tableur type langage 
régulier (par exemple: +12,3 ou 08 ou -15 ou 5E12 ou 14E-3): 


Figure: 62.3 - Deuxième exemple d'automate fini 


En d'autres termes, il suffit de reconnaitre un langage de la forme: 
{-,+,€) A',A'Ef-,+,6) (62.1) 


qui est bien régulier où & est le mot vide, A est l'alphabet {0,1,...,9} et 4* l'ensemble des mots (in 
extenso des nombres) qu'on peut écrire avec À. 
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E3. Automate fini et déterministe reconnaissant tous les multiples de 3, type langage régulier (en 
d'autres termes si un tel multiple est trouvé, l'automate effectue une sortie, sinon rien): 


0,3,6,9 


Figure: 62.4 - Troisième exemple d'automate fini 


A 


1.3. HIÉRARCHIE DE CHOMSKY 


La hiérarchie de Chomsky est une classification des langages décrits par les grammaires formelles 
proposée en 1956, par le linguiste Noam Chomsky. Elle est aujourd'hui largement utilisée en 
informatique, en particulier pour la conception d'interpréteurs ou de compilateurs, ou encore pour 
l'analyse des langages naturels. 


Il convient au préalable de définir certaines notions: 

1.3.1. LANGAGE FORMEL 

Définition (simpliste): Dans de nombreux contextes (scientifique, légal, etc.) l'on désigne par "langage 
formel" un mode d'expression plus formalisé et plus précis (les deux n'allant pas nécessairement de 
pair) que le langage de tous les jours (voir langage naturel). 

En mathématiques, logique et informatique, un langage formel est formé: 


1. D'un ensemble de mots obéissant à des règles logiques (grammaire formelle ou syntaxe) strictes. 


2. Éventuellement d'une sémantique sous-jacente (la force des langages formels est de pouvoir faire 
abstraction d'une telle sémantique, ce qui rend les théories réutilisables dans plusieurs modèles) 


Remarque: Ainsi, alors qu'un calcul particulier de paye ou de matrice inverse restera toujours un 
calcul de paye ou de matrice inverse, un théorème sur les groupes s'appliquera aussi bien sur 
l'ensemble des entiers que sur les transformations du cube de Rubik. 


Le langage formel d'une discipline scientifique c'est donc effectivement un langage obéissant à une 
syntaxe formelle stricte et qui va servir à exposer des énoncés de manière précise, si possible concise et 
sans ambiguïté, et s'oppose en cela au langage naturel. 


Le langage formel a pour avantage de rendre aisées la manipulation et la transformation de ces 
énoncés. En effet, on va disposer en général de règles de transformation précises (développement de 
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formules logiques, formes normales, contrapositions, commutativité, associativité, etc.) qui peuvent être 
appliquées sans même connaître la signification de l'énoncé à transformer ou la signification de la 
transformation. C'est donc un outil d'exploration puissant, et c'est le seul langage qui permette aux 
machines de "faire des mathématiques". 


L'inconvénient est évident: ne pas connaître le sens de l'énoncé empêche de savoir quelles sont les 
transformations pertinentes et nuit à l'intuition du raisonnement. Ainsi, il est bon de savoir lire 
rapidement un énoncé en langage formel et de le traduire tout aussi rapidement en un ou plusieurs 
énoncés du langage naturel, plus parlants. 


C'est là que se trouve la limite de ce que nous appelons les "logiciels d'aide à la preuve": naturellement, 
l'ordinateur n'a pas d'intuition. Toute l'habileté du concepteur d'un tel programme consiste à trouver des 
moyens pour que l'ordinateur comprenne. 


Donner un sens pertinent à un langage de programmation en vue d'exécuter ses programmes est 
relativement aisé, du fait que ces langages formels ont été conçus pour signifier des suites d'actions 
élémentaires de la machine. Pour prouver un programme (démontrer que l'algorithme se termine en un 
nombre fini de fois) ou un théorème de mathématiques (ce qui revient au même), il n'y a, en revanche, 
aucune méthode infaillible, la correction d'un programme étant un problème de décision indécidable. 
Ainsi, le prouveur doit se contenter d'appliquer certaines heuristiques (technique consistant à apprendre 
petit à petit en tenant compte de ce qui a été fait au préalable) et souvent appeler à l'aide l'utilisateur 
humain. Cependant, grâce à ses heuristiques et à sa puissance de calcul, l'ordinateur explore des milliers 
de voies que l'utilisateur humain n'aurait pas pu tester en plusieurs années, accélérant ainsi le travail du 
mathématicien. 


Définition (un peu plus formelle): En tant qu'objet d'étude, un "langage formel" est défini comme un 
ensemble de mots de longueur finie (i.e. chaînes de caractères) déduits d'un certain alphabet fini, c'est- 
à-dire une partie du monoïde libre (l'ensemble des mots formé sur un alphabet, muni de la loi interne de 
concaténation (qui est une loi de composition), est un monoïde que nous appelons monoïde libre, dont 
le mot vide est l'élément neutre) sur cet alphabet. 


Remarque: Il faut tout de même que cet ensemble de mots ait un sens, soit pertinent, soit 
opérationnel, serve à quelque chose. Sinon toute collection de groupements finis de caractères sera 
un langage formel. En somme que ces mots puissent s'articuler entre eux pour former sens, ou du 
moins construire une pensée, une démarche, un mécanisme logique, une technique de calcul... 


1.3.2, SYNTAXE 


Définition: La "syntaxe" est la branche de la linguistique qui étudie la façon dont les "morphèmes 
libres" (les mots) se combinent pour former des "syntagmes" (nominaux ou verbaux) pouvant mener à 
des propositions, lesquelles peuvent se combiner à leur tour pour former des énoncés. 


Exemple: 


Le syntagme "une modeste maison de briques rouges" est englobé dans le syntagme supérieur, c'est- 
à-dire, la phrase complète. Mais ce même syntagme "une modeste maison de briques rouges" inclut 
parmi ses éléments, le syntagme inférieur "de briques rouges", complément du nom "maison". 
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Définitions: 


D1. En grammaire scolaire, une "proposition" est un syntagme articulé autour d'un verbe. Cette notion 
est surtout utilisée dans l'apprentissage des langues. 


ZA 


D2. Un "énoncé", en linguistique est tout ce qui est prononcé par un locuteur entre deux pauses. 
Syntaxiquement, l'énoncé peut donc s'étendre du simple mot à la phrase (voire au discours) en passant 
par le syntagme. 


Le terme de syntaxe est aussi utilisé en informatique, où sa définition est similaire, modulo une 
terminologie différente. Ainsi la syntaxe est le respect, ou le non-respect, de la grammaire formelle d'un 
langage, c'est-à-dire des règles d'agencement des lexèmes (qui, en informatique, ne sont que des entités 
lexicales) en des termes plus complexes, souvent des programmes. Dans la théorie des langages 
formels, ce qui joue le rôle de lexème est en général appelé "lettre" ou "symbole", et les termes produits 
sont appelés "mots". 


D'un point de vue purement grammatical, l'étude de la syntaxe concerne trois sortes d'unités: 
U1. La phrase, qui est la limite supérieure de la syntaxe 

U2. Le mot, qui en est le constituant de base, parfois appelé "élément terminal" 

U3. Le syntagme (ou groupe), qui en est l'unité intermédiaire 

Les relations syntaxiques entre ces différentes unités peuvent être de deux ordres: 

O1. La coordination lorsque les éléments sont de même statut 


O2. La subordination dans le cas contraire (lorsqu'il y a subordination, l'élément subordonné remplit 
une fonction syntaxique déterminée par rapport à l'unité de niveau supérieur) 


L'étude de la syntaxe tiendra compte, notamment, de la nature (ou catégorie ou espèce) des mots, de 
leur forme (morphologie) et de leur fonction. C'est ainsi que l'on parlera plus généralement de rapports 
morphosyntaxiques. 


1.3.3. GRAMMAIRE FORMELLE 


Définition (simpliste): Une "grammaire formelle" est un formalisme permettant de définir une syntaxe 
et donc un langage formel, c'est-à-dire un ensemble de mots sur un alphabet donné. 


La notion de grammaire formelle est particulièrement utilisée dans les domaines suivants: 
- La compilation (analyse syntaxique) 

-L'analyse et le traitement des langues naturelles 

- Les modèles de calcul (automates, circuits, machines de Turing, etc.) 

Pour définir une grammaire, nous avons besoin (voir l'exemple plus bas pour comprendre): 


1. D'un alphabet de non-terminaux ; 
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2. D'un alphabet de terminaux ; 


3. D'un symbole initial (l'axiome) pris parmi les non-terminaux ; 
4. D'un ensemble de règles de production. 
Exemples: 


E1. Nous pouvons définir des expressions arithmétiques de la façon suivante (écritures que nous 
retrouvons fréquemment en théorie de la démonstration): 


exp — exp exp |exp *exp |(exp) | #um 


num —> Qrurn]| rue | 2rurme| | Sas | 1] 2]... | 9 


(6 y ep 


Les non-terminaux sont ici implicitement exp et num, les terminaux sont + , * ,(,) et les chiffres. 
L'axiome est exp. 


Une utilisation de cette grammaire (règle de production) peut-être la suivante: 
exp — exp*exp — exp*um — 3% num — 3 *laum — 3*18 (623) 


E2. la syntaxe de la logique propositionnelle classique ou calcul des propositions peut se définir de la 


façon suivante (cf. chapitre de Théorie De La Démonstration): 
F= Aom|FVF|FAF|F-F|F-F|3xF|VxF (624) 
Les types de grammaires les plus couramment utilisées sont: 


1. Les grammaires linéaires gauches qui produisent les mêmes langages que les expressions régulières 
(c'est ce qui va nous intéresser dans ce chapitre) 


2. Les grammaires hors-contexte (exemple ci-dessus) 


3. Les grammaires contextuelles (ce type de grammaire requiert un formalisme mathématique et ne 
peut être défini sans celui-ci) 


Un langage est ainsi un ensemble de mots, qui sont simplement des séquences de symboles choisis dans 
un ensemble fini appelé "alphabet". Les langages de la hiérarchie de Chomsky sont formés de mots qui 
respectent une grammaire formelle particulière. Ce qui les distingue dans le cadre de la classification est 
la nature de la grammaire. 


Remarque: Le plus souvent, les symboles que l'on considère sont formés de plusieurs caractères, de 
sorte qu'ils correspondent plutôt à ce que l'on appelle des mots dans la langue courante. Lorsqu'il y 
a ambiguïté, par exemple en analyse lexicale (vocabulaire) et syntaxique (partie de la grammaire 
qui traite de la fonction et de la disposition des mots et des propositions dans la phrase), on parle de 
caractères pour les symboles de l'alphabet utilisé pour coder les informations, et de lexèmes pour les 
symboles de l'alphabet abstrait, qui sont les unités de base du langage. De même, les mots du 
langage correspondent plutôt à des phrases ou à des textes.) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Définition (plus formelle): Une "grammaire formelle", ou simplement "grammaire", est formée d'un 
ensemble fini de symboles terminaux (qui sont les lettres ou les mots du langage), d'un ensemble fini de 
non-terminaux, d'un ensemble de productions dont les membres gauches et droits sont des mots formés 
de terminaux et de non-terminaux, et d'un axiome. Appliquer une production consiste à remplacer son 
membre de gauche par son membre de droite ; l'application successive d'un certain nombre de 
productions s'appelle une dérivation. Le langage défini par une grammaire est l'ensemble des mots 
formés uniquement de symboles terminaux qui peuvent être atteints par dérivation à partir de l'axiome. 


La hiérarchie de Chomsky est formée des quatre niveaux suivants, du plus restrictif au plus large. 


N1. Les "langages de type 3", ou "langages réguliers": ce sont les langages définis par une grammaire 
régulière ou une expression régulière, ou bien encore les langages reconnus par un automate fini. 


N2. Les "langages de type 2", ou "langages algébriques": ce sont les langages définis par une grammaire 
formelle hors-contexte, ou bien encore les langages reconnaissables par un automate à pile non 
déterministe. Dans cette catégorie se trouvent les langages de programmation informatique. 


N3. Les "langages de type 1", ou "langages contextuels": ce sont les langages définis par une grammaire 
contextuelle, ou encore les langages reconnaissables par une machine de Turing non-déterministe à 
ruban de longueur bornée par un multiple fixé de la longueur du mot d'entrée (ce type de langages 
requièrent un formalisme mathématique et ne peuvent être définis sans celui-ci). 


N4. Les langages de type 0, ou "langages récursivement énumérables". Cet ensemble inclut tous les 
langages définis par une grammaire formelle. C'est aussi l'ensemble des langages acceptables par une 
machine de Turing (que l'on autorise à boucler sur un mot qui n'est pas du langage). 


Remarques: 


R1. Outre les 4 types de la hiérarchie de Chomsky, il existe des classes intermédiaires remarquables: 
entre 3 et 2: les langages non-contextuels déterministes, reconnaissables par automate à pile 
déterministe et les langages compris entre 1 et 0: les langages récursifs, c'est-à-dire reconnaissables 
par une machine de Turing (celle-ci doit refuser les mots qui ne sont pas du langage). 


R2. Les six types ci-dessus sont strictement inclus les uns dans les autres. 


Un analyseur pour un langage formel est un programme informatique qui décide si un mot donné en 
entrée appartient ou non au langage, et éventuellement en construit une dérivation. 


On dispose de méthodes systématiques pour écrire des programmes d'analyse des langages de type 2 ou 
3. Les interpréteurs ou compilateurs comprennent presque toujours une phase d'analyse lexicale, qui 
consiste à reconnaître des langages de type 3, suivie d'une phase d'analyse syntaxique qui est une 
analyse de langage de type 2. 


Nous pouvons maintenant de manière vulgarisée (toujours dans l'objectif de préparer le terrain) définir 
ce qu'est un automate dans le cadre de la hiérarchie de Chomsky. 
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1.3.4. AUTOMATES ASSOCIÉS 


Définition (simpliste): Dans le domaine de l'informatique, un "automate" est une machine à traiter de 
l'information par un modèle formel (une machine de Turing) sur un langage donné. Ainsi: 


1. Sur un "langages fini" (langage contenant un nombre fini de mots), l'automate associé est une 
machine comparant un texte avec celui qui est enregistré dans une mémoire morte. La grammaire 
associée à un langage fini est une liste des mots du langage. 


2. Sur un "langage régulier" (langage où la correction syntaxique se vérifie en ne mémorisant qu'un 
nombre fini d'informations), l'automate associé est "l'automate fini déterministe" (c'est-à-dire que, pour 
chaque mot entré, il n'existe qu'un parcours possible du graphe) ou "l'automate fini indéterministe". La 
grammaire associée à un langage régulier est une grammaire linéaire gauche. 


3. Sur un "langage algébrique" (langage où la principale contrainte syntaxique est le parenthésage), 
l'automate associé est "l'automate à piles indéterministe". La grammaire associée est la grammaire 
algébrique. 


4. Sur un "langage borné" (description nécessitant un formalisme mathématique), l'automate associé est 
"l'automate linéairement borné". La grammaire associée est la grammaire contextuelle. 


5. Sur un "langage décidable" (un être intelligent arrive à trouver un procédé pour savoir si on est ou 
pas dans le langage), l'automate associé est une machine de Turing qui s'arrête sur toutes les données. Il 
n'y a aucune grammaire associée. 


6. Sur un langage "semi-décidable" (un être intelligent arrive à trouver un procédé pour savoir si on est 
dans le langage, mais peut rester dans l'expectative si on est à l'extérieur d'un tel langage), l'automate 
associé est la machine de Turing. Les grammaires associées sont des grammaires "semi-Turingienne", 
"de Vangarden", ou "grammaires affixes". 


2. TERMINOLOGIE 


Les automates travaillent donc essentiellement sur des lettres, mots, phrases et langues. Afin de 
construire des méthodes d'analyses et de traitement rigoureuses et optimales sur le sujet il est 
intéressant de formaliser les objets traités. C'est ce que nous allons faire dans un premier temps en 
définissant ceux-ci et leurs propriétés mathématiques (qui sont très intuitives). 


2.1. MOTS 
Définitions: 


D1. Un "alphabet" est un ensemble dont les éléments sont des "lettres". Les alphabets sont toujours 
supposés finis. 


D2. Un "mot" est une suite finie de lettres que nous notons par juxtaposition: 
W= Gi; d, 4€ A 
D3. Le "mot vide", noté # , est le seul mot composé d'aucune lettre. 


D4. La "longueur" d'un mot w est le nombre de lettres qui le composent, et est notée |w| (le mot vite est 
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le seul mot de longueur 0). 


Le "produit de concaténation" de deux mots x = 4,4,..4, et y = hb,...b, est le mot xy obtenu par 
juxtaposition (concaténation): 


xy = @4,...4,bhb,..b, (62.6) 
Bien entendu (trivial), nous avons |xy|= |x|+|y|. Nous notons 4* l'ensemble des mots sur A. 
Exemple: 


Les gènes sont des mots sur l'alphabet ACGT, les protéines sont des mots sur un alphabet à 20 lettres. 
Les entiers naturels, écrits en base 10, sont des mots sur l'alphabet des dix chiffres décimaux... 


Soit À un alphabet. Soit B une partie de A. Pour tout mot = 4*, la longueur en B de w est le nombre 
d'occurrences de lettres de B dans le mot w. Ce nombre sera noté lw| FT 


Remarque: En particulier, nous avons trivialement |w|=[w|.. 


Pour toute lettre 4 € À, ll, est le nombre d'occurrences de a dans w. Nous avons: 
Ml = > w| (62.7) 
deB à 


Soit w = 4.4, avec 4,4, € À. Le mot miroir de w est le mot noté # ou w° défini par: 


Évidemment: 
(uv) =ÿi et (w°) = (62.9) 
Définitions: 


D1. Un mot u est un "préfixe" ou "facteur gauche" d'un mot v s'il existe un mot x tel que 4x = v.Le 
mot u est "préfixe strict” ou "propre" si, de plus, 4 # v. De manière symétrique, u est "suffixe" ou 
"facteur droit" de v si xx =v pour un mot x. Si & # v, alors u est "suffixe strict" ou "propre". Le 
nombre de préfixes d'un mot v non vide est 1+ bvl (le mot vide étant toujours un préfixe, nous avons 


toujours n'importe quel mot non vide qui a comme préfixe au moins le mot vide). 
D2. Un mot u est "facteur" d'un mot v s'il existe x,y non vides tels que Y = X4y. 
Exemple: 


Le mot (v) aabab sur À = {4,b} a 12 facteurs (u) différents possibles: 


(E,a,b,aa,ab,ba,aab,aba,bab,aaba,abab,aabab) (62.10) 
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Lemme de Levy: Soient x, y, z, t des mots tels que xy = zt. Alors il existe un mot w tel que: 


AXW=Z (62.11) 


avec bien évidemment: 


ou: 

X=ZW (62.13) 
avec aussi in extenso: 

WY =# (62.14) 


Il en résulte logiquement en particulier que si |x|=|z|, le mot w est vide, et donc x =z et y=+.En 


d'autres termes, un monoïde libre (voir le rappel plus bas) est simplifiable à gauche et à droite. 
Démonstration (bof!): 
Posons: 

X=4.4,,) "A. dn (62.15) 


avec 4, € À de même: 


z=h..b,,t=b,,.b, (62.16) 
avec à, € À. 
Comme: 
xY=Zt (62.17) 
nous avons: 


m4 (62.18) 
(mais pas nécessairement # =? jet: 


4; = b, 


, (62.19) 


pour à = 1,..,# de sorte que: 
Z = 4.4 


et fé = yu (62.20) 


x 41 ""»# 
Si |zl= p £ x =|x|, posons w = x,,,..2,. Alors: 


x=2w et wWyÿ=t (62.21) 
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Si |z| > |x|, posons w=x,,,...x,. Alors: 


XW=Z et }=Wwf (62.22) 
OIC.Q.FD. 


Rappel: Dans le cadre des automates un "monoïde libre" est un ensemble A (l'alphabet), dont les 
éléments sont les lettres. 


( 4) est un monoide libre si = { est associative (concaténation) 


‘1l existe un élément neutre (£) dans À 


Remarque: Dans la section d'arithmétique, chapitre de théorie des ensembles, nous parlions 
simplement de "monoïde". Le monoïde (4,:) = (4, concaténation ). 


2.2. LANGAGES 


Les sous-ensembles de 4* sont appelés des "langages formels". Par exemple, pour À = {a,b}, 


l'ensemble (a*b* [#2 2 0} est un langage. 


Nous définissons sur les langages plusieurs opérations. Les opérations ensemblistes sont l'union, 
l'intersection, la complémentation et la différence qui s'en déduit. Si X et Y sont deux parties de 4", 
alors: 


XUY={e 4'|zeX ouzeÿ) 
XnY={zeA |zeXetze}) 
X° = A'\X={z2e4"|zeX) 
X\Y=XnY={ze{"|z2eX etzép) 
Le produit (de concaténation) de deux langages X et Y est le langage: 


AY ={xzy|xeXetye}r} (6224) 
Remarque: Nous avions bien évidemment X{e}={e}X = X 


et le quotient gauche de Y par X: 


XT'Y={w|IueXetver|v=uw) (62.25) 
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Exemple: 


ÆX = {0,1,2,3,4} 
Y = {5,6,7,8,9)} 
Z = {0,1} 
À UF = {0,1,2,3,4,5,6,7,8,9} 
AT = {05,06,07,08,09,15,16,17,18,19,25,26,27,28, 29,35... 
ZT: (AY) =(5,6,7,8,9) = F en 
ZX =({E) 
YT'X=0 
(Æ UF)\{e} est l'ensemble de toutes les suites décimales 
Z* ={0,1,00,01,10,11,...} 
Suite à la demande d'un lecteur détaillons la 6ème ligne en rappellant la définition: 
XT'Y ={w|IueXetverl|v=uw} (6227) 
Nous avons alors explicitement: 
{0, D” -(05,06,07,08, 09,15, 16,17,18,19,25,26,..) (62.28) 
et dans le produit de concaténation des deux langages X et Y, les seuls mots où nous trouvons les 
éléments {0,1} du langage Z en tant que préfixe sont: 
{05,06,07,08,09,15,16,17,18,19} (62.29) 


et comme par définition Z7 : 44 | est l'ensemble unique des termes w qui suivent les préfixes que 


constitue les termes de Z il ne reste alors plus que: 

{5,6,7,8,9) (62.30) 
Nous avons les propriétés suivantes: 
P1. X(F UZ)=ZXY UXZ (trivial) 


P2. X(Y nZ)C(XY nXZ) où l'inclusion est généralement stricte. Pour conceptualiser cette 


propriété, il ne faut surtout pas oublier que X est un ensemble de mots et que YŸ, Z n'ont pas 
nécessairement des mots de la même longueur ! 


Les puissances de X sont définies par X° ={e},X° = X et X = X*YZ #21. 


En particulier, si À est un alphabet, 4* est l'ensemble des mots de longueur n. 
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Définitions: 


D1. "L'étoile" (ou "fermeture de Kleene") de X est l'ensemble: 


X"={Jx"* ={x..2,/#20,x....x, € X)} (62.31) 


#20 
Exemple: 


Soit À = {a,ba}. Les mots de y*, classés par longueur sont: 


(l € 
1 a 
2 aa, ba 
(62.32) 
3 aaa, aba, baa 
4  aaaa,aaba.abaa, baaa. baba 


D2. L'opération "plus" est définie de manière similaire: 


X'=[JX"={n.x, #2 0%. € X} (62 


62.33) 
#> 0 


2.3. ÉQUATIONS 


D'abord voyons un petit quelque chose dont nous allons avoir besoin par la suite: soient u et v deux 
mots non vides. Les trois conditions suivantes sont équivalentes (sans démonstration car assez trivial de 
tête): 


C1. uv = vx 


C2. Il existe deux entiers #,## 2 1 tels que 3," = 3" 


C3. Il existe un mot w non vide et deux entiers #&,{ > 1 tels que x = w*,v = w° 


Remarque: Rappelons à nouveau que nous n'avons pas forcément |x| = |v| mais que nous pouvons 


très bien avoir fu] > |v|. 


Passons maintenant aux choses intéressantes (certains points flous du chapitre de théorie de la 
démonstration peuvent s'éclaircir ici parfois….): 


Définitions: 


D1. Soient V et A deux alphabets disjoints (vous pouvez les imaginer comme l'ensemble des variables et 


LEA 


respectivement celui des constantes par exemple...). Une “équation en mots" avec constantes sur À est 
# 7 . 7 7 
un couple & = (æ, #) de mots de {}° L 4) . Une telle équation est représentée par & = 8. Il faut donc 


voir les deux mots choisis comme le membre de gauche et respectivement de droite d'une équation 
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D2. Une équation e = (æ, 8) est dite "équation non triviale" si & # & 


Exemple: 
Soient À = {a},W ={x} et définissons & = ax, 8 = xa , dès lors nous avons xa =ax &= 8 


LA DEA 


D3. Une équation e est dite "équation sans constante" si &, 8e". 


D4. Une "solution" de l'équation e est un homomorphisme de monoïde (cf. chapitre de Théorie Des 
Ensembles)  : ( (J AŸ — A invariant (car toute lettre sur À est envoyée sur 4* et par conséquent 


tout mot sur À est envoyé sur À) sur À tel que: 
h() = k(É) (62.34) 
Rappel: La définition de l'homomorphisme est telle que si & = y alors k(a) = k(xy) = k(x)k(y). 
Exemple: 
Soient À = {&,b},} ={x, y}. Maintenant considérons les mots suivants: 
a=xab B=byx (62.35) 
définissons h tel qu'il envoie x sur b, y sur a, a sur a, b sur b. Dès lors nous avons bien: 
ha) = h(xab) = bab  h(8) = k(byx) = bab (62.36) 
et nous aurons toujours pour tout couple: 
(a, 8) — ka) = AS) (62.37) 


D4. Une solution h est dite "solution cyclique" s'il existe un mot w (appartenant à A) tel que k{x) € w” 
(en considérant le mot lui-même comme un alphabet donc) pour toute variable x. 


Remarque: Selon cette définition, les solutions de l'équation sans constantes 4 = YX en deux 
variables x,y sont cycliques telles que: 


hp) = yx, hCyx) = xp © x) = y,h0y) = x (62.38) 


2.4. CODES 


Définition: Nous appelons "code" toute partie C d'un monoïde libre 4* qui vérifie la condition suivante 
pour tout (mot) x,,..,2,,/,..,Y, € C': 


Lex "he A UM,X "Ji =1l,..,# (62.39) 


En d'autres termes, C est un code si tout mot de £* (mot composé de mots) se factorise, de manière 
unique, en un produit de mots de C. Lorsqu'un ensemble n'est pas un code, nous nous en apercevons en 


général assez facilement. 
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BExemples: 


E1. L'ensemble (langage) {&,4b,ba} n'est pas un code puisque le mot aba s'écrit à la fois comme 
produit 4.bæ et comme produit gb .a. 


Remarque: Les codes les plus simples sont les "codes uniformes". Ce sont des ensembles dont tous 
les mots ont une même longueur (ce qui fait qu'étant donné que chaque mot est différent, la 
combinatoire des mots peu très difficilement ne pas différer). 


E2. L'ensemble 4* des mots de longueur n est un code, si » > 1. Le code ASCII qui associe à certains 
caractères des mots binaires de longueur 7 (voir table ASCIT) est un code uniforme. 


2.4.1. CODES PRÉFIXES 


Le morse code la lettre E, la plus fréquente, par un ‘."et la lettre Y, plus rare, par ‘-.--": c'est un exemple 
de code de longueur variable, ce qui permet de représenter les lettres ou les mots les plus fréquents par 
des mots plus courts. Une propriété importante est l'unicité du décodage (application injective), 
problème qui ne se pose pas pour les codes de longueur constante. Il peut être résolu, mais de façon 
trop coûteuse, quand un symbole spécial sépare deux mots successifs du code (le blanc dans le cas du 
morse). 


On peut ne pas recourir à cette technique si aucun mot du code n'est le préfixe d'un autre mot du code; 
un code présentant cette propriété est appelé un "code préfixe". 


Exemple: 


Supposons que nous décidons d'une convention de code à taille variable, qui fait correspondre, entre 
autres, les valeurs suivantes: 


"11" 
"11010" 

12 |"O0" 

127 |"0111100" 

255 |"0100" 


Supposons alors que nous ayons à décoder la séquence: 1101000111100 
Plusieurs interprétations (factorisation) sont alors possibles: 
1101000111100 = 11 0100 0111100 = 0 255 127 
1101000111100 = 11010 00 11 11 00 = 2 12 0 0 12 


Et maintenant, nous sommes bien embarrassés! Avec plusieurs possibilités équivalentes entre 
lesquelles on ne sait pas trancher, on est incapable de retranscrire le code initial. 


Le problème qui s'est posé ici est que certains codes sont le début d'autres codes. Ici, "11" est le code 
du nombre 0, mais c'est aussi le début de "11010", code du nombre 2. D'où l'ambiguïté. 
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Nous appelons alors "code-préfixe" un codage dans lequel aucun code n'est le début d'un autre. Ainsi, 
pour qu'il n'y ait aucune ambiguïté au moment du décodage, il nous faut absolument un code-préfixe. 


Exemple: 


L'ensemble Z = {ab,ababa,baa} est un code. Ici, la connaissance du début abababa ne permet pas 
encore de savoir si la décomposition commence par ab .ab.ab.a où par ababa . ba . Ce n'est qu'après 
la lecture de la lettre suivante (non encore indiquée dans l'exemple) que l'on sait si la décomposition 
commence par ab (si la lettre est b) ou par ababa (si la lettre est a) 


Définition: Un code est à "délai de déchiffrage fini" s'il existe un entier d tel que, chaque fois qu'un 
message w commence par P = XX3...Xysy AVEC Xi, %,..., Ag € À alors la factorisation complète de w 


commence par x. C'est donc après un "délai" de d mots de code que nous pouvons affirmer que le 
premier mot trouvé est le bon. 


Exemples: 
Le code: 
ÆX = {a,ba,bb} Tableau: 62.2 

a un délai de O. 
Le code: 

ZX = {ab,ababa,baa} Tableau: 62.3 
a un délai de 2. 
3. ALGORITHMES LINGUISTIQUES 


Mettons un peu en pratique ce qui a déjà été vu jusqu'ici afin de nous appuyer un peu sur du concret 
"utile" ! Nous verrons plus loin une fois les automates introduits, quelques algorithmes de recherche de 
sous-chaînes (tels qu'utilisés en génomique). 


3.1. ALGORITHME DE HUFFMAN 


Rappel: en informatique, nous décidons de coder un nombre entier compris entre 0 et 255 par une 
séquence de 8 chiffres binaires (binary digits, ou "bits" en anglais, valant 0 ou 1), encore appelée octet. 


A priori, il suffit pour cela de se donner une table de correspondance du genre: 


138 10001010 
139 10001011 


Tableau: 62.4 - Correspondance de code arbitraire 


La correspondance peut être quelconque, dictée par notre imagination, du moment qu'à chaque entier 
entre 0 et 255 est affecté un code binaire et un seul. Une fois une correspondance fixée, il suffit de la 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


prendre comme convention. 


En pratique, la convention qui a été choisie est celle de la représentation en base 2. Elle a le mérite 
d'être naturelle et logique. Dans la table ci-dessus, 10001010 est la représentation en base 2 de 138. 
C'est la manière de noter les chiffres que nous aurions adoptée si nous n'avions que deux doigts au lieu 
de dix. 


L'octet défini selon cette convention est l'unité de base de stockage des données. Tout fichier 
informatique est une suite d'octets rangés selon un ordre bien défini. La taille du fichier est simplement 
le nombre d'octets qui le constituent. Le kilo-octet (Ko) correspond à 1024 (et non pas 1000) octets, le 
méga-octet (Mo) à 1024*1024 octets (convention absurde des informaticiens). 


Il convient de noter que cette représentation en base 2, n'est qu'une convention. D'autres conventions 
sont possibles, qui conviendraient tout autant pour peu que tout le monde s'accorde à employer la 
même convention. 


Le problème que nous nous posons est: y aurait-il une autre manière de coder les chiffres, peut-être 
moins logique mais plus judicieuse, de telle manière que la taille du même fichier réécrit selon la 
nouvelle convention, serait moins grande? 


La convention de codage binaire est finalement très démocratique: que vous soyez un Zéro ou un 
DeuxCentCinquanteCinq, nous vous allouons 8 bits de toute manière pour pouvoir vous coder. 
Autrement dit, chaque entrée possible (un nombre entre 0 et 255) est codée sur 8 bits. Il s'agit d'un 
codage à taille fixe. 


Du point de vue de notre problème (la compression de données), cela ne nous importerait pas si 
chacune des valeurs possibles (0 … 255) était représentée aussi fréquemment que les autres. Mais en 
général c'est n'est pas le cas. 


À titre d'exemple, voir l'analyse des octets du fichier Wordpad.exe (cf. dans votre dossier 
Accessoires...). Dans ce tableau, en abscisse comme en ordonnée sont portées les valeurs possibles d'un 
octet donné (donc 0 … 255). Sur la diagonale, à l'abscisse et ordonnée correspondante la taille du cercle 
est proportionnelle au nombre d'octets ayant cette valeur dans le fichier: 


- Analyse de la répartition des octets d'un fichier particulier 


Nous voyons clairement que les valeurs 0, 128 et 255 sont nettement plus fréquentes que les autres! 
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À titre indicatif, voici quelques valeurs: 


D  |71891 [344% 
D  |1119 L0.53% 
128 1968 (0.94% 
130 [79  |0.038% 
255 [10422 |4.99% 


Tableau: 62.5 - Correspondance valeurs/fréquences 


Nous allons maintenant décider d'une convention de codage à taille variable, qui représente une valeur 
fréquente par un petit nombre de bits, et une valeur peu fréquente par un grand nombre de bits. 


Par exemple, 0 sera maintenant représenté par la séquence "11" (anciennement 00000000"), 128 par 
"1011010" (anciennement 10000000"), 255 par "0100" (anciennement "11111111"), etc. 


Étant donné que 0 représente à lui seul un tiers du fichier, nous avons gagné une place considérable en 
le codant sur deux bits au lieu de huit! Et idem pour les autres valeurs fréquentes... 


L'algorithme de Huffman est une recette pour générer un code-préfixe à taille variable, à partir de la 
table des fréquences d'une suite de valeurs. Donc, si vous nous avez bien suivis dans la théorie jusqu'ici, 
c'est une solution à notre problème. 


Supposons que notre fichier soit extrêmement simple, et constitué d'un mot unique: 
anticonstitutionnellement 


Il y a 25 caractères dans ce fichier; chaque caractère étant codé par un octet de 8 bits (codage ASCIT) 
cela signifie donc 25 octets, ou encore 200 bits. Voyons ce que nous pouvons faire de cela. 


Table des fréquences: 


| 
ulw|wIRiIRl al RAR 


"tt" 5 


Tableau: 62.6 - Fréquence des lettres dans un mot 
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Tous les autres octets ont une fréquence nulle: ils ne sont pas représentés dans le fichier. 


Première étape, nous créons maintenant un "noeud terminal" pour chaque entrée du tableau: 


Figure: 62.6 - Noeud terminal associé à chaque entrée du tableau 


Ce qui nous fait pour l'instant 11 arbres contenant un seul noeud chacun. 


Nous commençons maintenant une itération: à chaque fois nous supprimons les deux arbres de gauche 
et les remplaçons par un "arbre somme". Le nouvel arbre est inséré dans la liste en respectant l'ordre 
croissant, et l'on recommence jusqu'à ce qu'il ne reste plus qu'un seul arbre: 


000 09 000006 
© © 


Figure: 62.7 - Première itération 


Itération 1: 


Itération 2: 


Pret 600006 


Figure: 62.8 - Deuxième itération 


90090000 
2e ce 
© © 


Figure: 62.9 - Troisième itération 


Itération 3: 


Itération 4: 
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0000000 
© 
© © 


Figure: @) 10 - Quatrième itération 


etc. 


L'arbre final: 


Figure: 62.11 - Dixième itération 


Et voilà le travail! 


Maintenant, le code associé à chaque Clé n'est autre que le chemin d'accès au noeud terminal 
correspondant, depuis la racine, en notant 0 chaque branche de gauche et 1 chaque branche de droite. 


Finalement: 
Clé Code binaire 
n (00 
t O1 
i [100 
le [o1 
a |11000 
c 111001 
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o 1101 
1 {1110 

m |11110 

s 111110 

lu [111111 


Tableau: 62.7 - Correspondance lettre/code binaire 
Et voici maintenant, transcrit avec notre nouveau code, le mot de départ: 


110000001100110011101001111100110001111111011001101000010111101110101111101010001 
ce qui nous fait 81 bits, au lieu de 200 au départ! Cela correspond à un taux de compression de 60%. 


Le fait d'avoir généré un code en se servant d'un arbre binaire assure qu'aucun code ne peut être le 
préfixe d'un autre. Vous pouvez vérifier qu'à l'aide de la table de codage, il n'y a aucune ambiguïté 
possible pour décoder notre mot compressé! 


En pratique, la table de codage étant spécifique à chaque fichier, il est indispensable de l'incorporer au 
fichier compressé, de manière à ce que le décryptage soit possible. Ce qui signifie que la taille du fichier 
compressé doit être augmentée d'autant. Dans le cas de notre fichier exemple, il faudrait incorporer au 
minimum 22 octets de plus pour insérer la table de codage, et le taux de compression n'est plus aussi 
bon. 


Toutefois, pour des fichiers suffisamment larges (à partir de quelques kilo-octets) le surplus de taille 
généré par la table de codage devient négligeable par rapport à l'ensemble du fichier. Concrètement, 
l'algorithme de Huffman permet d'obtenir des taux de compression typiques compris entre 30% et 60%. 
Sans être aussi bien que ce que réalise Winzip (en moyenne 20% de mieux), c'est déjà pas mal! 


3.2. ALGORITHME DE SARDINAS ET PATTERSON 


Face à de longs codes, la difficulté est de vérifier si un code en est vraiment un... Pour cela, nous 
pouvons utiliser l'algorithme de Sardinas et Patterson (la démonstration de cet algorithme se fera lors de 
la prochaine mise à jour de ce chapitre). 


Pour ce faire, nous construisons un graphe {4 = (P,Ü), où P est l'ensemble des préfixes non vides 


(selon la définition des "préfixes" donnée plus haut) de mots de X, et U l'ensemble des couples (u, v) 
tels que l'un ou l'autre des possibilités suivantes soient satisfaites: 


P1. «ve X (en éliminant les couples doubles au besoin) 
ou 

P2. v£ X etilexiste x e X tel que ux=v 
Exemple: 


Pour # = {a,bb,abbba, babab} , l'ensemble P contient, en plus de X (qui sont préfixes de £), les mots 
{b,ab,abb, abbb,b,ba,bab, baba} (respectivement préfixes de {b,bba,ba,a,abab,bab,ab,b}) 


D'abord nous voyons de suite que l'ensemble À = {4,bb,abbba,babab} n'est pas un code parce que: 
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a -bb.babab .abbba = abbba.babab.bh.a (62.40) 


Maintenant, les couples de U sont pour la première possibilité P1: 
(b,b),(abbb,a),(abb, ba), (ba,bab),(bab,ab),(baba,b) (62.41) 
et pour la deuxième possibilité P2: 
(a,abb),(ab,abbb),(b,ba),(bab,baba) (62.42) 


pour lesquels le x qui sert à former le v vaut respectivement b,bb,a,a). 


Le graphique de Sardinas et Patterson sera: 


bb 
Ÿ hs Mabb) Ge * ba} a | . 
| / cé babab babab 
(@X bab)—"{baba) 
babab 
1bbba ; 2, 
abbba) (ab {ab 
(babab 


Figure: 62.12 - Graphe de Sardinas et Patterson correspondant 


où les sommets correspondants aux mots de X sont doublement cerclés. L'étiquette de chaque arc est 
un mot de l'ensemble X. Les "arcs croisés" sont tracés en pointillés et les "arcs avant" en traits pleins. Si 
l'arc (4,v) est croisé, alors l'étiquette est uv, sinon c'est le mot x tel que ux=v. 


Dans notre exemple, il y a un chemin qui part de a et arrive en a. En vertu du théorème de Sardinas et 
Patterson (que nous démontrerons lors de la prochaine mise à jour de ce chapitre), l'ensemble X n'est 
pas un code (il suffit d'un seul et unique chemin entre deux sommets quelconques de X). 


L'ensemble X est un code si et seulement si il n'y a pas de chemin non trivial dans G{Æ) d'un sommet 
de X à un sommet de X (en d'autres termes, un ensemble X est un code si et seulement si il n'y a que le 
seul et unique chemin trivial qui mène d'un sommet de X à un autre - ce sommet pouvant être le même 
comme dans l'exemple précédent). 
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Notes personnelles: 
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63. INFORMATIQUE QUANTIQUE 


Le. quantique (nous devrions plutôt parler de "calculation quantique" car nous sommes 


actuellement très loin d'un système d'entrée/sortie) est un exemple royal de l'utilisation des spécificités 
des modèles théoriques de la physique quantique pour le traitement et la transmission de l'information. 


Toutefois il faut aussi se rappeler que le comportement des transistors gravés sur la puce de votre 
ordinateur n'a pu être imaginé en 1947 par Bardeen, Brattain et Shockley qu'à partir de leurs 
connaissances en physique quantique. Donc la totalité de nos appareils électroniques fonctionnant déjà 
sur la base de semi-conducteurs fonctionnent à l'aide de développements obtenus grâce à la physique 
quantique. 


La grande nouveauté, depuis le début des années 1980, est la possibilité pour les physiciens de 
manipuler et d'observer des objets quantiques élémentaires individuels: photons, atomes, ions, etc. C'est 
cette possibilité de manipuler et d'observer des objets quantiques élémentaires qui est à l'origine de 
l'information quantique, où ces objets quantiques élémentaires permettront de construire physiquement 
les qubits. Cela dit, aucun concept fondamentalement nouveau n'a été introduit depuis les années 1930, 
et les pères fondateurs de la physique quantique (Heisenberg, Schrôüdinger, Dirac, Planck, Einstein,.……), 
s'ils ressuscitaient aujourd'hui, ne seraient pas surpris par l'informatique quantique, même s'ils seraient 
sûrement éblouis par les prouesses des expérimentateurs qui réalisent aujourd'hui des expériences 
qualifiées à l'époque de "gedanken experiment" (expérience imaginaire). 


Il vaut aussi la peine de signaler que la miniaturisation croissante de l'électronique va trouver ses limites 
en raison des effets quantiques, qui vont devenir incontournables en dessous du nanomètre. Aïnsi, nous 
estimons que la loi de Moore (hypothèse selon quoi la puissance de calcul des machines double à peu 
près tous les 18 mois) pourrait ne plus être valable d'ici 2015-2020. 


Il est fort à parier que la mode de l'étude de la physique quantique et son application à l'informatique 
quantique (et l'électronique quantique et la télécommunication quantique) va exploser dans les 
décennies à venir (surtout vers la fin du 21ème siècle). Ainsi, les écoles d'ingénieurs intégreront presque 
dans tous les domaines la physique quantique dans les programmes scolaires. Ce que les physiciens 
étudient depuis bientôt déjà presque 100 ans dans leur cursus. 


Avant de passer au côté formel, nous avons jugé cependant intéressant de faire un petit passage 
vulgarisé car nous avons remarqué que cela aide à comprendre les calculs qui seront faits par la suite. 


Dans les années 70 et 80, les premiers ordinateurs quantiques naissent par retournement dans l'esprit de 
physiciens tels que Richard Feynman, Paul Bénioff, David Deutsch ou Charles Bennett. L'idée de 
Feynman était qu'au lieu de nous plaindre que la simulation des phénomènes quantiques demande des 
puissances énormes à nos ordinateurs actuels, que nous utilisions alors la puissance de calcul des 
phénomènes quantiques pour faire plus rapides que nos ordinateurs actuels. 


Longtemps les physiciens ont douté que les calculateurs quantiques utilisables puissent exister, et même 
que nous puissions en faire quelque chose de viable s'ils existaient. Mais: 


- En 1994, Peter Shor, un scientifique d'AT&T montre qu'il est possible de factoriser des grands 
nombres dans un temps raisonnable à l'aide d'un calculateur quantique. Cette découverte débloque 


brusquement des crédits. 
[Vincent ISOZ] | http://www.sciences.ch] | Page: 


- En 1996, Lov Grover, invente un algorithme basé sur les calculateurs quantiques permettant de 
trouver une entrée dans une base de données non triée. 


- En 1998, IBM est le premier à présenter un calculateur quantique de 2 qubits (pour "Quantum Bit"). 


- En 1999, l'équipe d'IBM utilise l'algorithme de Grover pour la recherche quantique rapide sur une 
base de données (quantum database search ) sur un calculateur de 3 qubits et battent leur record l'année 
suivante avec un ordinateur de 5 qubits. 


- En 2001, IBM crée un calculateur quantique de 7 qubits et factorise le nombre 15... grâce à 
l'algorithme de Shor ( ). Les ordinateurs à 7 qubits sont bâtis 
autour de molécules de chloroforme et leur durée de vie utile ne dépasse pas quelques minutes. 


- En 2007, la compagnie canadienne D-Wave lors d'une démonstration a présenté un ordinateur 
quantique à 16 qubits. 


La mémoire d'un ordinateur classique est faite donc de bits (1 À: 
Chaque bit porte soit un 1 soit un 0 (mode bipolaire). La machine calcule en manipulant ces bits. Un 
calculateur quantique travaille sur un jeu de qubits. Un qubit peut porter soit un 1, soit un 0, soit une 
superposition d'un 1 et d'un 0 (ou, plus exactement, il porte une distribution de phase). Le calculateur 
quantique calcule en manipulant ces distributions comme nous le verrons dans les détails plus loin. 


Interroger un qubit dont la phase n'est pas de 0° ou de 90° ne sert pas à grand-chose: nous obtiendrons 
la réponse 0 avec une probabilité donnée, et la réponse 1 avec une autre probabilité... et il est possible 
de construire des générateurs aléatoires bien moins onéreux! En revanche, si nous arrivons à créer un 
algorithme qui le conduit systématiquement à une phase 0° ou 90°, nous obtiendrons un résultat 
déterministe. Encore faut-il que celui-ci corresponde à une réponse cherchée. 


Un calculateur quantique pourrait être implémenté à partir de toute particule pouvant avoir deux états. 
Il peut être construit à partir de photons, ou à partir de n'importe quelle particule ou atome comportant 
un spin. 


Comme nous le savons, un ordinateur classique ayant trois bits de mémoire peut stocker uniquement 
des nombres de trois chiffres composés de uns ou de zéros digitaux (cf. cha ) 
pour un total de 8 états qu'il doit traiter à part. À un moment donné, il pourrait contenir les bits 101. 


Un ordinateur quantique ayant trois qubits peut en fait stocker 16 valeurs, assemblées deux par deux 


pour former 8 2°) nombres complexes. Il pourrait, par exemple, contenir ceci (nous démontrerons bien 
sûr d'où vient cela un peu plus loin!) à un instant donné: 
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État Amplitude Probabilité 
atib  |(a°+bf) 
000 (0.37+i0.04| 0.14 
001 (0.11+i0.18| 0.04 
010 (0.09+i0.31| 0.10 
[011 0.03+i0.30| 0.18 
100 0.35+i0.43| 0.31 
101 (0.40+i0.01| 0.16 
110 [0.09+i0.12| 0.02 
111 0.15+0.16| 0.05 


La première colonne montre tous les états possibles pour trois bits. Un ordinateur classique peut donc 
seulement porter un de ces états à la fois. Un ordinateur quantique, lui, peut être dans une superposition 
de ces 8 états à la fois. La deuxième colonne montre l'amplitude pour chacun des 8 états. Ces 8 
nombres complexes sont un instantané du contenu d'un ordinateur quantique à un moment donné. 
Durant le calcul, ces trois nombres changeront et interagiront les uns avec les autres. En ce sens, un 
ordinateur quantique à trois qubits a bien plus de mémoire qu'un ordinateur classique à trois bits. 


Cependant, il n'est pas possible de voir directement ces trois nombres. Quand l'algorithme est fini, une 
seule mesure est accomplie. La mesure retourne une simple chaîne (string) de 3 bits et efface les 8 
nombres quantiques. De plus, le report de calculs intermédiaire doit utiliser l'intrication quantique ce 
qui est loin d'être simple. 


La troisième colonne donne la probabilité pour chacune des chaînes possibles. Dans cet exemple, il y a 
14% de chance que la chaîne retournée soit 000, 4% que ce soit 001 et ainsi de suite. Chaque nombre 
complexe est nommé "amplitude" et chaque probabilité une "amplitude carrée". La somme des huit 
probabilités est égale à un. 


Typiquement, un algorithme d'un ordinateur quantique initialisera tous les nombres complexes à des 
valeurs égales, donc tous les états auront les mêmes probabilités. La liste des nombres complexes peut 
être imaginée comme un vecteur à 8 éléments. À chaque étape de l'algorithme, le vecteur est modifié 
par son produit avec une matrice. La matrice provient de la physique de la machine et sera toujours 
inversible, et s'assurera que la somme des probabilités continue à être égale à un. 


Il faut d'abord réaliser un calcul conduisant à un état non superposé. En effet, si on interroge un qubit 
qui se trouve dans une superposition d'états, la réponse sera aléatoire et ne nous apprendra pas grand- 
chose. Il faut donc trouver un algorithme donnant une réponse unique pour tous les chemins de calcul 
possibles. C'est un problème semblable à celui des énigmes où l'on doit obtenir une réponse toujours 
vraie en la posant à une série d'intermédiaires dont on sait que certains mentent toujours et d'autres 
jamais. La question est donc de trouver un calcul parvenant à cet invariant, par exemple dans le cas du 
cassage d'un code la clé de chiffrage que l'on cherche à déterminer. 


Un autre problème ensuite est de le mesurer: la lecture d'un seul bit d'un état quantique détruit la 
totalité de cet état. Il faudra donc refaire le calcul autant de fois que la réponse souhaitée comporte de 
bits, mais le temps correspondant sera juste proportionnel à ce nombre de bits et non exponentiellement 
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plus grand, ce qui est justement le but recherché. 


Commençons par comprendre les concepts sous-jacents à la théorique quantique de l'informatique 
quantique avec une étude de la polarisation du photon. 


1. POLARISATION DU PHOTON 


Depuis Einstein, nous savons que la lumière est composée de photons, ou particules de lumière et 
celle-ci a un aspect dual onde-particule (cf. chapitre d'Optique Ondulatoire). Si nous réduisons 
l'intensité lumineuse d'un faisceau de photons, nous devrions pouvoir étudier la polarisation des photons 
individuels, que nous savons parfaitement détecter à l'aide de photomultiplicateurs. Supposons que 
l'expérience détecte N photons. Lorsque } — ©, nous devons retrouver les résultats de l'optique 
ondulatoire (voir chapitre du même nom). 


Effectuons par exemple l'expérience suivante: 


” 


axe optique 


[e) D, 
lame 
biréfringente 
Figure: 63.1 - Expérience imaginaire pour la mesure de la polarisation 


Une lame biréfringente sépare un faisceau lumineux dont la polarisation fait un angle & avec Ox en un 
faisceau polarisé suivant OX et un faisceau polarisé suivant Oy, les intensités étant respectivement 
Icos? 8 et 7sin° 9 (selon la démonstration de la loi de Malus faite dans le chapitre d'Optique 
Ondulatoire). 


Réduisons l'intensité de telle sorte que les photons arrivent un à un, et plaçons deux photodétecteurs 
D,, D, derrière la lame. L'expérience montre que 2,, 2, ne cliquent jamais simultanément (sauf cas de 


"dark count" où un compteur se déclenche spontanément): un photon arrive entier soit sur 2, , soit sur 
D,, un photon ne se divise donc pas. D'autre part, l'expérience montre que la probabilité 12) de 
détection d'un photon par 2, (2,) est de cos? 8 (sin? ) . Ainsi, si l'expérience détecte N photons, 


nous aurons donc (,) photons détectés par À, (2,) : 


N,=Ncos 8 N,2Nsn°@ (631) 


où le tient compte des fluctuations statistiques. Comme l'intensité lumineuse est proportionnelle au 
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nombre de photons, nous retrouvons bien la loi de Malus à la limite 3} — co. 


Cependant, nous notons deux problèmes: 


1. Pouvons-nous prévoir, pour un photon donné, s'il va déclencher 2, ou 2, ? La réponse de la théorie 


quantique est NON, énoncé qui a profondément choqué Einstein (Dieu ne joue pas aux dés!). Certains 
physiciens (dont Einstein) ont été tentés de supposer que la théorie quantique était incomplète, et qu'il y 
avait des "variables cachées" dont la connaissance permettrait de prévoir le sort individuel de chaque 
photon. Moyennant des hypothèses très raisonnables sur lesquelles nous reviendrons, nous savons 
aujourd'hui que de telles variables cachées sont exclues. Les probabilités de la théorie quantique sont, 
nous le savons (cf. chapitre de Physique Quantique Ondulatoire), intrinsèques! Elles ne sont pas liées à 
une connaissance imparfaite de la situation physique, comme c'est le cas par exemple dans le jeu de pile 
ou face. 


2. Si nous recombinons les deux faisceaux de la première lame biréfringente, en utilisant une seconde 
lame symétrique à la première: 


Figure: 63.2 - Expérience imaginaire recombinant les deux faisceaux 


et si nous cherchons la probabilité qu'un photon traverse l'analyseur, un photon peut choisir le trajet x 
avec une probabilité cos? 8, il a ensuite une probabilité 44? æ de traverser l'analyseur soit une 
probabilité totale +55? 9cos? æ. S'il choisit le trajet y, il aura une probabilité sn? 9sin? æ de traverser 


l'analyseur. La probabilité totale s'obtient donc en additionnant les probabilités des deux trajets 
possibles: 


B, =cos" cos a+sin?8sin?æ (63.2) 


Ce résultat est FAUX! En effet, l'optique classique nous apprend que l'intensité est 7 cos’ (8 = a) (cf. 
chapitre d'Optique Ondulatoire) et le résultat correct, confirmé par l'expérience est: 
PB, “cos (8-a) (63.3) 
Ce qui n'est pas du tout la même chose! 
En fait, pour retrouver les résultats de l'optique ondulatoire, il faut se rappeler que la probabilité en 


physique quantique s'obtient par la norme au carré de l'amplitude de probabilité (cf. chapitre de 
Physique Quantique Ondulatoire). Aïnsi: 
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a(8— x) = cos 8 a(x— «a)= cos æ 
a(8—y)=sing a(y—a«)=sinæ 


et nous devons additionner les amplitudes pour des trajets indiscernables et en utilisant les relations 
trigonométriques de base, nous obtenons: 


de = CosO cos + sin sin & = cos(8- à) 


ce qui redonne bien: 


B, = fau f = cost (8- a) 


Supposons que nous ayons un moyen de savoir si le photon emprunte le trajet x ou le trajet y 
(impossible dans notre cas, mais des expériences analogiques répondant à la question "Quel trajet?" ont 
été réalisées avec des atomes). Nous pourrions alors diviser les photons en deux classes, ceux qui ont 
choisi le trajet x et ceux qui ont choisi le trajet y. 


Pour les photons ayant choisi le trajet x, nous pourrions bloquer le trajet y par un cache sans rien 
changer, et inversement pour les photons ayant choisi le trajet y nous pourrions bloquer le trajet x. Bien 
évidemment, le résultat ne peut être alors que F,. Si nous arrivons à discriminer entre les trajets, le 


résultat n'est plus le même, les trajets ne sont plus indiscernables. Dans les conditions expérimentales où 
il est impossible en principe de distinguer entre les trajets, nous pouvons dire au choix: 


1. Soit que le photon emprunte les deux trajets à la fois (...) 


2. Soit que cela n'a pas de sens de poser la question "Quel trajet?", puisque les conditions 
expérimentales ne permettent pas d'y répondre. 


Il faut noter que si l'expérience permet de décider entre les deux trajets, le résultat est BE, même si 


nous décidons de ne pas les observer. Il suffit que les conditions expérimentales permettent, en 
principe, de distinguer entre les deux trajets. 


2. QUEIT 


Nous pouvons utiliser la polarisation des photons pour transmettre de l'information, par exemple par 
une fibre optique. Nous décidons tout à fait arbitrairement, d'attribuer la valeur 1 du bit à un photon 
polarisé suivant Ox et la valeur 0 à un photon polarisé suivant Oy. 


Pour étudier la théorie, il est devenu traditionnel de se représenter que les deux personnes qui 
échangent de l'information sont appelées conventionnellement Alice (A) et Bob (B). Alice envoie par 
exemple à Bob la suite de photons polarisés suivante: 


YYXYXYYVX... 


Bob analyse la polarisation de ces photons à l'aide d'une lame biréfringente et en déduit le message 
d'Alice: 


001010001... 
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Ce n'est évidemment pas une façon très efficace d'échanger des messages, mais c'est à la base de la 
cryptographie quantique ( Crypto; ). Cependant, la question intéressante est 
maintenant: quelle est la valeur du bit que nous pouvons attribuer par exemple à un photon polarisé à 
45° ? Suivant les résultats précédents, un photon polarisé à 45° est une superposition linéaire d'un 
photon polarisé suivant Ox et d'un photon polarisé suivant Oy. Un qubit est donc une entité beaucoup 
plus riche qu'un bit ordinaire, qui ne peut prendre en logique stricte que les valeurs 0 et 1. 


En un certain sens, un qubit peut prendre toutes les valeurs intermédiaires entre 0 et 1 et contiendrait 
donc une quantité infinie d'information ! Cependant, cet énoncé optimiste est immédiatement démenti 
lorsque nous nous rendons compte que la mesure du qubit ne peut donner que le résultat 0 ou 1, quelle 
que soit la base choisie. Malgré tout, nous pouvons nous poser la question de cette "information 
cachée" dans la superposition linéaire et nous verrons que nous pouvons l'exploiter sous certaines 


conditions. 


Afin de rendre compte de la possibilité des superpositions linéaires, il est naturel d'introduire pour la 
description mathématique de la polarisation un espace vectoriel complexe (cause: phaseurs) à deux 
dimensions correspondant au plan de polarisation comme nous l'avons vu dans le chapitre d'Optique 
Ondulatoire. Nous noterons cet espace vectoriel # (nous reprenons la notation des espaces de Hilbert) 
et l'appellerons "l'espace de Hilbert des états de polarisation". 


Nous pouvons très bien décomposer le vecteur correspondant aux polarisations linéaires Ox et Oy en 
deux vecteurs kets |x} et |y} tel que tout état de polarisation (qu'il soit linéaire, circulaire ou autre) 


pourra se décomposer suivant cette base: 
(P}=A1x}+ dl») 


Ainsi, une polarisation linéaire sera décrite par des coefficients À, {{ réels, mais la description d'une 
polarisation circulaire ou elliptique exigera bien évidemment de faire appel à des coefficients 
complexes! 


Les amplitudes de probabilité vont correspondre à un produit scalaire sur cet espace. Soit deux vecteurs 
correspondant donc à deux polarisations différentes: 


(b}=A]x)+ ur) 
[#}=v|x)+aly) 


Le produit scalaire hermitique (cf. « ectoriel) sera donc: 


(EG) -52+ 80-171) 


Maintenant, un état de polarisation linéaire (cf. tique Ondulatoire) suivant 4 sera donné 
logiquement par (si nous nous restreignons au cas linéaire donc!): 


[8ÿ= cos8]x} +sin 8] y} 


où |x}, 


y} sont des vecteurs de norme unité. Ce qui est conforme à la représentation mentale: 
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Figure: 63.3 - Rappel du principe de décomposition du champ 
où l'amplitude du champ est normalisée à l'unité. 


L'amplitude de probabilité pour qu'un photon polarisé suivant & traverse un analyseur orienté suivant 
æ pourra maintenant s'écrire: 


(a|8}= cosœcos8+sinæsing=cos(8-æ) (63.13) 


et la probabilité de traverser l'analyseur sera toujours donnée par la norme au carré de cette amplitude 
comme nous l'avons démontré plus haut: 


lea) = cos (8-æ) (63.14) 


De façon générale, nous définirons des amplitudes de probabilité, où |D},|#'} sont des états de 
polarisation: 


afp T)=€#1D} (63.15) 
et la probabilité correspondante sera: 
2 2 - | 
ph Y)=la(pp) -Kalbif (6316) 


Nous sommes maintenant prêts à aborder la question cruciale de la mesure dans le cadre de cette 
expérience quantique. Reprenons l'ensemble polariseur/analyseur, en supposant que l'analyseur soit 
orienté suivant Ox. Si le polariseur est aussi orienté suivant OX, un photon sortant du polariseur traverse 
l'analyseur avec une probabilité de 100%; si le polariseur est orienté suivant Oy, la probabilité est nulle. 
L'analyseur effectue un test (de la polarisation), et le résultat du test est 1 ou 0. Le test permet donc de 
connaître l'état de polarisation du photon. 


Mais ceci n'est pas le cas général! 


Supposons que le polariseur soit orienté suivant la direction générale & ou la direction orthogonale 4, 
(il y a une rotation de x{2 [rad]). Nous avons alors en utilisant les propriétés du cercle 
trigonométrique: 
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[8 = cos 8] x} + sin8|y} 
[8,}=-sin8|x)+cos8|y} 


et donc si le polariseur prépare par exemple le photon dans l'état |4} et que l'analyseur est orienté 
suivant OX, la probabilité de réussite du test sera toujours :,,? 4 quel que soit le type de polarisation!! 


Rappelons que dans cet exemple, après le passage dans l'analyseur, l'état de polarisation du photon n'est 
plus |#°, mais |x}. La mesure modifie donc l'état de polarisation. 


Remarque: Bien sûr, une autre manière de voir que les deux vecteurs plus hauts sont orthogonaux 
est d'effectuer un produit scalaire et de constater que celui-ci est nul. 


Nous constatons une différence de principe entre la mesure en physique classique et la mesure en 
physique quantique. En physique classique, la quantité physique à mesurer préexiste à la mesure: si un 
radar mesure la vitesse de votre voiture à 180 Km/h sur l'autoroute, cette vitesse préexistait à sa mesure 
par le gendarme. Au contraire, dans la mesure de polarisation d'un photon |# par un analyseur orienté 


suivant OX, le fait que le test donne une polarisation suivant Ox ne permet pas de conclure que le 
photon testé avait au préalable sa polarisation suivant Ox. 


Donc nous avons un dispositif préparant le système quantique dans l'état [D et un second capable de 
le "préparer" dans l'état | Y} que nous utiliserons comme analyseur. Après le test, le système quantique 
sera donc dans l'état |[}}, ce qui veut dire du point de vue mathématique que nous réalisons une 


projection orthogonale sur |Y}. 


Soit P, ce projecteur, alors la projection orthogonale vectorielle (cf. cha Cala ctoriel) est 
donnée par: 


R|#}=lFXFIS) 


ce qui consiste (pour rappel) en un simple produit scalaire (projection orthogonale scalaire) multiplié 
par le vecteur |}. Ceci se voit aisément en plaçant judicieusement les parenthèses: 


Pr. 14}= (rE0IS) 


et donc: 


Pa = PIC 


La projection du vecteur d'état est appelée, comme nous l'avons déjà vu ( Il 
), dans l'interprétation de Copenhague de la physique cuoniique: ‘réduction du 

vecteur d'état", ou, pour des raisons historiques, "réduction du paquet d'ondes". Cette réduction du 

vecteur d'état est une fiction commode de l'interprétation de Copenhague, qui évite d'avoir à se poser 


des questions sur le processus de mesure. 


Le lecteur habitué à l'algèbre linéaire (voir chapitre du même nom) remarquera trivialement que nous 
pouvons manipuler la convention de notation du projecteur comme une matrice (application linéaire) 
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telle que dans deux cas particuliers simples (ceux qui nous intéressent!): 
1 0 0 0 
2-bl-l 6] 8h61 fe co 


Un lecteur nous ayant demandé de préciser la démarche, voyons comme nous arrivons à cet aspect 
matriciel de la projection orthogonale avec un exemple particulier de deux vecteurs dans un espace réel 
à deux dimensions. Considérons: 


et donc (la démarche est la même pour y): 


x x x x(4P, +x D, 
san) Jan (12:22) 
(x }{xl ) ki [es P: X3 Per cie 2 (4% +x2®) | 


1e | Rd +412 D : ” ef 1e) (63.23) 


A D+00 2) [rnb +x®,] [xx x? [\P2 
——y—— 


FR 


Remarque: L'écriture matricielle du projecteur orthogonal est souvent présentée en tant qu'une 
définition d'un outil mathématique appelé "produit extérieur". 


Donc finalement, pour en revenir à nos moutons, nous avons: 


1 


pe héle-hre-(@)2l le 20 


et idem pour l'autre composante. 


Comme: 
[8ÿ= cos8|x}+sin8|y} (63.25) 
Nous avons alors: 


28 +cos 8sin D 
Po|®} =|8}(8[8}=|8)(c0s 8, +sin 8P, = ee PL 


cos? 8  sinOcos 8 ®, 
indcos® sin’ 8 P, 
Nous remarquerons que l'opérateur identité peut être écrit comme la somme des deux projecteurs 


Re, 


ain cos D, + sin? æ, 
(63.26) 
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P+B = ll+ Ole (227 


relation dite "relation de fermeture", qui se généralise à une base orthonormée d'un espace de Hilbert 
4 de dimension N: 


She [= 1 Gl/}=4 (6329) 


Par ailleurs, les projecteurs À, 7, 


, commutent (vérification triviale): 


[5 P,] =PP,-PP=0 (6329) 


Ainsi, les tests |x}, 


y} sont compatibles (quel que soit le sens de la mesure le résultat en est 


indépendant). En revanche, les projecteurs P,, ,,: 


cos 8 sin Pcos8 sin? 8 — sin ÿcos 8 
TP, =|8 = PF, 19, 16, le 63.30) 
£ | À | sindcos® sin? 8 | is | 1. | |: cos 8 cos? 8 | 
qui satisfont (vérification triviale) à: 
|8ÿ{8[+18,}{8, |=1 (8]8,ÿ=0 (63.31) 


ainsi qu'à (vérification triviale): 
Rle)-le){ele)- 8) 2143-28 12)-18) «2 
ne commutent pas avec ?,, P,: 


[2.2 ] ( ain gcos # —. 
, = 63.33) 
M: — sin cos 9 (l | 


et donc les tests |x},[8 sont incompatibles. 


Pour des développements ultérieurs, il sera utile de remarquer que la connaissance des probabilités de 
réussite d'un test T permet de définir une valeur moyenne (espérance): 


(T}=1 PT =D+0 PT =0)= PT =) (6334) 


En analogie avec le contexte, nous pouvons lire cela ainsi: l'espérance du test est égale à la valeur 
représentative du photon orienté selon Ox (correspondant à la valeur 1 arbitrairement) multipliée par la 
probabilité de passer l'analyseur orienté aussi selon Ox (donc test concluant à 100%) sommée à la 
valeur représentative du photon orienté selon Oy (correspondant à la valeur 0 arbitrairement) multiplié 
par la probabilité de passage l'analyseur toujours orienté selon Ox (donc 0% des photons Oy passeront 
le test Ox). 


Par exemple, si le test T est représenté par la procédure |} et que nous l'appliquons à un état |} 


(contenant comme nous l'avons vu plus haut les valeurs représentatives du photon polarisé en linéaire 
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ou autre...) alors le test correspond à un produit scalaire: 


P(P)=fCUO - Ce tIe)- IEEE) = IR) (6335) 
et comme nous l'avons vu dans le chapitre de Physique Quantique Ondulatoire, nous savons qu'au fait: 
{M}, = (P|PR D) (63.36) 
est la valeur moyenne d'un opérateur M dans l'état |P\. Ainsi, au test T auquel est associée une 


procédure |}, nous pouvons associer le projecteur 2, dont la valeur moyenne dans l'état | donne 
la probabilité de réussite du test. 


La généralisation de cette observation permet de construire les propriétés physiques d'un système 
quantique. Donnons un exemple en revenant au cas de la polarisation. Supposons que nous 
construisions (de manière tout à fait arbitraire) une propriété A4 d'un photon de la façon suivante: 


AMA{ vaut +1 si le photon est polarisé suivant Ox 
MA vaut -1 si le photon est polarisé selon Oy. 
Nous pouvons associer à la propriété physique A4 l'opérateur hermitique: 
MR =R (6537 
qui vérifie bien (trivial) la relation entre opérateur, valeur propre et vecteur: 
M|x}= +1 |x}e+|x) _ 
Mb} bb) 
La valeur moyenne (espérance) de M étant alors (par définition): 
(M}=(+1) P(M =1)+(-D'P(M=-1) (63.39) 


Supposons le photon dans l'état de polarisation linéaire &, alors la valeur moyenne {M l dans l'état 
|8Ÿ est (trivial): 


{M4}, = {(8[R8)-{8/P 8 = cos? 8- sin? 8 = cos(28) (63.40) 
Avant de voir, comment nous pouvons construire un tel opérateur M avec un autre objet que le photon 


et ce avec les mêmes propriétés, introduisons un outil mathématique généralisant les conditions et la 
configuration d'une onde polarisée quelconque: 


2.1. SPHÈRE DE BLOCH 


La sphère de Bloch est comme nous allons le voir une représentation géométrique des états des qubits 
comme points de la surface d'une sphère. 


Un certain nombre d'opérations élémentaires faites en informatique quantique peuvent sous le choix 
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d'un projecteur adéquat être réalisées avec cette sphère. 


Nous allons montrer qu'un état d'un qubit arbitraire peut être écrit: 
8 6 . © 
[P\=e7 (co 510)+e? sin 1) (63.41) 


où FER etO0<g<zz,0<#£<27 définissent un point sur la sphère tridimensionnelle de Bloch. 
Les qubits représentés par des valeurs arbitraires de Y (invariance de jauge globale selon U(1)) sont 


tous représentés par le même point sur la sphère de Bloch parce que nous allons montrer que le facteur 
n'a pas d'effet observable et que nous pourrons alors écrire sans perdre en généralité: 


[F}= c08 € |0)+e sin 2) (63.42) 


ce qui est représenté comme nous le justifierons plus loin par la figure ci-dessous: 


[09 


Figure: 63.4 - Sphère de Bloch 


La sphère de Bloch est une généralisation de la représentation d'un nombre complexe z avec lf = | 


comme un point du cercle dans le plan (de Gauss) comme nous l'avons vu lors de notre étude des 
nombres complexes dans le chapitre traitant des Nombres. 


Nous avions vu également dans ce même chapitre qu'un nombre complexe pouvait être représenté par 
une exponentielle complexe telle que: 


z=x+iy= re® (63.43) 
et si le cercle était unitaire: 
z=e® (63.44) 


Notons que la contrainte lf = 1 élimine un degré de liberté. 


Nous allons maintenant noter la décomposition d'un état de polarisation sous la forme: 
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[P}=eælx}+ 4») (6345) 
et celle-ci sous une forme plus traditionnelle en informatique quantique (logique vu les bases.): 
[P}=eæl0)+81D (6346) 


où &,# € € (eh oui! on est plus dans le cas simple d'une onde polarisée linéairement maintenant...!) 
sans oublier la condition de normalisation: 


(|)= EE 2e +14 21 (6347) 
Nous pouvons donc écrire le qubit sous la forme: 


[Dh = re lo} +rçe [1} (63.48) 


Remarque: Attention il est très important d'avoir lu la partie traitant de la polarisation de la lumière 
dans le chapitre d'Optique Ondulatoire pour comprendre que cela ne tombe pas du ciel! À la 
différence, que nous ne travaillons pas ici avec des phaseurs car la solution de l'équation d'évolution 
de Schrôdinger comporte des exponentielles complexes comme nous l'avons vu dans le cadre de la 
résolution de celle-ci pour un mode propre d'une particule libre. 


Ajouter un facteur de phase globale ne devrait avoir aucune influence sur les coefficients &, 8 car: 


af = (e7a) (ea) = (e7a)(e va) = aæ=laf (63.49) 
et similairement pour | af . Ainsi, nous sommes libres de multiplier notre qubit polarisé et normalisé: 


|g}= re À Lo} iL [1 (63.50) 
par la phase globale ,-Ÿ#: ce qui donne: 
Be me brotdh |0h+ rue ce PE 1) 7, 10) +rge 8 [1h 7e [O)+ ra 0/1) (62:50 
En plus, nous avons toujours la condition de normalisation {| #'}=1 à respecter (imposer). 
En revenant aux coordonnées cartésiennes, nous avons: 
ar l0)+ree Pare [0)+(x+b)f1) (63.52) 
et la contrainte de normalisation donne alors: 
+ x = 72 + (x ti) (x ip) = 78 +22 432 21 (6359) 


Ce qui est l'équation d'une sphère unitaire dans l'espace m* avec les coordonnées cartésiennes 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


(x, VA de D'où l'origine quantique de la sphère de Bloch! 


Nous savons (cf. chapitre de Calcul Vectoriel) que les coordonnées cartésiennes sont reliées aux 
coordonnées sphériques par les relations: 


x=rsinôcos® y=rsan8sng z=rcos8 (63.54) 


donc en renommant >, —z et en se rappelant que > = 1, nous pouvons écrire: 
[E : =: [0ÿ+ (x +iy) [1} = cos 8[0}+ sin #(cos #+i sin #)|1} = COS 8[0+ sin 8e [1} (63.55) 


Nous n'avons maintenant plus que deux paramètres utiles à connaître pour définir notre point sur la 
sphère unité (et ce toujours à l'arbitraire de phase près). 


Le lecteur remarquera que contrairement au qubit polarisé linéairement, le cas général ci-dessus rajoute 
un terme complexe et qu'inversement en enlevant ce terme supplémentaire, nous retombons sur la 
relation de l'onde polarisée linéairement vue en début de chapitre. Cependant, à noter (pour la culture 
générale), que si nous ajoutons le même terme complexe au premier terme, nous avons alors aussi la 
représentation suivante très courante de l'onde polarisée linéairement et dont l'écriture se nomme 
"vecteur de Jones": 


cos 8 


[E'= cos 8e! [0}+ sin 8e [1} = cos 8e f) +sin deŸ f) = Fe }+ (63.56) 


Mais nous n'en avons pas encore terminé! 


Revenons donc à (nous enlevons l'apostrophe pour l'état de polarisation): 
[g} = COS 8[0}+sin 9e [1} (63.57) 
et remarquons que: 
8=0—|%)=10) (6358) 
et: 


8= = =|#)= [1} (63.59) 


en n'oubliant pas que # € R et que dans ce cas le facteur exponentiel devant [1} est un changement de 


phase global sans influence. 


Tout cela suggère que 0 £ 8 < n est suffisant pour décrire n'importe quel état de polarisation et donc 


tous les points de la sphère de Bloch. 


Par ailleurs, nous pouvons voir que dans le système (r,8,#) le point de coordonnées (1,7-8,#+3) 
est le point opposé à celui de coordonnées (1,8, #): 
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lY= cos(r—8)[0}+sin(7- 8)21#+7)|1) 
=-cos(8)|0}+sin(8)e "ef |1} (63.60) 
= cos(8)[0)- sin (8) [1}=-[p}=|p" 


Nous avons par ailleurs (c'est immédiat): 
(g[g'i=0 (63.61) 


et donc des points opposés sur la sphère de Bloch correspondent à des qubits (états de polarisation) 
orthogonaux! 


Ainsi, nous pouvons considérer seulement l'hémisphère supérieur de la sphère de Bloch puisque les 
points opposés ne différent que d'un facteur de phase -1 et sont donc équivalents dans la représentation 
de la sphère de Bloch. 


Ainsi, la relation: 
[= 005€ 10)+e sin SD) (6262) 


est suffisante pour décrire toute la sphère de Bloch dans un espace complexe de dimension 2. 


Par construction, chaque point donné par la relation précédente de dimension 2 contient une double 
représentation d'une rotation dans l'espace réel de dimension 3. 


Nous avons vu par ailleurs dans le chapitre de calcul spinoriel qu'une rotation pouvait s'écrire sous la 
forme: 


+ 0 9 g + - 
aie) =Cos—On-isin—Zoë (63.63) 
2 2 2 
avec pour rappel les matrices de Pauli: 


no fo 1 fo #1. ft 01 
do alt ol le ap le 1 7 


Soit avec l'écriture habituelle (traditionnelle) du domaine de l'informatique quantique: 
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(5) -#( 
cos 5 —i sin 5 
R,(8)= 
x (6) | (2) (2) 
—i sin | — cos| — 
2 2 
[©] LÉ 
7 — L (63.66) 
2 2 
8, (8) ; 


Maintenant considérons la rotation de notre vecteur d'état de polarisation (dû à un projecteur): 


«2 0 cos ere 
ACIDE Q12 || 6 sin CA se oil 6 in © PE 
2 2 


Pour obtenir un coefficient de [0} réel (afin d'avoir une observable dans la projection d'un axe), nous 


multiplions par un facteur de phase ,#*/2 donnant: 


Pa lie - cos : 
1x2 
8 —. =|  . “ g| (6368) 
gx l2 58 ins eg % pf sin = 


donc pour obtenir une rotation autour de l'axe z il suffit de changer $ — ÿ+«. 


Donc si nous revenons sur: 
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R(L,8) — ir Chi (63.69) 
2 2 


il peut être montré de la même manière que dans un cadre général un opérateur qubit unitaire peut être 
écrit sous la forme observable: 


U = éXR(E, ) (63.70) 
Il faut choisir ensuite les angles et l'axe de rotation pour définir complètement l'opérateur. 


2.1.1. QUEIT DE POLARISATION 


Nous allons revenir ici sur le cas de la polarisation du photon mais ce coup-ci, nous allons pouvoir 
généraliser grâce à la formulation de la sphère de Bloch à n'importe quel type de polarisation. 


Imaginons pour cela un polariseur qui ne laisse passer que des photons polarisés verticalement suivis 
d'un photodétecteur, qui fait ‘clic’ si un photon est détecté et rien sinon. Ce dispositif nous permet de 
détecter les photons polarisés verticalement. 


Traduisons ceci dans le langage de la mécanique quantique: 


Les états du système sont donc les états de polarisation d'un photon. Les mesures de l'observable auront 
aussi pour valeur ses états de polarisation. 


Les mesures possibles sont: 


A =0="'eclic" 


__ (63.71) 
À = 1="pas clic' 


Nous noterons les états correspondants |x},|y}. Dans notre configuration, il est alors évident que le 


couple (4, À) représente les valeurs propres et x}, y} les vecteurs propres d'un opérateur (que nous 


ne connaissons pas) et que nous noterons donc P. 


Comme nous le savons, |x},|y} est une base orthonormée de l'espace des états (de polarisation). C'est 


la base appelée "base H/V"' pour Horizontale/Verticale et qui est notée normalement: 
[0}, [D (63.72) 
Prenons maintenant plusieurs cas: 


1. Soit un photon dans l'état: 


Alors: 


PCA = 4)= P(0) =(0/0}=1 
P(A= À)= P(= {10)= 0 
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(63.74) 


2. Soit un photon dans l'état mi-vertical/horizontal, c'est-à-dire oblique (ce qui peut être assimilé à la 
superposition quantique de ses deux polarisations): 


[0i+ [1 
Pi= 1 72 (63.75) 
| } 5 


où la racine est juste là pour assurer la condition de normalisation {| ?}=1 


Alors puisqu'il y a superposition (soit la moitié de chaque dans l'onde totale): 


P(A= 4)= P(0) = (0|Y}= 
(63.76) 


tt 
Di 


PCA = 4)= P()= (|#}- : 
3. Prenons maintenant n'importe quelle polarisation (et c'est cela que nous n'avions pas avant!): 
[a = COS : [0 +8 sin 21) (63.77) 


qui est bien normé comme nous le savons. 


Alors: 


8 2 

PCA = Ào) = P(0) = (0[F}= (cos $] 
8 2 
PCA = À)= P(D = {| T}= (sn 2) 


La somme des deux probabilités donnant bien 1! 


Maintenant, imaginons que nous tournions le polariseur de 77/4. Nous noterons la nouvelle base de ce 
polariseur |0"},|1"} déterminée par une rotation d'angle 7/4 avec par construction: 

2 (63.79) 

V2 
où la première base correspond donc à la polarisation diagonale et la seconde est appelée polarisation 


antidiagonale. Il s'agit donc de la "base D/A" (Diagonale/Antidiagonale). Sous la forme des vecteurs de 
Jones ces deux dernières relations s'écrivent: 
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[1}= [0)—|1} 


D OR 


0 ; 
+ 
1} 10} 1 n 
Si nous imaginons que nous avons deux polariseurs qui se suivent. Le premier ayant la base D/A et le 
deuxième la base H/V, le premier va préparer le photon polarisé de manière générale dans un état 
(polarisation) particulier qui sera par construction l'état oblique pour la base H/V. Aïnsi notre deuxième 
polariseur n'aura que des situations du type: 


P(A= 4)= PC) = {0|Y}= 
(63.81) 


Li 
Di 


P(A= A)= PO = (1 #)= > 


Ainsi, cela montre que toute mesure perturbe bien évidemment l'état de polarisation du photon et 
perturbe donc l'état du système. 


Ce résultat est utilisé en cryptographie quantique! 


2.2. QUEIT DE SPIN 1/2 


Nous allons voir ici comment construire un qubit basé sur une particule possédant un spin de #. 


Lors de l'étude de la sphère de Bloch, nous avons examiné un qubit à un instant déterminé et nous 
avons vu que dans un espace de Hilbert H, ce qubit est décrit (par choix) par un vecteur unitaire: 


2 _. 
lp}= æl0}+ 81} af +l8f =1 (6382 
décomposé dans une base orthonormée {[0$, |} : 
Considérons l'état initial le plus général et minimal correspondant à une orientation arbitraire d'un spin: 
8 us : © 
[g}= cos —|0} +6 sin —|1} (63.85) 
2 2 
qui correspond comme nous le savons à deux états opposés (et superposés) sur la sphère de Bloch. 
Remarquons que nous avons bien une probabilité normalisée de la forme: 


(y | gi = cos? 2 sin? == 1 (63.84) 


Nous avons également vu que la projection selon z par l'opérateur &, (a) de l'état [gi est donnée à 


l'arbitraire de phase par: 
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cos £ COS — 
gix!2r (a)| Y}= 2 | … (63.85) 
ef sin eŸ sin — 
2 
Maintenant rappelons notre exemple: 
M\x}= +1 |x)=+ 
(x) (x) (7) (63.86) 


M|>y}=-1|y}=|>) 


où M était donc un opérateur hermitique. Or les matrices de Pauli sont des opérateurs hermitiques 
simples. De plus, comme nous l'avons démontré dans le chapitre de calcul spinoriel, l'opérateur 
hermitique &, (assimilé à M) a comme par hasard les mêmes valeurs propres et vecteurs propres 


correspondant aux deux relations. Mais s'écrit alors de manière traditionnelle comme nous l'avons vu 
dans le chapitre de Calcul Spinoriel: 


a, [+}=+|+} 


c.1=#}) 


(63.87) 
ou de manière encore plus condensée: 
o,|+)=+{+) (63.88) 


De plus cet opérateur satisfait aussi la relation: 


our lt OL fr on 
23% [o of Lo 1] [o -1] 


Et quelle est la propriété physique associée à &, ? Eh bien il s'agit du spin et nous y reviendrons donc 
un peu plus bas car cela signifie que nous pouvons utiliser le spin 1/2 comme qubit. 


Maintenant introduisons l'évolution du système sur cette projection car celui-ci n'est pas statique (mais 
ceci dit cela ne changerait rien à ce cas particulier de le considérer comme statique). 


Nous avons vu dans le chapitre de Physique Quantique Ondulatoire que cette opération consistait dans 
un cas simple (comme ici) à introduire un terme de phase dépendant du temps du type: 


it 
——# (63.90) 
e À 
Ainsi: 
it it 
er pv 8 _. L 
e À ee e À De g 220 Los . PH er 
LICE . =| : = (63.91) 
— # hr if e 270 8 in e À #6 cin 
eh eŸ sn— eh e* sin— 
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Ce qui est noté plus sobrement: 


Cos— 
rés 2 (63.92) 
5: 8 
6e sin — 


Rappelons que l'état d'une particule de spin 1/2 est bidimensionnel et décrit par la matrice d'état (cf. 
chapitre de Physique Quantique Relativiste): 


M =S = she (63.93) 


Soit: 
0 1 
S,=2aqs 
2 211 0 
A s 63.94) 
22-25; 0| 7 
1 0 
2 
2 210 —1 


Si nous voulons calculer la moyenne (l'espérance) de l'observable (propriété physique) selon chaque 
axe nous avons alors en utilisant le cinquième postulat dans le cas de l'axe x: 


COS — 
és, }= (TE) |S, K16) = CE e Ÿain ;) ë. | gta 2 


ñ y. 80 cos D " . e” sin 
=—|cos— e”sin— =—|cos— e”sin— 

2 1 0] 5. 8] 2 2 8 

g” sin — COS — (63.95) 
2 2 

: ? (cos CE FL +e Ÿ sin / cos$) = AA La cos É(eŸ +e#) 

: 2 2 Si 2: A 
L LP eos 2 (cos D+i sin f+cosf—isin #) = hsin 2 ne Lo d 

CR 2 2 
L sin 9cos$ 


Selon y: 
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af 8 9. 8)n[0 + ul 2 
(5,)= OS, 1TO}= ef 05 À e sg] k ss ; 9 


x 9 . | o 71 °° 5. 0 —ie* sin — 
=—|cos— e sin =—|cos— e ”’sin— 
e° sin — 1COS— (63.96) 
2 2 
= ? —i PL PRES en LÉ = A etre ®) 
2 2 2 2 Di D À 2 
= sin . cos (+ cos(#)+ sin(#) +i cos(#)+ sin(#)) = hsin Ÿ cos Psin(#) 
À . | 
=— sin Ÿ 
j sin sin # 
Et selon z: 


cos — 
(S, }= (FOIS [TO }= ef 08 e ein sl | | bd : 
e 


210 -1 PRE 
sin — 
2 
Cos ? Cos g (63.97) 
A 8 y. eL 0 5 ï( 8 y. <) 2 L 
= —| COS — e sit — = —| COS — 2 sin — 
2 2 2/10 —-1]| 5 . 8 2 r. À ÿÿ … 
eg sin —8 APT 


= (cos Saints) = 1.8 
2 2 2 2 


Nous retrouvons donc bien pour la composante z (car c'est la seule qui nous intéresse ici) le résultat qui 
était imposé plus haut sous la forme: 


M\ ={8[P8\-{8lP8\= cos 8- sin? 8 = cos{ 28) (63.98) 
8 x y 


à une différence d'angle qui n'est qu'histoire de substitution et d'une amplitude qui permet de mettre en 
adéquation la particularité de la configuration du système. Nous avons dès lors des relations 
mathématiques similaires en tout point en ce qui concerne la manipulation des qubits de spins orientés 
ou des qubits de photons polarisés. 


La question que nous pouvons nous poser sur le spin est comment le préparer dans l'état [g} ? Au fait 


nous pouvons le faire avec un champ magnétique en copiant à l'identique l'expérience de Stern-Gerlach 
qui permet de séparer un faisceau de particules de spin 2 en deux faisceaux distincts. 


Puisque nous connaissons maintenant toutes les valeurs propres et vecteurs propres de l'opérateur de 
spin S, nous pouvons alors déterminer la forme générale de l'opérateur de spin sous une orientation 
quelconque: 
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5, =S,sanôcos$-S, san8gsing+s, cos 8 


k(|0 11]. 0 |, 1 0 
— sing cos #+|. sin 9 sin + cos 8 
2111 O0 i Ü 0 —-1 
_À cos 4 sin cos #—i sin Jsin # (63.99) 
72 sin #cos Ÿ+isin sin Ÿ — cos # 
_À cos 4 sin 8(cos f-isinf) _À cos e sing 
- sin #(cos f+isin #) — cos g OR. 


Nous avons par ailleurs: 


8 
: 8 6 8 COS — 
5x LIT (cos 210) 4e sn 21) : COS e ” si | > 


6 
g"sing -cos8 | 5, © 
à cos fcos S+sinésinS i Sir 
mi Se (63.100) 
: 89 sin Pcos ee cos deŸ sin La 2 25 | sin cos 2 — cos 9 sin — 
o : 2 À 
COS — = 
: h 2 _h cos l dy) 
2 4 [sn cos : — cos sin d . e sin 8! 2 


À 
Nous avons La qui est donc un vecteur propre de $#, avec la valeur propre . 


Maintenant, nous savons en utilisant le 5ème postulat que la probabilité de trouver la valeur propre 
hk{2 (de l'opérateur &, ), lors d'une mesure de la propriété S selon l'axe z effectuée au temps t sur le 


système quantique préparé dans l'état Y , est donnée par le carré du module de la projection de la 
fonction ou vecteur d'état 4 sur le vecteur ou vecteur propre ® associé à la valeur propre %/2 (et de 
son opérateur selon cet axe). 


Or l'opérateur selon z est: 


1 0 
T5 (63.101) 
Q -]1 


Pour le même opérateur, nous avons vu dans le chapitre de Calcul Spinoriel qu'il avait comme vecteurs 


propres: 
+}= Li jh h (63.102) 


Prenons le premier vecteur propre orienté donc selon z sur la sphère de Bloch. Nous avons alors: 
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P=kef = 0) | 


Et la probabilité selon l'autre vecteur propre donnerait la même expression mais avec un sinus. La 
somme des deux probabilités nous donnerait alors bien 1! 


Nous remarquons donc que les relations sont très similaires entre le photon et le spin dans notre cas 
d'étude. Ce qui est normal puisque les deux sont des systèmes à deux niveaux, d'où les résultats 
similaires. 
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Notes personnelles: 
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Mathématiques 


sociales 


64. DYNAMIQUE DES POPULATIONS 


Een à la fin de sa vie, avait coutume d'évoquer les trois explosions qui allaient sous peu 


menacer l'humanité: l'explosion des bombes nucléaires, l'explosion de nos savoirs, l'explosion de 
l'effectif des hommes. Le rôle des scientifiques à ce niveau n'est pas seulement d'améliorer leur savoir, 
mais de le partager et surtout de diffuser la conscience qu'ils ont acquise des conséquences qu'ils savent 
discerner. Einstein avait à coeur de jouer ce rôle. Au-delà des péripéties immédiates, il savait voir les 
évolutions à long terme. Parmi ces évolutions, celle du nombre des hommes lui apparaissait à l'évidence 
comme celle des plus grands dangers (déjà préssentis par les initiateurs de la science démographique au 
début du 18ème siècle!). Aujourd'hui, en début de ces années 2000, nous pouvons constater leur 
perspicacité. L'humanité est réellement prise à la gorge par l'accroissement de son effectif ou de son 
maintien actuel sans la forcer à la baisse (car les politiciens favorisent la croissance infinie et la 
participation aux aides sociales qui effectivement imposent une augmentation sans fin de la population). 
Les problèmes majeurs étant de garantir le plein emploi (éviter le "chômage technologique" à un certain 
niveau) et le fait que l'accroissement de la population enrichit naturellement les propriétaires et 
appauvrit les salariés (parmi tant d'autres problèmes..). 


En attendant que les politiciens de tous les grands pays occidentaux comprennent et montrent l'exemple 
en osant proposer la limitation de la population (et donc du nombre de naissances) au niveau mondial et 
que la mentalité de la population de la rue soit ouverte à ce type de proposition (c'est elle qui élit ses 
politiciens), l'étude théorique du sujet peut permettre d'ouvrir quelques perspectives. en ce qui 
concerne le renouvellement et le cycle des ressources de notre unique planète. (car pour l'instant nous 
n'en avons qu'une..). 


Pour introduire les mathématiques sociales, il nous faut d'abord déterminer les caractéristiques qui 
décrivent la dynamique du nombre d'individus avant de formaliser les propriétés uniques qui les 
caractérisent. 


1. TABLES DE MORTALITÉ ET NATALITÉ (FONCTIONS BIOMÉTRIQUES) 


Nul ne sait ni le jour ni l'heure de sa mort. Cette évidence individuelle n'est plus pertinente si nous nous 
intéressons non à telle personne, mais à une collectivité assez nombreuse. Alors jouent les 
compensations entre ceux qui succombent à des accidents prématurés et ceux qui échappent quasi 
miraculeusement aux pires dangers. Nous pouvons alors décrire la façon dont est payé globalement le 
tribut à la mort en considérant un grand nombre d'enfants nés la même année et en précisant, grâce aux 
données de l'état civil, comment leur effectif diminue peu à peu pour un jour s'annuler. 


Un tel ensemble de conscrits est appelé par les démographes une "cohorte". Considérons donc la 
cohorte des Français mâles nés en 1900. Chaque année, nous pouvons, en regroupant les indications de 
l'état civil, calculer le nombre de ceux qui sont décédés dans la cohorte. 


Représentons par 4, le quotient du nombre des décès entre les anniversaires a et a+1 par l'effectif 
initial de la cohorte. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Remarque: Nous allons dans ce qui suit définir les bases des probabilités nécessaires au calcul 
actuariel. En effet, la mathématique actuarielle réunit le calcul financier et le calcul des 
probabilités. Le paiement d'un capital n'est plus certain et dépend par exemple de la survie d'une 
personne. 


La suite de ces nombres contient la totalité de l'information nécessaire pour étudier la mortalité de cette 
cohorte. 


Nous pouvons en déduire la proportion d'entre eux survivant à l'âge a: 
S =l-dp-di-d;-..-d,1 (641) 


Nous pouvons également caractériser l'intensité de la mortalité à chaque âge en divisant le nombre des 
décès entre les âges a et a+1 par le nombre de survivants. Ce nombre est alors appelé le "quotient de 
mortalité": 


=—T (64.2) 


S ë, 


a 


À à “ah D 
en 


La liste âge par âge de ces trois paramètres d, S, et q est la "table de mortalité" de la cohorte étudiée. 
Le tableau ci-dessous en donne le résumé pour les âges multiples de 5. 


Âge Survivants | Décès de l'âge a à a+5 Probabilité des décès 

a Sa So L So+s . Sa L Sos 

a — EC 

0 1 0.228 0.228 

5 0.772 0.013 0.017 

10 0.759 0.009 0.012 

15 0.750 0.023 0.031 

20 0.727 0.023 0.032 

25 0.704 0.020 0.028 

30 0.684 0.021 0.031 

35 0.663 0.025 0.038 

40 0.638 0.029 0.045 

45 0.609 0.026 0.043 

50 0.583 0.036 0.062 

55 0.547 0.047 0.086 

60 0.500 0.062 0.124 

65 0.438 0.078 0.178 

70 0.360 0.360 


Tableau: 64.1 - Table de mortalité 
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Remarque: Suivre une génération réelle d'individus tout au long de son existence ou sur une période 
de temps déterminée est appelé "analyse longitudinale" par contraste avec "l'analyse transversale", 
qui consiste à étudier les caractéristiques d'une population à un moment donné. Le tableau ci-dessus 
est donc un exemple d'analyse longitudinale. 


Choisissons au hasard dans ce tableau le nom d'un enfant inconnu dans la liste des naissances de l'année 
1900. La grande question lors de cette naissance était: combien d'années vivra-t-il? Aujourd'hui, nous 
sommes en mesure de répondre rétroactivement à cette question, tout au moins en évoquant des 
probabilités, car nous connaissons la table de mortalité de cette cohorte. 


Si la seule information dont nous disposons aujourd'hui à propos de cet enfant est le fait qu'il est né en 
1900, nous pouvons déclarer que la probabilité qu'il ait encore été vivant à l'âge de 5 ans est égale à 
0.772, à l'âge de 50 ans de 0.583... Autrement dit que la probabilité pour qu'il soit mort avant 5 ans est 
égale à 0.228. 


Si nous désignons aujourd'hui un individu inconnu repris sur la liste de ceux qui ont été incorporés dans 
la cohorte au cours de l'année 1920 à l'âge de 20 ans, nous pouvons de même calculer les probabilités 
des diverses durées de sa vie, mais nous avons une information supplémentaire: il était encore vivant à 
20 ans, il a évité les risques de mort avant cet âge. La probabilité qu'il atteigne alors l'âge de 50 ans est 
devenue: 


La probabilité pour une personne d'âge a de décéder entre l'âge a et a+n est logiquement donnée par: 


44 _ Sa = D En _ Lie 
: SA SA 


Ainsi à chaque âge, nous pouvons donner la loi de la variable "durée encore à vivre”. Cette loi peut être 
résumée en indiquant son espérance (cf. chap ). Un calcul immédiat permet d'en 
donner la valeur à chaque âge en fonction de la table de mortalité. 


Ce résultat peut être passionnant pour un historien, mais il donne une réponse à une question posée il y 
a longtemps et depuis oubliée. Ce qui nous intéresse est le présent. Cet enfant qui vient de naître, quelle 
est son espérance de vie? Pour répondre, il faudrait connaître la table de mortalité de sa génération, or 
le don de prémonition n'existe pas. L'attitude probabiliste permet de contourner cette difficulté à 
condition de bien préciser les hypothèses sous-jacentes. 


Ainsi, pour répondre à la question: quelle est l'espérance de vie des nouveau-nés de 1990, nous faisons 
alors l'hypothèse, tout à fait gratuite, qu'ils rencontreront à chaque âge, à l'avenir, les conditions qu'ont 
rencontrées en 1990 les individus de ces âges: en l'an 2000 ils subiront la même mortalité que celle 

subie en 1990 par ceux qui sont nés en 1980. Bien sûr, personne n'imagine que la réalité sera conforme 
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à cette hypothèse, mais le calcul qu'elle permet fournit une image synthétique des conditions actuelles 
de la lutte contre la mort. 


C'est cette hypothèse qui fait que l'espérance de vie rajeunit parfois les vieux (leur espérance de vie 
ayant tendance à augmenter au fur et à mesure qu'ils deviennent plus âgés grâce aux progrès de la 
science...) 


Prenons pour le calcul de l'espérance de vie, la table de mortalité pour les hommes en Suisse en 
1983-1993: 


Âge | Survivants | Espérance de vie | Âge Survivants| Espérance de 
n S E(a) n S vie 
E(a) 
0 | 1 73.68823 55 | 0.90224 22.81093 
| 1 | 0.99246 73.24806 | 56 |0.89581 |  21.97466 
2 | 0.99183 72.29459 57 | 0.88875 21.14922 
3 | 0.99148 71.32011 58 | 0.88099 20.33551 
4 | 0.99117 70.34241 59 | 0.87247 19.53409 
5) | 0.9909 69.36158 60 | 0.86312 18.7457 
6 | 0.99066 68.37838 61 | 0.85288 17.97077 
7 | 0.99044 67.39357 62 | 0.84169 17.20969 
8 | 0.99022 66.40855 63 | 0.82948 16.46301 
9 | 0.99001 65.42263 64 | 0.81618 15.73128 
10 | 0.98971 64.44246 65 | 0.80174 15.01462 
11 0.9896 63.44963 | 66 | 0.78609 14.31354 
12 | 0.98938 62.46373 67 | 0.76918 13.62821 
13 | 0.98915 61.47826 68 | 0.75096 12.95887 
14 | 0.98889 60.49442 69 | 0.73138 12.30579 
15 | 0.9886 59.51217 70 0.7104 11.66921 
16 0.98823 58.53445 71 | 0.68798 11.04949 
17 | 0.9877 57.56586 72 | 0.66409 10.44699 
18 | 0.98692 56.61136 73 | 0.63873 9.861773 
19 | 0.98581 55.6751 74 0.6119 9.294182 
20 | 0.98439 54.75541 75 | 0.58362 8.744543 
21 | 0.98285 53.84121 76 | 0.55393 8.21324 
22 | 0.98131 52.9257 77 | 0.52291 7.700465 
23 | 0.97975 52.00997 78 | 0.49066 7.206599 
24 | 0.97815 51.09505 79 | 0.45733 6.731813 
25 | 0.97653 50.17981 80 | 0.42309 6.276608 
26 | 0.9749 49.26371 81 | 0.38819 5.840903 
27 | 0.97328 48.34571 82 | 0.35288 5.425357 
28 | 0.97166 47.42631 83 | 0.31748 5.030301 
29 | 0.97007 46.50405 84 | 0.28234 4.656372 
30 | 0.9685 45.57943 85 | 0.24785 4.304337 
31 | 0.96694 44.65297 86 | 0.21446 3.974494 
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| 32 | 0.96541 43.72373 87 | 0.18263 3.667196 
33 | 0.96388 42.79314 88 | 0.15281 3.382828 
34 | 0.96236 41.86073 89 | 0.12546 3.120277 
35 | 0.96082 40.92782 90 | 0.10091 2.879397 

| 36 | 0.95927 39.99395 91 | 0.07942 2.658524 

| 37 | 0.95768 39.060335 92 | 0.06111 2.455081 
38 | 0.95604 38.12736 93 | 0.04593 2.266492 
39 | 0.95434 37.19528 94 | 0.03373 2.086273 
40 | 0.952357 36.26439 95 | 0.02414 1.915079 
41 | 0.95071 35.33534 96 0.0168 1.751786 
42 | 0.94874 34.40871 97 | 0.01134 1.595238 
43 | 0.94665 33.48468 98 | 0.00739 1.447903 
44 | 0.94441 32.5641 99 | 0.00464 1.306034 
45 | 0.94201 31.64706 100 | 0.00279 1.172043 

| 46 | 0.93942 30.73431 101 | 0.0016 1.04375 
47 | 0.93662 29.82619 102 | 0.00087 0.91954 
48 | 0.93356 28.92396 103 | 0.00045 0.777778 
49 | 0.93023 28.0275 104 | 0.00021 0.666667 
00 | 0.92659 27.1376 105 | 0.00009 0.555556 
o1 | 0.92259 26.25526 106 | 0.00004 0.25 
92 | 0.91821 25.3805 107 | 0.00001 0 
53 | 0.91338 24.51471 108 0 
04 | 0.90808 23.65779 


Tableau: 64.2 - Table de mortalité en Suisse en 1983-1993 


Donc la courbe représentative, appelée "l'ordre des vivants" est: 


0 5 0 # 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 V0 05 


Figure: 64.1 - Probabilité cumulée de survie en fonction de l'âge 


Voyons comment calculer l'espérance de vie. Pour cela, considérons un homme en vie lors de son 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


a-ème anniversaire. Le nombre d'années qui lui reste à vivre est une variable aléatoire dont nous 
pouvons calculer l'espérance mathématique (cf. chapitre de Probabilités), En nédgligeant les fractions 
d'années, cette espérance peut s'écrire: 


: (0 D, +1 Da +2 Du +.) 
]l 
” S L0-(Se — Sou) +1 (Sea — Sosa) +2: (842 — Sous) +..] 
l (64.6) 
5 Len — Sora + 28042 — 243 +... 
l 
_ [Sa +42 +S 4 +4] 
5 
1 Ss 
se n=l s 


Si a est pris comme étant égal à zéro, les démographes parlent de EDVN (espérance de vie à la 
naissance). 


Voici pour information l'augmentation de l'espérance de vie chez les hommes (source: Institut National 
Français d'Études Démographiques) depuis 1996 à 2006: 


1996 74.1 
1997 74.5 
1998 74.8 
1999 75.0 
2000 73,3 
2001 75.5 
2002 75,7 
2003 73.9 
2004 76.7 
2005 76.8 
2006 172 


Tableau: 64.3 - Augmentation de l'espérance de vie à la naissance 


Nous pouvons donc observer à l'aide du tableau ci-dessus que l'espérance de vie augmente d'un peu 
plus d'un an tous les quatre ans depuis plus de 50 ans (et jusqu'à quand...) 
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MM 22 sears anc nioner UM 55-69 years 
| EMIRTE UM 60-64 years 
| HÉMENTÉ 55-59 years 
7577 vers Een years 
74-75 years M :5-20 555 
72-73 years UM 40-44 vears 
70-71 years M 25-20 255 
Na BMiower tan 35 years 


Enfin, signalons que les actuaires définissent l'espérance de vie conditionnelle comme étant la somme: 
e(a,s)=a+ÆE(a) (647) 


à l'âge a pour le sexe s. Ces calculs nous seront utiles pour le calcul des primes d'assurance retraite dans 
le chapitre Techniques De Gestion. 


Passons à un tout autre sujet. Nous savons qu'à ce jour, pour faire un enfant, il faut être deux, certes les 
démographes le savent aussi. Mais cette double source de chacun des nouveau-nés leur pose de tels 
problèmes de description et d'analyse de la fécondité qu'ils préfèrent en général l'ignorer. Leur attitude 
est justifiée par le fait que seule la conception nécessite l'intervention de deux acteurs. Au moment de 
la naissance, la mère agit seule. Or la démographie ne s'intéresse pas aux conceptions, inaccessibles à 
l'observation, mais seulement aux naissances. 


Nous avons vu comment nous pouvons suivre un ensemble d'hommes ou de femmes nés une année 
donnée et enregistrer les décès successifs, ce qui permet d'établir la table de mortalité de cette cohorte. 
De même, nous pouvons noter les effectifs des enfants auxquels ils donnent naissance année après 
année. Nous obtenons ainsi la "table de fécondité". 


Il suffit de suivre une cohorte de femmes de 15 jusqu'à 50 ans pour avoir une description complète de 
son comportement procréateur. Les données fournies par l'état civil permettent de calculer chaque 
année le nombre des enfants auxquels ont donné naissance les femmes de cette cohorte, regroupées par 
âge ou par groupes d'âge. En divisant par le taux des femmes survivantes à cet âge, nous obtenons le 
"taux de fécondité" F,. 


Si nous additionnons l'ensemble de ces taux, nous obtenons le nombre d'enfants qu'auraient eu, en 
moyenne, les femmes de cette cohorte si leur mortalité avait été nulle. Tel n'a évidemment pas été le 
cas. Pour caractériser la façon dont elles ont assuré le renouvellement de leur génération, il faut 
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additionner les nombres réels moyens de naissances, produits du taux Æ, par le taux de survie &. 


L'ensemble de ces données est présenté dans une table de fécondité dont voici un exemple où 
#(a,a+5) est le nombre d'effectifs de naissances chez les femmes survivantes à cette tranche d'âge et 


où F, est le nombre de naissances de 1000 femmes de cette tranche d'âge. 


Femmes françaises nées vers 1830: 


Âge | Taux de survie | Effectifs naissances | Taux de fécondité 
n £, n(a,a+5) Fr. 

15 0.672 91 | 135 

20 0.645 464 | 720 

25 0.616 589 955 

30 0.587 475 | 810 

35 0.558 328 | 588 

40 0.528 153 | 290 
Total 1 2"100 | 31498 


Tableau: 64.4 - Table de fécondité en France en 1830 


Par exemple, sur 1'000 petites filles nées en 1830, 645 on atteint l'âge de 20 ans et ont eu 464 enfants 
entre 20 et 25 ans. L'intensité de la fécondité est mesurée par le nombre de naissances qu'auraient eu 
1000 femmes de cet âge: 


la 1000 = 720 (64.8) 
645 


Et la moyenne des naissances: 


Âge Survivantes Effectifs naissances 
n n(a,a+5) 

15 | 672 91 

20 | 645 464 

25 | 616 589 

30 | 587 475 

35 | 558 328 

40 | 528 153 
Total | 2'100 

Tableau: 64.5 - Moyenne des naissances en 1830 


Nous pouvons observer qu'en 1830, de 20 à 30 ans les femmes donnaient naissance en moyenne à: 


1644589 _ 1053 _, 9 Gao 
616 616 


ce chiffre étant assimilé par le grand public au "taux de fécondité" (donc attention à ne pas confondre 
avec F,). 


Pour faire le calcul sur l'ensemble de tous les âges, il suffit de prendre le rapport du nombre d'enfants 
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sur le nombre initial de femmes. Cela donne mondialement les chiffres indiqués dans la carte 
ci-dessous: 


. 


Figure: 64.3 - Taux de fécondité au début du 21ème siècle (source: Wikipédia) 


1.1. RENOUVELLEMENT DE LA POPULATION 


La question essentielle pour un ensemble humain en renouvellement permanent en raison des flux 
d'entrées et de sorties que sont les naissances et les décès est: notre effectif est-il en décroissance ou en 
croissance ? 


La table de natalité féminine permet de répondre, grâce au rapport du nombre de garçons à la naissance 
sur le nombre de filles. Ainsi, en ce début du 21ème siècle: il naît en moyenne 105 garçons pour 100 
filles dans le monde. Ainsi, la proportion des filles est donc de: 


—— =049 (64.10) 
5 


Vers quarante ans (49 en France selon l'INED), la prépondérance s'inverse et le nombre de femmes 
l'emporte généralement sur le nombre d'hommes, malgré de notables disparités régionales. 


Lu 


Figure: 64.4 - Répartition Hommes/Femmes au début du 21ème siècle (source: Wikipédia) 
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#7 Population féminine plus importante 


LA Populstions masculine et féminine équivalentes 
A Population masculine plus importante 


Données manquantes 


En supposant que la proportion était la même à l'époque, la table de fécondité de 1830 montre donc 
qu'en moyenne une femme de la cohorte de 1830 a engendré: 


Eau 0.49 = 2.1-0.49 = 1.03 


1000 


fille. Soit une augmentation que nous noterons k (en analogie avec le modèle exponentiel que nous 
verrons plus loin) de 3%. À tort, certains politiciens avancent la valeur (scolaire) 2.1 comme étant le 
taux de fécondité. qu'il faut pour assurer le renouvellement des générations ce qui n'est donc pas tout à 
fait exact. 


L'effectif féminin était donc en accroissement. Donc la population pouvait assurer son renouvellement 
(tant que le rapport est supérieur à 1). 


Le nombre ainsi obtenu est le "taux net de reproduction". Ce taux est donc normalement constitué par 
le rapport entre le nombre de filles mises au monde par cent femmes, rapport corrigé par la mortalité 
prévue entre la naissance de ces filles et l'âge moyen à la reproduction, car une partie des filles 
n'atteindra pas l'âge de la reproduction, étant donnés les décès survenus parmi elles entre leur naissance 
et leur âge à la maternité. L'âge moyen à la reproduction est donné par l'âge moyen des mères à la 
naissance. 


2. MODÈLES DE POPULATIONS 


Il existe de nombreux modèles mathématiques permettant d'étudier la croissance d'une population. Le 
terme "population" est utilisé ici au sens le plus large - il peut s'agir d'une population d'humains, 
d'animaux, de plantes, de personnes infectées par un virus, etc. 


Pour construire un modèle mathématique, il est nécessaire de faire des hypothèses. Ces hypothèses 
jouent deux rôles: préserver certaines caractéristiques essentielles de la réalité et simplifier 
suffisamment cette réalité afin qu'elle puisse être étudiée par la mathématique. 


2.1. MODÈLE EXPONENTIEL 


Dans ce modèle de dynamique des populations (un des plus simples), l'hypothèse sera la suivante: le 
taux de variation de la population est proportionnel, en tout temps t, à la population P(t) présente au 
temps t. 


Nous pouvons penser, a priori, que cette hypothèse est raisonnable pour une foule de situations. Par 
exemple, plus la population humaine est grande et plus le taux de variation de cette population, exprimé 
en nombre de personnes qui s'ajoutent par unité de temps, sera grand. De même, plus il y a de 
personnes infectées par un virus et plus, dans les semaines qui viennent, il y aura de nouveaux cas de 
personnes infectées. 


Mathématiquement, cette hypothèse peut se traduire à l'aide de l'équation différentielle (cf. chapitre de 
Calcul Différentiel Et Intégral): 
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aP 
dé 


= P (64.11) 


Cette équation différentielle est un modèle mathématique représentant une situation où le taux de 
croissance de la population est proportionnel à la grandeur de la population en tout temps. Dans ce cas, 
k est une constante appelée "taux d'accroissement" et nous verrons plus loin comment nous pouvons la 
déterminer. Dans certaines situations, la valeur de k est négative indiquant le fait que la population 
diminue avec le temps au lieu de croître. Il est évident qu'une solution à cette équation différentielle (cf. 
chapitre de Calcul Différentiel Et Intégral) est: 


P(e) = ce] (64.12) 


En premier lieu nous déterminerons la valeur de la constante k, à partir de données démographiques 
pour l'année 1965. À cette époque, il y avait 3 milliards de personnes sur la planète Terre. De plus, à 
cette époque, la population augmentait de 54 millions par année. 


Aünsi, en 1965: 


. = 541% =XxP=k&:310 (64.13) 
£ 


Ce qui nous donne: 
&= 0.018 (64.14) 
Soit 1.8%. L'équation différentielle est alors: 
P()=c"e98 (6415) 


Pour déterminer la constante multiplicative, il suffit de poser + = 0 et de la choisir en conséquence 
(puisqu'elle correspond à la condition initiale). Ainsi, en 1965 nous avions: 


PE) = chse = 310 600 (64.16) 


Si ce modèle mathématique est conforme à la réalité, la solution trouvée nous permettra d'estimer la 
population d'humains sur la terre pour des temps ultérieurs à 1965. Voici le graphique de la fonction: 
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Figure: 64.5 - Évolution de la population mondiale depuis 1965 


Si nous évaluons P(37), cela nous fournira la prédiction pour la population en 2002. Nous trouvons 5.84 
milliards ce qui est assez proche de la réalité. 


Le lecteur pourra également facilement vérifier le tableau suivant selon les valeurs de k: 


Taux d'accroissement par an k | Temps de doublement en années 
0.5% 139 
1% 69 
15% 46 
2% 35 
2.5% 28 
3% 23 
3.5% 20 
4% 17 


Tableau: 64.6 - Taux d'accroissement de la population selon modèle exponentiel 


Nous voyons alors immédiatement, que selon le modèle exponentiel, une croissance qui peut paraître 
lente, de l'ordre de 3% par an, est en fait véritablement explosive puisqu'elle entraîne un doublement 
tous les 23 ans. Soit une multiplication par plus de 17 en un siècle. Or, un siècle est vite passé! 


Cette simple constatation montre à quel point dans ce modèle sont mensongers les arguments qui nous 
font chercher la solution d'un problème économique ou social dans la croissance, et même, comme il est 
souvent admis, dans une croissance durable. Il est clair qu'aucune croissance ne peut véritablement 
durer, elle n'est qu'un épisode transitoire, nécessairement suivie d'un palier ou même d'une 
décroissance. Résoudre une difficulté par la croissance ou le maintien de celle-ci c'est reporter le 
problème à plus tard, à la période où il faudra trouver les moyens à la fois d'arrêter cette croissance et 
de résoudre autrement cette difficulté restée un temps camouflée. 


Le modèle de croissance que nous avons présenté ne peut par contre être valable sur de très longues 

périodes de temps. En effet, si nous calculions, en utilisant l'équation précédente, la population dans 7 
siècles le résultat serait que sur chaque mètre carré de la terre, excluant l'eau, il y aurait, en moyenne, 
dix humains! De même, une population de personnes infectées par un virus ne peut pas vraiment être 


décrite par un tel modèle. 
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Ces derniers résultats nous enseignent que si nous voulons élaborer une modélisation de la croissance 
d'une population, qui soit davantage conforme à la réalité, il va falloir modifier nos hypothèses initiales. 
Ce que nous allons de suite voir avec les modèles logistiques déterministes. 


Mais avant cela donnons un exemple sympathique où une explosion exponentielle a aussi lieu. 


Chaque individu sur Terre a normalement, nous le savons, deux parents, quatre grands-parents et huit 
arrière-grands-parents et ainsi de suite à chaque génération, si nous remontons le temps, le nombre 
d'ancêtres double. Mais cela ne peut pas doubler ainsi indéfiniment et la croissance exponentielle doit 
s'arrêter à un moment ou à un autre! Si le nombre d'ancêtres double à chaque génération et que nous 


remontons seulement 2'000 ans en arrière, nous aurions à titre individuel à peu près 10% ancêtres en ne 
considérant que 25 ans pour une génération. Deux mille ans en arrière, ce qui n'est pas si éloigné, et 
ces ancêtre représenteraient à peu près l'équivalent de la masse totale de la Terre si cette masse n'était 
faite que de corps humains! La réponse à ce paradoxe apparent est bien sûr qu'il y a énormément 
(vraiment énormément!) de répétitions dans chaque arbre généalogique (des parents ont plusieurs 
enfants. et les pères plusieurs femmes... et réciproquement) et que donc nous sommes tous sur une 
période assez courte cousins. 


Nous avons aussi les données actuelles concernant l'évolution de la population mondiale passée: 


Année Population mondiale Année Population mondiale 
-1000000.5 million 1910 [1.750 milliard 
-10000 |1 à 10 millions 1920 [1.860 milliard 
-6500 5 à 10 millions 1930 2.07 milliards 
-5000 5 à 20 millions 1940 12.3 milliards 
_200 [150 à 231 millions 1950 12.519 milliards 
1 170 à 400 millions 1955 2.757 milliards 
200 [190 à 256 millions 1960 B.023 milliards 
400 [190 à 206 millions 1965 B.337 milliards 
500 [190 à 206 millions 1970 B.696 milliards 
600 200 à 206 millions 1975 14.073 milliards 
700 207 à 210 millions 1980 14.442 milliards 
800 220 à 224 millions 1985 14.843 milliards 
900 226 à 240 millions 1990 (5.279 milliards 
1000 254 à 345 millions 1995 5.692 milliards 
1100  B01 à 320 millions 2000 (6.085 milliards 
1200  B60 à 450 millions 2005 (6.5 milliards 
1250 400 à 416 millions 
1300 360 à 432 millions 
1400  BB50 à 374 millions 
1500 425 à 540 millions 
1600 545 à 579 millions 
1650 470 à 545 millions 
1700 (600 à 679 millions 
1750 (629 à 691 millions 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


1800 0.813 à 1.125 milliard 
1850 [1.128 à 1.402 milliard 
1900 [1.550 à 1.762 milliard 


Nous y observons bien une croissance exponentielle pour l'instant. mais quand même pas avec des 
valeurs correspondant au petit calcul de notre exemple de l'arbre généalogique et ce même en cumulé! 


2.2. MODÈLE LOGISTIQUE DÉTERMINISTE 


Nous allons maintenant nous intéresser à un type de modèle autre qu'exponentiel (où la population 
explose) qui a l'avantage d'avoir un comportement asymptotique plutôt que divergent. 


Ce type de comportement est intéressant car les ressources sont normalement limitées et il y a une 


ZOU 


compétition entre individus. Le modèle logistique, également appelé "modèle de Verhulst" permet de 
rendre compte de cela relativement bien. 


Soit N(t) la population au temps t. Posons: 


aNç) _ rN(£) (64.17) 


où r est le taux d'accroissement qui cette fois-ci ne sera pas constant et sera défini comme valant: 


où K est la capacité maximale du milieu. Nous voyons que si K est infini que nous retombons 
immédiatement sur le modèle exponentiel et que si N(t) égale K alors r est nul. 


Finalement, nous avons: 


a N 
EU =: | 2 )ro (64.19) 


ce qui donne après réarrangement: 


N°(&) 


aN(e) _ # Né) + # EE = Ô (64.20) 


Soit sous forme mathématique: 
y = Y—— (64.21) 
APE 


avec comme condition initiale que y{0) = 0. 


Il s'agit maintenant de résoudre cette équation différentielle (cf. chapitre de Calcul Différentiel Et 


Intégral). 
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Donc nous avons à résoudre l'équation différentielle: 


V 
‘= myli-— | (6422 
y 2 ) ) 


Nous posons y{x)= 1/ f(x). L'équation différentielle devient alors: 


Len) (64.23) 


ce qui se simplifie en: 

1 # 7 

f'+mf-—=0 (64.24) 
K 

Cette équation différentielle se résout comme à l'habitude. Nous écrivons d'abord l'équation homogène: 

Jf'+m%/f=0 (64.25) 
Une solution particulière immédiate est: 

f(x)= 4e 07 (64.26) 


où À est une constante. En injectant cette solution dans l'équation différentielle initiale cela donne: 
= m 4e 07 + 40707 — D = a Q (6427) 


K 


Nous voyons donc immédiatement que pour que l'égalité soit satisfaite notre solution particulière 
devient la solution générale si nous l'écrivons sous la forme: 


FX) = 407 07 + (64.28) 


La solution de l'équation différentielle du début est donc: 


= LL 1 : K 
f de 74 1 ga x] (6429) 
La condition initiale: 
Implique: 
DO = em (ou 
le 41 Rd a1 KA 7 
Soit: 
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E- 
K= y KA+1) = 4= 20 (64.32) 
0 
Ce qui nous donne: 
= K K K K 
RAR Fans AP ES Prn, d'il Lt LT 
VO YO 0 
(64.33) 
0 


Soit sous forme traditionnelle dans le domaine de la dynamique de la population: 


No£ 


Mr ET ve 
W +IK-Nie 0 


(64.34) 


qui est donc la relation finale du modèle logistique déterministe. Nous voyons d'ailleurs aisément que: 
- si t tend vers l'infini alors l'asymptote horizontale est K 


- au temps t nul, la population initiale est bien M; 


0 1 2 3 eups 


Figure: 64.6 - Différence entre croissance logistique et croissance exponentielle 


Pour clore en revenant à la forme suivante de notre développement: 


K 


dE & 64.35 
En D 


Si nous la récrivons: 
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Le 


JOEe———— 


1+ae 


nous obtenons alors ce qui est communément appelé par sa forme une "fonction logistique". 


2.3. MODÈLE LOGISTIQUE CHAOTIQUE 


Nous allons supposer que chaque génération est proportionnelle à la précédente. D'une période à la 
suivante, l'évolution de la population peut alors se traduire par une suite du type: 


X#41 : x, 


où x, représente la population à la période t, x,,, la population à la période £ +1 et k le taux de 


reproduction. 


Mais on se rend très rapidement compte qu'un tel modèle est irréaliste: la terre aurait depuis longtemps 
été submergée par une marée humaine. En effet, le modèle exponentiel ignore des facteurs importants, 
comme celui des ressources qui ne sont pas illimitées. 


Pour rétablir un modèle plus satisfaisant, il faut tenir compte du fait que les ressources disponibles sont 
limitées et que, pour tout territoire, il existe une population maximale au-delà de laquelle la population 
décroît, quelle que soit l'espèce. Pour trouver une fonction qui traduirait de façon plus réaliste 
l'évolution d'une population, énumérons, en les simplifiant un peu, les propriétés que doit vérifier cette 
évolution: 


1. C'est un phénomène itératif: si x,,, représente l'effectif de la population de la période £ +1, il dépend 
de celui de la période précédente x, . 


2. Une population ne peut croître indéfiniment sur un territoire délimité: il existe un maximum après 
lequel elle décrofît. Il faut donc prévoir un facteur rétroactif limitant la hausse de population quand sa 
densité devient trop élevée. Pour simplifier les calculs, x ne représentera pas la population en nombre 
absolu, mais un pourcentage de ce maximum correspondant à un territoire donné; x ne peut donc 
fluctuer qu'entre 0 et 1. 


3. k représente le taux de croissance effectif d'une période à la suivante. 


L'effectif de la population de la période £ +1 sera la valeur x,,,, exprimée en pourcentage de la 


population maximale que peut accueillir le territoire donné, et sera obtenu à partir de l'effectif de la 
population x, de la période précédente t par l'équation: 


%n 7 (7 x) 


le facteur {1 - x,} représentant l'effet rétroactif. Cette suite est souvent appelée "suite logistique" et 


nous la retrouvons également dans de nombreux autres domaines de la physique non-linéaire. 


En effet, quand la densité de la population est élevée, proche de la saturation, alors x, est proche de 1 
et, par conséquent, 1- x, sera proche de 0. Donc, ce facteur rétroactif aura tendance à minimiser la 


population x,,1. 
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Nous allons voir que selon la valeur de son taux de croissance effectif k, une population animale, peut 
tendre vers un état d'équilibre, ou fluctuer entre deux ou quatre ou huit valeurs, ou varier de façon 
totalement aléatoire. 


Ainsi, pour certaines espèces animales, il est normal que les populations varient régulièrement, tandis 
que pour d'autres, il est normal de tendre vers une situation d'équilibre. Cette variété, ce "chaos" dans 
certains cas, est liée aux propriétés mathématiques même de l'équation: 


Xa “ÆA(Î-ZX) (64.39) 


La complexité devient la règle et non l'exception, et ce qui semble "chaotique" découle des propriétés 
bien précises d'une fonction bien précise. 


Ce sont ces résultats que l'on va retrouver. Pour cela, on va étudier l'évolution de populations animales 
dont les taux de croissance effectifs k varient de 1 à 4. On étudiera ces évaluations par calcul et par 
l'étude du graphe de la fonction logistique. 


Voyons quelques cas particuliers: 


- Si la valeur initiale x, vaut 0.1 et & =1 l'évolution de la population pour les quarante premières 
périodes est représentée par la courbe ci-dessous: 


10 20 30 +0 50 


Figure: 64.7 - Plot de l'équation logistique avec x —0.1 et k=1 


On constate que pour ce taux de croissance et cette condition initiale, la population décroît et va tendre 
Vers ZÉTO. 


- Si la valeur initiale x, vaut 0.1 et ; = 2 l'évolution de la population pour les quarante premières 
périodes est représentée par la courbe ci-dessous: 
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Figure: 64.8 - Plot de l'équation logistique avec x,-0.1 et k=2 


On constate que pour ce taux de croissance, la population va se stabiliser autour d'un nombre 
correspondant à la moitié de la population que le territoire pourrait accueillir. 


- Si la valeur initiale x, vaut 0.1 et ; = 3 l'évolution de la population pour les quarante premières 
périodes est représentée par la courbe ci-dessous: 


1 


0.8 


e 


10 20 30 40 s0 


Figure: 64.9 - Plot de l'équation logistique avec x,“0.1 et k=3 


Avec un taux de croissance effectif de 3, le nombre d'individus de cette population se met à osciller 
entre deux valeurs que l'on peut calculer à l'aide de l'ordinateur. On obtient alors les valeurs 0.64 et 
0.68. 


- Si la valeur initiale x, vaut 0.1 et x; = 3.5 l'évolution de la population pour les quarante premières 
périodes est représentée par la courbe ci-dessous: 


1 


0.2 


10 20 30 40 50 
Figure: 64.10 - Plot de l'équation logistique avec x,-0.1 et k=3.5 
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Avec un taux de croissance effectif de 3.5 la population oscille entre quatre valeurs: 0.39, puis 0.83, 
puis 049, et enfin 0.87. L'évolution d'une population qui a un tel taux de croissance effectif est 
nettement cyclique. 


- Si la valeur initiale x, vaut 0.1 et ; = 4,5 l'évolution de la population pour les quarante premières 
périodes est représentée par la courbe ci-dessous: 


1 


0.8 


0.2 


10 20 30 40 50 


Figure: 64.11 - Plot de l'équation logistique avec x,70.1 et k=4.5 


On constate que, lorsque le taux de croissance effectif k est égal à 4, le nombre d'individus des 
populations des périodes successives semble osciller irrégulièrement, de façon "chaotique" entre les 
deux extrêmes: la saturation quand x tend vers 1 et l'extinction quand x tend vers 0. 


La question maintenant, c'est quel est le comportement de cette fonction pour d'autres valeurs initiales 
de population”? 


Pour le savoir, nous reprenons les calculs précédents avec une population initiale représentant 0.8 de 1 
population maximale pour un territoire donné et nous comparons les résultats obtenus. 


La croissance de la population est toujours donnée par l'équation: 
Xu “ÆA(Î-ZX) (6440) 


- Selon que la population initiale soit x, = 0.1 ou x, = 0.8, on obtient pour # =1: 


v, = 0.1 r, =U,N 


Figure: 64.12 - Plots comparés des équations logistiques 


On constate que, quelle que soit la population initiale, elle tend vers zéro. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


- Selon que la population initiale soit x, = 0.1 ou x, = 0.8, on obtient pour & = 2: 


\, = 0,1 ,= 0.8 


Figure: 64.13 - Plots comparés des équations logistiques 
On constate que, quelle que soit la population initiale, elle tend vers une stabilisation. 
- Selon que la population initiale soit x, = 0.1 ou x, = 0.8, on obtient pour & = 3.8: 


ET x, = 0,8 


Figure: 64.14 - Plots comparés des équations logistiques 


On constate ici que l'évolution des populations est très différente. On a pris des populations initiales 
éloignées. Si on avait pris des populations initiales très proches, quelle aurait été l'évolution des deux 
populations ? 


- Selon que la population initiale soit x, = 0.8 ou x, = 0.8001, on obtient pour & = 3.8: 


= 0,8 x. = 0.800! 


0 


Figure: 64.15 - Plots de l'équation logistique 
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On constate ici que l'évolution des populations est très différente même si elles étaient très proches 
initialement et même si l'évolution de ces populations d'écoule d'une fonction très simple. Si on avait 
pris comme population initiale x, = 0.800001 on aurait constaté également une évolution très 


différente de l'évolution des populations. 


Conclusion: en dehors de la phase chaotique, la valeur initiale n'a aucune importance, mais dans cette 
phase chaotique, au contraire, la plus petite variation de valeur initiale change du tout au tout les 
valeurs suivantes. C'est ce qu'on appelle "l'effet papillon". 


2.3.1. DIAGRAMME DE FEIGENBAUM 


Pour comprendre l'évolution d'une population selon le modèle logistique, on a représenté l'évolution 
dans le temps, quarante périodes, d'une population correspondant à une valeur initiale précise et à une 
constante k déterminée. On a constaté, en prenant quelques valeurs particulières de k, que pour ces 
différentes valeurs, la population avait une évolution différente. On va donc étudier le comportement 
de la fonction logistique en prenant k comme variable. 


En donnant à k des valeurs comprises entre 0 et 4 avec un pas de 0.02, nous allons, pour chacune de 


ces valeurs, calculer ce que deviendra la population pour chaque période comprise entre la 30° et la 


130ûme | 


Le graphique ci-dessous représente donc pour chaque valeur du taux de croissance effectif k en 
abscisse, cent valeurs successives de x, en ordonnées pour t variant de 30 à 130. 


Soit avec Maple 4.00b: 


>with(plots): with(plottools); 
>feigenbaum:=proc(début,fin, pas) local k,itéré,a,b,s; 
s:={}; a:=début; 
while a<=fin do itéré:=0.1; 
for k to 50 do itéré:=a*itéré*(1-itéré) od; 
for k to 100 do itéré:=a*itéré*(1-itéré); 
s:=s union {[a,evalf(itéré,4)]}; 

od; 

a:=a+pas 
od; 
plot([op(s)l,'a' -début..fin,style=-POINT;symbol=POINT) 
end: 
>feigenbaum(1,4,0.01); 
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Figure: 64.16 - Diagramme de Feigenbaum 


Ce graphique (où l'on peut observer des bifurcations), est appelé "diagramme de Feigenbaum"', du nom 
du physicien Mitchell Feigenbaum qui l'a étudié en profondeur et a montré qu'on le retrouvait dans de 
nombreux phénomènes naturels. 


On va maintenant examiner deux propriétés remarquables de ce diagramme: le doublement de période 
et sa dimension fractale. 


Si on revient à notre exemple où la fonction logistique donne l'évolution d'une population animale selon 
son taux de croissance effectif k, le diagramme de Feigenbaum indique que, quand ce taux est inférieur 
à 3, le système tend vers un état final stable. Cela correspond en général à notre intuition influencée par 
notre désir inconscient d'ordre et de simplicité. 


Mais à partir de 3, cela se complique: le nombre d'individus par génération se met à osciller entre 2 puis 
4, puis 8 valeurs. pour enfin entrer dans une zone "chaotique" où toute valeur semble possible. Il y a 
déjà quelque chose de fascinant. Mais si on observe de plus près cet intervalle de doublement qui 
précède la zone chaotique, on va découvrir des résultats encore plus curieux. 


On prend ainsi d'abord la séquence des trois premiers doublements avec 2, puis 4, puis 8 branches, pour 
un taux de croissance effectif portant sur un intervalle & =[3,3.564407] et on obtient le graphique 
suivant: 
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Figure: 64.17 - Bifurcations dans le diagramme de Feigenbaum 


Il est remarquable d'observer également sur le graphique ci-dessus qu'il y a deux points qui sont 
totalement stables (ceux juste après 3.3)! 


Si on prend maintenant l'intervalle & =[3.5,3.569891] on obtient le diagramme de Feigenbaum suivant: 


1 


3.562 3,564 3.566 3.568 
Figure: 64.18 - Multiplication des bifurcations 


On constate sur le graphique ci-dessus que les bifurcations se multiplient à partir de points de plus en 
plus rapprochés et sur des intervalles de plus en plus courts. Le physicien Feigenbaum a démontré deux 
résultats curieux: 


- les bifurcations vont se multiplier à l'infini (!) sur un intervalle qui ne dépassera pas le point de 
d'abscisse 3.5699456 appelé le "point de Feigenbaum"' ou "porte d'entrée sur le chaos", car, après ce 
point, le système devient chaotique. Il se met à fluctuer entre des valeurs "imprévisibles" et devient 
extrêmement sensible aux conditions initiales. 


- la longueur des intervalles propres aux différentes classes de bifurcations (2, 4, 8, 16...) diminue dans 
un rapport constant, 4.6692... appelé, bien sûr, "constante de Feigenbaum". 


Peitgen indique que ces bifurcations, points et constante de Feigenbaum, ne se retrouvent pas 
seulement dans le cas de la fonction logistique étudiée par May (voir plus loin), mais dans de nombreux 
phénomènes physiques comme l'hydrodynamique, l'électronique, les lasers ou l'acoustique. 


Remarquons enfin un dernier phénomène bien curieux, celui des "fenêtres". Si on examine plus 
attentivement la zone chaotique comprise entre le point de Feigenbaum et Z = 4, on constate qu'il 
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existe des zones étroites où la fonction logistique se remet à osciller entre un nombre fini de 
bifurcations avant de replonger dans le chaos. 


Figure: 64.19 - Visualisation des fluctuations de fond 


On constate que, dans cette fenêtre, il y des bifurcations qui ressembleraient au diagramme de 
Feigenbaum lui-même si on l'agrandissait. 


On aurait pu reprendre les calculs entre # = [3.548, 3.850] et on aurait alors constaté qu'on retrouve la 
même figure et que, si on l'agrandissait à l'infini, on retrouvait toujours (!) la même figure toujours et 
toujours: 


4 


re: 64.20 - Autosimilarité du diagre 


On vient ainsi de découvrir une figure fractale: "l'attracteur étrange de la fonction logistique" appelé 
aussi "diagramme de bifurcation de l'équation logistique" ou encore simplement "diagramme de 
Feigenbaum". 


Nous verrons (sans démonstration) dans le chapitre sur les Fractales que le diagramme de Feigenbaum 
ci-dessus est intimement lié à la fractale de Mandelbrot. 


Grâce à la théorie mathématique du chaos appliquée à la dynamique des populations, l'écologie reçoit 
une stimulation décisive. Jusqu'au début des années 1960, le débat sur la dynamique des populations 
opposait les tenants d'une théorie déterministe, voyant des évolutions régulières de populations ne 
subissant qu'exceptionnellement de brutales variations, à ceux pensant ces évolutions comme purement 
aléatoires. Mais de nombreux faits restaient mal expliqués. En particulier les explosions cycliques de 
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certaines populations et leur périodicité étrange n'entraient dans aucune des deux explications. En 
montrant que des modèles déterministes peuvent donner naissance à un comportement aléatoire, 
Robert May, réconcilie ces points de vue à partir d'une théorie plus profonde. Ce qui apparaît à niveau 
d'appréhension comme une instabilité généralisée peut se concevoir à un autre comme un chaos stable. 
Une situation mathématique chaotique peut se révéler stable au point de vue écologique. 


Révolution aux conséquences profondes dans la théorie de l'écologie, et aux implications pratiques non 
moins importantes, l'approche de Robert May est un trait de lumière dans la situation théorique 
passablement confuse qui règne encore dans la dynamique des populations. 


Si, à cause de la montée en puissance des ordinateurs, la théorie du chaos a permis des avancées 
importantes dans différentes disciplines, elle soulève un débat majeur, celui du déterminisme. Dans 
quelle mesure la science permet-elle de prédire l'avenir ? Pour certains, les résultats obtenus jusqu'ici 
dans le cadre de la théorie du chaos prouvent l'importance des conditions initiales. Pour ces personnes, 
les équations déterministes n'ont qu'une portée limitée et l'avenir restera imprévisible. Pour d'autres au 
contraire, les résultats obtenus montrent que l'on peut trouver un ordre et des lois dans ce qui peut 
sembler chaotique. Ces lois sont tout simplement plus complexes. 


C'est un débat ouvert et vif qui déborde largement le cadre des milieux scientifiques. 


2.4. LOI DE MALTHUS 


Nous avons vu précédemment quelques modèles déterministes et chaotiques utilisant des taux 
d'accroissement pour la simulation. Introduisons maintenant un autre type de modèle utilisant le 
numéraire des enfants, des femmes et de leur fécondité respective. 


Pour ce modèle, nous énonçons les hypothèses suivantes: 

H1. Au départ, N individus dont N/2 sont des femelles. 

H2. Le taux d'accroissement r est supposé constant à cause d'un taux de fécondité f constant aussi. 
H35. La population s'accroît. 


Nous avons donc comme données: la population au temps t notée N(t), la population féminine notée 
W£(s) et We(f) le nombre d'enfants. 


Avec les relations suivantes: 


NF(t)= N(12 
Nas) = F- Nr) 


et donc: 


0 
F3 


J 


N(E+ D = NE) + No (0 = NO + fre) = NO + f = = mof1+E) = rN() 


donc le taux d'accroissement est: 


si 


r=1l+— 
. 
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Finalement nous obtenons la loi de Malthus: 


Ne) =r'N(0)| (64.44) 


ce modèle est donc continu, prend en compte la fécondité mais diverge… 


2.5. MODÈLE DE LESLIE 


Le modèle de Leslie est un peu plus perfectionné que les autres modèles déterministes mais tout aussi 
empirique (il est possible comme dans tout domaine de la science de construire des modèles théoriques 
valides et toujours plus complets et complexes). 


Outre le taux de fécondité et de mortalité, il permet de prendre en compte les tranches d'âges de la 
population et certaines de leurs propriétés relativement aux deux facteurs précités. L'inconvénient de 
ce modèle est cependant les trop nombreux paramètres à déterminer pour l'ensemble des classes d'âge. 


Le système se base sur la découpe de la population en tranches d'âges tels que par exemple: 


- M, (£) : est le nombre d'individus de 1 an 


- N;(£) : est le nombre d'individus de 2 ans 
- Mt) : est le nombre d'individus de plus 10 ans 


Ensuite, l'idée est que l'évolution d'une classe d'âge dépend des autres classes d'âge. Par exemple, les 
naissances sont données par le taux de reproduction r sommé sur toutes les classes d'âge (bien 
évidemment pour certaines d'entre elles le taux est nul...) tel que: 


T 
M(£+D = Dr, (£) (64.45) 
=2 


Il est de tradition et raisonnable pour l'être humain d'admettre que normalement seules les classes d'âge 
pour lesquelles ; 11 et 7 = 55 entrent en ligne de compte en ce qui concerne la reproduction ce qui 
implique que normalement les 7; sont non nuls que pour cet intervalle. 


Ensuite, le vieillissement et la mortalité m seront pris en compte par les relations (nous reprenons les 
indices sur toute la population car évidemment il n'y pas que les individus entre 11 et 55 qui 
décèdent..) : 


NME+D=N. (6) -miN. (6) VieN,i=2.7T (64.46) 


Il est relativement aisé de voir que ces équations peuvent être mises sous forme matricielle (cf. chapitre 
d'Algebre Linéaire) de la manière suivante: 
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M(e+1 (el Fr r rr [| MO 
M (+1 1-7 (el ( ( 0 0 || AS (6) 
_| 0 I-m 0 0 0 0 _—. 
M, (+1) 0 0 Ô M. (6 
0 O0 1-» 0 
No (+1) 0 0 O0 O0 1-"»r1 O[[N,(G 


où la matrice contenant les coefficients de mortalité et de reproduction est appelée "matrice de Leslie". 
De manière plus compacte cela s'écrit: 
N(t+D=A.N(E) (64.48) 


ou en partant de la population initiale: 
NG)=A.N(0) (64.49) 


Il est possible de faire des analyses très intéressantes sur ce modèle relativement à l'âge de faire des 
enfants et aux conséquences y relatives. Ce modèle est relativement beaucoup utilisé en biologie 
marine. 


3. PROPAGATION DES ÉPIDÉMIES 


La "théorie des épidémies" fournit de nombreux systèmes intuitifs d'équations différentielles ou aux 
dérivées partielles en temps discret dans lesquelles interviennent des phénomènes de contamination, de 
diffusion, etc. 


Nous allons ici prendre l'exemple de la diffusion de la rage dans une population de renards, et en 
présenter un modèle assez simple où nous considérons que les individus (les renards) peuvent se trouver 
dans trois états différents: 


1. Il y a des renards sains S 
2. Des renards infectés I 
3. Et des renards morts R 


Cette hypothèse de classification en trois catégories fait que ce modèle de propagation des épidémies 
est souvent appelé "modèle SIR"!. 


Pour les plus optimistes, nous pouvons aussi utiliser le modèle qui suppose que certains individus sont 
immunisés et ne peuvent dons plus être infectés. Finalement, à trois états différents, nous pouvons lier 
trois équations d'évolutions propres telles que: 
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TEE: ÿ 

pa 

À perso) (6450 

pa 

re, Î 

pat 

avec: 

Su = S +8" À 
La=1+I"AM (6451 
R = R+R'A 


où lesS, I, R sont donnés en % de la population totale. 


Dans ce modèle, la première équation correspond au phénomène de contamination: lorsque cohabitent 
des individus sains et des individus infectés, un certain nombre d'individus sains sont infectés. Il est par 
ailleurs naturel de considérer ce terme comme proportionnel au produit ;. 5. En effet, la quantité de 
microbes dans le milieu défini (donc le facteur r pour un individu sain donné d'être infecté en présence 
d'un individu infecté) est proportionnelle à I selon le facteur. Il nous faut ensuite multiplier cette 
probabilité par le nombre d'individus sains, c'est-à-dire par S. Le signe négatif est quant à lui présent 
pour signifier la diminution de la population saine. 


Pour ce qui est des variations de 1, le premier terme correspond aux individus contaminés (qui 
augmentent 1). Le deuxième terme, en -al, correspond aux individus qui meurent. 


Le tracé ci-dessous, montre un calcul de l'évolution des populations S, 1, R en fonction du temps (une 
seconde étant considérée comme une boucle de l'algorithme). Selon les valeurs des paramètres a, r les 
comportements sont complètement différents: si a est trop élevé par exemple, les individus infectés 
meurent presque tout de suite et n'ont pas le temps d'en infecter beaucoup d'autres (...). Voici un tracé 
de l'évolution des populations au cours du temps, effectué avec l'algorithme suivant avec r =4,a = 2 
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Figure: 64.21 - Evolution des renards sains, infectés et morts en fonction du temps 


L'algorithme étant du type suivant: 


Pour i=1 à (temps max)/(par du temps) faire 
dS=-r*S(i)*T(i); 
di=r*S(i}*I()-a*I(); 
dR=a*T(i); 
S(i+1)=S(i)+dt*ds; 
I(i+1)=I(i)+dt*dl; 
R(i+1)=R(i)+dt*dR; 
Fin Pour 


Nous pouvons bien sûr arriver à de nombreux modèles suivant les hypothèses que nous faisons sur la 
maladie étudiée. Il sera souvent intéressant de définir plus de catégories de populations. Ainsi, pour des 
modèles de M.S.T. (Maladies Sexuellement Transmissibles), nous différencierons les populations 
suivant leur sexe (il faudrait aussi prendre l'âge en compte), ce qui multiplie le nombre de possibilités 
déjà par deux. Pour définir le système différentiel sous-jacent, il devient ainsi préférable de modéliser le 
processus par un schéma. 


Ainsi, pour étudier une infection du type SIDA (Syndrome d'Immunodéficience Acquise), nous 
pouvons par exemple faire un modèle dans lequel nous considérons quatre groupes de populations: les 
individus sains X, les individus infectés Y, les porteurs sains Z, et enfin les individus malades A. Dans le 
schéma qui suit, les flèches entre les différents états représentent les transitions possibles pour un 
individu donné avec les probabilités correspondantes: 
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Figure: 64.22 - Chaîne de Markov d'une contamination mortelle 


En effet, du point de vue de l'étude du SIDA (et uniquement du SIDA), un individu donné, quel que soit 
son état, peut mourir d'autre chose que le SIDA, c'est ce que nous rangeons dans "mort naturelle". Nous 
considérons qu'il y a un taux de mortalité fixe, noté n, et ce pour toutes les populations considérées 
(sains, infectés, malades ou porteurs sains). D'autre part, un individu sain X peut aussi être contaminé, 
auquel cas il devient un individu infecté Y. Un individu infecté peut lui évoluer vers deux stades 
possibles: malade A ou porteur sain Z. 


Le nombre s représente la vitesse d'évolution de la maladie: plus ce taux est grand, plus les individus 
infectés évoluent vite vers l'un des stades suivants. Le nombre p, compris entre 0 et 1, représente la 
probabilité pour que cette évolution se fasse vers l'état de malade. Bien sûr, si p diminue, la quantité de 
porteurs sains, immunisés contre la maladie, augmente. La maladie est alors moins dangereuse 
globalement. Enfin, un malade peut mourir de sa maladie, ce avec un taux de mortalité d considéré 
comme fixe, alors qu'un porteur sain, immunisé, ne peut plus évoluer du point de vue de cette maladie. 
Toutes ces hypothèses conduisent à poser des équations du système de la forme: 


L'B-nX-AX 
F'=AX -(n+s)r 


(64.52) 
A'=s'p'}-(d+hn)A 
Z'=s(1-p}} - 
où: 
À a (64.53) 
Xt+tY+Z+A 


En effet, ce coefficient représente un taux de contamination, qu'il est naturel de relier au rapport 
FICXZ +F +27 + À), probabilité lors d'une rencontre pour que la personne rencontrée soit infectée, donc 
contaminante. 
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4. MODÈLE PROIES-PRÉDATEURS (DE LOTKA-VOLTERRA) 


Ce modèle d'interaction proies-prédateurs a été proposé par Volterra après la première guerre mondiale. 
Il s'agissait d'expliciter la dynamique des populations de sardines et de requins en mer Adriatique (et 
hop! un peu d'océanographie sur le site….); expliquer notamment pourquoi les quantités de sardines 
pêchées après l'interruption due à la guerre n'étaient plus aussi importantes que précédemment (ce qui 
peut sembler contre-intuitif) et pourquoi à la reprise de la pêche la proportion observée de requins avait 
augmenté. 


Supposons d'abord qu'il n'y ait pas d'interaction entre les 2 populations (sardines et requins)! 


Reprenant ce que nous avions vu tout au début de ce chapitre et en notant N(t) le nombre d'individus 
proies et P(t) le nombre d'individus prédateurs, nous avons (soit implicitement une croissance 
exponentielle du nombre de proies en l'absence de pêche): 


et en l'absence de proies (dans le cas d'une pêche), le nombre de prédateurs diminuant 
exponentiellement, nous avons respectivement: 


L = #2 (64.55) 
dt 


À ce point du discours, nous devons considérer deux espèces (proies et prédateurs) qui ne sont pas 
isolées, mais en interaction. Pour quantifier la contribution de l'interaction entre espèces, nous 
considérerons seulement la prédation, en assumant que sa valeur ou intensité (de l'interaction) est 
fonction de la probabilité de rencontre des proies-prédateurs qui sera elle supposée proportionnelle au 
produit 7. P des pourcentages des deux populations. 


Ces rencontres n'ont pas les mêmes effets sur les deux espèces. Premièrement, bien sûr, chaque proie 
mangée par un prédateur est un gain net pour la population de ce dernier et une perte nette pour le 
premier. Ainsi, si l'effet des interactions est accepté comme étant proportionnel à 7. P, les signes de 
l'influence d'interaction différeront pour les deux espèces de sorte que nos équations avec interaction 
cette fois deviennent: 


d 

nn Ne 

dt (64.56) 
De -mP EN 

dt 


Ce système d'équations est appelé le "modèle de Lotka-Volterra”. 


Avant d'aller plus loin, cherchons les valeurs pour lesquelles les dérivées s'annulent (ce qui nous 
donnera au fait le point d'équilibre du système): 


rN'-cN'P'=0 
-mP'+BN'P'= 0 


où N''et P ‘sont les valeurs qui annulent les dérivées (à ne pas confondre cette fois-ci avec la notation 
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parfois d'usage pour condenser l'écriture d'une dérivée!!!). 
D'où: 
(r-cPN'=0 
(64.58) 
(N'-m)P"= 0 


Une solution triviale est la "solution d'extinction" (appelée aussi parfois "solution critique") donnée par: 


M =P =0 (6459) 


C 
Sinon, nous avons aussi comme possible solution: 


r=cP! P'=? 


(64.60) 


C 
bN'=m — N'=— 


Maintenant, normalisons les équations de Lotka-Volterra en écrivant (ainsi elles sont sans dimensions): 


(64.61) 


En réarrangeant les coefficients, le système s'écrit finalement à l'équilibre (hors de la solution 
d'extinction): 


dx 
PE CA à 
. (64.63) 
dy _ {x—li 
Œ 


pour lequel les dérivées s'annulent aux points unitaires. 


Le tracé discret de ce système d'équations (dans lequel nous reconnaissons les termes logistiques vus 
plus haut), donne avec » = r = b =c =1 et les conditions initiales {x,,3, 1 = (4,11: 
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Figure: 64.23 - Fluctuation théorique des populations 
En comparaison, voici un exemple pratique (réel) de mesures de proies-prédateurs (Lièvres ("Hares" en 


anglais)- Lynx) par la Hudson Bay-Company (quand on cherche des données qui concordent à un 
modèle, on finit souvent par trouver...): 


Hares —— — — — - Lynx 
(x1000) (x1000) 
160 12 
120 9 
f 
80 1 ; 
\ ; À / y A ‘ a 
AAA ANA VATATANAAN ER 
( AN 
f\ } \ \ A { | 
F ! 0 
1850 1875 1900 1925 


Figure: 64.24 - Fluctuation mesurée des populations 


Les deux diagrammes précédents représentent donc les variables x, y en fonction du temps. Cependant, 
ce qui peut être intéressant pour un scientifique (ou un écologiste...) c'est la représentation de y en 
fonction de x et inversement. Ainsi, nous obtenons pour les mêmes conditions initiales m, r, b, c 


précédentes et pour des conditions | x,,y, | diverses (les prédateurs sont en ordonnée et les proies en 
abscisse): 
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Figure: 64.25 - Espace des phases x-y 


Nous voyons ainsi (dans cette représentation de l'espace des phases particulier x-y) que pour des 
conditions initiales fixes données, le système est périodique (oscillant) déphasé et a un point d'équilibre 
en: 


(x,y) = (LD (64.64) 
appelé "point fixe" dans le domaine de la physique non-linéaire. Ce qui correspond aux points où: 


0 
dé dt 


(64.65) 
Finalement, nous avons deux couples de points d'équilibre (c'est trivial en regardant le système 
d'équation): 

(M,71)= (00) et(6,35)=(LD (64.66) 


La question qui se pose est le sens de rotation (représentation) du plan des phases. Ainsi, en 
représentant les directions à l'aide d'un champ de vecteurs, nous obtenons la représentation (plus 
intéressante pour comprendre les observations de la pêche après la guerre..). 
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Figure: 64.26 - Mise en évidence de la direction des cycles dans l'espace des phases 


Pour savoir dans quelle direction nous nous dirigeons dans l'espace des phases à un moment donné, il 
suffit donc de connaître la dérivée dy/dx (ou réciproquement dx/dy). Ainsi, nous avons: 

dy _dy dt _dy AC] = (64.67) 

dx di dx rx] - 
Ceci dit, nous voyons bien sur le diagramme des phases sous sa forme de champ de vecteurs qu'il arrive 
un moment dans le cycle de ce modèle où le nombre de prédateurs est très élevé pour un faible nombre 
de proies. Donc le modèle mathématique (théorique) explique bien ce qui peut être a priori contre- 


intuitif pour l'être humain. Il devient dès lors évident de deviner en quels points du cycle se trouvait 
l'écosystème à la reprise de la pêche après la guerre. 


Cependant, nous pouvons (devons) nous poser la question de ce qu'il se passe après une petite 
perturbation autour des points d'équilibres (ce qui est de la plus haute importance en écologie). 


Nous avons donc le système de Lotka-Volterra à l'équilibre: 


dx 
a 7x y) 
(64.68) 
æ. (x—1) 
dd 7 


En y mettant une perturbation infiniment petite, celui-ci s'écrit: 
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4 * # 
—=rix+x l-iy+y il 
dt _. 
ä (64.69) 

P'emiy+y \lix+x 1] 

di 

En nous concentrant d'abord sur l'étude proche du point d'extinction (0,0) nous pouvons négliger les 
termes xy, nous obtenons: 


dx *# *# *# 
sr[(i-» ix+il-y-y x] 

dé . 
d (64.70) 
Cs-mlil-x \y+(1-x-x) j 

di | “é ” 


Mais c'est encore trop compliqué. Toujours en nous considérant proche du point d'extinction (0,0), nous 
considérons un peu abusivement mais astucieusement (sinon nous ne pourrions toujours pas résoudre le 
problème analytiquement) les approximations suivantes: 


dx * * * M :ù * 
—ZFrX-Y XHX —Vx —y X [=rIx+x | = rx 
d£ — — —— —— x Xx* 

(64.71) 
dy # # # # *% # 
—Z=-m|y-xy+y —-xy —xy |[=-m|y+y | = -"m}y 
dt =" 5 ‘à Fey" 

Donc: 
dx | 
He 
à (64.72) 
IAPTUE 
Full 


Ce qui nous montre pour le système à l'équilibre, proche du point d'extinction, que le nombre 
d'individus des prédateurs diminue exponentiellement alors que les proies augmentent elles 
exponentiellement. Ceci a un sens biologique: quand il y a peu d'individus prédateurs , les proies se 
multiplient alors qu'au fur et à mesure que le nombre de proies augmente, les prédateurs se multiplient 
et se concentrent de plus en plus sur leurs proies ; respectivement quand il y a peu de proies, le nombre 
de prédateurs diminue et à mesure le nombre de proies augmente (ahhh la nature...). 


Remarque: Dans la littérature nous retrouvons tantôt le signe "-" en haut ou en bas dans le système 
d'équations précédent. En réalité, la position du signe "-" n'a aucune importance car il s'agit juste du 
choix de départ dans la dynamique du système. 


Proche du point d'équilibre (1,1), nous avons donc (hop! nous changeons la position du signe exprès 
afin de d'insister sur le fait que ce n'est qu'un choix de départ!!!): 
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Pour résoudre ce système, différentions l'équation des proies par rapport au temps telle que: 


2 
dx, d (6472 
dt? dt 
et en y injectant dy/dt (prédateurs): 
2 
ee = -rmx (64.75) 
dé 


Nous obtenons donc une petite équation différentielle du deuxième ordre (cf. chapitre de Calcul 
Différentiel Et Intégral) dont la solution type est: 


x= xe * (64.76) 


En injectant cette solution dans l'équation différentielle, nous obtenons après simplification des 
exponentielles une simple équation du deuxième degré (cf. chapitre de Calcul Algébrique): 


Æ x +rm% = 0 (64.77) 
Dont la solution est triviale: 
Aa= +ifrm (64.78) 


Ainsi, la solution générale de l'équation différentielle est la combinaison linéaire des deux solutions telle 
que: 


x() = % Cent + im) (64.79) 


Mais nous avons donc: 


dx _ -ry > y(f) = _l1& (64.80) 
dt r dt | 


Dès lors, connaissant x(t) nous obtenons facilement: 
Pr [. -j frmi fm ., 
YÉ) = -x9 | je rm Fr. Fr | (64.81) 
+ 


Utilisons maintenant la relation d'Euler (voir le traitement des nombres complexes dans le chapitre des 
Nombres dans la section Arithmétique): 


e* =cos(x) +isin(x) (64.82) 
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Ainsi, pour les proies, nous avons: 


x(£) = 2x [oes. front | +isin | fret | + cos | rm | +à sin | re | (64.83) 


et comme (cf. chapitre de Trigonométrie) : 
cos(x) = cos(-x),—sin(x) = sin(-x) (64.84) 
nous avons alors: 


x(E) = 2x, cos Vrrmé| (64.85) 


et de manière similaire, nous obtenons pour les prédateurs: 


10) = 29 (cos in (-VP + cos | art | +i sin [rent | || 
=-n cos | Afrest | —à sin | 4frmet || + cos | Afrmet |+à sin | fret || 

= 29 il cos Vin (ré) + cos (afrmet || 

= 2i sin | frmé || = 230 sin me 


(64.86) 


soit: 


JC) = 2 f" sin(rré| (64.87) 
Fr 


Ainsi, autour du point d'équilibre (1,1), les perturbations suffisamment petites pour valider la 
linéarisation (annulation des termes quadratiques) oscillent comme des ellipses (ou cercles) dont les 
axes sont définis par les deux équations précédentes. 


Nous pouvons obtenir les graphes ci-dessus avec Maple 4.00b (car il s'agit d'un joli exemple 
d'application du logiciel): 


>restart: with(plots): with(DEtools): 

>rate_eqn1:= diff(h(t),t)}=(0.1)*h-(0.005)*h*(1/60)*u; rate_eqn2:=diff(u(t),t)=(0.00004)*h*u-(0.04)*u; 
vars:= [h(t), u(t)]; 

> init1:=[h(0)-2000,u(0)-600]; init2:=[h(0)-2000,u(0)-1200]; init3:=[h(0)-2000, u(0)-3000];domain 
:= 0... 320; 

> L:= DEplot({rate_eqn1, rate_eqn2}, vars, domain, {init1 }, stepsize-0.5, scene=ft, ul], 
arrows=NONE): 

H:= DEplot({rate_eqn1, rate_eqn2}, vars, domain, {init1 }, stepsize=0.5, scene=ft, h], arrows-NONE): 
> display( {L,H} , title = ‘Lièvres et 60 * Lynx vs. temps }); 
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Lièvre and 60 * Lynx vs. temps 


2500 


2000 


1000 
500 


(a) 50 100 150 £ 200 250 300 
Figure: 64.27 - Plot sous Maple 4.00b du modèle théorique 


>DEplot({rate_eqn1, rate_eqn2}, vars, t= 0 .. 160, {init1, init2, init3}, stepsize=0.5, scene=[h,ul], 
title=" Lièvres vs. 60 * Lynx pour t = 0 .. 160’, arrows=slim); 


Lièvres vs. 60 * Lynx pour t = 0 .. 160 


(a) 1000 2000 3000 4000 
k (lèvres) 
Figure: 64.28 - Plot sous Maple 4.00b de la direction des cycles dans l'espace des phases x-y 
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5. MODÈLE DE CAPTURE OPTIMALE DE SCHEAFER 


Un principe utile pour la gestion des quotas de pêche, de la chasse, de la cueillette sauvage ou de 
l'exploitation de matières premières est celui du "rendement équilibré maximal" qui est directement lié à 
une bonne gestion de la dynamique de la population concernée par l'exploitation. 


Définition: Le "rendement équilibré maximal", c'est la quantité maximale de poissons, cerfs, oiseaux 
ou champignons, etc. qui peuvent être tués/récoltés dans une population sans mettre en péril sa survie. 


Déterminer ce rendement équilibré maximal permet d'atteindre l'objectif de pêcher, chasser, cueillir le 
plus possible, sans toutefois tomber dans la surconsommation qui entraînerait potentiellement la 
disparition de la population. 


La distinction entre une consommation de ressources naturelles équilibrée et exagérée est souvent 
difficile à faire. Des modèles mathématiques et statistiques sont alors comme toujours utiles et 
nécessaires pour établir cette frontière. 


Ces calculs interviennent dans les calculs des quotas même encore en ce début du 21ème siècle. Le 
modèle simpliste que nous allons présenter est utilisé par certains grands États (mais il va avec le temps 
disparaître pour faire place à un modèle plus élaboré avec des paramètres probabilistes). 


Nous nous intéressons donc à la biomasse d'une population d'un bien consommable. Le modèle mis en 
avant par Schaefer en 1954 fait intervenir deux paramètres seulement: 


- La biomasse maximale M qui peut vivre en permanence dans un système 
- La taux de reproduction r 


Nous partirons sur l'hypothèse (à vérifier dans la pratique à cause du Modèle de Lotka-Volterra) qu'à 
l'année zéro (avant le début de la consommation de la ressource), la biomasse correspondante est: 


Xo=M 


Le modèle empirique s'écrit: 


Fr 
Fist +, (1-#)-c 


Pour bien comprendre ce modèle, supposons d'abord que la population n'est pas exploitée, c'est-à-dire 
que C = 0. À l'année n, la population s'accroît alors de: 


À 
Fr É _ æ) 
M 
Ainsi, en l'absence de pêche, si 4, est plus petit que M, la population va croître tranquillement jusqu'à 


atteindre sa capacité limite M. 


Dans le cas extrême, où la consommation C est égale à M, nous avons: 
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W 


X. 
Aou = #0 +rA0 -R)-c-acef-#)-c-uro-n- Ô (64.91) 


ce qui est logique. (il y a extinction totale). 


Maintenant, réécrivons le modèle de Schaefer sous la forme suivante: 
Àh 
An — ÂAn = ÀAX =rÂy 7 —C (64.92) 


Nous souhaiterions savoir pour quelle valeur de X,,, nous aurions la biomasse qui ne varie plus. C'est- 


à-dire: 
F8 
ÂAX =rX, h-#)-c = 0 (64.93) 
M 


Dès lors: 


x —. 
kr RC = PAS _rX,+C=0 (6494) 


Il s'agit donc d'une simple équation du deuxième degré! Elle n'a de solution réelle que si le discriminant 
(cf. chapitre Calcul Algébrique) est positif ou nul. Soit, sachant que r est positif ou nul par construction: 


4C 4C 
r? arczoer(r-Foer-Pzoec< (64.95) 
M M M À 


Ainsi, la plus grande valeur possible de C est »Af / 4. Lorsque nous remplaçons C par cette valeur dans 
l'équation initiale: 


L 
PAC —rXn+C=0 (64.96) 
nous obtenons: 


PAS rx, + =0 (64.97) 


Soit: 
r M° 
—_| x? MX, Lee ai. 
M° | 
XF -MX, += 0 (6450) 
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Donc, la solution est: 


Ainsi, il existe un temps n (infini) pour lequel la population tend asymptotiquement vers M/2 à la 


condition que X5 > =. 


Cela dit, dans la pratique, on choisira une fraction de la valeur suivante afin de se prémunir des 
variations naturelles négatives de la reproduction: 


CE — 
4 


Malgré tout, sa grande simplicité et son côté déterministe font que le modèle de Schaefer est encore 
utilisé en ce début de 21ème siècle dans la gestion des pêches. 


6. MODÈLE DE HARDY-WEINBERG 


Le modèle de Hardy-Weinberg (développé en 1908) décrit la diversité (plutôt que l'évolution) du vivant 
dans le sens de la génétique des populations. Cependant, ce modèle permet quand même de 
comprendre l'impact d'un agent de mutation sur une population d'individus et ainsi de résoudre les 
problèmes liés au refus de modèle de la sélection (évolution) naturelle de Darwin. Effectivement, les 
travaux de Darwin portaient sur des caractères qui variaient de façon continue. Or, il ne pouvait 
expliquer comment les individus se transmettent ces variations (c'est effectivement gênant). La 
génétique de Mendel, quant à elle imposait que seuls les caractères discontinus étaient héréditaires. 


Il y avait donc conflit entre le modèle continu (de Darwin) et discontinu (de Mendel) et ce fut la 
génétique qui au vingtième siècle permis d'établir qu'au fait c'est le mélange des gênes qui crée la 
diversité et in extenso la sélection naturelle. 


Remarque: Nous démontrerons en méthodes numériques (section d'informatique théorique) dans le 
cadre de l'étude des algorithmes génétiques que le chromosome ayant la valeur de fonction de 
"fitness" la plus grande sera celui qui aura le plus de chance de se reproduire. Ceci fait partie du 
théorème nommé "The Schema Theorem".… 


Conclusion: L'évolution ne se fait pas à l'échelle de l'individu mais de la population (c'est une bonne 
leçon à retenir Ça...) 


Définitions: 


D1. Un gène ou "génotype" est composé "d'allèles" (deux habituellement, donc nous considérerons les 
individus comme "diploïdes") 


D2. Un "pool génique" est un ensemble de gênes présents dans une population 


D3. Une "micro-évolution" est un changement de la fréquence des allèles d'un pool génétique d'une 
population. 
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D4. Un allèle est dit "allèle fixe" lorsque tous les membres d'une population portent deux allèles 
identiques. 


D5. Une "spéciation" est l'apparition à long terme d'une micro-évolution faisant apparaître une nouvelle 
espèce. 


D6. Une "espèce" est un ensemble de populations dont tous les membres ont le potentiel de se 
reproduire entre eux dans un environnement naturel (nous supposons dans ce modèle que les individus 
se reproduisent selon un mode sexué). 


D7. La "mutation" est un agent évolutif qui modifie le pool génique d'une population en produisant de 
nouveaux gènes (nous considérons donc qu'il n'y a pas d'agents évolutifs à l'oeuvre dans la population 
dans ce modèle). 


Remarque: La mutation est un événement rare et le plus souvent néfaste. Ses effets quantitatifs sont 
plus importants chez les organismes à temps de génération court (bactéries et virus), l'effet étant 
nettement moins marqué chez les organismes à temps de génération plus long (animaux et 
végétaux). 


Considérons maintenant une population composée de 13 individus (1 gêne, chacun composé de deux 
allèles pris parmi 3): 


AA, A2X1L A 3A2, A 1LA1, AIX, A1A1, À 243 _. 
= 64.101) 
A1LA 3, À3AX2,A1A1 A1A 3, A3A 3, A3X3 Li 


La fréquence de l'allèle X1 est dans ce cas particulier: 
Pm=13/26=0.5 (64.102) 

La fréquence de l'allèle X2 est: 

Pxà = 4/26=0.154 (64.103) 
Enfin, la fréquence de l'allèle X3 est: 

Px3 = 9/26=0.346 (64.104) 
Et bien évidemment: 

Pt Pxat Pxz © 1 (64105) 
Pour résumer, si nous considérons maintenant une population d'individus possédant des gènes composés 


de seulement deux types d'allèles, nous avons dès lors (cas plus concret par rapport à la biologie du 
vivant sur notre Terre): 


BB. Bb,bh (64.106) 


Nous avons donc pour la fréquence relative du nombre d'allèles B: 
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2.{nombre dindvidus BB1+1.{nombre d'individus Bb1 


SE ——— © ————————————————————— (64.107) 
nombre dindividus total 


et pour la fréquence relative d'allèles b: 


2.{nombre d'induidus bb1+1.{nombre d'individus 8 
= EE  Ù 
; nombre dindividus total 


Avec donc: 
p+g=1l (64.109) 


Nous pouvons faire quelques observations suite à la manière de construire ce modèle. Effectivement, la 
fréquence des allèles (équilibre génétique) dans une population demeure approximativement constante 
génération après génération si: 


1. La population est de très grande taille (une perturbation infime ne change que très peu la fréquence 
des types de génotypes) 


2. Pas d'émigration ou d'immigration (il n'y a pas de nouveaux types d'allèles dans la population) 
3. Pas de mutations modifiant les allèles (cela contient le point 2) 

4. Accouplements au hasard (non influencés par le type d'allèle étudié) 

5. Pas de sélection naturelle (cela contient le point 4) 


Il peut être pertinent (pour la culture générale) de mettre en évidence le fait que nous distinguons deux 
types d'accouplements non aléatoires: 


1. L'endogamie: croisement entre individus du voisinage, donc ayant des liens de parenté ; chez les 
espèces se dispersant peu, particulièrement dans le règne végétal. 


2. L'homogamie: choix des partenaires qui se ressemblent pour certains caractères ; répandu chez les 
animaux. 


L'endogamie et l'homogamie ne sont pas une cause directe de microévolution puisqu'elles ne modifient 
pas le pool génique d'une population. Cependant, si certains des individus issus de ces croisements non 
aléatoires ont plus de chance de s'accoupler que d'autres (par sélection naturelle), il s'ensuivra une 
modification de la fréquence allélique dans la population descendante et par conséquent, une 
microévolution. En conséquence, les accouplements non aléatoires sont un facteur potentiel de 
microévolution. 


Finalement, pour en revenir à notre modèle, la probabilité qu'un individu possède l'un des trois 
génotypes possibles (relativement à un génotype) dans la population (relativement à notre exemple) est: 


- Probabilité qu'un individu soit BB: 


BB=p'p =p° (64.110) 
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- Probabilité qu'un individu soit bb: 


bb=qg'a=g (64.111) 
- Probabilité qu'un individu soit Bb ou bB: 
(bB,Bb\i= pq +gp=2pg (64.112) 
Finalement, nous obtenons "l'équation de Hardy-Weinberg": 
2 2 _ — cn 2 
po + 2pq +g = (p +4) =] (64.113) 
Que nous pouvons représenter par le graphique: 


q 
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Figure: 64.29 - Tracé de l'équation de Hardy-Weinberg 


Après cette étude, nous pouvons enfin (re)définir la "loi de Darwin" de manière à ce qu'elle se soustraie 
à la grande question (problématique) de la modification continue ou discrète: 


La sélection naturelle est un agent évolutif qui modifie le pool génique d'une population en augmentant 
la fréquence des allèles produisant les phénotypes (génotypes définissant le comportement d'un 
individu) les mieux adaptés au milieu. Ainsi, les individus les mieux adaptés à leur environnement se 
reproduisent plus que les autres et contribuent davantage au patrimoine génétique de la descendance. 
La fréquence des bons gènes augmente graduellement dans la population, de génération en génération. 
Ainsi, la sélection naturelle dirige l'adaptation d'une population à son milieu en accumulant les 
génotypes qui favorisent la survie dans le milieu. 
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Remarques: 


R1. Le modèle de Hardy-Weinberg n'existe pas dans la nature. Effectivement, il est impossible que 
toutes les conditions nécessaires soient présentes en même temps. Cependant, c'est un modèle 
théorique qui permet d'évaluer s'il y a de la microévolution dans une population. Aïnsi, on mesure la 
fréquence des allèles dans la population mère et l'on applique l'équation. Si la structure génétique de 
la population fille s'écarte de celle prédite par la loi, alors on sait qu'au moins un agent de l'évolution 


est à l'oeuvre. 


R2. Ce modèle théorique permet de prédire les coûts sociaux des maladies génétiques. 
Effectivement, si on connaît le pourcentage d'individus qui présentent une maladie récessive dans 
une population, on peut appliquer l'équation et évaluer le nombre de transmetteurs sains puis 
prévoir la probabilité d'apparition de la maladie dans les générations futures. Si celle-ci est grande 
(ce raisonnement n'est valable que dans un cadre libéral et capitaliste), on peut décider d'investir 
dans la recherche ou prévoir des budgets pour soigner les malades. 


Exemples: 


EI. Soit un génotype de séquences possibles {88,bb,Bb} et considérons que p, = 0.6,p, = 0.4. Nous 
aurons alors: 


p?=0.36 2pg=0.48 g?=0.16 (64.114) 
Ainsi, dans une population de 1'000'000 d'individus, nous devrions avoir: 


0.36:1:10$ = 360'002P 
0.48:1:10$ =480'008à (64.115) 
0.16:1:10$ =160' 0088 


E2. Si au Québec (6 millions d'habitants), une personne sur cinq a les yeux bleus {bb — 4? =1/5), 
combien de personnes sont de génotype BB et combien sont Bb? 


g = N115 = 0.44721 
(64.116) 
p=il-gi=0.5528 


Donc: 
p?=0.3056 2pg=0.4944 g?=0.2 (64.117) 
Ainsi nous avons: 


0.3056: 6:10 =1 833 600BP 
0.4944:6:10° = 2'966'400Bb 


0.2:6:10° =1200000bb = : 6:10° 


(64.118) 
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E3. Nous introduisons dans un étang 1'000 grenouilles tachetées, homozygotes pour ce caractère (TT) 
et 250 grenouilles sans taches également homozygotes pour ce caractère (tt). Si nous laissons les 
grenouilles se reproduire pendant quelques années, en supposant que la population demeure stable, quel 
nombre de grenouilles TT, Tt, tt devrait-on alors observer ? 


Nous avons donc une population de 1250 individus dans laquelle nous avons 1'000 TT (2'000 allèles T) 
et 250 tt (500 allèles t). Donc: 


PO = gg 08] _ [P*-064 

2'500 = {2pq =0.32 (64.119) 
= 00 0e 2 = 0.04 
F0 5500 on 


Si la population est de 1'250 individus, nous aurons donc: 


0.64: 1'250 = 800 individus 77 
0.32:1'250 = 400 individus T£ (64.120) 
0.04: 1'250 = 50 individus ££ 


7. TAUX DE CROISSANCE AVEC LA TEMPÉRATURE 


Pour de nombreuses espèces (mammifères, poissons, micro-organismes), il est raisonnable de 
considérer qu'en première approximation, la relation du taux de croissance de la population avec la 
température de l'environnement est un polynôme du second degré: 


u=aT?+bT+e (64.121) 
où les valeurs a, b, c vont dépendre de l'espèce considérée. 


Nous savons en plus qu'il existe pour chaque individu un optimum de croissance à une température 


donnée 7°, , ainsi que des températures minimale 7, et maximale 7... en deçà et au-delà desquelles 


il n'y a plus de croissance. 


Ainsi, les paramètres a, b, c doivent vérifier les relations suivantes: 


Ty) _ à 
dT (64.122) 
HT) = AT) = 0 


Ce qui implique pour les trois températures cardinales 7, , Tin 


démontrées dans le cadre de l'étude des polynômes du deuxième degré: 


Ta de respecter les relations 


LL È 
di 24 
TT. = b=VbŸ-4ac _-b Nb -4ac _ VB? -4ac (64.123) 
ER 24 24 24 sil 24 LL 
—b + JP? —dac —b b? Age V8? — dac 
Fe = —— “+ "7% SE —— 
2a 24 24 dé 24 
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Donc si nous connaissons pour un objet vivant 7, et 7, il est facile d'en déduire théoriquement une 


approximation de 7... . 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Notes personnelles: 
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65. THÉORIE DES JEUX ET DE LA DÉCISION 


LL théorie de la décision et des jeux dépasse très largement le cadre étroit des jeux de société, même 


si ces derniers ont constitué son premier objet d'étude et lui ont donné son nom dans la plupart des 
ouvrages disponibles dans le commerce. 


Par ailleurs, les deux théories sont très proches l'une de l'autre d'où le fait qu'elles soient très souvent 
non différenciées dans la littérature. 


Définition: 


D1. La "théorie des jeux" est l'étude des modèles de prise de décision en avenir incertain non 
probabilisable. 


D2. La "théorie de la décision" (appelée aussi parfois "analyse décisionnelle") est l'étude des modèles 
de prise de décision en avenir incertain probabilisable (objectivement ou subjectivement). 


Chacune des méthodes d'analyse de ces deux théories se fait principalement sous forme tabulaire 
(tableau) ou sous la forme d'un arbre vertical ou horizontal. 


Voici un schéma assez connu par les coordinateurs de projets qui résume assez bien la situation globale: 


PROBABILITÉS CONNUES ? 


Théorie des Jeux éorie cd la cécisio 


Méthock des scénarios Simulations 
(Opt, Att, Pess stochastiques 


änalyse Mutticritères 
matrices  chécision 


Figure: 65.1 - Classification élémentaire des techniques de décision 


ârbres de Markow 


Ces outils ont pour objectif de tenter de formaliser comment statuer que telle configuration ou décision 
est meilleure qu'une autre? Nous chercherons pour cela à trouver l'optimum de certains paramètres qui 
permettent de quantifier la qualité stratégique d'une situation. Il faut également déterminer quelles 
conditions conduisent à une configuration qui est jugée optimale. 


La théorie des jeux et de la décision est aujourd'hui assez répandue et utilisée dans les milieux 
universitaires, non seulement en économie (finance d'entreprise particulièrement), mais également par 
toute une classe d'autres sciences dans lesquelles l'étude des situations de confits est pertinente: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


sociologie, biologie, évolution, informatique (jeux vidéo), marketing... 


Remarque: Dans le monde de l'industrie les techniques de décisions sont inconnues de la quasi- 
totalité des dirigeants dont les choix sont souvent plus qualitatifs, instinctifs que scientifiques. 


Nous tenterons, comme toujours sur ce site, de minimiser au mieux le nombre de définitions et concepts 
afin de ne pas noyer la rigueur de l'analyse mathématique sous le chaos d'un vocabulaire inutile et non 
nécessaire à une telle analyse (et dans le cadre de la théorie de jeux c'est un peu comme dans la théorie 
des graphes vraiment le cauchemar!). 


Définition: Un "jeu" est une situation où des joueurs sont conduits à faire des choix stratégiques parmi 
un certain nombre d'actions possibles, et ce dans le cadre défini à l'avance par les "règles du jeu", le 
résultat de ces choix constituant une "issue du jeu", à laquelle est associé un "gain" (ou payement), 
positif ou négatif, pour chacun des participants. 


Remarque: Un joueur peut être une personne, un groupe de personnes, une société, une région, un 
parti politique, un pays ou la Nature. 


Postulats (nous les retrouverons en économétrie): 

P1. Le marché est régi par la compétition et la coopération. 

P2. Les comportements des agents économiques sont rationnels (...) 

P3. Il est possible de formaliser les comportements compétitifs 

P4. Tous les phénomènes compétitifs ont une dimension utilitaire 

Nous différencions et définissons quatre types de situations (que nous formaliserons plus loin): 


D1. Les "jeux coopératifs ou non-coopératifs": un jeu est dit coopératif lorsque les joueurs peuvent 
communiquer librement entre eux et passer des accords (par ex. sous forme d'un contrat). Ils forment 
alors une coalition et recherchent l'intérêt général suivi d'un partage des gains entre tous les joueurs. 
Dans un jeu non-coopératif, les joueurs (qui ne communiquent pas ou ne peuvent pas communiquer 
entre eux) agissent selon le principe de rationalité économique: chacun cherche à prendre les meilleures 
décisions pour lui-même (c'est à dire cherche à maximiser égoïstement ses gains individuels). Ce dernier 
type de jeu fait intervenir les probabilités. 


D2. Les "jeux à somme nulle ou non nulle": un jeu est dit à "somme nulle" lorsque la somme des gains 
des joueurs est constante (ou par le choix subtil d'une fonction d'utilité peut l'être.) ou autrement dit: 
ce que l'un gagne est nécessairement perdu par un autre (échecs, poker..….). Les jeux de société sont 
souvent des jeux à somme nulle mais les situations réelles sont souvent mieux décrites par les jeux 
non-coopératifs à somme non nulle car certaines issues sont profitables pour tous, ou dommageables 
pour tous (vie politique, situations d'affaires..….). 
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Remarques: 


R1. Certains théoriciens critiquent les jeux à somme nulle, au moins dans le giron des situations 
économiques, aux motifs qu'un échange économique est en principe mutuellement avantageux et 
que les jeux à somme nulle seraient totalement irréalistes. 


R2. Les jeux à somme nulle sont parfois appelés "jeux antagonistes". 


R3. Depuis l'invention de l'arme atomique, l'équilibre de la terreur repose sur la doctrine de 
dissuasion offensive. Contrés par les capacités réciproques à s'infliger des dégâts colossaux, les 
arsenaux nucléaires respectifs s'auto-annulent, dans un jeu à somme nulle, par un principe de 
destruction mutuelle assurée. 


D3. Les "jeux avec ou sans équilibre": un jeu à somme non nulle coopératif ou non est dit avec 
"équilibre de Nash" s'il existe un couple de stratégies (dans le cas d'un jeu à deux joueurs) tel qu'aucun 
des joueurs n'a intérêt à changer unilatéralement de stratégie et ceci afin de s'assurer le maximum des 
minimum (le "maximin") des gains. 


D4. Les "jeux compétitifs ou non-compétitifs": un jeu non-compétitif est à l'opposé d'un jeu compétitif 
tel que par définition, lorsque tout couple de stratégies (dans le cas d'un jeu à deux joueurs) est tel qu'il 
fait perdre ou gagner simultanément à tous les joueurs un gain donné (quand je perds quelque chose, tu 
perds quelque chose, quand je gagne quelque chose tu gagnes aussi quelque chose). 


1. REPRÉSENTATIONS DE JEUX 


Il existe différentes manières de formaliser la théorie des jeux et de la décision et ce d'autant plus 
suivant le type de situations dont il s'agit. Ainsi, nous distinguons: 


1. Les "formes extensives" qui sont des formes synoptiques (arbre, branche, feuille) utiles à une 
compréhension simple des stratégies possibles et où l'issue d'un jeu est assimilée à une feuille dans 
laquelle nous retrouvons le vecteur des gains (ou "payements") respectifs des joueurs. Ce genre de 
représentation devient compliqué (longue à dessiner) lors de jeux répétitifs. 


Lorsqu'une forme extensive fait appel aux probabilités, nous faisons alors référence à un "arbre de 
décision", car comme nous l'avons mentionné au début, qui dit intervention des probabilités dit théorie 
à part entière: la théorie de la décision. 


2. Les "formes normales" qui permettent de réduire considérablement la taille et le temps de 
représentation graphique d'un jeu sous forme d'un tableau (matrice) de gains (ou "payements") mais qui 
sont inadaptées aux jeux répétitifs. 


Deux sous-catégories principales peuvent en plus être distinguées (il en existe donc d'autres!): 


- Les "formes normales des jeux à somme nulle" (jeux strictement compétitifs) où selon un choix 
adapté, il est possible de simplifier la représentation de la matrice (ou "bimatrice") en demi-matrice 
puisque les gains sont égaux et opposés pour les joueurs pour chaque stratégie donnée. 


- Les "formes normales des jeux à somme non nulle" (jeux compétitifs). 
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Remarque: Chaque cellule du tableau/matrice contient donc un "vecteur" dont les composantes 
sont les gains respectifs des joueurs. Si le jeu est à somme nulle chaque cellule ne contient qu'une 
seule valeur puisque ce qui est gagné par un joueur est perdu par l'autre. Nous en verrons de 
nombreux exemples. 


3. Les "formes ensemblistes" qui ont une approche ensembliste orientée probabiliste qui va nous 
permettre d'étudier la dernière forme ci-dessous. 


4. Les "formes graphiques" qui sont sympathiques à regarder et que nous introduirons comme approche 
complémentaire car faisant appel à la recherche opérationnelle (cf. chapitre de Méthodes Numériques), 


1.1. FORME EXTENSIVE D'UN JEU 


Les règles d'un jeu stratégique et les gains contingents qui y sont associés peuvent donc être représentés 
sous une forme extensive plus couramment nommée par les spécialistes "arbre de Kuhn”. 


Exemple: 


Nous considérons deux firmes d'ordinateurs qui ont à faire un choix de système d'exploitation. La 
compatibilité entre les systèmes serait socialement préférable, mais pour des raisons liées à l'histoire des 
deux firmes, chacune préférerait que ce soit l'autre qui fasse l'effort de s'adapter. Si les deux firmes 
choisissent CAM, MBI (J,) gagne 600 M$ et Poire (7,) 200 M$. Si elles choisissent MAC, c'est Poire 


qui gagne 600 M$ et MBI 200 M$. S'ils ne sont pas compatibles, ils gagnent chacun 100 M$. 


Remarque: Nous appelons ce type de jeu, un "jeu de coordination". Par exemple, le choix de 
standards de télévision ou de lecteur des Mac et PC correspondent à ce type de jeux. Chaque 
constructeur voudrait imposer son propre standard mais en cas de désaccord, les consommateurs 
pourraient refuser d'acheter le produit. 


Les firmes jouent séquentiellement tel que le jeu puisse être représenté sous la forme d'un arbre de 
décision: 


MAC MAC MACICAM CAM ! MAC CAM ! CAM 
J, = 200,7, = 6007, =100,7, =100 7, =100,7, =100 À = 600,7, = 200 


Figure: 65.2 - Jeu séquentiel sous forme d'un arbre de décision (ou arbre de Kuhn) 
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Remarques: 


R1. La structure informationnelle mise en évidence fait référence à l'information dont dispose 
chaque joueur à chaque noeud de décision du jeu. 


S 


R2. MAC/CAM est un jeu à "information parfaite" dans le sens que les joueurs connaissent 
exactement l'éventail de leurs stratégies et de celles de leur adversaire et les conséquences précises 
de ces stratégies. Ainsi, chaque noeud de la forme extensive est visible par les joueurs (nous 
définirons le concept d'information parfaite de manière formelle un peu plus loin). 


Une analyse plus simple de la meilleure stratégie à adopter dans le cadre d'un jeu consiste à passer 
directement à la forme normale comme nous le verrons un peu plus loin (mais cette forme normale n'est 
pas adaptée pour une forme extensive d'une décision). 


1.2. FORME EXTENSIVE D'UNE DÉCISION 


Comme nous l'avons mentionné au début de ce chapitre, les théories des jeux et de la décision se 
différencient par le fait que les données de départ de la première se trouvent dans un univers totalement 
déterministe alors que pour la seconde, elles sont totalement probabilistes. Ce dernier contexte est 
tellement important dans l'industrie qu'il existe comme nous allons le voir de suite des logiciels (@Risk, 
Isograph, Treeage) spécialisés sur le marché pour la gestion des formes extensives (ces dernières faisant 
partie intégrante des méthodes de gestion de risque de la norme ISO 31010). 


® Exemples: 


E1. Le cas de décision le plus simple dans l'industrie est l'analyse par arbres d'événements qui fait appel 
(lorsque les Re sont fixes) uniquement aux axiomes élémentaires des probabilités (( 

). Si les probabilités ne sont pas fixes (ce qui est fréquent dans la réalité), il faudra faire 
appel à des logiciels intégrant les méthodes de Monte-Carlo (cf. l ques). 


L'analyse par arbre d'événements est une technique graphique permettant de représenter les séquences 
d'événements mutuellement exclusifs suivant un événement initiateur dépendant du 
fonctionnement/non fonctionnement (ou enclenchement/non enclenchement) de divers systèmes 
conçus pour limiter ses conséquences. 


Voici un exemple simple d'arbre d'événement effectué et automatisé par mes soins au niveau des calculs 
avec le logiciel bureautique Microsoft Office Visio: 
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Analyse événements serveur 


22 


E Qui | | onctionnement normal 
Probabibeé: 0.3 Fréquencean: 12 
nt | res 
Qui 
Probabilté: 0.8 


Probablité: ©.5 


Ow 
Probablité: 0.5 don marmselle pour 
Le commando au rémem 
ProbaDioNE G.7 Fréquence/an: 28 
Oui lon mamselle poser 
oise nn marche $R 
Probabitsé: 0,3 Fréquence/an: 12 
Neo 
Non 


Avertissement diems 


Prubabitsé: 0.7 Fréqueneu/an: LB 
ORUIONEENMEN Or MI 
 . … 


Figure: 65.3 - Arbre d'événements avec probabilités fixes sous MS Office Visio 


Analyse par arbre d'événements 


Probatilté: 0,2 


La fréquence annuelle dans la colonne se trouvant à l'extrême droite du tableau (les feuilles) est 
simplement égale à l'estimation de la fréquence annuelle de l'événement initiateur multipliée par le 
produit des probabilités d'une branche telle que: 


= RIZ (650 


et il faut bien évidemment faire attention à ce que la somme des probabilités dans chaque branche soit 
égale à 100%. 


E2. Cet exemple va être plus compliqué et nettement plus long que l'analyse par arbre d'événements 
vue avant. Imaginons une société informatique B en concurrence potentielle, pour une migration 
informatique internationale chez X avec une autre société A (cette dernière pouvant être vue comme un 
ensemble de concurrents aussi!). 


En simplifiant quelque peu, mais sans être toutefois hors de la réalité, considérons que deux choix sont 
ouverts à B: viser "cher" ou viser "bas". 


Supposons que nous sachions également que dans le passé B a soumis une proposition pour chaque 
appel d'offres de ce type, alors que le groupe À ne l'a fait que dans 60% des cas (pas de fonction de 
distribution de probabilité dans notre scénario!). 


Nous savons également que: 
- Si B soumet cher et est le seul à soumettre une proposition, son bénéfice attendu est de 22 millions. 


- Si B soumet un prix élevé mais se trouve en concurrence avec le groupe À, il obtiendra le contrat 
selon le niveau de prix demandé par le groupe A. Dans ce cas, il sait qu'il obtiendra en moyenne 1 
million. 
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- Si enfin B soumet à un prix bas, il est sûr d'obtenir le contrat et de réaliser un bénéfice de 10 millions. 


Donc dans le cadre où le choix du projet est déterminé uniquement par son prix (au détriment de la 
qualité comme souvent dans la réalité...) les questions qui se posent sont alors les suivantes: 


Q1. Que doit faire B, si aucune information complémentaire ne peut être obtenue? 
Ceci constitue une situation du type: "décision sans informations" 


Q2. À supposer qu'un espion au sein du groupe A puisse informer B si le groupe À soumettra une offre 
ou non, combien vaudrait cette information pour B? 


Ceci constitue une situation du type: "décision avec information parfaite" 


Q3. Une société de conseil spécialisée peut donner son avis, mais son expertise, chère, s'élève à 1 
million par étude. Pour envisager le recours à ses services, nous savons que, dans le passé, sur les 30 
fois où le groupe À avait en fait soumis une proposition, la société de conseil l'avait prévu 24 fois. Et, 
sur les 20 fois où il n'en avait pas soumis, elle l'avait prévu 17 fois. Faut-il lui commander une étude 
(bon de toute façon dans la réalité ce genre d'information est quasi impossible à obtenir...)? 


Ceci constitue une situation du type: "décision avec information imparfaite" 


S1. Pour répondre à la première question (Q1), nous représentons tout d'abord le problème à résoudre 
sous la forme graphique d'un arbre de décision (qui est pour l'instant assez simple à mettre aussi sous 
forme de tableau) avec le logiciel Tree Age par exemple: 


Concurrence 11 
Cher & 60% ÿ 
P 
Appel Offre as TE D 


Pas cher 
10 


Figure: 65.4 - Arbre de décision sans informations avec TreeAge 


Indiquons qu'il est possible de faire le même type d'arbres avec MS Office Visio mais la modélisation de 
Monte-Carlo n'y est pas incorporée et la création des formules prend beaucoup de temps (compter un 
facteur temps de 10 à 20 par rapport à TreeAge, Isograph ou @Risk). 


Ensuite, en lançant le calcul de l'espérance à chaque branchement, appelée "valeur monétaire espérée" 
(VME), TreeAge nous donne simplement (ce logiciel a une option pour faire de la modélisation de 
Monte-Carlo mais l'exemple ici étant avec des probabilités fixes cette option est inutile à ce niveau): 


Concurrence 
sus” 


*, Pas cher 
——<«]| 10.00: P = 1.00 


Figure: 65.5 - Espérances calculées sur l'arbre de décision 


Ainsi, la réponse à la première question est que la stratégie donnant l'espérance de gain la plus grande 
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est la stratégie "Pas Cher" car il y a un gain espéré de 10 millions. 


Avec la première décision (Cher) nous ne gagnerions en moyenne que: 


22-0.4+1.0.6=9.4 


Remarque: Dans les arbres de décision construits avec TreeAge une règle de base est d'avoir à 
chaque branche probabiliste la somme des probabilités qui vaut 1! 


S2. Pour répondre à la deuxième question (Q2) qui est de connaître la valeur financière de l'information 
donnée par l'espion, nous devons d'abord construire l'arbre (bon l'exemple est tellement simple qu'ici ce 
n'est pas vraiment nécessaire mais bon...) d'une situation dite de concurrence à "information parfaite" 
(car l'espion peut nous fournir une information tout à fait sûre). 


L'arbre est facile à construire. Si l'espion nous dit que le groupe A va faire une offre, alors nous allons 
devoir proposer l'offre la moins chère. Dans le cas contraire, nous allons proposer l'offre la plus chère. 
Le scénario est donc le suivant: 


Concurrence 
Information 


Pas Concurrence 


La probabilité qu'il y ait concurrence est de 60% et 40% qu'il n'y en ait pas. Donc "l'espérance de la 
valeur monnétaire de l'information parfaite" (EVMIP) est dans une situation à information parfaite: 


40% . 22 + 60%. 10 = 14.8 


Donc par rapport à la meilleure situation précédente nous avons un delta de 4.8 millions. C'est donc la 
valeur de l'information parfaite de l'espion. 


S3. Concernant la troisième question (Q3) qui consiste à déterminer la valeur de l'information 
imparfaite fournie par une société de conseil. La seule certitude de bon sens que nous ayons est que 
cette information ne peut avoir une valeur supérieure à celle de l'information parfaite: elle aura donc 
une valeur comprise entre 0 et 4.8 millions. 


Pour commencer, rappelons que selon l'énoncé, nous pensons que pour le mandat actuel, il y a 60% de 
probabilité qu'il y ait concurrence et la société de conseil dans le passé a eu 80% du temps raison (24 
fois sur 30) lorsqu'elle avait dit qu'il y aurait concurrence (et donc 20% des autres fois tort….). 


Respectivement, nous pensons pour le mandat actuel qu'il y a 40% de probabilité qu'il y ait non 
concurrence (1-60%) et la société de conseil dans le passé au eu 85% du temps raison (17 fois sur 20) 
lorsqu'elle avait dit qu'il n'y aurait pas de concurrence (et donc 15% des autres fois tort….). 


Ce qui se résume sous forme de tableau: 
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Proba. Concurrence | Sans concurrence 


[NConcuiencenN 60% 80% 20% 
[Sansiconcumence} 40% 15% 85% 


Tableau: 65.1 - Décision avec information imparfaite (forme initiale) 


Nous aimerions maintenant: 


1. Calculer la probabilité qu'il y ait réellement concurrence ET que la société de conseil ait prévu de la 
concurrence. 


2. Calculer la probabilité qu'il n'y ait réellement pas de concurrence ET que la société de conseil ait 
prévu de la concurrence. 


3. Calculer la probabilité qu'il n'y ait réellement pas de concurrence ET que la société de conseil ait 
prévu pas de concurrence. 


4. Calculer la probabilité qu'il y ait réellement concurrence ET que la société de conseil ait prévu pas de 
concurrence. 


Pour calculer ces probabilités, nous allons utiliser la formule de Bayes démontrée dans le chapitre de 
Probabilités. Ainsi pour rappel, les probabilités a posteriori et a priori sont données par: 


P(AN BE) P(An B) 


et PA BB) = — © (654 
(4/8) P@) (65.4) 


P(B1 À) = 
d'où: 
P(B N À) = P(B/ A)P(A) = PCA! BP(B) (655) 


Nous pouvons maintenant: 


1. Calculer la probabilité qu'il y ait réellement concurrence ET que la société de conseil ait prévu de la 
concurrence. Nous avons alors en utilisant le tableau précédent: 


P(AN B) = PB! A) P(A) = 80% . 60% = 48% (65.6) 


où dans cette situation À est donc l'événement "il y a eu réellement concurrence" et B est l'événement 
"prévision de concurrence par la société de conseil". B/A est donc l'événement "prévision de 
concurrence par la société de conseil sachant qu'il y a eu réellement concurrence". 


2. Calculer la probabilité qu'il n'y ait réellement pas concurrence ET que la société de conseil ait prévu 
de la concurrence. Nous avons alors en utilisant le tableau précédent: 


P(AN B)= P(B1 A)P(A) = 15% 40% = 6% (65.7) 


où dans cette situation À est donc l'événement "il y a eu réellement pas de concurrence" et B est 
l'événement "prévision de concurrence par la société de conseil". B/A est donc l'événement "prévision 
de concurrence par la société de conseil sachant qu'il y a eu réellement pas de concurrence". 
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3. Calculer la probabilité qu'il n'y ait réellement pas concurrence ET que la société de conseil ait prévu 
pas concurrence. Nous avons alors en utilisant le tableau précédent: 


P(AN 8) = P(B{ A) P(A) = 85% 40% = 34% (65.8) 


où dans cette situation À est donc l'événement "il y a eu réellement pas de concurrence" et B est 
l'événement "prévision de pas de concurrence par la société de conseil". B/A est donc l'événement 
"prévision de pas concurrence par la société de conseil sachant qu'il y a eu réellement pas de 
concurrence". 


4. Calculer la probabilité qu'il y ait réellement concurrence ET que la société de conseil ait prévu pas 
de concurrence. Nous avons alors en utilisant le tableau précédent: 


P(AN B)= P(B 1 A)P(A) = 20% : 60% =12% (65.9) 


où dans cette situation À est donc l'événement "il y a eu réellement concurrence" et B est l'événement 
"prévision de pas de concurrence par la société de conseil". B/A est donc l'événement "prévision de pas 
concurrence par la société de conseil sachant qu'il y a eu réellement concurrence". 


Nous avons alors le tableau suivant qui résume de manière utilisable les scénarios possibles: 


DNCONUIENCE 45% 12% 
BSanstconcuiencen 6% 34% 
EN 54% 46% 


Tableau: 65.2 - Décision avec information imparfaite (forme finale) 


À l'aide de ce tableau, nous vérifions bien que la somme des 4 premières cases donne 100% (c'est- 
à-dire l'ensemble des éventualités). 


Nous voyons donc que 54% du temps la société de conseil prévoit de la concurrence (quelle que soit 
l'issue réelle) et 46% du temps aucune concurrence (quelle que soit l'issue réelle). 


Nous avons alors l'arbre de décision suivant dans le logiciel Tree Age: 


Sans concurrence réelle 
Cher | 6/54 
Avec concurrence réelle 


22 


Conseiller Prévoit concurrence 


Appel Offre 
pp 0 


Sans concurrence réelle 


Avec concurrence réelle 
12448 


Conseiller Prévoit non-concurrence 


Figure: 65.7 - Arbre de décision avec information imparfaite avec Tree Age 


Ce qui donne après calculs: 
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Sans concurrence réelle 420] 
Cher O.11 
43 
ec concurrence réelle 
Conseiller. Prévoit concurrence 4 [1.00] 
{Bas : 10.00 


VE + 


10 10.00, P = 0.54] P=054 
Sans concurrence réelle 
ne [22 00. P = 0.34] 00, P = 0.34 


concurrence réelle 


[1.00 P = 0.12] P=0.12 
026 


Figure: 65.8 - Espérances calculées sur l'arbre de décision 


Nous nous retrouvons donc avec une espérance de gain de 13 millions moins le 1 million de paiement 
pour la société de conseil cela fait 12 millions. 


Ainsi, la valeur de l'information imparfaite est de 2 millions par rapport aux 4.8 que rapporte 
l'information parfaite. Ce résultat est donc tout à fait logique. 


Remarques: 


R1. Ce type d'arbre est souvent utilisé en pharmaco-économie (analyse des coûts). Ainsi, la racine 
de l'arbre sera une infection X pour laquelle il existe plusieurs antibiotiques (branche A/B) et dont 
chacun à deux issues (traitement réussi/raté) avec deux résultats possibles (effets secondaires 
oui/non). Une probabilité est associée à chaque noeud et pour les noeuds terminaux des coûts de 
traitement. Ainsi, en calculant l'espérance, il est possible de déterminer le choix économique du 
meilleur antibiotique pour l'institut médical (évidemment ce n'est utile déontologiquement que 
lorsque le taux de succès des deux antibiotiques est proche et que le taux d'effets secondaires 
oui/non l'est aussi... sinon cette méthode ferait scandale!). 


R2. Dans l'industrie, mes clients utilisent ces arbres avec des distributions de probabilités définies 
sur chaque noeud. Ils font ensuite une simulation de Monte-Carlo sur l'ensemble et font une analyse 
de la sensibilité (graphe Tornado) avec des suites décisionnelles comme celle de @Risk de Palisade. 


1.3. FORME NORMALE D'UN JEU 


Pour passer à la forme normale ou encore "forme stratégique", nous définissons une stratégie comme 
un plan d'action complet pour chaque joueur, qui spécifie un choix pour chaque noeud de l'arbre et 
donc pour chaque situation pouvant survenir au cours du jeu. La "matrice des gains" représente la 
situation stratégique des joueurs et les gains qu'ils recevront pour chaque stratégie. 


Nous reprenons l'exemple précédant MAC/CAM et obtenons: 


600 , 200 100 , 100 


Tableau: 65.3 - Matrice des gains d'un jeu à somme non nulle 
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Il s'agit donc d'une simple forme tabulaire du jeu. 


Remarques: 


R1. Nous voyons dans cette matrice que les intérêts des deux entreprises ne sont pas complètement 
opposés, elles progressent à chaque fois dans la même direction lorsque les stratégies sont opposées 
(si un perd, l'autre perd aussi et inversement). Ainsi, le jeu MAC/CAM est un jeu dont les gains ne 
progressent pas dans des directions (stratégies) opposées. Nous parlons alors de "jeu non 
strictement compétitif" (nous définirons ce concept de manière formelle un peu plus loin). 


R2. Nous voyons également que quelle que soit la stratégie choisie par un des joueurs, chaque choix 
possible par l'autre joueur amènera toujours à des gains équivalents. Dès lors, nous disons alors que 
c'est un "jeu sans tactique prudente”. 


Définition: Une stratégie donnée est dite à "tactique prudente" (c'est le choix du numéro de la ligne 
pour le joueur ligne, ou du numéro de la colonne pour le joueur colonne) lorsque le gain d'un des 
joueurs est tel que lorsque par rapport à une stratégie choisie, l'ensemble des choix de son concurrent 
apporte un gain maximal à ce dernier. Le gain minimal assuré de J, est appelé le "niveau de sécurité" 


de J. 


® Exemple: 
D en 
6,4 0,10 4,6 
70 5,9 6,4 
7,3 7150 8,1 
BL 0,10 2,8 
D,9 9,0 0,10 


Tableau: 65.4 - Matrice des gains d'un jeu avec tactique prudente 


Le joueur À peut penser que le joueur B est très perspicace, ou a beaucoup de chance, et est ainsi en 
mesure de choisir la meilleure réponse possible à toute tactique de A. 


Ainsi: 

- Si A choisit a; B le devinant choisirait b., et À aurait gagné 0 (tandis que B aurait gagné 10) 
- Si A choisit @., B le devinant choisirait b., et À aurait gagné 1 (tandis que B aurait gagné 9) 
- Si A choisit ; B le devinant choisirait b., et A aurait gagné 6 (tandis que B aurait gagné 4) 
- Si A choisit a,, B le devinant choisirait b.,, et À aurait gagné 0 (tandis que B aurait gagné 10) 
- Si A choisit a; B le devinant choisirait b 4 et A aurait gagné 0 (tandis que B aurait gagné 10) 


Le choix prudent de A est donc >; qui lui assure de gagner au moins 6. Ce gain minimal assuré est le 
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niveau de sécurité. En faisant de même pour B s'il redoute l'extrême perspicacité de A le choix est b.. 


Cette tactique lui assure un gain de 4, qui est aussi son niveau de sécurité. 


Si nous étudions le jeu MAC/CAM par sa matrice de gains, nous pouvons nous rendre compte qu'il y a 
deux issues remarquables où le gain des deux entreprises est maximum par rapport aux autres 
stratégies. Ces deux issues sont intéressantes à plus d'un titre: 


Effectivement, les deux entreprises n'ont aucun regret quant à leur choix de stratégie. S'ils considèrent 
la stratégie de leur adversaire comme inéluctable, leur propre choix de stratégie est le meilleur possible. 
Nous disons que les deux issues sont des "équilibres de Nash" (nous définirons ce concept de manière 
formelle un peu plus loin). L'équilibre de Nash caractérise ainsi en quelque sorte la rationalité 
individuelle! 


Remarque: Le jeu MAC/CAM comporte deux équilibres de Nash. Dès lors, nous ne sommes pas 
capables, sans aucune information complémentaire, de prédire quelle sera exactement la solution du 
jeu. Les deux résultats sont également vraisemblables. 


C'est ainsi que la théorie des jeux fait apparaître la stratégie sociale la plus favorable aux deux joueurs: 
que les deux joueurs adoptent au moins le même système. Quant à savoir lequel... le jeu devra dès lors 
être coopératif. 


Dans l'exemple précédent aussi, la conjonction des tactiques prudentes (a.,b.) constitue un équilibre de 


Nash (dans le sens où chacun des joueurs n'a pas intérêt à changer unilatéralement de stratégie s'il veut 
préserver le gain minimum). Cela tient à une particularité de ce jeu ! En d'autres termes: 


1. Il existe de nombreux jeux qui n'ont pas d'équilibre 


2. Il existe de nombreux jeux qui ont des équilibres qui ne correspondent pas à la conjonction des 
tactiques prudentes. 


Remarque: Si dans un jeu, un couple d'issues est tel qu'il est impossible d'améliorer le score de l'un 
des deux joueurs sans diminuer le score de l'autre, nous disons que ces issues sont "pareto- 
optimales" ou "pareto-efficientes" (nous définirons ce concept de manière formelle un peu plus 
loin). 


® Exemple: 


Dans ce jeu, deux joueurs J,,J, s'affrontent à pierre, ciseaux, papier (PCP...). De façon générale, la 


pierre bat les ciseaux (en les émoussant), les ciseaux battent le papier (en le coupant), le papier bat la 
pierre (en l'enveloppant). Ainsi chaque coup bat un autre coup, fait match nul contre le deuxième (son 
homologue) et est battu par le troisième. 


La forme extensive de ce jeu est trivialement: 
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XNB9 SIC) 


(0,0) (1-1) (11) (-1:1) ol (1-1) (1:11) (-11) (0,0) 


Figure: 65.9 - Forme extensive du jeu (arbre de Kuhn) 


Pour faire apparaître la simultanéité du jeu sur la représentation, nous avons entouré les ensembles 
d'informations. J, sait que J, a choisi un élément, mais il ne sait pas lequel, donc il ne connaît pas le 


noeud exact où son propre choix va intervenir, et donc il est incapable de déterminer l'issue du jeu qui 
va être atteinte. Le jeu est donc à "information imparfaite". 


Sous forme normale, nous avons donc: 


0,0 1,-1 


-1,1 0,0 


Tableau: 65.5 - Matrice des gains d'un jeu à somme nulle 


Ce jeu est un jeu à somme nulle dans le sens où tout ce qui est gagné par l'un est perdu par l'autre. En 
d'autres termes, nous avons déjà vu que nous pouvions parler dès lors de jeux "strictement compétitifs". 


Les jeux à somme nulle ont ceci de particulier en plus qu'il est toujours possible comme nous l'avons 
déjà mentionné de les représenter par leur demi-matrice (par rapport à un seul joueur donc) qui résume 
à elle seule tout le jeu puisque ce qui est gagné par ce joueur est perdu par l'autre et inversement: 


0 1 -1 


-1 0 1 


1 -1 0 


Tableau: 65.6 - Demi-matrice des gains du jeu 
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Au besoin, si les gains et pertes respectives de jeu n'ont pas le même "delta", il suffit de définir une 
fonction d'utilité adéquate pour l'autre joueur telle qu'il soit toujours possible pour n'importe quel jeu 
strictement compétitif où les gains ne sont pas opposés et égaux d'être mis sous la forme d'une 
demi-matrice. Nous démontrerons qu'il existe une telle fonction d'utilité. 


Remarque: Sur la demi-matrice d'un jeu à somme nulle, il est très facile de reconnaître s'il existe un 
équilibre de Nash ou non. Par exemple: 


Dans ce jeu, la ligne 2 est la tactique prudente du joueur ligne et le joueur colonne choisira la 
colonne 1 comme tactique prudente dans laquelle ne se trouve pas la plus grande perte. Dès lors, le 
joueur ligne aura intérêt à se déplacer en première ligne donc les tactiques prudentes conjointes ne 
sont pas un équilibre et par ailleurs, il n'y a pas d'équilibre de Nash!! 


Dans le duel tactique ainsi défini, l'espérance du joueur ligne est le maximum des minimums de lignes, 
c'est-à-dire le "maximin", tandis que l'espérance du joueur colonne est le minimum des maximums de 
colonnes, c'est-à-dire le "minimax". 


Définitions: 


D1. Le "maximin", appelé aussi parfois "critère de Wald", est un critère pessimiste. Il s'agit 
effectivement selon ce critère, de maximiser le résultat minimum. Pour le mettre en oeuvre, il convient 
dans un jeu à somme nulle et à information parfaite: 


- Pour chaque décision (ou stratégie), de retenir le résultat le plus faible 


- Parmi, les moins bons résultats, choisir le plus élevé des moins bons résultats des différentes 
stratégies. 


Ce genre d'approche peut donc outre sous forme tabulaire être représenté sous la forme d'un arbre de 
décision. 


D2. Le "maximax", selon la même logique que le critère précédent consiste à retenir le meilleur des 
résultats des différentes stratégies possibles, c'est donc un critère optimiste. Pour le mettre en oeuvre, il 
convient dans un jeu à somme nulle et à information parfaite: 


- Pour chaque décision (ou stratégie), de retenir le résultat le plus attendu le plus élevé 
- Parmi, les meilleurs résultats, choisir le plus élevé des meilleurs résultats des différentes stratégies. 


D3. Le "minimax", est un critère appelé parfois "critère de Von Neumann" prudent qui consiste à 
retenir le plus petit des meilleures résultats des stratégies possibles. Pour le mettre en oeuvre, il 
convient dans un jeu à somme nulle et à information parfaite: 


- Pour chaque décision (ou stratégie), de retenir le résultat le plus attendu le plus élevé 
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- Parmi, les meilleurs résultats, choisir le moins élevé des meilleurs résultats des différentes stratégies. 


Ce genre d'approche peut donc outre sous forme tabulaire être représenté sous la forme d'un arbre de 
décision. 


Si et seulement si le maximin est égal au minimax, leur valeur commune, qui est l'espérance commune 
aux deux adversaires, est appelée la "valeur du jeu" (nous le démontrons juste quelques lignes en 
dessous), et tout couple formé par une telle tactique prudente du joueur ligne et une tactique prudente 
du joueur colonne défini un équilibre (pour cette raison l'exemple précédent n'a pas d'équilibre). 


Exemple: 
2 4 
1 3 
0 4 


Dans ce jeu, la ligne 1 est la meilleure tactique prudente du joueur ligne et le joueur colonne choisira la 
colonne 1 comme tactique prudente dans laquelle se trouvent les plus petites pertes. Dès lors, la cellule 
supérieure gauche correspond aux tactiques prudentes conjointes et correspond comme nous le voyons 
à un équilibre de Nash. 


Définition: Dans un jeu à somme nulle nous appelons "col", l'utilité (vue dans le sens du gain ou de la 
perte) qui est à la fois minimum dans sa ligne et maximum dans sa colonne (ce qui est le cas de 
l'exemple précédent où l'équilibre est un col). 


Démontrons maintenant que dans tout jeu à somme nulle, si et seulement si les niveaux de sécurité des 
deux joueurs sont opposés (le minimax est égal au maximin), la conjonction des tactiques prudentes est 
toujours un équilibre. 


Reprenons la définition d'un couple formé: 


- d'une tactique prudente 4, pour le joueur À, lui assurant de gagner au moins v 


- d'une tactique prudente à, pour le joueur B, lui assurant de gagner au moins -w 


Dans le cas d'un jeu à somme nulle, nous pouvons toujours redéfinir la fonction d'utilité d'un des joueurs 
de manière à obtenir v= w comme nous l'avons vu afin de pouvoir écrire la demi-matrice. Dès lors, 
observons ce qu'il se passe (en se rappelant bien que dans un tel jeu, le gain équivaut à la perte donc par 
extension quand le gain est minimal pour l'un la perte est minimale pour l'autre): 


Le couple (a ; D, ) , comme tout couple qui contient &,, assure À de gagner au moins v et in extenso 


assure B de gagner au moins -v (puisque v = w ). 


A n'a donc aucun intérêt à s'écarter unilatéralement de 4, , puisque B s'est assuré de perdre au plus v 
dans la stratégie de A. De même, B n'a aucun intérêt à s'écarter unilatéralement de la tactique b, , 


puisque A s'est assuré de gagner au moins v. 


Par conséquent, dans le cas où les niveaux de sécurité des deux joueurs sont égaux et opposés, la 
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conjonction des tactiques prudentes est un équilibre. 


Nous avons déjà vu précédemment un exemple dans lequel les niveaux n'étaient pas exactement 
opposés. 


1.3.1. JEUX RÉPÉTITIFS 


Supposons qu'un homme J, et une femme J, aillent au cinéma. Une fois sur place, ils doivent choisir 


entre aller voir un documentaire ou une comédie. L'un des deux préfère les documentaires et l'autre les 
comédies, mais tous deux préfèrent voir un film ensemble plutôt que séparément: c'est. la guerre des 
sexes (GDS...) 


Les stratégies disponibles pour chacun des deux joueurs, en considérant qu'ils font leur choix 
simultanément (ce qui est peu vraisemblable dans un cas réel, la galanterie obligeant à désynchroniser 
le jeu au profit de la femme:-) ), sont alors: 


- Aller voir un documentaire, ce que nous noterons Doc 
- Aller voir une comédie, ce que nous noterons Com 


La matrice des gains sera alors: 


2,3 1,1 


Tableau: 65.9 - Matrice pour jeu répétitif 


D'abord, nous pouvons remarquer que GDS n'est pas un jeu strictement compétitif (donc inutile 
d'essayer de le représenter sous la forme d'une demi-matrice) et qu'il s'agit d'un jeu de coordination. 
Deuxièmement, nous remarquons que les deux issues à gain maximum sont des équilibres de Nash 
(nous ne pouvons donc prédire l'issue du jeu). 


Ce jeu a cependant ceci de particulier par rapport aux précédents ce que c'est un jeu à une seule étape. 
Supposons ainsi maintenant que le couple retourne au cinéma la semaine suivante, et qu'il doive à 
nouveau faire ce choix. Nous pouvons de nouveau représenter cette situation par un jeu, qui n'est en 
fait que la répétition de GDS, notons le GDS2. 


Si nous considérons que lors de la deuxième étape chacun des deux joueurs sait ce que l'autre a choisi 
lors de la première étape, les stratégies disponibles sont maintenant des stratégies conditionnelles: elles 
peuvent tenir compte des coups joués par l'adversaire lors d'étapes précédentes. 


La description de ces stratégies suit le schéma suivant: nous jouons X, au premier coup, puis si l'autre a 
choisi le documentaire lors de la première sortie, alors nous jouons X,,, sinon X,,, avec 4,,4,,, 4, 


prenant leur valeur dans l'ensemble { Doc, Cam} . Nous noterons cette stratégie: 
(A, Zu [4 Dec], X, 1[X,Cow]) (65.10) 


Nous pouvons lire cette notation de la manière suivante: nous jouons ZX, puis si nous nous retrouvons 
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en [ X,,Doc] alors nous jouons X,, , ou si nous nous retrouvons en | X,, Cow] alors nous jouons X,,. 


Dans le cas GDS2, nous avons donc 8 stratégies: 


1. (Doc, Doc |[ ee, Dec], Doc | [Dec,Com]) : nous choisissons toujours le documentaire 


2. (Dec, Doc [[ Doc, Dec |, Com | [Dec,Com]) : nous choisissons toujours le documentaire, sauf si la 


première fois nous nous sommes retrouvé(e)s seul(e)s 


3. (Dec, Com [[ Dee, Doc |, Doc | [Dec,Com]) : nous choisissons toujours le documentaire, sauf si la 


première fois nous avons tous les deux choisi le documentaire 


4, (Doc, Com [[ Dec, Doc |, Com | [Doc,Com]) : la première fois nous choisissons le documentaire et la 


seconde, la comédie. 


5? (Com, Dec |[ Cow, Dec |, Doc | [ Com, Com]) : la première fois nous choisissons la comédie et la 


seconde, le documentaire 


6. (Cam, Doc |[ Com, Doc], Com | [Com, Com]) : nous choisissons toujours la comédie, sauf si la 


première fois, nous nous sommes retrouvé(s) seul(e)s. 


7. (Com, Com |[Com, Doc], Doc | [Cam, Com] : nous choisissons la comédie sauf si la première fois, 


nous avons tous les deux choisi la comédie. 


8. (Com, Com | [ Com, Doc |, Com | [Cors, C'om]\ : nous choisissons toujours la comédie. 


Pour chaque issue de GDS2, les vecteurs d'utilité sont déterminés en effectuant la somme des vecteurs 
obtenus pour chacune des étapes considérées comme des issues de GDS. Nous dirons que GDS2 est un 
"super jeu" dont GDS est le "jeu constitutif". 


Définition: Un "équilibre parfait en sous-jeux" correspond à une combinaison stratégique dont les 
actions choisies pour chaque sous-jeu sont des équilibres de Nash. 


Remarque: Un "sous-jeu" est simplement un sous-arbre de l'arbre de jeu. 


Voyons maintenant tous ces concepts de manière ensembliste (accrochez-vous un peu ;-)) 


1.4. FORME ENSEMBLISTE D'UN JEU 


Nous avons donc vu jusqu'à maintenant qu'il existe un certain nombre d'éléments qui composent un jeu: 
les joueurs, les actions et stratégies des joueurs, les déroulements et les étapes du jeu, les résultats du 
jeu et les informations dont disposent les joueurs de chaque choix d'action. 


Définitions: 


D1. Les règles d'un jeu indiquent: 
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- La succession des étapes du jeu, et l'ordre dans lequel interviennent les joueurs 


- Les actions qui sont autorisées à chaque étape 
- Les informations dont dispose le joueur chaque fois qu'il doit prendre une décision 


Nous avons vu qu'il y a deux formes de représentations possibles pour un jeu jusqu'à maintenant. L'une 
d'entre elles utilise un arbre (une forme extensive) et l'autre une table (forme normale). Sous une 
expression formelle cela donne: 


D2. Un arbre de jeu 4=(2,7,p) est la donnée: 


- D'un ensemble D de noeuds de décisions, ou situations de jeu 


- D'un ensemble 1 d'issues de jeu, avec D 7 = Gi (donc un noeud n'est pas considéré comme une 
issue!) 


- D'un élément 4, de D et d'une fonction p de D L7{{4,} dans D telle que: 
p:DUI (a) =D 


appelée "fonction prédécesseur", qui pour chaque situation de jeu, ou issue, indique l'unique action 
(décision ou situation, d'où le fait que nous enlevons au moins un élément D de l'ensemble de départ) 
qui a permis d'arriver à cette situation, ou issue. 


Pour déterminer l'issue d'un jeu, il suffit de connaître les stratégies utilisées par chacun des joueurs. Une 
stratégie est une combinaison d'actions autorisées par les règles du jeu jusqu'à la fin de celui-ci. Il existe 
plus précisément trois types de stratégies. 


D3. Une "stratégie pure" s pour un joueur n est une application de l'ensemble 2, des noeuds de 
décision de ce joueur vers l'ensemble D de tous les noeuds de décision du jeu telle que: 


Vae D,,p{s(d))=d 


Plus simplement dit, une stratégie pure est une stratégie ne faisant intervenir aucune forme de hasard, 
qui est donc complètement déterministe. 


Remarque: La fonction stratégie pure n'est que la fonction réciproque de p telle que p} =. 


D4. Une "stratégie mixte" pour un joueur n est une distribution de probabilité (Æ,2....,2,) avec 


2, 8 =1 sur l'ensemble de ses stratégies pures $ = se 


. "8% 
1 


Exemple: 


Les tirs aux buts (penaltys) sont une forme de jeu à stratégie mixte. Effectivement, le gardien de but 
doit anticiper le tir et ne peut l'analyser. Il doit donc choisir au hasard s'il restera au milieu, s'il ira à 
gauche ou à droite. Idem, pour l'attaquant (normalement le gardien doit se lancer au moment même où 
l'attaquant tire) qui ne sachant pas où se lancera le gardien tirera donc au hasard. 
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Remarques: 


R1. Une stratégie pure peut être regardée ainsi comme une stratégie qui donne la probabilité 1 à & 
et 0 à toutes les autres. 


R2. Dans notre définition de l'ensemble des stratégies, il y a un nombre fini de stratégies pour 
chaque agent mais en économie, les ensembles des stratégies sont souvent continus et contiennent 
une infinité de stratégies possibles (choix de quantité, de prix, etc.). 


Naturellement, le résultat obtenu par le joueur ne peut pas être garanti de façon certaine, puisque le 
processus de choix de la décision fait intervenir des probabilités. 


Une stratégie pure est donc une stratégie faisant le choix d'une parmi toutes les stratégies mixtes et qui 
utilise celle-ci durant toute la durée de jeu. Un joueur utilisant une stratégie mixte face à un joueur 
utilisant une stratégie pure utilisera (sera forcé) donc lui aussi une stratégie pure pour une rencontre, 
mais n'utilisera pas toujours la même stratégie pure lors de toutes leurs rencontres. 


D5. Une "stratégie de comportement" pour un joueur n est un ensemble €, ={...,c,,.….} où à est un 
élément de 2, (donc un numéro de noeud) et c, une distribution de probabilité sur le sous-ensemble 


p7 (i) des successeurs du noeud de décision i. 


D6. Une "combinaison stratégique" est un vecteur de stratégies dont chaque élément correspond à la 
stratégie utilisée par un joueur participant au jeu. La donnée d'une combinaison stratégique détermine 
donc de manière complète l'issue du jeu. 


Les joueurs doivent avoir des préférences parmi les issues qui sont à leur portée. C'est avec la définition 
de ces préférences que nous pouvons caractériser la rationalité d'un joueur. La relation de préférence 
que nous noterons $#, est une relation binaire sur l'ensemble des issues d'un jeu. Nous noterons x & y et 
nous dirons que "x est au moins aussi bon que y". Nous pouvons alors définir la préférence stricte > 
telle que: 


x>y S xÈSymaspasyix 
que nous lirons "x est préféré à y", et la relation d'indifférence: 
XV xSyetyS x 


Remarque: Nous réutiliserons ces concepts en économétrie lors de notre étude de la théorie de la 
préférence. 


D7. Une relation de préférence $ est dite "relation rationnelle", si elle est complète (réflexive) et 
transitive. Dans ce cas, comme nous l'avons vu dans le chapitre des Opérateurs (section Arithmétique), 
nous avons affaire à un préordre. 


D8. Une "fonction d'utilité", ou encore "fonction de paiement" ("payoff function" en anglais) est une 
fonction de l'ensemble des issues d'un jeu à n joueurs vers jr* qui associe les utilités retirées par chaque 
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joueur. 


Si U est une fonction d'utilité, nous noterons £/, la fonction de l'ensemble des issues d'un jeu vers IR 


correspondant aux utilités du joueur i. Une telle fonction sera dite représentant de la relation de 
préférence ÿ si pour toute issue x, y€ À, nous avons: 


x 5 y © U,G) 20,0) 


La théorie de l'utilité dont fait usage la théorie des jeux axiomatise le fait que seule cette notion de 
préférence est importante. En bref, nous dirons que seul l'ordre de préférence de l'utilité des issues est 
important, la valeur des gains apportés par chaque issue étant sans importance. 


Nous pouvons maintenant étendre la définition du jeu: 


DS. Un "jeu sous forme développée" J = (4, NU F) est la donnée: 
- d'un arbre de jeu 4=(D,1,p) 


- d'un ensemble N de joueurs 
- d'une fonction d'utilité U qui donne pour un joueur donné son gain 


- d'un ensemble de partitions d'informations F, dont chaque élément est une partition de D et indique 
les états du jeu que le joueur est capable de distinguer 


Remarque: Comme nous l'avons déjà précisé, un jeu sous forme développée est également dit 
"forme extensive", ou encore "arbre de Kuhn”. 


D10. Un jeu est à "information complète" quand chaque joueur connaît l'ensemble des composantes du 
jeu, et à "information incomplète" sinon. Il est à noter que de parler d'un jeu à information complète 
revient à dire que F ne contient qu'une seule partition et donc que les joueurs n'ont qu'une seule vue sur 
l'arbre de jeu. 


D11. Un jeu est à "information parfaite" quand l'unique élément de F se réduit à une partition de D où 
chaque noeud de décision forme un sous-ensemble, c'est-à-dire que chaque élément de la partition est 
un noeud de l'arbre et réciproquement. Plus simplement, nous pouvons dire que dans ce cas les joueurs 
peuvent savoir à chaque instant quel noeud de l'arbre est atteint. Dans le cas contraire le jeu est dit à 
information imparfaite. 


Remarque: Nous pouvons remarquer que tous les jeux simultanés, c'est-à-dire dans lesquels les 
joueurs font leur choix en même temps, sont des jeux à information imparfaite. En effet, au moment 
de son choix, le joueur ne sait pas sur quel noeud de décision il se trouve. 


Maintenant nous pouvons en venir à définir ce qu'est la matrice des gains: 


D12. Un "jeu sous forme normale" J = (W,S,U\ est la donnée: 
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- d'un ensemble N de joueurs 


- d'un ensemble S de combinaisons stratégiques 
- d'une fonction d'utilité U définie sur S 


Ainsi, un jeu sous forme normale est également dit "jeu sous forme stratégique". Nous simplifions 
d'ailleurs la donnée du jeu à la donnée de la fonction d'utilité, sous la forme d'une matrice de gains (ou 
de paiements). 


D13. Un jeu est "concurrentiel pur" ou "strictement compétitif" si: 


Vi,jelxl,imneNxN (U,() -U,6))' (0,4) -0,6)) < 0] (65.16) 


Donc un jeu est strictement compétitif si pour un ensemble couple d'issues, les gains d'un au moins des 
joueurs diminuent. Si les deux joueurs ont pour un couple d'issues, leurs gains respectifs qui augmentent 
ou diminuent, alors nous avons: 


(OO -U,6) (AU)-LE)>0 in 


>0 >0 


le jeu n'est dès lors plus strictement positif. Nous en avons par ailleurs donné des exemples au début de 
ce chapitre. 


D14. Un jeu strictement compétitif est un "jeu à somme nulle" si: 


Vel, DU, (i)=0| (65.18) 


Un jeu est à somme nulle quand les intérêts des joueurs sont diamétralement opposés. Dans un jeu à 
deux joueurs à somme nulle, par exemple, ce qui est gagné par l'un est perdu par l'autre. Ce terme 
trouve son origine dans les jeux de salon comme le poker où un joueur qui veut gagner de l'argent doit 
le faire aux dépens des autres. Les échecs sont un jeu à somme nulle. 


D15. Un "super jeu" 7 =(J,T,&) est la donnée: 
- d'un jeu constitutif J = (N,S,U) 


- du nombre de répétitions T 


- du vecteur £2 = (a... @,) de taux d'escompte d'utilité, &, étant le taux d'escompte du joueur à 


(souvent pris comme égal à l'unité) 


Ainsi, comme nous en avons déjà fait mention lors de notre jeu répétitif GDS2, nous considérons qu'à 
une étape t le choix dicté par une combinaison stratégique s au joueur n est noté 5s,, et que l'utilité, 


pour ce même joueur, obtenue à cette étape du jeu, c'est-à-dire l'utilité issue du jeu constitutif 
correspondant, est notée 7, (s,,), alors l'utilité associée à l'issue du super jeu est: 


+7 -1 


U,= d'au, (s,;) (65.19) 
+0 
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il est clair que si wx,£ & = 1 nous retrouvons une définition intuitive simple de la cumulation des gains. 


1.5. FORME GRAPHIQUE D'UN JEU 


Nous avons maintenant amassé suffisamment d'éléments pour avoir une approche probabiliste et 
opérationnelle de jeux à somme nulle relativement simples. 


Comme il est toujours relativement difficile de ne pas être trop théorique pour que ce domaine reste 
compréhensible étudions les formes graphiques via un exemple. 


Considérons deux sociétés que nous nommerons respectivement S1 et S2 qui sont spécialisées dans la 
vente à grande échelle d'un certain produit et qui forment un oligopole bilatéral en concurrence parfaite 
(cf. chapitre d'Économie), La société S1 décide d'investir un nouveau marché, constitué par un 
ensemble de régions d'importances comparables. 


La pénétration dans différentes régions s'opère grâce à l'installation d'un présentoir dans des chaînes de 
magasins C1 ou C2 dans chacune des régions. Pour mieux motiver ses détaillants, la société S1 ne 
choisira qu'une seule chaîne de distribution (C1 ou C2) par région pour vendre ses produits. 


La société S2 ayant pris connaissance du projet de la société S1 décide alors aussi d'investir le marché 
de manière similaire. 


Le problème pour chaque société est de savoir, pour chaque région, s'il vaut mieux faire installer un 
présentoir dans la chaîne de magasins C1 ou C2 ou ne pas en faire installer du tout, c'est-à-dire nulle 
part (ce que nous noterons NP). 


Suite à une étude de marché (il faut bien obtenir au moins quelques chiffres au départ pour faire des 
maths...) la société S1 apprend que ses gains par rapport au concurrent seraient ceux représentés dans 
le tableau ci-dessous: 


[En | C2 | NP 

0 À | 4 
_3 | 
3 -5 | 


Tableau: 65.10 - Préparation du jeu pour analyse graphique 


8 
0 


La société S2 arrive au même résultat suite à une étude de marché (nous simplifions par cette 
hypothèse l'analyse du problème). 


Remarques: 


R1. Puisque tout ce que gagne un concurrent serait perdu par l'autre, le jeu est à somme nulle (d'où 
le fait qu'il n'y ait qu'une seule valeur dans chaque cellule) 


R2. Nous supposerons que les deux sociétés ne peuvent et ne veulent pas communiquer entre elles, 
en d'autres termes qu'il s'agit d'un jeu non coopératif. 


Commençons par analyser quelles sont les stratégies qui n'ont aucun intérêt pour l'une ou l'autre des 
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sociétés. 


Pour cela, regardons s'il y a une stratégie qui ne sera jamais choisie par S1 quelle que soit la stratégie de 
52: 


1. Si S2 choisit C1 alors S1 aura pour meilleur intérêt à choisir C2 
2. Si S2 choisit C2 alors S1 aura pour meilleur intérêt à choisir C1 
2. Si S2 choisit NP alors S1 aura pour meilleur intérêt à choisir C2 


Nous voyons ici que quel que soit le choix de S2, la société S1 ne choisira jamais NP. Donc la stratégie 
NP pour S1 est totalement dominée et peut être éliminée. 


De même, regardons s'il y a une stratégie qui ne sera jamais choisie par S2 quelle que soit la stratégie de 
SL 


1. Si S1 choisit C1 alors S2 aura pour meilleur intérêt à choisir C1 (car ainsi S2 ne perdra rien (0)) 
2. Si S1 choisit C2 alors S2 aura pour meilleur intérêt à choisir C2 (car ainsi S2 gagnera 3) 
3. Si S1 choisit NP alors S2 aura pour meilleur intérêt à choisir C2 (car ainsi S2 gagnera 5) 


Nous voyons ici que quel que soit le choix de S1, la société S2 ne choisira jamais NP. Donc la stratégie 
NP pour S2 est totalement dominée et peut être éliminée. 


Le tableau se simplifie alors de la manière suivante: 


[ St282 | € f  @ à 
ENCENN 0 | 2 
RC 5 | = 


Tableau: 65.11 - Simplification du jeu pour analyse graphique 


Par ailleurs, ce jeu ne contient pas d'équilibre de Nash (donc aucune stratégie pure n'est avantageuse). 
Il est donc sans équilibres. Effectivement, si S1 choisit C1 alors S2 a intérêt à choisir aussi C1. Mais S1 
a alors meilleur intérêt à jouer C2. Mais S2 a maintenant intérêt à choisir plutôt C2. Ce qui redonne à 
S1 l'envie de choisir C1... 


Étudions maintenant l'aspect ensembliste, en d'autres termes l'aspect du jeu qui va donner la stratégie 
mixte à adopter par S1 avec la répartition du choix ad hoc pour que celle-ci ait un gain maximal. 


Pour cela, appelons p et q les fréquences avec lesquelles les sociétés S1 et S2 choisissent la chaîne de 
magasin C1. 


RS EC 

D Et 2 p 
CRC -3 1-p 
| q 1-q 


Tableau: 65.12 - Mise sous forme paramétrique du jeu pour analyse graphique 


Ces probabilités doivent être interprétées de la manière suivante: 
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1. Sip et q sont égaux à l'unité alors pour toutes les régions, ce sera la chaîne C1 qui s'occupera de la 
commercialisation 


2. Si p et q sont par exemple 9/11 et respectivement 5/11 cela signifiera que la société S1 donnera le 
droit de vente à la chaîne de magasins C1 dans 9 régions sur 11 (les deux restantes étant pour C2) et 
respectivement la société S2 donnera le droit de vente à la chaîne de magasins C1 dans 5 régions sur 11 
(les 6 restantes étant pour C2). 


Donc commençons notre étude. Nous allons nous mettre dans une optique d'analyse dans laquelle la 
société S1 cherche sa stratégie mixte de manière à maximiser son gain (ou utilité) que nous noterons v 
et à connaître la stratégie mixte de la société S2 afin qu'elle minimise sa perte v (puisque c'est un jeu à 
somme nulle et tout ce que gagne l'un l'autre le perd). 


Le système d'équation sera alors naturellement pour la société S1: 


max(v)} 
6-(1—-p)+0-p>v 
2-p-3-.(1-p)2v 
OÜ£<ps<Il 


et pour la société S2: 


min(v) 
2-(1—-g)+0-g=<v 
6-g—-3.(1-g)=<v 
0£<g<i 


[ep] 
(ex. 
N 
+= 


Or, nous retrouvons ici une situation remarquable. Effectivement, il ne s'agit que de deux formes 
standards de programmation linéaire (cf. chapitre de Méthodes Numériques). Nous avons vu lors de 
notre étude de celle-ci que lorsqu'il n'y a qu'une seule inconnue par forme (ou système) alors il est 
possible de passer par une résolution graphique sans faire usage de l'algorithme du simplexe. 


Après simplification cela donne: 


S1 S2 
max(v) rmin(v} 
v£S—-6.p+6 vz-2.qg+2 (65.22 
v£S.p-3 v29.g-3 
0O£<p<l 0O<g<l 


et la représentation graphique de v en fonction de p correspondante: 
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[ Réalissbe | 


fl 


Figure: 65.10 - Correspondance des inéquations du problème d'optimisation 


En résolvant avec l'algorithme du simplexe, nous avons comme valeurs optimales pour les deux 
systèmes respectifs (il est aussi possible de lire la valeur approximative sur les graphiques mais bon...): 


51 S2 
v=12/11 v=12/11 (65.23) 
=9/11 g=5/1l 


La société S1 peut par conséquent se garantir un gain moyen v (nous devrions parler "d'espérance" pour 
être rigoureux) de 12/11. Effectivement: 


=6-(1-p)+0.p=6.(1-9/15=12/11 
v= E(U,) (65.24) 
=2.p-3.(1-p)=2.9/11-3.(1-9/11)=12/11 


et la probabilité p donnant au fait la distribution entre les chaînes de magasins C1 qui aura 9/11 du 
marché de l'ensemble des régions et C2 le reste soit 2/11 (la somme devant faire bien évidemment 1). 


La société S2 peut par conséquent se garantir aussi un gain moyen v de 12/11. Effectivement: 


of =2.(1-g)+0.g=2.(1-5/11)=12/11 _. 
v = .2 
4-3 0-9 =6 51130-51010 


et la probabilité q donnant la distribution entre les chaînes de magasins C1 qui aura 5/11 du marché de 
l'ensemble des régions et C2 le reste soit 6/11. 


2. JEUX COOPÉRATIFS ET NON-COOPÉRATIFS 


Une première approche (sans faire usage des maths dans un premier temps) de cette attitude d'esprit 
(forme de jeu) est accessible à de jeunes enfants (sans qu'ils le sachent!). 
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Exemple: 


Imaginons deux enfants, l'un et l'autre gourmands, en présence d'un gâteau homogène, parfaitement 
divisible (et très bon...). Si la maman fait deux parts, il y aura immanquablement des disputes, chacun 
trouvant plus grosse la part de l'autre. Le seul moyen (hors dictat) d'éviter toute dispute est pour la mère 
d'imposer la règle suivante: l'un des enfants effectue le partage, et l'autre choisit en premier sa part. 
Celui qui coupe ne peut pas raisonner en tenant compte de ses seules préférences, qui le pousseraient à 
se couper une grosse part. Il sait en effet que l'autre pourra choisir sa part. Si donc il coupe une part 
plus grosse que l'autre, il risque de la retrouver dans l'assiette du voisin. Il va donc s'efforcer de couper 
des parts aussi égales que possibles, à ses yeux. Aïnsi, quel que soit le choix de l'autre, il ne s'estimera 
pas maltraité. C'est cette anticipation du choix d'un autre décideur qui constitue l'originalité de la 
théorie de la décision et de la coopération ! 


Définitions: 


D1. La partie de la théorie des jeux qui s'occupe de la détermination des éléments socialement 
préférables (au niveau du groupe plutôt que de l'individu seul en d'autres termes) de l'ensemble des 
issues J est souvent dite "coopérative" ou "coalitionnelle". Elle nécessite que les différentes parties 
puissent communiquer entre elles et. qu'elles soient rationnelles. 


D2. La partie dite, au contraire, "non-coopérative" ou "stratégique" ne s'intéresse pas à la mise en 
oeuvre des solutions préconisées par la théorie des jeux coopératifs qui ont force de loi. Elle suppose 
que les différentes parties ne communiquent pas entre elles ou ne sont pas rationnelles. 


Cette distinction entre jeux coopératifs et jeux non-coopératifs prête souvent à confusion. Essayons de 
la dissiper pour partie. Tout d'abord, cette distinction ne signifie nullement que les comportements que 
nous concevons intuitivement comme "coopératifs", au sens où ils induisent une part de sacrifice de nos 
intérêts propres au profit d'un bien jugé supérieur, ne pourront apparaître que dans le cadre des jeux 
coopératifs, au contraire! Les jeux stratégiques se soucient beaucoup de l'apparition endogène de tels 
comportements. Inversement, les jeux coopératifs sont très attentifs au respect des intérêts des 
individus. C'est là d'ailleurs l'une des difficultés principales qu'il leur faut affronter: si sacrifice 
individuel pour le bien commun il doit y avoir, qui doit se sacrifier ? Et pourquoi tel individu plutôt 
qu'un autre ? 


Une fois défini l'ensemble 1 unanimement considéré comme représentant toutes les issues possibles du 
problème que nous cherchons à résoudre, il nous faut déterminer des critères qui permettent de 
sélectionner le "meilleur" état possible, compte tenu des appréciations diverses et contradictoires dont 1 
fait l'objet par les différents citoyens en présence. 


Nous savons que cette appréciation se mesure au moyen de la fonction d'utilité Z/;, définie sur I et 
prenant ses valeurs dans IR . Ainsi, si le système que nous considérons comporte À/ individus et si 


xei est l'issue sélectionnée, L (x) est le gain accordé par le joueur i à x. 


Remarque: Si un individu i avait le pouvoir d'imposer sa volonté aux autres (quitte, au besoin, à la 
faire passer pour la "volonté générale"), il choisirait tout simplement l'issue x qui maximise LA, (x) 


(c'est-à-dire son gain). 
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2.1. OPTIMUM DE PARETO 


Un premier critère qui vient à l'esprit, et qui est dû au sociologue italien Vilfredo Pareto, est celui de 
l'optimalité qui porte son nom (à ne pas confondre avec la "loi de Pareto" concept complètement 
empirique en économie selon lequel la plupart des répartitions se font dans un rapport 20/80% (cf. 
chapitre de Techniques De Gestion). 


Considérons deux issues x et y, appartenant toutes deux à 1, et supposons que, pour chaque individu i, 
nous ayons la situation suivante: 


Vi,U,(y) 2 U(x) (65.26) 


En d'autres termes, aucun individu ne serait a priori lésé si nous substituions pour chacun l'état y à l'état 
x. Supposons de surcroît, qu'il existe au moins une personne j qui préfère strictement y à x tel que: 


U;(y)>U;(x) (65.27) 


Dans ces conditions, nous ne voyons plus vraiment ce qui devrait retenir le législateur de choisir y 
plutôt que x. 


Définition: Une issue i réalisable qui n'admet aucune "amélioration" est appelée un “optimum de 
Pareto" (O.P.) et est définie rigoureusement par: 


Vielltfi},i%meN U,(j)<U,(i)| (65.28) 


La "pareto-optimalité" est à comprendre comme une condition sine qua non, un "minimum 
minimorum", sans lequel le concept de solution d'un jeu coopératif que nous cherchons à élaborer 
devrait être automatiquement rejeté. 


Remarque: Ce résultat forme rejoint donc ce que nous avions déjà écrit en début de chapitre. C'est- 
à-dire que si dans un jeu, un couple d'issues est tel qu'il est impossible d'améliorer le score de l'un 
des deux joueurs sans diminuer le score de l'autre, nous disons que ces issues sont "pareto- 
optimales" ou "pareto-efficientes". 


3. ÉQUILIBRE DE NASH 


Définition: "L'équilibre de Nash" (ou "équilibre" tout court) décrit donc une issue d'un jeu dans lequel 
aucun joueur n'a intérêt à modifier sa stratégie unilatéralement, compte tenu des stratégies des autres 
joueurs. 


Remarque: Nous avons déjà vu de nombreux exemples avec des équilibres précédemment. 
Soit un jeu à n joueurs, et: 
+ + + - 
s =(5,..,8,) (65.29) 


une combinaison de choix stratégiques de ces n joueurs où 5, est le meilleur choix stratégique du 


joueur i et avec 5, € $,, l'ensemble des stratégies praticables par le joueur i. Soit L, (a 8e) le gain 
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du joueur i lorsque &” est sélectionné. 


Une combinaison de choix stratégiques $’ est un équilibre de Nash si et seulement si: 


UF. CCS PAR à Cr on (65.30) 


pour tout s, dans S$; et tout i. 


Interprétation: Aucun joueur ne peut tirer un bénéfice d'une déviation de 5; , quelle que soit la stratégie 
qu'il choisisse dans son ensemble $. Ainsi, aucun joueur n'a intérêt à dévier, et s; participe à un 
équilibre. 


Remarque: Il peut arriver qu'un optimum de Pareto se confonde avec l'équilibre de Nash mais ce 
n'est pas toujours le cas (donc un équilibre de Nash n'est pas toujours un optimum de Pareto). 


Définition: Quand la stratégie d'un joueur est la meilleure réponse face à toutes les stratégies possibles 
de ses rivaux, nous parlons alors de "stratégie dominante" #; (cette stratégie domine toutes les autres 


stratégies du joueur). L'équilibre de ce jeu est alors appelé "équilibre en stratégie dominante". 


In extenso, une stratégie est "dominée" si elle procure au joueur des gains toujours inférieurs à ceux 
associés à au moins une autre de ses stratégies. 


Remarque: Nous pouvons nous interroger si dans un jeu non-coopératif l'équilibre de Nash (s'il 
existe) n'est pas tel qu'il amène de toute façon à une coopération implicite? Au fait, ce n'est pas le 
cas (et c'est un résultat très important) comme nous le verrons dans l'étude du fameux dilemme du 
prisonnier un jeu dont l'équilibre de Nash est assuré par des choix individualistes et rationnels tels 
qu'ils soient non coopératifs !!! Ce sera donc un exemple extrêmement important dans le cadre de 
l'économie de marché. 


Méthode: Une manière de déterminer les équilibres d'un jeu consiste à éliminer en premier toutes les 
stratégies dominées puis à rechercher les équilibres dans le jeu ainsi réduit. 


Exemple: 


En éliminant les stratégies dominées (mêmes faiblement dominées) pour chacun des joueurs, nous 
tombons sur (6 , 4) qui est comme nous le voyons un équilibre de Nash (car c'est celle où aucun joueur 
n'a intérêt à changer de stratégie). 


Tableau: 65.13 - Matrice avec équilibre de Nash 


Le jeu suivant par contre, ne comporte pas d'équilibre de Nash. Effectivement, quel que soit le couple 
de stratégies envisagé, l'un des joueurs obtient toujours plus en modifiant son choix. 
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1,0 


0,1 1,0 
Tableau: 65.14 - Matrice sans équilibre de Nash 


Toutefois, pour le moment il apparaît pour le moins prématuré de prescrire aux joueurs le choix d'un 
équilibre; certes s'il est choisi, la situation a une certaine stabilité, mais il reste trois difficultés: 


1. Nous ne sommes pas assurés de l'existence d'un couple de tactiques en équilibre (conjonction des 
tactiques prudentes) 


2. Même en cas d'existence, nous ne sommes pas assurés de l'unicité d'un couple de tactiques en 
équilibre 


3. Même en cas d'existence et d'unicité, nous pouvons prescrire un autre choix (!!!!) 
4. UTILITÉ ESPÉRÉE 


Soit le jeu non-coopératif à somme nulle suivant: 


0 2 


Es _ | 


Tableau: 65.15 - Demi-matrice d'un jeu non-coopératif à somme nulle 


qui ne comporte pas d'équilibre comme nous l'avons vu plus haut. Dans ce genre de jeu, toute 
recommandation à un joueur de choisir une tactique plutôt qu'une autre peut lui nuire, dès lors que 
l'adversaire en est informé, ou peut deviner cette recommandation. 


Effectivement, si J, pense que 7, va choisir sa tactique 1, il a intérêt à choisir sa tactique 2 (utilité 3 
contre 0). Mais alors, si J, pense que J, va choisir sa tactique 2, il a intérêt à choisir sa tactique 2 
(perte 1 au lieu de 3). Alors, si J, pense que 7, va choisir sa tactique 2, il a intérêt à choisir sa tactique 
1 (utilité 2 contre 1). Mais alors, si J, pense que J, va choisir sa tactique 1, il a intérêt à choisir sa 
tactique 1 (perte 0 au lieu de 3). Et la boucle est bouclée…. 


En définitive, la chose qui importe avant tout dans un jeu non-coopératif c'est que la tactique d'un 
joueur ne puisse pas être devinée par son adversaire. Comme tout raisonnement pourrait être percé à 
jour, les adversaires étant parfaitement rationnels et informés, la seule solution imaginable est de s'en 
remettre à un processus précis, appuyé sur des probabilités affectées aux diverses tactiques possibles. 
Ainsi, comme nous l'avons défini plus haut, le jeu comporte un aspect à "stratégie mixte”. 


Naturellement, le résultat obtenu par le joueur ne peut pas être garanti de façon certaine, puisque le 
processus de choix de la décision fait intervenir des probabilités. Comparer des résultats revient donc à 
comparer des loteries. Nous imaginons la situation d'un amiral devant répondre devant un tribunal 
militaire de la perte d'un navire, et expliquant qu'il a pris sa décision en jouant aux dés (en supposant 
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une bataille sans équilibre de Nash et non-coopérative): même si parfaitement conforme aux 
prescriptions de la théorie des jeux, cette explication aura peine à convaincre! 


4.1. CRITÈRE DE HURWITZ 


Il nous faut donc introduire une utilité probabiliste (appelée aussi parfois le "critère de Hurwitz"). 
Considérons un jeu à deux stratégies propres $,,$, et notons l'utilité respective: 


UTSP,S (1 PF] (65.31) 


qui permet d'obtenir £, avec une probabilité P et £, avec une probabilité 1-P. Cette relation s'écrit 


avec des notations évidentes (cf. chapitre de Probabilités): 
E=U[S2,S,(-2)]= 2 U(S)+(1-P)U(S,) (65.32) 


avec E que nous appellerons "l'utilité espérée" (en similitude avec le concept d'espérance vu dans le 
chapitre de Statistiques) ou "espérance de gain anticipée”. 


Nous pouvons déjà noter que, s'il existe une telle utilité (espérée), il en existe une infinité à un arbitraire 
près, obtenues à partir de U par une transformation affine strictement croissante, c'est-à-dire une 
relation de la forme: 


F = aU+b avec ga >0 (65.33) 
En effet, la relation: 
UISP,S,(-P)]=P'U(S)+(1-PIU(S,) (65.34) 
entraîne pour 4 >0: 
aU[S.P,$,(1-P)]= P'aU(S)+(1-PjaU(S,) (65.35) 
qui, additionnée terme à terme à la relation évidente (nécessaire): 
b= Pb+(l- Pb (65.36) 


conduit bien à: 


PIS2,.S.Q-P)]=P:V(S)+(1-P)F7(S;) (65.37 


Cela prouve entre autres ce que nous avions énoncé plus haut: nous pouvons toujours choisir une 
fonction d'utilité (et ce même dans une optique de stratégie pure où P = 0 ou P = 1) telle que les deltas 
des gains de joueurs dans les jeux à somme nulle soient égaux et opposés. 


Remarque: L'utilité espérée (ou "critère de Hurwitz") se confond avec le critère du maximin lorsque 
P = 0 et du maximax lorsque P = 1 (voir plus loin). 


Voyons de suite un exemple en considérant le jeu à somme nulle suivant: 
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Tableau: 65.16 - Matrice d'un jeu à somme nulle 


Nous voyons dans ce jeu qu'il n'y a pas d'équilibre de Nash (et donc pas de col). Effectivement, si 7, 
pense que J; va décider &,, il a intérêt à choisir à, (perte de 2 au lieu de 5). Mais J, comprenant cela, 
va changer pour 4, (gain de 4 au lieu de 2). Mais 7, devinant cela va changer pour à, (perte de 3 au 
lieu de 4), et J, qui a tout compris va revenir à &, (gain de 5 au lieu de 3). 


Considérons maintenant que le joueur J, va choisir un nombre compris entre 0 et 1, soit x, et prendra 
les décisions 4, avec la probabilité x et 4, avec la probabilité 1- x. De même, le joueur 7, va choisir un 
nombre compris entre 0 et 1, soit y, et prendra les décisions à, avec la probabilité y et à, avec la 
probabilité 1- y. 


Les résultats de ces décisions conjointes sont alors: 


- 5, résultant de la conjonction de 4,,, obtenu avec la probabilité xy (les décisions des deux joueurs 
étant indépendantes !) 


- 2, obtenu avec la probabilité x(1- y) 

- 3, obtenu avec la probabilité y(1- x) 

- 4, obtenu avec la probabilité (1-x)(1- y) 
L'espérance de J, est donc: 


E(J)=5Sx+2x(1-y)+3y(1-x)+4(1-x)(1-y)=x(4y-2)+4-y (65.38) 


Remarque: Nous voyons bien que si x=0 (et y=1) alors nous tombons sur le critère du Minimax (le 
gain maximum des stratégies les plus pessimistes) soit E(J + égal à 3. De même si x=1 (et y=1) 


alors nous tombons sur le critère du Maximax (le gain maximum des stratégies les plus optimistes). 


S'il y a équilibre entre les stratégies probabilistes, J, n'aura aucune raison de modifier la valeur de x 
dans l'espoir d'augmenter E(J 1) . Dès lors, la dérivée par rapport à x doit être nulle telle que (maxima): 
dE(S) 1 


Âv-S=)p=ys" (639 
= 772 


Dans ces conditions: 
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E(J) = (65.40) 


Pour examiner ce qui s'offre à J,, dont l'espérance, rappelons-le, sera dans un jeu à somme nulle 
nécessairement opposée à celle de J,, nous écrivons: 


E(J,)=-E(J)=-x(4y-2)-4+y=y(l-4x)-4+2x (65.41) 
En appliquant le même raisonnement (mais implicitement en minima): 


dE(J 
HT 6 (65.42) 
dy 4 


Dans ce cas: 
E(J,) = = (65.43) 


Ainsi, nous avons déterminé les probabilités des stratégies qui maximisent l'espérance des gains de ce 
jeu non-coopératif ! En les adoptants J, est certain d'une espérance au moins égale à 7/2 (puisque J, 


n'a rien à gagner à modifier sa stratégie) et J, est certain d'une espérance au moins égale à -7/2. Le 
nombre 7/2 (valeur absolue) est la "valeur du jeu”. 


Définition: Si la valeur du jeu d'un jeu non-coopératif à stratégie mixte est égale pour les deux joueurs, 
nous disons alors qu'il s'agit d'un "équilibre en stratégie mixte" (aucun des joueurs n'a intérêt à dévier 
unilatéralement). 


Ce résultat est certainement le plus remarquable jusque-là sur ce chapitre, car les jeux non-coopératifs 
sont les plus nombreux sur le marché. 


4.2. CRITÈRE DE LAPLACE 


Le critère de Laplace est un critère qui affecte la même probabilité, en l'absence d'information, pour 
chaque décision (équiprobabilité). Il s'agira de calculer une espérance de gain pour chaque décision 
compte tenu de la probabilité affectée. 


Autrement dit, le critère de Laplace consiste à déterminer pour chaque projet l'espérance mathématique 
en affectant la même probabilité à chaque état de la nature et retenant celui dont l'espérance est la plus 
élevée. 


Voyons de suite un exemple en considérant à nouveau le jeu de somme nulle suivant: 


Tableau: 65.17 - Matrice d'un jeu à somme nulle 
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En appliquant l'équiprobabilité, nous avons le tableau suivant: 


5/2+2/2=3,5,5 0/2+2/2=3.5,2/2+4/2=3 
/2+3/2=4 


3/2+4/2=3.5,5 3/2+4/2=3.5,2/2+4/2=3 
/2+3/2=4 


Tableau: 65.18 - Application des probabilités dans la matrice 


Le jeu devient alors: 


3,2, 4 


3.5 , 4 | 3.9 ; 3 


Tableau: 65.19 - Calcul des espérances 


Dans cet exemple, où l'espérance est toujours égale pour le joueur j, quelle que soit sa stratégie, le 

P P ] gale p J 14 q gl 
joueur 2 choisira la stratégie où l'espérance de sa perte est la plus faible soit à,. Nous avons donc ici un 
équilibre de Nash (sans optimum de Pareto). 


Remarque: Les techniques présentées ci-dessus ne sont pas exhaustives. Les entreprises utilisent 
par exemple beaucoup les études statistiques de R&R (répétabilité & reproductibilité) par attributs 
pour analyser statistiquement avec intervalles de confiance (utilisant le test binomial exact 
démontré dans le chapitre de Statistiques) et sur la base d'un indicateur appelé "Kappa de Cohen" 
(voir mon livre sur Minitab) les décisions de gestionnaires ou d'employés par rapport à celles d'un 
expert de référence. 


5. JEUX ÉVOLUTIONNAIRES 


Les stratégies de l'évolution biologique, comme nous en avons fait mention au début de ce chapitre, 
peuvent être modélisées à l'aide de la théorie des jeux. Dans ce cadre, le biologiste est amené à définir 
des relations remarquables définissant une stratégie d'évolution donnée (dominance, stagnation, 
suicide). 


Définition: Une "stratégie évolutionnaire stable (SES)" (ou "evolutionary stable strategy" ESS) est une 
stratégie adoptée par la majorité et empêchant qu'une population soit envahie par un mutant qui 
recourrait à une stratégie différente. 


Cette stratégie s'écrit sous la forme d'une condition de stabilité telle que soient deux stratégies S,5, de 
deux joueurs nous ayons: 


U(S,,8,) > U(S,,8)| (65.44) 


ou (si cette dernière n'apparaît pas) par la simultanéité des deux stratégies de non-sélection et suicide: 
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U(S,,8,) = U(S,8)le 


+ 


U(S, 52) > U(S2, 5) 


- La première relation signifie qu'en aucun cas un individu n'a à changer de stratégie pour se défendre 
contre une évolution mutante ayant la même stratégie que lui, car toute autre lui serait défavorable. 


- La deuxième relation signifie que quelle que soit la stratégie adoptée contre une stratégie mutante, il y 
aura stagnation. 


- La troisième relation signifie que contre $£,, toute stratégie différente de $, est préférable pour 
contrer $, même. Autrement dit, appliquer une stratégie $, différente de $; est suicidaire (le cas 


contraire ne l'est donc pas!). 
Exemple: 
Voyons un jeu connu Faucons (Hawk) contre Colombes (Dove). 


Ce jeu vise à modéliser les rapports entre individus en compétition pour une ressource rare, c'est-à-dire 
dont le degré d'adaptation va être modifié à la fois par l'obtention de cette ressource et par les violences 
qu'ils subiront ou infligeront pour l'obtenir. 


Dans leurs interactions compétitives, les organismes recourent à deux types de stratégies 
(comportements): la stratégie du faucon et celle de la colombe. Le faucon intensifie le conflit jusqu'à ce 
qu'il soit blessé ou jusqu'à ce que l'autre batte en retraite. La colombe se retire après une première 
démonstration de force si l'adversaire choisit d'intensifier le conflit. Lorsque deux faucons se 
rencontrent, l'un est blessé et l'autre emporte la ressource. Si un faucon et une colombe s'affrontent, le 
faucon s'empare de la ressource sans danger d'être blessé et la colombe n'obtient ni avantage ni 
dommage. Enfin, deux colombes se partagent à part égale la ressource. 


Nous posons également les hypothèses suivantes: 
H1. Les affrontements se déroulent un à un 

H2. La population est infinie 

H3. Les rencontres sont aléatoires 


H4. Les combats sont symétriques (au sens ou ni l'âge, ni la taille, ni l'expérience n'influent sur l'issue 
du combat) 


H5. Il est impossible de savoir avant le début d'un conflit quelle stratégie un animal adoptera. 


Sur la base de ces règles d'interaction (assez loin de la réalité..), il est possible de construire le tableau 
du jeu qui nous permettra de calculer les avantages ou les désavantages des diverses stratégies selon les 
circonstances. 
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Ainsi le tableau de jeu est le suivant: 


(V-C)/2 , (V-Cy2 V,0 
0, V V?2 , V/2 


Tableau: 65.20 - Matrice d'un jeu évolutionnaire 


Comme il s'agit d'un jeu à somme nulle, nous pouvons le simplifier: 


(V-Cy/2 V 
0 V2 


Tableau: 65.21 - Demi-matrice simplifiée du jeu évolutionnaire 


Nous notons ici V l'avantage qu'un organisme retire de l'obtention de la ressource. V désigne non la 
ressource elle-même, mais l'accroissement du degré d'adaptation qu'elle procure à l'organisme qui 
l'obtient. C correspond au coût payé, mise en danger ou blessure, pour acquérir la ressource. 


D'abord explicitons la manière dont il faut lire ce tableau: 


1. Pour la stratégie (D, D) - tout le monde est gentil avec tout le monde - le gain total des deux 
individus est: 


=ÿ (65.46) 


La population restera donc constante (c'est la stagnation). 
Bref, de par leurs comportements les colombes se partagent à l'amiable la valeur de la ressource. 


2. Pour les stratégies (4, D),(D, 4 \ les "colombes" D sont toujours perdantes (elles ne progressent 


pas dans leur évolution). Leur gain est nul alors que les "faucons" auront éliminé le nombre V de 
colombes (d'où le gain). 


3. Pour la stratégie (4, Æ) les "faucons" supportent une perte du type (7° -C’}{2 où C est une 


constante et telle que la somme des gains des faucons est normalement inférieure ou égale à V. 
Autrement dit: 


w-c) (w-0c) 
2 2 


=Y-C£<F (65.47) 


Bref, lorsqu'un faucon en affronte un autre, il obtient en moyenne une fois sur deux la valeur de la 
ressource diminuée du prix encouru pour l'obtenir. 
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Remarque: Ce jeu peut être vu comme un jeu de guerre entre deux joueurs. l'interprétation des 
résultats est dès lors plus que pertinente. 


Nous devons maintenant considérer deux stratégies: 

1. L'étude du jeu de manière globale en stratégie pure (sans probabilités donc) 

2. L'étude du jeu de manière globale en stratégie mixte (faisant intervenir les probabilités) 
Commençons par la première en considérant 3 cas de figure: 


F<CF=C,72>C (65.48) 


- Si > C (avantage plus élevé que le coût de la stratégie), en choisissant (A À | (qui est dès lors 


l'équilibre de Nash strict du jeu) nous pouvons observer que le jeu sera du type évolutionnaire stable 

(SES). Effectivement, nous retrouvons la relation: 

UC) 
è 


ju.» - >[U(D,H)=0] (6549) 


correspondant bien à: 
U(S,,8,) > U(S,,8) (65.50) 


et nous pouvons aussi observer qu'il existe aussi une stratégie faiblement dominante (pas de sélection 
naturelle) dans: 


F 
jue.D)-r>[ue.n-E] css 
correspondant bien à: 
U(S,82) > U(S,,5) (65.52) 


Mais celle-ci ne sera pas adoptée puisque moins forte que l'équilibre de Nash. 


- Si = C (avantage égal au coût), le jeu est aussi du type SES. Effectivement, (H, H) devient une 
stratégie faiblement dominante: 


[U(H,H)=0]=[U(D,H)=0] (65.53 


correspondant bien à (5,8) = U(S,,8) et il n'y a dès lors pas d'évolution et nous pouvons aussi 
observer qu'il y a aussi: 


ue.D-n[uo»-2] «3 


correspondant à: 
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U(S,S)> U(S,S) (65.55) 


Puisque nous avons simultanément: 
U(S,,8,) = U(S,,5) et U(S,5,) > U(S,,$) (65.56) 
lorsque ÿ = € le jeu est une SES. 


- Si <C (avantage inférieur au coût), ni H, ni D ne sont des stratégies dominantes et nous n'avons 
pas de SES: 


jueo.#)-op> [um - TT] 65 
et: 
(ue. D) => [une] ss 


ces deux dernières relations correspondant toutes 2 à: 
U(S,,52) > US, 83) (65.59) 


C'est plutôt embêtant.. c'est une sorte de suicide collectif. 


Remarque: Ces deux dernières relations nous amènent à observer que les faucons ne voudront pas 
forcément révéler aux autres faucons leur stratégie de prédateurs de colombes, puisque: toute 
stratégie vaut mieux être contrée par une autre stratégie plutôt que par elle-même. Ils préfèrent 
peut-être discuter entre eux ce qui amène au fait que le jeu est dès lors coopératif. 


Cherchons maintenant à l'aide de l'étude en stratégie mixte ce que nous pourrions faire pour amener la 
dernière configuration précédente à un ESS (donc relativement à la dernière configuration ÿ < € afin 
de voir de plus près ce que nous pouvons faire pour éviter cela): 


Nous considérons une population d'individus qui jouent donc une stratégie mixte que nous noterons 
pour chacun: 


o(P,1-P) (65.60) 
avec P = P(A) et: 
1-P=P(D) (65.61) 
Si P =] (stratégie pure), nous aurons dès lors: 
o(P.1-P)=0{10)=0, (65.62) 


Reprenons maintenant l'étude des trois cas de figure: 
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F<CF=C,72>C (65.63) 


1.SiF > C avec «æ, et 0 £ P<1 nous avons toujours: 
U(Oy. On) >U(O,O%) (65.64) 


en d'autres termes, la stratégie sera toujours du type évolutionnaire stable (SES) si «,, est une stratégie 
pure et ce même si & peut varier et s'approcher de «7. 


2. Si} =C avec &, et 0 £ P< 1 nous avons toujours: 


U(Oy Ou) = U(S,0x) et U(ay,0) > U(O, 0) = (65.65) 


en d'autres termes, la stratégie sera toujours du type non-sélective si «,, est une stratégie pure et ce 


même si & peut varier et s'approcher de «,. 


3. SiF <C et 0 <P <1, nous laissons tomber «,, pour ne nous intéresser qu'à la généralisation 


g(?P,1-P). Nous avons alors: 


U(o,D)\>U(D,D) (65.66) 


Effectivement: 
[u(e:n) = PF +(1 -P)= = (1 +? > ju.) = 4 (65.67) 
De même: 
U(o,H)>U(A,H) (65.68) 
Effectivement: 
U(o.H)-= PE CE, (i-P)0- POI > [U(A,H) - © (65.69) 


Et nous aimerions arriver à une SES en stratégie mixte. Cela est-il possible ? 


Dans le cadre d'une stratégie mixte, nous avons démontré lors de l'étude d'un jeu à somme nulle que 
l'équilibre mixte était donné par: 


E(J,) = -E(J;) (65.70) 


Il est donc assez évident que pour un jeu qui n'est pas à somme nulle, nous ayons l'équilibre mixte qui 
soit donné par: 


E(J)=ÆE(Z) (65.70 
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Dès lors, cherchons la relation entre P, C, V telle que cet équilibre soit atteint: 


E(J,) = E(J,) 
a 


E(H) = E(D) 
. (65.72) 


U(H,0)=U(D,o) & U(S.8,) = U(S,,S) 
————_———————_—————— >’ 
P'U(4,H)+(1- PU(A,D) = P:U(D,H)+(1- P} U(D, D) 


En connaissant les utilités: 
F-C 
P: ( ; ) + (él - PÿY = P'0+ fl Be (65.73) 


d'où nous tirons que l'équilibre en stratégie mixte est donné par: 


À quoi cette stratégie va-t-elle mener ? Eh bien simplement dans le cas suicidaire cette stratégie mixte 
est la meilleure réponse contre elle-même (c'est ce qu'il est possible de faire de mieux dans ce qu'il y de 
pire) car elle conduit aux deux conditions qui satisfont une SES. 


6. ÉQUILIBRE DE COURNOT 


Imaginons deux propriétaires M et N, et deux sources dont les qualités sont identiques et qui se trouvent 
placées de manière à alimenter concurremment le même marché de sorte que la quantité totale livrée 
aux commerces se compose de la somme des quantités m, n livrées par chacun des propriétaires à un 
prix qui est nécessairement le même pour chacun d'eux puisqu'il n'y a aucun motif de préférer une 
source à l'autre. Ce prix se trouve déterminé quand la somme des quantités m, n l'est elle-même, à cause 
de la liaison qui existe entre le prix et la demande. Admettons que le propriétaire N ait fixé 
arbitrairement, sans égard au prix, la quantité n qu'il entend livrer: alors le propriétaire M fixera le prix 
de vente, c'est-à-dire la production totale (composée de la somme des quantités m et n), c'est-à-dire 
encore sa production m de manière à se procurer le plus grand revenu possible. 


Dans la pratique, une suite de tâtonnements et d'oscillations amènera les deux propriétaires à cette 
position d'équilibre, et la théorie montre que cet équilibre est stable: c'est-à-dire que si l'un ou l'autre des 
propriétaires, trompé sur ses intérêts véritables, vient à s'en écarter momentanément, il y sera ramené 
par une suite d'oscillations du genre de celles qui avaient primitivement abouti à constituer l'équilibre. 


Nous allons mettre en place une situation de jeu à deux personnes. Nous poserons que le prix P est une 
fonction affine de la quantité totale Q produite: 


P(Q) = P(m+n) = @m+n) (65.76) 
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où & est une constante de normalisation des unités. 


Nous supposerons égaux et fixes les coûts marginaux de production, représentés par le nombre €, et 


nuls les coûts fixes, en sorte que le coût de production s'écrive respectivement £'&'## et c'&'x# pour 
les deux sources. 


Le modèle de Cournot pose que les deux entreprises fixent les quantités qu'elles produisent 
simultanément, ou, à tout le moins dans l'ignorance mutuelle de la tactique de l'autre. 


Pour reconnaître un jeu sous forme normale, il ne nous reste plus qu'à identifier le gain retiré par 
chacun des adversaires pour tout couple (#,#) de tactique afin de pouvoir, si on le désire, construire la 


matrice des gains. 
Le profit de M est: 

nn) = mA P(m+ax)-c]= MAamtx)-c] (65.77) 
et celui de N: 

7,2) = HP + »)-c]= x[@m + x) —c] (65.78) 


La recherche d'un équilibre de Nash conduit chaque entreprise à choisir sa production pour maximiser 
son profit et minimiser ses coûts de stockage (voir modèle de Wilson dans le chapitre de Techniques de 
Gestion), la production de son partenaire étant supposée connue. 


Dans ce but, on annule la dérivée des deux fonctions précédentes: 


à 

Tu O=20m+an-c=0 

dre _ 
de (65.79) 
HT =0=am+2an-c=0 

dx 


Système dont la résolution conduit très facilement à la détermination de: 


(resterait à vérifier que ce sont bien des maximums, en contrôlant les dérivées de deuxième ordre et 
non des minimums). La situation d'équilibre du duopole intervient donc lorsque chacune des deux 
firmes produit un tiers du marché potentiel (son profit est alors maximum). 


Le prix de vente dans le cadre d'un équilibre de Nash serait alors: 


2 
—c 
3 


(65.81) 


P(Q) = ain +n)= 


Soit, une valeur inférieure au coût marginal ce qui ne présage évidemment rien de bon! Il vaudrait donc 
mieux que le prix ne soit pas une fonction affine de la quantité... 


De ce dernier résultat nous déduisons que le profit de chaque entreprise sera donné par: 
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mc 
Foy (,n) = —- — 
3 Ce A9 
(65.82) 
#-C 
Fu (2, H) = _—. 


et est in extenso négatif pour les deux (en cause le modèle de relation supposée affine). 


Ces calculs sont à rapprocher du raisonnement purement économique, pour lequel chaque entreprise 
aimerait être seule, en monopole sur le marché. Le profit de l'entreprise M en situation de monopole 
serait: 


rm, 0) = mcm -c]= am -mce (65.83) 


ce qui met en évidence le maximum, atteint pour (on cherche où la dérivée s'annule): 
Les =. 
FR = —— (65.84) 
2 


Ainsi, on voit très bien que la quantité produite en cas de monopole est plus grande qu'en cas de 
duopole (logique!) et que le profit ainsi que les prix sont plus élevés. 


Cependant avec notre modèle affine, même si l'entreprise M est seule, son profit sera négatif... 


L'idée serait maintenant, si l'on revient à nos deux entreprises, qu'un accord soit établi (cas appelé 
"entente oligopole" contre la concurrence. ce qui est interdit par la loi!), qui leur partage ce profit 
majoré. La parfaite symétrie des situations conduirait au partage par moitiés. Mais la difficulté vient du 
fait que la décision de produire: 


n'est pas la meilleure réponse car elle incite à trahir l'accord avec l'autre. Ainsi, le meilleur équilibre est 
celui de Nash qui impose: 


Lors de la mise au point d'une entente ou d'un cartel, on peut distinguer plusieurs niveaux qui 
dépendent du degré de précision des règles fixées par l'ensemble des entreprises. 


Le premier cas est celui qu'on peut appeler "l'entente parfaite"; c'est l'entente qui permet de maximiser 
le profit total des entreprises concernées. Une condition mathématique élémentaire est que toutes les 
entreprises doivent fonctionner avec le même coût marginal. En effet, la maximisation du profit total 
d'un ensemble d'entreprises s'écrit de la manière suivante: 


L] 
Mr (Dead) =Q'PO)-Ÿ cg (65.87) 


i=] 


où rappelons-le : 
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* 
Q = br (65.88) 


il 


Ce profit est maximum quand toutes les dérivées partielles d'ordre 1 sont nulles et maximales (condition 
dites du "premier ordre"). Soit: 


La partie de gauche de la deuxième relation exprime la variation de recette totale provoquée par une 
petite variation de la quantité produite par le producteur i, et la partie droite exprime la variation de 
coût engendrée par la même variation de g, (coût marginal du producteur i). La recette marginale 


provoquée par une variation donnée de production q est la même, quel que soit le producteur qui a 
modifié sa production. En effet, l'influence d'une production additionnelle sur l'offre totale et sur le prix 
est identique, que cette production additionnelle vienne d'un producteur ou d'un autre. 


Mais comme on l'a vu dans le duopole de Carnot, ce type d'égalité admet un profit total maximum à 
condition que toutes les entreprises de l'entente aient leur coût marginal au même niveau, 
correspondant à la recette marginale du marché. Cette condition d'égalité n'est certainement pas une 
condition facile à remplir dans la réalité des ententes. 


7. CHAÎNES DE MARKOV 


Comme nous l'avons mentionné dans le chapitre de Probabilités, les chaînes de Markov sont aussi 
utilisées dans le domaine des techniques de décision. Nous disons alors que nous faisons une "analyse 
de Markov" (dénomination que l'on retrouve dans la norme ISO 31010). Le cas d'utilisation le plus 
fréquent des chaînes de Markov dans l'industrie est le milieu de la pharma-économie (analyse des coûts 
de traitements des malades) qui passe avant, d'après notre expérience, le domaine de la finance et de 
l'ingénierie. 


Par exemple, la chaîne de Markov simple suivante relative à un symptôme particulier, a une étape dite 
"état absorbant" connue par tous dont il n'est pas possible de réchapper à ce jour...: 
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60% 


0 
BONNE SANTÉ di 


10% 40% 


Figure: 65.11 - Chaîne de Markov avec état absorbant 


Dont voici la chaîne de Markov décomposée sur 20 cycles comme le présente traditionnellement le 
domaine médical (cela suppose que les probabilités ne changent pas au cours du temps...): 
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MALADE Somme=100%e : 
1406+1206=-26%6 Survivants=75% 
is Espérance de vie=2.65 ans 
60% 26%6=15.6% 40% 26%=10 4% 
MALADE MORT Somme=]100%% 
séiet da 403% Espérance de vie=3 247 ans 
Somme=100% 
Espérance de vie=5 ans 


Figure: 65.12 - Chaîne de Markov avec cycles 


Évidemment il est possible d'effectuer le même calcul directement sous forme matricielle. à nouveau 
la matrice de transition (matrice stochastique) est simple à identifier. Il s'agit de (cf. chapitre de 
Probabilités): 


Pu 212 23 0.7 02 OI 
P=|pn P2 P3|=| 0 06 04! (65.90) 
Pa Pa Pz û 0 1 


Le vecteur de probabilités initiales p(0) vaut bien évidemment dans les cas les plus courants de 
maladie: 
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1 


P(O)=|0! (65.91) 
0 


À chaque fois que nous multiplions la transposée de la matrice de transition par le vecteur de 
probabilités initiales, nous obtenons donc la probabilité d'être dans un état donné, à un cycle donné!: 


ptr+1= 2" p(r) (65.2) 


Avec la version anglaise de Microsoft Excel 11.8346, la modélisation est assez simple à reproduire: 


EN 
3] 
4 
15 | 
6 pQ) p() PQ) pPG) PA) P6) PG6) PC 
1.00 0.70 049 0.34 0.24 0.17 0.12 0.08 
18. 0.00 0.20, 0.26, 0.25 0.22 0.18 0.14) 0.11 
EI 0.00 0.10 0.25, 0.40 0.54 0.65 0.74 0.81 
LD /Espérance de vie: 1.00 0.90 075 0.60 0.46 0.35 0.26 0.19 


.11/Somme espérance de vie: 1.00 190 2.65 3.25 3.71 406 432 4.51 


p (0) p (1) p (2) 
l =MMULT($B$2:FD$4B7B9) =MMULT($B$2:$D$4.C7:C9) 
0 =MMULT($B$2-$D$4B7B9) =MMULT($B$2:$D$4:C7:C9) 
(el =MMULT($B$2:FD$4B7B9) =MMULT($B$2:$D$4.C7:C9) 
10/Espéranc—-B7+B8 —=C7+C8 =D7+D8 
11 Somme e=B10 =B11+C10 =C11+D10 


Figure: 65.14 - Calculs explicites des vecteurs 


Si nous continuons ainsi jusqu'au 20ème cycle: 
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GS PAT pas pAY pe | 
0.00 0.00 0.00 0.00 0.00 
0.01 0.00 0.00 0.00 0.00 
0.99 0.99 1.00 1.00 1.00 
0.01 0.01 0.00 0.00 0.00 


4.38] 4.38 4.39! 4.33 4.39, 
Figure: 65.15 - Suite (...) 


Il est très courant dans les entreprises de synthétiser l'évolution sous forme graphique (plus parlant pour 
la direction.….): 


ANALYSE PROBABILISTE MARKOVIENNE 
100% 


90% 
80% 
70% 
60% 
50% 
40% 
30% 
20% 
10% 

0% 


12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 


—— Bonne santé —=— Malade Mort 


Figure: 65.16 - Évolution de la cohorte 


Nous voyons donc que l'état "mort" est bien un état absorbant car toute la probabilité y converge 
(malheureusement..). Nous voyons également que l'espérance de vie totale est de 4.99 cycles. Si nous 
assimilons un cycle à une année, alors l'espérance de vie est 4.99 années. Nous voyons immédiatement 
que la mesure stationnaire de la chaîne (cf. chapitre de Probabilités) est donc: 


0 
xæ=10| (65.93) 
1 
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Notes personnelles: 
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66. ÉCONOMIE 


LL. que nous assimilons sur ce site au domaine englobant la "théorie des biens", la 


"mathématique financière", "l'analyse financière", la "théorie des portefeuilles", a pour objectif de tenter 
de régler, de modéliser et de déterminer les origines, la dynamique et les optimums des prix de biens 
d'échanges ou valeurs "d'agents économiques" (acteurs du marché) en compétition rationnelle selon des 
modèles théoriques statistiques (simplifiés et idéalisés...) de marchés. 


La profession étant majoritairement occupée par des anglo-saxons, nous indiquerons quand cela sera 
nécessaire les termes anglophones d'usage dans le domaine. 


1. CONCEPTS 


Un agent (économique) pour vivre va devoir satisfaire deux types de besoins qui peuvent exiger pour leur 
obtention un ou des échanges: 


1. L'ensemble des "besoins primaires" (finis et dénombrables) ou physiologiques 8, 


2. L'ensemble des "besoins secondaires" (qui ne sont pas vitaux et non nécessairement finis et 
dénombrables) 3, et qui sont subjectivement propres à tout individu (et pas que humain non plus!) 


Remarque: Les besoins secondaires sont très difficiles à définir et à mesurer mais si nous raisonnons en 
des termes ensemblistes, nous pouvons simplement dire qu'est "besoin secondaire" tout ce qui est 
exclu de l'ensemble des besoins primaires 3, . 


Définitions: 


D1. Nous disons qu'un besoin est un "besoin économique" quand il concerne un "bien rare" dont 
l'obtention exige un à plusieurs échanges. Ils s'opposent aux "biens libres" qui sont des biens disponibles à 
tous en abondance, aucun travail (typiquement...) n'étant supposé nécessaire pour en bénéficier. 


La quantité importante de biens nous oblige à les classifier de la manière suivante: 

C1. "Biens matériels" qui ont une réalité physique, palpable et qui peuvent être stockés. 

C2. "Biens intermédiaires" ou "services" dont la production et la consommation sont simultanées. 
C3. "Biens virtuels" qui n'ont qu'une existence mathématique et souvent limitée dans le temps. 


D2. Un "marché" est un système constitué par la rencontre entre une offre et une demande qui porte sur 
un bien donné. 


In extenso nous sommes amenés à énoncer les postulats suivants: 
P1. Le marché est assimilé à un système isolé et isotrope 


P2. Tout agent actif est en compétition 
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Définitions: 


D1. La "microéconomie" est la branche de l'économie qui analyse le comportement économique au niveau 
d'entités individuelles telles qu'un consommateur ou une entreprise. Les consommateurs sont considérés 
comme des offreurs de travail et demandeurs de produits finis. Les firmes sont, quant à elles, des 
demandeuses de travail et des offreuses de produits. 


D2. La "macroéconomie" est l'approche théorique qui étudie l'économie à travers les relations existant 
entre les grands agrégats économiques, le revenu, l'investissement, la consommation, le taux de chômage, 
l'inflation, etc. 


1.1. MCROÉCONOMIE 


Définition: La "valeur d'échange" d'un produit précise pour chaque bien la quantité des autres biens qui 
lui est équivalente. Usuellement, nous considérons que le "prix" (ou "monnaie") P est la forme monétaire 
de la valeur d'échange (nous reviendrons sur le concept de la monnaie plus tard). 


Remarque: Le "prix" est un paramètre auquel s'intéresse l'économie. Tout bien matériel ou ressource 
humaine ainsi qu'une monnaie donnée ont un prix dont il faut déterminer la valeur (relative) soit de 
manière empirique soit avec des modèles mathématiques statistiques complexes. 


Il existe différents types de prix dont voici un échantillon dans l'ordre d'un processus économique 
classique (les définitions sont propres à ce site!): 


D1. Le "prix de fabrication" Æ, d'un bien au temps t est déterminé par la somme des charges directes 
(mais pas forcément constantes...!) €’; de fabrication au même temps t (salaires, matières premières, 
machines, licences, brevets,.….): 


BE) = Y Coté) 


D2. Le "prix d'usine" Æ, d'un bien au temps t est la somme du prix de fabrication augmenté des charges 
indirectes €’, au même temps t (taxes, impôts, frais administratifs, frais de stockage, publicitaires, etc.). 


Afin de pouvoir modéliser un tant soit peu ce prix de manière théorique, nous allons supposer que le 
marché est à "flux tendu" ou à l'équilibre si vous préférez (nous verrons plus loin qu'il s'agit implicitement 
de la loi de Say). En d'autres termes, les biens sont fabriqués directement en fonction de la demande, sans 
stockage et sans intervalle de temps entre la mise sur le marché et la vente (c'est une approximation 
grossière mais nous y sommes contraints). Dès lors: 


F6) = BE + Cr) 


D3. Le "prix de vente net" Æ,, d'un bien au temps t (ou vu de l'acheteur: le "prix d'achat net" P,,) est le 


prix d'usine au même temps t augmenté de la "marge sécuritaire" (appelée aussi "bénéfice brut" ou encore 
ou "marge bénéficiaire") 3, de l'usine tel que: 


Fur) = EC) + 8, (€) 
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Remarque: Ce bénéfice brut sera investi dans de multiples domaines par le fabricant (recherche et 
développement, redistribution aux investisseurs, etc.) et le solde doit permettre de se protéger contre 
les différentes fluctuations directes du marché, c'est-à-dire: les salaires, les taxes, les prix des matières 
premières. 


Nous pouvons alors envisager deux cas de figure: 


1. Le bénéfice brut est plus grand que la somme des charges générales et charges non prévues (il y aura 
donc un bénéfice net) 


2. Le bénéfice brut est plus petit que les charges générales (il y aura donc un déficit ou perte nette) 
De ce qui a été défini précédemment il découle trivialement que: 


D4. Le "bénéfice net" 8, est donné par la partie de la marge sécuritaire qui était prévue pour une période 


et qui finalement n'a pas été utilisée par les charges imprévues €”, durant cette période telle que: 


B,=B,-C, 


Remarque: Si les ventes sont supérieures aux prévisions et que des quotes-parts de charges générales 
et imprévues ont été comptées aux clients, nous parlons alors pour ce supplément imprévu de "boni de 
suractivité" ce qui augmente bien évidemment le bénéfice net prévu. Dans le cas contraire, nous 


parlons de "coût d'inactivité partielle", ce qui diminue bien évidemment le bénéfice net espéré. 


D5. Le "prix d'appel" P,, au temps t est le prix d'usine multiplié par un facteur F., sentimental et 


artistique (mode, ragots, raisons subjectives, etc.) appelé aussi parfois "indice I.G.P." (pour "indice gros 
pipeau...). Ce facteur peut être quantifié statistiquement à partir de l'unicité du bien, de la durée 
d'existence de celui-ci, du nombre d'acheteurs potentiels et ceci tant que personne n'intervient de manière 
à en modifier l'original après sa fabrication. Nous avons dès lors: 


Pap (€) = Fu) Æ@) 


D6. Le "prix de vente brut" Æ,, au temps t ou vu de l'acheteur le "prix d'achat brut" P,, est le prix d'appel 


augmenté de la marge bénéficiaire du vendeur (intermédiaire entre l'usine et l'acheteur) plus les frais 
généraux de vente Æ..La marge du vendeur peut-être incluse dans un premier temps dans les charges 


directes mais les frais généraux ne sont pas déterministes mis à part dans un marché à flux tendu où il n'y 
en a pas et comme nous en avons fait l'hypothèse, nous avons: 


En) = Pyp(E) + B, (6) + FC) © Pa (0) + B, (€) 


EL 


Remarque: Le prix d'achat brut est aussi parfois appelé "prix catalogue”. 
D7. Le "prix de revient" Æ, au temps t est le prix de vente brut (ou d'achat selon le point de vue) diminué 


des différentes déductions D (étant une valeur négative) possibles ou obligatoires faites par le vendeur tel 
que: 
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PR (0) = Em) + D(E) (66.7) 


Les agents du marché d'échange de biens admettent parfois une réduction sur le prix catalogue. Les 
réductions n'existent que sous deux formes connues: 


1. La "remise" R qui est une bonification de prix accordée (valeur négative) soit à un agent demandeur qui 
achète un bien par fortes quantités N soit à un détaillant auquel est facturé un article de marque au prix de 
vente imposé par le fabricant (facteur stratégique commercial, promotion). La remise dépend donc du 
temps t et de la quantité N achetée ou commandée. 


2. "L'escompte" ou "ristourne" E qui est une déduction au temps t consentie à l'agent demandeur pour 
paiement au comptant ou pour règlement anticipé ou encore pour paiement à une époque convenue (nous 
y reviendrons formellement lors de notre étude de l'intérêt simple en calcul actuariel plus loin). 


Dans le cas le plus général qui soit nous parlerons à un temps t donné de "prix d'exercice" Æ (ou "prix 
facturé") auquel le bien peut être acheté ou vendu tel que: 


Bgiti= RIENI+E(EI+N 4 Fogléi] D Cpiti+S Crléi+B, (éi+Æglti+D(4) (66.8) 


Remarque: L'ensemble des termes de ces expressions prennent généralement leurs valeurs dans IR … 


Les facteurs à prendre en compte lors de l'élaboration d'une politique de prix sont synthétisés de manière 
non exhaustive dans le diagramme suivant: 


Facteurs | Facteurs Sensibilité Importance Stratégie 
externes internes aux prix des du marché des 
consommateurs concurrents 


selon les produits | calcul du marché | agressivité 
et le moment de | potentiel ouvert en matière 
l'achat par un certain de prix 
mveau de prix 


DEMANDE | | 


OBJECTIFS 
aassigner ala 
politique de prix 


ei Contraintes 
| ategie de environnementales 
entreprise (réglementation, 


pratiques du marche.) 


Stratégie de prix 


Evolution tactique 


Figure: 66.1 - Résumé schématique simplifié pour l'élaboration d'une politique de prix 


D1. La "propension à consommer" Æ, est la part du revenu R d'un agent qui est consacrée à la 


consommation d'un montant C (consommation primaire et secondaire): 
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C 
Æ = (66.9) 


R 


D2. La différence entre la dépense de consommation et le revenu est définie comme étant une "épargne" 
alors que les cotisations et prestations sur les revenus représentent des "transferts sociaux": 


ÆE=R—-C (66.10) 


D3. "L'élasticité-revenu" est égale au rapport de la variation de la consommation sur la variation du 
revenu: 


La notion d'élasticité-revenu permet de classer les biens de la manière suivante: 


1. "Biens inférieurs": qui sont les biens de consommation dont l'élasticité par rapport au revenu est est 
négative et donc dont la consommation diminue avec l'augmentation du revenu tel que Æ, < 0 (le pain, la 


farine...) 


2. "Biens supérieurs": qui sont les biens de consommation de luxe dont l'élasticité par rapport au revenu 
est positive et donc dont la consommation augmente avec une augmentation du revenu tel que Æ, > 0 (la 


santé, loisirs,.…) 


3. "Biens normaux": qui sont les biens neutres et dont le coefficient d'élasticité par rapport au revenu est 
un peu différent de O tel que Æ, = 0. 


D4. "L'élasticité-prix" est égale au rapport de la variation de la quantité de demande d'un bien sur la 
variation de son prix et est donnée par: 


Remarque: Une demande est dite "sensible au prix" lorsque le pourcentage de variation de la quantité 
demandée est supérieur au pourcentage de variation de prix. Dans le cas contraire, nous parlons de 
demande "rigide au prix". 


D5. Un "investissement" I est l'opération réalisée par un agent économique dont l'objectif est d'obtenir des 
biens de production en échange. 


D6. La "transaction" T est l'échange d'une quantité de biens à un prix déterminé entre un "vendeur" et un 
acheteur". Elle se conclut sur le marché dont la forme est déterminée par le nombre d'agents 
économiques qui y interviennent ce qui détermine la "concurrence". 


Le tableau ci-dessous présente les différentes formes du marché: 
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multitude | concurrence parfaite oligopole | monopole 
quelques-uns | oligopsone oligopole bilatéral [monopole contrarié 
lun seul monopsone monopsone contrarié monopole bilatéral 


Tableau: 66.1 - Différentes formes du marché de la concurrence 


Une autre typologie des marchés peut être effectuée grâce à deux notions: la notion "concurrentielle" et la 
notion "d'état de la demande" qui se traduisent de la manière suivante: 


marché fermé marché rigide 


stable marché compétitif marché ouvert 


Tableau: 66.2 - Typologie des marchés 


La concurrence est qualifiée de "concurrence pure" (CPP: concurrence pure et parfaite) si elle répond aux 
cinq hypothèses suivantes: 


H1. Atomicité: Acheteurs et vendeurs sont nombreux au point que nul ne peut à lui seul influencer les 
prix. 


H2. Homogénéité (postulat d'homogénéité): Les produits échangés sont identiques et substituables les uns 
aux autres. [ls permettent de satisfaire un même besoin. 


H35. Libre entrée: Il n'existe aucune entrave à l'entrée et à la sortie de nouveaux agents. 
H4. Libre déplacement: Les agents économiques peuvent se déplacer librement. 


H5. Information parfaite: Tout le monde connaît en même temps et gratuitement toutes les quantités 
offertes et demandées par tous les agents aux prix différents. 


Ces hypothèses étant données, revenons-en à nos définitions car nous n'avions pas terminé... 


D7. Les "soldes intermédiaires de gestion" (S.I.G.) sont des parties du résultat global d'une période 
d'activité de marché qui sont significatives pour l'analyste financier. Il en existe de multiples dont les 
définitions découlent d'opérations algébriques élémentaires sur les concepts définis précédemment: 


- La "marge commerciale" qui est la différence entre le produit des ventes de marchandises et le coût 
d'achat des marchandises vendues (la marge commerciale est spécifique aux activités de négoce, c'est- 
à-dire aux entreprises ayant une activité de distribution). 


- La "production de l'exercice" qui est la somme des productions vendues, stockées et immobilisées (la 
production de l'exercice est spécifique aux activités de production, c'est-à-dire aux entreprises ayant une 
activité industrielle). 


- La "marge brute" qui est la différence entre le produit retiré de la vente de l'exercice et les achats 
consommés de matières premières 
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- Le "chiffre d'affaires" qui est la somme des produits des ventes de marchandises et des ventes de biens et 
de services. 


- La "valeur ajoutée" (V.A.) qui est définie comme la différence entre la production de l'exercice et la 
consommation intermédiaire par les agents (le gestionnaire la considère comme la richesse créée résultant 
de l'activité réelle de l'entreprise et la V.A. est comme nous l'avons vu d'importance nationale aussi car elle 
constitue un agrégat). 


- "L'excédent brut d'exploitation", ou E.B.E., est le résultat de l'activité courante de l'entreprise et est 
défini comme étant: 


E.B.E = V.A. + Subventions d'exploitations - Impôts ettaxe - Charges de personnel (66.12) 


- Le "résultat d'exploitation" (R.E.) est l'enrichissement (ou l'appauvrissement) net généré par 
l'exploitation. Il prend en compte l'ensemble des produits et charges d'exploitation, notamment les 
amortissements, provisions, reprises et transferts de charges: 


RE = E.B.E + dotation aux amortissements et provisions + autres produits 
(66.14) 
- autres charges + transferts de charges 


1.1.1. COÛT MOYEN ET MARGINAL 
Introduisons ce sujet directement par un exemple: 


Supposons qu'un cuisinier du dimanche (et économiste) invite ses amis à sa table et se propose de leur 
faire une salade de tomates. Il évalue le travail qu'il aura à faire et il chiffre ce travail en valeur monétaire. 
Il considère qu'une minute de son temps passée à la préparation de la salade correspond à une dépense de 
1.- 


Donc les données sont: 
- Acheter des tomates à 1.- l'unité 
- Préparer la salade en 15 minutes donc 15.- 


Si chacun de ses amis est rassasié avec une seule tomate, préparer son dîner pour 5 amis (lui ne mangeant 
pas) lui coûtera au total: 


Cr= 5.-+15.-=20.- (66.15) 


où contrairement aux calculs de la physique au sens large, l'homogénéisation des unités passe au second 
plan... 


Mathématiquement, la "fonction de coût total" sera de la forme suivante si nous notons q le nombre d'amis 
(dans la pratique, il s'agit souvent d'une fonction polynômiale strictement croissante): 


Crg)=1g+15 (66.16) 


Le "coût moyen" ou "fonction de coût moyen" pour chaque invité est de 20.- divisé par 5 soit 4.-. Ce qui 


correspond à: 
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qui n'est donc pas une fonction nécessairement croissante. 


Remarque: Selon les ouvrages (et auteurs), le coût moyen est noté avec un m minuscule ou M 
majuscule et le coût marginal aussi. 


S'il en invite un sixième, le coût total sera de 21.-. En effet le temps de préparation restera, du moins nous 
le supposerons..., constant. Dans ce cas, le coût marginal du sixième invité est de: 


(21.-)-(20.-)=1.- 
alors que le coût moyen pour l'ensemble des invités est alors de: 
21.-/6=3.5.- 


Nous remarquons donc dans cette situation que le coût moyen baisse indéfiniment tant que le nombre 
d'invités augmente. 


Cet exemple permet d'illustrer les rendements d'échelle et montre que nous avons souvent intérêt à 
augmenter la production pour réduire le coût moyen de production (mais cela ne signifie pas pour autant 
que notre cuisinier du dimanche va apprécier le raisonnement lorsqu'il va arriver à sa limite physique..). 


De plus, il ne s'agit cependant pas d'une règle générale! En effet, si le saladier de notre économiste ne peut 
contenir que 6 tomates, le 7ème invité va l'obliger à préparer un deuxième saladier. Dans ce cas, la 
variation du marginal sera supérieure au coût moyen préalable. 


Il faut aussi savoir que dans la réalité la fonction de coût total est rarement une fonction continue (car il 
faut acheter des machines ou engager du personnel par palier de quantités) et de plus c'est le marché qui 
dicte les quantités à une usine et pas l'inverse. 


Définition: Mathématiquement, le "coût marginal" est défini par la variation de la fonction coût total 
C'r(g), par rapport à la quantité produite q: 


AC 
Cet 
àg 


ou si la quantité est dérivable (de toute façon en économie, même si la quantité n'est pas continue on en 
fait abstraction.…): 


dCr 


dq 


Le coût marginal correspond ainsi au coût de la production d'une unité supplémentaire. En pratique, on 
s'intéresse plutôt au coût d'une série supplémentaire. 


De plus, le lecteur remarquera que comme le coût total est une fonction strictement croissante, le coût 
marginal est aussi une fonction strictement croissante. 
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Remarque: Si le coût marginal augmente quand la quantité augmente, nous disons que les rendements 
sont décroissants. À l'opposé, ceux-ci sont croissants si le coût marginal est décroissant lorsque la 
quantité augmente. En effet, dans l'industrie notamment, on lance plutôt une série supplémentaire 
qu'une unité supplémentaire. 


Démontrons maintenant que si le coût moyen passe par un extremum, le coût marginal lui est égal en ce 
point. Nous appelons cette situation particulière un "optimum technique". 


Rappelons au préalable que si une fonction continue et dérivable f(x) a un minimum (ou un maximum), sa 
dérivée en ce point s'annule (cf. chapitre de Calcul Différentiel Et Intégral). 


Appliquons cela au coût moyen £’,(g}. Mais rappelons au préalable que (cf. chapitre de Calcul 


Différentiel Et Intégral): 


Nous avons donc si la dérivée du coût moyen est nulle: 


dCn = ST) &)- O (66.23) 
dq dg\ q g 


Il s'agit donc de la dérivée du rapport de deux fonctions. Donc: 


dC d 
Ty-cr 
Cr |, _ dg dg _ 5 Cr 
4 d 


D'où nous déduisons: 


Soit: 


Ce qui nous dit déjà que dans cette situation, le coût marginal est égal au coût moyen (nous retrouvons la 
définition de chacun des coûts respectivement à gauche et droite de l'égalité). 


En d'autres termes, là où le coût moyen atteint un optimum (minimum dans le cas qui nous intéresse), alors 
le coût marginal égale le coût moyen. 


Exemple: 


Une usine a calculé que le coût de production de q unités d'un produit peut être modélisé par la fonction 
suivante dans les limites des rendements des machines et de la main d'oeuvre dont elle dispose: 
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Cr(g) = 2'600+2.g+0.001-g7 (66.27) 


Calculons le coût, le coût moyen et le coût marginal de la production de 1'000, 2'000 et 3'000 unités pour 
l'exemple. Nous avons alors les informations suivantes: 


Cr (4) = 2'600 +2. g + 0.001. 4° 


C: 2'600 


Cia) = TA = 240.002 4 


Nous avons alors: 


Quantité | CoûtTotl | Coûtmoyen | Coûtmargnal 
1000 | 5'600 5.60 | 4.00 
2000 | 10'600 5.30 | 6.00 
3000 | 171600 5.87 | 8.00 


Tableau: 66.3 - Différents coûts 


Et pour que le coût moyen soit le plus faible possible, il faut que le coût marginal soit égal au coût moyen: 


ac C 2'600 
dCr@) _Cr@) = +2+0001.z=2+0.002.g (66.29) 
dg q q 


Nous en déduisons: 


me cl 1 612 (66.30) 
0.001 


En injectant cette valeur dans la fonction de coût total, nous en déduisons que le coût moyen minimum 
s'élève à 5.22. 


Les économistes d'entreprises définissent ensuite une fonction de prix indépendante de la fonction de coût 
et en déduisent des recettes. Mais de mon expérience personnelle (qui n'attend que d'être éclairée), c'est 
n'importe quoi! D'abord parce que la fonction de prix est obligatoirement dépendante du coût, 
deuxièmement parce qu'en tant que consultant je n'ai jamais (j'insiste sur le "jamais") vu un économiste 
d'entreprise faire les calculs susmentionnés tellement la réalité est plus complexe. 


Dans la réalité, on fait des simulations de Monte-Carlo (je le sais puisque j'interviens pour des grandes 
multinationales) qui permettent non seulement de travailler en avenir incertain et sur des étendues de 
quantités, mais qui peuvent aussi prendre en compte des fonctions non continues! Pour plus d'informations 
sur la modélisation de Monte-Carlo, le lecteur pourra se référer au chapitre de Méthodes Numériques. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


1.2. MACROÉCONOMIE 


Définition: Les "agrégats" sont des grandeurs synthétiques élaborées par les nations pour leur 
comptabilité nationale et qui mesurent le résultat de l'ensemble de leur économie. Les principaux agrégats 
sont définis par: 


D1. Le "produit intérieur brut" (P.I.B.) qui a pour rôle de mesurer la production nationale (considérée 
comme isolée), c'est-à-dire de l'ensemble des valeurs des biens et services produits au cours d'une période 
donnée (le terme "Brut" indique que la valeur du P.LB n'est pas déduite des différentes taxes existantes sur 
les productions). 


D2. Le "revenu national" (R.N.) qui a pour rôle de mesurer l'ensemble des revenus perçus par les agents 
économiques. 


D3. La "consommation" (C) qui a pour rôle de représenter la valeur des biens et services utilisés pour la 
satisfaction directe des besoins. 


D4. La "formation brute de capital fixe" (F.B.C.F.) qui a pour rôle de représenter les investissements. 


D5. La "valeur ajoutée" (V.A.J.) d'une entreprise qui a pour rôle de représenter la différence entre la 
valeur des biens et services produits par celle-ci avec la valeur des biens et services utilisés pour produire 
ces mêmes biens et services. 


D6. Le "produit national brut" (P.N.B.) qui a pour rôle de mesurer la production nationale (comme le 
P.I.B.) et de prendre en compte les revenus du reste du monde. En d'autres termes, le P.N.B est le P.[.B. 
auquel nous sommons les capitaux en provenance de l'extérieur et auquel on soustrait les capitaux versés à 
l'extérieur. 


Remarque: Inutile de parler du concept d'inflation qui ne veut rien dire et dont nous ne retrouvons de 
définition mathématique rigoureuse nulle part! À ce jour ce terme et le chiffre qui lui est associé ne 
veulent rien dire. 


1.3. MODÈLE DE COBB-DOUGLAS 


En 1928, Charles Cobb et Paul Douglas ont publié une étude dans laquelle apparaissait une modélisation 
de la croissance de l'économie américaine entre 1899 et 1922. Ils y avaient adopté une vue simplifiée de 
l'économie selon laquelle la quantité produite n'est fonction que de la quantité de travail réalisé et du 
montant des capitaux investis. 


Malgré que beaucoup d'autres facteurs affectent les performances économiques, leur modèle s'est avéré 
remarquablement précis. La fonction qu'ils ont employée pour modéliser la production était de la forme: 


P(L,K)= bÉ KIA 
où P est la production totale (la valeur monétaire de tous les biens produits en un an), L la quantité de 


travail (le nombre total d'heures de travail prestées en un an) et K la quantité de capital investi (la valeur 
monétaire de toutes les machines, équipements et bâtiments). 
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Bien que ce modèle ait été appliqué en premier lieu à l'économie, on le retrouve dans de nombreux articles 
scientifiques de biologie ou de ressources humaines. Il nous a semblé pertinent de montrer en détail 
(puisque c'est le but du site) d'où vient cette étrange fonction car le démarche est relativement géniale. 


D'abord, si nous avons une fonction de deux variables P(L,K), la dérivée partielle 4P / 4 indique le taux 
de variation de la production par rapport à la quantité de main d'oeuvre seule. C'est ce que les économistes 
appellent la "production marginale par rapport au travail" ou la "productivité marginale du travail". De 
même la dérivée partielle 4P ; 4€ indique le taux de variation de la production par rapport au capital et 
est appelée la "productivité marginale du capital". 


En ces termes, les hypothèses de Cobb et Douglas (à confronter aux mesures historiques et à adapter à ces 
mêmes mesures au Cas par Cas) s'énoncent comme suit: 


H1. Sans travail L ou sans capital K pas de production 
H2. La productivité marginale du travail est proportionnelle à la quantité produite P par unité de travail L 
H3. La productivité marginale du capital est proportionnelle à la quantité produite P par unité de capital K 


Vu que la production par unité de travail est le rapport P/L, l'hypothèse 2 s'écrit: 


pour une certaine constante &. Au cas où le capital investi K est constant ( # = #5 ), l'équation aux 
dérivées partielles devient une équation différentielle ordinaire: 


dP | 
al £ 
Ce qui nous donne: 


Le do (66.34) 
P £ 


Et donc la résolution de cette équation différentielle donne: 
In(P)= æln(L)+et el Lai), cie M) (66.35) 
D'où: 
P(L, Kp)= ce (Ko)Z® (66.36) 
car comme nous avons fixé K il va de soi que la constante dépend de #5. 


En procédant de même pour l'hypothèse 3: 
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Il vient: 


P(l.Ki= C(L)KË (66.38) 
Donc nous avons au final: 


PL. kn)=C*(K)E 
(66.39) 
Pilp,Ki=KÉC® (I) 
et en identifiant terme à terme, nous avons immédiatement: 


P(L,K)= ceKÊ rx (66.40) 


Observons ce qu'implique cette dernière relation si le capital et le travail sont tous les deux multipliés par 
un facteur m: 


PAL, Mk) = de (mR (le = em t8 RTE LE TE PL K) (66.41) 
Si nous iImposons: 
&+B=1 (66.42) 


alors la production est elle aussi multipliée par le même facteur m. Et nous nous retrouvons dans une 
hypothèse de proportionnalité de la production ce qui semblait cohérent à Cobb et Douglas. Dès lors: 


P(L,K)= ce KITS 7% (66.43) 


Les données économiques exploitées par Cobb et Douglas sont celles de la table ci-dessous publiées par le 
gouvernement des États-Unis d'Amérique: 
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1899 100 100 100 
1900 101 105 107 
1901 112 110 114 
1902 122 117 122 
1903 124 122 131 
1904 122 121 138 
1905 143 125 149 
1906 152 134 163 
1907 151 140 176 
1908 126 123 185 
1909 155 143 198 
1910 159 147 208 
1911 153 148 216 
1912 177 155 226 
1913 184 156 236 
1914 169 152 244 
1915 189 156 236 
1916 225 183 298 
1917 227 198 335 
1918 223 201 366 
1919 218 196 387 
1920 231 194 407 
1921 179 146 417 
1922 240 161 431 


Tableau: 66.4 - Données U.S. en % utilisées par Cobb et Douglas 


Ils prirent délibérément l'année 1899 comme base, c'est-à-dire qu'ils attribuèrent le niveau 100 à chacun 
des facteurs et exprimèrent les valeurs des autres années en pourcentage de cette année-là. 


Pour déterminer les coefficients de Cobb-Douglas, il s'agit de faire une régression linéaire par la méthode 
des moindres carrés (cf. chapitre de Méthodes Numériques). Si nous prenons le logarithme: 


In(P)=imlc®rlers |=ifferig-a ra = n[sx(£ 


sy) 


L 


> LL. L 
ini |] | Inte )#ay+ain( à] 


(66.44) 


et après réarrangement, toujours en utilisant les propriétés des logarithmes (cf. chapitre d'Analyse 


Fonctionnelle): 


In F) = int )+aæin (&) (66.45) 
K K 
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En posant: 
l (&) 1 (F) (66.46) 
xX=in| — =nN| — 00.40 
Kk) ? "(x 


Nous nous retrouvons simplement avec une fonction affine: 


Y="EXx +in(c®) (66.47) 


Il suffit alors d'adapter le tableau, de l'injecter dans un tableur ou logiciel de statistique, pour obtenir (cf. 
chapitre de Méthodes Numériques): 


æz0.75 cz101 (66.48) 
Donc: 
P(L,K)=101K&02 5 (66.49) 
En testant par rapport aux données du tableau il vient: 


Rove (123,185) z 137 
Roto (147,208) = 161 
Ron (194,407) = 235 
Ron (161,431) 207 


(66.50) 


Donc nous voyons que la modèle est. un modèle. avec une certaine marge d'erreur. 
2. MODÈLE MONÉTAIRE 


Pour construire un modèle monétaire nous ferons l'hypothèse que "l'utilité monnaie" peut être définie a 
priori par trois propriétés: 


P1. Unité de compte 
P2. Moyen de paiement (intermédiaire d'échange) 
P3. Réserve de valeur 


Cette démarche de description est cependant insuffisante pour l'analyse mathématique: il faut un système 
explicatif complet, car, ici, nous ne faisons que constater, sans rien de plus. Il faut donc établir le lien entre 
la monnaie et la théorie de la valeur. 


Mise à part la représentation valeur que représente la monnaie, celle-ci dérive son utilité des biens qu'elle 
permet d'obtenir dans l'échange. C'est ce que nous nommons "l'utilité dérivée". 


Notons l'offre de monnaie disponible d'un marché ©,. Elle dépend donc de la quantité totale existante de 
monnaie ©, moins les "encaisses" e conservées par les agents économiques (qui ont échangé des biens 


contre de la monnaie). Nous pouvons alors écrire la relation suivante nommée "offre de monnaie selon 
Walras": 
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0, =0,-e 0, =0, te 


Cette encaisse est aussi celle des ménages d'une certaine manière et est une demande réelle de biens, qui 
peut s'exprimer nécessairement sous forme monétaire. 


Remarque: Si les gens savaient réellement comment le processus de création monétaire moderne 
fonctionne (celui utilisé depuis que la majorité des États à travers le monde autorisent les banques à 
créer de "l'argent dette" - c'est-à-dire de créer de l'argent à partir d'une promesse de remboursement de 
dette) le système ne tiendrait pas longtemps. Par ailleurs, le système contemporain est en réalité 
relativement fragile et vicieux (il va probablement droit vers le mur). 


Des agents de vente, à l'occasion de la vente de leurs biens, désirent a priori encaisser une certaine somme 
de monnaie contre la vente de ces biens, somme notée 2}, et appelée "encaisse de monnaie désirée". 


Nous exprimons cette encaisse de monnaie désirée en "numéraire" et pour ce, nous introduisons alors un 
prix de la monnaie en numéraire. L'encaisse désirée s'écrit alors par rapport à la totalité des encaisses du 
marché. Le numéraire sert lui à exprimer les prix relatifs pour l'équilibre général. Il y a une encaisse 
désirée de la part des agents pour la réalisation de l'équilibre général. Ce sont en fait des biens réels sous 
forme monétaire: 


sp 


où p, est le "prix de la monnaie en numéraire" (facteur variable au cours du temps et qui amène dans un 
marché qui n'est pas à flux tendu à faire de la spéculation). Dans un marché à flux tendu, », sera toujours 
supposé égal à l'unité. Nous pouvons alors écrire pour différents numéraires: 


Pad, = Dr 
il 


Remarque: Dans un marché isotrope à monnaie unique cette relation n'aurait pas besoin d'être écrite. 


L'encaisse désirée peut alors s'exprimer en utilisant la relation: 


Î * 
D,=—) r,2, 
2 À 


Revenons, à ©, mais cette fois-ci vu du côté des entreprises. Elles ont besoin de monnaie pour effectuer 
les paiements et fonctionner (salaires, investissements, etc.) et l'encaisse désirée de l'ensemble de ces 
entreprises est nécessairement dans un cas idéal égale à l'ensemble de la monnaie disponible sur le marché 
tel que: 

2, =: 0, 


puisque les entreprises vendent des biens sur les encaisses des agents (moins les marges) du marché 
économique. 
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Hypothèse: La dernière relation suppose que le prix de vente des marchandises tend à être égal à leur prix 
de revient 


Remarque: Cette relation signifie aussi que toute l'offre est satisfaite uniquement par la demande des 
agents et que l'encaisse précédemment citée n'est constituée que de biens hors entreprises. 


Cela correspond également à une certaine quantité de biens puisqu'il s'agit de proposer des biens pour se 
procurer de la monnaie (vu des entreprises). Nous pouvons donc écrire: 


D, =0, 
| L ; | (66.56) 
D, = > P; D; a 
J=l 4 


Mais comme les biens du marché (en possession des agents économiques) doivent également être 
renouvelés les entreprises ont finalement comme quantité de monnaie totale potentielle disponible sur le 
marché: 


Q, = 2,+2, 
(66.57) 


| # # 
O, ns 2P;D;+2 rb, 
Pa | ÿ-1 il 


La somme entre crochets correspond donc à l'ensemble de la monnaie disponible sur le marché sous forme 
de biens des ménages et des encaisses potentielles sous la restriction de biens ayant un prix de la monnaie 
en numéraire », global identique. C'est restrictif comme modèle mais suffisant dans le cadre de la 


détermination du prix d'un type de bien. 


Nous notons alors par définition: 


Q, = — À] (66.58) 


A, = Sp, + Ÿ D, | (66.59) 
J=l il 
Nous avons donc in extenso: 
A, = p,@, (66.60) 
La première relation encadrée exprime la "théorie quantitative de la monnaie selon Walras". 


Passons à l'examen du modèle qui est fondé sur l'association des trois éléments (dont certains ont déjà été 
énoncés plus haut) suivants: 


- La "loi de Say": Il ne peut y avoir de déséquilibre durable sur les marchés et la loi de l'offre et de la 
demande réalise une régulation spontanée et automatique de l'activité économique 
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- La C.P.P.: La concurrence est pure et parfaite (voir tableau plus haut) 


- La "loi de Walras": La valeur totale des offres étant identique à la valeur totale des demandes, si 
l'équilibre entre offre et demande est réalisé sur n-1 marchés alors il est réalisé sur le n-nième marché. 


Ainsi, l'objectif de Walras est de répondre à la question de savoir s'il existe un système de prix qui assure 
l'équilibre entre l'offre et la demande sur tous les marchés. Cette question est importante, car de sa réponse 
dépend la capacité du marché à assurer l'allocation des ressources de façon efficace. 


Au vu de ce qui précède, le lecteur aura remarqué que le modèle de Walras considère que la monnaie est 
neutre en ce sens que la quantité totale de monnaie en circulation n'exerce d'influence ni sur les prix 
relatifs des produits les uns par rapport aux autres, ni sur le niveau de l'offre et de la demande de produits. 
La monnaie n'est pas souhaitée pour elle-même... 


Remarque: La "parité" est le terme utilisé pour chercher l'équivalence des cours monétaires étrangers 
de différents marchés. Cette parité est dépendante (entre autres) du temps et il est important de 
considérer les variations de celle-ci dans le cadre du marché des biens où la monnaie n'est pas unique 
et le payement non immédiat. 


Nous allons maintenant mettre en évidence l'interdépendance des marchés selon Walras: 


Nous supposons une économie composée de n marchés où nous avons la demande de biens notée x? , et 


l'offre notée  d et où nous avons, enfin, les prix p, (exprimés par rapport à un autre bien) sur la marché i. 


Selon la loi de Say, nous avons (équilibre entre l'offre et la demande sur tous les marchés): 


x* x 
D … "2 Pi 4 
to] 


il 


L'objectif de cette loi est de montrer l'interdépendance des marchés. Pour cela, il faut faire appel à la 
demande excédentaire notée 1” (différence entre l'offre et la demande). Nous avons alors (toujours de 


par la loi de Say): 


x 
XD CR: XD 
X “ZX -% Ÿ nr; =0 


i 
il 


Conclusion: S'il y a un déséquilibre sur un marché i, cela implique qu'il y aura un autre déséquilibre de 
même ampleur sur l'ensemble des autres marchés. C'est une première manière de mettre en évidence 
l'équilibre des marchés par l'intermédiaire de l'équilibre entre l'offre et la demande. 


Remarque: Les variations des prix des monnaies en numéraire n'affectent pas l'équilibre réel. Si tous 
ces prix relatifs varient dans la même proportion, l'équilibre n'est pas modifié (et donc les demandes 
excédentaires ne devraient n'y augmenter ni diminuer). 


Avant de continuer, rappelons qu'une fonction f est homogène de degré r si en multipliant tous ses termes 
par un même facteur k, nous obtenons: 
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f(x) = & f(x) (66.63) 


De cette définition il s'ensuit la propriété intuitive que dans un marché où la demande est supposée 
proportionnelle au prix..., les fonctions de demande sont homogènes de degré 1 telles que: 


Er 7 A 
x; (ap, pp.) _ ŒX; (P1, Pass Pa) (66.64) 


Avec ce que nous avons dit tout à l'heure, nous devrions dès lors avoir une équivalence telle que: 


+1 


LA 
D nx 0 2 Hi +(p,144) = 0 (66.65) 
? 


il 
Démonstration: 


Si tous les prix augmentent de & et qu'il y a un (nous pouvons généraliser à n) nouveau bien sur le marché 
dont le prix augmente de la même valeur et dont la loi de l'offre et de la demande est également 
proportionnelle au prix, alors: 


# x 
D'Cap)x HR (Pr. Epan) © AD PR FAR (P1. Par) 
3 


il nu 
(66.66) 


+1 


= & D p;x? LS EE a p,X si" ( _ (s] 


il il 
OIC.Q.F.D. 


L'équilibre n'est donc pas affecté par la variation des prix monétaires (vous comprenez maintenant que les 
salaires sont un prix numéraire de la valeur monnétaire du travail qui augmente(rait) lui aussi 
proportionnellement aux prix des biens du marché). 


Cette pseudo-démonstration (soyons objectifs.) implique donc que le n + 1ème marché est totalement 
déterminé par les n autres. 


Ici, les relations sont fondées sur des équations. Walras distingue cependant deux procédures pour assurer 
l'équilibre entre offre et demande: 


1. Une méthode algébrique théorique. Mais. nous ne pouvons pas déterminer les besoins des individus à 
l'avance afin de savoir quand il y aura demande et se préparer à construire l'offre. Ce système ne 
fonctionne que si et seulement si les agents économiques sont raisonnables et s'accordent pour attendre 


2. Une méthode empirique qui recherche la solution par des opérations d'essais/erreurs: il y a la présence 
d'une sorte de secrétaire de marché, le "commissaire-priseur". Ce dernier annonce des prix pour chaque 
type de bien qui pourrait exister: les agents économiques réagissent à ce prix, ils offrent et ils demandent 
en fonction du prix. Pour le bien i, il y a p}, nous avons alors 2,0. Nous comparons l'offre et la 
demande. En cas d'égalité, le prix est un prix d'équilibre. En cas de différence, le commissaire-priseur 


recommence la procédure et ainsi de suite jusqu'à ce qu'il y ait équilibre. C'est en gros cette procédure qui 
est utilisée dans les marchés boursiers et que l'on appelle souvent la "main invisible des marchés"!!! 
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Cependant, les équations nous montrent que nous avons besoin du prix de la monnaie en numéraire pour 
mesurer l'offre et la demande et il convient de se rappeler que nous avons considéré la monnaie comme 
une marchandise en quantité donnée fixe car le système est à l'équilibre entre offre et demande. Mais 
justement, les agents ne peuvent pas indéfiniment se répartir la quantité totale de monnaie si leur nombre 
augmente. Dès lors, pour que la demande soit possible, si elle a lieu, il faut être prêt à en injecter (ou à en 
disposer) sur le marché (sinon celui-ci devient immobile ce qui n'est peut-être pas favorable à long 
terme...). Il faut bien sûr aussi être prêt à en retirer et c'est là aussi qu'intervient une instance tel que l'État 
en intervenant dans l'économie pour réguler cette quantité de toutes les manières possibles (par 
l'intermédiaire des impôts par exemple) puisqu'elle agit directement sur les biens disponibles et déjà 
immobiles (achetés). 


Ainsi, selon le modèle de Walras, la quantité de monnaie disponible sur le marché est donc seulement 
fonction du nombre d'agents économiques. Mais dès lors faut-il mettre en place un nouveau modèle pour 
un cadre plus général de demande de monnaie”? 


Au fait, cela n'est pas nécessaire. Nous savons que s'il y a équilibre général pour n biens, il y a équilibre 
général pour n + 1 biens (et par récurrence pour n-1 aussi) ; le dernier marché n'étant autre que celui de la 
monnaie. Le modèle de Walras explique dès lors pourquoi à un certain niveau de quantité de monnaie 
correspond un certain niveau des valeurs numéraires des biens et ce même de la monnaie. 


3. THÉORIE DE L'OFFRE ET DE LA DEMANDE 


C'est le deuxième des cinq modèles cités plus haut. Il nécessitera nécessairement (et cela est prévu!) une 
révision car fortement incomplet. Les idées présentées ci-dessous sont à ce jour à prendre avec des 
pincettes. 


Dans notre société humaine où il existe une monnaie d'échange (de référence) et des biens persiste un 
problème qui consiste en la détermination de la valeur monétaire d'un bien. Pour déterminer celle-ci, il 
faut pouvoir connaître l'évolution de l'offre et de la demande. C'est ce à quoi nous allons nous attarder ici 
en commençant par des modèles simplistes et en complexifiant ceux-ci de manière croissante: 


3.1. THÉORIE DE LA PRÉFÉRENCE 


Avant de se lancer dans un modèle élaboré de l'offre et de la demande, il est nécessaire de cerner ce qui 
motive les agents économiques dans leurs choix de consommation et de modéliser leurs comportements 
sous le principe fondamental de rationalité. 


L'agent économique sera perçu comme un individu unique disposant d'un dont il cherche à tirer le 
maximum de satisfaction. Ses goûts sont subjectifs même s'ils dépendent de certaines caractéristiques 
objectives comme l'âge ou le niveau de culture. Le niveau de satisfaction sera défini à partir d'une fonction 
d'utilité dont nous verrons les principes de base et la maximisation sous contrainte. 


Plusieurs principes fondent l'utilité des biens et conduisent à la notion "d'utilité marginale", concept central 
dans la théorie de la préférence de l'agent économique. D'après Aristote, à l'origine du concept de valeur- 
utilité, l'utilité des biens dérive de la satisfaction des besoins. Condillac énonce que: "la valeur des choses 
est fondée sur l'usage que nous pouvons en faire". Cette idée d'une valeur fondée sur l'utilité, 
fondamentale chez les économistes marginalistes, s'oppose au courant théorique de la valeur-travail fondée 
sur la quantité de travail, directe et indirecte, incorporée dans la fabrication du bien (Adam Smith, Karl 
Marx). 
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Il faut cependant, de préférence, considérer une hypothèse importante dans ce modèle : 
Hypothèse: Il existe une certaine satiété des besoins, mais elle n'est jamais totale. 


Ainsi, pour un bien donné l'utilité marginale de la dernière unité consommée est donc plus faible que celle 
des unités précédentes mais non nulle et toujours positive c'est le "principe de l'utilité marginale 
décroissante" relative à l'unité supplémentaire consommée. 


Ainsi, dans le cadre de la consommation multiple » £ N d'un bien unique d'utilité nominale donnée, 
l'utilité totale Z,. (somme des utilités marginales £/,,(#) ) serait une courbe du type: 


i+l 


Ürin= 2 Ua (x) 
ka 


Una (2) 


Figure: 66.2 - Utilité asymptotique 


et donc l'utilité marginale est du type: 


Ua (x) 


Us (ru) 


A; Hu ? À; 


Figure: 66.3 - Utilité marginale décroissante correspondante 


Ainsi, confronté à un prix donné pour chaque bien, l'agent économique compare ce prix avec les utilités 
marginales qu'il retire successivement de leur consommation. Il en achète tant que leur utilité dépasse le 
prix (surplus lié à cet achat) et cesse d'en acheter dès que l'utilité marginale tombe en dessous du prix du 
bien. Son intérêt est alors d'acheter d'autres produits pour lesquels il existe un surplus positif (utilité 
marginale de ces produits supérieure à leur prix). 


Cet exemple, relatif à un bien, doit être élargi maintenant à un panier de biens pour déterminer l'utilité 
globale de ce panier. 
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Considérons pour cela un agent i dans une économie disposant de ?  N biens. Il peut donc en acheter au 
maximum J. Un panier de consommation possible correspond donc au vecteur de biens x: #, =(#,...,%), 


où les x, représentent les quantités éventuellement nulles achetées par le consommateur. L'utilité de ce 


panier s'écrit U/(#,) et sera supposée additive selon: 
U(%) - 2 Una) (66.67) 


c'est-à-dire la somme des utilités totales relatives aux quantités consommées de chaque bien. 


Considérons maintenant un panier à deux biens, nous pouvons sans trop d'erreur émettre l'hypothèse que 
ces biens peuvent être divisés en fractions x aussi petites que nous voulons d'autres biens/composants. 


Ainsi, grossièrement, nous ne travaillons plus dans M mais dans IR. 


Ainsi, soit un panier de R° d'un agent économique, nous supposerons que celui-ci est tel que sa 
différentielle totale exacte est nulle telle que: 


dU = LUE + ax, =Û (66.68) 
ôz, ôx; 
Le rapport: 
au 
rus = 5 co 
MS x aÙ (66.69 
6x; 


est défini comme le "taux marginal de substitution" (T.M.S.) entre les deux biens élémentaires i, j: quantité 
supplémentaire du bien i qu'il faut fournir à l'agent économique pour compenser exactement une 
diminution d'une unité du bien j. 


Le comportement attribué à l'agent économique est de pouvoir classer tous ces paniers de biens possibles 
(vecteurs) selon une échelle de préférence, sans que celle-ci corresponde nécessairement à une évaluation 
chiffrée. Cette capacité de classement correspond au concept "d'utilité ordinale" (pouvant être ordonnée 
donc) et à l'utilisation d'une relation de préférence, notée & (préféré ou indifférent à) qui vérifie les 
propriétés suivantes: 


- transitivité: #, à %, et #, = #, — %, à *, (cohérence des classements successifs) 
- réflexivité: À, à # 


Cette relation, "préordre" au sens mathématique, est utilisée dans la plupart des présentations actuelles de 
la théorie de la préférence. Ce préordre est complet s'il permet toujours de comparer deux paniers de biens 
dans l'ensemble des I biens. 


Un tel préordre complet permet de définir une relation d'équivalence sur l'ensemble des biens et un ordre 
strict, ainsi que de représenter les préférences à partir de fonctions d'utilité: 
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où nous avons dans l'ordre: (1) #, préféré ou indifféranciable à #, (2) #, est strictement préféré à #, (3) 


, est indifférent à #,. 


Si la fonction U est bien définie par un nombre, elle ne reflète plus une évaluation de l'utilité, mais dès lors 
seulement la possibilité de comparer l'ordre des utilités, relatives à des paniers de biens quelconques. 


La possibilité de hiérarchiser différents paniers de biens de gg? permet de définir des surfaces de niveau 


ZA 


dont l'utilité est constante, appelées "courbes d'indifférence" ou encore "courbes d'iso-utilité". Les 
graphiques suivants donnent bien une représentation de ces courbes dans x? (panier de deux biens) et 


leurs principales propriétés: 


Ainsi, deux paniers tels que 4 - 3 dans gp? se traduisent graphiquement par un réseau de courbes, dont 
chacune est constamment décroissante: 


Figure: 66.4 - Exemple de courbe d'iso-utilité (d'indifférence) 


Pourquoi n'avons-nous pas des droites ou autres choses? La raison en est relativement simple et le 
graphique suivant l'explique trivialement. Considérons l'iso-utilité (l'indifférence): 


Figure: 66.5 - Contre-exemple d'iso-utilité (d'indifférence) 


Ci-dessus, À domine 4. En effet, le panier de biens 5 possède plus de biens x,,x, que le panier 4. Ces 


deux points ne peuvent donc être sur la même courbe d'indifférence et imposent qu'une courbe 
d'indifférence doit être décroissante et que c'est la seule condition (donc ce n'est pas nécessairement une 


droite). 
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Remarque: Si nous supposons que la satisfaction de l'agent économique augmente avec la taille de son 
panier de biens, plus une courbe d'iso-utilité est éloignée de l'origine plus elle correspond à une utilité 
élevée. 


Les courbes d'iso-utilité (d'indifférence) ne peuvent se couper (ne peuvent être sécantes). Effectivement, 
soit les deux courbes d'iso-utilité (d'indifférence) ci-dessous: 


4 U D 


Figure: 66.6 - Autre contre-exemple d'iso-utilité (d'indifférence) 


Les paniers 4 et À sont situés sur la même courbe d'iso-utilité U1 alors que Ë et £* sont, eux, situés sur 


la même courbe U2. Ainsi, nous pouvons écrire que 4. & et 5. €. 
D'après la transitivité des préférences, nous devrions alors avoir 4. £. Or ces deux paniers ne sont pas 
équivalents puisque 4 et £ ne sont pas situés sur la même courbe. Deux courbes d'indifférence ne 


peuvent donc pas se couper. 


Nous sommes donc conscients qu'il existe des relations particulières entre les biens qui vont modifier nos 
attitudes de consommation. C'est le cas notamment des biens complémentaires et des biens de 
substitutions: 


Définitions: 


D1. Deux biens sont dits "biens complémentaires" si la possession de l'un et de l'autre procure une 
satisfaction supérieure à la somme des satisfactions des deux biens s'ils étaient pris isolément (super- 
additivité). Ainsi, il y a complémentarité entre des skis et un forfait sur des remontées mécaniques, entre 
une voiture et de l'essence. Cela peut être interprété par la courbe d'indifférence suivante: 
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Figure: 66.7 - Principe de représentation de biens complémentaires 


Effectivement, pour le couple (voiture, essence) chaque courbe a respectivement un minimum sous lequel 
nous ne pouvons pas descendre afin que le couple conserve son intérêt de consommation en tant que tel (il 
ne vaut pas la peine d'acheter une voiture si l'essence tend vers zéro). 


D2. Deux biens sont dits "biens substituables" si nous pouvons remplacer facilement l'un par l'autre, par 
exemple en cas de pénurie ou de hausses de prix. Le thé et le café sont des substituts car, à défaut de l'un, 
nous nous reportons souvent sur l'autre. Cela est encore plus vrai pour deux marques d'une même boisson 
(Pepsi et Coca). La crise de la vache folle est également un bon révélateur de la substituabilité des 
produits carnés, avec un report de consommation sur les volailles et l'agneau. Cela peut être interprété par 
la courbe d'indifférence suivante: 


Figure: 66.8 - Principe de représentation de biens substituables 


Effectivement, l'intersection avec les axes respectifs indique (exprime) justement la substitution totale 
possible d'un bien par l'autre dans le panier. 


Voyons maintenant un exemple d'application: 


Soit à calculer le T.M.S$. le long de la courbe d'indifférence 7 = x, x; = 100 (il s'agit donc d'une fonction 
hyperbolique). Nous avons montré que le T.M.S était donné par: 


au (x x) 
ruse Ce (66.71) 
dx, OÙ  8(m'x) x 
ôx; ax 


Ainsi, pour les trois points À, B, C de coordonnées respectives: 
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A(5, 20); 8(10;10), (20,9 


nous trouvons les valeurs T.M.S. respectives: 
TMS, =4,TMS, = 1,7MS, = 0.25 


Ces valeurs expriment des équivalences entre les biens 2 et 1 pour des variations marginales des quantités 
de ces biens. Ainsi au point À, pour conserver le niveau d'utilité de 100, le consommateur est prêt à 
abandonner du bien 2 pour augmenter sa consommation de bien 1 dans un rapport de 4 à 1. Au point B 
l'équivalence entre les deux biens est dans un rapport de 1 à1, etc. 


Remarque: Le concept de courbes d'indifférences a été développé par Vilfredo Pareto et d'autres dans 
la première partie du 20ème siècle. Le recours à ce concept a permis à l'analyse économique d'utiliser 
le concept de préférences dans la détermination des choix plutôt que le concept d'utilité qui a le 
problème de ne pas pouvoir être mesuré de façon objective. 

Pour résumer: 


Les courbes d'indifférences (iso-utilité) ont donc traditionnellement les propriétés suivantes: 


P1. Les courbes d'indifférences ne se croisent pas. C'est la conséquence de l'hypothèse que les 
consommateurs préfèrent toujours avoir plus d'un bien plutôt que moins... 


P2. Les courbes sont décroissantes. Cela découle de l'hypothèse que plus les individus consomment de 
moins en moins d'un produit, plus ils en demanderont un autre. 


Finalement, les hypothèses sont (les trois premières hypothèses sont obligatoires, les autres sont 
facultatives puisque découlant des deux propriétés précédentes): 


H1. Complétude: les consommateurs connaissent leurs préférences individuelles. En d'autres termes, ils 
peuvent choisir entre consommer le couple X ou le couple Y. Ils savent si X est préféré à Y, Y est préféré à 
X, ou s'ils sont indifférents entre consommer X ou Y. 


H2. Transitivité: si un consommateur préfère le couple X au couple Y, et préfère le couple Y au couple Z, 
alors il préférera le couple X au couple Z. 


H3. Continuité: cela signifie que nous pouvons choisir de consommer n'importe quelle quantité d'un bien. 
H4. Non-satiété: c'est l'idée que plus d'un bien est toujours préféré à moins. 


H5. Convexité: la valeur marginale qu'un individu retire de chaque bien décroît. Dans un monde à deux 
biens, si un consommateur a relativement plus d'un bien, il sera plus heureux avec un peu moins de ce bien 
et avec un peu plus de l'autre bien. 


3.1.1. MODÈLE CONTRARIÉ A PERTE NETTE 


Considérons maintenant, et ce indépendamment de la théorie de la préférence, un modèle à monopole 
contrarié et à information parfaite pour un besoin primaire. Notons D(t) la demande sur le marché et O(t) 
l'offre. Nous avons alors une demande exponentielle (en absence d'offre): 
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_ =rD (66.74) 
d£ 
et en l'absence de demande: 
= -3#@ (66.75) 
dé 


Les offreurs et les demandeurs sont en interaction. Pour quantifier la contribution entre groupes, nous 
considérons l'offre en assumant que sa valeur ou intensité est fonction de probabilité de rencontre entre le 
demandeur et le produit et quelle sera proportionnelle au produit du pourcentage ©. D de l'offre de la 
demande. 


Les effets de la découverte du produit n'ont pas les mêmes effets sur les deux groupes 
offreurs/demandeurs. Premièrement, bien sûr, chaque offre acquise par un demandeur est un gain net pour 
le premier et sera supposée comme un perte d'épargne nette pour le second. Ainsi, si l'effet des interactions 
est accepté, comme étant proportionnel à ©. 2 les signes d'influence d'interaction différeront selon: 


(66.76) 


Avant d'aller plus loin, cherchons les valeurs pour lesquelles les dérivées s'annulent (ce qui nous donnera 
au fait le point d'équilibre entre l'offre et la demande): 


rD'-cD'O'=0 . 
(66.77) 
-##0'+BD'O'=0 
D'où: 
{r-cO)D'=0 
(66.78) 
(BD'-m)O'= 0 


Une solution triviale est la "solution d'inexistence" (appelé aussi parfois "solution critique") donné par: 
D,=0,=0 (66.79) 


Sinon, nous avons aussi comme possible solution: 


Fr 
r =c0" O'=- 
- (66.80) 
A 
nn ur 


Maïntenant, normalisons les équations en écrivant (ainsi elles sont sans dimension): 
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re ND Ne x 

o Fe (66.81) 
y=—=°pp=ly 

Or c 


avec cette normalisation, le modèle s'écrit: 


dx 

—=Frx (1 — y) 

é (66.83) 
34 

—— = | 

7 = xl) 


pour lequel les dérivées s'annulent aux points (1,1), qui sera à nouveau l'équilibre de Say. 


Le tracé discret de ce système d'équations (dans lequel nous reconnaissons un terme logistique), donne 
avec m=r=b=6e=1 etles conditions initiales (x, ,y, ) = 4,1: 


4.5 


0 5 10 15 
t 


Figure: 66.9 - Cycles d'offre et demande 


Nous retrouvons comme le marché semble nous le montrer, des cycles d'offre/demande (certains produits 
démodés reviennent à la mode) dont il faut déterminer par des statistiques, les conditions initiales afin d'en 
connaître la possible période. Nous remarquons que l'offre a toujours un peu de retard sur la demande dans 
ce modèle. 


Si nous représentons l'offre et la demande non pas respectivement en fonction du temps mais en fonction 
de l'un et de l'autre, nous obtenons: 
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Figure: 66.10 - Représentation dans l'espace des phases des cycles offre/demande 


Nous voyons ainsi (dans cette représentation de l'espace des phases) que pour des conditions initiales 
fixes, le système est périodique et a un point d'équilibre en 


Ce qui correspond aux points où: 


A0 (66.84) 
dt dit 


Finalement, nous avons deux couples de points d'équilibre (c'est trivial en regardant le système 
d'équation): 


(4,71) = (0,0) et (6,73) = (LD (66.85) 


La question qui va se poser est le sens de rotation (représentation) du plan des phases. Aïnsi, en 
représentant les directions à l'aide d'un champ de vecteurs, nous obtenons la représentation: 
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4 


4 
Figure: 66.11 - Sens de rotation de l'espace des phases de l'offre/demande 


Pour savoir dans quelle direction nous nous dirigeons dans l'espace des phases à un moment donné, il 
suffit donc de connaître la dérivée dy/dx (ou réciproquement dx/dy). Ainsi nous avons: 


dy _dy di _dy _ MX D = (66.86) 
dx dt dx rx] - 


Ceci dit, nous voyons bien sur le diagramme des phases dans sa forme de champ de vecteurs qu'il arrive un 
moment dans le cycle de ce modèle que l'offre soit très élevée pour une faible demande. Donc le modèle 
mathématique (théorique) explique bien ce qui peut être a priori contre-intuitif pour l'être humain. 


Cependant, nous pouvons (devons) nous poser la question de ce qu'il se passe après une petite 
perturbation autour des points d'équilibres (ce qui est de la plus haute importance en économie). 


Nous avons donc le système de Lotka-Volterra à l'équilibre: 


dx 
nm A) 
(66.87) 
0 
de FHy 


En y mettant une perturbation infiniment petite, celui-ci s'écrit: 


dx *# # 

FA i1-iy+y il 

; (66.88) 
L emiy+y \x+x )-1] 


dé 


En négligeant les termes quadratiques, nous obtenons: 
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dx [i-ix+(-r-v ir] 
dé 


dy * #\ * 
—Z-m|ll-x iy+il-x-x | ] 
2 m| x |y XX |y 


(66.89) 


En nous concentrant d'abord sur l'étude proche du point (0,0) nous pouvons négliger les termes xy, nous 


obtenons: 


dx *# *# *# 
sr[(i-» ix+il-y-y x] 
" (64.90) 
34 # *# *# 
EE -pmlil-x iy+il-x-x ] 
di | ” ” 


Mais c'est encore trop compliqué. Toujours en nous considérant proche du point (0,0), nous considérons 
un peu abusivement mais astucieusement (sinon nous ne pourrions toujours pas résoudre le problème 
analytiquement) les approximations suivantes: 


Donc: 


X *# # # # # # 
ZrIX-Y X+X —yx —y x [=r|lx+x | 
nn, D — 


4 = FX 
CE * 
an 29 = XX 
(64.91) 
dy # # # # *% # 
—Z=-m|y-XYTy —2x2) —xy |=-mMmIyYTYy | = —"x 
dt —— ss FÆy* 


=Û =| = 


dx 

pr SvA 

k (66.92) 
TPE 

“ru 


Ce qui nous montre pour le système à l'équilibre, proche du point d'inexistence, l'offre diminue 
exponentiellement alors que la demande augmente elle exponentiellement. Ceci a un sens économique: 
quand il y a peu d'offre (respectivement de demande), la demande croît alors qu'au fur et à mesure que la 
demande augmente, l'offre croît et se concentre de plus en plus sur la demande (ahhh la nature.…..). 


Remarque: Dans la littérature nous retrouvons tantôt le signe "-" en haut ou en bas dans le système 
d'équations précédent. En réalité, la position du signe "-" n'a aucune importance car il s'agit juste du 
choix de départ dans la dynamique du système. 


Proche du point d'équilibre (1,1), nous aurons (hop! nous changeons la position du signe exprès afin de 
d'insister sur le fait que ce n'est qu'un choix de départ!!!): 


dx s— 

“ (66.93) 
D sx 

dt 
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Pour résoudre ce système, différentions l'équation: 


2 
dx, (6604) 
dé dt 
et en y injectant dy/dt: 
d°x 


px] 3 = mx (66.5) 
£ 


Nous obtenons donc une petite équation différentielle du deuxième ordre (cf. chapitre de Calcul 
Différentiel Et Intégral). Dont la solution-type est: 


re 2e * (66.96) 


En injectant cette solution dans l'équation différentielle, nous obtenons après simplification des 
exponentielles une simple équation du deuxième degré (cf. chapitre de Calcul Algébrique): 


#% +rm% = ÔÀ (66.97) 
Dont la solution est triviale: 
À12 = +ifrm (66.98) 
Ainsi, la solution générale de l'équation différentielle est la combinaison linéaire des deux solutions tel que: 
x(Ë) = % line + gift | (66.99) 


Mais nous avons donc: 


Dès lors, connaissant x(t) nous obtenons facilement: 
FA | ss ; cn 
y = xp] —|-ie iafrmt ii rt | (66.101) 
| - 


Utilisons maintenant la relation d'Euler (cf. chapitre sur les Nombres): 
e* =cos(x) +isin(x) (66.102) 
Ainsi, nous avons: 


xÉ) = [oes. rent | +isin | fret | + cos| fret | +i sin | remé | (66.103) 


et comme (cf. chapitre de Trigonométrie) cos{x) = cos(-x},- sin(x) = sin(—x), nous avons alors: 
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x(£) = 2xÿcos|Yrmft| (66.104) 


et de manière similaire, nous obtenons pour les prédateurs: 


7 = cos( Vtt in ré) cos | fret |+i sin rent || 
= cos | fret | — à sin | fr ||+ cos afrmet |+ à sin | rm || 

= 29 cos in {+ cos in (V 

= 20 (asie (V2 220 Jin 


(64.105) 


soit: 


Fr =. 
VE) 2% — anis lp | (64.106) 
Fr 


Ainsi, autour du point d'équilibre (1,1), les perturbations suffisamment petites pour valider la linéarisation 
(annulation des termes quadratiques) oscillent comme des ellipses (ou cercles) dont les axes sont définis 
par les deux équations précédentes. 


Ce modèle est cependant imparfait car il prend en compte seulement un monopole contrarié à perte nette 
et à information parfaite. Le fait de considérer la population constante n'est pas trop gênante mais en toute 
rigueur nous devrions rajouter un terme logistique dans les équations initiales. Il y a encore du travail 
donc... 


4. CAPITALISATION ET ACTUARIAT 


Définition: La "capitalisation" est le domaine de la mathématique financière qui permet de calculer des 
valeurs futures à partir de valeurs présentes, alors que le "calcul actuariel" permet de déterminer quelle 
somme doit être prêtée pour obtenir un montant fixé à l'avance. 


Dans une dynamique de marché, des acteurs peuvent prêter ou emprunter un capital en contrepartie de 
quoi ils perçoivent ou respectivement versent un intérêt périodique. Cet intérêt se justifie par la prise de 
risque que prend le créditeur (celui qui prête le capital) relativement au non-remboursement de la totalité 
ou d'une part du capital initial que doit rembourser le débiteur (celui qui doit rembourser le capital 
emprunté). D'une autre manière, vu au niveau du marché économique, les emprunts permettent à certains 
agents économiques de mettre en place des biens en pariant sur le fait que soit ceux-ci créeront l'offre soit 
que l'offre viendra d'elle-même mais en souhaitant devancer la concurrence. 


Lorsqu'un capital est prêté (ou emprunté, c'est selon le point de vue...) dans le but d'accroître une 
dynamique de marché (la quantité de biens en circulation sur une durée donnée) nous parlons alors "d'actif 
financier", ceci pour faire comprendre que le capital participe à l'activité de l'économie. 


Définitions: 
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D1. Nous appelons "rendement d'un actif financier prêté" le rapport relatif de progression donné par: 


Au 4 100 
n 


r,A% = (66.107) 


D2. Nous appelons "rendement arithmétique d'un investissement" le rapport relatif: 


| F, —F. 
RAR EE 66.108) 
; 


où Fest la valeur initiale de l'investissement et F’; sa valeur finale. 


Il suit de cette dernière définition que si un investissement a rapporté 5% la première année et a porté une 
perte nette de 2% la deuxième année, le "RSI (Retour Sur Investissement) arithmétique moyen" est alors 
de: 


_— n | Arith Arith 0 _où 
gr 2 LS pages LR RCD 9 (10 
ñ 


Or il est faux d'utiliser la moyenne arithmétique pour ce type de situation car la somme finale obtenue 
après les deux années est mathématiquement de: 


ps =FTIA+RSÉ) (66.110) 
k=1 


ce qui donne alors en reprenant l'exemple précédent: 
PS =7.(+5%)(1-2%) (66.111) 
Donc le rendement moyen réel est par définition le "RSI géométrique" tel que: 
F.(1+5%)(1- 2%) = (+ RST um) (66.112) 
c'est-à-dire qu'il s'agit simplement d'une moyenne géométrique (cf. chapitre de Statistiques). Il vient alors: 
RSI om = A+ 3%)(1— 2%) — 1= 2.90% (66.113) 


ce qui est bien évidemment nettement différent du RSI arithmétique moyen obtenu plus haut! 


Remarque: Nous disons d'un actif qu'il a un "rendement sans risques" si la valeur future de celui-ci est 
parfaitement connue. 


Soit un actif 4, qui peut valoir le rendement (optimiste) futur r;, avec une probabilité », et la valeur 
(pessimiste) r,, avec une probabilité », ou d'autres valeurs r,, avec la probabilité », alors l'espérance 


mathématique du rendement est donnée par: 
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Ers 4 |= D rer 


il 


Que la somme monétaire soit du type actif ou non, les types de rendements applicables sont identiques et 
variés. Il en existe cependant de grands classiques qui ne sont pas stochastiques et connus. Pour leur 
étude, définissons certaines variables: 


- C représente le capital initial ou plus techniquement la "valeur actuelle" (V.A.) ou "present value" (P.V.) 


en anglais. 


- €, représente le capital final ou "valeur capitalisée" (V.C.) ou "futur value" (E.V.) en anglais après n 
périodes temporelles. 


- {% représente le taux appelé plus techniquement "taux effectif" 


- À, représente "l'intérêt" produit au bout de n périodes (horizon) par la valeur actuelle 
Rajoutons encore comme complément la relation: 

Fu D 4 
appelée "facteur de capitalisation". 


Définition: Nous définissons "l'intérêt" comme la rémunération d'un capital (somme d'argent) prêté ou 
investi pendant un certain temps. L'intérêt peut être payé en une fois ou périodiquement si la durée du prêt 
ou de l'investissement dure longtemps. L'intérêt peut être payable d'avance (praenumerando) ou à la fin de 
la période (postnumerando). L'intérêt est fonction de la durée du prêt (ou investissement), du capital 
emprunté (ou prêté) ainsi que du "taux" d'intérêt pratiqué. La période sur laquelle l'intérêt porte est en 
général l'année, mais elle peut être plus courte: semestre, trimestre, mois ou jour. 


Remarque: Dans un texte, le taux d'intérêt est exprimé normalement en % mais dans les calculs 
financiers, il est d'usage de calculer sous forme décimale. 


4.1. INTERVALLE DE DATES 


Pour déterminer le montant d'un intérêt sur un prêt (ou investissement.), il est d'abord indispensable de 
connaître la durée de ce dernier ou les dates définissant les périodes de paiement d'une obligation 
(échéancier). 


Le calcul des dates et des durées est donc la première étape en mathématiques actuarielles. Si certains 
logiciels utilisent dans le calcul de la durée l'année civile (365 jours selon le calendrier Grégorien), d'autres 
se basent sur l'année commerciale (360 jours), ce qui était le cas de la plupart des établissements bancaires 
(c'est tout à leur avantage financièrement parlant de faire le choix de cette dernière...) avant l'arrivée du 
calendrier target pour la zone Euro. 
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Remarques: 


R1. Sur les marchés financiers, il existe une seule convention en matière de détermination d'un 
intervalle de dates pour calculer une durée: le premier jour (date de départ) est inclus dans la période. 
Le dernier jour (date de fin ou date d'échéance) est exclu de la période. Aïnsi une période allant du 15 
au 25 juin comporte 10 jours. 


R2. Dans le cadre de ce site, qui se veut avoir une approche la plus rigoureuse possible des sujets 
traités, nous ne nous attarderons pas sur les aberrantes méthodes 30/360 allemande, européenne ou 
encore américaine (autant faire chaque pays de la planète alors. et se reporter à Microsoft Excel...) 
pour nous concentrer sur la méthode des 365 jours (système de la base exacte) qui est, et reste, le 
système le plus naturel de comptage à utiliser puisqu'il tient compte des mois de 28, 29, 30 ou 31 jours. 


R3. Signalons qu'en ce qui concerne les carnets d'épargne, les banques se basent sur un système de 
"quinzaines" (moitiés d'un mois), et estiment qu'il y a donc 24 quinzaines par année. 


Il nous faut dès lors dans le système de la base exacte connaître comment calculer le nombre de jours 
entre deux dates 2,2} donné par le calcul 2, - 2, chacune de ces dates étant encryptée sous forme 


normalisée aaaa-mm-jj (année-mois-jour) ou sous forme populaire j.m.a (jour.mois.année). 
Définitions: 
D1. Le calendrier Grégorien a été défini tel qu'il ait 12 mois. 
D2. Les mois de: 

{janvi er(l},mars(3},ma(5), juillet( 7}, aout(8), octobre(10), décembre(l 2)} 
sont des mois de 31 jours et les mois de: 

{ avril(4), juin (6), septembre(9),novembre(l 1)} 

de 30 jours. 


D3. Le mois de février est un cas particulier permettant de corriger le fait que l'année civile de 365 jours, 
ne corresponde pas tout à fait à la période orbitale de la Terre autour du Soleil qui est d'environ 365.25... 
jours. Ainsi, toutes les années qui sont multiples de 4 ou de 400 sont des années bissextiles (le mois de 
février à 29 jours au lieu de 28) mais les années qui sont divisibles par 100 ne sont pas bissextiles. 


Exemples: 
E1. 1992, 1996, 2004, 2008 sont bissextiles. 
E2. Les années 1900, 2100, 2200, 2300 ne sont par contre pas bissextiles (car divisibles par 100) 


E3. Les années 1600, 2000, 2400, 2800 sont bissextiles car bien que divisibles par 100, elles sont multiples 
de 400. 
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Ces définitions et exemples étant donnés, soit une date sous la forme donnée précédemment. Le nombre 
de jours depuis l'an 1 est: 


100 


=] = 4 
Dm) = 365(a - 1) + den -2f | + 2 | +31(m-1)+ j| (66.118) 


où E[x] est la partie entière de x. Cette relation se déduit logiquement de la manière suivante pour les 
dates où » < 2 (soit uniquement pour les deux premiers mois de l'année incluant la problématique du 
moisd de février): 


1. Nous avons 365(a-1) car soit a donné, le nombre de jours civils depuis l'an 1 est 365 fois le nombre 
d'années a diminué d'une unité puisque l'année en cours n'est pas terminée. 


2. Même remarque pour les mois avec 31(m-1): en considérant des mois de 31 jours, le mois en cours 
n'étant pas pris en compte (d'où 31(m-1)). La correction pour les mois de 28 ou 30 jours intervient sous le 
cas Où # > 2 que nous allons voir un peu plus bas. 


3. Logiquement, nous ajoutons j (qui contient toute l'information quant à savoir si l'année a est bissextile 
ou non) à la somme des deux termes précédents. 


a=1 
100 
et a en prenant en compte les années bissextiles qui ont lieu tous les multiples de 4 et 400 ans excepté les 
années qui sont multiples de 100. 


4. Les termes Æ — - «| | +E x] donnent quant à eux le nombre de 29 février entre l'année 1 


Si »# > 2, nous devons utiliser la relation suivante: 


d d Ce: 
D(jima) = 365(a -1)+EÆ[=|-E|—|+8#8|—|+316#- D +; Æ(0.42M4 +240.5) (66.119) 
(ma) (a —1) ( EG | Gn— D + j— EÆ( À (66.11 


Cette relation se déduit toujours de la même manière que la précédente à la différence que certains termes 
au numérateur ne sont pas diminués d'une unité car ayant » > 2, il faut, pour ces termes, prendre en 
compte l'année en cours dans le calcul. 


Le dernier terme E(0.42M+2+0.5) est ici pour corriger le fait que tous les mois n'ont pas 31 jours. Pour 
l'obtenir, nous construisons le tableau suivant (la troisième colonne donne le décalage en jours par rapport 
au cas où les mois auraient tous 31 jours): 
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Mois N'Moin | Décalaged 
mars 3 3 
avril 4 4 
mai 5 4 
juin 6 5 
juillet . 5 
aout 8 5) 
septembre 9 6 
octobre 10 6 
novembre LL ve 
décembre 12 7 


Tableau: 66.5 - Décalage mensuel en jours 
Une régression linéaire simple donne: 


d(n) = 04242» + 2.018 (66.120) 


En prenant la valeur entière et en vérifiant bien que la fonction choisie est correcte, nous obtenons 
finalement bien (en prenant une précision de deux décimales): 


E(0.42M+2+0.5) 


Mois N°Moin Décalagd dt) EG() 
mars 3 à 3.26 à 
avril 4 4 3.68 4 
mai 5 4 4.1 4 
juin 6 5 4.52 5 
juillet 7 5 4.94 5 
aout 8 5 5.36 5 
septembre 9 6 5.78 6 
octobre 10 6 6.2 6 
novembre 11 7 6.62 7 
décembre 12 7 7.04 7 


Tableau: 66.6 - Comparaison entre la fonction de régression et l'objectif 
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4.2. ÉQUIVALENCES DE TAUX 


Intéressons-nous maintenant brièvement au calcul des taux avant de s'attaquer directement aux calculs des 
différents et nombreux types d'intérêts. 


Définition: Le "taux proportionnel" fait apporter à un même capital, durant la même période, le même 
"intérêt simple" (voir la définition de l'intérêt simple plus bas) et est donc donné par la relation: 


L% 
1,70 = (66.121) 
À 


Si le taux proportionnel est calculé sur la base d'une année, nous parlons alors de "taux de rendement 
annualisé"; s'il est calculé sur la base d'un mois, nous parlons alors de "taux de rendement mensualisé". 


BExemple: 


Calculer le taux mensuel £,%% proportionnel (soit: le taux de rendement mensualisé) à un taux annuel 
t% de 12%: 


12% 


12mois 


4, % = 


? =1% (66.122) 


Définition: Le "taux équivalent" fait apporter à un même capital, durant la même période, le même 


"intérêt composé" (voir la définition de l'intérêt composé plus bas) et est donc donné par la relation: 


(+4,%)" = (1+4%)" 
= (1+4,%) = N(1+14%)" (66.123) 


x 
> 1,% = (1+5%)* —1 

et inversement: 

LA De 

1% = (1 + 1,%)* 1 (66.124) 
Exemple: 
Taux 1% mensuel équivalent à un taux £,% annuel de 12% (résultat tronqué au dix-millième): 
£ = 
= (1+0.12)2 -1=0.9488% (970) 


la procédure inverse consisterait donc à calculer le taux annualisé et nous voyons alors qu'un taux mensuel 
de 1% annualisé vaudrait plus que 12%. 
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4.3. INTÉRÊT SIMPLE 


Définition: "L'intérêt simple" est défini par la relation (voir plus haut pour la définition des notations): 
1, =C't%'n (66.126) 


qui implique une capitalisation (valeur finale): 


C, =Cotl+{%'A)| (66.127) 


Il s'agit simplement de l'intérêt qui est calculé à chaque période sur la seule base du capital prêté ou 
emprunté à l'origine. 


Remarques: 


R1. Il est très facile à partir de la connaissance de trois des quatre paramètres de la relation précédente 
de retrouver la quatrième. S'agissant d'une simple équation du premier degré, nous ne nous attarderons 
pas sur ce genre d'exercice de style d'algèbre élémentaire. 


R2. Une particularité de l'intérêt simple est d'être proportionnel à la durée du placement. Si l'intérêt par 
exemple sur une année est de 12%, le "taux équivalent" d'un placement identique pendant 12 mois 
sera de 1% par mois. Cette propriété n'est pas vraie pour l'intérêt composé comme nous le verrons de 
suite après. 


R3. Pour les carnets d'épargne, nous avons déjà fait mention que les instituts financiers utilisent la 
quinzaine comme période temporelle (soit 24 périodes dans l'année composée de mois de 30 jours). 
Donc pour calculer l'intérêt annuel, lors de chaque quinzaine, ils prennent le solde le plus faible sur le 
compte au cours de la quinzaine et calculent l'intérêt simple sur un taux rapporté à 24 quinzaines par 
année et reporteront le résultat obtenu lors de la clôture annuelle du compte à la fin de l'année (ils sont 
pas fous...) 


Par ailleurs, si plusieurs placements à intérêt simple sont effectués simultanément pour des durées et à des 
taux différents, nous pouvons être amenés à calculer le taux moyen T de l'ensemble de ces placements. 


Si nous notons €, le placement numéro £, à, le taux d'intérêt du placement numéro t, x, la durée du 


placement numéro t et k le nombre de placements, nous obtenons la moyenne arithmétique pondérée (cf. 
chapitre de Statistiques) comme suit: 


2 Ci 
: : : tt 
T - Cia + Cire +... + Ci À (66 128) 


Cra + Cor ++ Cire CA 
4.3.1. ESCOMPTE 


Toujours relativement à l'intérêt simple, nous pouvons revenir sur une notion dont nous avions parlé au 
début de ce chapitre: l'escompte. 
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Rappelons que l'escompte est une remise accordée à un acheteur par un vendeur dans le but de l'inciter à 
payer rapidement avant n unités (périodes) de temps (c'est donc le nombre d'unités n qui importe!). Un 
acheteur devrait en principe profiter de cet escompte (qui peut donc être vu comme un crédit). Dans le cas 
contraire, c'est comme si l'acheteur empruntait implicitement à une banque pendant une durée donnée (les 
n unités). 


Historiquement, l'escompte est la retenue que fait un banquier sur une promesse de versement que possède 
une commercant (promesse signée par un acheteur pour une certaine échéance), que le banquier verse 
avant l'échéance (donc comme une avance). 


Voyons cela: 


Notons €; la valeur actuelle escompte compris (déduit), €, le montant sans escompte appelé "valeur 


nominale", n la durée rapportée à l'échelle de temps du taux d'escompte, t% le taux d'escompte et i 
l'intérêt implicite simple en cas de renonciation à l'escompte. 


Nous avons maintenant les relations triviales suivantes: 
CC, EC, = C,(1-1%) (66.129) 


Et rien nous empêche d'écrire que le montant sans escompte peut être obtenu par un intérêt simple de la 
forme: 


C,=C(1+x'i) (66.130) 


*# 
à partir de la valeur avec escopte. L'intérêt implicite simple sur la valeur actuelle étant alors trivialement: 


i= Cy CG 
#C 


(66.131) 


Dès lors, il vient par substitution: 


__E-Q C-C(i-%) 1-(1-5%) 1% _—. 
1=————— = = = ——————— (66.132) 


aC, nC(1-1%)  n(1-1%) n(1-1%) 


Nous remarquons alors qu'il suffit de connaître le taux d'escompte accordé t% (souvent donné en 
annuel...) ainsi que la durée de renonciation n pour déterminer le taux équivalent simple du crédit accordé. 


Exemple: 
Calculons le taux implicite simple i relatif à un escompte de 1% à 10 jours ou net à 30 jours: 


qu OS D 0505% 


(66.133) 
20 (1-0.01) 
Ainsi, cet escompte s'il n'est pas pris en considération, peut être vu comme un crédit à 0.505% par jour 
pendant 20 jours sur la somme avec escompte! Ce qui correspond sur un mois de 30 jours à un taux 
d'intérêt simple de 1.515%. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Cette méthode de calcul est appelée "escompte commercial" car les calculs se font sur la base de la valeur 
nominale et non de la valeur actuelle. 


Cependant, historiquement, les calculs étaient plutôt du type suivant: 
Exemple: 


Le 19 mars, un banquier escompte t% de 6% (annuel) un contrat d'acheteur à un commercant de 240'000.- 
payable le 31 mai (il y a donc 73 jours calendaires entre les deux dates). La valeur de l'escompte est alors: 


Escompte = 240" 000-273 = 2'920 — (66.134) 


Donc la valeur actuelle du contrat sera de 237'080. Le taux implicite simple sera alors donné par: 


1 
1—-1%. 0 66.135 
OU Co je ju ed ee 
A (1-46. x) 
Soit: 
6% 
1% 360 
= 7 — 5 0.0169% (66.136) 
i £70-A1 CE) 
360 


4.4, INTÉRÊT COMPOSÉ 


Définition: "L'intérêt composé" est donné par la relation: 
L=Cf-C = CF -1) (66137 


et implique que la valeur finale est donnée par: 


C,= Cf = C(1+2%)| (66.138) 


Nous disons donc que le taux d'intérêt est "composé" lorsqu'à la fin de chaque période l'intérêt est ajouté 
au capital pour le calcul de la prochaine période. Cette relation implique bien évidemment qu'il n'y a ni 
retrait ni dépôt pendant toutes les périodes. 


Nous avons par ailleurs les relations triviales (cf. section d'Algebre): 


In| — 
ca É | cf (66.13 


RAR 
_ # PAT Inf1 + 4%) 
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où la première relation donne donc la valeur initiale si la valeur final est connu et qu'il n'y a ni retrait ni 
dépôt pendant toutes les périodes. 


Remarque: Les relations équivalentes dans la version française de Microsoft Excel 11.8346 pour 
trouver C°,,C,,#,i sont respectivement (fonctions en français) VC(), VAO, NPMO, Taux() 


l'abréviation NPM signifiant "nombre payements mensuels". 


Dans le cadre des intérêts cumulés (composés), deux notions importantes sont donc la "valeur actuelle" et 
la "valeur finale" acquise d'un capital. 


En répondant à la question: "Quel capital obtenons-nous au bout d'un certain temps en plaçant aujourd'hui 
une somme X sur un carnet d'épargne?", nous faisons une recherche de valeur finale ou acquise d'un 
capital. Nous parlons alors "d'opération de capitalisation". 


Par contre, si nous nous demandons: "Quel capital devons-nous placer aujourd'hui sur un carnet d'épargne 
pour obtenir au bout d'un certain temps un capital X ?", nous faisons une recherche de valeur actuelle d'un 
capital. Nous parlons alors "d'opération d'escompte" (c'est le propre du "calcul actuariel"). 


Définition: Nous appelons f. le "facteur de capitalisation" et £, le "facteur d'escompte" définis par les 


relations: 


1 
1+4% 


(66.140) 


f=1+% = 


ce qui nous amène par ailleurs à avoir: 


Partant de de la relation de capitalisation composée vue plus haut (mais donc avec la notation condensée): 
C,=Cof: (66.142) 


Le capital initial €; peut être exprimé avec le facteur d'escompte: 


x 
# l 1 # feC 12 
Co C0 7 =C (| “Cds 0618) 
€ € 


Cela rend alors très simple le calcul d'actualisation ou de capitalisation puisqu'il s'agit de multiplier le 
capital final ou initial par le facteur d'escompte ou de capitalisation élevé à la puissance n. 


Rappelons maintenant la relation que nous avons obtenue lors de notre présentation initiale des taux 
équivalents: 


# 
04 = 04 \x —1 (66.144) 
1,% = (1+4%)m -1 


Souvent afin de se simplifier le calcul, la personne qui cherche le taux équivalent va se contenter de poser 
(normaliser) # = 1. Ce qui l'amène à écrire: 
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1,7% = (1+1%)* -1eti% =(1+4,%) —1 (66.145) 


Vient alors une petite astuce du financier qui fait intervenir dans ses démarches de ventes les concepts de 
"taux effectif" (déjà vu!) et "taux nominal". Le taux nominal étant toujours inférieur au taux effectif, il 
permet à l'émetteur de l'emprunt d'afficher un taux inférieur à ce qu'il est réellement (pratique qui au 
demeurant est interdite par voie législative dans certains pays!). 


Exemple: 


Imaginons que les conditions d'un prêt soient les suivantes: intérêt annuel de £,% = 12% (taux nominal) 
payable par tranches mensuelle de £,% = £,% 12 = 1% . Un individu attentif se rend compte que payer 


1% tous les mois dans un système d'intérêts composés ne donne pas un intérêt annuel de 12% mais de: 


0 ra 0 12 
8% ={1+4,%) [1-5 1-[r 4) —1=12682%... (66.146) 
P 


qui est le taux effectif t% ! Pas forcément gagnant donc... 


Maintenant, si plusieurs placements sont effectués simultanément pour des durées et à des taux différents, 
nous pouvons être amenés à calculer le taux moyen T de l'ensemble de ces placements. 


Si nous notons €, le placement numéro t, f,., le facteur de capitalisation du placement numéro t, x, la 


durée du placement numéro t, k le nombre de placements et finalement T le taux moyen de l'ensemble des 
placements nous pouvons à l'aide du calcul formel jusqu'au quatrième degré (voir chapitre de Calcul 
Algébrique) ou au-delà avec l'analyse numérique (prendre le solveur de Microsoft Excel par exemple), 
résoudre l'équation: 


CA + CS +... + CRE = Ci (147) +0, (14 7972 +...+C,(1+7)* (66.147) 


Si nous faisons un changement de variables 1+7 = x nous avons alors à résoudre l'équation de #4 
inconnues en x (tous les autres termes étant normalement connus dans l'énoncé du problème): 


CRE + HONG Ms CS C7 0 (EME) 


é, 


4,5. INTÉRÊT CONTINU 


Rappelons que l'intérêt composé est défini en utilisant le taux effectif: 
= # = 0,4 \* GG [e 
C,=Cor" = C(1+#%) (66.149) 


Avec le taux nominal, nous écrivons alors: 


04 Ÿ ; 
C, =Clit La =] (66.150) 
P 
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Nous pouvons maintenant nous demander ce qu'il adviendrait du taux effectif t% si l'intérêt était versé non 
pas mensuellement, ni quotidiennement, mais en continu, d'une manière instantanée (ou quasi- 
instantanée). Nous écrivons alors (cf. chapitre d'Analyse Fonctionnelle): 


F—+o P 


û, 
a (res 2%) —1= er 1] (66.151) 


Ainsi, en cas de capitalisation continue, la fonction de capitalisation s'écrit finalement: 


maps) | -«( (1+[e [*-1]) - (e**) = Ce (66.152) 


Et comme: 
144%)" = gh% — 1430 = 2% (66.153) 


Nous avons alors (relation relativement importante en finance des marchés): 


1,%=in(1+#%) | (66.154) 


Il peut être intéressant que le lecteur compare le résultat de ce calcul avec celui de l'intérêt composé 
classique dans un tableur. Il pourra dès lors constater que le taux continu est une approximation du taux 
composé qui sous-évalue toujours ce dernier (ce qui est normal puisque l'argent travaille d'autant plus que 
la fréquence est grande). 


Une propriété utile et très utilisée en trading de l'intérêt continu est qu'il est "consistant dans le temps". 
Pour voir de quoi il s'agit, considérons les 3 valeurs suivantes d'un capital de portefeuille placé 
quelconque: 


Cy2 10.00.- 
14 
Cri 14.00.- = (14-10)/10 = 40% = In 10 = 33.65% 
3 {u) 
LS 9.00.- = (9-14)/14 = -35.71% | =in 1)% —44.13% 
Somme: = 4.29% =-10.54% 
; 9 
Comparaison: = (9-10)/10 = 10% =in (5) = 10.54% 


Tableau: 66.7 - Comparaison entre la fonction de régression et l'objectif 
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Donc comme nous pouvons le voir, contraire au taux de renabilité simple, le taux de rentabilité continu est 
consistant en temps car nous pouvons sommer les différents taux pour avoir la variation totale. Ce résultat 
provient simplement de la propriété suivante: 


4%) 6% h% b% 
C0 et der és" a 0 


x 


| = 470 +£,%0 Tableau: 66.8 


#2 


% %e C 
17% > n| — 
C, 


4.6. INTÉRÉT PROGRESSIF (RENTES) 


Définition: Une "rente" ou "annuité”" est une suite de paiements versés périodiquement à intervalles de 
temps réguliers et durant une période fixée d'avance à intérêt composé (typique des deuxième ou troisième 
piliers en Suisse). 


Il suffit alors d'appliquer la relation (voir plus haut la démonstration) €, = €, f} à chaque terme de rente 


versé si nous souhaitons connaître la valeur actuelle de cette rente. 


Par contre, si nous souhaitons obtenir la valeur finale d'une rente, nous appliquerons à chaque terme la 
relation (voir plus haut la démonstration): 


C,=C,f (66.155) 


Définition: Si la rente est payable en fin de période, elle est dite "rente postnumerando". Par contre, si elle 
est payable en début de période, elle est dite "rente praenumerando". 


Remarques: 


R1. Les rentes qui sont toujours payées sont appelées "rentes certaines" et lorsque la durée est fixée 
d'avance, nous parlons de "rentes temporaires". 


R2. Les rentes versées sur la base de la durée de vie d'un individu sont appelées "rentes viagères". 


Puisque les termes sont souvent supposés constants, nous avons pour habitude de baser les calculs sur la 
valeur d'une unité monétaire. Ainsi, nous notons (les notations adoptées sont celles que nous trouvons 
dans la littérature car bien que peu pratiques, elles sont originales et jolies à regarder...): 


- 42 la valeur actuelle d'une rente d'une unité monétaire payable postnumerando (à terme échu) pendant 


une durée de n périodes 


- ä- la valeur actuelle d'une rente d'une unité monétaire payable praenumerando (d'avance) pendant une 


durée de n périodes 


- 5 la valeur finale d'une rente d'une unité monétaire payable postnumerando pendant une durée de n 


périodes 


- $ la valeur finale d'une rente d'une unité monétaire payable praenumerando pendant une durée de n 


périodes 
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Les relations qui déterminent ces valeurs font usage des propriétés des séries géométriques et de leur 
somme partielle (cf. chapitre de Suites Et Séries). 


4.6.1. RENTES POSTNUMERANDO 


À terme constant, pour calculer la valeur finale d'une rente à échéance/postnumerando, nous pouvons 
donc travailler uniquement sur le facteur de capitalisation en multipliant au final par le montant de la 
rente. 


Exemple: 


Nous souhaitons calculer la valeur finale d'une rente postnumerando de 3'500.- versée durant 10 périodes 
et calculée au taux d'intérêt périodique de 6%. 


Les versements ont lieu aux dates 1, 2... et 10. Le versement €, =3"500 de la date 1 a pour valeur acquise 
à la date 10: €; (1 + th) De même, le versement de la date 2 rapporte des intérêts pendant 8 ans. Sa 


valeur acquise date 10 est donc: €; (1+ 8%) etc. Finalement le versement de la date 10 (que nous venons 


de déposer à la banque) a pour valeur C;. La valeur acquise des 10 versements est donc, en posant 
f. =1+£% (nous démontrerons les simplifications juste après): 


1- f} 10 _; 
ete + fS +...+ f +f)=Q (F2 + fe AE A | =C — ; -GÉ a | (66.156) 
10 _ 
= c, À TL 461132 80 - 
É% 


Donc la rente postnumerando est un versement à termes constants et à taux constant durant un nombre de 
périodes données conduisant à une suite géométrique simple. 


Rappelons donc (encore une fois!) que: 
C,=C,f" (66.157) 
Sous la forme de rente postnumerando à termes constants, nous avons alors sous forme générale: 
C=Cf +Of +Cf7 +. + Cf (66.158) 
Ce qui s'écrit: 
CCR +f + fr. + fm Ce (66.159) 


donc: 


#-l 
_ + 
S = D. (66.160) 
+0 


En fait, nous avons donc une suite géométrique de raison q (cf. chapitre de Suites Et Séries). Dès lors: 
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D ed VEN. PE, 


_ 4% "a tqat.tga, a ta t..+a, 


Ma") (66.161) 
d “4 
5, ras, 49 dy > 6, … PET ie, 
et donc: 

xl 1- . — f* x — 

CD A sl fr) _ 1 Je HT Go167) 

+1 (1-f) nt À FA =] 

Finalement: 


1 
s (66.163) 
5% 


Nous avons donc pour notre exemple dix périodes (et dix termes donc avec # = 10 ): 


# 10 _ 
Co = 35005 = 3'500 À = 3500 = 46"132.80. - 
#0 | 


Ce capital correspond donc à la somme acquise au bout de dix périodes. 


La méthode de calcul de la "valeur actuelle d'une rente à l'échéance/postnumerando" fonctionne sur le 
même principe mais à l'envers selon la relation démontrée plus haut: 


_ # 
C,=C,f, (66.164) 
Donc si les termes (montants versés) sont constants nous pouvons écrire: 


CC (A + fr ++ ff =C a (66.165) 


donc: 
x 
aa = D (66.166) 
+ 
Or: 
d, "dt FFE, 
: _ Es es RE 
5,748, a a —S, da)  ‘(i-a) 
alors: 
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l 
& CL = C VERRE C FS = 
x] | sr) 1- dl FA p=1 el (66.168) 


finalement: 


_ t: 1 
= = 1 Je (66.169) 
: 1% 


Remarque: La valeur €, = C,a- correspondant donc au montant qu'il faudrait placer sur un carnet 
d'épargne à t% afin de pouvoir y faire un retrait périodique €, constant durant les n périodes et ainsi 
solder le compte. 


Nous avons également les relations entre les rentes postnumerando actuelle et finale: 


3 me 
: 1% ah = fs (66.170) 
n Zen °° 
D in 
5% 


Nous avons également les opérations en chaîne suivantes: 


k 
Gp = aa + flan = fa ta 
D 


S. 


Ha 


x = +4 
a Je Sp Je Sn * Su 


Remarque: Il est clair étant donné a; fe.#% connus que # =In(1 - {oa-)/In(j.) et ainsi de suite 
pour les autres types de rente. 
4.6.2. RENTES PRAENUMERANDO 


La méthode de calcul de la "valeur actuelle d'une rente à l'avance/praenumerando" fonctionne sur le 
même principe que la dernière toujours en utilisant la relation €’, = C,.f. mais cette fois les termes de la 


suite géométrique changent puisque le payement se fait à l'avance: 


Ch = CU + fe + LE ++ FT |=C &1 (66.172) 


donc: 
xl - 
=D A (66173) 
+0 
Or: 
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D md ta FFE, 


L gs, — 44) +g4, +... + ga, 4 +4 +..+a, 


| (1-3) (66.174) 


dn —& 
a ra > S, = += =———— 
’ {-9) ‘-9 
alors: 
ao É) ue 1 
DD EE ee 
xl 2 (i-f) + f.-1 (66.175) 
Je ï 
finalement: 
Re (66.176) 
“PL 


Remarque: Pour le même nombre de périodes et le même taux , nous avons 4= > 42 Car 4 = fa. 


La méthode de calcul de la "valeur finale d'une rente à l'avance/praenumerando" fonctionne sur le même 
principe que la dernière toujours en utilisant la relation €’, = Cf”. mais cette fois les termes de la suite 
géométrique changent puisque le payement se fait à l'avance: 


C,=C, (£ LE PE #2] = Cé (66.177) 


donc: 
LA 
& =D f (66.178) 
+1 
Or: 
ÿ, a +a tra 
S, =gataat..tga, =a ta +..+a 
45, 44 T 44; ga, 2 3 7 (66.179) 
4 4 _ 
S -g$ =a -a. . —=$, =“ xl - 
* * 1 #+1 x (1-4) 1 {l ) 
alors: 


ë D: - a. A) D a Ni, 
»l — £ € Ü-) £-1 1% (66.180) 
J. 1+4% 
finalement en notant 4 = nous avons: 


1+4% 
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=] 
Je (66.181) 


Remarques: 


R1. Avec la même notation nous avons par ailleurs la valeur actuelle de la rente praenumerando qui 


Ie 
d 


LEA 4 .. 
rl = 
s ecrit d= 


R2. Pour le même nombre de périodes et le même taux, nous avons 5 ? 5 car 55 = fs. 


4.7. ARRONDIS 


Pour arrondir un nombre x au multiple de 1/n le plus proche la relation à utiliser est la suivante: 


JF (x,#) 


ÆEfax+05] 
= 166.182) 
ñ# 


La démonstration est intuitive. Il suffit de s'imaginer l'axe des réels et de couper celui-ci en 1/n petits 
intervalles. Soit alors un nombre x donné, le nombre de ces intervalles dans x sera donné par: 


X 

—< = AX 
jl (66.183) 
À 


Enfin pour savoir quel est le nombre strictement inférieur au multiple recherché, nous prenons la valeur 
entière de la dernière relation et la multiplions par 1/n tel que: 


(66.184) 


Lex) = Eax]L = . 


# 
Si cependant, nous souhaitons avoir le nombre arrondi au multiple le plus proche, nous voyons alors qu'il 
faut rajouter 0.5 tel que: 


JF (x,#) 


(66.185) 


_ Efux + 0.5] 
# 


5. EMPRUNTS 


Les individus et les entreprises recourent souvent à l'emprunt (crédit) comme moyen financier. Nous allons 
ici définir les principaux types d'emprunts rencontrés dans la pratique ainsi que les relations qui les 
caractérisent. 


Définition: Nous appelons "emprunts indivis", un emprunt ne comportant qu'un seul prêteur, en général, 
un établissement financier. 


Les principaux points concernant les emprunts sont: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


- Connaître l'état de la dette à tout moment 


- Connaître le montant à rembourser à chaque période 
- Connaître l'intérêt dû à chaque période 


Définition: Nous appelons "annuités", les paiements effectués dans le cadre de l'apurement d'un emprunt. 
Une annuité comprend une part de remboursement R appelée aussi "amortissement financier" et une part 
d'intérêt 1 selon la relation: 


Annuité = Amortissement + Întérêts 
A=R+] 


La décomposition de l'annuité en amortissements et intérêts est une notion importante non seulement en 
finance mais aussi en comptabilité. En effet, la part d'amortissement financier correspond à un 
remboursement de dette à la différence de l'intérêt qui est une charge financière. 


Nous allons étudier ici trois types d'emprunts: 
1. Les emprunts remboursables à échéance fixe 
2. Les emprunts à remboursements constants 


3. Les emprunts à annuité constante (les plus pratiqués) 


Remarques: 


R1. Nous considérons ici des emprunts périodiques. Le passage d'une période temporelle à une autre et 
le calcul d'un taux équivalent se fera selon les relations déjà démontrées plus haut. 


R2. Des annuités mensuelles constantes sont appelées des "mensualités". 


5.1. EMPRUNT À ÉCHÉANCE FIXE (IN FINE) 


Définition: Nous parlons d'un "emprunt à échéance fixe" ou "emprunt in fine" lorsque chaque année, 
l'annuité comprend uniquement la part d'intérêt ! La dernière année, l'annuité comprend l'intérêt ainsi que 
la totalité (!) du remboursement de l'emprunt. 


Remarque: Ce modèle d'amortissement est particulièrement utilisé dans les emprunts obligataires, 
étudiés plus loin. 
Les relations suivantes permettent d'établir n'importe quel élément du "tableau d'amortissement". 
Ainsi, l'état de la dette (capital emprunté) C en début d'année k est: 


C, =C VE (66.186) 
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Le remboursement (amortissement) À, effectué en fin d'année k est égal à l'amortissement cumulé $, en 


fin d'année k et celui-ci n'a lieu qu'à la dernière année n tel que: 


KR "5" AA 66.187 
A lCsiksn 7 


l'intérêt payé /, sera constant tout au long de la durée du prêt selon un taux #% sur le capital emprunté 
C, tel que: 


1, = 1%0C, (66.188) 
L'annuité devient alors: 
A4 =1,+R, (66.189) 
Exemple: 


Voyons le tableau d'amortissement d'un emprunt de 1'000.- à 10% l'an remboursé à l'échéance au bout de 4 
ans. Le tableau d'amortissement correspondant sera: 


k C, fs | s, FA A 


il 1'000 0 | 0 100 100 
2 1'000 0 | 0 100 100 
3 1'000 0 | 0 100 100 
4 1'000 1'000 1'000 100 1100 


Tableau: 66.9 - Emprunt avec amortissement à échéance fixe 
Le coût du crédit représente la somme des intérêts soit 400.-. 


5.2. EMPRUNT A AMORTISSEMENT CONSTANT 


Définition: Nous parlons d'un "emprunt à amortissement constant", lorsque montant annuel remboursé est 
constant, c'est-à-dire identique d'année en année (système intuitif). 


Les relations suivantes permettent d'établir n'importe quel élément de ce tableau d'amortissement: 
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Coca = di, 
À # 


A 
KR, =R= È 
é (66.190) 
S% re 
ñ 
1, = 0, 
RE CE A 


Exemple: 


Un emprunt de 1'000.- à 10% l'an est remboursé par amortissement constant en 4 ans. Établir le tableau 
d'amortissement et déterminer le coût du crédit. Le tableau d'amortissement correspondant sera: 


k C, R | S, A A, 


1 1'000 250 | 250 100 350 
2 750 250 500 75 325 
3 500 250 | 750 00 300 
4 250 250 1'000 25 275 


Tableau: 66.10 - Emprunt avec amortissement constant 


Le coût du crédit représente la somme des intérêts soit 250.-. Donc on paie moins qu'avec le système 
précédent. 


5.3. EMPRUNTS A ANNUITÉ CONSTANTE 


C'est le cas le plus fréquent (la définition est dans le titre même). Il est utilisé par la plupart des instituts de 
petit crédit et de leasing. L'emprunteur connaît d'avance la somme qu'il aura à payer d'année en année. En 
d'autres termes, c'est comme s'il s'agissait d'un capital C que l'on doit solder en faisant à chaque période un 
retrait constant A: ce qui consiste à déterminer la valeur actuelle d'une rente postnumerando telle que: 


C'= Aa (66.191) 


Les relations suivantes permettent alors d'établir n'importe quel élément du tableau d'amortissement: 


C 
A= A, = D (G6:192) 
gl 


et puisque C'= 44, alors: 
Ci = Aa (66.195) 


dès lors, lorsque £ = 1, nous avons conformément à ce que nous attendons C1 = 44. 
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Et donc l'amortissement est de: 
R = A—{%C, (66.194) 


L'amortissement cumulé est un peu moins évident à trouver avec le bon sens, prenons pour démonstration 
un amortissement À avec taux t% sur n périodes. Nous avons par définition: 


k 
S% =ùR (66.195) 


il 
avec k=2 et n=3: 


R =A-1%C, 
(66.196) 
R = A-#%C, 
d'où: 
S, = 24-44 (C, +C,) = 24-1%( 4, + Aa) = Af2 = (a +ap)] 
- AP -#(# +P+fP+f +f)]-4P2 -Lh(2f} +252 +7) 


02 û 
D | 27 EE 7 SOS LE 
(1+1%) (+4%) (1+4%) (1+4%) 


= ral +49)? — 2% (201 +4%)? + 2(1 +4%) +1)] 


(+£ 
AT K [20 + 30% +307 +147) 06 (5 + 68% + 24% ?)] 
0 [ 
= 4 (2+ th] = Af Re 2+1% = Af> 26% +e4° 
(1 + 4%) FA 
2 
- gsl1t206 48 IT Qt) 1] à 
(66.197) 


Ainsi, nous avons: 

Si = Afé'sg (66.198) 
et aussi: 

1, = #4%0C, (66.199) 


Exemple: 


Un emprunt de 1'000.- à 10% l'an est remboursé par annuité constante en 4 ans. Établir le tableau 
d'amortissement et déterminer le coût du crédit. Le tableau d'amortissement correspondant sera: 
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287 287 1'000 29 315 


Tableau: 66.11 - Emprunt avec annuité constante 


Le coût du crédit représente la somme des intérêts soit 262.-. Ce résultat pourrait s'obtenir par: #4 - C'. 


Remarque: Les instituts financiers rajoutent différents frais au crédit comme les frais de dossier, les 
frais d'assurance, les frais de garantie, etc. L'ajout de ces frais a pour effet de faire augmenter le taux 
de prêt dont la valeur finale réelle (tous frais compris) est appelée "taux effectif global" (TEG). 
Comme chaque institut financier fait sa petite cuisine ou que chaque pays impose une méthode de 
calcul particulière (l'obligation de communiquer ce taux et la méthode de calcul associée est spécifiée 
dans de nombreux pays par la législation pour éviter que les consommateurs ne soient trompés), nous 
n'avons pas souhaité développer le sujet ici. Cependant, le lecteur intéressé pourra se référer aux 
exercices d'Économétrie disponibles sur le serveur d'exercices où il pourra trouver un exemple concret 
mais. particulier! 


6. THÉORIE MODERNE DES PORTEFEUILLES 


La théorie du marché des valeurs dite aussi "théorie moderne du portefeuille" est la théorie mathématique 
qui traite du choix, de la gestion et des opérations des échanges des emprunts, prêts et capitaux. Elle fait 
très fortement appel aux modèles statistiques et il est donc important d'avoir lu et compris le chapitre y 
relatif sur le site au préalable. 


Il faut cependant savoir qu'en pratique, dans les instituts financiers privés ou publics, seule une infime 
minorité des acteurs du marché connaît, comprend et applique des modèles mathématiques et pour les 
autres ayant obtenu des certifications ou diplômes de formation continue (CFA, FRM, CAIA, etc.), le 
niveau est souvent affligeant. Effectivement la grande majorité des traders (opérateurs de marché) se 
limitent à l'analyse graphique de diagrammes de Bourse du type bougies en utilisant des analyses du type 
moyennes mobiles, limites basées sur les cartes de contrôles (cf. chapitre de Génie Industriel) avec bandes 
de Bollinger ou autres USL/LSL, régressions linéaires et une trentaine de techniques du même genre (le 
plus drôle étant les indices empiriques ayant des noms scientifiques comme "l'indice stochastique" et qui 
sont en fait de simples variations relatives...). La gestion financière n'est donc finalement souvent que 
l'application du bon sens (quand il est présent.) sur la variation des prix en fonction des quantités... en 
analysant des graphiques et en sachant retirer ou déplacer ses investissements au bon moment. 
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Cette situation s'explique aisément: les modèles théoriques actuels du 20ème siècle et du début du 21ème 
siècle sont incapables de prendre en compte la complexité et l'interaction dans la complexité de notre 
monde moderne. Vous verrez effectivement dans cette section que la majorité des modèles mathématiques 
étudiés dans les grandes universités supposent des cas simplifiés et idéalisés (indépendance, normalité, 
variance finie, choix d'indicateurs statistiques empiriques, etc.). Donc dans la situation actuelle il vaut 
mieux écouter un trader qui est informé des stratégie des états et entreprises qu'un mathématicien pour 
lequel le monde se résume à un conte de fée (mais qui néanmoins lui permet de vendre des heures de 
conseil à un tarif très élevé et de rassurer des clients qui veulent à tout prix des prévisions qui n'ont 
quasiment aucun sens). 


Il faut aussi savoir que beaucoup sont persuadés que tout est écrit quelque part (croyance probablement 
assez ancrée dans la culture occidentale), qu'une sorte de réalité assez abstraite existe en dehors de notre 
monde concret et que si nous étions assez malins, nous pourrions la formaliser mathématiquement et 
prévoir les évolutions futures sur le long terme. Au fait le scientifique sait lui que nous avons affaire dans 
ce genre de domaine à un chaos déterministe du marché et que la seule manière de gérer celui-ci est de 
corriger au jugé avec une vague idée de ce qui va se passer. En économie les spécialistes parlent de la 
"dictature des marchés", mais c'est reconnaître en un sens que nous ne savons rien prédire! Évidemment, 
certains, dans les milieux de la complexité, vendent aux banquiers et à d'autres l'idée qu'ils sauront prédire 
les fluctuations de la Bourse. mais il suffit d'observer le passé pour voir qu'aucun modèle moderne 
n'aurait su le prédire. La seule chose que la mathématique peut faire dans la gestion financière, c'est 
d'analyser le comportement d'un actif financier idéalisé dans un cadre qui l'est lui aussi et c'est déjà pas 
mal et force un peu au bon sens... (pour ceux qui savent faire des maths ce qui est très loin du cas du 99% 
des personnes travaillant dans la finance). 


En finance, les modèles mathématiques serviraient donc à mesurer et quantifier le risque des 
investissements. À ce titre, ils jouent le rôle d'outils d'aide à la décision pour les gestionnaires, les 
investisseurs et les régulateurs. Mais, à de rares exceptions près, une banque ou un fonds d'investissement 
ne fonde pas une décision majeure d'investissement sur une équation mathématique. La décision, pour les 
banques d'investissement est souvent motivée par la recherche de rentabilités toujours plus grandes et pour 
cela elles ne s'appuient pas sur des modèles mathématiques. Par ailleurs, les personnes dirigeantes des 
banques privées ou d'état sont souvent des personnes issues du monde de la politique, du droit ou de la 
gestion d'entreprise avec peu de compétence pour comprendre réellement le fonctionnement des marchés 
(voir le programme des Master en trading de nombreux pays par exemple). Par ailleurs méfiez-vous des 
entreprises - particulièrement des multinationales - qui recherchent des spécialistes financiers maîtrisant 
Microsoft Excel ou Microsoft Access. Car cela signifiera qu'elles utilisent des outils non professionnels 
pour faire un travail qui lui devrait pourtant l'être avec des outils adaptés (et Microsoft Excel ou 
Microsoft Access ne le sont pas)!!! Donc en termes d'organisation interne, vous pouvez vous assurer que 
ces entreprises organisent et analysent n'importe quoi, n'importe comment, avec un outil non adapté et 
donc que c'est le bordel général en interne. 


Cela n'empêche cependant pas que pour ceux qui considèrent la mathématique comme un art (ce qui est 
mon cas), les modèles théoriques financiers ont une certaine élégance et permettent de comprendre 
rigoureusement le mécanisme de fonctionnement à défaut de pouvoir le prévoir. 


Il faudrait peut-être responsabiliser aussi ce domaine d'activité en mettant en place les mesures suivantes: 


- Exiger la documentation publique détaillée des composants (sous-jacents), algorithmes et modèles 
mathématiques des produits financiers. 
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- Imposer un niveau de fonds propre dynamique (réserve fractionnaire) aux instituts financiers en fonction 
de leurs positions sur les marchés et du risque des classes d'actifs gérés. 


- Obliger les acteurs sur un marché d'opérer dans un domaine d'activité ayant un certain niveau prédéfini 
de connexité avec la classe d'actifs gérée. 


- Limiter le nombre de transactions pour un actif financier non limité dans le temps et imposer aussi pour 
cette même famille d'actifs un temps minimum de non-transaction. 


- Obliger les personnes actives dans ce domaine d'activité de passer des examens régulièrement pour 
vérifier qu'ils comprennent bien ce qu'ils font et les hypothèses de travail y relatives. 


- Interdire les banques qui font du dépôt de faire également du négoce. 


Il y aurait donc un grand nombre de propositions à mettre en place pour redonner son but et son éthique 
originelle au domaine de la gestion financière. 


Définition: La "Bourse" ("Stock Exchange") est le marché public où s'échangent des titres (actions, 
obligations, contrats, options, etc.) dont la valeur va fluctuer relativement à la "valeur fondamentale" 
(valeur de base calculée selon des modèles théoriques) au gré de l'offre ("ask en anglais) et de la 
demande ("bid" en anglais). Lorsqu'un titre est beaucoup demandé, son prix monte, et inversement, 
lorsque personne n'en veut. La différence entre la valeur de l'offre et de la demande est appelée "spread" 
(en anglais mais c'est aussi le terme d'usage en français). 


La Bourse est une structure qui permet: 


1. Pour les entreprises qui veulent investir (donc augmenter leur capital) d'obtenir des fonds afin de 
satisfaire la demande potentielle. 


2. De rendre au plus stable l'économie en la rendant la plus dynamique et fluide possible (mais sous 
contrôle quand même...) dans le but qu'elle s'autorégule. 


Le système cité ci-dessus fonctionne si et seulement s'il est transparent, rationnel, efficient, autorégulant et 
équilibré! 


Remarque: Nous parlons de "bulle spéculative" lorsque les prix observés sur un marché boursier 
s'écartent trop de la valeur fondamentale des biens échangés. 


Avant de commencer à s'attaquer à la mathématique pure et dure, il va nous falloir au préalable donner 
encore une fois un grand nombre de définitions pour s'habituer au vocabulaire usité par les analystes et 
ingénieurs financiers (attention c'est relativement long...). 


7. ABSENCE D'OPPORTUNITÉ D'ARBITRAGE (A.O.A.) 


L'une des hypothèses fondamentales des modèles financiers usuels est qu'il n'existe aucune stratégie 
financière permettant, pour un coût initial nul, d'acquérir une richesse certaine dans une date future. Cette 
hypothèse est appelée "absence d'opportunités d'arbitrage" (A.O.A.). Elle est justifiée théoriquement par 
l'unicité des prix caractérisant un marché en concurrence pure et parfaite. 
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Pratiquement, il existe des arbitrages mais qui disparaissent très rapidement du fait de l'existence 
d'arbitragistes, acteurs sur les marchés dont le rôle est de détecter ce type d'opportunités et d'en profiter. 
Ceux-ci créent alors une force qui tend à faire évoluer le prix de l'actif vers son prix de non-arbitrage (son 
prix "réel"). 


Remarque: Le problème, c'est que le prix "réel" de l'actif, c'est le prix vers lequel le font converger 
acheteurs et vendeurs et quand ceux-ci se mettent d'accord entre eux... le système se grippe. 


Ainsi, si plusieurs actifs de même risque proposent des rendements différents, les investisseurs qui 
recherchent de nouvelles opportunités vont logiquement tourner leurs achats vers ceux dont le rendement 
est le plus élevé, ce comportement entrainant alors une baisse du rendement de ces actifs. 


La mathématique financière reposant sur l'A.O.A. laisse ainsi ces arbitragistes gagner de l'argent et néglige 
ces apparitions d'opportunités qui de toute façon n'existent toujours que sur un temps supposé très bref (ce 
type de stratégie est mis à profit aujourd'hui avec l'informatique qui peut donner des ordres de vente et 
d'achat à la milliseconde près). 


Un exemple royal pour illustrer ces propos est d'utiliser une version simplifiée du modèle élaboré par Cox, 
Ross et Rubinstein car il traduit explicitement le concept de l'A.O.A. et l'importance des modèles 
probabilistes. 


L'exemple se base sur l'hypothèse que le marché est formé d'un actif risqué et d'un taux de placement 
constant r. Par exemple, une somme de 1 dollar aujourd'hui, placée au taux r, engendre un revenu certain 
et garanti de 1+r dollars au temps 1 quelle que soit l'évolution future du marché dans l'exemple considéré. 


Nous commençons par étudier ce marché sur une seule période de temps telle que le temps initial sera 
noté £ = 0 et l'instant final £ = 1 (nous appelons une telle situation un "marché monopériodique"). Nous 
supposons parfaitement connaître le marché à l'instant initial. Dans notre contexte cela signifie que le prix 
de l'actif risqué est $, > 0 fixé et l'actif non risqué est déterminé par son rendement > > (0. 


Quant à l'actif risqué, sa valeur à £ = 1 n'est pas connue à l'avance. Afin de restreindre le champ des 
possibles, nous supposerons que le rendement de cet actif ne peut prendre que deux valeurs b (bas) et h 
(haut) avec: 


—1<b<kh 
Ainsi, l'actif risqué au temps £ = 1 ne peut prendre que deux valeurs positives. La valeur basse: 
S = Si(1+b) 
ou la valeur haute: 
S = So (1+#) 
d'où l'appellation de "modèle binomial".… 


Un investisseur peut ainsi acheter une quantité 4 d'actif risqué et placer une somme #, au taux r . La 


valeur # au temps £ = 0 du portefeuille de composition {5,#,) est donc: 
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À l'instant final, nous aurons: 
Fi = 8.8 + (1+r) (66.204) 


Comme nous l'avons expliqué plus haut, $ peut prendre deux valeurs, il en est donc de même pour F.Ce 
qui signifie que le revenu de ce portefeuille est incertain. 


Maïntenant, pour montrer le concept de l'A.O.A. passons à une application numérique en considérant la 
situation particulière où il est plus avantageux, et à coup sûr, d'investir dans l'actif risqué que le non risqué. 


Imaginons pour cela que nous empruntions 100.- à une banque au taux sans risque de 5% et que l'unité 
d'actif risqué que nous souhaitons acquérir avec cet argent soit cotée aujourd'hui à $, =100.-— celle-ci 


pouvant prendre deux valeurs futures: 


(66.205) 


| Ê = 1052 =5% 
© [S3 = 108 — À = 8% 
Nous avons alors pour notre portefeuille à l'instant initial: 
F5 = 8: So +#9 =1:100—-100=0.— (66.206) 
et à l'instant final deux cas possibles: 
Ps = 0-88 +0 (1+r)=1:105-100-(1+5%) = 0.— (66.207) 
et: 


Fn = 0: hn + #0 (1+r)=1.108-100.(1+5%)=3.-— (66.208) 


Nous voyons alors de manière triviale que si » « à il existe une opportunité d'arbitrage puisqu'il devient 
possible de gagner de l'argent à coup sûr sans en dépenser! Pour éviter une A.O.A. dans cette situation, il 
faut donc que le marché s'équilibre et qu'il y ait: 


b <r (66.209) 


Inversement, s'il est plus à coup sûr plus lucratif d'investir dans l'actif non risqué que dans l'actif risqué, le 
marché doit s'organiser pour éviter toute opportunité d'arbitrage de la sorte que: 


r <h (66.210) 


Ainsi, dans les deux cas, il faut éviter à tout moment que dans le marché binomial nous ayons une A.O.A. 
Et cela est seulement possible si: 


b <r<h (66.211) 
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L'absence d'opportunité d'arbitrage à deux implications simples (il y en a des moins simples comme nous le 
verrons bien plus loin....). Considérons le cas où nous avons deux actifs respectivement de rendement i et j 
et que nous savons que l'actif de rendement i ne fera pas défaut dans le paiement de ses dividendes. Par 
contre l'actif de rendement j pourrait faire défaut avec une probabilité 1 - p. Alors, de par l'A.O.A nous 
devons avoir: 


p(l+t)=1+; 


Donc nous pouvons en déduire la probabilité de non défaut de paiement de l'actif: 


et donc la probabilité de défaut: 


Ce type de raisonnement permet donc aussi d'exiger un rendement k d'un émetteur d'actifs (de type 
obligations typiquement) connaissant par expertise/audit la probabilité de défaut de 
paiement/remboursement par rapport à un actif sûr à 100% de rendement i. 


7.1. PORTEFEUILLES 


La majorité des transactions boursières concernent le contenu des "portefeuilles de titres" (security 
portfolio) qui sont l'ensemble des titres qu'un acteur du marché peut détenir. Gérer un portefeuille consiste 
donc (le plus classiquement...) pour un gestionnaire à chercher un retour sur investissement (RSI) maximal 
pour le client tout en minimisant les risques. 


EL 


Remarque: Le RSI est aussi parfois appelé "rendement" ou "taux de rendement" ou "taux de profit" et 
désigne donc un ratio financier qui mesure le montant d'argent gagné ou perdu par rapport à la somme 
initialement investie dans un placement (souvent sur la base d'une période annuelle). En général, ce 
ratio est exprimé en pourcentage plutôt qu'en valeur décimale. 


Les "titres financiers" (financial security) se dérivent sous la forme d'actions, d'obligations, d'options de 
devises et de matières premières tous appelés plus généralement "produits financiers" ou encore "actifs 
financiers" et dont les définitions (non exhaustives) seront données ci-dessous. Lorsque certains de ces 
produits sont mélangés, nous parlons alors de "produits structurés" (typiquement l'association d'un 
sous-jacent avec une option). 


Définitions: 


D1. Pour mesurer l'évolution générale d'un marché boursier, nous utilisons des "indices" reflétant la 
moyenne arithmétique (Down Jones Index par exemple) ou la moyenne pondérée (Swiss Market Index par 
exemple) des cours (valeurs) d'un certain nombre de titres représentatifs. Cela permettant d'en connaître le 
rendement. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 3839/4839 


D2. Un "produit dérivé" est un produit/instrument financier, qui s'achète et se vend, et qui est toujours bâti 
sur la base d'un titre financier. Ce dernier est alors appelé "actif sous-jacent" ou "support" du produit 
dérivé. Ceux-ci peuvent donc être des actions, des obligations, des devises, … et même des produits 
dérivés. Le danger avec les produits dérivés est, à force de les superposer de ne plus savoir exactement 
quels sont les sous-jacents. 


D3. La "volatilité" mesure l'amplification de la variation d'un cours. Autrement dit, un titre financier dont 
la volatilité est élevée voit son cours varier fortement, voire de façon exagérée sur une période donnée. À 
l'inverse, un titre dont la volatilité est faible voit son cours varier peu et/ou de manière assez cohérente. La 
volatilité s'exprime souvent en pourcentage dans les modèles mathématiques simples (car il en existe 
plusieurs définitions dont nous en verrons certaines par la suite). Ainsi, la volatilité d'un titre sur une 
période donnée est basiquement définie par: 


Cours Le plus haut - Cours le plus bas 
= ——_—_—_—_——_—ns; (66,715) 
Cours moyen 


Dans des situations complexes, la volatilité est souvent assimilée à l'écart-type et nous verrons cela plus 
loin. 


7.1.1. ACTIONS 


Définition: Les "actions" sont des papiers-valeurs reconnaissant par contrat des droits de propriétés sur le 
capital d'une entité dite "société anonyme" (S.A.). Ce contrat a un prix et il est échangeable sur le marché. 


L'action donne à son propriétaire des droits de différentes natures tels que les droits sociaux (droit de vote 
aux assemblées générales, droit d'élection et d'être élu au conseil d'administration) ou patrimoniaux (droit 
de recevoir une part du bénéfice net, sous forme de "dividende" variable représenté à l'époque du papier 
par un petit coupon numéroté à détacher/découper), ou une part du produit de la liquidation de la société 
si elle venait à tomber en faillite, ainsi qu'un droit préférentiel d'acheter de nouvelles actions en cas 
d'augmentation du capital. 
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ACTION DE DIVIDENDE 


Figure: 66.12 - Exemple d'action avec dividende à l'époque du papier... 
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Nous distinguons les actions suivantes: 


- "L'action classique" qui donne donc un droit de vote lors des assemblées générales, un droit à 
l'information (...), une droit à des dividendes. 


- "L'action privilégiée" qui offre un privilègre qui peut être une priorité lors des votes dans les assemblées 
générales ou une priorité lors de la distribution du dividende. 


- "L'action à dividende prioritaire" qui donne uniquement un accès privilégié aux dividendes (donc pas de 
droit de vote!). 


- Les "actions à bons de souscription d'actions" qui sont des actions qui donnent droit à leur détenteur de 
souscrire à de nouvelles actions à une date donnée. 


Définition: Il y a plusieurs types de "rendement boursier" en fonction du contexte d'une discussion qui 
sont pour certains intuitifs et pour d'autres assez complexes. Voici trois des plus courants (nous en verrons 
d'autres par la suite.) à notre connaissance lorsque l'on aborde pour la première fois la mathématique 
financière: 


- Il y a le rapport, exprimé en pourcentage et appelé "yield" ou "taux de rendement" (à ne pas confondre 
avec le "yield to maturity" ou "taux de rendement à maturité” que nous verrons plus loin), entre le 
dividende par action distribué par une société et le cours de l'action en circulation de cette société au 
moment du versement du dividende (certains prennent parfois la moyenne arithmétique des dividendes 
versés sur plusieurs périodes): 


Dividende versé 


a a a 
Cours de l'action 


- Il y a le rapport, exprimé en numéraire par année et appelé "rentabilité de l'action", de la différence entre 
le cours de vente de l'action majoré par les dividendes et le cours d'achat de l'action de cette société sur le 
nombre de périodes (exprimé souvent en années): 


_ (Cours de vente + Dividendes versés)-Cours d'achat . 


Rg 


nombre d'années 


Si nous divisons le résultat de ce dernier rendement numéraire annuel par le capital initial investi, nous 
obtenons le rendement en pourcentage. 


- Il y a le "taux de rendement implicite" (et son inverse le PER: "Price Earning Ratio") qui est le rapport 
entre le bénéfice net de l'entreprise et la valeur de capitalisation boursière et dont l'abréviation peut être 
confondue avec le taux de rendement interne (cf. chapitre Techniques de Gestion): 


TRI = Bénéfice net 


Capitalisation boursière 


Le TRI est donc une sorte de rendement entre le revenu potentiel de l'action et son prix (attention : il ne 
serait question du rendement réel que si l'on prenait en compte le rapport dividendes versés/cours de 
l'action qui peut être très différent). On suppose, à tort ou à raison, que l'entreprise a un meilleur usage à 
long terme à faire de ses bénéfices que de les distribuer sous forme de dividendes... 
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Le PER (l'inverse du TRI) généralement cité dans la presse est celui calculé sur le dernier bénéfice annuel 
publié. Toutefois les analystes se basent souvent sur le bénéfice anticipé pour l'année en cours. 


Exemples: 


E1. Prenons une action remboursable achetée il y a 6 ans au prix de 10.- (capital investi). L'investisseur la 
vend à 12.50.- L'investisseur a reçu 3 fois un dividende de 2.20.- plus une fois un de 1.-. Les deux types de 
rendements donnent alors respectivement: 


7.6 
Rg == 152% 
12.5 
Re 


6 
et si nous divisons ce dernier par le capital initial investi (10.-), nous obtenons donc 16.8%. 


E2. Le prix (frais compris) maximum que nous pouvons mettre pour acheter une action de 500.- 
rapportant un dividende de 12% à concurrence d'un placement identique avec un rendement de même 
périodicité de 5% est de 1'200.-. Effectivement, une telle action rapporterait 60.- de dividendes à chaque 
période (12% de 500.-). La somme qu'il faudrait placer pour avoir le même intérêt à 5% est 1'200.- (5% de 
1'200.- faisant aussi 60.-). 


E3. Le titre émis par une société (dont le capital est composé de 10 millions d'actions) cote 100.-, ce qui 
porte la valeur en Bourse de la société à 1 milliard. Le bénéfice net prévu est de 50 millions pour l'exercice 
en cours, Soit 5.- par action. La division du bénéfice net prévu par la capitalisation donne donc un price 
earning ratio de 20. 


Remarques: 


R1. Nous différencions les "actions au porteur" négociables sans restrictions en Bourse des "actions 
nominatives" dont la valeur doit être négociée avec des restrictions juridiques plus ou moins 
complexes, car il y figure le nom de l'actionnaire qui doit être inscrit au registre des actionnaires. 


R2. Lorsqu'une société anonyme veut augmenter son capital-actions, elle peut émettre des actions 
supplémentaires. Les nouvelles actions seront proposées aux actionnaires de la société à un cours fixe 
et en proportion des actions qu'ils détiennent ("droit de souscription") afin de ne pas les pénaliser 
contre une décote. Ceci leur permettra donc de maintenir le pourcentage de leur part dans le capital, 
ainsi que le poids de leurs droits de vote. 


Pour clore cette petite introduction sur les actions, signalons qu'un modèle théorique d'évaluation actuelle 
(dans le sens "à la date du jour") des actions porte le nom de "modèle de Durand". Son idée est assez 
simple: le prix Æ, d'une action aujourd'hui est égale à la somme de ses cash-flows (donc de ces dividendes 


2) actualisés au taux géométrique moyen du marché (ou attendu/exigé par l'actionnaire) de la période i 
correspondante 4% versés à chaque période k ainsi que de son prix de revente futur F- actualisé lui 


aussi. 
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Soit formellement: 


T 

pe Æ 4e D 

: (66.220) 
[I+6%: _ [I+6%) 


i=] i=] 


Si nous faisons l'hypothèse scolaire habituelle comme quoi le taux est toujours constant (sinon, nous 
utiliserons une moyenne géométrique des taux sur la totalité des périodes ou mieux encore une simulation 
de Monte-Carlo), nous avons alors: 


FT 
-__F Fi 2 7. 
a ——_—# #2, ——> (66.221) 
(1+4% #1 11+5%6 


Or le prix de revente en T sera égal à cette même relation et ce ainsi de suite jusqu'à l'infini, car une action 
n'a pas vocation à être remboursée! Nous avons alors: 


ff en 


Don La re (66.222) 
(1+4%) t-111+5% 


et comme: 
nu 0 (66.223) 
(1+5% 1 
Il reste alors: 
La] 
D 
BR =D —— | (66224) 
t-111+5% 


Maïntenant, considérons une simplification du modèle de Durand qui s'appelle le "modèle de Gordon et 
Shapiro" ou en anglais "Dividend Discount Model". Celui-ci considère qu'à chaque période, les dividendes 
croissent selon un même taux noté , d'où: 


D = Dita %} = D (1+44% FT (66.225) 


En appliquant ce que nous venons de montrer dans le modèle de Durand: 


+1 
pp 2 SR AGtE#) | D (ea) 
si Zn 2 . 
| (66.226) 
_ A Sfite%Ÿ 
148% 4 1+4% 
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Posons: 


1+6,3% 
1+6% (66.227) 
é—1=} 


Nous avons alors: 


ft 
nat (re) S g" (66.228) 
J 1+4% = 1+4% 1+4% 


Or, nous avons démontré dans le chapitre de Suites Et Séries, que pour toute suite géométrique de raison x 
est donnée pour rappel par: 


nH 
gs 2172 (66.229 
Le] 
l-g 


Donc si n tend vers l'infini et sous l'hypothèse que: 


c'est-à-dire que le taux de rendement attendu par les actionnaires est supérieur aux taux de croissance des 
dividendes, nous avons alors: 


œ 
rs: = 1 (66231 
-g  l-g 
Dès lors: 
1+4% 5 1+H%1-g 146%, lt 148% 1H6%71 44% (66.232) 
1+4% 1+4% 
D'où au final: 
(66.233) 
L%0— 4.43% 


Le taux de croissance des dividendes £.,% est déterminé soit à partir des données historiques de l'action, 


soit à partir des prévisions des analystes sur les futurs dividendes. 


Notons que nous trouvons cette dernièr relations souvent sous les formes suivantes dans la littérature: 
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D il+éa%1 Dil+gi 
tn h h-g 


ñ 


Les praticiens utilisent parfois la dernière expression sous la forme: 
t% = Ft 


pour comparer le taux de rendement t% de plusieurs actions connaissant leur dividende, leur prix actuel et 
le taux supposé de croissance des dividendes par des prévisionnistes. 


Exemple: 


Nous souhaitons valoriser une action qui verse un première dividende de 5.- et dont la croissance est 
supposée constante (à l'infini...) à un rendement (moyen géométrique) de 14.87% en comparaison à un 
rendement géométrique moyen du marchée de 20%. Nous avons alors le prix de cette action qui peut être 
estimée par: 


5 


= —— = 9746.- 
0.2—-0.1487 


Le 


Signalons pour clore cette évaluation des actions une propriété importante, aussi applicable aux obligations 
que nous allons de suite voir, et qui est le "risque de défaut de crédit". Ce risque, qui doit être quantifié au 
mieux en termes de probabilités, consiste simplement dans le fait que l'émetteur de ces actions pourrait ne 
pas répondre à ses devoirs et verser l'argent qu'on est en droit d'attendre de lui pour la simple raison qu'il a 
fait faillite ou que le système économique ne s'y prête pas (crise économique majeure par exemple). L'État 
garantit normalement seulement une fraction du gain attendu (garantie qu'il s'agit aussi d'actualiser 
mathématiquement). Dès lors, il faut savoir que: 


1. Le prix actualisé est toujours un peu plus faible que le simple modèle ci-dessus puisque celui-ci est lié à 
un événement n'ayant pas de probabilité égale à 100% (mais inférieure!). 


2. Le prix actualisé est en réalité une espérance pondérée par les probalités des scénarios économiques. 


3. Tous les modèles économiques algébriques sont idéalisés et il ne faut jamais oublier cela (ils ne 
prennenat pas en compte les phénomènes macro-économiques)|! 


7.1.2. OBLIGATIONS 


Contrairement à l'emprunt individuel (emprunt indivis), l'emprunt dit "emprunt obligataire" fait appel à de 
nombreux prêteurs, appelés "souscripteurs", qui reçoivent, en échange de sommes prêtées, des titres 
appelés "obligations". 


Définition: Les "obligations" sont des papiers valeurs (titres de créance) établissant par contrat des droits 
de créance (capital prêté) et qui rapportent un intérêt fixe (en général annuel) au titulaire (elles sont 
remboursables à une échéance prévue par le contrat). Ce contrat a un prix (dépendant de la date!), il est 
échangeable sur le marché et le débiteur est obligé de payer les intérêts. Par ailleurs si l'obligation est 
"convertible" elle donne droit au créancier d'obtenir soit le remboursement de l'obligation, soit sa 
conversion en actions, suivant des modalités fixées d'avance. 
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Remarque: Les actions et les obligations sont très différentes de par ce qu'elles représentent. Alors que 
l'action désigne un titre de propriété lié au capital social d'une société, cotée ou non, l'obligation est un 
titre de créances. L'obligation est donc basée sur les dettes d'une entreprise, d'un état, ou d'une 
collectivité locale alors que l'action est une part des capitaux propres d'une société par actions. Toute 
société composée d'actions n'est pas nécessairement cotée sur le marché boursier, et toute société n'est 
pas nécessairement une société d'actions. L'émission d'une obligation permet à l'émetteur de diversifier 
ses sources d'emprunts, et pour une action, de diversifier ses sources de financements. De plus en cas 
de faillite de l'émetteur, le détenteur d'une obligation est prioritaire sur l'actionnaire. 


Nous distinguons principalement trois types d'obligations: 


T1. "Obligation à taux fixe" ou "obligation ordinaire" qui est la plus classique des obligations. Elle procure 
un flux d'intérêt définitivement fixé lors de son émission selon une périodicité prédéfinie jusqu'à son 
échéance (ce qui est sécurisant) dont l'intérêt mathématique correspondant à ce flux est appelé "taux de 
rendement à maturité" (Yield to Maturity). Les financiers la désignent souvent sous le nom anglophone de 

"plain vanilla bond". Lorsque la durée du flux peut être considérée comme infinie, nous parlons 
"d'obligation perpétuelles".Ce n'est cependant pas un investissement sans risque comme nous le verrons 
dans un exemple simple plus loin. 


aies Em) 


De + pre 


| RE 1 
et vie 
Con # R1TLIEN 


dt MAIRES | à 
ds ‘am 


ut 112788 


Ouen te ITR 
its ss: 2 
qe fl 


se 


ALI) 
LR shine | 


ben © = Ririsés 


sm > ve pee mn) | | 


en DOTE MERE 7] 
Ds tam . DALLIIT] 
en # 4178464 | nus Al TRR ER } mot GEI RON 
4. mr © + CENTRE 


LA LIL] 


ur rpm 
COLA UILTIE 


Lib AIO LR TNT] Cine, SRELLEUES Le "| 
Ke LUE TE] — 
2: aitu d 
= — 


rien % RAT RES 


Cned RITES 


(S von = RIT NES 
Lao © 


ms à mn a a 


Figure: 66.13 - Exemple d'obligation à taux fixe avec coupons à l'époque du papier... 
o o 


L'obligation à taux fixe est classiquement cotée en prix ou en taux. L'obligation à taux fixe est évaluée par 
actualisation des flux futurs qu'elle délivre. 


Enfin, nous avons la famille des "obligations indexées": 


T2. "Obligation à taux variable" dont les flux d'intérêt, mais pas le prix de remboursement, sont indexés 
sur un taux de référence comme le taux directeur d'une banque centrale, les résultats d'une entreprise, ou 
autre. Le risque associé à ce taux variable est appelé "risque de taux". Pour le détenteur d'un portefeuille 
obligataire qui souhaite protéger son capital, il suffit alors d'immuniser son portefeuille contre les 
variations ce taux. C'est ce que nous appelons cela la "couverture en duration". 
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T3. "Obligation zéro-coupon" qui ne comporte que deux flux financiers: un flux initial (achat) et un flux 
final (coupon et norminal), sans aucun paiement intermédiaire (d'où son nom puisque qu'elle ne verse 
aucun coupon entre-temps ou des coupons à 0%... et que seul nominal est versé à l'échéance). C'est la 
moins risquée de toutes les obligations puisqu'elle ne verse qu'un seul coupon et que dès lors son taux de 
rendement effectif est égal à son taux actuariel d'origine (puisqu'il ne peut y avoir de réinvestissement 
entre temps). L'acquéreur souscrit l'obligation à un prix inférieur à sa valeur faciale, laquelle est payée à 
l'échéance du contrat. Le zéro-coupon est généralement indexé sur l'inflation. 


Les investisseurs obligataires à taux variable de type zéro-coupon préfèrent généralement les maturités 
courtes car le taux de rendement ne reflète exactement l'enrichissement de l'investisseur que si celui-ci 
peut réinvestir chaque coupon détacé au même taux et conserve l'obligation jusqu'à son échéance. Or ce 
type de scénario est difficiele à garantir sur le long terme. De plus il y a le "risque de défaut", c'est-à-dire 
la mise en faillite de l'émetteur. 


Inversement, les émetteurs ont habituellement une préférence pour les maturités longues, qui leur 
permettent d'étaler leur endettement dans le temps. La divergence entre la demande (les investisseurs) et 
l'offre (les émetteurs) se traduit par des rendements généralement plus faibles à court terme qu'à moyen et 
long termes. La "courbe des taux" qui est une fonction qui à une date donnée et pour chaque maturité en 
abscisse, indique le niveau du taux d'intérêt associé en ordonnée aux instruments financiers à terme a donc 
typiquement une forme croissante: 


Par exemple la courbe trésor des taux zéro-coupon US au 5 septembre 2001 ci-dessous issue d'obligations 
zéro-coupon du trésor américain: 
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À une date donnée et dans un pays ou une zone économique unifiée, il existe une multitude de courbes de 
taux. 


Quand la courbe des taux est plate, nosu parlons alors logiquement de "flat curve", quand elle est 
croissante de “"upward sloping curve" et quand elle est décroissante de "downward sloping curve". 
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Remarquons que le "taux zéro périodique" à échéance de n uités de période d'une obligation zéro-coupon 
de nominal C et de prix d'émission P peut être obtenu facilement à partir de la relation de l'intérêt 
composé: 


C'=Pil+#4%)" (66.237) 


Relation que l'on retrouv fréquemment dans la littérature spécialisée anglophone sous les forme s 
suivantes: 


C = PV (1+y) 
FV = PF 1+yT 


(66.238) 


avec PV qui signifie "Present Value", FV "Future Value" et le taux est noté y pour signifier "yield". 


Soit: 


1h 
& 4% = (2) —1 (66.239) 


Ce que l'on retrouve parfois dans la littérature plutôt sous la forme traditionnelle suivante (vive l'absence 
de normes...!): 


LT 

z(T\= W —] (66.240) 
PIT) 

Nous voyons que cette fonction pour un nominal donnée est est un prix d'émission donné à exactement la 

forme de la courbe des taux de la figure précédente! 


Exemple: 


Le taux zéro à 4 ans correspondant à un zéro-coupon de nominal 100 est de prix d'émission 90 (en-dessous 
du pair) est de: 


ln 1/4 
h%= (2) -1= Fe) _12267% (66.241) 


Remarque: Parmi les obligations, seules les zéro-coupon permettent d'éliminer réellement tout risque 
de taux entre deux dates. Une obligation à taux fixe classique génère en fait autant de risques de taux 
supplémentaires qu'elle est dotée de flux financiers intermédiaires: le taux de réinvestissement de 
chacun des coupons entre sa date de paiement et la date de remboursement final est, en fait, inconnu, 
même s'il est implicite dans le prix de l'obligation. 


Il existe une autre manière courant et très pratique d'écrire la valeur actuelle. Rappelons que nous avons 
démontré bien plus haut que sous certaines conditions: 
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C,=C,(1+4%) = Cyr" (66.242) 


Il vient alors: 


P= nr L _e_ = Ce hare (66.243) 
(1+4%)  (1+4%) 


Exemple: 


Considérons une obligation zéro-coupon qui paie 100.- dans 10 ans et dont la valeur actuelle est de 
55.3895.-. Ceci correspond à un taux de: 


Lx Lx 
4,70 = 5 —1]= Es —1=6% (66.244) 
P 55.8395 


Et intérêt continu, cela donne (conformément à la démonstration déjà effectuée bie plus haut): 
4,%=Ini1+#%)i=Ini1+6%)1=5.83% (66.245) 


Les obligations sont caractérisées par plusieurs propriétés: 
P1. Leur "devise" de base qui peut fluctuer sur un marché global. 


P2. Leur "date d'échéance" ou "date de maturité" qui permettra en fonction de leur date d'émission et du 
type de calendrier (échéancier) de connaître la valeur actualisée de l'obligation à tout moment. 


P3. Leur "valeur nominale", appelée le "pair", désigne la valeur servant de base au calcul des intérêts. 


P4. Leur "taux d'intérêt nominal" ou "taux facial" associé à la périodicité (souvent annuelle) permet de 
définir l'intérêt appelé "coupon" ou "coupon de dividende" appliqué sur la valeur nominale d'une 
obligation qui sera versée au souscripteur à la date dite "date de jouissance". Normalement le mode de 
calcul du taux d'intérêt doit être communiqué. 


P5. Leur "prix d'émission", "prix de souscription" est le prix réellement payé par le souscripteur pour 
devenir propriétaire d'une obligation. L'émission des obligations se fait donc au pair si la valeur nominale 
est égale à la somme demandée pour son acquisition. Le prix de souscription se fait en-dessous du pair si 
la somme demandée est inférieure au nominal (cas le plus fréquent), mais le prix peut au-dessus du 
nominal! La différence entre nominal et prix de souscription est appelée "prime d'émission". 


Le prix d'émission n'est pas toujours égal à la valeur nominale afin de donner envie au prêteur d'acheter 
sans forcéement proposer un taux d'intérêt nominal trop élevé. Ainsi, l'émission d'une obligation est un jeu 
subtil pour l'émetteur entre la valeur du taux facial et le prix d'émission. Aïnsi, si le taux d'intérêt nominal 
est légèrement supérieur à celui du marché il faudra probablement avoir une prix d'émission au-dessus du 
pair et inversement. 
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P6. Leur "prix de remboursement" ou "valeur de remboursement" est la somme réellement versée à 
l'emprunteur lors du remboursement de l'obligation à l'échéance. Le remboursement peut être prévu au 
pair ou parfois au-dessus à l'échéance (in fine), par tranches, ou jamais (obligations perpétuelles). La 
différence entre la valeur de remboursement et le nominal est appelée "prime de remboursement". 


ZA 


Remarque: L'investisseur doit être particulièrement attentif à l'indication "subordonné" sur son papier 
d'obligation, qui signifie qu'en cas de faillite du débiteur (assimilée au "risque de signature"), le 
détenteur de l'obligation ne pourra être remboursé qu'après tous les autres créanciers. Le risque de 
signature peut être évité en choisissant des obligations (très) sûres comme les obligations d'état ou de 
sociétés renommées. Le revers de la médaille est la faiblesse des taux alors offerts qu'il faut en plus 
mettre en opposition avec l'inflation (sur un taux de 3% sur dix ans d'une obligation d'état qui subit une 
inflation de 2% il ne reste plus que 1% de rémunération par exemple). 


Indiquons que les obligations à coupons multiples sont peu à la mode à cause du système d'imposition des 
États et aussi de par le coût des démarches administratives qu'elles génèrent. D'où le fait que les 
Zéro-coupon sont préférées. 


Exemples: 


E1. Considérons un emprunt obligataire de 3'000'000.- divisé en 300 obligations de 10'000.- nominal émis 
en juin 2004 pour une durée de 10 ans. Souscription: 99.5% de la valeur au pair. Remboursement au pair à 
l'échéance. Intérêt annuel fixe: 4.5%. 


Les valeurs définies plus haut s'expriment alors ainsi: 


La valeur nominale C de l'obligation est donc de 10'000.-. Le nombre N d'obligations est de 300. La durée 
n de l'emprunt est de 10 ans et le taux facial t% est de 4.5%. Le prix d'émission est de 99.5% de 10'000.- 
soit E = 9'950.- (en-dessous du pair!). Le coupon a donc une valeur c de 450.-.et le remboursement R 
s'effectue au pair et vaut donc 10'000-4500 = 5'500.-. 


E2. Soit une obligation à taux fixe, émise au prix de 1'000.-, et versant un coupon annuel de 100.-. Le taux 
servi est donc de 100/1'000=10%. 


Supposons que les taux du marché passent à 15%. Cela signifie qu'une nouvelle obligation, qui est émise 
au prix de 1'000.-, sert un coupon de 150.- (car 150/1'000-15%). 


La nouvelle obligation est donc plus intéressante que l'ancienne, et tout le monde va vouloir vendre 
l'ancienne pour acheter la nouvelle. C'est pourquoi le prix de l'ancienne obligation va implicitement 
baisser, jusqu'à ce qu'il corresponde à celui d'un produit financier procurant du 15%, soit ici 666.-. Alors, 
nous aurons bien 100/666-15%. 


De même, si les taux du marché baissent à 5%, cela signifie qu'une nouvelle obligation, qui est émise au 
prix de 1'000.-, sert un coupon de 50.- (car 50/1'000-5%). 


La nouvelle obligation est donc moins intéressante que l'ancienne, et personne ne voudra l'acheter. C'est 
pourquoi le prix de l'ancienne obligation va implicitement monter, jusqu'à ce qu'il corresponde à celui d'un 
produit financier procurant du 5%, soit ici 2'000.-. Alors, on aura bien 100/2'000=-5%. 
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Ainsi, le prix d'une obligation à taux fixe diminue implicitement lorsque les taux montent, et monte lorsque 
les taux baissent. C'est la raison pour laquelle un placement en obligationes n'est pas sans risques: on peut 
perdre une partie du capital. En fait, la seule stratégie sans risque consiste à acheter les obligations au 
moment de l'émission, et à les garder jusqu'à l'échéance. 


À tout moment, la valeur sur le marché d'une obligation à taux fixe ou taux variable doit donc être égale à 

la somme des valeurs actualisées des coupons et du remboursement auxquels elle donnera encore droit. La 
valeur actuelle étant calculée au taux du marché obligataire en vigueur pour des obligations du même type 
et de même durée. 


Ainsi, la valeur actuelle d'une obligation à taux fixe (le cas étant facilement généralisable à un taux 
variable) doit être vue comme un capital initial dont on retire pendant n périodes restantes une certaine 
somme fixe, somme correspondante au prix du coupon (taux facial multiplié par le nominal): 


c=i%.C 


avec C la valeur nominale de l'obligation et le tout cumulé étant périodiquement soumis à l'intérêt du taux 


Qi] 


du marché £,,% (donc le "taux à maturité”) constant dans le cadre d'une prise en considération d'un 


avenir certain. 


Ainsi, la valeur actuelle d'une obligation à taux fixe est dans un premier temps constituée que de la valeur 
actuelle des coupons futurs (appelés aussi souvent flux") restants pendant n périodes telle que: 


* # Î * Î 
CC er  Drreee n D Drepenres 
il (1+6,%0) in (1+4,%) in (1+6,,%0 1 


€ 


Que l'on retrouve dans la littérature spécialisée parfois sous la forme suivante: 


P=ery 
m1 (l+yi 


Cette partie du prix de la valeur de l'obligation correspond donc à la somme totale nécessaire telle que l'on 
peut solder À après avoir retiré n fois (le nombre de périodes restant) la valeur c à un taux d'intérêt £,,% . 


Remarque: Rappelons suite à ce que nous avons démontré dans le chapitre de Suite Et Séries, que si 
t,,% est inférieur à 1 et que la somme tend vers l'infini, alors: 


P € _{hC 


Tu ba % 


Ensuite, l'obligation est constituée de la valeur du remboursement R. Bien que celle-ci soit remboursée à 
terme, elle peut être vue comme un capital épargne à un taux correspondant à celui du marché £,,% tel 


que: 
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R=C, (1+2%) Cf SC, =Rf* (66.250) 


La valeur actuelle de l'obligation concernant le remboursement est alors: 


2 = Rf} (66.251) 


ce qui correspond au capital actuel pour obtenir le remboursement R après les n périodes restantes. 


Ainsi, le prix total d'une obligation à taux fixe, appelé aussi "prix obligataire de non-arbitrage" est: 


P 


Le! 
1 À 
= +R =c +R fe =) ————© + —————— | (66.252) 
1 h 
il (l+ép oi (l+éy%i 


c'est-à-dire la valeur actuelle des coupons futurs ainsi que la valeur actuelle du remboursement in fine. 
Cette relation à son importance en finance, il convient de s'en souvenir!! 


La valeur d'une obligation, au sens de son cours en Bourse, peut donc différer de sa valeur nominale fixée 
à l'émission si les taux d'intérêts changent sur le marché d'où l'intérêt de calculer sa valeur actuelle. 


Exemple: 


E1. Soit à calculer le prix actuel d'une obligation, ayant des coupons annuels de 450.-, avec un 
remboursement au pair dans 5 ans de 10'000.-. 


La valeur actuelle pour un taux du marché compris entre 0% et 100% a la caractéristique suivante: 


10000 


8000 


6000 


2000 


0 0.2 0.4 06 0.8 1 


x 
Figure: 66.15 - Valeur actuelle d'une obligation en fonction du taux du marché 
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E2. Aujourd'hui, nous achetons une obligation de maturité 3 ans, de montant principal 100.-, de taux de 
coupon 5% et de taux de rendement fixe 10%. Les flux perçus sont alors de 5, 5 et 105 au bout 
respectivement d'un an, deux ans et trois ans. Le prix de cette obligatione est alors égale à: 


P=S D + 9757. (66.253) 


1 105 
1(1+10%Ÿ  (1+10% L 


Évaluer une obligation revient donc à trouver ce qu'elle devrait valoir en principe dans les conditions 
actuelles du marché, donc son cours potentiel, par une opération mathématique dite "opération 
d'actualisation" déterminant sa valeur actuelle théorique. Il s'agit donc, comme nous le savons déjà, d'un 
calcul actuariel. 


L'obligataire aura évidemment pour objectif de chercher le taux du marché qui permet de faire de son 
investissement une action rentable. Ainsi, nous définissons le "” taux de rendement actuariel" (TRA) x 
comme étant l'intérêt du marché qui permet de satisfaire les relations suivantes, en fonction de la durée 
restante à courir n de l'obligation. 


Ainsi, à l'émission: 


R 
E = + Rf* = So pd + 66254 
ca Po 1. ë mA FL ë . ML (1 n D" (66.254) 
ou à une date quelconque: 
R 
Pam can + RE = 
ca + RF, rx (ie) + ex) (66.255) 


Le taux de rendement actuariel d'une obligation est donc le taux x qui annule la différence entre la valeur 
du prix d'émission E et la valeur actuelle des flux futurs qu'elle génère. Ce taux est calculé au jour du 
règlement et figure obligatoirement dans les brochures d'émission. Pour l'acheteur de l'obligation, le taux 
actuariel représente le taux de rentabilité qu'il obtiendrait en gardant l'obligation jusqu'à son 
remboursement et en réinvestissant les intérêts au même taux actuariel. 


Maïntenant, passons à quelques éléments mathématiques des obligations zéro-coupon de nominal C, de 
prix d'émission 


Voyons quelques autres définitions utiles relatives aux obligations: 
Définitions: 


D1. Le "coupon échu" (C.E.) d'une obligation est payé à son propriétaire sous déduction de 74% d'impôts 
anticipés (IA étant l'abréviation de: Impôts Anticipés). Ainsi, le calcul du coupon net annuel d'obligations à 
X.- (valeur monétaire) à rendement de Y % est trivialement donné par : 


CE = X'F(1- 24%) (66.256) 
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D2. "L'intérêt couru" (1.C.) est le montant de l'intérêt qui s'est accumulé depuis la dernière date de 
paiement de l'intérêt, mais qui n'est pas encore dû. Il est gagné par une obligation depuis sa dernière 
échéance et est déterminé lors d'une vente ou d'un inventaire. Son calcul est trivialement donné par une 
application des règles de l'intérêt simple telle que: 


_XF' M 
360 


IC 


où 4 est bien évidemment le nombre de jours compris entre la date de la dernière échéance et la date de 
jouissance (l'année commerciale étant définie comme ayant 360 jours). 


Remarque: Donc pour obtenir la valeur effective d'une obligation, nous ajoutons à sa valeur cotée 
(appelée "prix immaculé") l'intérêt couru depuis la dernière échéance. 


D3. Par extension, si nous cherchons à calculer la valeur nette de X coupons à Y% dont la valeur 
nominale vaut Z avec un impôt anticipé de 1A% , nous calculons le "coupon annuel net à l'échéance" 
(C.A.E.) par la relation triviale: 


CAE = À'Fh:'Z'(1-74%) 


Contrairement au calcul de l'intérêt couru, le calcul du dividende couru est impossible. Le cours de l'action 
est toutefois influencé par la date plus ou moins proche du paiement du dividende. 


7.1.3. BONS DE SOUSCRIPTION 


Définition: Un "bon de souscription", également appelé "option de souscription" ou "stock-option", est un 
titre financier permettant (donc il n'y a pas obligation!) de souscrire pendant une période donnée, dans une 
proportion et a un prix fixé à l'avance (souvent une moyenne des cours de la Bourse avant l'émission des 
bons), à un autre titre financier sous-jacent (action, obligation, voire un autre bon...). 


Le bon permet donc d'être intéressé à la hausse ou à la baisse d'une action sans avoir à y consacrer le 
même montant de capitaux qu'en achetant directement des actions. Ainsi, lors de l'acquisition, si le titre 
sous-jacent à une valeur plus élevée que sur le bon de souscription, l'acquéreur fera un bénéfice qui est 
appelé "plus-value d'acquisition". Ensuite, l'acquéreur qui possède maintenant les titres sous-jacents peut 
très bien vendre ceux-ci lorsque le prix est plus élevé que lorsqu'il en a fait l'acquisition et cela engendre 
alors un (pseudo) second bénéfice appelé "plus-value de cession". 


Un bon de souscription peut être donc attaché à l'émission d'une action ou d'une obligation. Alors, selon 
les cas, nous parlons "d'actions à bons de souscription d'actions" (ABSA) ou "d'obligations à bons de 
souscription d'actions" (OBSA) mais également "d'obligations à bons de souscription d'obligations" 
(OBSO) ou "d'actions à bons de souscription d'obligations" (ABSO). 


Dès l'émission de ces valeurs composées, le tout se scinde en parties: les actions ou les obligations 
redeviennent des titres classiques et les bons acquièrent une vie propre. Ils sont cotés séparément après 
l'émission. 
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Les "plans de souscription", plus connus sous le nom de "plan de stock-options", sont des paquets 
d'émission de bons de souscription (nominatifs) destinés aux employés méritant d'une entreprise et visent 
très souvent à renforcer l'association au développement entre cette même entreprise et ses salariés. Ainsi, 
ces derniers lors de l'acquisition des titres seront des actionnaires à part entière, recevant des dividendes et 
pouvant participer aux assemblées des actionnaires. Ce qui est censé accroître la motivation de l'employé 


CG): 


Par ailleurs, les stock-options (données par l'entreprise), sont des actifs financiers sans risques puisqu'il n'y 
a aucune obligation de les appliquer et qu'ils ont été offerts. Précisons aussi que bon nombre d'entreprises 
annulent les bons de souscription des employés qui les quittent. 


Exemple: 


Le bon de la société X permet de souscrire à une action de cette société au prix de 500.- jusqu'au 30 avril 
2004. Si l'action X dépasse le niveau de 525.-, le bon qui permet de se procurer une action à un coût 
inférieur au cours de Bourse se révèle un placement gagnant. Si l'action X vaut donc par exemple 525.- en 
avril 2004, le gain vaudra 25... 


Remarque: Le développement de la liquidité sur les marchés d'actions et d'obligations a incité les 
établissements financiers à émettre des bons de souscription permettant de faire l'acquisition de titres 
financiers (sous-jacents) existants indépendamment des opérations financières de la société concernée. 
Sauf exception, ceux-ci ne concernent que les investisseurs et sont émis uniquement par les banques 
entre elles et ne permettent donc pas le financement d'entreprises (il s'agit donc de pure spéculation!). 
Ces bons (également cotés) sont fréquemment appelés "warrants" (Warrant Call ou Warrant Put) ou, 
plus précisément "covered warrants" (warrants couverts) car, dès l'émission, l'établissement financier 
se couvre en rachetant des titres sur le marché (les warrants sont basés sur le même principe que les 
options et utilisent les mêmes outils mathématiques). 


D'un point de vue conceptuel, un bon est assimilable à une option d'achat (Call) vendue par une société 
sur des actions à émettre ou existantes (voir plus loin la définition détaillée de ce qu'est une option). Le 
prix d'exercice de cette option est le prix auquel le détenteur du bon peut acheter le titre financier 
correspondant et l'échéance de l'option est celle du bon. 


Cependant, l'évaluation d'un bon présente quelques particularités par rapport à une option: 


- Un bon a généralement une durée de vie longue (2 à 4 ans) et rend difficilement acceptable l'hypothèse 
de constance des taux d'intérêt utilisée par le modèle de Black & Scholes (voir la démonstration de ce 
modèle plus loin). 


- Toute opération de l'entreprise émettrice qui modifie la valeur du titre sous-jacent affecte la valeur du 
bon. Effectivement, les entreprises ont le droit de réserve légal d'émettre un nouveau contrat pour les bons 
de souscription et d'en changer la valeur et la période de temps de validité! 


- Si le titre sous-jacent est une obligation, son prix évoluant dans le temps et sachant que plus une 
obligation se rapproche de son échéance, plus sa valeur tend vers son prix de remboursement. Sa volatilité 
se réduit progressivement ce qui rend inapplicable le modèle de Black & Scholes qui postule la constance 
de la volatilité dans le temps! 
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Les opérateurs utilisent alors des modèles dérivés de Black & Scholes pour remédier à ces lacunes et 
évaluer le prix des bons de souscription. 


7.1.4. CONTRATS À TERME 


Ce type de contrat est symétrique, c'est-à-dire que chaque contrepartie a autant de chance de gagner que 
de perdre de l'argent. 


Définition: Un "contrat à terme", appelé "future" sur les marchés anglo-saxons (ou "forward" 
/"'commodity forward" lorsqu'il s'agit de contrats non standardisés négociés hors des marchés organisés) 
est un contrat d'achat ou de vente d'un produit financier, passé entre deux contreparties, dont toutes les 
caractéristiques sont fixées à l'avance: date de règlement, prix à terme, etc. Le prix conclu est appelé "prix 
à terme" ou aussi. "prix forward", et l'échange se fera à ce prix obligatoirement quel que soit le prix 


courant du marché du sous-jacent (dit aussi "spot price") à la date de livraison! 
Deux types d'exécution peuvent se produire: 


- Les "physical settlement" (règlement physique): le sous-jacent est effectivement échangé (ce qui est rare 
dans l'économie virtuelle mais devrait dans l'économie réelle être. une réalité). 


- Les "cash settlement" (règlement numéraire): si le cours du sous-jacent est en-dessous du prix fixé, 
l'acheteur (du contrat à terme) se fournit sur le marché qu'il veut et verse la différence au vendeur et 
inversement. 


Un contrat à terme doit faire référence âu rôle de chaque intervenant (acheteur ou vendeur), une référence 
officielle de marché (actions, indices, obligations, marché de changes, taux d'intérêt, etc.) dont le prix au 
temps t est noté $,, la date future de référence de relevé de la référence T, le prix du contrat à terme K, le 


montant notionnel sur lequel porte la transaction du contrat à terme N (qui est donc la quantité mais qui 
mathématiquement est presque toujours ramenée à l'unité), les instruction de paiement (physical ou cash 
settlement). 


L'intérêt des contrats à terme pour les intervenants est de figer des cours dans le futur: il s'agit dans ce cas 
d'une opération de couverture. 


A l'échéance, le gain ou "payoff" du contract est: 
Fr = Sr -K 


Cette valeur correspond tout simplement aux pertes ou profits latents (on inversera le signe suivant que 
l'on est vendeur ou acheteur). 

® Exemple: 

Un industriel suisse sait qu'il doit recevoir en euros une forte somme d'argent dans six mois. Pour se 
couvrir contre une baisse de l'euro, il achète un contrat de vente à terme, d'échéance 6 mois sur l'euro, en 
francs suisses (si les opérateurs financiers savent aussi que l'euro va baisser, le contrat de vente à terme 
aura un coût suffisamment élevé pour que l'achat du contrat ne soit pas intéressant). Notons que cette 
opération de couverture du risque de change peut lui être défavorable si dans six mois, le contrat cède 
moins que le taux de change. 
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Le pricing des prix de forward, dans le cadre d'une approche naïve, est assz simple dans l'hypothèse où 
l'actif sous-jacent ne verse pas de reveus (dividendes ou autres) que les investisseurs peuvent placer ou 
emprunter des capitaux sur le marché. Dès lor, le prix du forward à temps nul ne va logiquement pas être 


inférieur à $. (à moins que l'émetteur soit un très bon ami...). Le prix va être au mieux logiquement égal, 
(Il 


pour éviter toute opportunité d'arbitrage (autre hypothèse...) actualisé au prix du sous-jacent au taux t% 
du rendement géométrique moyen sans risque du marché tel que si la durée du contrat est T (sous-entendu 
un certain nombre de périodes) nous ayons: 


K(0) = Sp (1+4% 7 


et donc si déjà l'équivalement de t périodes de temps ce sont déjà écoulées, le prix du forward sera alors 
donné par (en adoptant cette fois la notation traditionnelle r pour le taux du rendement géométrique 
moyen sans risque du marché): 


K(D=KÆ =S8(1+r) * 


Ainsi, le prix de forward K (donc le prix à terme) est logiquement plus égal ou plus grand au sous-jacent et 
ce afin de réfleter naturellement la valeur temporelle de la monnaie. 


Dans la littérature, l'unité de période de temps étant souvent prise comme étant un petit élément de temps, 
nous retrouvons souvent cette dernière relation sous la forme suivante en utilisant l'intérêt composée 
continu (ne pas oublier que rigoureusement il s'agit d'une approximation dans la pratique!): 


FA » se (T+#) 


Il ne faut pas oublier que le terme r a dans la pratrique très souvent une certaine volatilité. Ainsi, le prix du 
forward a donc in extenso aussi une certaine volatilité!! 


Nous n'étudierons pas plus la mathématique des opérations et de la détermination des prix ("pricing") des 
contrats à terme (futures) maintenant, car comme ils ne sont qu'un cas particulier des options que nous 
allons de suite voir en détail, il serait redondant de présenter deux fois tous les théorèmes alors qu'il n'y a 
qu'une petite modification à faire par exemple dans le modèle de Black & Scholes pour obtenir l'un à partir 
de l'autre. 


Effectivement, comme nous allons le voir une option est un produit dérivé optionel qui ne donne pas 
forcément lieu à une exécution de part son caractère optionel par rapport à un contrat a terme ferme 
(futur, forward...) ou l'exécution est fixee à l'avance. 


Une entreprise va préférer des futures à des options si son but est de connaître ses coûts à l'avance alors 
qu'elle est certaine à 100% de consommer le sous-jacent. Alors que l'achat d'une option qui demande le 
paiement d'une prime de risque génère alors un coût d'opportunité. Dans le cas où l'entreprise n'est pas sûr 
de consommer le sous-jacent, elle devra préférer l'option qui peut être exécutée ou pas, ce qui fait que le 
management se réserve un bon résultat quoi qui ce passe mais alors paient la prime de risque de l'option. 
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Étudiant maintenant un cas intéressant de couveture du risque de la variation des prix des matières 
premières. Imagions pour cela qu'une entreprise à besoin d'acheter pour une somme totale S une matière 
première mais pour laquelle il n'existe malheureusement pas de contrats à terme (et aucun partenaire 
n'accepte de la faire gré à gré). Cette entreprise souhaite se protéger contre une variation haussière du prix 
de la matière première qui l'intéresse et alors deux stratégies s'offre à elle: 


S1. Trouver des contrats à terme d'une commodity positivement corrélée à la matière première intéréssée. 
Dès lors, en espérant que la commodity réplique bien le comportement de la matière première d'intérêt et 
que si son prix augmente alors l'autre augmentera très probablement aussi (si possible dans les mêmes 
proportions)... et l'idée est d'avoir une position d'acheteur de contrats à terme afin d'acheter la commidity 
à une valeur inférieure à celle des prix du marché et espérer trouver quelqu'un afin de la revendre aux plus 
pressants et utiliser la différence du gain pour acheter la matière première qui nous intéresse en subissant 
une minimum de pertes (voir même une perte nul ou même un gain!). 


S2. Trouver des contrats à terme d'une commodity négativement corrélée à la matière première intéréssée. 
Dès lors, en espérant que la commodity réplique bien de façon inverse le comportement de la matière 
première d'intérêt et que si son prix diminue alors l'autre augmentera très probablement aussi (si possible 
dans les mêmes proportions)... et l'idée est d'avoir une position de vendeurs de contrats à terme afin de 
vendre la commidity à une valeur supérieur à celle des prix du marché et utiliser la différence du gain pour 
achteer la matière première qui nous intéresse en subissant une minimum de pertes (voir même une perte 
nul ou même un gain!). 


Mathématiquement la stratégie consiste donc à écrire dans les deux cas (nous verrons plus loin quel signe 
correspondant à quelle stratégie): 


ÀÂV=AS+TNAF 


où AS est donc la variation du prix de la matière première d'intérêt sur le marché et Az le gain des 


contrats à termes qui repliquent positivement ou négativement (suivant la stratégie S1 ou S2) 
l'augmentation de du prix de S. Nous avons À} qui est la différence de la bonne ou mauvaise réplication 


et qui idéalement doit tendre vers zéro. Une autre manière plus conforme de voir les choses relativement 
aux informations disponsibles du marché est de prendre la variance de cette dernière relation: 


y = cËs + N'oËpt 2NOs ar 


et de chercher la valeur de N qui minimise la variance de À} en fonction de la corrélation des deux 


commodities et deur leur volatilité. Nous avons alors en dérivant par rapport à N: 


8ciy 
ON 


= 2NOËr Æ 205 AF = 


Ce qui donne en utilisant la relation entre la covariance et le coefficient de corrélation linéaire démontré 
dans le chapitre de Statistiques: 
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* _,Casar _,Casar _, Ras arCaSOar 


re) 


N = 


rt 


àF 


€T; 
_ AS 
= LRisar 
TAF 


(66.266) 


Comme les écart-types sont positifs et que N doit obligatoirement être positif (et arrondi à l'entier le le plus 
proche pour avoir une solution physique réaliste), il va de soi que le coefficient de corrélation doit toujours 
être de signe inverse au type de stratégie choisie. Raison pour laquelle finalement on a pour tradition (car 
cela revient toujours au même) de prendre que le signe positif tel que: 


N = Rasar 


€, 


TAF 


(66.267) 


et de prendre toujours la coefficient de corrélation comme étant toujours positif. Donc N* est le nombre de 
contrats à terme qui quelle que soit la stratégie, minimisera la variance totale. Il est cependant d'usage de 
ramaner cette expression telle que nous ayons non pas les variance de la variation des prix, mais de la 


variation des taux. Ainsi, comme nous avons: 


S = Os 5 
ix total Hé shit 
prix tote … quantité prix à l'urité 
quantité matËte de matière de la matière 
frenuere première première : 
(66.268) 
F = Or f 
. : Ce y 
prix derenient antité prix à l'unité 


des contrats à 


terme à termie 


Il vient alors: 


Gas = oiAS) = (A (Qs s))= Qyar As) = sQra ("| 


Our = OIAF = oiA(Qp. fil=OQroiAfi= Oro = 


Donc: 
# S 
N = Ragap 2 = Ragan ——<= 
Our PRES 
f 


Ce qu'il est parfois d'usage de noter sous forme condensée: 


de contrats d'un contrat 


àäterme 


(66.269) 
() 
T 
s / |[sQs 
5, à per) Cr (66.270) 
TT — 
Î 


(66.271) 
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La variance de V devient alors en utilisant cet optimum (nous reprenons le double signe qui va à nouveau 
nous être utile): 


2 


” " * TASAF SAS,AF 
TAF = És+N OÈr +2N TASAF = CËs + SE oÊr +2 Æ mA TASAF 
AF iF (66.272) 
OÙ.4Z / 4 
san 
= Po+ ES EF Lo LS AF 


Bien évidemment, le seul signe qui a ici un intérêt physique est le signe "-" qui va diminuer la variance 


globale (puisque c'est l'intérêt des deux stratégies). Nous avons alors: 


2 
oÀ Ras Ar Os Or | 
#2 9 ÀSAF ’ 2 2 
DAp = Ds TS ———_ 5% Tas — Rés ar OÀs 


Car 
ÀS à 2 ÀS . ÀS | 2 
(e(eee) roue e( ee) (eee 1h 


Soit au final: 


(66.273) 


* ÀS 
Day = {Ÿ) sOs/- Farr (66.274) 
5 ? 


® Exemple: 


Considérons qu'une compagnie d'aviation à besoin de 10'000 tonnes de carburant (dont le prix actuel est 
de 277.-/tonne) pour son parc de d'avions dans 3 mois et qu'elle souhaite se prémunir contre une 
éventuelle augmentation des cours de cette matière première transformée et qu'il n'existe pas de contrats à 
terme directement pour ce carburant. L'entreprise souhaïite alors se couvrir du risque en utilisant une autre 
commodity précise pour laquelle il existe des contrats à terme dont la quantité sous-jacente est de 42'000 
tonnes (à 0.6903.-/tonne). Nous souhaiterions calculer la diminuation de la variance du carburant en ayant 
un position d'achat de contrats à terme (donc nous faisons un pari à la baisse pour la commodity 
répliquante) schant que la variance à trois mois du carburant est estimée à 21.17% et celle de la commity 
répliquante de 18.59% sur évidemment la même période et que leur corrélation est en valeur absolue de 
0.8242. 


Nous avons alors: 


AS 

0.2117)  277-10'000 

N = Rein ses = (0248 SE) Eggs € 897 = 50 
| a.) Dr 0.1859 / 0.6902.42'000 


u 


*# 


(66.275) 


Comme nous avons pour la volatilité pure du carburant en numéraires: 
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ÀS 
Ts = sose(") = 277-10"000.0.2117 = 586409. — 
5 


Et une fois couverte par la commodity répliquante, celle-ci devient: 


Oiy = af2£ )ses Rlsar = 0.217: 277-10'0004/1- 0.824? 
S 


= 331 997 — 


Donc la couverture par des contrats à terme permet de réduire la volatilité numéraire d'environ 43.38%. 
11,5: OPTIONS 


Les options sont des "actifs conditionnels" ("contingent claim"), c'est-à-dire une forme particulière d'un 
titre (contrat), donnant à son détenteur contre le paiement d'une somme d'argent le droit, et non 
l'obligation d'acheter ou de vendre une certaine quantité d'un actif financier (action ou obligation), à ou 
jusqu'à une date (échéance ou maturité) et à un prix fixé d'avance. 


Il s'agit principalement d'un produit dérivé permettant de se couvrir des risques de variations des marchés. 
Par exemple, si Airbus vend un avion en dollars mais produit dans la zone euro. Le prix de vente est fixé 
aujourd'hui, mais la vente est réalisée à la livraison! Airbus doit alors se protéger contre le risque du taux 
de change (qui peut parfois être de 100% en quelques années seulement). En général, les entreprises se 
protègent de ces risques en achetant auprès des banques des produits dérivés comme des options. 


Remarques: 
R1. Nous reviendrons plus loin en détail sur les options qui sont des produits dérivés importants. 


R2. La principale différence entre les options et les contrats à terme (future) réside dans le fait que les 
options représentent un droit d'acheter ou de vendre à l'échéance du contrat alors que les futures 
représentent l'obligation d'exercer le contrat à terme. 


Définitions: 


D1. Une "option" est un produit dérivé qui donne le droit, et non l'obligation, d'acheter ("option d'achat", 
appelée aussi "Call") ou de vendre ("option de vente", appelée aussi "Put") une quantité donnée d'un actif 
sous-jacent S (action, obligation, indice boursier, devise, matière première, autre produit dérivé, etc.) à un 
prix fixé d'avance appelé "strike" K ou "prix d'exercice" E et durant (jusqu'à) un certain temps appelé 
"échéance" ou "maturité" T en échange d'une "prime" dépendante (C pour les Call ou P pour les Put) de la 
valeur intrinsèque à la maturité de l'option appelée "flux" ou plus souvent "pay off terminal" (et par 
certains "cible stochastique"). La détermination de la prime avec des modèles mathématiques est ce que 
nous appelons le "pricing" de l'option. Une option est donc une sorte de "contrat d'assurance" permettant 
de se prémunir contre les variations des coûts en transférant le risque sur une personne prête à vendre 
l'option contre une prime de risque. par ailleurs souvent appelée "prime d'assurance". 
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D2. Nous parlons de "cours spot" ou plus simplement "spot" pour désigner le cours en vigueur de l'actif 
sous-jacent S lors d'une transaction immédiate de l'option (Call ou Put). Si le sous-jacent consiste en un 
taux de change de devises, nous parlons alors de "cours du cross" ou plus simplement "cross". 


D3. Nous parlons de "cours forward" ou plus simplement "forward" pour désigner le cours qui sera en 
vigueur de l'actif sous-jacent S lors d'une transaction à maturité de l'option (Call ou Put). Nous retombons 
alors sur la définition d'un contrat à terme telle que vue plus haut. 


D4,. Si la valeur intrinsèque d'une option est positive par rapport au spot, elle est dite "dans la monnaie”. 
Dans le cas de l'achat d'un Call, cela signifie que le prix d'exercice est inférieur au cours spot. Il est donc 
possible dès lors d'acheter moins cher que le cours du moment à la date d'exécution de l'option (qui est une 
date comprise entre la date d'émission et de maturité de l'option pour rappel). 


D5. Si la valeur intrinsèque d'une option n'est pas avantageuse par rapport au spot, elle est dite "en dehors 
de la monnaie". Dans ce cas, le prix d'exercice est supérieur au cours du spot pour un Call par exemple. Il 
ne serait dès lors pas judicieux d'exercer ce Call à la date d'échéance (ni avant non plus), car cela 
reviendrait à acheter plus cher que le cours spot à cette date! 


D6. Si la valeur intrinsèque à ce jour du sous-jacent est égale à son cours du spot à maturité, la valeur 
intrinsèque est nulle et la valeur de l'option est dite "à la monnaie" (nous verrons plus loin les implications 


mathématiques de cela). 


Voici un tableau récapitulatif: 


Call 
Acheteur d'un Call Vendeur d'un Call 
(long Call) (short Call) 
À le droit, mais non À Moneeonnte 


l'obligation, d'acheter la 
valeur sous-jacente au 
prix fixé d'avance 
jusqu'à la date 
d'échéance 


vendre la valeur 
sous-jacente au prix 
fixé d'avance si le Call 
est exercé 


Put 


Acheteur d'un Put 
(long Put) 


Vendeur d'un Put 
(short Put) 


À le droit, mais non 
l'obligation, de vendre la 
valeur sous-jacente au 
prix fixé d'avance jusqu'à 
la date d'échéance 


À l'obligation d'acheter 
la valeur sous-jacente 
au prix fixé d'avance si 
le Put est exercé 


Il y a donc une différence mathématique d'une énorme importance entre les options et les 
actions/obligations. Effectivement, ces premières ayant une date d'exercice fixée, leur dynamique de prix 
peut être statistiquement prédictible et ceci d'autant mieux lorsque nous sommes proche de leur d'achat ou 
de leur date d'exercice (donc c'est une sorte de parabole que les financiers appellent "smile de 
volatilité"..). Leur volatilité est souvent maximale entre deux et ceci n'est pas applicable pour les 
actions/obligations car on ne sait jamais au niveau stratégique quand elles seront vendues ou 


respectivement achetées. 
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Remarques: 


R1. L'utilité de l'existence des options peut être vue comme la création d'actifs financiers permettant 
d'accroître la volatilité (écart-type ou "loss/gain deviation") du marché et ainsi son équilibre. 


R2. Pour des raisons évidentes, le détenteur ou acheteur d'un contrat d'option est dit être en position 
longue alors que sa contrepartie, l'émetteur ou vendeur du contrat, est en position courte. 


R3. Si l'option peut être exercée à n'importe quel instant précédant l'échéance, nous parlons "d'option 
américaine", si l'option ne peut être exercée qu'à l'échéance, nous parlons "d'option européenne". Une 
option non exercée est considérée comme "abandonnée" (perdue). Ces deux familles d'options dans 
leur version Call/Put sont en pratique regroupées sous le terme "d'options vanilles" ("plain vanilla 
options" en anglais). 


R4. Parallèlement aux options classiques, apparaissent depuis les années 1990, sur les marchés des 
options dites "options exotiques" caractérisées par le nom du lieu où elles ont été créées et la manière 
de calculer leur prix d'exercice à l'échéance comme les options asiatiques dont le prix d'exercice est 
fonction de la moyenne des cours du sous-jacent durant la durée de vie de l'option, ou les options 
parisiennes qui peuvent être annulées ou activées si le cours reste dans une certaine zoen plus d'un 
temps donnée, etc. 


Formalisons un peu plus les choses quand même... mais sans aller trop dans les détails (nous nous les 
gardons pour l'étude du modèle de Black & Scholes plus loin qui consiste à déterminer le montant de la 
prime). Ne considérons pour simplifier que des options portant sur un seul sous-jacent ne versant pas de 
dividendes. 


Nous noterons $, le prix (cours/taux de change) de l'actif sous-jacent de l'option au temps t et de maturité 


T'et ferons abstraction de la différence de notation entre Puts et Calls continentaux (américains et 
européens). 


Imaginons donc un Call, qui donne à son détenteur le droit (mais non l'obligation) d'acheter l'actif 
sous-jacent à tout moment entre aujourd'hui £ = 0 et £= 7 au prix d'exercice K fixé à l'avance. Prenons le 
cas pratique courant d'une option d'achat (Call) qui protège une entreprise par exemple contre la hausse du 
taux de change euro/dollar. Acquise aujourd'hui par l'entreprise, elle va lui conférer donc le droit (mais pas 
l'obligation) d'acheter 1 dollar en échange de K euros (le prix d'exercice ou strike K est une caractéristique 
fixe du contrat) à la date future T fixée (date de maturité). 


Si le taux de change en question vaut $, à la date t (i.e. 1 dollar = $, euros), cette assurance revient du 
point de vue de l'entreprise à percevoir un montant (pay off): 


max(Sr — K,0) 


euros à la maturité T et noté traditionnellement $,. À tout temps, deux cas se produisent dès lors pour 


notre acheteur du Call: 
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1. 8, < Æ°: dans ce cas, le Call donne le droit d'acheter au prix K le sous-jacent que nous pourrions acheter 


moins cher sur le marché. Dans le cas de notre Call pour le change dollar/euro nous aurons donc plutôt 
intérêt à faire le change au taux du marché plutôt que d'exercer notre Call puisque sinon nous aurons 
moins d'euros pour un même dollar. Mais nous perdrons la somme déboursée (la prime) d'achat des Call. 


2. $, > £ : le Call permet d'acheter le sous-jacent moins cher que sur le marché. Nous exercerons donc 


très probablement le droit (le profit étant la différence entre ces deux prix). Dans le cas de notre Call pour 
le change dollar/euro nous exercerons notre droit au taux plus avantageux garanti par le contrat d'option (1 
dollar = K euros) avec un gain noté traditionnellement: 


(S _ K)" 


Du point de vue de la contrepartie (vendeur du Call), dans le cas (1) elle ne verse rien à l'acheteur, et tout 
est oublié (le contrat expire; tout lien contractuel entre les deux parties disparaît). Dans le cas (2), le 
vendeur est assigné, il doit vendre à sa contrepartie l'action aux prix K. S'il ne détient pas cette action, il 
doit d'abord l'acheter sur le marché plus cher (au prix $. 2 #7). Dans les deux cas la contrepartie a 


encaissée par contre la prime par unité de Call. 


Ainsi, dans le premier cas, l'acheteur et le vendeur ne reçoivent ni ne doivent rien. Dans le deuxième cas, 
tout se passe comme si l'acheteur de Call achetait l'action sur le marché et recevait au même moment la 
somme $, - £ (pour le vendeur c'est bien évidemment l'inverse). Donc avec ces produits dérivés c'est le 


vendeur du Call (ou du Put) qui endosse presque tout le risque du marché et évidemment l'intérêt est grand 
de neutraliser ce risque en utilisant un formalisme mathématique (le modèle de Black & Scholes). 


Voyons un exemple maintenant du point de vue de l'investissement (la prise de risque est flagrante dans 
cet exemple): 


Exemple: 


Imaginons le cas d'une action valant actuellement 1'000.- (peu importe la devise) et qu'elle soit supposée 
augmenter de 12% en une année. 


Imaginons aussi qu'un investisseur ait l'alternative d'acheter l'action à 1'000.- ou d'acheter l'option Call à 
un prix d'exercice de 1'000.- (donc supposé égal au prix de l'action, ce qui n'est pas nécessairement 
toujours le cas) pour une prime de 40.- (nous verrons plus tard comment calculer les primes). Évidemment, 
l'investisseur peut alors pour 1'000.- acheter 25 options Call plutôt qu'une seule action. 


La question est de trouver l'investissement le plus intéressant: Ainsi, une augmentation de 120.- dans le cas 
de l'achat d'une action représente un retour sur investissement de 12% par année, alors que l'achat d'une 
option Call aura un retour sur investissement de 80.- (120.- de gains sur le prix de vente moins 40.- de la 
prime payée) soit de 200%. 


Il apparaît clairement dans cet exemple que la rentabilité d'achat d'un Call à même investissement est 
nettement supérieure à l'achat de l'action tant que la prime d'option ne dépasse pas un certain seuil. 
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Maïntenant abordons de manière détaillée et par l'exemple un autre concept que nous avons déjà 
implicitement présenté dans les paragraphes précédents et qui nécessite toute notre attention, car il en est 
souvent fait mention par les analystes. Il s'agit de "l'effet de levier" des options qui est une arme à double 
tranchant, une arme atomique de destruction massive de portefeuille (si le levien n'est pas calculé à 
l'avance et ce même approximativement). 


Lorsque nous évoquons les options, nous ne retenons souvent que le droit d'acheter ou de vendre un bien 
ou un instrument financier (à un prix fixé d'avance et durant un certain temps), en négligeant l'obligation 

correspondante du vendeur de l'option. Or, l'effet de levier qui caractérise ces instruments financiers peut 
rendre cette obligation dévastatrice pour le vendeur. 


Pour voir de quoi il s'agit commençons par le risque des Call. 
Exemple: 


L'acheteur d'un Call sur une action (par exemple) limite son risque à la prime de l'option pour un gain 
potentiel illimité. Le vendeur du Call se trouve dans la position exactement inverse: il encaisse la prime de 
l'option, mais prend un risque illimité. 


Prenons une action X cotée 350.- à la mi-octobre. Un investisseur parie sur la hausse du titre et achète 

12.50.- (la prime") une option Call à échéance janvier de l'année suivante au prix d'exercice de 380.-. 

Une représentation graphique permet de mettre aisément en relation l'évolution du titre (en abscisse) et 
son effet sur l'acheteur ou vendeur du Call. 


Considérons le cas de l'acheteur du Call: 


Tant que le cours de l'action reste en dessous de 380.- ("valeur de levier"), prix d'exercice, l'acheteur du 
Call n'aura aucun intérêt à exercer son option, qui est dite "out of the money". Par contre, si le cours de 
l'action progresse et dépasse le prix d'exercice, l'option est dite alors "in the money" et il devient 
intéressant d'exercer l'option. Lorsque le prix d'exercice de l'option est égal au prix du sous-jacent en 
Bourse, nous disons que l'option est "at the money". Dès que le cours de l'action dépasse 392.50. soit 
l'addition du prix d'exercice et de la prime de l'option à la mi-octobre (380+12.50), le détenteur du Call 
commence à gagner de l'argent sur son investissement initial. Si le cours du titre monte tout à coup à 500., 
soit une augmentation d'un peu plus de 30%, le gain sera beaucoup plus que proportionnel: pour 12.50.- 
investis, l'acheteur réalisera un bénéfice de 107.50.- soit un gain de 860%: c'est le fameux "effet de 
levier". 


gain 


>0 
392.50 


Prix action 


-12.5 
Perte 


Considérons maintenant le cas du vendeur du Call: 
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Tant que l'action reste en dessous de 380.- ("valeur de levier"), le vendeur du Call fait un bénéfice de 
12.50, représentant la prime de l'option. À partir de 380., le vendeur risque d'être obligé de livrer l'action 
au prix d'exercice, soit 380.-. À partir de 392.50, il commence à perdre de l'argent sur l'opération, 
puisque l'action qu'il devra sans aucun doute livrer vaudra plus chère que l'addition du prix d'exercice et de 
la prime encaissée. Si pour son malheur le titre monte effectivement à 500.- et qu'il ne le possède pas, il lui 
faudra aller le racheter en Bourse pour honorer la demande d'exercice du détenteur du Call, en perdant 


donc possible de perdre beaucoup plus que la prime encaisée. Nous disons alors que nous sommes en 
situation "d'appel de marge”. 


gain 
+125 
392.50 


Prix action 


<Û 
Perte 


Ainsi, si le prix du sous-jacent augmente de 3.29%, le vendeur du Call perd 100%. Nous parlons alors d'un 
lever de 3.29 pour 100 ou plus simplement d'un levier correspondant au rappot 100/3.29 soit un levier 
d'environ 30.39 (il est en de même évidemment pour le gain!). 


Maintenant intéressons-nous au risque des Put. 
Exemple: 


L'acheteur d'un Put limite son risque au coût de la prime de l'option pour un gain potentiel beaucoup plus 
important. En face de lui, le vendeur du Put se trouve dans la position exactement inverse: il encaisse la 
prime de l'option mais prend un risque beaucoup plus grand. Si nous prenons la même action X cotée à 
350.- à la mi-octobre, nous nous trouvons cette fois avec un investisseur qui parie sur la baisse du cours de 
l'action. Il achète donc pour 49.50.- (la prime") un Put d'échéance décembre au prix d'exercice de 390.-. 


Considérons le cas de l'acheteur du Put: 


L'acheteur du Put commence à réaliser un profit si le prix de l'action tombe en-dessous de 340.50.-, soit le 
prix d'exercice moins le prix de l'option (390-49.50). Entre 340.50.- et 390.- l'exercice n'est pas profitable 
mais permet de diminuer la perte. Au-dessus du prix at-the-money (390.-) l'exercice du Put n'offre 
vraiment plus aucun intérêt et nous disons alors que l'option Put est out of the money (O.T.M.). 
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gain 


>0 


prix action 


-49.5 
Perte 


Figure: 66.18 - Effet de levier pour l'acheteur d'un Put 
Considérons le cas du vendeur du Put: 


Le vendeur du Put encaisse d'abord la prime de l'option soit 49.50.-. Tant que le cours se maintient 
au-dessus de 390... il est gagnant. Si le cours de l'option se situe entre 340.50.- et 390.- il perd un peu de sa 
prime mais reste gagnant. En-dessous de 340.50 le vendeur du Put sera obligé au moment de l'échéance de 
verser 390.- à l'acheteur du Put (en vendant le sous-jacent et en versant la différence d'une manière ou 
d'une autre). Bien évidemment si le prix du sous-jacent tombe à zéro, le vendeur du Put peut ainsi perdre 
jusqu'à 340.50.- de fonds propres. 


Gain 


+495 


340.50 
Prix action 


<Û 
Perte 


Figure: 66.19 - Effet de levier pour le vendeur d'un Put 


Si nous réfléchissons un petit moment, une stratégie possible est d'acheter des Put et des Call du même 
sous-jacent avec le même strike et la même date d'expiration (échéance). Ce type de stratégie s'appelle un 
"straddle" ou "straddle purchase" ou encore "bottom straddle”. 


Ainsi, si le cours du sous-jacent est proche du strike K à la date d'expiration T alors le straddle engendre 
une perte nette (car nous n'utiliserons ni le Put, ni le Call et nous aurons perdu la somme équivalant à la 
prime des options). En revanche, si le cours du sous-jacent est assez loin du strike à l'échéance le profit 
peut être très important. 


C'est de la pure spéculation des banques d'affaires et cela devrait être objectivement interdit mais voyons 
en quand même le principe via un exemple. 


Exemple: 
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Considérons qu'un sous-jacent qui vaut actuellement 69.- va décaler violemment dans les trois mois qui 
viennent. Nous pouvons mettre en place une stratégie straddle en achetant à la fois un Call et un Put de 
strike 70.- et de maturité 3 mois. Supposons que le Call coûte 4.- et le Put 3.-. 


Dans le cas où à échéance, la valeur du sous-jacent est celle du strike K, pour le spéculateur c'est la pire 
situation car il aura perdu la somme des deux primes, soit 7.- car il n'avait n'a aucun intérêt à exercer le 
Call en utilisant son Put (puisque la différence est nulle entre les deux). 


Si le cours du sous-jacent reste à 69.-, nous perdons 6.- car le Call ne vaut plus rien à maturité (du moins 
comme il fait perdre de l'argent il serait peu judicieux pour un pur spéculateur de l'exercer) et le Put ne 
vaut plus que 1.- (car on va pouvoir vendre à 70.- quelque chose qui en vaut 69.- et cela fera un petit gain 
de 1.-). Donc: 


(—4+-3)+1=-7+1=-6.— (66.280) 


Si le cours du sous-jacent monte à 90.- (ou descend à 50.-), nous réaliserons un profit de 13.- grâce au Put 
car: 


(—4-3)+(90—-70)=13.— (66.281) 


Il faut espérer pour le spéculateur qu'il pariera correctement sur une forte variation ignorée de la majeure 
partie des acteurs du marché, sinon quoi les primes d'options seront suffisamment élevées pour que son 
gain soit dès lors quand même nul... Graphiquement le stratégie Straddle est souvent représentée sous la 
forme suivante (l'axe verticle est le gain, l'axe horizontal est le prix du sous-jacent): 


Acheter un Call Acheter un Put 
RE | 
Straddle 


Figure: 66.20 - Stratégie Straddle 


Nous pouvons résumer ces quelques propriétés sous la forme du tableau suivant: 
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PRE a En 

Achat de Call Hausse "Illimité" Limitée 

: de Put [Baisse Limité Limitée es 

EE de Call (Stabilité ou légère baisse Limité "limitée" = 

ne de Put Stabilité ou légère hausse Limité Limitée = 
Tableau: 66.13 - Différentes stratégies des options Call et Put 


7.1.6. FONDS DE PLACEMENT 


Définition: Un "fonds de placement" est un véhicule d'investissement (portefeuille de titres, d'actions ou 
d'obligations par exemple) que les établissements financiers proposent à leurs clients. 


Remarque: Un "hedge fund" ou "fonds couvert" est un ensemble de produits financiers utilisés comme 
couverture contre les fluctuations du marché. En théorie, si la Bourse chute, le hedge fund ne descend 
pas et a une performance absolue. Ces types de fonds alternatifs sont cependant réservés à une 
clientèle fortunée et avertie. 


Bien qu'un fonds de placement réunisse divers actifs financiers, les clients peuvent acheter les parts émises 
à une faible valeur par rapport à l'achat d'actifs individuels. Chaque part contient théoriquement une 
proportion de chacun des actifs se trouvant dans le fonds de placement. Elles garantissent un droit de 
participation à la fortune globale du fonds sans toutefois donner de droit sur les sociétés inclues dans le 
fonds. 


Un fonds de placement peut investir les montants de diverses manières dont les plus communément 
pratiquées sont les papiers-valeurs (actions, obligations), papiers monétaires, valeurs immobilières, régions 
(pays, continents), secteurs d'activité ou encore selon des objectifs personnels. Il existe en ce début de 
21ème siècle à peu près 30'000 fonds de placement à travers le monde. 


Les fonds de placement rendent souvent service aux petits portefeuilles: avec des montants relativement 
modestes, il est possible de bénéficier d'une bonne répartition des risques et aussi de prix de gros accordés 
sur les transactions effectuées par les gestionnaires de fonds. 


7.2. RETOURS ET TAUX D'INVESTISSEMENTS 


Pour définir l'objectif poursuivi par le possesseur d'actifs financiers, nous nous référerons à la motivation 
économique de tout acte d'investir. Celle-ci consiste concrètement à consentir présentement à une 
dépense, en vue d'un accroissement de patrimoine espéré dans le futur. 


De deux ou plusieurs stratégies d'investissements, la meilleure au niveau individuel est celle qui maximise 
le capital final de l'investisseur. 


Il existe alors différents types de retour sur investissements suivant l'objet d'étude. Aïnsi, nous 
différencions en finance (avant d'en voir les détails): 
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1. Les retours d'actifs financiers sur un horizon économique (return on investment) et leurs taux de 
rendement respectifs (rate of return). 


2. Les retours sur des investissements en comparaison à un taux géométrique moyen du marché et la limite 
du taux de rentabilité correspondante (internal rate of return). 


Ensuite, il faut considérer d'autres approches de taux de rentabilité. Outre les deux mentionnés ci-dessus 
les deux autres grands classiques sont (avant d'en voir les détails): 


1. Le taux de retour pondéré par les capitaux investis (M.W.R.R.) qui a l'avantage par rapport au taux de 
rendement interne de prendre en compte les investissements faits en dehors des périodes temporelles 
classiques. 


2. Le taux de retour pondéré dans le temps (T. W.R.R.) qui est un outil pratique pour mesurer la 
performance des gestionnaires de fonds car il ne prend pas en compte les flux (retraits ou investissements) 
des investisseurs qui sont incontrôlables. 


Voyons donc un peu tout cela: 
7.2.1. RETURN ON INVESTMENT 


En pratique, nous définirons l'objectif de l'investisseur comme consistant à maximiser l'accroissement de sa 
fortune initiale, quelles que soient les modalités de cet accroissement. Cet accroissement appelé donc en 
anglais "return on investment" (R.O.L.) ou, plus brièvement, "return" est défini par la relation (logique) 
dans le cadre de la gestion d'actifs par: 


R=(E-RnD+C 


où À, est donc le return de l'actif financier pour la période (se terminant au temps) t, À le prix du marché 
au temps t de l'actif financier et €, le revenu liquide attaché à la détention de l'actif financier durant la 


période (se terminant au temps) t. 


Le revenu € est supposé perçu au temps t, ou, s'il est perçu entre (£ — 1) et t, il est supposé ne pas être 
réinvesti avant le temps t. Le prix de marché P au temps {£ -1) est une valeur "ex-coupon" c'est-à-dire 
une valeur enregistrée immédiatement après (le détachement du coupon donnant droit à) la perception, au 
temps (£ -1), du revenu liquide afférant à la période (£ -2). Sur le plan empirique, l'hypothèse de 
non-réinvestissement jusqu'à la période élémentaire de temps utilisée est courte (un mois maximum), afin 
d'éviter des distorsions statistiques trop importantes dans le traitement des données chronologiques. 


Pour faciliter les comparaisons entre investissements, nous utilisons une mesure exprimée en termes 
relatifs le "taux de rentabilité" ou "rate of return" défini assez logiquement par: 


= (E —Æi1)+C, 
HS ne 


t-1 


où 7, est le taux de rentabilité pour la période t. 


Nous reviendrons lors de notre étude du modèle mathématique d'évaluation des actifs financiers sur ces 
outils. 
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7.2.2. INTERNAL RATE OF RETURN 


La mise en oeuvre d'un capital financier pour permettre la réalisation d'opérations d'économie réelle (c'est- 
à-dire le fait de consacrer, directement ou indirectement, ce capital financier à l'acquisition ou à la 
constitution de moyens de production, au sens le plus large de ce terme) peut donc produire à travers le 
temps des retours d'argent sous la forme de flux nets de liquidités appelés "flux net de trésorerie" (F.N.T.) 
ou encore "cash-flows" (C.F.) (cela fait toujours mieux en anglais...). 


Le calcul actuariel permet de construire formellement un critère de décision. En effet, nous définissons 
(logiquement mais sans toutefois être complètement réaliste) la prise de risque par le "goodwill" celui-ci 
étant donné par la relation démontrée dans le chapitre de Techniques De Gestion sous la démination de 
"valeur actuelle nette" (le terme "goodwill" étant souvent utilisé par les comptables): 


G=-1 5 fe 
ri 


Explications: 


Le deuxième terme à droite de l'égalité nous est déjà connu (nous en avons démontré l'origine dans le 
chapitre de Technique De Gestion) mais pour rappel sous la forme: 


: 1 
CD Ce ——— 
2 (1+ 4%)" 
Dans un contexte de certitude de l'avenir (...) il nous donne donc l'investissement initial à effectuer à un 
pourcentage donné constant (...) pour avoir un retour sur investissement (cash-flow) Æ, à un taux d'intérêt 


périodique moyen géométrique t% (taux du marché) avec T étant l'horizon de l'opération (nombre de 
périodes), À, étant la dépense initiale d'investissement. 


En d'autres termes, le goodwill de l'opération représente les flux excédentaires actuels obtenus après avoir 
remboursé la somme initiale investie sur sa durée d'utilisation et après avoir rémunéré le capital encore 
investi au début de chaque période au taux d'actualisation. 


Si: 


G > 0: accepter l'investissement 
CG < Ô : rejeter l'investissement 


G = 0: niveau dindifférence 


A la formulation du critère de décision telle qu'elle vient d'être présentée, nombreux sont ceux, notamment 
les praticiens, qui préfèrent la méthode dite du "taux interne de rentabilité" (TRI) ou "internal rate of 
return" (L.R.R.). Celle-ci n'est en apparence qu'une variante de la première formulation. Elle consiste à 
calculer un taux généralement symbolisé par la lettre grecque ©, qui annule la valeur du goodwill (il s'agit 
donc de déterminer le taux de rentabilité tel que la somme des flux nets de trésorerie soit égale au montant 


du capital investi): 


T 


F, 
DN——-1 
UE 


t=l 
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Si: 


2 > {0 : accepter l'investissement 
2 < £% : rejeter l'investissement (66.288) 


© = Ü: niveau dindifférence 


Nous voyons que le taux interne de rentabilité intervient dans le processus de décision de manière à 
première vue équivalente à celle dont il est utilisé dans le calcul d'une valeur actuelle nette. En outre, 
l'expression du résultat du calcul est indéniablement plus parlante que le montant absolu (goodwill) obtenu 
dans la première formulation. Nous inclinerions donc à adopter la seconde formulation si celle-ci ne 
présentait, à l'examen approfondi, l'inconvénient majeur que le calcul du taux interne de rentabilité 
comporte dans certains cas plusieurs solutions. La relation est en effet une équation polynomiale dont 
nous avons démontré, dans le chapitre d'Algèbre, qu'elle a autant de racines que le polynôme présente de 
changements de signe. 


7.2.3. MONEY WEIGHTED RATE OF RETURN 


Nous allons maintenant introduire un type de taux interne de rentabilité différent de celui lié au goodwill 
et qui s'applique mieux à la gestion de portefeuilles que le taux interne de rentabilité vu plus haut (qui 
rappelons-le se base sur l'hypothèse que les cash-flows sont déboursés à intervalles périodiques). 


Considérons un fonds F et les informations suivantes: 


1. La valeur du fonds #; € R, juste avant le temps 0. 
2. La valeur du fonds À € IR, juste après le temps 1. 


3. Une valeur monétaire totale nette 7 « IR investie durant la période [0,1] versée en deux moitiés en 
début et fin de période (pour simplifier l'exemple...). 


Les données qui vont nous intéresser sont les suivantes: 


1. La valeur Æ, + # {2 qui représente la valeur totale du fonds et d'une partie de l'investissement au 


moment (0. 


2. La valeur {1 +84) ! -N{2 qui représente le capital qu'il aurait fallu rassembler au temps 0 pour arriver 
en fin de période à la valeur N/2 lorsque le taux du marché est à un taux t%. 


3. La valeur (1+4%) 1. Æ qui représente au temps 0 la valeur du fonds à laquelle on voudrait arriver pour 


arriver en fin de période à Æ lorsque le taux du marché vaut aussi t%. 


La différence: 


- 1 N ; N 
(+84) A -(1+4%) = 0+%) (a ! >) (66.289) 


N 
donne la valeur qu'il aurait fallu capitaliser pour obtenir la somme (A - 3) , 
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Ce qui est trivialement intéressant pour un investisseur est alors de connaître le taux #% tel que le premier 
investissement égalise son objectif annuel. C'est-à-dire: 


N : N 
F LS = (1+4%) (a - 3) (66.290) 


soit: 


N _ N 
Fo + (141%) (e +) 0| (66.291) 


relation qui est appelée "relation de Hardy". 


Si cette relation se vérifie pour #,, “M connus et déterminés et un À supposé, un investisseur n'aura rien à 
( 1 
gagner ni à perdre à investir dans le fonds ou de capitaliser au taux du marché #%# . 


Si l'équation de Hardy n'est pas non nulle, mais positive alors l'investissement dans le fonds n'est pas 
intéressant. Si elle est négative, il vaut alors mieux investir dans le fonds. 


De l'algèbre élémentaire, nous conduit à la relation: 


Æ PE ÈR (1+4%) 1 (# _ à) D (66.292) 
2 P. F+£8 -1 
avec: 
Î=ÆA-Fo-N (66.293) 
Effectivement: 
N N N 
A -— A -—-F# -— 
£% = 2 427102 0 2247 R TN) 24H N) (66.294) 
FE, +— R+T 286 +N FB+A-(A-F-N) 


Le taux £%# est souvent nommé en gestion de fortune le "Money Weighted Rate of Return "(M.W.R.R.). 
ou "Taux de Retour Pondéré par les Capitaux Investis" (T.R.P.C.L.) et représente donc la performance d'un 
fonds (portefeuille) avec prise en compte des entrées et sorties de capitaux au cours de la période 
d'évaluation. 


Exemple: 

Un fonds a eu les revenus suivants pendant l'année 2006: 
- Valeur au 1er Janvier 2006: 30 MFr.- 

- Investissement dans le fonds pendant l'année: 18 MFr.- 


- Retraits sur le fonds: 30 MFr.- 
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- Valeur du fonds au 31 décembre 2006: 21 MFr.- 


Quel est le taux effectif (M.W.R.R.) de ce fonds en 2006 ? 


Nous avons alors comme données initiales Æ, = 30, = 21, M =18—30 = —-12 ce qui donne si nous 
assumons les hypothèses de départ concernant N : 


Î1=21-30-(-12)=3 (66.295) 
et alors: 


R = __à3 z 125% (66.296) 
21+30-3 


Considérons maintenant que nous savons que les investissements ont eu lieu la 3/8ème part et les retraits 
la 3/4ème part de l'année. 


Le M.W.R.R. est alors le taux du cash-flow: 
€ ={(0,30),(3/8,18),(3/4,-30),(L2T)) (66.297) 
Nous devons alors trouver t% tel que: 
30= 21(1+4%) —1801+2%) 95 + 3001449) #4 (66.208) 
La résolution de cette équation avec Maple 4.00b donne: 
#% =8.875 (66.299) 


Nous voyons qu'en considérant les cash-flows et les moments où ils ont lieu (donc une analyse plus fine et 
rigoureuse) nous réduisons le M.W.R.R. Par ailleurs, le dernier calcul étant plus rigoureux que le premier, 
c'est celui que l'investisseur voudra connaître en fin d'année. 


Ce taux est donc une mesure effective du taux d'accroissement du fonds, donnant l'impact du poids des 
cash-flows sur la valeur du fonds. Il s'agit aussi au fait d'une simple généralisation du de l'IRR (Internal 
Rate of Return). 


Remarque: En Suisse, certaines fondations d'assurance de la LPP (Loi sur la Prévoyance 
Professionnelle) communiquent la M.W.R.R. annuelle ou trimestrielle sur les 5 à 10 ans passés. 


7.2.4. TIME WEIGHTED RATE OF RETURN 


Nous allons maintenant nous intéresser à un autre outil financier de la gestion de portefeuilles utilisé 
également pour juger du rendement d'un investissement. 


Considérons un fonds tel que: 
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MAT erAN EN EETUEIN [SCIENCES.CH] 


1000 | 370 | 81 | 7.8 
10% | 3% |(4%)| 6% 
100 | 11.1 |(3.2)| 0.5 
(730) | (300) | (70) | 0 


1000 370 | 81.1 | 7.8 | 8.3 
Tableau: 66.14 - Time Weighted Rate Of Return 


Le 31 décembre 2000, le fonds a une valeur de 1000.-. Durant le premier trimestre 2001 il a un retour de 
10% mais nous imaginons que cette valeur est loin de celle qui était attendue alors l'investisseur retire 
730.- du fonds (portefeuille basé sur le fonds). Lors du second trimestre, le fonds a gagné 3% et 300.- 
supplémentaires ont été retirés par l'investisseur. Lors du troisième trimestre le fonds a perdu 4% et 70.- 
ont été retirés. Le dernier trimestre, le fonds a gagné 6% et aucun fonds n'a été retiré. 


Nous avons alors l'accroissement (retour) global sur l'ensemble de la période (année) qui est donné par: 


TRR = (14 0.1)(1+ 0.031 0.04)(1+ 0.06)-1=15.3% (66.300) 


Nous voyons bien que cette valeur est indépendante des flux monétaires du portefeuille de l'investisseur. 
Nous appelons la valeur de 15.3% le "Time Weighted Rate of Return” (T.W.R.R) ou "Taux de Retour 
Pondéré dans le Temps" (TR.P.T.) sur une base trimestrielle. 


En d'autres termes, le T.W.R.R. indique la performance d'un portefeuille sans prise en compte des entrées 
et sorties de capitaux au cours de la période d'évaluation. 


Ce cas particulier peut être noté de manière générale par la relation: 


TWRR=][(+R)-1] (66.301) 


2=] 


Il convient de se rappeler que si nous avions voulu calculer la moyenne du rendement du fonds par 
trimestre, nous aurions simplement utilisé la moyenne géométrique (cf. chapitre de Statistiques)! 


Le TW.R.R. est un outil pratique pour mesurer la performance des gestionnaires de fonds, car il ne prend 
pas en compte les flux (retraits ou investissements) des investisseurs qui sont incontrôlables. Aïnsi, nous 
avons une mesure de la qualité de la dynamique des fonds indépendante du choix des investisseurs qui 
pourraient considérer les retraits ou investissements comme des cash-flow qui serviraient à calculer un 
LR.R. qui n'aurait plus ou moins aucune signification par rapport à la dynamique du fonds. 


Remarque: En Suisse, certaines fondations d'assurance de la LPP (Loi sur la Prévoyance 
Professionnelle) communiquent la T.W.R.R. annuelle ou trimestrielle sur les 5 à 10 ans passés mais sur 
une base journalière. 
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7.3. MODÈLE SPÉCULATIF DE BACHELIER 


Après ces nombreuses définitions contextuelles, le but maintenant est d'introduire les techniques 
mathématiques spéculatives stochastiques de base utilisées en finance. En effet, la finance étant devenue 
au fil du temps un domaine de plus en plus concurrentiel, les marges sur les produits standards ont 
tendance à se réduire, la prime est donc donnée à l'innovation. Cette évolution a conduit à une 
sophistication croissante des produits financiers, faisant ainsi appel à des notions mathématiques poussées, 
basées principalement sur des modèles de probabilités, introduits par Louis Bachelier dans sa "Théorie de 
la spéculation" mais réellement utilisées que depuis 1973 grâce aux différents travaux de Black & Scholes 
et Merton (qui ont valu à leurs auteurs un Prix Nobel d'économie). 


Regardons pour commencer quels sont les développements proposés par Louis Bachelier dans sa thèse 
pour déterminer l'espérance mathématique prévisionnelle et l'écart-type prévisionnel d'un actif financier 
(résultat que nous utiliserons dans le cadre de l'étude du modèle d'évaluation de Black & Scholes). 


Désignons par p,, la fonction de densité de probabilité que le cours d'un actif soit x au temps t. Dès lors, 


la probabilité cumulée que la valeur du cours se trouve comprise dans l'intervalle élémentaire [x, x + dx] 
au temps t est de la forme: 


Pysdx 
dont l'intégrale sur l'ensemble du domaine de définition devra donner 1. 


En vertu du quatrième axiome des probabilités (voir chapitre du même nom), la probabilité que le cours 
évolue d'une certaine valeur à une autre (chaîne de Markov temporelle à temps continu), sera égale au 
produit de la probabilité cumulée pour que le cours soit coté x dans un intervalle donné à l'époque #, c'est- 


à-dire: 
Pas dx 


multipliée par la probabilité cumulée pour que, le cours étant coté x à l'époque £,, le cours soit coté z dans 


un intervalle donné à l'époque £, +£,, c'est-à-dire, multipliée par: 
Pare, AZ 
La probabilité cherchée est donc: 
PraP 3x3, AZAX 


Cette écriture suppose donc que les cours sont des variables aléatoires indépendantes... 


Le cours pouvant se trouver à l'époque # dans tous les intervalles dx compris entre +c , la probabilité 


cumulée pour que le cours soit coté z à l'époque £, +£, sera: 


+o 


[Pr Pr-rs,dzdx 
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La probabilité de ce cours z, à l'époque £, +£, a aussi pour expression: 


Pause, 4Z (66.307) 


Nous avons donc: 


+o 


Pre 4, 4z = (l Pa Pa-xe, ZX (66.308) 


ou: 


+ 


Pass — [Ps Pa-xs, x (66.309) 


telle est l'équation à laquelle doit satisfaire la fonction de distribution de probabilité p que nous 
recherchons. Cette équation est vérifiée, comme nous allons le voir, par la fonction: 


p = A8 Ë%* (66.310) 


Mais il ne faut pas oublier qu'il s'agit d'une solution particulière (raison pour laquelle ce modèle est parfois 
appelé "modèle gaussien de Bachelier"). et de plus rien ne dit que les deux variables aléatoires 
indépendantes suivent la même loi de probabilité... 


Les deux hypothèses de construction du modèle vues jusqu'à maintenant (indépendance et distribution 
identique) sont souvent indiquées en finance sous l'appellation des "hypothèses d'indépendance et de 


Zi 


stationnarité". 


Ceci étant dit, nous devons alors bien évidemment imposer (axiomes des probabilités obligent!): 


+ + à 
frx-afe dx=1 (66.311) 


L'intégrale classique qui figure dans le deuxième terme a pour valeur (cf. chapitre de Statistiques): 


+co 
-B?x? VI 
Ale dx = A— =] 66.312 
[ B (66.312) 


— 
nous devons donc obligatoirement avoir pour la normalisation: 
B= Ar (66.313) 
Il en découle: 
xt (66.314) 


En posant x = 0, nous obtenons À = p, c'est-à-dire que A égale la probabilité du cours coté actuellement. 
Il faut donc établir que la fonction: 
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p= 2e (66.315) 


où p, dépend du temps, satisfait bien à l'équation de condition ci-dessus. 


Soient »,,p, les quantités correspondant à p, et relatives aux temps £,,é,, il faut donc prouver que 


l'expression: 
1e 2,2 ? d 
fre + Ris dx (66.316) 
LS 


peut se mettre sous la forme 4,-## où A,B ne dépendent que du temps! Cette intégrale devient en 


remarquant que z n'est pas une variable d'intégration (nous supposons qu'il est indépendant de x comme 
vous l'aurez compris depuis le début) 


+© 
opte n -dApf+pi ht +2spèm 
nine fe Crabe (6317 


0 


Nous allons maintenant changer la forme de l'intégrale (nous changeons aussi de notation pour 
l'exponentielle sinon cela devient illisible): 


2 
4-2 \+ 2 
XP:2Z Z 
P1Pa EXP -Hp5z" ue [exp = NE + pi - dx (66.318) 
Pi *Pa = Vri +3 


et posons: 


2 
2 2 PaZ 
NE +? Te “4 (66.319) 
Pi * Pa 


Nous aurons alors: 


L'intégrale: 
+o 


? ue è 
fe” du = c'o du (66.321) 


—& 


ayant pour valeur 1 (cf. chapitre de Statistiques), nous obtenons finalement: 


4 _2 
3.2, ÀAP3Z 
PiPaexp|-7p3z + — : - 
F1 * Pa P1P3 É l (66.322) 
EXP | ——— 2 


dard : 2 2 
Pit P2 Pi *P2 
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Cette expression ayant la forme désirée puisque: 


2.2 
PiPa |. PAP2 ,2|%-1 (66323 


+o 
J pi +pi VP1 +P2 


Cette relation exprime le fait que la probabilité cumulée totale que la variable aléatoire z puisse prendre 
n'importe quelle valeur est égale à l'unité. 


Nous devons en conclure que la probabilité que le titre soit coté z au temps £, +£, s'exprime bien par la 


relation: 
p= pe "#" (66.324) 


Nous voyons que la probabilité est régie par une loi de distribution de type loi Normale centrée réduite (cf. 
chapitre de Statistiques)! Ceci constitue un résultat remarquable obtenu par Louis Bachelier en 1900 et qui 
avait été déjà spéculé par Jules Regnault au milieu du 19ème siècle. 


Effectivement, Regnault compare la spéculation à un jeu de pile ou face dans lequel les deux côtés de la 
pièce correspondent aux deux possibilités, hausse ou baisse du cours. Sous l'hypothèse qu'à quelque 
moment que ce soit, il n'y a jamais plus d'avantages pour une chance que pour l'autre. Autrement dit, à 
chaque cotation, le cours a une chance sur deux d'augmenter et une chance sur deux de diminuer. Mais 
chaque spéculateur a son opinion sur la question. Sans cette diversité d'opinions, il n'y aurait par 
conséquent ni échanges ni variations des cours. Les opérateurs se répartissent donc en deux groups 
(haussiers, baissiers) qui font des évaluations subjectives de la valeur future du cours qui comportent 
forcément une marge d'erreur. Cependant, pour Regnault, les erreurs des spéculateurs ne sont pas 
quelconques, elles obéissent à une distribution Normale. Effectivement, comme l'a démontré Laplace, si la 
probabilité d'erreur est petite et qu'elles sont nombreuses et indépendantes alors les résultats des erreurs 
suivent une loi Normale (cf. chapitre de Statistiques), 


La relation antéprécédente nous montre que les paramètres p, = f{f) satisfont à la relation fonctionnelle: 


F'G)F (6) 


f'Ute) rt) 


(66.325) 
Différentions par rapport à 4, puis par rapport à £, . Le premier membre ayant la même forme dans les 
deux cas, nous obtenons: 

rs 


mulrwr@) (ww |, 
roa[ 705) Lt rl 


PPT EROIRON ER TO 0 
ro a( ARS) | cl 


(66.326) 


donc après simplification: 
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J'()= f(4)F° (6) - 
(+ G) |2 2) @) _ 1) () 
rt _1@)#" (a) f@ JG) 
Crea 
(F (h)+ 5° (4) 


Ce qui donne finalement: 


(66.328) 


Cette relation ayant lieu, quels que soient £,,£,, la valeur commune des deux rapports est constante et nous 
avons donc: 


J'()= cf (e) (66.329) 
Une fonction qui satisfait cette relation existe et est: 
PACS RS Ta T (66.330) 
H désignant une constante ou une fonction indépendante du temps. 
Vérification: 
F'E = TR 7 al: # (66.331) 


donc: 


2H? 


Nous avons donc pour expression finale de la fonction de densité de probabilité de la valeur du cours x: 


sH1x! x 
_ = ae vi ee) | ——e 297 = N(0,o)| (66.333) 


H J2x eN2r 


avec x (pour rappel) qui est supérieur ou égal à 0. 


Le lecteur remarquera donc que pour une valeur de H et t fixées nous avons toujours ici la forme d'une loi 
Normale centrée (cf. chapitre de Statistiques)!l Les financiers disent alors que nous avons affaire à un 
"hasard sage", sous-entendu que les variations sont faibles et régulières. 


7.4. ESPÉRANCE ET VARIANCE POSITIVE 


Comme le cours ne peut pas être négatif, nous nous restreignons au calcul de l'espérance positive comme 


étant alors (cf. chapitre de Statistiques): 
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sH?x? aH°x 1 sH?x? 


IS: cts SRE TE 
(a 


(66.334) 


Il 
He | 
es | 
—— 
ÿ 
= 22 bis 
ce 
es | 
er. 
ÿ 
œ |" 
x 
ÿ| 
Se. 


en notant: 


 — (66.335) 
27H 


ZA 


le "coefficient d'instabilité 
qui est au final: 


(sur lequel nous ne savons rien) nous avons ainsi l'espérance positive du cours 


+o 
= Eu = nf (66.336) 


l'espérance mathématique du cours est donc proportionnelle à la racine carrée du temps comme l'est le 
mouvement brownien que nous avons étudié dans le chapitre de Mécanique Statistique!! 


Il découle aussi immédiatement de ce résultat que l'écart-moyen de la valeur du cours à deux instants 
différents consécutifs est lui aussi proportionnel à la racine carrée du temps écoulé entre les deux instants! 


Nous remarquons aussi qu'à l'instant où t est égal à 0, l'espérance positive du gain est nulle, car la valeur y 
est connue de manière sûre (c'est ainsi qu'il faut l'interpréter). 


Remarque: Le mouvement brownien est massivement employé par les professionnels, puisque les 
calculs de volatilité annualisée (en %/an) dont on trouve les résultats dans toute page financière de la 
presse quotidienne, ne sont que des conversions en racine carrée du temps des calculs de volatilité 
périodique (en %/mois ou %/semaine) utilisée comme base d'estimation. 


Calculons maintenant la variance positive aussi: 


+® nu sa 
[ Mg ©? de (63537 
0 


Nous posons: 


Fr 
z=,|-Æ#x (66.338) 
Ê 


soit: 
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(66.339) 
H?x 


avec: 


= = x (66.340) 
dx Ë 


Il vient alors: 


4e 2 TH +0 +0 
Var(x) = [e t PAL CRE £ Po de= —"—— | so d (66.341) 
ü Ve Je HNx H°x à Br x F 


Or, dans le chapitre de Statistiques, nous avons démontré par intégration par parties (cf. chapitre de Calcul 
Intégral Et Différentiel) que: 


Pe*as-ze" | +[° = [e"æ=- — =— (66.342) 
== 4 
0 0 
Soit au final: 
57 (66.343) 


Donc si nous posons: 


(66.344) 
2H 7 


= [ px7ax = Ka | (66.345) 
0 


Donc l'écart-type positif est lui aussi proportionnel à la racine carrée du temps (et le résultat serait le 
même si nous calculions l'écart-type total)! 


Nous avons finalement: 


Donc par stabilité de la loi Normale (cf. chapitre de Statistiques) nous avons: 


Ap=N{i0- 4 G-@)=N 0,12 ñ 


3 753 | (66.346) 
47 Ar À 
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Il s'ensuit immédiatement que: 


et: 


Donc les variations du prix du cours d'un actif financier entre deux instants successifs ont une loi de 
probabilité bien évidemment aussi décrite par une loi Normale centrée (découlant donc de la stabilité de 
cette loi) caractérisée elle aussi par une espérance positive et un écart-type positif proportionnels à la 
racine carrée du temps. 


Ce résultat démontré mathématiquement avait été mesuré par Regnault une cinquantaine d'années 
auparavant (1850) en observant que l'écart-moyen de titres obligataires français était proportionnel à la 
racine carrée du temps. 


Ceci dit il faut accepter les limites de cette approche. Prenons par exemple les rendements journaliers de 
l'indice Dow Jones en 2008 et 2009. D'après les spécialistes possédant les détails de ces données, elles 
suivraient plutôt une loi de Student de paramètre 3 qu'une loi Normale.….! 


Pour donner une comparaison flagrante de la limite de ces approches rappelons (( 

) que la probabilité cumulée qu'une variable aléatoire suivant une loi Normale soit au-delà de 4 
écart-types est de 1-99.99366% soit 0.00634%. Cela signifie, si la Bourse a 252 jours ouvrés, une certitude 
d'avoir une grande déviation tous les: 


1 
0.00634% L 53 ans 
252 
où nous considérons donc ( api )ilités) les événements comme disjoints deux à deux. 


Or la réalité montre, par exemple, que l'indice Dow Jones a eu entre 2008 et 2009 en moyenne 8 
déviations au-delà de 4 écarts-types par année.….et ce n'est guère qu'un peu mieux si nous faisons une 
approche avec la loi de Student. 


Au final trois résultats majeurs sont à retenir ici sous les hypothèses fortes de normalité centrée et 
d'indépendance: 


1. Que la fonction de distribution de probabilité que le cours d'un actif financier soit x à un instant t donné 
suit une loi Normale centrée...!! 


2. Que l'espérance positive et l'écart-type positif de la valeur d'un actif financier sont proportionnels à la 
racine carrée du temps avec un facteur dont nous ne savons rien!! 


3. Que l'espérance de gain est globalement nulle (ce qui rend le modèle peu réaliste mais donne déjà une 


base de travail). 
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C'est le premier modèle de base à connaître en finance (qui ne devrait plus être utilisé dans les entreprises 
en ce début de 21ème siècle mais qui l'est malheureusement encore en majorité...) et nous réutiliserons 
donc ces démarches lors de notre introduction au modèle de Black & Scholes. 


Enfin, il convient de préciser que c'est un modèle théorique! Il faut donc le confronter à la pratique pour 
voir s'il est valide ou non. En l'occurrence l'observation des marchés financiers montre que ce n'est que 
hors des bulles spéculatives que les variations peuvent être modélisées par un mouvement brownien. Il 
faut donc chercher des modèles plus puissants et nous verrons un jour que le mouvement brownien 
(appelé également "processus brownien") qui est lisse (continu) et donc sans sauts brusques est un cas 
particulier des processus de Lévy. 


7.5. MODÈLE DE DIVERSIFICATION EFFICIENTE DE MARKOWITZ 


Les travaux de Markowitz en 1954 ont constitué la première tentative de théorisation de la gestion 
financière de portefeuilles et son modèle suggère une procédure de sélection de plusieurs titres boursiers, à 
partir de critères statistiques, afin d'obtenir des portefeuilles optimaux. Plus précisément, Markowitz a 
montré que l'investisseur cherche à optimiser ses choix en tenant compte non seulement de la rentabilité 
attendue de ses placements, mais aussi du risque de son portefeuille qu'il définit mathématiquement par la 
variance de sa rentabilité. Ainsi, le "portefeuille efficient" est le portefeuille le plus rentable pour un 
niveau de risque donné. Il est déterminé au mieux par application de méthodes de programmation 
quadratique (cf. « es) ou sinon de manière heuristique en les étapes 
suivantes: 


1. Nous fixons une espérance de rentabilité et nous trouvons tous les portefeuilles de variance minimale 
satisfaisant l'objectif de rentabilité. Nous obtenons ainsi un ensemble de portefeuilles de variance 
minimale. 


2. Nous gardons de ces portefeuilles celui qui pour une variance donne le rendement le plus élevé. 


En procédant ainsi pour plus plusieurs valeurs de l'espérance, nous nous retrouvons avec un ou plusieurs 
portefeuilles efficients. Ainsi, entre deux portefeuilles (ensemble d'actifs) caractérisés par leur rendement 
(supposé aléatoire!), nous ferons les hypothèses suivantes: 


H1. À risque identique, nous retenons celui qui a l'espérance de rendement la plus élevée (gain maximal) 


H2. À espérance de rendement identique, nous retenons celui qui présente le risque le plus faible (aversion 
au risque) 


Ce principe conduit à éliminer un certain nombre de portefeuilles, moins efficients que d'autres. 


Passons maintenant à la théorie (un exemple pratique du modèle de Markowitz sera donné après les 
développements mathématiques). 


Soit À, le rendement d'un portefeuille composé de n actifs caractérisés par leur rendement respectif 
R,R,..,R,. Nous posons, en outre, que chaque actif i entre pour une proportion À, dans la composition 


du portefeuille P tel que: 
* 


Sax -1 


il 
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Remarque: Une part X; d'un actif peut aussi être négative. Détenir une part négative d'un actif, c'est 


ce qui s'appelle en anglais le "short-selling" (vente à découvert). Cette technique consiste par exemple 
à emprunter beaucoup d'actifs (supposés surévalués sur le marché) à une banque, les vendre pour faire 
baisser le prix de l'actif, et faire un profit en les rachetant moins cher pour les rendre à la banque 
(grosso modo car c'est assez complexe au fait….). 


Donc l'espérance du portefeuille est donnée par: 


E(R,)=EQ ZAR) = D'ALE(R)| (66.351) (66.352) 
il il 


où l'espérance de R; est souvent prise comme étant simplement la moyenne arithmétique. 


Maintenant, nous supposerons que les return des différents actifs financiers ne fluctuent pas 
indépendamment les uns des autres: ils sont corrélés ou, ce qui revient au même, ont des covariances non 
nulles (cf. chapitre de Statistiques): 


COVÉR,,R;) #0 (66.353) 
Dès lors, la variance du portefeuille est donnée par (cf. chapitre de Statistiques): 
ñ 
V(Rp)= YAXV(R )+25> 9 XX, cov (R.R;) (66.354) 
i=l ie 


Avant d'aller plus loin, précisons (car c'est important dans la pratique) que nous pouvons également écrire 
cette dernière relation sous forme matricielle (le lecteur peut facilement vérifier en ne prenant par exemple 
que deux titres que les deux écritures donnent un résultat identique) si nous notons X le vecteur des parts 
d'actifs et yT le même vecteur transposé: 


et finalement c; ; la matrice des covariances: 


covéR,R}) cov(R,R) -- cov(AR.R,) 
cov(R,,R) cov(R,R) È 


cov(R,R) cov(£,.8,) 


matrice qui se simplifie directement en: 
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ct cor(R,R) - cov(R,R,) 
cov(&.A) & 


(66.357) 


Cyj = 


co(R A) À 


nous obtenons finalement la relation de la variance sous forme matricielle condensée: 


V'(R,) = xT (cg X) (66.358) 


telle que nous la voyons souvent dans la littérature spécialisée. 


Pour en revenir à la forme algébrique du modèle, puisque la covariance est symétrique (cf. chapitre de 
Statistiques): 


cov(R,À;)=cov(R,, À) (66.359) 
et que: 
Cov(R,, À;) = WCR;) (66.360) 


Nous pouvons simplifier et écrire la variance: 


V(Rr)= SE AV(R)RESAX, cov(R,.R;) (66.361) 
i=l 


icj 


sous la forme algébrique suivante: 


F(R,) = >. cov(R,,R;)| (66.362) 


EI ji 


telle que nous la voyons souvent dans la littérature spécialisée d'une certaine époque... 
Sélectionner un portefeuille revient donc à résoudre le problème de maximisation sous contrainte suivant: 
rain : Var (2,) 
__ te 
E (&,) _* 
> #, . =] 
en utilisant la programmation quadratique (cf. chapitre de Méthodes Numériques). 


Dans la pratique, nous cherchons non pas un, mais tous les portefeuilles qui pour une espérance donnée 
minimise la variance. Nous obtenons alors une fonction de l'espérance en fonction de la variance pour les 
portefeuilles optimaux si nous traçons cela sur un graphique (voir plus bas). Cette fonction est souvent 
assimilée par les financiers (à juste titre!) à une frontière comme le précise la définition qui suit. 
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Définition: La frontière qui caractérise le polygone ou la courbe des contraintes s'appelle dans cette 
situation la "frontière efficiente (de Markowitz)" et dans le polygone/courbe se situent tous les 
portefeuilles à rejeter dits "portefeuilles dominés". Une autre manière de formuler ceci consiste à dire que 
les combinaisons (rendement, risque) de cette frontière forment un ensemble d'optima de Pareto (cf. 
chapitre de Théorie Des Jeux et de la Décision), c'est-à-dire que si l'un des éléments augmente, l'autre doit 
augmenter aussi. 


Maïntenant, formalisons l'optimisation comme cela était fait à l'époque où les gens devaient encore 
développer les algorithmes eux-mêmes... 


Soit Z la fonction économique précitée: 


Z = PE(R,) -V(R,) (66.363) 


# 
qui doit être maximisée sous la contrainte que dx, =] et où est un paramètre qui représente le degré 
il 


d'aversion au risque des investisseurs (histoire aussi d'homogénéiser la relation.….). 


Le problème de maximisation sous contrainte consiste à déterminer le maximum de la fonction 
économique Z définie par: 


Z= DS XE(R)- D S XX; cov(R,R,) + af x] (66.364) 
il il j=l il 
Cette fonction de n + 1 variables (4,,%4,,..,4,, À) est maximisée si sa dérivée (partielle) par rapport à 
chacune de ces variables est nulle, ce qui revient à poser le système suivant: 
aZ 
Fa = PECR) - 24 cov(R,R,) - 24, cov(R,R,) -..-2X cov(R,,R ) - A =0 
1 
— = PE(R,)- 24, cov(R,,R)-22X, cov(R, ,R,) -..—24 cov(R,,k,)-A=0 
2 
ee (66.365) 
ax = DER, )-2X, cov(R,,R) -2X, cov(R,,R,) -..-2X cov(R ,Rj-4=0 
x 
Le 
8 


1-X-X,-.-X, =0 


Posons: 
cov(R,,R;)= Gi; (66.366) 


Nous pouvons alors écrire: 
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2Xon+2X,0u+….+2X,0, + A = DE(R) 
2X, On + 2X)On +... +2X,0, + À = PER.) 


a (66.367) 
2XOu + 2Æ0 0 +. +2X,0, + À = PEUR.) 


X+X+.+X,=1 


soit sous forme matricielle: 


21 2 … 2 INA PER) 


2On 2 … 20» 1[| #2 PER) 
. |= (66.368) 
20n 29 … 26 1||X| |PER) 
l D 1 O0} À 1 
Soit désormais: 
2On 2 … 2%, ! PE(R) À) 
2On 2 … 20 | PE(R,) À 
A=| … .. ,B= et À =| … (66.369) 
2 On « 2 1! PER, ) X, 
l D: 1 (] 1 À 


Dans ce cas, le système d'équations à résoudre peut se résumer sous la forme matricielle: 
A'X=8B (66.370) 

Par conséquent: 
X=A"!B (66.371) 


La détermination du poids de chacun des n actifs susceptibles d'entrer dans la composition d'un 
portefeuille passe donc par l'inversion d'une matrice carrée de n + 1 lignes et n + 1 colonnes comportant 


Ci _ #) {2 covariances (la diagonale comportant des variances seulement et la matrice étant 


symétrique!). Ce qui est relativement long à calculer pour de gros portefeuilles. 


Cependant, même une fois la pondération des actifs terminée, le problème lui ne l'est pas complètement. 
Effectivement, nous pouvons donc connaître la frontière efficiente mais le client va lui imposer une 
contrainte bien logique au niveau du risque nul de son portefeuille et du rapport rendement/risque 
maximum. 


Compte tenu de la lourdeur des calculs nécessaires à l'inversion de la matrice A, Sharpe a proposé un 
modèle simplifié que nous verrons après un exemple pratique du modèle de Markowitz. 
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Exemple: 


Considérons trois titres composants un portefeuille en proportions égales (que nous supposerons dans des 
proportions égales dans le portefeuille) et les n observations de leur rendement À; ; saisis dans Microsoft 


Excel 11.8346 (la composante j pouvant être vue comme une période temporelle): 


el A B C D 
1 Obs. Titre À Titre 2 Titre 3 
2 1 -0.15 0.29 0.38 

+] 2 0.05 0.18 0.63 

EE 3 -0.43 0.24 0.46 Rss 
Fa 4 0.79 0.25 0.36 

pal 5 0.32 0.17 0. 


Figure: 66.21 - 5 observations des rendements de 3 titres 


Le but est donc de déterminer la frontière d'efficience du portefeuille selon le modèle de Markowitz ainsi 
que la C.M.L. et la pondération des actifs (poids optimaux) qui minimise la variance pour une espérance 
maximum pour un portefeuille composé d'un actif sans risque d'un rendement R; de 0.22. 


Au-dessous de la table donnée précédemment nous allons créer dans Microsoft Excel le tableau contenant 
les proportions #, des titres (que nous supposerons équidistribuées, soit 1/3), nous afficherons la moyenne 


du rendement ;4 calculée bien évidemment selon l'estimateur: 


2, &, n Moyenne(B2: B6) 
E(R)= À, = hs = 4  Moyenne(C2: C6) (°°°72) 
| Moyenme(D2: DO) 


et la variance =" calculée pour chaque titre par l'estimateur: 


= +2 
DR;-A)  (Par(82:86) 
2 = — = fFar(c2:ce 7? 
: Var(D2: D6) 


Ce qui nous donne le tableau suivant dans Microsoft Excel 11.8346: 


RAS Has tuile D 
13 Titre 1 Titre 2 Titre 3 
m À; 14 143 14 
BE À 0.116 0.226 0.252 
16 À 0.21728 0.00253 0.22247 


Figure: 66.22 - Proportions, estimateurs de l'espérance et de la variance des 3 titres 


Soit sous forme détaillée dans la version française de Microsoft Excel 11.8346: 
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A | B | C D | 
13 Titre 1 Titre 2 Titre 3 
14! X; 143 143 143 


AE À =MOYENNE(B2:66) =MOYENNE(C2:C6) =MOYENNE(D2:D6) 


16| G7  =VAR(EZ:E6) =\VYAR(C2:C6) =\YAR(D2:D6) 


A7 
Figure: 66.23 - Formules explicites pour le calcul des estimateurs de l'espérance et de la variance des 3 titres 


Nous devons maintenant calculer le rendement moyen du portefeuille selon: 
ñ 
E(R,)= D AR = Xifa + Xl + Xalg (66.374) 
i=1 


Cette relation est un peu longue à saisir, et le sera davantage si nous avons un nombre bien plus important 
de titres. 


Dans notre cas, il s'agit de faire la somme des produits terme à terme de deux plages de cellules (Æ, et #) 


ayant la même dimension (même nombre de lignes et même nombre de colonnes). Nous pouvons alors 
utiliser la fonction suivante dans la version française de Microsoft Excel 11.8346: 


=SOMMEPROD(B14:D14;B15:D15) 
Pour la variance du portefeuille, c'est un peu plus compliqué puisqu'il s'agira de calculer: 
S y2 
V(R,)=o(R,)=ZX/V(R)+2D D XX, cov(R,.R) 
2=l ié7 


= S X202 +23 D X;X; cov(R,,R) 
i=l 


ic 


(66.375) 


La relation développée dans notre cas particulier donne: 
(8, )= Po +X20i + X2oi +2X1X2cov(Ri.R) _—_ 
+244 Cov (A À ] + 2A A3 Cov (Ra, k ] 


L'astuce pour appliquer ceci dans un tableur Microsoft Excel consiste à utiliser l'algèbre linéaire et écrire 
cette relation sous forme matricielle comme nous l'avons démontré: 


eo? (8, ) = XT -Cÿ À (66.377) 
Ce qui équivaut dans la version française de Microsoft Excel 11.8346 à écrire: 


=SOMMEPROD(PRODUITMAT(B14:D14;G14:116);B14:D14) 


Soit sous forme matricielle explicite: 
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cov(R,,R) cov(R,R)|fx 
(8, )=(X X2 ZXs)lcov(R.R) ue cov(R3,82)||X2 | (66.378) 
cov(R,R;) cov(R,,k) cé #3 


En se basant sur les tableaux précédents, il est simple dans Microsoft Excel d'obtenir la matrice de 
covariance: 


14 T1] 0.217268 -0.003376 -0.053492 


15 72] 0.005576  0.00253 0.006468 
16 73] -0053492 0006468  0.22247 


Figure: 66.24 - Matrice de covariance des 3 titres 


Soit sous forme détaillée dans la version française de Microsoft Excel 11.8346: 


14 Tt}=VAR(B6:B10) =615 =616 


T2|-COVARIANCE(CS:C10.86:B10) =VAR(CE:C10) =H16 


T3]=COVARIANCE(D6:D10,86:B10) =COVARIANCE(D6:D10,C6:C10) =VAR(D6:D10) 
Figure: 66.25 - Formules explicites de la matrice des covariances 


Rappel: La matrice des covariances est symétrique. (cf. chapitre de Statistiques), 


Et pour l'espérance et la variance du portefeuille, nous aurons donc le tableau suivant: 


Portefeuilie 
E | ke | 0.198 


c(R,) 0.038386667 


ue) 
Figure: 66.26 - Espérance et variance du portefeuille 


en appliquant donc les relations susmentionnées: 


Portefeuille 
E { 8, }FSOMMEPROD(B14:D14;B15:D15) 


Eu { R, FSOMMEPROD(PRODUITMAT(B14:D14;G14:16)B14:D14) 


Figure: 66.27 - Formules explicites pour l'espérance et variance du portefeuille 


Le problème maintenant est de déterminer pour un rendement du portefeuille fixé (B20), les proportions 
des différents titres qui minimisent le risque. 
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Après avoir ajouté les deux cellules B24 (rendement espéré/attendu du portefeuille) et B25 (nombre total 
des parts du portefeuille): 


Rendement attendu : Æ g | R,) 0.200 
25 25 [Sommes des poids : Sx, 1 


Figure: 66.28 - Objectifs en termes de rendements et parts 
Nous devons donc maintenant résoudre le problème d'optimisation non linéaire: 
min : a? (2, 
E(R,) =02 (66.379) 


Lx =1 


et ceci ne peut que se faire (simplement) à l'aide du solveur: 


[re A 8 C D LEE CSI 
6] Obs Tire 1 Tire 2 Tire 3 

[6] 1 015 0.2 0% 

7 2 0.05 0.18 063 

8 | 3 043 0.24 0.46 

F9 4 079 0.25 0% 

10 5 0.32 0.17 17 

11} 

12 

1 Tare 1 Tire 2 Tire 3 Era naen 
Lo x, 18 18 13 

15! à 0116 02% 0252 210003% 000053 0.00647 
16. a 021728 0.00253 0.22247 7210053449 000847 0.22247 
D CRETE x 

48] 

[19] potes Seromcs fix 

120 | &(R,) 01% “Eqsire CM Mg (Yale cé: fo Che j 

7 a (2,) PR 

|22| 2 otetoes ges _| | 

FA | 10814-40414 | 

I24/Rendement attendu : Z(R, ) 0.200 Facrhebedains | |_Stos | 

25 | Sommes des poids Z4, 1 

26 | 

127] 

128, 

[29 

3 

se 


Figure: 66.29 - Recherche des solutions à l'aide du solveur 


Ce que nous allons faire à l'aide du solveur est de chercher et reporter les solutions pour des rendements 
de 0.2 à 0.245 par pas de 0.05. À chaque résultat, nous noterons le numéro de l'itération, la variance du 


portefeuille a? (2, et l'espérance de rendement E(R,) qui était exigée. Cela devrait donner (bon il 


faudrait automatiser dans l'idéal la procédure par du VBA): 
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1 
2. 0008447 0205 
3] 0006515 0210 
4 0.003520 0.215. 
5 0.002460 0.220. 
6. 00023% 02% 
7. 0003149 0230 
8, 0.004897 0.235) 
9, 0007582 0240 
10. 0.011202 0.245) 


Figure: 66.30 - Solutions pour différentes valeurs du rendement 


Ce qui donne la frontière efficiente de Markowitz suivante sous forme graphique, appelé "plan de 
Markowitz"', dans Microsoft Excel 11.8346: 


0002  O004 0006 0.008 0.01 0.012 ; 0.014 
a (k,) 


Figure: 66.31 - Plan de Markowitz correspondant aux solutions du tableau précédent 


Maïntenant il est aisé avec Microsoft Excel 11.8346 de déterminer l'équation de cette parabole en utilisant 
l'outil d'interpolation (nous sommes obligés dans Microsoft Excel 11.8346 de tourner la parabole pour 
cela...): 
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y =18.795x? - 8.3892x + 0.9384 
R2=1 


0.200 0.210 0.220 0.230 0.240 0.250 


Figure: 66.32 - Rotation du plan de Markowitz pour déterminer l'équation de la parabole 


Évidemment avec l'équation de cette parabole, en cherchant où sa dérivée s'annule, nous obtenons alors 
ce qu'il est d'usage d'appeler dans la finance le "portefeuille global de variance minimum" (en anglais: 
"Global Minimum Variance Portfolio"). Les poids des actifs de ce portefeuille sont donnés évidemment 
directement par les résultats affichés par le solveur. 


Maintenant, nous allons déterminer la "Capital Market Line" abrégée C.M.L (voir le modèle du modèle 
des actifs financiers plus bas pour les détails) qui est la droite formée par l'ensemble des portefeuilles 
composés de l'actif sans risque, d'une part, et du portefeuille de marché, d'autre part. Par construction, elle 
associe à chaque niveau de risque, la rentabilité espérée la plus élevée. 


Nous allons pour déterminer cette droite avec Microsoft Excel 11.8346 nous fixer dans un premier temps 
un taux de rendement sans risque que nous noterons À; et que nous prendrons arbitrairement comme 


valant 0.22 (en Suisse en 2011, le rendement sans risque était estimé à 1% par exemple). 


Nous avons donc la courbe de Markowitz d'équation: 


y =18.795x —8.3892 x +0.9384 = ax? +bx+e 
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Titre du graphique 


y =18.795x? - 8.3892x + 0.9384 
R2=1 


\ 
0220 0230 0.240 0.250 
CL 


Figure: 66.33 - Mise en évidence de la Capital Market Line 
et la droite du portefeuille sans actif risqué: 
y=a'x+b" (66.380) 
avec la condition (voir sur le graphe): 


\_ __b 
Œ =—-—— (66.381) 
0.22 


Nous avons alors deux équations à deux inconnues pour résoudre ce problème (l'intersection de la droite 
et de la parabole pour la première et l'égalité de la pente de la parabole et de celle de la droite au point 
d'intersection pour la deuxième): 


ax, +bxy +c=a"xy +b' 


(66.382) 
2axy +b=a" 
La deuxième équation nous donne: 
a b 2 
x. =4 — b _ 0.22 (66.383) 
je 24 24 
Injecté dans la première équation: 
— 1! : 2 —h L —b 1 
022 | ,5/022 |,,- 2" |022 |,y (66384 
24 24 0.22 24 
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Si nous résolvons ce polynôme du deuxième degré nous avons deux solutions réelles (Microsoft Excel 
n'arrive pas à déterminer les racines de ce polynôme mais pour Maple 4.00b c'est très simple): 


b'=-006822748631 b', =0.120763489 (66.385) 
La solution 2 est à éliminer (nous le savons en essayant de la prendre comme solution). Nous avons donc: 


b' =-006822748631 a' =" =0.3101249378 (66.386) 


Ce qui donne sous forme graphique: 


y =18.795x?- 8.3892x + 0.9384 
RE= 1 


y=03101x-00682 /” 


( + 
0.200 0210 0.220 0.230 0.240 


Figure: 66.34 - Représentation de la "vraie" Capital Market Line 


Soit sous forme traditionnelle: 
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a (2,) 


0.002  O004 0006 0.008 0.01 0012 0014 


Figure: 66.35 - Petite rotation de la figure précédente 
Il vient aussi immédiatement: 
—b' 


x = 022 = 0.2314265746 
(#1 


(66.387) 


Ainsi, en réutilisant le solveur comme plus haut mais avec cette nouvelle valeur pour l'espérance, nous 
obtenons pour un portefeuille du marché composé d'un actif sans risque de rendement 0.22, un rendement 
global efficient de 0.2314276... avec la composition suivante du portefeuille donnée par le solveur: 


À = 0.055 
X=1079 (66.388) 
X; = -0.024 


Il s'agit donc par construction du portefeuille qui, parmi l'ensemble des portefeuilles comportant 
uniquement des actifs risqués, maximise le rendement alors qu'il comporte un actif sans risque tout en 
minimisant le risque!!! Encore une fois, rappelons que ce portefeuille est appelé "portefeuille de marché" 
ou "portefeuille tangent”. 


Voilà donc un sympathique petit exemple applicatif dans un logiciel accessible à presque tout le monde! 


Cependant rappelons deux hypothèses de construction de ce modèle qui font que son utilisation est 


H1. L'optimisation moyenne-variance revient à modéliser les actifs du portefeuille par des variables 
aléatoires pour lesquelles ces deux moments existent. Or dans la réalité, rien ne nous dit que c'est le cas. 
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H2. Le modèle est basé sur des rendements moyens estimés pour une période d'allocation pouvant évoluer 
à court-terme. Or un changement très faible de la moyenne des rendements peut avoir des conséquences 
démesurées sur l'allocation. 


7.6. MODÈLE DE DIVERSIFICATION EFFICIENTE DE SHARPE 


L'utilisation du modèle de Markowitz, tel qu'il le proposait dans son ouvrage de 1959, soulevait de 
nombreux problèmes dès qu'il s'agissait d'utiliser des algorithmes à partir d'une liste de base comportant un 
nombre élevé de valeurs. Ces problèmes étaient de deux ordres: 


1. L'ampleur des matrices requérait à l'époque un calculateur de grande capacité et un temps de calcul 
assez long! 


2. L'utilisation du modèle de base requérait que l'on connaisse dans son entièreté la matrice des 
covariances. Le principal problème qui se pose à ce propos réside tant dans le nombre des estimations à 
fournir que dans la difficulté de réaliser des estimations précises et surtout cohérentes. 


Si nous voulons que l'approche proposée par Markowitz puisse entrer dans le domaine de l'application, il 
faut de toute évidence trouver le moyen d'alléger notablement la procédure tout en perdant le moins 
possible de la rigueur de la méthode. 


En 1963, William Sharpe a proposé une solution dont la caractéristique essentielle consiste à faire 
l'hypothèse que les returns des diverses valeurs sont exclusivement liés entre eux par leur commune 
relation avec un facteur de base sous-jacent (indice boursier typiquement) qui permet de déterminer un 
coefficient appelé le "bêta" (corrélation entre le rendement d'un titre et celui du portefeuille de marché). 


Cette hypothèse purement empirique appelée "modèle à un indice" (ou “modèle unifactoriel", "modèle 
monofactoriel") a revêtu par la suite une importance considérable, car elle a été, comme on le verra dans 
les développements ultérieurs, à la base de la théorie de la formation des prix des actifs financiers dans un 
univers incertain. 


Remarque: Encore une fois, les développements qui vont suivre pourraient s'avérer abstraits mais... 
nous verrons comment résoudre l'exemple précédent fait avec Microsoft Excel pour le modèle de 
Markowitz mais en appliquant le modèle de Sharpe et nous pourrons ainsi même comparer 
visuellement les deux méthodes. 


Le terme "unifactoriel" vient donc du fait qu'à la base le but du modèle de Sharpe est de définir le 
rendement d'un placement financier en fonction de son risque non diversifiable, assimilé au seul risque de 
marché (ou "risque systématique") donné par un nombre appelé "coefficient bêta". 


Les investisseurs et gestionnaires distinguent trois sortes de risques: 


1. Le "risque spécifique" relatif (implicite) au titre lui-même (sa variance) appelé aussi "risque non 
systématique" ou "risque idiosyncratique”. 


2. Le "risque systématique/non diversifiable" relatif à l'économie/marché au sens le plus large (variance du 
portefeuille de référence du marché). 
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3. Le "risque global" qui est en quelque sorte la somme des deux (c'est un peu plus subtil qu'une simple 
somme …). 


Comme vous l'aurez probablement deviné, le facteur risque est difficilement quantifiable. L'élément qui 
aidera à le déterminer est la variation du rendement de l'actif financier par rapport à la variation du 
rendement du marché dans sa globalité. Un actif financier dont le cours fluctue souvent et dont la volatilité 
est grande présente donc certainement un risque élevé. 


Voici par exemple les distributions des rendements de fonds de placements du deuxième pilier (LPP) en 
Suisse en fonction de la stratégie de diversification d'un portefeuille (les chiffres après LPP représentent la 
part en % d'actions): 


Effets de la diversification 
Probabilité d'un rendement quotidien, en % — LPP-25 
_+ 20% —…— LPP-40 = 


SN -4% -3% -2% -16 O0 +14 +24 +3%  +4%+5% 
LL Rendement quotidien SOURCE PPCMETRICS 


Figure: 66.36 - Effets de la diversification sur la distribution du rendement (source: PPC Metrics) 


Vous remarquerez sur la figure précédente que les distributions sont centrées (donc de moyenne nulle), 
symétriques et que l'écart-type (volatilité) est d'autant plus grand que la part d'actions dans le portefeuille 
est élevée. 


Définition (simpliste): Le "coefficient bêta" mesure la dépendance entre le rendement d'un portefeuille ou 
d'un actif financier et le rendement d'un indice de référence et constitue la pente d'une droite appelée 
"security characteristic line" (S.C.L.): 


_ variation attendue de la valeur du portefeuille 


ê 


— — (66.389) 
variation du niveau de lindice 


ce coefficient est bien évidemment d'autant plus utile que l'horizon de prévision futur est éloigné et que la 


ZOU 


fréquence d'observation est petite. Ce coefficient est aussi parfois appelé "volatilité relative". 
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Droite de régression 


Variation du cours du titre en % 


-20 0 20 40 60 80 
Variation de l'indice en % 


Figure: 66.37 - Principe de régression linéaire du coefficient bêta 


Remarque: L'indice de référence est choisi de la manière la plus pertinente possible avec ce que cela 
implique. Si possible lorsque le rendement de l'indice est nul, la variation de la valeur du portefeuille 
ou de l'actif devrait aussi être nulle. 


Une simple analyse du graphique (c'est de l'analyse fonctionnelle élémentaire) montre donc qu'un 
coefficient bêta égal à 1 pour un titre/actif donné signifie qu'une augmentation (respectivement: 
diminution) de 10 % du return des titres sur le marché pendant une certaine période se traduira par une 
augmentation (respectivement: diminution) de 10 % en moyenne du rendement de ce titre. Donc la 
volatilité de l'actif est égale à celle de l'indice. 


Un bêta supérieur à 1 signifie que l'évolution du return de l'actif financier est plus volatile (ou plutôt, était 
volatile, puisque ce coefficient se réfère généralement à une période passée) que celle du return du 
marché, tandis qu'un bêta inférieur à 1 révèle l'inverse. Ainsi, un fonds ayant un bêta de 1.15 est de 15% 
plus volatile que l'indice. Inversement, un fonds ayant un bêta de 0.70 est 30% moins volatile que l'indice. 


Donc pour résumer: 


1. Un investissement ne présentant aucun risque (par rapport à l'indice de référence) afficherait donc un 
bêta égal à 1. 


2. Un bêta inférieur à 1 indique que si le marché (indice de référence) est à la baisse, le titre sera 
susceptible de baisser moins que le marché. 


3. Un bêta supérieur à 1 indiquera que si le marché (indice de référence) est à la hausse, le titre sera 
susceptible de suivre moins rapidement la tendance à la hausse. 


Le concept de bêta ayant été introduit, passons maintenant à la théorie du modèle qui a donc pour objectif 
de simplifier celui de Markowitz en utilisant ce fameux coefficient. 


Par définition, le bêta global d'un portefeuille est déterminé à partir des bêtas pondérés respectifs de 
chacun des titres ou bêtas sous-jacents qui le composent tel que: 
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NW 
Ê 2 A8 


avec 6, étant le bêta du portefeuille global, X; la proportion du titre i dans le portefeuille P, & le bêta du 


titre i et n le nombre d'actifs financiers présents dans le portefeuille. 


Sharpe suggère donc que le rendement R; de chaque actif i à un instant t est donné par la régression 


linéaire (cf. chapitre de Méthodes Ni jues) déterminant la "security characteristic line" vue plus haut: 


K=a+Aîts 


NS 


ou: 


- l'est le rendement d'un indice économique donné (indice boursier, indice du produit national brut, indice 
des prix ou voire même le rendement du portefeuille du marché lui-même...) au temps t et est la variable 
expliquée de la régression (selon la terminologie utilisée dans le chapitre de Méthodes Numériques) 
considérée comme une variable aléatoire. 


- &, 8, sont des estimateurs non biaisés (cf. chapitr | es) des paramètres propres à cette 


valeur. Le premier terme appelé en finance "coefficient alpha" est simplement l'ordonnée à l'origine de la 
régression (le rendement de l'actif lorsque le rendement de l'indice de référence est nul soit lorsque le 
marché a un rendement nul) et le deuxième paramètre est pour rappel simplement le bêta du titre risqué i. 
Le coefficient alpha n'étant pas une source de risque, il est souvent ignoré dans les calculs. 


- & est une variable aléatoire supposée caractérisée par une espérance nulle, une variance égale à une 


constante et les différents £& sont supposés non corrélés entre eux (covariance nulle). 


Quant au niveau de l'indice 1, il sera caractérisé par la relation (afin de simplifier les développements plus 
tard): 


Î : sl + Vas] 


où &,,, est un paramètre non biaisé supplémentaire pour caractériser l'indice I et v,,, une variable 
aléatoire caractérisée par une espérance nulle et une variance égale à une constante. 


Pour résumer les points principaux, le modèle de régression linéaire simple des rendements des actifs 
financiers est basé sur les hypothèses majeures suivantes: 


H1. Le modèle de rendement s'écrit de manière générale: 
K=a+fAlite 


en supposant que nous n'avons pas fait d'erreur sur la forme linéaire du modèle, ni sur la liste des 
régresseurs. 


H2. Nous supposons que la perturbation de la régression est d'espérance nulle telle que (hypothèse 
sous-jacente d'un effet brownien!): 


E(a)=0 
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ce qui constitue ceci dit une hypothèse simplificatrice dangereuse mais pratique pour être utilisable (et 
compréhensible) par les praticiens de la finance... 


H3. Pour n'importe quel échantillon de taille n, nous utilisons les estimateurs du maximum de 
vraisemblance (cf. chapitre de Statistiques) pour l'espérance et variance des rendements des actifs 
financiers du portefeuille de référence: 


Ces hypothèses posées, nous utilisons aussi les résultats obtenus dans le chapitre de Méthodes Numériques 
sur la régression linéaire pour obtenir le bêta. Nous y avons démontré qu'il existait plusieurs manières de 
faire une régression linéaire dont une consiste à utiliser la covariance et l'espérance. En adoptant les 
notations de l'économétrie, la pente de la régression peut alors s'écrire: 


- cov(R,,R;) _ cov(R,.R;) 
Var(R;) a? 


(66.396) 


ce qui donne la définition rigoureuse du coefficient bêta selon le modèle de Sharpe où R; est le rendement 


de l'actif financier et R, le rendement du marché (ou du portefeuille du marché/référence). 


Définition (rigoureuse): Le "coefficient bêta" est donné par le rapport de la covariance des rendements et 
indices des actifs sur l'écart-type de l'indice du marché du portefeuille. 


Maintenant, en considérant la même hypothèse que dans le modèle de Markowitz, le rendement À, d'un 
portefeuille est défini à nouveau assez logiquement par: 


* 
À, SLR (66.397) 


il 
où pour rappel X; la proportion du titre i dans le portefeuille P. 


Si les rendements ne sont pas explicitement connus dans la pratique, nous utilisons alors le modèle linéaire: 


RD AR = X(a+Rlt+a)=-d X(a+e)+ D X AI (66.398) 
il it il il 
Dès lors en utilisant les propriétés de l'espérance: 
ER, ) = £ D 2 (& +E) +S X;AI = SX E(&) + D'AE(s) + dt, LEA + Vu) (66.399) 
3] il il 


il il 


Posons pour simplifier l'écriture que: 


# 
y = D X,A (66.400) 


il 


Dans ce cas, comme par hypothèse Æ(#) = 0 et Æfv,)= 0: 
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#+1 


* # 
ER, ) = 2 a +0+ À an E (ur , Van) = > Aa +0+ À But n ET (66.401) 
à 


il il 


Finalement: 


#+l 


E(R,) = ET (66.402) 
il 


Si les rendements sont explicitement donnés et donc connus l'espérance se calculera avec: 


il 


E(R,) = EOXR) : ŸAER) (66.403) 
il 


Cette relation est souvent appelée "weighted average return" ou "rendement moyen pondéré". 


Comme le client va souvent chercher à maximiser l'espérance tout en minimisant la variance (le risque) il 
nous reste à déterminer cette dernière. Étant donné que maintenant nous supposons explicitement connus 
les rendements des actifs financiers du portefeuille et les rendements du portefeuille (indice) du marché 
nous avons: 


(Re) = Ex |- D A(R)HDD AE, cœr(8.R,) 


ic 7 
ñn 
= D'XV(R) +257 X; x; cov( æ + &l,a; +81) 
i=l iej 
Hypothèse: Si l'indice I est correctement choisi, lorsque 7 = Q nous devons avoir À; = 0 ce qui implique 


&, = 0 (c'est une hypothèse forte qui amène à avoir une approximation!). 


Ainsi: 
P(R)= D ARR) HD K, eo A) 
= DA (RHIDEE X, BB; cov(1,1) nn 
= mr 
= > XV (R)+ 222 XX, BBV() 
Finalement: 


V(Rp)= S X202 +255 À; À; 8 B;| (66.405) 
i=l 


HE 


Ce qui donnerait donc pour un portefeuille comportant deux titres: 
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V(R)= DA + DD XXE) 
i=l 


1<7 


(66.406) 


= Xfc? +X202 +20/([X% X,88) 
= X?oÿ +X303 +207} X 48 


Nous pouvons condenser l'écriture de la variance en utilisant la formulation matricielle en notant d'abord 
respectivement le vecteur transposé et le vecteur-colonne des poids des actifs du portefeuille par: 


À 
X'=[X ZX, … X,] X-= F2 (66.407) 
x, 
et en en définissant la matrice des bêtas: 
& AB Ab 
E,,= B À = | (66.408) 


88 


LA | JL 


Ce qui nous donne finalement: 


W(Rp)= c DA (B:, X) (66.409) 


Pour un portefeuille de deux titres cette dernière relation se réduit donc à: 


à x], 
V(R)= 0 [M X2] ‘ E (x 
D 2 
& À pe 
ï 
D r+ABX 
af (66.410) 
= of [À X | 2 
RARE 
= 0? D RAR XX + 84XX. +À y2 
1 a I 241 142 ue 2 


_ XP + Xi +20%288 
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Nous retrouvons donc bien la même chose que la forme algébrique. 


Si nous ne connaissons pas explicitement les rendements, l'étude de la variance est un peu plus délicate. Il 
faut alors utiliser le modèle linéaire tel que: 


PR,) = 2# (G +6) + 2 A1 = 247 (@) + 2 AVE) + 24 AV (a + Vaa1) 
(66.411) 


Et toujours sous l'hypothèse déjà précisée plus haut comme quoi l'indice I est correctement choisi ce qui 
implique &, = 0. 


En outre, notons: 
Q, =V(E) (66.412) 
De plus, nous savons que: 
Qu = Peu) (66.413) 


Dès lors en négligeant la variance de l'ordonnée à l'origine: 


# 
FR) : > Xe, . Fe #+l (66.414) 
im] 
Car: 


Fu) = lc“) =0 (66.415) 


Finalement: 
#+1l 
V(R,) =D XÏQ (66.416) 
il 
Dans ce contexte le problème revient toujours à maximiser la fonction économique Z: 
# 
Z = DE(R,) -V(R, al x] (66.417) 


il 


simplement que maintenant elle s'écrit: 


Z = Ska Sroulr-$x] (66.418) 


Le calcul de chacune des dérivées partielles donne alors: 
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EPA 

—— =hag -240, -4=0 

3x, & 1 

d£ 

= Pa, -2X,0, -A=0 

3X, æ Fer 

d£ ... 
= D -2X —=0 (66.419) 

ax, a, Ne 

EPA 
= Du — 2 XauQun = À = 0 

TA sl n+1E+]l 

Pot-hr Ent 

a 


soit sous forme matricielle: 


D D DL ba 
0 2@ … 0 . baæ 


ni 


(66.420) 
0 OT 
1 LL Il 0 


À, +1 Pau 
À 1 


La résolution de ce système passe alors par l'inversion d'une matrice plus simple que celle du modèle de 
Markowitz mais nécessite cependant des hypothèses relativement contraignantes. 


Pour finir, signalons que les financiers utilisent souvent les indicateurs de rendement pondéré par le risque, 
le plus répandu au niveau international étant le "ratio de Sharpe". Il est déterminé par le rapport entre le 
(pour être plus exact il s'agit de son espérance) différentiel du rendement d'un placement (actif) sans 
risque À; et le rendement du marché (appelé le "benchmark") À, et la déviation standard du placement 
au taux du marché (nous déterminerons rigoureusement l'origine de cette relation plus loin lors de notre 
étude du MEDAF): 


S, = | (66.421) 


Relation qui exprime donc le niveau de rendement pur par unité de volatilité (ou par unité de risque). Pour 
simplifier, c'est un indicateur de la rentabilité (marginale) obtenue par unité de risque pris dans cette 
gestion. Il permet de répondre à la question suivante: le gestionnaire parvient-il à obtenir un rendement 
supérieur au référentiel, mais avec davantage de risque? 


- Si le ratio est négatif, le portefeuille a moins performé que le référentiel et la situation est très mauvaise. 


- Si le ratio est compris entre 0 et 0.5, le surrendement du portefeuille considéré par rapport au référentiel 
se fait pour une prise de risque trop élevée. Ou, le risque pris est trop élevé pour le rendement obtenu. 


- Si le ratio est supérieur à 0.5, le rendement du portefeuille surperforme le référentiel pour une prise de 
risque ad hoc. Autrement dit, la surperformance ne se fait pas au prix d'un risque trop élevé. 
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Ce qui donne en développant: 


n n 


DAfa+ai+e)-Dx(a+e) Al 
$, — il i=l = i=l (66.422) 


Var(x,(a +41+a ) Var(X,(a +81+8)) 


Signalons également un autre indicateur courant qui est le "tracking error" défini comme étant l'écart-type 
de l'écart de performance entre le portefeuille et le benchmark. Plus le tracking error est faible, plus le 
fonds ressemble à son indice de référence en termes de risque: 


TE= V(R,-R;)= op, (66423) 


Ces modèles sont relativement complexes. Raison pour laquelle quelques années plus tard, Sharpe et 
Lintner ont créé un nouveau modèle qui leur a valu le prix Nobel d'économie et que nous allons étudier de 
suite après un exemple pratique de ce que nous venons de voir. 


Exemple: 


Considérons trois titres composants un portefeuille en proportions égales et les n observations de leurs 
rendements À, ; saisis dans Microsoft Excel 11.8346. Ces rendements seront comparés à un indice de 


référence I qui sera le rendement d'un portefeuille de marché de référence PF, : 


Titre 1 Titre 2 Titre 3 


Figure: 66.38 - 3 titres avec leurs rendements comparés à un portefeuille de marché de référence 
Le but est de déterminer la frontière d'efficience du portefeuille avec le modèle de Sharpe. 


En détail sous forme graphique voici d'abord les bêtas (rendement de l'actif en fonction du rendement du 
portefeuille de marché/indice de référence) obtenus avec Microsoft Excel 11.8346: 
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0.05 


-0.15 


-0.35 


-0.55 


-0.75 


+ Titrel m Titre2 + Titre3 
— Linéaire (Titre1} — Linéaire (Titre) __ Linéaire (Titre3) 
Figure: 66.39 - Régression linéaire pour le calcul des bêtas des titres 


et le tableau de construction suivant pour le calcul des bêtas, la variance et l'espérance du portefeuille du 
marché et des différents titres: 


Bêta fs 1000 1499 0055 21% 
12 Espérance: 4; 0.402 0116 0.226 | 0.252 | 
113 |Variance : «2 0039 0.217 0.003 022 


Figure: 66.40 - Indicateurs- clés (correspondants du portefeuille de référence et des 3 titres 


Voici les détails des formules (remarquez que les bêtas sont obtenus à l'aide d'une simple régression 
linéaire avec l'indice de référence qui est le portefeuille et les autres paramètres avec les estimateurs non 


biaisés): 


11 |Bêta: 8; =LINEST(B6:B10;$86:$810) EUNEST(CS C10,$86:$B10) | 
12 Espérance: À ; g| | =AVERAGE (6: B10) =AVERAGE(CG:CI0) | 
13 |Variance : 2 =VAR(BE:B10) =VAR(CE:C10) | 


=UNEST(D6:D10:$86:$810) =LINEST(ES:E10;$86:5810) 


: [FAVERAGE(D6:D10)  AVERAGE(EG:E10) 
13/lVariance:g2  |[=VAR(D6:D10) =VAR(EG:E10) 


Figure: 66.41 - Formules explicites pour les indicateurs précédents 


L'espérance du rendement du portefeuille composé des trois titres est facile à calculer puisque nous avons 
leurs rendements. Donc: 


7 
E(R,) _ ZAR = Xi + of + Xafa (66.424) 
2= 
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Ce qui donne sous Microsoft Excel 14.0.6123: 


Titre 1 Titre 2 Titre 3 


ZX; 143 143 143 1 
À 0.116 0.226 0.252 
Portefeuille 
ER, | 0.198 


Figure: 66.42 - Espérance de chacun des titres et de l'ensemble du portefeuille 


Soit de manière détaillée: 


À BE C D 
15 Titre 1 Titre 2 Titre 3 
16| ZX, 1/3 1/3 13 
17 Æ =c12 =D12 =E12 
18 
19 Portefeuille 


20/£iR, | =SUMPRODUCT((B16:D16)*(B17:D17)) 


Figure: 66.43 - Formules explicites pour les calculs de l'espérance 


Maïntenant, il nous faut calculer la variance en utilisant la relation démontrée dans la partie théorique des 
paragraphes précédents: 


r 
V(R,)=o(R,)= of. XT.(B,.X) (66.425) 
avec pour rappel dans notre cas particulier: 
es 
+ À& 48 
Cr 


B;, ; = & 8 a A4 | (66.426) 
I 


avec dans notre exemple ci = 0.033 (cellule B13). 


Soit sous forme développée pour notre exemple: 
(8, )= Aa +Xia + Xios 
HA X,07 8 8 +22 X,05 88 +2X,X307 88 


(66.427) 


Ce qui donne dans Microsoft Excel 11.8346 pour notre matrice des bêtas: 
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A B c D 
2 
24 el Ti 72 13 
25 TA[ 5547102374 0081703388 -3.18/578249 
26 T2] 0081709338 0.064590248  0.115907001 
27 Ta 3187578249 0115907001  5.679601736 


Figure: 66.44 - Matrice des bêtas 


Soit sous forme développée (la matrice est symétrique): 


À E C D 
23 
24 
25 =C11*D11 =C11*E11 
26 #21=C11*D11 =D13/613 =D11*E11 
27 #=C11*E11 =D26 =E13/813 


Figure: 66.45 - Formules explicites pour la matrice des bêtas 


Et finalement le couple variance/espérance du portefeuille est donné par: 


Portefeuilie 


0.198 


0.0217 


Soit sous forme détaillée: 


À B C D E 
19 Portefeuille 
20| £lR,| =SUMPRODUCT(B16:D16)(B17:D17)) 
21/07 {8,1 =SUMPRODUCT(MMULT(B16:D16;825:D27);B16:D16)"813 


Figure: 66.47 - Formules espérance/variance 


Une fois ceci fait, nous procédons comme pour la frontière de Markowitz. Nous utilisons le solveur en 
minimisant la variance tout en imposant une espérance et une contrainte comme quoi la somme des parts 
des actifs financiers est égale à l'unité: 
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Solver Parameters 


Set Target Cell: 

Equal To: C'Max CMg (Yale of: fo 

-By Changing Ceks: __Gese _ | 
fseti6:$0416 «] Guess | 

Subject to the Constraints: - - 


| Options _| 


Figure: 66.48 - Paramétrages du solveur 


Ce qui donne le tableau variance/rendement suivant (à comparer avec le même tableau de Markowitz): 


ftération Varisence Rendement 
1 0.0110 0.200 
2 0.0076 0.205 
3 0.0051 0.210 
4 0.0034 0.215 
5 0.0025 0.220 
6 0.0024 0.225 
7 0.0032 0.230 
8 0.0047 0.235 
9 0.0071 0.240 
10 0.0103 0.245 


Figure: 66.49 - Itérations obtenues à l'aide du solveur 


et le graphique suivant (comparaison directe avec Markowitz mise en évidence): 


— Sherpe 
| ——Markowwvitz 


0.190 
0.000  O.002 0004 0006 0008 0010 0012 0.014 


Figure: 66.50 - Comparaison entre les frontières de Sharpe et Markowitz 


La suite de l'exercice (C.M.L.) se fait de la même manière que dans le modèle de Markowitz. 
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7.7. MODÈLE D'ÉVALUATION DES ACTIFS FINANCIERS (MEDAF) 


Comme nous l'avons vu, Markowitz (1959) a développé la théorie du choix optimal d'un portefeuille par 
un individu sur la base de la variance du rendement espéré. Plus tard (1963), Sharpe élabore un modèle de 
choix d'actifs basé sur des indices de risques comme les coefficients bêta. 


Sharpe, Lintner et Mossin (1965) ont ensuite étudié les conséquences de ces théories pour mettre en place 
une théorie extrêmement simple permettant d'évaluer les coefficients bêta, les rendements espérés et les 
variances d'actifs financiers d'un portefeuille à partir de données statistiques sur le marché global et de la 
spécificité de la composition d'un portefeuille. 


Cette théorie basée encore une fois sur le problème moyenne-variance est appelée "modèle d'évaluation 
des actifs financiers" (MEDAF) ou encore "modèle d'évaluation des actifs financiers à l'équilibre" 
(MEDAFE) (en anglais: "capital asset pricing model" (C.A.P.M.)). C'est donc un modèle très souvent 
utilisé, aussi bien par les praticiens que par les académiciens, pour évaluer les rendements anticipés 
d'équilibre de n'importe quel actif risqué sur le marché. 


Pour commencer, rappelons que nous avons vu plus haut lors de notre étude du return que le taux de 
rentabilité périodique (quotidien, hebdomadaire, mensuel, annuel) d'un actif se calcule comme suit: 


L (E—-EÆ)+cC, 
r, D 
t-l 


avec À qui est le prix d'un actif à la fin de la période t, À, le prix de ce même actif à la fin de la période 
t-1 et finalement €, le flux monétaire payé par l'actif pendant la période de détention allant de t-1 à t. 


4 Li 


Cette relation sert à calculer le "rendement réalisé 
espéré" qui intéresse un investisseur donné. 


(ex post) d'un titre alors qu'au fait c'est le "rendement 


À la date de la prise de la décision, le rendement que va réaliser l'investisseur en détenant un actif donné 
est incertain, c'est pour cette raison que l'on parle de rendement espéré: il s'agit d'un rendement que l'on 
cherche à évaluer et que l'on espère recevoir au cours de la prochaine période d'investissement. 


Pour calculer le rendement espéré, comme nous l'avons déjà vu, il convient d'attribuer à chaque valeur 
possible du rendement une probabilité de réalisation, puis de calculer une moyenne pondérée de ces 
différentes valeurs possibles en utilisant les probabilités », comme pondérations: 


E(R)=H=p Ratp2 Rot.+p R=>p;.R; 
J=1 


Or, il est clair que dans une économie donnée, l'investisseur sera tenté de détenir plusieurs actifs financiers 
et cherchera donc à composer des portefeuilles. Le rendement (moyen) espéré d'un portefeuille peut être 
calculé en utilisant la relation connue: 


E(R,)= Xi E(R)+ 42 E(R)+. +4 E(R)= XX; ER) 


2=1 
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avec n qui est le nombre de titres inclus dans le portefeuille, Æ{ À, | le rendement de l'actif à inclus dans le 


portefeuille et Æ, la proportion de la richesse totale de l'investisseur investie dans l'actif i. 


Le taux de rendement espéré est cependant insuffisant pour caractériser une opportunité d'investissement 
et il faut tenir compte également du risque, c'est-à-dire de la variabilité du rendement de cet 
investissement sur l'actif financier. La variance est comme nous l'avons déjà vu utilisée comme mesure du 
risque et donnée pour un actif financier par: 


VR)= oc = [Ai - ER +p2 [Ra ERIT +47, [R,-E(RT (664 


Soit: 


=X(8- ER) P; (66.432) 


J=l 


Le calcul du risque d'un portefeuille fait donc intervenir deux concepts importants: la variabilité du 
rendement de chacun des actifs, mesurée par les variances de ces derniers, ainsi que les relations 
existantes entre les différents actifs composant le portefeuille. 


La dépendance entre deux actifs est souvent mesurée, comme nous en avons déjà fait mention lors de 
notre étude des return, par la covariance ou encore le coefficient de corrélation linéaire. 


La covariance entre deux actifs i et j se calcule comme suit: 


co(R,R;)= [RER] |Ra-EÆ(R;)|+22[R2-E(R I] R2-E(R;)|+.+ 
Pa[ An ER ] [Re - E(R; ] 


Soit comme nous le savons si les probabilités sont équiprobables: 


cov(R.R) = X(R — E(R))(Rx — ECR;))| (66.434) 
&=l 


La covariance entre les rendements de deux titres peut être positive ou négative et sa valeur n'a aucune 
signification économique comme nous le savons (cf. chapitre de Statistiques). 


Remarque: Rappelons que nous avons vu dans le chapitre de Statistiques que, lorsque les rendements 
(valeurs) de deux actifs (variables aléatoires) varient dans le même sens (dans le sens contraire) leur 
covariance sera positive (négative). 


Le coefficient de corrélation entre deux actifs i et j quant à lui se calcule comme suit (cf. chapitre de 
Statistiques): 


cov(R,,À;) LG 


Ry= —— - (66.435) 
PCR) PR) Go 
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Une fois les variances et covariances des différents actifs calculées, nous serons en mesure de calculer la 
variance de rendement d'un portefeuille contenant n actifs. Cette variance est donnée par la relation 
suivante (« ques): 


V(R,) = SYAX, cov(R.R;)= Aid +Y D XX,cov(R.R,) 


i=l j=1  j 


ou écrit autrement: 


V(R,)= ZAPVR)HEEAX, cov(R,,R;) 


icÿ 


La relation ci-dessus de la variance de rendement d'un portefeuille montre clairement que même dans le 
cas où les rendements des différents actifs détenus dans le portefeuille sont totalement non corrélés, la 
variance de ce dernier peut encore être réduite en ajoutant plus d'actifs. 


Pour comprendre ceci, nous noterons que pour n actifs non corrélés, la variance se réduit à (puisque la 
covariance est alors nulle): 


VR,) = © = Y X202 
2=| 


En simplifiant davantage, si toutes les variances sont supposées égales et si tous les actifs sont détenus 
dans les mêmes proportions (1/n), nous avons (cf. chap e ): 


1 


= 3 22of =[ 1) ne? = Log 
i=1 #4 


Ainsi, quand n tend vers l'infini, la variance du portefeuille s'approche de zéro. Ainsi, si des risques non 
corrélés sont réunis en portefeuille, le risque total peut être éliminé par diversification. Dans le cas où les 
risques sont corrélés, la diversification ne permettra d'éliminer que les risques spécifiques aux actifs alors 
que le risque de marché continuera d'exister. Notons que la réduction du risque serait plus importante 
lorsque les différents actifs détenus sont négativement corrélés. En effet, plus le coefficient de corrélation 
entre les rendements des titres est petit, plus les bénéfices inhérents à la diversification sont substantiels. 
Dans le cas où le coefficient de corrélation est égal à 1, il n'y a aucun bénéfice lié à la diversification, 
puisque le risque du portefeuille sera égal à la moyenne pondérée des risques le composant. Par contre, la 
diversification est à son maximum lorsque le coefficient de corrélation est égal à -1. Dans cette situation, il 
est possible de combiner deux actifs risqués pour former un portefeuille sans risque. 


D'après ce qui précède, il est clair que tout investisseur désirant former un portefeuille cherchera à détenir 
un ensemble d'actifs risqués qui lui permettra de recevoir un rendement donné avec un minimum de 
risque. En d'autres termes, il cherchera à minimiser la variance pour un niveau de rendement espéré tout 
en respectant une contrainte budgétaire. Nous savons que le rendement espéré et la variance de rendement 
d'un portefeuille contenant n actifs risqués s'écrivent comme suit: 
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E(R,)= XX; ER) 
i=1 


(66.440) 


Var(R,)= XD XX, 
i=1 ;=l 


Par ailleurs, nous savons qu'à partir de ces n titres, il est possible de construire une infinité de portefeuilles 
en faisant varier les pondérations X.. Or, les portefeuilles les plus intéressants pour un investisseur donné 


sont ceux qui permettent de minimiser le risque qu'il doit supporter pour obtenir un niveau de rendement 
donné. Ces portefeuilles sont le résultat du problème de minimisation suivant qui est un problème 
d'optimisation non linéaire (cf. chapitre de Méthodes Numériques): 


rnin : Var (2,) 
E(R, ) = c (66.441) 
24 =1 

que nous avions déjà vu lors de notre étude du modèle de Markowitz. 


Il est donc possible de constituer une infinité de portefeuilles en faisant varier les proportions investies 
dans chacun des titres. La prochaine étape consiste à sélectionner, parmi l'ensemble des portefeuilles 
disponibles, un portefeuille donné. Pour ce faire, on doit considérer les préférences individuelles de 
l'investisseur. 


Un investisseur rationnel ne devrait donc considérer que les portefeuilles se trouvant sur la frontière 
efficiente pour ses choix d'investissement. Son portefeuille optimal se situera au point de tangence entre la 
frontière efficiente et sa courbe d'indifférence la plus haute qu'il serait capable d'atteindre. En procédant 
ainsi, chaque investisseur maximisera son utilité espérée. En présence d'une économie ne contenant que 
des actifs risqués, la composition du portefeuille d'actifs risqués varie d'un individu à un autre. 


En pratique, les investisseurs ont également la possibilité d'investir dans des actifs financiers sans risques. 
Nous allons donc chercher à déterminer la nouvelle frontière efficiente en tenant compte de cette nouvelle 
opportunité d'investissement. 


Considérons alors un portefeuille qui est une combinaison de l'actif sans risque et d'un portefeuille de 
marché (à risque). Nous avons alors: 


LR +(1-X,)R;, (66.442) 


où #,, est la fraction du portefeuille investie dans le portefeuille du marché (m) et À; est le "taux de 


rendement certain" ou "taux de rendement sans risque”. 
Rappel: L'espérance d'une constante est égale à cette constante (cf. chapitre de Statistiques). 
Nous avons donc: 

E(R,)= ZX E(Ra)+(1- X)E(Rs) = À ER) +(1-X,)R; (66.443) 


et donc: 
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PR | = VU XmRm +1 Zn ) Rp | 


2 
El Xnkn +1 XniRs — El Lin Rm + (1 mn Rp | | 


| 2 
E||Ænkn +CI=A 1k, me VRh | | (66.444) 


ELA R, A ir | - 2] x ns Et | 
= L2gliR -E 211 2 
= An E| Ron Eten) [= An Am | 
Soit sous forme condensée: 
2 
oi = Xo2 (66.445) 
La dérivée du rendement espéré par rapport à #,, nous donne: 


dE(R,) 
x, 


= E(Ry)-R; (66.446) 


La dérivée de l'écart-type par rapport à Æ,, nous donne: 


2(R,) | L 
DT NE o(R,) (66.447) 


mi 
Mettant ces deux résultats ensemble, nous avons: 


2E(R,) _ E(R)- Ry 
ÔR,) GR) 


(66.448) 


Cette équation nous donne la pente de la "capital market line" (C.M.L.). Elle est constante (la pente!), et 
donc la C.M.L. est une droite. L'ordonnée à l'origine est évidemment À; . 
Puisque: 
E(R,)= Zn E(Rn) +(1- Zn) Rg = Xn(E(Rn) = Ry)+Ry (66.449) 
l'équation de la C.M.L. se réduit alors à: 


c(R,) 
TR) 


E(R,)= (ER)-R;)+R; (66.450) 


Et puisque dans la finance l'intérêt est de représenter graphiquement . 


E(R,)= J(otR,)) (66.451) 
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Alors, il est de tradition de noter la fonction sous la forme suivante: 


ER,)- y 
GiR,) 


E(R, )= GR, )+R;| (66.452) 


où nous retrouvons en facteur de l'écart-type de &, le coefficient appelé "Sharpe ratio" (ou ratio de 


Sharpe) dont nous avions parlé plus haut mais sans en démontrer la provenance. 


Par construction, cette droite associe donc à chaque niveau de risque, la rentabilité espérée la plus élevée. 
Ainsi, étant donné le rendement d'un actif sans risque il devient facile à partir de cette équation de 
déterminer le point de tangence avec la frontière d'efficience de Markowitz ou de Sharpe pour obtenir le 
portefeuille le plus efficient sur la base du rendement sans risque!! 


Intéressons-nous maintenant à déterminer une équation pour le rendement espéré de n'importe quel actif 
individuel. 


Considérons un nouveau portefeuille de rendement À >» qui est une combinaison d'un actif sans risque 
quelconque À et du portefeuille de marché, où Æ, est la fraction du portefeuille investie dans l'actif sans 
risque A. 


Ce que nous souhaiterions évaluer est la pente de la courbe des combinaisons espérance/écart-type 
lorsque nous combinons le portefeuille de marché (qui contient déjà l'actif A) avec l'actif A. 


Nous souhaitons évaluer la valeur de la pente de l'équation tangente à la frontière efficiente telle que la 
pondération de l'actif sans risque A soit nulle. 


Nous avons: 


” 


R, = ÆaRa +T(—-Æy)Rn (66.453) 
Nous obtenons de suite: 
ECR,)= X4E(Ry)+(1- XYDEUR,) (66454) 
et (cf. chapitre de Statistiques): 
ViR,) =V(Ry)+ PVR) +2cov(Ra À.) (66.455) 
donc: 
m(R,) = Xio?(R;)+(1-X,) OR) +2X (1 Xu)cov(Ra,R,) (66.456) 
Dérivant le rendement espéré de ce nouveau portefeuille par rapport à X#,, nous obtenons: 


OE(R,) 


=E(R,)\-E (66.457) 
KE, (Ru E(2,) 


Dérivant l'écart-type du rendement de ce nouveau portefeuille par rapport à Æ,, nous obtenons: 
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2etR,) _1 2K 0 (Ra 2(1-X4)O(R,)+(2—4X 4) cov(Ra, Re) a. 
OX 4 2 (X202 (Ra) +01 ZaY (Rs) +2X 401 Xa)cou(Ry, Ram) 


La contribution de Sharpe et Lintner a été de dire qu'il faut évaluer ces dérivées au point où Æ#, = 0 c'est- 


à-dire où la pondération de l'actif À dans le nouveau portefeuille est nulle. 


Ce faisant, nous obtenons, l'expression suivante pour l'écart-type du nouveau portefeuille (bien sûr, 
l'expression pour le rendement espéré ne change pas): 


9ctk,) 
EX y 


_1 202 (R,)+2cov(Ra,R) 


A (66.459) 
xs ? RETTE 


ce qui donne après simplification: 


9ctk,) 
8x y 


_ Cov(Ra, Ru) (Ru) 
Ta) 


(66.460) 


X 4=0 


Avec les deux dérivées, nous pouvons obtenir une expression pour la courbe de combinaisons 
espérance/écart-type pour le nouveau portefeuille. Nous avons alors: 


DER, ) 
2ctk,) 


_ E(Ry)- ER,) 
eo [OVCRa Ru) — OCR) flot) 


(66.461) 


Cette pente doit être égale à celle de la C.M.L. En égalisant, nous obtenons: 


ER) Rs _ E(R4)- E(Rn) 
R) ['covCR NE a (R,) |! {R,) 


(66.462) 


Quelques manipulations algébriques et nous y sommes! Nous avons: 


E(Rn)= Rj _  ElRa)- E(Rn) 
(Ru)  cov(Ry,R,)- o°(R,) 


(66.463) 


et donc: 


E — À 
HR D = EE fcon( Re Ru= 4(Rn)}+ ER) 
covR4, À) 
(8) 
COVCR 4, À) 
o(Ry) 


- (E(R,)-R;) —E(R,)+ À; +E(R,) (66.464) 


=(Æ(R,)-R;,) +R; 


d'où: 
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E(Ry)- R; =(E(R,)-R;) 


COvCR 4, À) 
(Rx) 


(66.465) 


En posant ce que nous avons déjà vu lors de notre étude du modèle de Sharpe, c'est-à-dire le risque non 
diversifiable sous forme de facteur bêta: 


8- covÉR4,R,) 
(Rx) 


(66.466) 


c'est donc la volatilité de la rentabilité de l'actif considéré rapportée à celle du marché. 


Nous avons alors: 
ER) À; = (ER) _ R;) B (66.467) 


Cette expression permet donc d'exprimer le rendement excédentaire d'un actif comme le produit du 
rendement excédentaire du portefeuille de marché et le facteur bêta du titre. 


Le rendement excédentaire d'un actif ne dépend pas directement que de sa variance, qui est souvent une 
mesure intuitive du risque d'un actif. Ce qui compte est son facteur bêta, qui dépend de sa covariance avec 
le portefeuille de marché. 


Plus classiquement, la dernière relation est utilisée graphiquement sous forme de droite: 


E(Ra)= S(8)= (ER) -R;)8+R; (66.468) 


Cette droite est appelée la "security market line" (S.M.L.) elle est extrêmement importante en finance, car 
elle donne donc le rendement moyen d'un titre À en fonction du bêta, du rendement du marché et du taux 
sans risque. 


Exemple: 


Le taux sans risque est de 5% et la rentabilité espérée du marché est de 8%. Une action A est deux fois 
plus ensible aux mouvement de marché que l'indice de référence, in extenso lorsque l'indice enregistre une 
hausse de 1%, l'action À montre de 2%. D'après la S.M.L, la rentabilité espérée est alros de: 


E(Ry)= F(E)= (ER) -R;) B+Ry (66.469) 


Remarque: Le lecteur vérifiera facilement que dans la relation ci-dessus, si le bêta est égal à l'unité, le 
rendement espéré du titre À sera égal au rendement espéré du marché. Le MEDAF est donc un outil de 
détermination de supplément de rentabilité que l'on doit attendre lorsqu'on s'investit dans un 
portefeuille ou une société donnée (société dont le rendement est estimé sur la base de ses dividendes 
si elle est cotée ou sinon comparée à des sociétés équivalentes qui elles seront cotées). 


On la trouve aussi fréquemment sous la forme suivante: 


E(R4)= AB+R, (66.470) 
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avec À qui est appelé la "prime par unité de risque" ou plus simplement "prime de risque" (surplus de 
rentabilité exigé par les investisseurs lorsque ces derniers placent leur argent sur le marché plutôt que dans 
un actif sans risque) et l'ordonnée à l'origine est le taux d'intérêt sans risque (généralement des emprunts 
d'État). 


Le MEDAF stipule donc que le taux de rendement espéré (ou que devrait exiger un investisseur rationnel 
ayant une aversion pour le risque) d'un actif risqué doit être égal au taux de rendement de l'actif sans 
risque, plus une prime de risque appelée parfois "spread de crédit". Dans ce cas, la relation entre le risque 
systématique et le rendement espéré demeure linéaire et seul le risque systématique doit être rémunéré par 
le marché puisque le risque spécifique peut être éliminé grâce à la diversification. 


Il est peut-être intéressant d'expliciter les hypothèses sur lesquelles reposent mathématiquement les 
développements que nous avons faits. Ce sont donc les hypothèses du MEDAF dont certaines semblent 
difficilement acceptables. Il ne faut cependant pas oublier que la validité d'un modèle ne dépend pas du 
réalisme de ses hypothèses mais bien de la conformité de ses implications avec la réalité. 


Nous avons pour rappel émis les hypothèses suivantes: 


H1. Les investisseurs composent leurs portefeuilles en se préoccupant exclusivement de l'espérance et de 
la variance de rendement de ces derniers 


H2. Les investisseurs ont une aversion pour le risque: ils n'aiment pas le risque 
H3. Il n'y a pas de coût de transaction et les actifs sont parfaitement divisibles 
H4. Ni les dividendes, ni les gains en capitaux ne sont taxés 


H5. De nombreux acheteurs et vendeurs interviennent sur le marché et aucun d'entre eux ne peut avoir 
d'influence sur les prix. 


H6. Tous les investisseurs peuvent prêter ou emprunter le montant qu'ils souhaitent au taux sans risque. 
H7. Les anticipations des différents investisseurs sont homogènes 
H8. La période d'investissement est la même pour tous les investisseurs 


7.8. MODÈLE D'ÉVALUATION DES OPTIONS DE BLACK & SCHOLES 


C'est au génie de trois célèbres mathématiciens que le marché des dérivés doit son succès, grâce à 
l'équation de Black & Scholes conçue dans les années 1970 (et publiée en 1973) qui permet de déterminer 
théoriquement la prime exacte que doit payer un client pour acquérir un Call ou un Put et la stratégie que 
devra suivre le vendeur de ces options pour se couvrir du risque (pour ne citer que l'exemple le plus 
connu). Évidemment ce modèle ne fonctionne que si les périodes temporelles considérées sont 
relativement courtes (de l'ordre de la semaine ou de quelques mois au mieux). Au-delà l'utilisation de ce 
modèle théorique particulier est une farce! 


Black, Scholes et Merton sont les ancêtres d'une génération de produits dérivés sophistiqués, donnant droit 
de cité à tout un lexique de termes aussi exotiques que Butterflies, Rainbows, Knock-in, Knock-out, 
Barrières, Swaps, Calls, Puts, Baskets, Swings. Ce modèle est aussi considéré ceci dit comme un des 
facteurs principaux du crash boursier de 1987 par certains spécialistes. 
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Ce que nous aimerions dans ce qui va suivre est déterminer la valeur théorique de la prime d'une option à 
partir des cinq données suivantes: 


1. La valeur actuelle de l'actif financier sous-jacent de l'option (déterminée par la spéculation du marché). 
2. Le temps qui reste à l'option avant son échéance (choisie par la société émettrice). 

3. Le prix d'exercice (strike) fixé par l'émetteur subjectivement ou après modélisation. 

4. Le taux d'intérêt sans risque (supposé comme étant le taux de rendement attendu du sous-jacent). 

5. La volatilité (écart-type) du prix du sous-jacent de l'option (mesurée sur le marché). 

La prime de l'option ainsi déterminée sera unique et équitable pour les deux parties. Effectivement, le 
système des options permettrait de faire payer un prix d'option (prime) majoré par rapport aux prévisions 
du marché et donc de générer à coup sûr et à partir de rien un profit mais les nombreux acteurs du marché 


vont faire jouer la concurrence pour être au plus juste et attirer le client sur leurs options plutôt que sur 
celles de la concurrence. 


La modélisation du cours des options (Black & Scholes) repose sur l'utilisation du calcul différentiel 
stochastique. Ainsi, l'approche de Black et Scholes suppose que l'évolution du cours de l'action définit un 
mouvement brownien géométrique (dans le sens que les mouvements possibles du prix tendent vers 
l'infini) et que son rendement définit un processus de Wiener généralisé (concept que nous allons définir 
un peu plus loin). 


7.8.1. ÉQUATION DE PARITÉ CALL-PUT 


Avant de nous attaquer à des calculs stochastiques un peu ardus, il est utile d'établir au préalable une 
équation dite de "parité Call-Put" qui nous servira de sorte d'équation de conservation pour vérifier la 
validité des résultats que nous établirons par la suite sur l'évaluation des prix des options. 


L'objectif va être de répondre à la question suivante: Quelle somme M devons-nous payer maintenant pour 
recevoir une somme garantie E correspondant au prix "prix d'Exercice" (qui est la notation française du 
"strike price" K utilisée jusqu'à maintenant) à un temps futur T ? 


Ainsi, nous avons vu lors de notre étude du calcul d'intérêts qu'en considérant un capital C et un intérêt r 
constant nous avions dans un cas de capitalisation continue: 


Dès lors, en posant © = Æ et C; = M nous avons: 

E = Me* 
d'où: 

M = Ee* 


Mais cette relation n'est pas tout à fait juste. Effectivement, nous devons avoir M = E assuré au temps T = 
t. Dès lors nous sommes naturellement amenés à poser: 
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M = Ee\*#) (66.474) 


Nous allons maintenant supposer que le Call et le Put possèdent les propriétés suivantes: 

P1. Même support qui vaut S à l'instant t (spot). 

P2. Même échéance T 

P3. Même prix d'exercice E (souvent noté K) 

et les hypothèses suivantes: 

H1. Il n'existe pas de coûts de transaction 

H2. Le support n'est pas un instrument à terme (i.e. qu'il est payable ou livrable immédiatement) 
H3. Le support ne verse pas de dividendes pendant la durée de vie de l'option ( i.e. entre [O,T1] ). 
H4. Les options sont européennes 


En nous reposant maintenant la question initiale: Quelle somme devons-nous payer maintenant pour un 
portefeuille afin de recevoir une somme garantie E (prix d'exercice) à un temps futur T ? 


Le portefeuille pouvant être considéré comme une boîte noire, rien ne nous empêche dès lors de répondre 
en écrivant avec S le prix du jour du sous-jacent, P celui du Put et C celui du Call: 


I=S$+P-C= 8e "7" (66.475) 


qui n'est rien d'autre que "l'équation de parité Call-Put" ou autrement écrite si nous adoptons la notation 
anglo-saxonne K au lieu de E et nous prenons comme début le temps zéro, alors: 


S+P-C= Ke "T (66.476) 
En toute rigueur, il vaudrait cependant mieux écrire cette dernière écriture sous la forme suivante: 
C,-B=8S,-Ke "4 (66.477) 


Quel que soit le réarrangement des termes dans cette dernière égalité, il doit toujours y avoir égalité sinon 
quoi il y a opportunité d'arbitrage. Cette relation montre aussi que la valeur d'un Call européen avec prix 
d'exercice K et maturité T peut être déduite de celle d'un Put européen avec le même prix d'exercice K et 
la même maturité T. 


Voyons plus en détails suite à la demande d'un lecteur que cette dernière relation découle de l'absence 
d'opportunité d'arbitrage (O.A.0.): 


Considérons la configuration fréquente et naturelle d'un premier agent ayant un portefeuille A contenant 
une option d'achat (Call) européenne de prix C et une somme g,-"f investie dans un placement sans 


risque. La valeur initiale de ce portefeuille sera donc: 


Pa =C+ Ke 'T (66.478) 
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Considérons la deuxième configuration naturellement opposée à la première d'un portefeuille contenant 
une option de vente (Put) européenne de prix P et le sous-jacent de prix S. La valeur initiale de ce 
portefeuille sera donc: 


Fg = P+S$S (66.479) 
Nous avons alors deux scénarios: 


S1. À l'échéance (maturité) T, si le sous-jacent a une valeur inférieure ou égale au prix d'exercice (soit 
Sr € #), le portefeuille À vaudra K car l'option Call ne sera très probablement pas exercée et donc sa 


valeur financière devient nulle maïs l'actif sans risque (placé au rendement sans risque) aura lui rapporté 
K. Le portefeuille B quant à lui vaudra :£—$r 1+$7 = & où le terme entre parenthèse représente le gain 


généré par le Put. 


S2. À l'échéance (maturité) T, si le sous-jacent a une valeur supérieure au prix d'exercice (soit ST >K) 
nous sommes donc une situation contraire à celle du premier scénario. Le portefeuille À vaudra alors 
(Sr -K1+K =$7.Le portefeuille B vaudra lui 0+ $7 = $7 car la vente ne sera pas effectuée et l'option 


de vente sera alors considérée comme ayant une valeur nulle. 


Pour résumer: 


si Sr £K si S7 > & 
Pal0+K=K (Sr-Ki+K=Sr 
Fe (K—Sri+Sr = K 0 + Sr = Sr 
A= B A= B 


Tableau: 66.15 - Résumé de l'absence d'opportunité d'arbitrage 


Donc les deux portefeuilles sont toujours égaux à maturité sinon quoi il y a opportunité d'arbitrage. Ce que 
nous pouvons écrire (l'indice T pour le cours du sous-jacent à maturité est souvent omis): 


C'+Ke *T=p+S$ (66.480) 
7.8.2. HYPOTHÈSE D'EFFICIENCE DU MARCHÉ 


Le modèle de Black & Scholes (et beaucoup d'autres modèles financiers) se base sur le postulat que le 
marché est "efficient". 


Définition: Un "marché efficient" ("Efficient Market Hypothesis" en anglais. - abrégé E.M.H) est un 
marché où les prix reflètent complètement toute l'information disponible. Ainsi, si le marché est efficient, 
il n'est pas possible de faire des profits anormaux. 


Nous pouvons distinguer trois types de marchés efficients qui sont fonction du type d'information 
disponible: 


1. L'hypothèse de marché efficient en "forme faible" qui explicite que les prix reflètent toute l'information 
contenue dans la série historique des prix. 
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2. L'hypothèse de marché efficient en "forme semi-forte" établit que les prix reflètent toute l'information 
publique disponible. 


3. L'hypothèse de marché efficient en "forme forte" qui établit que toute l'information connue, publique et 
privée, est reflétée dans les prix du marché. 


Plusieurs études ont essayé de tester l'hypothèse de l'efficience des marchés des actifs. Pour tester la 
forme faible de l'hypothèse, on a utilisé l'analyse des séries temporelles (voir plus loin) en testant 
spécifiquement l'hypothèse d'une marche au hasard (mouvement brownien - nous y reviendrons). Plus 
spécifiquement, ces tests ont essayé de tester si les accroissements des prix sont indépendants des 
accroissements passés. Si l'hypothèse d'une marche au hasard est rejetée, alors le marché n'est pas 
efficient, car les accroissements de prix passés pourraient aider à anticiper les prix futurs des actifs. 
L'évidence empirique soutient l'hypothèse de marché efficient en forme faible. Pour tester la forme 
semi-forte de l'hypothèse, on a évalué la vitesse d'ajustement des prix de marché à l'arrivée de nouvelles 
informations; l'évidence en faveur d'un rapide ajustement des prix de marché est dominante. La forme 
forte de l'hypothèse de l'efficience des marchés, consiste à tester s'il est possible de tirer profit d'une 
information privilégiée (information accessible à un petit groupe d'agents économiques). Étant donné 
qu'on ne peut pas identifier l'information non publique, un type de test de forme forte considère l'examen 
de la performance d'investissement des individus ou groupes qui pourraient avoir de l'information privée. 
Elton et Gruber (1984) signalent que l'analyse de la performance des fonds mutuels, après déduction des 
coûts, soutient la forme forte de l'efficience. 


Ceci implique les hypothèses suivantes (pour résumer en gros): 


H1. L'histoire passée du cours de l'option est complètement réfléchie dans le prix présent qui ne contient 
lui pas d'autres informations sur l'option 


H2. Le marché incorpore immédiatement toute nouvelle information dans le prix d'une option. 


Le paradoxe du postulat des marchés efficients tient à ce que si chaque investisseur pensait vraiment que 
le marché était parfaitement efficient, alors personne n'étudierait les sociétés, leurs bilans, etc. Il suffirait 
d'acheter de l'indice. En vérité, les marchés efficients dépendent d'individus actifs sur le marché parce 
qu'ils pensent que ce marché est "inefficient" et qu'ils peuvent faire mieux que le marché ! 


Ce postulat est source de beaucoup de débats dans le domaine... 


Remarque: Avec les deux hypothèses précédemment énoncées, tout changement non anticipé dans le 
prix de l'option est appelé un "processus de Markov". 


Rappel: Un processus de Markov est un processus dont l'évolution future ne dépend de son passé qu'à 
travers son état à l'instant présent. Or, le cours d'une action n'est vraisemblablement pas un processus de 
Markov (la "mémoire" du processus est probablement plus longue - par exemple une tendance 
saisonnière). 


7.8.3. PROCESSUS DE WIENER 


Soit Ax la variation de la valeur d'une option (ou autre actif financier volatile) sur un petit intervalle de 
temps noté /#. 
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Nous posons que (dans le sens que la variation de l'option est similaire à la variation de la valeur du 
sous-jacent! ): 


et à l'aide de la connaissance des deux résultats majeurs du modèle de Bachelier vu plus haut nous avons 
donc pour les variations de la valeur de l'option une espérance positive dépendante de manière 
proportionnelle à la racine carrée du temps selon: 


À = ef (66.482) 


où nous posons comme hypothèse (acceptable. car nous travaillons sur de petites variations pour rappel!) 
que le coefficient d'instabilité est une fonction: 


€ — N(0,1) (66.483) 


où rappelons-le, N(0,1) est la notation de la loi Normale centrée réduite telle que nous l'avons établie dans 
le chapitre de Statistiques. 


Remarque: Souvent dans le domaine de l'économie, nous notons WN au lieu de N en hommage à 
Wiener. 


Ceci dit, la relation antéprécédente est souvent notée de manière généralisée: 


PF, = M +e Vas = Hi + N(0,1)Af | (66.484) 


et définie comme étant un "mouvement brownien standard" avec "bruit blanc" (loi marginale de type 
Normale), ou "mouvement brownien arithmétique", où le W est là par hommage à Wiener! Il est 
intéressant de remarquer que le mouvement brownien est supposé indéfiniment divisible (ce qui signifie 
que la période temporelle prise n'influe pas sur la loi de probabilité qui reste toujours la même... c'est une 
propriété fractale du mouvement brownien qui a été creusée par Mandelbrot aussi!). 


Ne pas oublier pour une démonstration que nous ferons plus loin que nous en déduisons: 


Mau We = MO, 1) At = M(0,D/+1)—£= M0,1) (66.485) 


Il est possible de produire un graphique de ce mouvement brownien dans la version anglaise de Microsoft 
Excel 11.8346 avec dans la colonne A le temps avec un pas As typique de 0.01 [s] (colonne qui sera là 
uniquement par souci de confort de lecture et par tradition) et dans la cellule B2 la formule suivante: 


=B1+NORMSINV(RAND())*SQRT(0.01) 
où B1 contient la valeur 0. 


Nous obtenons alors pour 4 colonnes du même type les variations de valeurs suivantes: 
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Figure: 66.51 - Exemple de 4 mouvements browniens standards 


Les mouvements browniens standards ont certaines propriétés remarquables comme nous pouvons le voir: 
la trajectoire a tendance à alterner au-dessus et en dessous de l'axe des abscisses. Cela provient de ce que 
la loi Normale considérée est d'espérance nulle, autrement dit qu'il n'y a pas de tendance générale à la 
hausse ou à la baisse des variations (pour le vérifier faites au moins 30'000 points dans Microsoft Excel et 
vous verrez...) 


Il est facilement possible de caractériser Az à l'aide de son espérance: 
E({y) = Es VW) = JA: E(e)= JAM:'0=0 (66.486) 
effectivement, rappelons que pour la loi Normale centrée réduite, nous avons: 
4 = E(x) = 0 (66.487) 


donc nous pouvions nous attendre à ce résultat d'absence totale de tendance générale (c'était quasi- 
intuitif!). 


Nous pouvons également caractériser AZ à l'aide de sa variance: 
F(Az) = v(eVx) = M'V(e)=M'1=AM (66.488) 
d'où: 
y = VA (66.489) 
effectivement, rappelons que pour la loi Normale centrée réduite, nous avons: 


ai =W(x) =1 (66.490) 
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Finalement (au fait ce résultat découle de manière immédiate de la propriété de linéarité de la loi 
Normale): 


Âx = lg = N(0. V4) (66.491) 
Donc lorsque nous avons: 


Elhz\=0 
(66.492) 
El Az? |= E(ahti= AtE(e)= A6 


Il est d'usage de parler de "processus de Gauss-Wiener" ou plus simplement ou plus simplement de 
"processus de Wiener”. 


Pour résumer un peu les choses... 


1. Nous savions avec le modèle de Bachelier que l'espérance positive et l'écart-type positif de la valeur 
sont proportionnels à la racine carrée du temps. Nous avons utilisé ces deux résultats ici. 


2. Nous savons maintenant (sous l'hypothèse bien précise d'un coefficient de type Normal) que les 
variations ont une espérance (tendance) nulle et un écart-type proportionnel à racine carrée de la variation 
temporelle. 


La propriété qui vient d'être établie reste valable pour un grand intervalle de temps noté T correspondant à 
n petits intervalles A !!! En d'autres termes: 


T=n"AM (66.493) 
Dans ce contexte, il convient de remplacer Ax par: 


x(7) -x(0) (66.494) 


x(7) — x(0) = Ÿ Ar = Ÿ 4e, Ve JA (66.495) 
il 


il il 


Comme dans l'hypothèse d'une évolution du cours sur un petit intervalle de temps, il est possible de 
caractériser x(7”) - x{0i à l'aide de son espérance et de son écart-type: 


sam -x0) - #[Ÿ VE - (WE Ÿ«) - ES E(&)- VEr-0-0 


(66.496) 
Fx(T) - x(0)) = rave =MY ÿ«] = AS V(a)= AS 1=n A =T 
il 3] i 


ce qui est logique... 


Nous retrouvons alors, pour un grand intervalle de temps T: 
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x(T) - x(0) = M(O AT) (66.497) 


que nous pouvons aussi écrire sous la forme suivante en utilisant les propriétés de la loi Normale: 


x(T) = N{x(0), 7) (66.498) 
résultat auquel nous pouvions raisonnablement nous attendre avec les hypothèses susmentionnées... 


Ce dernier résultat est écrit sous la forme explicite suivante dans les tableurs: 


x) = x(0)+ MO, Dé | (66.499) 


et nous voyons que c'est peu réaliste car cela signifierait que tout actif financier suit la même loi (quelle 
que soit sa volatilité...) et n'aurait aucune tendance générale à la baisse ou à la hausse. Nous verrons de 
suite comment améliorer cette approche. 


Pour clore cette approche, remarquons que si Â# tend vers 0 (ce qui revient à considérer une subdivision 
du temps T en intervalles extrêmement petits) le cours subit sur la période T un nombre infiniment grand 
de variations. En d'autres termes, le processus d'évolution du cours de l'option est continu, ce qui conduit à 
remplacer Â# par dt, Ax par dx et /ÿ par dz. 


Dans ce cas, nous obtenons: 
dx = N (0, at) (66.500) 


ce qui définit un "processus de Wiener" (nous reviendrons là-dessus lorsque nous aurons établi l'équation 
différentielle stochastique). 


Mais évidemment ceci n'est pas vraiment conforme à la réalité comme nous l'avons déjà mentionné... Nous 
préférons alors ajouter un décalage constant dans le temps ce qui donne le mouvement brownien que nous 
allons voir maintenant. 


7.8.4. MOUVEMENT BROWNIEN GÉNÉRALISÉ 


Dans ce cas (généralisation un peu plus réaliste), l'évolution du cours dépend non seulement d'un 
processus aléatoire brownien standard (deuxième terme ci-dessous à droite de l'égalité), mais également 
d'un paramètre de tendance centrale, ou "drift" (premier terme ci-dessous à droite de l'égalité): 


dx = a'dt+b'dz| (66.501) 


avec toujours: 
dz = gnfat (66.502) 
et: 


€ — N(0,1) (66.503) 
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Nous avons donc un mouvement brownien généralisé, constitué d'un mouvement brownien standard (dz 
représenté par une loi Normale d'espérance nulle et de variance dt comme nous l'avons vu plus haut) et 
d'un drift. Dans ce scénario, a et b sont imposés comme constants contrairement au cas encore plus 
général que nous verrons un peu plus loin. 


La relation antéprécédente est souvent représentée dans la littérature sous la forme différentielle suivante: 
dX, = adt+bdW, = adt +bd(N(0,1)ÿdf) (66.504) 


Donc graphiquement cela donne, en rajoutant ce drift et en prenant une valeur positive et non nulle pour 
a, un mouvement brownien standard qui aura tendance à alterner au-dessus et en-dessous du drift: 
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Figure: 66.52 - Exemple de mouvement brownien standard avec drift (et décomposition) 


Sur un petit intervalle de temps /#, le processus, en temps discret s'écrit bien évidemment: 
Âx=a" Af+b: Az (66.505) 
Dans ce cas, nous avons: 
E(Ax) = E(ah +bÂ)=a' AM +b'EÆ(A) (66.506) 
dans la mesure où seule 7; a une composante aléatoire. 
Ainsi: 
E(x)=a M+b Er)=a M+b:E(eÎM)=aM+bÎN:E(e) =a AM+0=a M 


(66.507) 
PCA) = Va A +b: Le) = 0+b7 -V(eA) = BA V(e) = b A 


Finalement: 


Âx = N(aa,b#) (66.508) 
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En subdivisant une période T en n intervalles de temps /# (soit T = #:Af ), la variation du cours devient 
sur cette période 1: 


x(7) - x(0) = SA, (66.509) 


il 


Dès lors: 


E(x(T) - x(0)) = £ ŸAx = E(Ar)= na M = a'T 


il i=] 


F(x(T) - x(0)) = Sas = Ÿ 7 (4x) = Dr (NE) = PAS =n PAM=RT 


(66.510) 


il il 


Finalement: 

x(7) — x(0) = Na °7,b' NT) (66.511) 
Soit: 

x(T) = x(0)+ Na TbNT) (66.512) 
ou encore: 


x(T) = N(x(0) +a T,b NT) (66513 
Il est alors aisé de comprendre pourquoi nous disons que la loi Normale régit la variable aléatoire obtenue 
en arrêtant un processus brownien à un instant donné: c'est une photo instantanée du mouvement 


brownien simple ou généralisé! 


En choisissant: 
a = x(0)-,b= ox(0) (66.514) 


Nous avons alors la relation antéprécédente qui s'écrit traditionnellement sous la forme explicite suivante 
dans les tableurs: 


(0 = x(0)+ 4 x(0)-4 + NO, Dex(O)Æ | (66.515) 


où ;{ est le rendement en % de l'actif financier et æ la volatilité du rendement en %. Soit écrit 


autrement: 


x = N{x(0)+ ux(0)e,ex(O)4E | (66.516) 
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Il est alors intéressant pour le financier de visualiser l'espérance en fonction de t et la valeur x(t) 
correspondante à une probabilité cumulée de 2.5% et de 97.5% sur un graphique pour avoir une idée de 
l'évolution de l'intervalle de confiance à 95% de son x(0). Ceci est très facile à obtenir dans Microsoft 
Excel et l'on tombe typiquement en jouant avec plusieurs types de graphiques dans le même diagramme 
sur un résultat comme celui visible ci-dessous pour un portefeuille de 500 MF avec rendement de 5% et 
écart-type de 20%: 
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Figure: 66.53 - Tracé du mouvement brownien standard avec intervalle de confiance 


Avec le tableau suivant: 
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FRE | RE 


0 500.00 
1 525.00 336.41 100.00 329.00 721.00 
2 550.00 620.67 141.42 272.82 827.18 
3 575.00 842.16 173.21 235.52 914,48 
4 600.00 565.28 200.00 208.01 991.99 
5 625.00 701.39 223.61 166.74 1063.26 
6 650.00 550.01 244.95 169.91 1130.09 
7 675.00 684 45 264.58 156 44 1193.56 
8 700.00 725.39 282.84 145 64 1254.36 
9 725.00 1040.65 300.00 137.01 1312.99 
10 750.00 763.32 316.23 130.20 1369.80 
11 775.00 724.46 331.66 124.95 1425.05 
12 800.00 703.70 346.41 121.05 1478.95 
13 825.00 1288.31 360.56 118.32 1531.68 
14 850.00 1283.01 374.17 116.65 1583.35 
15 875.00 641.06 387.30 115.91 1534.09 
16 900.00 1641.97 400.00 116.01 1683.99 
17 925.00 1499.09 412.31 116.89 1733.11 
18 950.00 763.09 424.26 118.46 1781.54 
19 975.00 662.14 435.89 120.67 1829.33 
20 1000.00 1180.59 447.21 123.48 1876.52 
21 1025.00 1086.71 458.26 126.83 1923.17 
22 1050.00 1076.45 463.04 130.70 1969.30 
23 1075.00 420.13 479.58 135.03 2014.97 
24 1100.00 1144.08 469,90 139.82 2060.18 
25 125.00 996.50 500.00 145.02 2104.38 
26 1150.00 1564 97 509.90 150.61 2149.39 
27 175.00 1698.68 51962 156.57 2193.43 


Figure: 66.54 - Tableau des données correspondantes au tracé précédent 


Utilisant donc les relations démontrées plus haut: 
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Figure: 66.55 - Formules explicites pour le mouvement brownien et l'intervalle de confiance 


Évidemment, dans la pratique il est possible de faire ce type de graphique avec n'importe quelle donnée 
comportant un drift linéaire et dont l'écart-type est connu. 


7.8.5. PONT BROWNIEN 


Voyons maintenant un cas d'application du mouvement brownien qui va nous être utile plus tard! En 
refaisant les développements vus plus haut, il vient immédiatement que: 


2 = Xe +MmAE+ N(0, Dom VAE (66.517) 
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Effectivement, vérifions cela en choisissant: 


At=1 (66.518) 


Nous avons: 
4 = 2% +üexp 14 NO, Dom Vi = x +4xp + MODO (66.519) 
et donc pour £=1: 
4% = X0 + 20 + W(0,DOzxg (66.520) 

et de même pour £ = 2: 

23 = 2% + 420 + V0, Dax = 2 +4: x0 + VO Doxp + 4° 3 + M0, Dax 

= 20 + 24-20 + N(0,D+ M0 Diom = 26 +24: 6 +Ni0,1i 20% 

=Ni0, 21 
Ce qui est donc bien équivalant à: 
x(6) = x(0)+ ax(0)A4+ NO, Dox(O) JA (66.521) 

pour Àf=2. 


Bref, ceci étant dit, nous souhaiterions construire un mouvement brownien qui partant au temps £ = 0 de 
zéro (ce qui impose x{0} = 0 ) fluctue pendant une période T donnée et revient à zéro comme le montre les 
deux figures ci-dessous: 


0 0,25 0,50 0,75 1 


Figure: 66.56 - Deux exemples de ponts browniens 
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Comme il est d'usage, choisissons la notation suivante: 


(6 = Was + AaAE+ NO, Do VAé (66.522) 


Si nous voulons que le mouvement brownien s'annule au moment T, il suffit de faire une simple 
soustraction du type suivant: 


BBE)= W(£)-W(T) (66.523) 


où BB signifie "Brownian Bridge" ou "pont brownien" en français. Si nous nous arrêtons ici, nous avons 
bien: 


BB(T)= W(T)-W(T)=0 (66.524) 
mais nous avons un problème au temps £ = Ü : 
BB(0) = #(0)-W(T) #0 (66.525) 
et pour s'assurer que la différence est bien nulle, l'astuce naturelle consiste à écrire: 
BBG)=W()-EW(T) (66.526) 
Ainsi, nous avons: 
BB(0) = #(0)-0-#(T)=0 (66.527) 
Mais dès lors, vient un autre problème. Effectivement: 
BB(T)= W(T)-T W(D) #0 (66.528) 


Donc, la solution finale consiste à écrire: 


BB() = W(9- S (D (66.529) 


Et donc: 
BB()= BB(T) =0 (66.530) 


Et nous avons: 
E\BB(£) 1 = s(ro- F men) =0 (66.531) 
Le pont brownien: 
BB(t) = W( - FF (66.532) 


fonctionne pour tous les processus de Wiener, raison pour laquelle vous verrez parfois dans la littérature 


tantôt des ponts avec: 
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= Was + a At+ NO, Dodo As (66.535) 


ou par exemple avec: 
FF, = Was + ht+N(O,DoVAs (66.534) 
qui n'est qu'un cas particulier du précédent avec #5 = 1. 


7.8.6. PROCESSUS D'ITÔ 


Considérons maintenant un processus brownien correspondant à une variation de x en temps continu 
définie par: 


dx = a(x,fjdt +b(x,f)dz (66.535) 


a et b étant alors des fonctions des 2 variables x et t. Cette considération est ce que nous appelons un 
"processus d'Itô". Il s'agit donc d'une généralisation du cas précédent où a et b ne sont plus constants. 


Il est possible de calculer l'espérance et la variance de dx exactement de la même façon que pour le 
processus de Wiener et nous obtenons très facilement par analogie: 


E(adx) =0 Vdx)=b?(x.tjdt (66.536) 
Par conséquent, nous pouvons écrire: 


dx = N{a(x,#dt,b(x, f&) (66.537 


où a(x,t) correspond au drift instantané et b(x,t) à la variance instantanée. 


Le "mouvement brownien géométrique" qui permet de définir théoriquement la meilleure prédiction 
d'évolution du rendement d'une option est un cas particulier de processus d'Itô (parmi tant d'autres 
modèles.) où nous supposons que: 


a(xé)={'x et b(xf)=C'x (66.538) 


Dès lors nous pouvons écrire l'expression du mouvement brownien géométrique de la valeur de l'option 
notée: 


dF =Hixdt + Oxdz | (66.539) 


souvent représentée dans la littérature aussi sous la forme suivante: 
dX, = HX,dt+oX,dW, (66.540) 
ou encore plus explicitement: 
dX, =(4X, )\dt+(oX,)dW, =(uX, \dt +(aX, )\d(N(O, Daft) (66.541) 


L'interprétation financière de la relation: 
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dF = jixdt + Oxdz (66.542) 


devient apparente lorsque nous divisons les deux membres par x: 


dF _ F(t+at)-F(t) 


= {idt + Odz 
x x(£) 


ce qui correspond au taux de rentabilité de l'option (ou tout autre actif de la même famille) sur une période 
infinitésimale dt. 


Le mouvement brownien géométrique est donc a priori un bon candidat pour modéliser l'évolution du prix 
d'un actif financier à partir de son taux de rentabilité. 


Dans la littérature spécialisée, le return (rendement) est aussi parfois noté (notation justifiée) sous la forme 
de l'équation différentielle stochastique (E.D.S.) suivante: 


ds, 
L = {idt + Odz| (66.543) 


t 


où #, est bien évidemment le prix du sous-jacent appelé "stock price" au temps t, X est appelé la "dérive" 


ZA 


(assimilé souvent au rendement) et & la "volatilité" (la volatilité du rendement). C'est la notation et le 
vocabulaire que nous adopterons pour la suite. 


À noter que puisque nous avons: 


not : (66.544) 


Ë 
A] 


Nous pouvons donc aussi écrire: 
d'in(S,) = dt +odz (66.545) 


Au cas où 4 = 0 (processus de Wiener, autrement dit le prix du sous-jacent est parfaitement connu à un 
temps donné et sans risques), nous nous retrouvons avec une équation différentielle (connue dans le 
domaine) que nous pouvons de suite résoudre: 


ds, ds 
TE = udt & = US, = S,= Se) (66.546) 


t 


Il s'agit donc d'une exponentielle (comme l'intérêt continu que nous avons vu au début de ce chapitre). 
Cette relation n'étant valable que si l'intervalle de temps est donc très petit. 


Nous allons voir maintenant à l'aide du "lemme d'Itô", qu'il est possible (ce qui n'est pas une possibilité 
unique!) d'établir qu'un tel processus peut définir une loi log-normale (cf. chapitre de Statistiques). 


Le lemme d'Itô est établi à partir du développement de Taylor (cf. chapitre de Suites et Séries) à 2 
variables x et t donné par : 
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2 2 
AF=lOE NN, IOPL TOF La, 107 
1! &é 1! 4x 21 af? 2! &x? 


Ax? +... (66.547) 


avec (0) = 0 à l'origine du mouvement brownien. 


En considérant À « ‘x, et en ne prenant les termes que jusqu'au deuxième ordre (approximation 
formelle périlleuse mais numériquement non obligatoire grâce à la puissance de calcul des ordinateurs), 
nous avons: 


2 
perles. Te 
1! 


Ax? (66.548) 
f 1! &x 21 8x? 


Revenons maintenant à: 
Âx=a Mt+b Az =ahMt+bedfAt (66.549) 


Élevons au carré, nous obtenons: 


2 
Az? =(aht+bedfAt| = a Ar? +26abA80 + bals = ble At (66.550) 


ElbeArl= Ale? | (66.551) 


et comme nous l'avons démontré dans le chapitre de Statistiques: 
V(X)=E(X?|-E(X) Ex? )=7(X)+E(X) (66.552) 
Nous avons alors: 
Ele?|=Y(e)+Æ(e) =1+0=1 (66.553) 
Donc: 
E( = A) =b?M (66.554) 
Par ailleurs: 
VOA) = DAV (E) = BAM (66.555) 
qui tendent tous deux vers 0 quand À£ tend vers 0. 


Nous avons aussi en considérant une subdivision du temps en intervalles # extrêmement petits 
(approximation qui va nous être utile un peu plus loin): 
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lim be AE limb?Af=0 (66.556) 
üt—0 it 0 


ce qui implique dans ce dernier cas de figure: 
be Azæb°Af (66.557) 


donc en se plaçant en temps continu (donc un modèle continu avec intervalles de temps extrêmement 
petits), l'application du développement de Taylor discrète vue plus haut: 


2 
. 104: 167, 19 ET, (66.558) 


1! dŒ 1! 4x 21 4 


peut alors s'écrire: 


2 
PUR LP TR ACER Te Pat + (a dt + bde) += UE PE pa 
de 8x 2 8x° & 2 8x° 
dr, ôF ,1 °F 8F Et 
+R | gE+ bd 


FR Fe 0 


il s'agit du lemme d'Itô également appelé "théorème d'Itô-Doeblin". 


Remarque: Comparer la forme de la dernière égalité à la relation 4x = a(x,f)dt + b(x,£dz 


Si nous prenons: 
F(x) =In(x) (66.560) 


Dès lors: 


AF(x) _, 8F(G) _ 1 8° F(x) 
dé 7 &x x 8x? x 


Dans ce cas: 


aP-[o+-5 Jai (66.562) 
x 2 x x 


En revenant à l'hypothèse de mouvement brownien géométrique, nous savons que nous devons considérer 
que: 


a = a(x,f) = {ix et b=b(x,f) = OX (66.563) 


Nous avons donc: 


1 
dt+x—dz (66.564) 


X 2 x x 


2 
ar -[o+ 1) 


et nous obtenons finalement l'équation différentielle stochastique à coefficients constants: 
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am 
dF as dt + Oz (66.565) 


Soit en reprenant la notation du début sous forme explicite: 
e 
d'In(x) = La 2 dt+ Oz (66.566) 


ou sous une autre forme encore plus explicite: 


d'In(ÆX,) = La Puis cum = La PJarou( ve) (66.567) 


appelée parfois "équation intégrale de la dynamique des prix". 


Une approche triviale de la résolution de cette intégrale est (on considère toujours dans ce modèle que la 
volatilité est indépendante du temps...): 


f# #1 tH f# f# 
diniXsi= l|g-—|dt+ | odW, =| 4-—|1dt+o 1 4W, (66.568) 
J f È 2 È f 2 . . f 


f f f f f 
Soit: 
Cu . 
In (Xru i-in(Æ4 = Hire ((é+1)-£)+0(Fu —#) (66.569) 
Soit: 
Æ, 
n|=% nou -M)> u- +0N0.D (66.570) 
À 2 2 
Remarques: 


R1. Se rappeler que nous sommes partis de la relation  &F = {{xdt + © xdz 


R2. Les mouvements browniens ont été successivement dégagés de l'hypothèse de Normalité dans les 
années 1960, puis de l'hypothèse de stabilité dans les années 1980. Avec ces deux hypothèses, les 
mathématiciens les rangent dans la catégorie particulière des "processus de Lévy 2-stables". 


dF définit alors un mouvement brownien géométrique avec drift particulier dont nous pouvons maintenant 
mesurer les paramètres (c'est ce que nous voulions obtenir). Par conséquent, les résultats que nous avions 
obtenus pour le mouvement brownien peuvent être récupérés et nous permettent d'écrire au final: 
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dF — v([- + Jéov (66.571) 


ce qui revient dire que dF suit une loi log-normale (cf. chapitre de Statistiques) de paramètres: 


a 
a dé et cfdt (66.572) 


Allons maintenant un peu plus loin en intégrant l'élément différentiel. Nous avons donc: 


d#, 
#, 


- La je + cd (0, 1)Vat ) (66.573) 


Intégrons cette dernière relation: 


Ê -J(a-S a + [aa (wc0,1a) (66.574) 


La première primitive est simple: 


=in(X,)+c% (66.575) 


La deuxième primitive est simple (pas de constante d'intégration car au temps zéro l'espérance de gain est 


nulle): 
(2 = dé = La IE _ La æ} (66.576) 


La troisième primitive vaut (pas de constante d'intégration car au temps zéro la valeur du gain est 
parfaitement connue comme valant O0): 


[oa(w60,1Var) = 20,1 [aa = ON(O, Dé (66.577) 


Remarque: Attention à l'abus d'écriture!!! Dans la racine il s'agit implicitement d'un dt (du pas 
d'analyse donc!) et non simplement d'un t. Souvenez-vous en pour la suite!!! 


Nous avons donc: 
te à . 
in (X,)= = + M(0, 1) —c% (66.578) 


Et au final (nous mettons le signe "-" dans la constante): 
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AUS . (a-T}ranans (66.579) 
=8 2e 


À, =e 
Pour trouver la signification du premier facteur, il suffit de poser la condition initiale: 
À,(@=0)=ÆX9 (66.580) 


Nous avons alors immédiatement pour l'expression finale du brownien géométrique: 


[a Thonans (66.581) 
À, = À0e 


obtenue par P. Samuelson en 1965 et qui est parfois appelée "modèle de Bachelier-Samuelson" ou 
"représentation log-normale de la valeur de l'option". Ainsi, pour pricer un actif suivant ce modèle sur un 
horizon, t nous pouvons utiliser la fonction VBA de Monte-Carlo suivante: 


Function PricingStock({RiskFree, StDwv, StockValue, Time, Confidence) 


Dim i Às Integer 

Dim arrPricingStock(1 To 10000) 2s Double 

For i = 1 To 10000 
arrPricingStock(i) = StockValue * Exp{(RiskFree - 0.5 * StDv * 2) L 
* Time + StDv * Application.NormInviRndi), O, 1)) 

Next i 

Pricing$tock = äpplication.Percentile(arrPricingstock, 1 - Confidence) 


End Function 


Nous avons au final une formulation (sous forme de fonction de distribution probabiliste) d'une variation 
temporelle et du return intrinsèque d'une action qui peut être utilisée à des fins décisionnelles 
d'investissements sur une prévision. Mais ce modèle est quand même trop lisse en n'arrive pas à modéliser 
les krachs boursiers (il en est de même pour rappel avec le mouvement brownien standard) pouvant arriver 
sur le long terme. Raison pour laquelle certains modèles plus récents que nous n'étudierons pas ici ajoutent 
un processus de Poisson (discret et à événements rares par construction) à celui de Wiener. 


Il existe d'autres modèles que la log-normale mais celle-ci de par sa facilité est la plus répandue. Il faut 
cependant encourager d'autres méthodes plus généralistes! 


Pour terminer cette partie résumons par une comparaison le mouvement brownien standard et le 
mouvement brownien géométrique qui régissent donc la dynamique des cours lorsque les paramètres 
(rendement et volatilité instantanés) sont donnés en %: 


X, = X + Xout+ NO. DeX VE = X, + Xout+ OX. = Xo(1+8,) 


CUS [a To (66.582) 
À, = Âne = Xe 


et rappelons que l'avantage du mouvement brownien géométrique est qu'il élimine (grâce à l'exponentielle) 
les valeurs négatives du cours que nous pouvions obtenir avec le mouvement brownien standard de 


Bachelier. 
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Il est alors intéressant pour le financier de visualiser l'espérance en fonction de T'et la valeur x(T) 
correspondante à une probabilité cumulée de 2.5% et de 97.5% sur un graphique pour avoir une idée de 
l'évolution de l'intervalle de confiance à 95% de son x(0). Ceci est très facile à obtenir dans Microsoft 
Excel et l'on tombe typiquement en jouant avec plusieurs types de graphiques dans le même diagramme 
sur quelque chose du genre (portefeuille de 500 MF avec rendement de 5% et écart-type de 20%): 


2250 


2000 


1750 


1500 


1250 


1000 


#50 


500 


250 


123 45 6 7 8 9 10 1112 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 


—#«— Mouv. Brow Exp. Géométrique — Espérance Brownien Exp. Géométrique 


Intervalle 95% Exp. Inf. Intervalle 95% Exp. Sup. 


Figure: 66.57 - Tracé du mouvement brownien géométrique avec intervalle de confiance 


Avec le tableau suivant: 
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A | G | H I J 
Eu Mois Espérance Brownien Exp. Géométrique Mouv. Brow Exp. Géométr intervalle 95% Exp. Inf. Intervalle 95% Exp. Sup. 
2 (] 500.00 
3| : 515.23 484.24 348.14 762 50 
4 2 530.92 538.26 358.75 785.72 
5 | 3 547.09 515.09 369 67 809.65 
6| 4 563,75 566.32 380.93 834.31 
2] 5 580.92 442 14 392 53 859.71 
8 6 598.61 524.75 404 49 885 90 
WE | 7 616.84 704 60 416.60 91268 
10, 58 635.62 621.09 429 50 G40 68 
HR _9 654.98 653.62 442 58 969.33 
12, 10 674.93 667.10 456 Œ 998.65 
13, 11 695.46 598.67 469 934 1029 27 
14, 12 716.66 71465 4684 1060 61 
15, 13 738.49 809 84 499.00 1092 91 
16, 14 760.98 1083.04 514 20 1126.20 
1) 15 784,16 602 51 529 & 1160.49 
18, 16 806.04 674.59 546 00 1195 84 
191 17 832.65 1066.60 562 63 1232.25 
20, 18 858.00 81395 579.76 1269 78 
21 19 884.13 897 73 597 42 1308 45 
#21] 20 911.06 932 60 615.61 1348 30 
23] 21 938.81 844 90 634% 1389.% 
24| 2 967.40 867 24 653 68 1431.68 
251 23 996.86 890.16 673.59 1475.28 
261 24 1027,22 1220.87 694 10 1520.21 
2 2 1058.50 969.59 715.24 1566.50 
21 #% 1090.74 132565 737 02 1614.21 
21 27 1123.95 1255.50 759.47 1663.37 


Figure: 66.58 - Tableau des données correspondantes au tracé précédent 


Utilisant donc les relations démontrées plus haut (la cellule $B$2 contient la valeur 500): 


1 [Mois Espérance Brownien Exp. Géométrique Mouv. Brow Exp. Géométrique | 
20 -$B52"EXP(5%-20%"2/2)* A2) 

s.|1 =$0$2*EXP((5%-20%"2/2)43) =$8$2*EXP((5%-20% 2/2) 4 3)YEXP(20%*NORMSINY(RSANDON) 
42 |-5B$2*EXP((5%-20%"2/2)* A4) =$B$2*EXP((5%-209%6"2/2)* A4 )*EXP(20%*NORMSINY(RAND())) 
53 |=5B$2*EXP((5%-20%"2/2}* A5) =$B$2*EXP((5%-20%"2/2)*A5)*EXP(20%*NORMSINY(RAND())) 
64 |=$B$2*EXP((5%-20%"2/2}* A6) =$B$2*EXP((5%-20% 12/2) A6)*EXP(20%*NORMSINY(RAND())) 
25 -5B52"EXP(5%-20%"2/2) A7) =$B$2*EXP((5%-2092/2)* 47 )"EXP(20%*NORMSINV(RAND())) 
86 -5B52"EXP(5%-20%"2/2)* A8) =$B$2*EXP((5%-20%"2/2*A8)*EXP(20%*NORMSINY(RAND())) 
97 |=5B$2*EXP((5%-20%"2/2}* A9) =$B$2*EXP((5%-20%2/2)* A 9)*EXP(20%*NORMSINY(RAND())) 
103 =-$B52*EXP(5%-20%2/2)* 410) =$B$2*EXP((5%-20% 2/2)" 41 0YEXP(20%*NORMSINY(R£ND())) 
1109 -5B52*EXP(5%-20%"2/2) 411) =$B$2*EXP((5%-20%"2/2)*41 1 Y'EXP(20%*NORMSINY(RAND())) 
12/10 =$B$2*EXP(5%-20%"2/2)*412) =$0$2*EXP((5%-20% 2/2) 41 2 EXP(20%NORMSINY(R£ND())) 
13/11 =$8$2*EXP((5%-20%"2/2 413) =$B$2*EXP((5%-20%%2/2% 41 3 EXP(20S*NORMSINY(R£ND(ON) 
14/12 =-5B52*EXP(5%-20%"2/2)* 414) =$B$2*EXP((5%-20% 2/2)" 41 4 EXP(20%*NORMSINY(R£ND())) 
1513 =$B$2*EXP(5%-20%2/2)*A15) =$B$2*EXP((5%-20% 2/2) 41 5 EXP(20%*NORMSINY(RAND())) 
16/14 -5B52*EXP(5%-20%"2/2) 416) =$B$2*EXP((5%-20%"2/2)* 41 6)*EXP(20%*NORMSINY(RAND())) 
17/15 -$52*EXP(5%-20%"2/2) 417) =$B$2*EXP((5%-20%2/2)* 41 7)*EXP(20%*NORMSINY(RAND())) 
1816 =-$B52*EXP(5%-20%2/2)*418) =$B$2*EXP((5%-20% 2/2) 41 8 EXP(20%*NORMSINY(R£ND())) 
19/17 =-$B52*EXP(5%-20%2/2)419) =$B$2*EXP((5%-20% 2/2)" 41 SYEXP(20%*NORMSINY(R£ND())) 
20118 |=$B$2*EXP(5%-20%2/2)*A20) =$B$2*EXP((5%-20% 2/2)" 420) EXP(20%NORMSINY(RAND())) 
21019 |-5B52"EXP(5%-20%"2/2) 421) =$B$2*EXP((5%-20%2/2)* 421 Y'EXP(20%*NORMSINY(RAND())) 
22120 =$0$2*EXP((5%-20%"2/2)* 422) =$B$2*EXP((5%-20% 2/2) 422 EXP(20S*NORMSINY(R£AND())) 
23121 |=-$B$2*EXP(5%-20%2/2)*A23) =$B$2*EXP((5%-20% 2/2) 423) EXP(20%*NORMSINY(R£ND())) 
24122 |=$B$2*EXP(5%-20%2/2)*A24) =$B$2*EXP((5%-20% 2/2)" 4,24) EXP(209%*NORMSINY(R£ND())) 
2523 |=$B$2*EXP(5%-20%2/2)*A25) =$B$2*EXP((5%-20% 12/2)" 425) EXP(20%*NORMSINY(RAND())) 
26/24 |-5B52*EXP(5%-20%"2/2) 226) =$B$2*EXP((5%-20%2/2)* 426) EXP(20%*NORMSINY(RAND())) 
27125 =F0$2*EXP((5%-20%"2/2* 427) =$0$2*EXP((5%-20%"2/2)*427 )*EXP(20%6*NORMSINY(R£NDO)) 
28.26 |=$B$2*EXP(5%-20%2/2)*428) =$B$2*EXP((5%-20% 2/2) 428) EXP(20%*NORMSINY(R£ND())) 
29127 |=$B$2*EXP(5%-20%2/2)*A29) =$B$2*EXP((5%-20% 2/2) 429) EXP(20%*NORMSINY(RAND())) 


Figure: 66.59 - Formules explicites pour le mouvement brownien géométrique 


et pour l'intervalle de confiance à 95%: 
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Intervalle 95% Exp. Inf. 


=$B#2"EXP((5%2-20%"2/2) AS EXP(202 NORMSINV(2.5%)) 
=$B$2"EXP((5%2-20%"2/2) A4) EXP(202"NORMSINV(2.5%)) 
=$B$2"EXP((5%2-20%"2/2) AS) EXP(202 NORMSINV(2.5%)) 
=$B$2"EXP((5%-20%"2/2) A6) EXP(202"NORMSINV(2.5%)) 
=$B#2"EXP((5%2-20%"2/2) AT) EXP(202 NORMSINV (2.5) 
=$B$2"EXP((5%2-20%"2/2) A8) EXP(202"NORMSINV(2.5%)) 
=$B$2"EXP((5%2-20%"2/2) AI) EXP(202 NORMSINV(2.5%)) 
=$B$2"EXP((5%-20%"2/2) MO)" EXP(202"NORMSINV(2.5%4)) 
=$B$2"EXP((5%2-202"2/2) AIN EXP(20%"MORMSINY(2.5%)) 
=$B$2"EXP((5%-20%"2/2) A2) EXP(202"NORMSINV(2.5%4)) 
=$B#2"EXP((5%2-20%"2/2) ANS) EXP (202 NORMSINY(2.5%)) 
=$B$2"EXP((5%2-20%"2/2) AJ 'EXP(202"NORMSINV(2.5%4)) 
=$B$2"EXP((5%2-20%" 2/2) AIS) EXP (202 NORMSINY(2.5%)) 
=$B$2"EXP((5%2-202"2/2) ME) 'EXP(202"NORMSINV(2.54)) 
=$B$2"EXP((5%-20%"2/2) AIT) 'EXP(202"NORMSINV(2.524)] 
=$B$2"EXP((5%2-20%"2/2) A8) EXP(202"NORMSINV(2.54)) 
=$B$2"EXP((5%-20%"2/2) AIS) "EXP (202 NORMSINV(2.524)] 
=$B$2"EXP((5%-20%"2/2) 420) EXP(20"NORMSINV (2.58%) 
=$B$2"EXP((5%-20%"2/2) A2N"EXP(202"NORMSINV(2.524)] 
=$B$2"EXP((5%2-20%"2/2) 422) EXP(204"NORMSINV (2.5) 
=$B$2"EXP((5%-20%"2/2) 429) EXP(20 MORMSINV(2.5%)) 
=$B$2"EXP((5%-20%"2/2) 424) EXP(202 NORMSINV(2.5%)) 
=$B$2"EXP((5%-20%"2/2) 425) EXP(20< NORMSINV(2.5%<)) 
=$B$2"EXP((5%-20%"2/2) 226) EXP(204 NORMSINV(2.5%)) 
=$B$2"EXP((5%-20%"2/2) 427) EXP(20"MORMSINV(2.5%)) 
=$B$2"EXP((5%-20%"2/2) 428) EXP(202 NORMSINV (2.5) 


Intervalle 95% Exp. Sup. 


=$B#2"EXP((5%2-20%"2/2) AS) EXP(202 NORMSINV(97.5;<)) 
=$B$2"EXP((5%-20%"2/2) AÎJ EXP(202"NORMSINV(97.5;<)) 
=$B$2"EXP((5%2-20%"2/2) AS) EXP(202 NORMSINV(97.5;)) 
=$B$2"EXP((5%-20%"2/2) A6) EXP(204"NORMSINV(97.5:<)) 
=$B$2"EXP((5%2-20%"2/2) AT) EXP(202 NORMSINV(97.5:<)) 
=$B$2"EXP((5%-20%"2/2) A8) EXP(202 NORMSINV(97.5:<)) 
=$B$2"EXP((5%-20%"2/2) AI) EXP(202 NORMSINV(97.5;4)) 
=$B$2"EXP((5%2-20%"2/2) AO)" EXP(202"NORMSINV(97.5%<)) 
=$B$2"EXP((5%2-20%"2/2) AIN EXP(202"NORMSINV(97.5%4)) 
=$B$2"EXP((5%2-20%"2/2) A2)" EXP (202 "NORMSINV(97.5%<)) 
=$B$2"EXP((5%2-20%" 2/2) AIS) EXP (202 NORMSINV(97.5%<)) 
=$B$2"EXP((5%2-20%"2/2) A4)" EXP (202 "NORMSINY(97.5:)) 
=$B$2"EXP((5%2-20%"2/2) AIS) EXP (202 "NORMSINY (97.5) 
=$B$2"EXP((5%2-20%"2/2) AG) "EXP (202 "NORIMSINV(97.5%)) 
=$B$2"EXP((5%-20%"2/2) AIT) 'EXP(202"NORMSINY (97.5) 
=$B$2"EXP((5%2-202"2/2) AIS)" EXP (202 "NORMSINY (97.5) 
=$B$2"EXP((5%-20%"2/2) AIS) "EXP (202 "NORMSINV(97.5%<)) 
=$B#2"EXP((5%2-20%"2/2) 220) EXP (20% MORMSINY(97.52)) 
=$B$2"EXP((5%4-20%"2/2) A2N"EXP(202"NORMSINY(97.5:)) 
=$B#2"EXP((5%2-20%"2/2) 422) EXP (20% MORMSINV(97.524)) 
=$B$2"EXP((5%-20%"2/2) A29) EXP (20% MORMSINV(97.524)) 
=$B#2"EXP((5%2-20%"2/2) A2) EXP (20% MORMSINV(97.54)) 
=$B$2"EXP((5%2-20%"2/2) A25) EXP (20% MORMSINV(97.524)] 
=$B$2"EXP((5%2-202"2/2) 226) EXP (20% MORMSINV(97.524)) 
=$B$2"EXP((5%-20%"2/2) A27) EXP (20% MORMSINV(97.524)) 
=$B$2"EXP((5%2-20%"2/2) 228) EXP(20%"MORMSINY(97.524)) 


ResebrsheleeepeeEeielelelelele 


=$B$2"EXP((5%2-20%" 2/2) A29) EXP(202"NORMSINV(2.5%)) | =$B42"EXP((52-204"2/2) 29) EXP (20% NORMSINY(97.5%2)) 
Figure: 66.60 - Formules explicites pour l'intervalle de confiance 


Il est intéressant de comparer l'évolution de portefeuilles ayant les mêmes paramètres (volatilité et 
rendement) sur la même période de temps. Cela donne alors graphiquement: 


2250 
2000 
1750 
1500 


1250 


123 45 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 


intervalle 95% Standard Sup. 
Espérance Brownien Standard 
—«— Mouv. Brow Exp. Géométrique 


intervalle 95% Standard Inf. 
—— Myt. Brownien Standard 


Espérance Brownien Exp. Géométrique 


Intervalle 95% Exp. Inf. 


Intervalle 95% Exp. Sup. 


Figure: 66.61 - Comparaison mouvements browniens géométrique et standard 


Donc dans 6 mois, nous voyons que le portefeuille a 95% de probabilité cumulée de se situer entre 404.49 
et 885.90 millions avec une espérance de 662.54 millions. 
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Enfin, le lecteur remarquera que l'on peut généraliser l'écriture des deux mouvements browniens (en 
prenant le logarithme népérien en ce qui concerne le mouvement brownien géométrique) en les écrivant 
sous une forme proposée par Mandelbrot en 1962: 


X, = Xo+6t+cli (66.583) 


où $ et c sont respectivement les paramètres de localisation (rentabilité moyenne) et de dispersion 
(volatilité non gaussienne) du processus, et où Z* désigne le mouvement & -stable standard de Lévy. 


Le problème avec ce modèle c'est la perte de l'existence, pour certaines lois de probabilité qui marchent 
très bien, du deuxième moment (la variance) si important en termes de communication et d'images pour les 
professionnels dans les années 1970 car il leur servait d'unique mesure du risque. L'absence de variance 
finie constitua vraisemblablement l'une des causes les plus puissantes du rejet. 


7.8.7. ÉQUATION DE BLACK & SCHOLES 


Nous avons obtenu lors des développements précédents, sous la contrainte d'une loi log-normale et d'un 
mouvement brownien, l'équation différentielle suivante pour la marche aléatoire de la valeur de l'action: 


2 
ne PL Le PP PR) A TL L Es de 
F1 8x 2  àx ax FA ax 2 8x? ax 
(66.584) 


Soit avec les bonnes notations: 


2 
ar 402,108 ln En 2 [EE ol 20 ln SE 
EN 8 2 a$52 1 BAM os 


(66.585) 


Si nous construisons maintenant un portefeuille consistant en une option et un nombre -A de titres 
sous-jacents (souvent aussi noté —A, dans la littérature). La valeur du portefeuille IT est alors exprimée 


par: 
[= "-AS (66.586) 
Le différentiel temporel du portefeuille s'écrit alors: 
dll=4F-AMS (66.587) 
Vous remarquerez que nous supposons constant (et négatif) le nombre A durant le différentiel de temps. 
Remarque: Attention!!! Certains auteurs choisissent, par convention, d'inserver les signes des termes à 


droite de l'égalité des deux relations précédentes. Cela ne change pas le résultat final de la solution de 
l'équation différentielle mais il faut savoir que cela peut se faire. 
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En réunissant les relations précédentes et (nous adoptons ici la notation traditionnelle usitée dans le 
domaine) l'équation de l'actif risqué donnée donc par: 


. = Odz + jidt (66.588) 


nous obtenons: 


ATI= 4F - AdS = D + + LOST +08 à |-A[Soùr + Sud] (66.560) 
ës 2° as ET 


où nous avons dans le crochet tout à droite le mouvement brownien géométrique. 


Ce qui donne après réarrangement des termes l'équation différentielle du portefeuille: 


all=eS$ A dz + 
as 


°F 0F 
as + PSE +Ÿ-s)a (66.590) 


Considérons maintenant que À est lié par la relation de dépendance spéculative (dont nous prenons la 
valeur entière) qui élimine de la relation précédente la partie aléatoirement risquée du portefeuille (c'est le 
dz qui génère le risque de manière aléatoire pour rappel!) tel que: 


LES Te Pl (66.591) 
os GN 


Nous pouvons alors écrire: 


EF 0F 
dTI= (a as + OST + SAS dt (66.592) 


Or, nous avons également pour un portefeuille sans risque (puisque nous venons d'éliminer le risque 
aléatoire nous pouvons l'écrire ainsi): 


àT1 =rlldt (66.593) 


noté parfois aussi dans littérature: 
0 _ ,o0 _ 
dS, =rS, dt (66.594) 
En substituant maintenant les quatre relations: 


IlI= F-AS = dIl=rllif r=}{ (66.595) 


dans: 
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La: ŸF, a 
dII= +=$ S 56.596 
(use 3 +5 pr Ji — {à Je (6€ ) 


Nous obtenons: 


+195 2ŸF, "SE _,p = O| (66.597) 
2 as? as 


qui n'est autre que “l'équation différentielle partielle (sans second membre) de Black & Scholes" (à 
coefficient S non constant). Cette dernière équation est plus souvent notée sous la forme relative à la 
référence implicite d'un Call telle que: 


2 
1,290 ec + 800,0 = O (66.598) 
a 2°" 7 "& 


ou sous forme un peu plus condensée (suivant les auteurs...): 
l 
C+= DS 82C+rS0C-rC=0 (66.599) 
et encore plus condensée.. (mais là cela devient franchement abusé..): 
c+lo Ce +r8Cs-rC = 0 (66.600! 
f 5 se +role —rt = (66.600) 


Le lecteur aura noté que le paramètre {{ (dérivation) est absent de cette équation! En d'autres termes, la 
valeur d'une option est indépendante de la vitesse de variation des valeurs des titres sous-jacents. Le seul 
paramètre qui affecte le prix de l'option est la volatilité & du sous-jacent. Une conséquence de cela est 
que deux personnes ayant des opinions divergentes quant à la valeur de Æ sont toujours en entente sur la 
valeur de l'option. 


L'objectif bien évidemment est de résoudre cette équation différentielle afin de déterminer le return 
F(S, t). Celle-ci ne se laisse par ailleurs pas résoudre en deux lignes. 


Avant de nous attaquer à cette tâche quelques définitions et indications pratiques préalables concernant 
certains paramètres sont utiles et nécessaires (nous déterminerons leur forme explicite après la résolution 
de l'équation différentielle): 


7.8.8. PORTEFEUILLE AUTOFINANÇANT SUR SOUS-JACENT RISQUÉ 


Une stratégie de portefeuille autofinançant est une stratégie dynamique d'achat ou de vente de titres et de 
prêts ou d'emprunts à la banque, dont la valeur n'est pas modifiée par l'ajout ou le retrait de cash (nous 
aurions pu introduire ce sujet dès le début du chapitre mais nous avons jugé plus opportun de ne le faire 
que maintenant). 


Nous supposerons ici pour l'exemple que nous ne pouvons investir que dans un seul titre (placement 
risqué), et dans du cash (placement supposé non risqué), c'est-à-dire en plaçant ou empruntant de l'argent 
à une banque. 
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Nous désignons par $, le prix à la date t du titre, par 7, le taux d'intérêt pour un placement entre [£,£+df] 


à la banque. 


Soit } la valeur de marché, ou encore valeur liquidative, ou encore "Mark to Market" (M.t.M.) du 
portefeuille à la date t. Après renégociation, le nombre d'actions ä, du portefeuille est constant jusqu'à la 


prochaine date d'échéance de gestion. Pour simplifier, nous supposons pour le moment que le gestionnaire 
ne prend en compte dans sa règle de décision la valeur du cours du sous-jacent qu'au moment de 
renégocier. 


Dans un temps très court, la variation de valeur du portefeuille n'est due qu'à la variation de la valeur du 
sous-jacent et à l'intérêt versé par la banque sur le cash, soit, puisque le montant investi dans le cash est: 


F, — à,-s, 


nous avons "l'équation d'autofinancement": 


dP, = 6,48, +(V, — 6,8, \ndt = Vir dt +6, -(d8, _ r,$,at)| 


Ainsi, pour un vendeur de Call (par exemple.….), il s'agit de trouver le coût initial F4 et la stratégie 4, qui 
permettent d'obtenir (les financiers parlent de "réaliser l'actif financier"): 


(Sr-K) 


dans tous les scénarios de marché. S'il existe une telle stratégie de couverture, nous disons alors que nous 
avons affaire à un "marché complet". 


1.83. LES GRECQUES ET AUTRES... 


Dans la réalité ces modèles théoriques sont bien jolis (pour l'honneur de l'esprit humain) mais toutefois très 
peu réalistes. Raison pour laquelle les traders font (comme en ingénierie) appel à des indicateurs simples et 
parlants appelés "les grecques" pour prendre leurs décisions de vente ou d'achat. Cependant on peut, avec 
un peu de créativité, utiliser ces mêmes indicateurs dans de nombreux autres domaines (industriel, gestion 
de projets, chimie, etc.). 


Voici la liste des plus connus: 
Définitions: 


D1. Le "delta" d'une option, qu'il est important de comprendre (ou de savoir), donné par: 


Aa 
ES 


et représente le taux de changement de la valeur des options du portefeuille dépendamment des valeurs 
des titres sous-jacents S (mathématiquement parlant c'est donc la dérivée première de la prime de l'option 
sur le prix du sous-jacent). Ce terme est fondamental dans la théorie et dans la pratique et nous en ferons 
fréquemment usage. C'est donc une mesure dans la corrélation entre le mouvement de l'option ou autres 
actifs financiers et dérivés et les sous-jacents. 
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Considérons par exemple qu'un Call sur l'action ABC est de delta 0.25 avec un cours du support (spot) à 
90.- et une prime à 5.-. Lorsque le cours de l'action ABC passe de 90.- à 91.-, la prime de l'option va 
augmenter alors de 1 delta, et devient alors 5.25.-. Lorsque le cours de l'action ABC passe de 90.- à 88., 
la prime de l'option va diminuer de 2 fois delta, et devient 4.50.-. Cette variation en termes de delta 
(nombre entier) est alors notée 4 . 


Le delta est donc le paramètre le plus important pour un praticien qui veut se couvrir contre le risque. 
Effectivement, afin d'obtenir le delta global d'une position, il suffit de multiplier la valeur du delta de 
chaque option par sa position. Puis on fait la somme de tous ces deltas. 


Par exemple, si sur un même sous-jacent nous sommes vendeur de 5 calls C st acheteur de 7 Call C ) 


alors notre delta global sera égal à: 


7-Ac, -5-Ac 


La valeur de ce paramètre nous informe sur la quantité de sous-jacents à acheter ou vendre (position 
opposée sur le sous-jacent) afin d'immuniser la valorisation de notre portefeuille aux variations du cours de 
ce sous-jacent. Nous disons alors qu'il s'agit d'une "stratégie en delta-neutre" ou de "delta-hedging”". Plus 
exactement il s'agit d'une stratégie dynamique car il faut maintenir un poretefeuille delta-neutre tout au 
long de la vie de l'option contrairement aux stratégies statistiques. Par exemple, une stratégie statique our 
couvrir la vente d'un Call de strike de 125.- sur 1'000 actions (prix spot 100.-), peut consister à acheter 
immédiatement 1'000 actions sur le marché contre 100'000., et attendre l'échéance. Dans cette situation, 
si l'acheteur exerce le Call le vendeur est en mesure de lui livrer les 1'000 actions contre 125'000.-. Mais 
s'il ne l'exercie pas, le venderu reste avec 1'000 actions. De même, si le cours final s'établit par exemple à 
80.-, le vendeur enregistre une perte de 20'000.-. Le delta-hedging permet d'éliminer ce risque. 


Ainsi, les gestionnaires, vont entre la date à laquelle ils ont encaissé la prime (en ayant vendu un contrat 
d'option) et sa maturité T, tout naturellement gérer en delta-neutre au fil du temps un portefeuille 
autofinancé constitué de 4 actifs sous-jacents S à chaque instant t, afin de disposer de façon certaine 


(donc sans risque) de la cible stochastique à la maturité. Nous parlons aussi de "portefeuille de 
couverture". 


D2. Le "thêta" d'une option donne la sensibilité du prix de l'option par rapport à sa maturité et est donné 
par: 


Appliqué à notre portefeuille, le thêta nous donne simplement la valeur perdue ou gagnée suite à 
l'écoulement d'une journée par exemple. 


D3. Le "rhô" calcule la sensibilité du prix de l'option par rapport à la varation au taux d'intérêt 
géométrique moyen sans risque du marché et est donné par: 


OF 


_&æ 
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re) 


Cet indicateur semble être assez peu utilisé par les professionnels. 


D4. Le "véga", représenté par la lettre nu minuscule car le nom véga n'est pas lui-même un nom de lettre 
grecque, mesure la sensibilité de l'option par rapport à la volatilité et est donné par: 


La volatilité est le paramètre déterminant du prix d'une option. L'impact de la variation de ce paramètre 
sur la valorisation de notre portefeuille est donc très important pour les traders sur options. 


D5. Le "gamma" correspond à la dérivée du delta et est donc donné par: 


Fr 
r = pe] 
EN 


Une lecture possible du gamma est le sens d'évolution du delta en fonction du prix du sous-jacent. Un 
gamma positif indique que prix du sous-jacent et delta évoluent dans le même sens, alors qu'un gamma 
négatif montre le contraire. 


Afin d'éviter de réajuster le delta en stratégie delta-neutre, et donc de payer les frais de transactions mais 
aussi les spreads inhérents, un bon moyen est d'avoir le delta le plus stable possible. Avoir le delta le plus 
stable signifie pas ou peu de modification de sa valeur initiale, donc avoir une stratégie "gamma-neutre" en 
plus d'avoir une stratégie "delta-neutre". 


Comme la stratégie delta-neutre fait que l'on joue déjà avec le sous-jacent pour rendre le delta constant, 
alors on ne peut utiliser le sous-jacent pour rendre le gamma neutre. Le principe de gamma hedging dun 
portefeuille contenant au moins un option, est alors de trouver une autre option sur le marché, dans des 
proportions qui permettent de compenser le gamma de la position originelle. 


Exemple: 


Considérons comme résumé un Call dont sur sous-jacent dont le prix spot est de 100.-, le strike de 100., 
la volatilité du rendement de 24% et le taux d'intérêt géométrique moyen du marché de 5%. Considérons 
que nous avons les valeurs suivantes: 


8 =062 I'=002 9=-002- v=037- p=05- 


La valeur du delta nous indique donc que si le prix du sous-jacent montre de 1.-, la valeur de l'option 
augmentera de 0.62.-. Le gamme nous indique que si le prix du sous-jacent montre de 1.-, le delta de 
l'option passera de 0.62 à 0.64. La valeur du thêta nous indique en fin de journée que la valeur de l'option 
aura diminué de 0.02.-. La valeur du vega nous indique que si la volatilité du sous-jacent passe de 24% à 
25%, la valeur de l'option augmentera de 0.37.-. Enfin la valeur du rhô nous indique si la valeur du taux 
moyen géométrique sans risque du marché passe de 5% à 5.5%, la valeur de l'option augmentera de 0.25... 


D6. "L'opérateur différentiel linéaire de Black & Scholes" Z,, donné par: 
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aurait une interprétation financière comme mesure de la différence entre le retour d'une option (les deux 
premiers termes) et l'ensemble d'un portefeuille de rendement sans risque r contenant cette option (les 
deux derniers termes). 


Bref, ceci étant dit, nous pouvons donc avoir l'écriture technique suivante de l'E.D.P. de Black & Scholes 
(à coefficient S non constant) en utilisant les grecques: 


84 ST +rSA 7 =0 | (66.612) 


7.8.10. RÉSOLUTION DE L'E.D.P. DE BLACK & SCHOLES 


Avant de nous attaquer à la résolution de l'équation B.S. donnons déjà les solutions avec un rappel des 
termes (cela permettra d'avoir une idée préalable des concepts utilisés lors des développements et de plus 
je ne risque pas d'écrire ceux-ci avant quelques années faute de temps...): 


Soient F(S,t) la valeur d'une option Call C(S,t) ou Put P(S,t), er la volatilité du sous-jacent, E le prix 
d'exercice (strike), T la date d'expiration et r l'intérêt et S le prix du sous-jacent. Nous allons résoudre 
l'équation différentielle de BS (à coefficient S non constant) écrite la forme suivante: 


2 
a, 1 262 PCs = 0 (66.613) 
- os 


# 2 a$ 


L'astuce (qui a menée à l'obtention d'un prix Nobel d'Économie pour rappel) est de voir qu'il s'agit d'un 
équation différentielle aux dérivées partielles et plus particulièrment avec des différentielles du premier 
ordre en t et en deuxième ordre en S. Or, il existe une équations différentielle de ce type qui est très 
connue en physique: l'équation de le chaleur (cf. chapitre de Thermodynamique). L'idée est alors par des 
changements de variables de s'y ramener. Toute la difficulté était de trouver les bons changements de 
variable et nos prédécesseurs se sont occupés de ce tatonnement.. pour nous (merci à eux!). Nous 
commencors alors par poser (ce choix permet aussi de se ramaner à des conditions initiales similaires à 
celles de l'équation de la chaleur): 


CE Si= KuiT,x) T=o (T-i) s=u() (66.614) 


et donc explicitement: 
5 _—.—. 
CSST rx) = (0? (T-£6),in ) (66.615) 
Nous utiliserons plus bas le fait que: 
OT =-9 & = L (66.616) 
ot a S 


À toute fin utile, écrivons la transformatin inverse (qui nous sera utile beaucoup plus tard) qui en découle: 
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1 1 FT 
T,x)=—C(s, S)=—C| T-—, Ke | (66.617 
ii | x Fe l l Fe | = | ( ) 


Une partie de l'idée sous-jacente à ce choix de changement de variables est de transformer le fait que dans 
l'équation différentielle de Black & Scholes, nous connaissons les conditions finales (puisqu'à maturité le 
prix de l'option est parfaitement déterminée) alors qu'avec l'équation de la chaleur il nous faut des 
conditions initiales et non finales! Nous allons de suite voir que ce choix de changement de variables 
permet cela. Effectivement, rappelons qu'à maturité nous savons que: 


CT,S)=(S;-K) (66.618) 


Soit: 
" 
Loirs)- Sr. _f (66.619) 
K K 
Comme: 
x=in Æ) = S =e* (66.620) 
& & 


Nous avons alors: 


Loir. s)=(e -1) (66.621) 
K& 


Et le fait ce que nous permet d'avoir une condition initiale est que: 


Lo(r.si=(e 1) =uitxi=ulotiT-é#ixl=ui0 x) (66.622) 
& t=T 


Pour transformer notre équation différentielle aux dérivées partielles (à coefficient S non constant): 


2 
ac 1,242 PC Ce = C6 
2 as? as 


avec ces nouvelles variables il nous faut calculer quelques dérivées partielles de C. Nous avons alors: 


Fafe(aroa(p ea (ra (s) 
een(]-<r8 
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(66.624) 


et: 
= x [or é),in . 2e [o? (T- ou(?))] 
a 6 K K 
(66.625) 
= Lan oi (7- on - À Ou 
Sôx S à 
Ainsi que: 
2 
RTS SP RAA ES 
8° LS 8x S 6x S|0S K 
ER 9, #04 ,& 9, -_X 6, À 0 _ _ £ Ou K du (66.626) 


— ÿ, = — À — — 
SX SES" S8x SX" SX SX"  S'Ox S?Px 


En injectant cela dans l'équation différentielle, il vient: 


ke |+ LE E- 2) --tuge (66.627) 
ot à à S & 


On simplifie les S: 


æ & 
Ke M4 SK Mu 2 po D (66.628 
dd à 8x 


On multiplie des deux côtés par: 


1 
—- 66.629 
eus PA 


Pour obtenir: 


+ ? Ô (66.630) 
——#— + —u = : 
a x oo 


ÔT 2 


4 1(u 4 r du 
8 x 


Soit: 


at (-s (66.631) 
8T 28 a 2])8x co | 


Posons comme il est d'usage: 
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Fr 
ps = (66.632) 


Il vient alors l'équation différentielle (à coefficient constants cette fois-ci!): 


du 1 Fu | É — 
= + | 17% (66.633) 
ôT 28x 2} x 


avec pour rappel la condition initiale: 
{ x + re pr 
ui0,xi=le"—-1)] (66.634) 


La suite toute aussi astucieuse, consiste à faire encore un changement de variable en posant: 


vt.x)=e TE ufr x) (66.635) 


Nous allons déterminer les deux paramètres 4, 8 qui permettent d'écrire l'équation différentielle partielle 


à coefficients constants sous forme d'équation de la chaleur! 


Nous allons procéder d'abord comme plus haut en déterminant l'équivalence des différentes dérivées 
partielles de u. Nous avons alors: 


Di 


ôle VIT, xil 
DR PEUR Dr A (éé ES) 
ÔT ÔT OT 
et: 
mer Hit US (66.637) 
Ex êx 
Ainsi que: 


du à at 6x dv —XT- 8x | dv 2 dv dv at 8x 
—=—|- +— =|-8— + v+—-8— 

| is Æ. = hé 8x° Fr À 
(66.638) 


Ensuite vient une astuce très difficile à deviner (du moins a priori car je n'ai pas trouvé plus simple...). 
Effectivement avant de substituer ces trois dernières relations dans l'E.D., rappelons que: 


v(rx)= TA ufr x) (66.639) 
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Donc les trois dernières relations peuvent s'écrire (retrouver un mélange fonction de u et de v est très 
contre-intuitif): 


% | -avé4 dv ga T-6x au 4. DV gra T-fx 
OT OT OT 
du D _r- dv - 
= -p+2)e GAS LL + —g AT A (66.640) 
8x 8x êx 
2 2 
x 


et maintenant seulement faisons la substition (partielle!) dans l'E.D.! Nous passons alors de: 


Bu 1 Fu | Je 
—=———+|x-— |" xx (66.641) 
ôT 28r 2 } &x 


au +e7 47 4 z| 
OT 


2 
= Le 28e TA Der D (e-3) |-A +e Tr >|-« 


(66.642) 


Écrivons cette derinière égalité un peu différemment en mettant en factorisant à gauche et à droit ce qui 
contient u: 


[-æ]x 7 Es 2 
ÔT 
(66.643) 
1 > 1 1 ares À ue & Ov | ; arf 
— 5" -Blkr-—-|-Ku-—|2 — — — |+| K-— — 
E El :) L s [266 %x 2j  _&% 


et donc en posant: 


L'équation différentielle se simplifiement en: 


2 
gs 9 __ ll, Le TE D _ ar cad +|x- js (66.645) 
ôT 2 8x % &% 


L'exponentielle peut se simplifier et il reste: 
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v] 
% __1 + ui OE (66.646) 
ôT 2| °&x & 2) 8x 
Ce que l'on peut réécrire sous la forme: 


8 1 &  16v 
—=||xr--|-$8 —+—— (66.647) 


Et si nous choisissons: 
1 | 
K——|= £ (66.648) 


Il nous reste alors: 


& 1 4v 
—=——> (66.649) 
ÊET à 
ou autrement écrit (à la physicienne): 
l 
V, = Tr (66.650) 


On reconnait donc ici l'équation de la chaleur (ou "équation de diffusion") démontrée dans le chapitre de 
Thermodynamique mais où le coefficient de dilatation thermique vaut 1/2. 


Il résulte donc de ces développements que: 


Soit en injectant la deuxième égalité dans la première et après quelques simplifications élémentaires: 


1 iT 1 1 1 1Ÿ if 2 1 
a=-—|c--| +x-=|r--|+e= rx) +ez ae c++ -|+x 
2|" 2 2 2 20" 2 2 4 

1 


(66.652) 
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Il nous reste maintenant à transformer la condition en u: 


/ + 
u(0Oxi={e"—1) (66.654) 


En une condition initiale en v à l'aide de: 


if, 1 1 1 
+] stef (66.655) 
VIT,XI=Ee uIT,X| 


Donc il vient immédiatement: 
2 


+ 
1 «+1 O+. xl x xl p 4 xl X+X _ x 

| 2112 2 2 + + 2 2 

vi0,xi=e ui0, xi=e Je -11 =le —2 


(66.656) 


La suite (la résolution de l'équation différentielle) viendra dans un proche avenir... sauf accident (pas le 
temps de la rédiger...). 


- Pour le Call européen (valeur de l'option d'achat de maturité T et de strike K) la solution (dont la 
démonstration doit encore être rédigée dans ce chapitre...) est: 


C{S,é1= SN(d, + £e "T0 27 d)| (66.657) 


où N(x) est donc la loi Normale centrée réduite: 


1 1% 
N(x) = e ? dy (66.658) 
x | 
avec: 
»[]" Le. Ir -0 
. E 2 (66.659) 
; ONT-t 
et: 


ee ET —£$ (66.660) 
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La distribution Normale cumulée de ce paramètre représente la probabilité que l'option soit exercée dans 
un univers risque-neutre (en absence d'opportunité d'arbitrage pour faire simple). Multiplié par E, la valeur 
normale cumulée du paramètre précédent représente donc en quelque sorte l'espérance, en univers risque- 
neutre, de paiement du prix d'exercice. L'exponentielle se trouvant dans l'expression de C(S,t) est le 
facteur d'actualisation. 


Remarque: Si nous avons un Call ou Put à la monnaie (pour rappel cela signifie que S = E) alors les 
deux coefficients ci-dessus se simplifient puisque le logarithme néperien est alors nul. 


- Pour le Put européen (valeur de l'option de vente de maturité T et strike K): 


P(St)=-SN(-à)+£e (2) = S(N(a)-1)- 86 "70 (nd )-1)| (6.661 


Dès lors, le "delta du Call" que nous avions déjà introduit plus haut est donné dans ce modèle par 
l'expression exacte (c'est immédiat): 


Ac=—=N(d;) (66.662) 


qui est donc dans ce cas particulier une valeur positive comprise entre 0 et 1. 
Le "delta du Put" est lui donné par (c'est aussi immédiat): 


Âp= SN (a) —]1 (66.663) 


qui est donc toujours une valeur négative. 
Il est facile de vérifier que ces solutions satisfont l'équation de parité Put-Call: 
S+P-C= EH "CT (66.664) 


où rappelons que E est juste une autre manière traditionnelle de noter la valeur de strike K des deux 
options P et C. 


Voici les commandes intégrées à la version anglaise de Microsoft Excel 14.0.6129 pour faire le calcul avec 
des valeurs d'entrées arbitraires: 
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292.85 Prix du sous-jacent à ce jour 


300.00 Prix d'Exercice (ste) fixé à l'avance 


4% Rendement géométrique moyen annuel non risqué du marché 


S 
E 
Fr 0.25 Maturité en années (inférieur ou égal à 0.25 comme limite théorique) 
» 
T 40% Volatiité annuelle du sous-jacent 


Figure: 66.62 - 


di ={LN(B1/B2}+(B4+0.5*(B52))*B3)/(B5*SORT(B3)) 
=B7-B5*SORT(B3) 


Ca 
2, 
e 


WAC(S,T) =B1:C1*NORM.S.DIST(B7:1)-B2*EXP(-B4*B3)*NORM.S.DIST(B8;1) 
BNP(S,T) =-BI*NORM SDIST(-B7.1}+B2*EXP(-B4*B3)*NORM S DIST(-B8:1) 


EN Delta Cal =NORM S.DIST(LN(B 1/B2}+(B4+0.5*B512)*B3)/(B5*SORT(B3)).1) 


Application de Black & Scholes dans la version anglaise de Microsoft Excel 14.0.6129 


Remarque: Il est sûr que les équations de Black & Scholes ont permis l'essor des marchés aux options, 
en permettant une spéculation sécurisée. Cela reste de la spéculation (les acteurs spéculent les uns par 
rapport aux autres sur la volatilité des actions), mais cette spéculation reste sécurisée par l'équation de 
couverture, qui évite que les pertes ne soient trop importantes. Il existe néanmoins des inconvénients à 
leur utilisation. Le plus important est sûrement l'effet d'emballement qu'elles provoquent. Supposons 
par exemple que vous êtes le vendeur d'une option sur l'action d'une société S. Celle-ci annonce des 
résultats légèrement inférieurs à ceux attendus. Son cours baisse, et c'est normal. L'équation de 
couverture de Black & Scholes vous recommande alors de diminuer le nombre d'actions de cette 
société dans votre portefeuille, ce que vous faites. Mais tous les acteurs du marché font le même 
raisonnement, engendrant une nouvelle baisse du cours de l'action. L'équation de couverture de Black 
and Scholes vous recommande de vendre encore des actions, etc... Cela peut déclencher un véritable 
emballement du marché, à la baisse comme à la hausse. Ceci est accentué par le fait que bien souvent, 
les ordres d'achat ou de vente sont automatisés, implémentés directement dans les logiciels, et ne 
nécessitent plus d'interventions humaines. D'autre part, l'équation de couverture de Black & Scholes 
est efficace pour de petites variations de cours, mais pas pour des "dévissages" brutaux et importants. 
Ainsi, un an à peine après avoir reçu leur prix Nobel d'Économie, Robert Merton et Myron Scholes 
furent impliqués dans la déconfiture du fonds d'investissement américain LTCM à l'automne 1998, à la 
suite de la grave crise russe de l'été 1998. 


7.9. VALUE AT RISK 


Les mesures du risque ont bien évolué depuis que Markowitz a avancé sa célèbre théorie de la 
diversification de portefeuille à la fin des années 1950, théorie qui devait révolutionner la gestion de 
portefeuille moderne. Le risque d'un portefeuille était alors relié à la matrice des covariances-variances 
comme nous l'avons démontré théoriquement et par l'exemple plus haut. 


Dans les années 1960, Sharpe a proposé le modèle unifactoriel d'évaluation des actifs financiers où le bêta 
est le facteur explicatif principal du risque d'un portefeuille via la matrice des bêtas. 
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Au début des années 1990, une nouvelle mesure du risque a fait son entrée (la banque JP Morgan en serait 
à l'origine). En effet, on reconnaissait de plus en plus les limites des mesures traditionnelles du risque. Il 
fallait se donner des mesures du risque de baisse de la valeur des actifs. Pour ce faire, il fallait trouver des 
mesures davantage reliées à l'ensemble de la distribution des flux monétaires d'un portefeuille. C'est dans 
ce contexte qu'une mesure nominale du risque a été proposée: la VaR (notée V@R en gestion de projets). 
Dont l'idée est en gros de pouvoir dire que nous avons X% de probabilité cumulée de ne pas perdre plus de 
Y en numéraires dans les N prochains jours. 


Cette nouvelle mesure a d'abord servi à quantifier le risque de marché auquel sont soumis les portefeuilles 
bancaires. En effet, l'Accord de Bâle a recommandé aux banques, en 1997, de détenir un montant de 
capital réglementaire pour pallier aux risques standards de marché. Or, ce capital est depuis lors calculé à 
partir de la VaR et celle-ci est devenue de plus en plus populaire pour évaluer le risque de portefeuilles 
institutionnels ou individuels (et pas que!). Il n'existe pas cependant une mesure unique de la VaR. En 
effet, elle repose sur le concept de volatilité, qui est essentiellement latent. C'est pourquoi les banques se 
doivent de recourir à plusieurs modèles de VaR de manière à définir la fourchette de leurs pertes 
éventuelles. Ces calculs sont d'autant plus complexes que la distribution des rendements des titres mesurés 
à haute fréquence s'éloigne sensiblement de la normale. 


Définition: La "Value at Risk" (VaR) est la perte maximale théorique que peut subir un gestionnaire d'un 
portefeuille (dont la valeur est forcément implicitement variable) et pour une certaine période de temps 
avec une probabilité cumulée donnée (l'utilisation de la VaR n'est pas limitée aux instruments financiers, 
elle est utilisée dans beaucoup d'autres domaines de la gestion du risque en général). 


Remarque: La VaR n'est pas réellement pertinente si elle n'est pas présentée avec d'autres indicateurs 
de risques tels que le ratio de Sharpe, le ratio de Treynor ou encore les coefficients des grecques 
(comme le bêta). Enfin, indiquons que dans la pratique la VaR est parfois indiquée en %. 


7.9.1. VAR RELATIVE 


Dans le modèle classique de la VaR relative (appelée aussi parfois "VaR Paramétrique"), nous supposerons 
que la distribution statistique des résultats d'un portefeuille obéit à chaque instant à une loi Normale. que 
nous noterons par la suite: 


X = N{u,o°) 
Sous cette hypothèse de normalité, la VaR relative est appelée en toute rigueur "VaR delta-normale". 


L'idée suivante est que la variable aléatoire X peut donc être réécrite avec une variable aléatoire Normale 
centrée réduite (cf. ch e Sta ) en posant: 


&= M(0,1) 


telle que (utilisation des propriétés de base de la loi Normale): 


Æ=uH+E0 


et cette écriture est donc utilisée dans énormément d'autres domaines que la finance (gestion de projets, 
assurance qualité, logistique, etc.). 
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Soit & le seuil critique associé à la probabilité cumulée visée. Nous pouvons alors écrire: 


XZ=u+a0 


qui est une forme intéressante car elle reporte l'analyse du risque et de la variabilité sur l'estimation de 
l'écart-type seul (ce que les financiers apprécient bien.…..)! 


Cette forme d'écriture se vérifie aisément avec la version anglaise de Microsoft Excel 11.8346 pour les 
sceptiques. Considérons un portefeuille P ayant un écart-type annuel de 10% et supposons que nous 
possédons 1'000.- en actifs de ce portefeuille. Nous avons alors à la première année: 


=NORMINV(99%;1000;10%*1000)=1000+NORMSINV(99%)*10%*1000-1"232.6 


Soit 99% de probabilité cumulée d'avoir un portefeuille valant entre 0 et 1°232.6.- à tout moment (on 
considère comme négligeable la probabilité cumulée que le portefeuille ait une valeur négative avec cette 
écriture). 


Mais ce qui intéresse le gestionnaire n'est pas de se couvrir du risque de l'espérance (car il est nul) mais de 
la volatilité seule! Dans le cas précédent elle est donc de 100.- et suit une loi Normale centrée réduite. 
D'où la raison de définir la VaR formellement comme étant la relation mathématique qui donne un 
intervalle de confiance (ou une quantile selon le point de vue) de l'écart-type: 


VaR = 


Ainsi, pour une probabilité cumulée de 99% les logiciels nous donnent en valeur absolue (voir le 
traitement des intervalles de confiance dans le chapitre de Statistiques): 


a = NORMSINV(99%)=ABS(NORMSINV (1%) = 2.326 


où par tradition les financiers prennent l'alpha (et donc la VaR) comme étant positif. D'où le fait qu'ils 
parlent de risque couvert à 99% alors qu'en réalité il s'agit de couvrir un risque qui a 1% de probabilité 
cumulée d'avoir lieu (mais strictement parlant c'est la même chose simplement que le premier est plus 
facile à faire comprendre à un client...!!!). Raison pour laquelle on trouve parfois aussi la VaR sous la 
forme suivante: 


VaRk =-a47 


Signalons que le résultat du calcul peut être désigné aussi sous le nom de "réserve fractionnaire" (bien que 
cela n'ait aucun rapport avec la façon dont les États imposent une réserve fractionnaire aux banques) ou 
encore "réserve mathématique" (bien que cela n'ait aucun rapport avec la manière dont les assurances 
calculent la réserve mathématique). 


Remarque: Le modèle RiskMetrics de J.P. Morgan/Reuters proposait en 1996 de prendre un & de 1.65 
correspondant a une probabilité cumulée de 95%. Certains praticiens recommandent fortement, au vue 
de l'hypothèse forte et simplificatrice de Normalité.., de multiplier la VaR par un facteur 2 ou 3. 
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Exemple: 


Un portefeuille P de valeur 1'000.- a une volatilité annuelle de 10%. La volatilité journalière (instantanée) 
du rendement est alors de (nous utilisons ici la propriété du mouvement brownien standard): 


_ 10% 


= Z 0.63% (66.672) 
252 


TR; 
où 252 est le nombre de jours de Bourse dans l'année dans un pays donné. Soit en numéraires: 
g; 20.63% 1'O00Z 6.29 (66.673) 
La VaR relative au seuil de 99% à une journée est alors: 


VaR; = 2.326.6.29=1465 (66674) 
De même sur un an nous aurions la VaR relative annuelle au seuil de 99% suivante: 


VaR4 = 2.326-.1'000-10%=232.6 (66.675) 


Soit une VaR relative de 23.26% (juste histoire de la donner en pourcents comme il est d'usage dans le 
domaine financier). 


Ainsi, en ce qui concerna la VaR annuelle relative, nous avons alors 99% de probabilité cumulée de gagner 
232.60.- mais aussi de les perdre! Effectivement nous avons 1% de probabilité cumulée d'avoir une perte 
annuelle de: 


=NORMSINV(1%*10%%*1000)=-232.6 


donc il faudrait au moins un capital risque (fonds propres) de 232.6.- pour couvrir 99% des risques 
(couvrir cette probabilité cumulée de 1% d'être dans une mauvaise année respectivement). Nous pouvons 
aussi dire que nous avons 99% de probabilité cumulée de ne pas perdre plus 232.6.-. Nous retrouvons 
donc le même résultat numérique qu'avec l'exemple précédent. 


Le lecteur remarquera que nous avons donc dans le domaine de la Bourse (ceci découle donc du 
mouvement brownien standard) pour passer d'un horizon temporel à un autre: 


VaRy=VaR;t=2326.0,4/252 (66.676) 


Les financiers appellent cette propriété du mouvement brownien dans le cadre de l'utilisation de la VaR la 
"scaling law". Elle est autorisée par les accords de Bâle en 1996 qui présupposent une distribution 
Normale et conseillent un horizon temporel de 10 à 30 jours. Nous avions vu cependant lors de notre 
démonstration du modèle du mouvement brownien standard que nous sous-estimons sous cette hypothèse 
le risque réel et que ce réflexe de changement d'échelle via la racine carrée est très critiquée par les 
spécialistes. 
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Donc la VaR bien qu'étant un montant placé dans les capitaux propres (provisions pour risques et charges) 
afin de faire face à un décrochage violent mais temporaire du marché, ne suffit pas à se protéger d'un 
retourenement puissant et durable du marché... Raison pour laquelle les banques provisionnent souvent le 
minimum minimorum.... 


Remarque: Personnellement je préconiserai de couvrir selon la méthode Six Sigma à 99.9996% sur un 
horizon temporel correspondant au minimum au temps de position moyen. Mais c'est personnel... 


7.9.2. VAR ABSOLUE 


La mesure de VaR que nous venons de donner est une mesure relative car elle ne tient pas compte de la 
moyenne des pertes et gains futurs. 


Si la volatilité est de 100.- dans l'exemple qui vient d'être donné, la VaR relative est donc 232.6.- Mais 
comme le profit moyen est généralement non nul sur une longue période de temps, nous devons la plupart 
du temps utiliser la mesure absolue de la VaR (sur une très courte période le profit étant considéré comme 
parfois nul, on s'en tient au calcul de la VaR relative). 


Rappelons d'abord que suite à notre étude du modèle de Bachelier nous avons démontré que l'espérance 
positive de la valeur (ou rendement) ainsi que l'écart-type positif d'un portefeuille sont proportionnels à la 
racine carrée du temps. 


Supposons que la période d'observation t soit en mois. Le rendement mensuel espéré pour le portefeuille 
de valeur initiale S est alors de Æ (son espérance donc..!.) et la variance mensuelle de son rendement de 


a. 


Sa VaR relative au seuil de confiance & est donc après t mois donnée par (vous pouvez vérifier que la 
relation est bien homogène!): 


Var, =S. (aa) (66.677) 


comme nous avons pu le vérifier dans l'exemple précédent (donc jusqu'ici rien de nouveau...). La racine 
carrée du temps provient, pour rappel, du modèle de Bachelier (mouvement brownien standard). 


En version de Monte-Carlo avec du VBA (car la version ci-dessus est dite ponctuelle") cela donne: 


Function ValueitRiskMC{(confidence, horizon, RiskFree, StDw, StockValue) 
Dim i is Integer 

Dim stockReturnii To 10000) 2s Double 

For i = 1 To 10000 


stockReturn(ii) = Expi(RiskFree - 0.5 * StDw * 2) 
+ StDy * äpplication.Norminv(Rndi()j, 0, 1j) -— 1 
Next ji 
ValueitRiskMC = (horizon) * 0.5 * StDv … 


* ipplication.Percentile(stockReturn, 1 - confidence) 


ValueitRiskMC = StockValue * ValueitRiskMC 
End Function 
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Remarque: Contrairement à ce que nous avions vu lors de notre étude des seuils/intervalles de 
confiances dans le chapitre de Statistiques, nous ne divisons pas par 2 l'argument de la fonction 
NORMALSINV() de la version anglaise de Microsoft Excel 11.8346 pour obtenir le & dans la 
situation ci-dessus car ce qui nous intéresse c'est seulement un côté de la courbe centrée réduite (le 


RL 


côté pessimiste") et non les deux. 


Si nous reprenons le même exemple que précédemment (portefeuille de 1'000.- avec 10% de volatilité 
annuelle). La VaR relative est donc sur une projection de 30 jours de: 


(1) 
Var, = Sacft = 1000. 2.326. pe -4/30 = 80.2 


V252 


Mais cette dernière relation ne tient pas compte du rendement moyen espéré Æ du portefeuille dans le 
temps. La VaR absolue est donc obtenue en retranchant ce rendement à la VaR relative sur la même 
période temporelle, c'est-à-dire: 


Var, =Var, -S.u.t=-S{u.t- act) 


où nous faisons l'hypothèse particulière que le rendement est donc linéairement dépendant du temps 
(conformément à la construction semi-empirique du mouvement brownien standard). La VaR absolue est 
donc bien évidemment inférieure à la VaR relative de ce montant. 


Mentionnons que le calcul de la VaR absolue peut être considéré comme vicieux ou ayant peu d'intérêt car 
il suppose que le gain obtenu grâce au rendement sera placé dans les fonds propres pour financer la VaR 
relative. Or, dans la majeure partie des cas les gains seront replacés autrement. 


Reprenons quand même notre exemple habituel sous cette hypothèse (portefeuille de 1'000.- avec 10% de 
volatilité annuelle) avec un rendement annuel de 15%. Nous avons alors: 


Var, = Saot - Suit =1' 000. 2.326. 10% —1'000.15% = 232.6 —150 = 82.6 


Concrètement, si nous finançons la VaR avec les gains alors sur une année il suffit d'avoir 82.6.- de fonds 
propres. Dans la pratique il peut être intéressant de savoir à partir de combien de temps les gains couvrent 
la totalité de la VaR. Dans ce cas il s'agit d'une simple équation du deuxième degré telle que: 


Sant - Suit = Ô 


et nous trouverions dans notre exemple 2.4 années. Concrètement après 2.4 années les gains auront 
couvert la totalité des risques selon les hypothèses de construction. 


7.9.3. VAR HISTORIQUE 


Une troisième manière pragmatique de calculer la VaR relative est basée sur les données historiques. Il 
s'agit de la manière la plus simple de faire le calcul avec la facilité d'utilisation des tableurs existant 
aujourd'hui. 
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Supposons pour l'exemple que nous ayons les cent dernières performances journalières d'un portefeuille. 
Les dix plus mauvaises performances journalières sont données ci-contre par ordre croissant: 


-19'000 


-16'450 
-15'000 
-12'500 
-11950 
-11250 
-11'050 
-10'600 
-10'500 
-10"250 


Tableau: 66.16 - Performances journalières triées d'un portefeuille 


La VaR relative à 95% pour 1 jour consiste alors à déterminer le 5ème centile. Comme nous avons 100 
échantillons, il est facile de déterminer qu'il s'agit de la 5ème valeur dans l'ordre croissant des valeurs. 
Donc: 


Va, =11'950.— (66.682) 


Comme nous l'avons déjà mentionné dans le chapitre de Statistiques, dans les tableurs nous utilisons la 
fonction CENTILE( ) qui n'est pas forcément calculée de la même manière d'un logiciel à l'autre. 


7.9.4. VAR DE CRÉDIT 


Pour introduire ludiquement la VaR de crédit Considérons trois portefeuilles, À, B et C dont les 
probabilités de défaut de crédit suivent une loi de Bernoulli (donc pour rappel c'est un événement binaire) 
de valeurs respectives 5%, 10% et 20% et dons les valeurs numéraires sont en millions de francs de 25., 
30.- et 45.-. 


Pour l'exemple qui suivra, nous ferons les hypothèses (qui sont souvent implicites même dans tout ce que 
l'on a vu jusqu'à maintenant) que l'exposition au risque est constante, que les portefeuilles sont 
indépendants et qu'en cas de défaut de crédit nous perdons tout. 


Comme les trois portefeuilles sont donc indépendants, l'espérance de perte (notée "L" pour Loss) est 
facilement calculable à l'aide de la propriété de linéarité de l'espérance: 


E(L)=5%.25+10%.30+20%%.45=1325.-— (66.683) 


Comme la perte de crédit est considérée comme une variable aléatoire de Bernoulli (et que les 
portefeuilles sont toujours indépendants), nous avons alors toujours en millions de francs (se référer au 
calcul de la variance d'une variable aléatoire de type Bernoulli dans le chapitre de Statistiques): 


V(L)=V(L,+ EL +lo)= (La) +V(Lr)+ (Le) 
=25.5%.11—5%1+30.10%.11—10% 1 +45. 20% .11— 20% 1 =434.688. — 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


(66.684) 


Bon ceci étant fait pour le plaisir... Comme déterminer le plus finement possible la distribution des pertes 
pour avoir la VaR de crédit à un seuil donné? Eh bien pour cela il va nous falloir construire le tableau de 
toutes les issues possibles. 


Aucun (1-0.05)*(1-0.1)x(1-0.2)-68.40% 68.40% 
A GE 0.05*(1-0.1)x(1-0.2)=3.60% 72.00% 

B 30.- (1-0.05)x0.1x(1-0.2)=7.60% 79.60% 

É 45.- (1-0.05)*(1-0.1)x0.2=17.10% 96.70% 
À, B 55.- 0.05*0.1x(1-0.2)-0.40% 97.10% 
A,C 70.- 0.05x(1-0.1)x0.2=0.90% 98.00% 
B,C 75.- (1-0.05)x0.1x0.2=1.90% 99.00% 
À, B,C 100.- 0.05*0.1x0.2=0.1% 100% 


Tableau: 66.17 - Scénarios de pertes et probabilités associées 


Ainsi, la VaR de Crédit la plus proche de 95% est de 45 millions de francs. Puisque nous pouvons nous 
attendre à une perte de 13.25 millions de francs, la partie non attendue sera donc considérée comme étant 
de 31.75 millions de francs. 


7.9.5. VAR OPÉRATIONNELLE 


Nous avons déjà rencontré le concept de convolution plusieurs fois dans le chapitre de Statistiques mais 
pour des lois continues connues explicitement sous leur forme algébrique... Dans la pratique il en est tout 
autre! Aïnsi, les actuaires on souvent à leur disposition pour une période donnée (souvent sur une année), 
une distribution expérimentales des fréquences des événements d'intérêt (accidents, décès ou autre) et une 
distribution expérimentales des coûts des événements d'intérêt. Par exemple, considérons le cas très 
simplifié (en taille!) suivant: 


| Distribution Fréquence (pertes) Distribution des coûts de perte 
| Probabilité | Fréquence | Probabilté | Perte 
0.6 0 l 0.5 1'000.- 
0.3 1 | 0.3 10'000.- 
0.1 2 | 0.2 100'000.- 
Espérance: 0.5 ] Espérance: 23'500.- 


Tableau: 66.18 - Fréquence d'événements de pertes et probabilités et probabilités de perte 


Si nous souhaitons à partir de ces valeurs expérimentales et discrètes déterminer la distribution empirique 
des coûts, nous allons devoir faire une convolution discrète dont le principe est le suivant: 
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0 0 0 0 =0 

1 1'000 0 1'000 =0.3x0.6-0.150 

1 10'000 0 10'000 =0.3x0.3=0.090 

1 100'000 0 100'000 =0.3x0.2=0.060 

2 1'000 1'000 2000  |=0.1x0.5x0.5=0.025 
2 1'000 10'000 11000 |=0.1x0.5x0.3=0.015 
2 1'000 100'000 101'000 }=0.1x0.5x0.2=0.010 
2 10'000 1'000 11000 |=0.1x0.3x0.5=0.015 
2 10'000 10'000 20000 |=0.1*0.3x0.3=0.009 
2 10'000 100'000 110000 |=0.1*0.3x0.2=0.006 
2 100'000 1'000 101'000 }=0.1x0.2x0.5=0.010 
2 100'000 10'000 110000 |=0.1x0.2x0.3=0.006 
2 100'000 100'000 200'000 |=0.1*0.2*0.2=0.004 


Tableau: 66.19 - Convolution distribution des événements de pertes et valeurs associées 


L'espérance des pertes est alors égale à 11'750.-, ce qui équivaut aussi à calculer simplement (l'espérance 

du produit de deux variables aléatoires indépendantes étant égal au produit des espérances comme nous 

l'avons démontré dans le chapitre de Statistiques): 
0.5-23'500=11"750 (66.685) 


Ensuite, nous combinons et trions les pertes et probabilités: 


Du côté de la VaR opérationnelle, si on la pose à 95% (les accords de Bâle II propose plutôt de prendre 


__ Perte | Probabilité cumulée 
0 60% 

1'000 75% 
2'000 77.5% 
10'000 86.5% 
11000 89.5% 
20'000 90.4% 
100'000 96.4% 
101'000 98.4% 
110'000 99.6% 
110'000 100% 


Tableau: 66.20 - Combinaison des calculs 


99.9%), la valeur la plus proche est alors: 


VaR,y. = 100"000.— 


Dès lors, la réserve de perte non attendue est de: 


100"000-11"750 = 88'250.— 
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Graphiquement nos tableaux, manipulations et calculs se résument à: 


Distribution des Fréquences Distribution des Coûts de pertes 
l l 


0.5 
0 
0 1 2 1 10 100 
Fréquence des Pertes/année Pertes en KFr.- 
Convolution 


Espérance de Perte 


11°750.- Réserve de perte 


aenviron 95% 


88 230.- 


0 1 PA 10 11 20 100 101 110 200 
Pertes par année (en KFr.-) 


Il est au passage très intéressant de remarquer comment deux simples tables produisent une quantité de 
calculs en convolution relativement conséquent. Raison pour laquelle dans des cas pratiques réels, il faut 
faire appel à l'informatique. 


7.9.6. VAR VARIANCE-COVARIANCE 


La VaR variance-covariance est basée sur un cas plus réaliste du calcul de la VaR pour un portefeuille 
composé de plusieurs actifs financiers corrélés ou non (contrairement aux cas précédents où nous n'avions 
qu'un seul actif). 


Considérons pour introduire ce concept un portefeuille P1 de 5'000'000.- de volatilité journalière de 2% 
(soit de 100'000.-/j.) et un deuxième portefeuille P2 de 7'000'000.- de volatilité journalière de 1% (soit de 
70'000.-/j.). 


Nos mesures montrent que leur coefficient de corrélation À; est de 0.6. L'écart-type global journalier est 
alors de (cf. chapitre de Statistiques): 


Gu = Je + +282 = 4100 "0007 +70'0007 +2. 0.6: 100'000.70'000 ———. 
= 152'643 


Ainsi, la Va relative journalière à 99% pour le portefeuille global est de (pas de scaling law à appliquer ici 
puisque l'écart-type est journalier et que nous voulons la VaR relative journalière): 


Va, 142 = &Oy = 2.326-152'634= 355 000 (66.687) 
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Il est intéressant de comparer la Va relative journalière à la somme des VaR relatives des deux 
portefeuilles: 


Vak, +Va, 2 = aa +0: = 2.326 .100'000 + 2.326. 70'000 = 395'420 
Nous avons: 
VaR, 142 < Vak, + Vak, 2 


Ceci est dû au gain de diversification! 


Remarque: Un piège dans le calcul de la VaR relative variance-covariance aurait été de calculer 
l'écart-type global en % et ensuite de l'appliquer dans la relation du calcul de le VaR globale. Le 
résultat aurait dès lors été erroné! 


Rappelons pour clore à quoi sert la VaR? Mentionnons d'abord qu'elle se révèle d'une grande utilité 
puisqu'elle est mesurée en termes nominaux. Une fois qu'une institution financière a calculé sa VaR 
globale, c'est-à-dire la perte maximale qu'elle peut encourir sur l'ensemble de son bilan pour une 
probabilité prédéterminée, il lui est loisible de se servir de ce montant pour déterminer le capital (avoir 
propre) minimal qu'elle doit détenir pour ne pas s'exposer à la faillite. Si en effet elle détient un capital 
moindre et que la perte maximale probabiliste se produit, son avoir propre sera négatif et elle devra 
peut-être déposer son bilan. 


La VaR est donc très utile pour une institution financière, car elle lui permet de déterminer le niveau du 
capital qu'elle doit maintenir pour survivre. Quand la VaR est utilisée à cette fin, nous l'appelons plus 
communément CaR pour "Capital at Risk", c'est-à-dire que le capital que doit détenir une institution 
financière est calculé ou évalué selon les risques auxquels elle est exposée. Plus le risque est important, 
plus elle devra maintenir un capital élevé. Cela apparaît bien raisonnable, car le capital détenu par une 
institution financière est d'abord et avant tout un filet de sécurité. Pour une banque, il vise à protéger les 
dépôts à son passif. La VaR se présente donc comme une mesure appropriée pour définir le capital 
réglementaire que doit détenir une institution financière. C'est pourquoi le Comité de Bâle, chapeauté par 
la Banque des Règlements Internationaux, retenait cette mesure pour calculer le capital réglementaire 
d'une institution de dépôts en 1995 et qui est devenue effective en janvier 1998. Celles-ci doivent 
maintenant calculer leur exposition au risque en recourant à la VaR et tester sa justesse en faisant des 
"stress tests" (confronter les calculs à des variations extrêmes ) ainsi qu'à des "back testing" en vérifiant 
que les grandes déviations (en dehors de l'intervalle de confiance) n'ont pas lieu plus de 5 fois par année 
boursière (donc par comparaison aux données historiques). 


7.9.7. BACK-TESTING DE LA VAR (MODÈLE BINOMIAL) 


Comme mentionné précédemment, le "back-testing" est une méthode très fréquente utilisée par les traders 
pour contrôler a posteriori de l'efficacité d'un modèle prévisionnel ou d'un stratégie de trading. 


Nous allons voir ici un modèle naïf de back-testing de la VaR (il en existe un grand nombre) mais lorsque 
le lecteur parcourra plus loin les modèles prévisionnels (moyenne mobile, lissage exponentiel, ARIMA, 
etc.) nous verrons que nous comparerons ces modèles avec les mêmes valeurs en utilisant des mesures 
d'erreurs (ME, MAD, MDS, MPE). Ces comparaisons sont considérées alors aussi comme une forme de 
"back-testing". 
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Donc pour en revenir à la VaR, il est relativement évident que lorsque l'on vient de mettre en place un 
modèle de VaR par exemple annuel et que l'on a peu d'historique il vaut mieux la ramener à une VaR 
journalière et faire le back-testing sur la base d'une plus petite unité. 


Rappelons l'exemple du début où nous avions une VaR relative journalière et respectivement annuelle au 
seuil de 1% (donc couverture à 99%) de: 


VaR, = 14.65.- 
Var, = 232.6.- 


Supposons que nous faisons un back-testing de ce modèle en le comparant aux données de 600 journées 
que nous avons en notre possession. Nous observons 9 valeurs au-dessus de 14.65.-. Que pouvons-nous en 
conclure??? 


Eh bien il faut d'abord savoir que si les N journées sont indépendantes et que nous notons par p la 
probabilité qu'un des journées soit hors de la VaR (donc valeur associée égale à 1% dans notre exemple!), 
alors nous avons affaire à une expérience de N épreuves de Bernoulli. Il s'agit donc d'une loi Binomiale 
dont la probabilité cumulée associée est pour rappel (cf. chapitre de S jues): 


à pl 

À | 
SOA pp en UT ef 
rar) oékliN-kil 


Dès lors, l'espérance est déjà donnée par (c'est sympa de la calculer mais en réalité ce n'est pas très utile): 
E(X)= bp = 600 1%=6 


Cependant pour connaître la probabilité cumulée associée à 9 événements, nous calculons par exemples 
avec Microsoft Excel 14.0.6129 en anglais: 


=BINOM.DIST(9;600;1%; TRUE)=BINOM.DIST(9;600;1%;1)=-91.71% 


Soit une p-value de 8.29%. Donc que ce soit en unilatéral ou bilatéral, ce test d'hypothèse nous amène à 
ne pas rejeter le modèle de la Va. Il ne faut pas oublier que si N est très grand et que la probabilité est 
petite, la loi binomiale tend vers une loi Poisson (cf. chapitre de Statistiques) qui est plus simple à 
manipuler (c'est le recommandation du standard CreditRisk+). 


8. ANALYSE DES SÉRIES TEMPORELLES (A.S.T) 


Contrairement à l'économétrie traditionnelle, le but de "l'analyse des séries temporelles" (A.S.T.) n'est pas 
de relier des variables entre elles, mais de s'intéresser à la dynamique d'une variable dans le temps pour 
découvrir certaines régularités afin de pouvoir extrapoler ou d'établir des prévisions sous réserve de 
l'hypothèse qu'on puisse relier une observation à celles qui l'ont précédée. Avec une analyse fine, il est 
même possible d'établir des prévisions "robustes" vis-à-vis de ruptures brusques et de changements 
non-anticipables. 
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Remarque: Ce domaine est un souvent appelé "Business Intelligence" dans les entreprises. Une 
variable analysée sous forme d'A.S.T. sera elle appelée un "Indice de Performance Clé” (IPC) et un 
ensemble d'IPC un "tableau de bord”. 


Définition: Une "série temporelle à temps discret" ou "série chronologique à temps discret" (plus 
rigoureusement on devrait parler de "suite"!) est une suite d'observations X, d'une variable y à différentes 


dates t. Habituellement l'espace de base de t est dénombrable, de sorte que £ = 1.7. Le tout étant noté: 
{ La t) L (66.693) 


et parfois le Y majuscule est noté par un X (cela importe peu...). 


Une série temporelle est donc toute suite d'observations correspondant à la même variable: il peut s'agit de 
données macroéconomiques (le PIB d'un pays, l'inflation, les exportations), microéconomiques (les ventes 
d'une entreprise donnée, son nombre d'employés, le revenu d'un individu, …), financières (le CACA40, le 
prix d'une option d'achat ou de ventre, le cours d'une action), météorologiques (la pluviosité, le nombre de 
jours de soleil par an...), politiques (le nombre de votants, de voix reçues par un candidat...), 
démographiques (la taille moyenne des habitants, leur âge.….). 


En pratique, tout ce qui est chiffrable et varie en fonction du temps peut être analysé relativement 
pertinemment sous forme de AST tant que la personne qui manipule le modèle sait ce qu'elle fait (ce qui 
est rare dès qu'on sort du domaine public et étatique..). 


Ainsi en finance on utilise ces modèles pour modéliser les rendements mais aussi la volatilité (écart-type) 
et la VaR. Bref, il n'y pas vraiment de limites à l'application. 
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Figure: 66.63 - Quelques séries temporelles 


La dimension temporelle est ici importante car il s'agit de l'analyse d'une chronique historique: des 
variations d'une même variable au cours du temps, afin de pouvoir en comprendre la dynamique. On 
représente en général les séries temporelles sur des graphiques de valeurs (ordonnées) en fonction du 
temps (abscisses). Une telle observation constitue un outil essentiel qui permet au modélisateur ayant un 
peu d'expérience de tout de suite se rendre compte des propriétés dynamiques principales, afin de savoir 
quel test statistique pratiquer. La figure précédente montre différentes séries temporelles à titre 
d'exemples. 


Une série temporelle se décompose principalement en trois éléments de base: 


1. La "tendance séculaire à long terme" ou "trend". Elle correspond à un mouvement conjoncturel non 
saisonnier qui traduit l'évolution à long terme de la variable mesurée. 


2. Les "variations saisonnières" sont des fluctuations périodiques qui se produisent régulièrement 
(périodiquement: jours, mois, trimestres ou années). 


3. Les "aléas" ou "variations résiduelles/accidentelles" sont des fluctuations de type aléatoires, en général 
de faible amplitude. 


Définitions: 


D1. Les séries qui oscillent autour de leur moyenne sont appelées "séries stationnaires" (nous verrons une 
définition rigoureuse un peu plus loin). 


D2. Les séries qui semblent croître ou baisser sur l'ensemble de l'échantillon observé sont appelées des 
"séries tendancielles" et leurs moyennes ne sont pas constantes. 
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D3. Les séries qui ne sont ni stationnaires ni tendancielles haussière ou baissière à long terme sont 
appelées "séries non-stationnaires" ou "séries aléatoires" ou encore "séries stochastiques". T out processus 
dont l'évolution temporelle peut être analysée en termes de probabilité est donc dit "processus 
stochastique”. 


D4. Les séries qui présentent une périodicité (fluctuation) régulière sont appelées "séries saisonnières". 
Régulièrement, les séries stationnaires sont des séries tendancielles avec une composante périodique. 


D5. Les séries qui semblent saisonnières ou semblent avoir une composante saisonnière mais dont la 
périodicité est variable, sont appelée "séries cycliques". 


Soit y; une valeur de la série, f sa composante tendancielle, 4 sa composante saisonnière et & sa partie 


aléatoire, nous définissons: 
- Un modèle additif par une expression du type: 
Y=htstE 
- Un modèle multiplicatif simple: 
= hil+si+e 
- Un modèle multiplicatif complet: 
De = 4 (l+s +8 ) 
- Un modèle mixte: 
V4 =4(1+s; +525 +E 


Les caractéristiques de ces graphiques sont toutes modélisables et analysables dans le cadre de l'analyse 
des séries temporelles. Il existe pour cela des outils plus ou moins complexes dont certains ne peuvent être 
mis en doute et dont d'autres sont des modèles heuristiques qu'il faut savoir manipuler et utiliser avec 
précaution. 


Dans le texte qui va suivre, nous allons nous intéresser qu'aux modèles élémentaires accessibles sans une 
artillerie mathématique lourde. 


L'humilité dans le métier de prévisionniste est cependant de mise pour accepter l'erreur de manière 
récurrente, tout en cherchant à améliorer la qualité de ses prévisions (ventes, volatilité des marchés, 
corrélation d'actifs, etc.) et l'identification des composantes non aléatoires des phénomènes. Il convient de 
se rappeler des 4 critères suivants: 


1. Les prévisions sont très généralement inexactes. Il faut donc un écosystème robuste pour réagir 
rapidement à l'imprévu (savoir que l'on ne peut pas prévoir, ne signifie pas que l'on ne peut pas tirer profit 


de l'imprévisibilité). 


2. Une bonne prévision est plus qu'une valeur numérique. Puisque les prévisions sont généralement 
inexactes, une bonne prévision doit également inclure une mesure de l'erreur anticipée pour la prévision 
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3. Les prévisions agrégées sont plus précises. De manière générale, nous remarquons que l'erreur faite 
pour la prévision de ventes d'une ligne de produits est généralement moindre que l'erreur faite dans la 
prévision de ventes d'un seul élément. 


4. Les prévisions à long terme sont moins précises. Il n'y a pas grand-chose à en dire car c'est intuitif... 


5. Les prévisions peuvent être sensibles aux conditions initiales (pensez aux modèles chaotiques de la 
météorologie ou de la dynamique des populations.) 


Remarque: Les exemples de cas où de grands dirigeants de multinationales ont, faute de connaissances 
statistiques ou mal conseillés par des gestionnaires non statisticiens/non économistes, fait des 
prévisions de bénéfices ou ventes sur plus de 10 à 20 ans (ce qui est une aberration!!) dans les médias 
sont légion! Évidemment les chiffres donnés et la stratégie de développement associée ont conduit 
certaines de ces multinationales à la quasi-catastrophe. 


Signalons que les techniques prévisionnelles quantitatives utilisent également et principalement les outils 
suivants (il est bien évidemment possible de les combiner) pour lesquels nous avons déjà donné des 
exemples dans les chapitres respectifs: 


- Marche aléatoire simple ( ) 

- Régression linéaire simple ( iques) 

- Régression linéaire multiple ( ) 
- Régression logistique (« ) 

- Interpolation polynomiale (cf. cha ues) 

- Linéarisation logarithmique et exponentielle ( ) 
- Modélisation par mouvement brownien ( ) 

- Moyenne Mobile ( ) 

- Analyse de corrélations (cf. ) 

- Cartes de contrôle (cf. ) 

- Réseaux de neurones ( ) ) 


et ils peuvent être regroupés en deux familles principales: 
1. Les modèles causes-effets basés sur plusieurs variables explicatives 
2. Les modèles en série chronologique dont la seule variable explicative est le temps 


et c'est toujours délicat pour un prévisionniste de choisir laquelle est la mieux adaptée à son cadre de 
travail et au niveau de compréhension de ses supérieurs. La partie intéressante du métier est qu'une fois le 
ou les modèles choisis (encore faut-il choisir parmi la centaine de modèles empiriques publiés...), nous 
pouvons les confronter aux données statistiques passées de l'entreprise et voir si les prévisions sont en 
accord avec ce qui c'était réellement passé. 


Remarque: Il est préférable d'utiliser des modèles basés sur les statistiques que des modèles 
déterministes qui sont de piètre qualité (comme la moyenne mobile simple ou double ainsi que les 
lissages exponentiels et régressions linéaires simples ou multiples). 
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8.1: TYPES D'ERREURS 


Avant de construire des modèles de prévision il faut pouvoir estimer la qualité de celle-ci (à des fins de 
comparaison aussi entre modèles) et pour cela il est d'usage d'utiliser plusieurs indicateurs empiriques qui 
sont: 


- "L'erreur prévisionnelle": 
e, =F, —?, (66.698) 
qui est donc la différence entre le réel et la modélisation. 


- "L'écart-moyen" ou "biais de prévision" ("Mean Error” en anglais): 
 ._ 
ME = — € (66.699) 


qui va seulement nous dire s'il y une erreur systématique positive ou négative entre la prévision et le réel 
(car si la valeur de ME est non nulle, le modèle est biaisé). Mais comme cette valeur est souvent très petite 
(les valeurs négatives équilibrant les positives dans certains modèles) nous lui préférons la mesure d'erreur 
suivante: 


- "L'écart moyen absolu" ("Mean Absolute Deviation" ou "Mean Absolute Error” ou encore "Mean 
Forecast Error" en anglais): 


n 
MAD = MAE = MFE = 7 ke,| (66.700) 
x 


+= 


qui est la moyenne des erreurs absolues faites par le modèle de prévision sur toute la durée de celle-ci, 
sans égard au fait que l'erreur soit une surestimation ou une sous-estimation. 


- Le "carré moyen des résidus" ("Mean Square Deviation" ou "Mean Square Errors" en anglais): 


+= 


Î ñ 
MSD=MSE= Se (66.701) 
# 


LA 


qui permet de pénaliser les grandes erreurs plus que les petites puisque chaque erreur est multipliée par 
elle-même, donnant ainsi un poids plus grand aux grandes erreurs qu'aux petites erreurs. 


Le problème avec les indicateurs précédents est que l'amplitude de l'erreur dépend des amplitudes des 
valeurs analysées. Pour éviter cet inconvénient, il est plus intéressant de travailler avec un pourcentage 
(valeur relative). Ainsi, nous définissons "l'erreur relative" indiquée en pourcents ("Percentage Error” en 
anglais) par: 
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qui est donc la différence en pourcents entre le réel et la modélisation par rapport au réel. Il s'ensuit alors 
"l'erreur relative moyenne" ou "biais relatif de prévision" ("Mean Percentage Error" en anglais) toujours 
indiquée en pourcents: 


Pour les mêmes raisons que l'indicateur ME nous lui préférons la mesure d'erreur suivante. 


- "L'écart relatif moyen absolu" ("Mean Absolute Percentage Error" en anglais) toujours indiqué en 
pourcents: 


MAPE = LS 1ps | 
# 


t=1 
Le seul problème avec les indicateurs relatifs c'est lorsque la série temporelle analysée contient des zéros.…. 


Enfin, pour clore cette partie concernant les indicateurs, signalons que dans le domaine du prévisionnel il 
faut aussi vérifier sur le long terme si un modèle théorique est viable ou non pour le remplacer par un 
autre. Les techniques de base pour cela consistent à faire usage des cartes de contrôles autocorrélées ( 

ch ) où les mesures seront simplement les écarts (sans en prendre la valeur 
sbsoluël) entre les valeurs projetées et ce qui a réellement eu lieu. 


8.2. DÉCOMPOSITION 


Certains modèles utilisant les séries chronologiques sont des outils de prévision adéquats pour autant que 
la variation ait montré un patron stable dans le temps et que les conditions dans lesquelles le patron est 
apparu s'appliquent toujours. 


Parfois, un patron n'est pas apparent lors de l'analyse des données brute; celles-ci peuvent toutefois être 
décomposées de manière à révéler des patrons qui facilitent la projection des données dans le futur (nous 
verrons la décomposition par transformée de Fourier plus loin). Voici les quatre composantes généralement 
reconnues (et déjà mentionnées plus haut) pour les séries chronologiques hors analyse spectrale: tendance 
(linéaire, exponentielle, sigmoïde, etc.), saisonnalité, cyclicité, aléatoire. 


Voyons cela avec un exemple pratique utilisant (pour faire simple) la version française de 

Microsoft Excel 14.0.6123. Créons une composante aléatoire basée sur la valeur absolue d'une loi normale 
de moyenne 10 et d'écart-type 20 et ce sur une période de 32 mois avec la formule suivante dans la 
colonne B (de B1 à B32): 


=ABS(LOINORMALE.INVERSE.N( 
ALEA.ENTRE.BORNES(0.1;10000)/10000;10;20)) 


où la colonne A contiendra la numérotation des périodes allant de 1 à 32 (de A1 à A32). 


Ce qui donnera une simulation d'un graphique aléatoire dont nous allons fixer les valeurs. Par exemple: 
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COMPOSANTE ALÉATOIRE 


0 + 
0 10 20 30 


Figure: 66.64 - Tracé d'un exemple de la fonction aléatoire avec Microsoft Excel 14.0.6123 


Ensuite, ajoutons une composante de tendance (drift) linéaire de pente 4 et d'ordonnée à l'origine de 20 à 
cette composante aléatoire de manière à avoir cette fois dans la colonne B la formule suivante: 


=ABS(LOI.NORMALE.INVERSE.N( 
ALEA.ENTRE.BORNES(0.1:10000)/10000:10;20))+(4*A1+20) 


La somme donnant graphiquement: 


SOMME COMP. ALÉA+LINÉAIRE 


20 
Û T T T T 
0 10 20 30 


Figure: 66.65 - Tracé de la somme de la fonction aléatoire et la tendance avec Microsoft Excel 14.0.6123 


Ajoutons maintenant une composante saisonnière de type sinusoïdale avec une amplitude de 50 et une 
période de 12 mois et sans déphasage: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


COMPOSANTE SAISONNIFRE 


Figure: 66.66 - Tracé de la partie saisonnière seule avec Microsoft Excel 14.0.6123 
La somme des trois composantes donnera dans la colonne B: 


=ABS(LOI.NORMALE.INVERSE.N( 
ALEA.ENTRE.BORNES(0.1:10000)/10000:10;20))+(4*A1+20) 
+50*SIN(A1*2*PI()*1/12) 


et graphiquement cela donne: 


__. SOMMECOMR 
ALEFA+LINEAIRE+SAISONNIERE 
250 
200 
150 
100 
50 
Û T T T T 
(: 10 20 30 


Figure: 66.67 - Tracé de la somme de la fonction aléatoire, la tendance et la saisonnalité avec Microsoft Excel 14.0.6123 


et enfin ajoutons une composante cyclique qui sera encore une fois pour l'exemple une fonction 
sinusoïdale d'amplitude 20 et de période 64: 
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COMPOSANTE CYCLIQUE 


25 


Û L T T T 
0 10 20 30 


Figure: 66.68 - Tracé de la partie cyclique seule avec Microsoft Excel 14.0.6123 


La somme des quatre composantes donnera dans la colonne B: 


=ABS(LOI.NORMALE.INVERSE.N( 
ALEA.ENTRE.BORNES(0.1;10000)/10000;10;20))+(4*A1+20) 
+50*SIN(A1*2*PI()*1/12)+ 20*SIN(A1*2*P1()*1/64) 


et graphiquement cela donne: 


SOMME TOUTES COMPOSANTES 
250 


200 


(il T T T T 
0 10 20 30 


Figure: 66.69 - Somme des toutes les composantes avec Microsoft Excel 14.0.6123 


Maïntenant, comme nous l'avons introduit en détail dans le chapitre de Suites Et Séries, faisons une 
transformée de Fourier rapide (analyse spectrale) - abrégée TFR - avec l'Utilitaire d'Analyse de données 
intégré dans Microsoft Excel 14.0.6123. Cela nous donne alors: 
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Somme Aléa+Lim+Sais+Cye Cal 
1 54.15 3905.71268156154 3905.7127 
2 82.43 -118.965404756721+715.83847960268% 725.6566 
3 11798 205.123779910172+553.6075143219721 590.3872 
4 87.64 -517.526534512484-322817654253957 60995488 
5 79.94 -57.2052383800352-12.8708650198023i 58.6353 
6 9136 -999428098103601+120.8119324209661  156.79314 
7 7904 -720218228963377-50.04076307556681 87.699606 
8 33.69 -32.1476861984657-49.739080603281% 59.223727 
9 3104 -157914952894831-52.545031644511 11 1664275 
10 4207 -78.2534115089101+84.55507413654121 11520919 
11 80.91 -80.1174542237266+1583692095175641 81.667708 
12 93.67 -80.5978065119414+7424386122977221  109.58174 
13 118.54 -427997832944269-77.67396392618471 88.685208 
14 154.22 48.2069000063986+14.65178971066561 50.384324 
15 179.25 -48.2578811831555-34.20257401380521 59.149296 
16 170.61 67.2921055723724+62.0011087526294i 91.500628 
17 155.64 -42.6708876842777 42.670888 
18 186.39 67.2921055723718-62.00110875262981 91.500628 
19 116.27 -48.2578811831558+34.2025740138054 59.149296 
20 11141 48.206900006399-14.65178971066621 50.384324 
21 72.55 -42.7997832944267+7767396392618461 88.685208 
22 8245 -80.5978065119415-742438612297724  109.58174 
23 11680 -80.1174542237267-15836920951756l1 81.667708 
24 146.69 -78.2534115089099-84.55507413654l1 115.20919 
25 177.57 -157.914952894831+52.545031644511 11 1664275 
26 209.24 -32.1476861984655+49.73908060328081 59.223727 
27 19099 -72.0218228963379+50.0407630755671 87.699606 
28 206.25 -999428098103598-120.811932420965  156.79314 
29 19737 -57.2052383800352+12.870865019802%1 58.6353 
30 165.20 -517.526534512483+3228176542539581 60995488 
31 163.48 205.12377991017-553.6075143219731 590.3872 
32 11087 -118.965404756723-715.83847960268 725.6566 


Figure: 66.70 - Tableau de la TFR avec l'Utilitaire d'analyse de Microsoft Excel 14.0.6123 


Mais à la différence du chapitre de Suites Et Séries, nous allons cette fois-ci tracer le spectre de fréquence. 
Pour cela, nous créons d'abord une colonne avec une numérotation allant de 0 à 31 et juste à côté nous 
mettons la formule visible dans la capture ci-dessous 
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Fréquences 


0 
=E3*(NB($B$2:$B$33)($4$33-$4$2))/32 
=E4*(NB($B$2:$B$33)($4$33-$4$2))/32 
=ES*(NB($B#$2:$B$33)($49$33-$4$2))/32 
=E6*(NB($B#$2:$B$33)($49$33-$4$2))/32 
=E7*(NB($B#$2:$B$33)($49$33-$4$2))/32 
=E8*(NB($B#$2:$B$33)($49$33-$4$2))/32 
=E9*(NE($E$2:$B$33)($4$33-$4$2))/32 
=E10*(NB($E$2:$5$33)($49$33-$4$2))/32 
9 =Ell“(NB($B$2$B#35)($4933-$4$2))/32 
10 =E12*(NB($B$2:$B$33)($4$33-$4$2))/32 
11 =El3*(NB($B$2$B535)($4933-$4$2))/32 
12 =El4*(NB($B$2#$B$35)($4$33-$4$2))/32 
13 =E1S*(NB($B$2#$B$35)($4933-$4$2))/32 
14 =El6*(NB($B$2$B$35)($4$33-$4$2))/32 
15 =El17*(NB($B$2#$B$35)($4933-$4$2))/32 
16 =E18*(NB($B$2:$B$35)($4$33-$4$2))/32 
17 =E19*(NB($B$2:$B$33)($4$33-$4$2))/32 
18 =E20*(NB($B$2:$B$33)($4$33-$4$2))/32 
19 =E21*(NB($B$2:$B$33)($4$33-$4$2))/32 
20 =E22*(NB($B#$2:$B$33)($4$33-$4$2))/32 
21 =E23*(NB($B$2:$B$35)($4$33-$4$2))/32 
22 =E24*(NB($B$2:$B$35)($4$33-$4$2))32 
23 =E2S*(NB($B$2:$B$35)($4$33-$4$2))/32 
24 =E26*(NB($B#$2:$B$35)($4933-$4$2))/32 
25 =E27*(NH($B#$2:$B535)($4$33-$4$2))/32 
26 =E28*(NB($B#$2$B535)($4$33-$4$2))/32 
27 =E29*(NB($B#$2$B$35)($4933-$4$2))/32 
28 =E30*(NB($B#$2:$B$33)($4$33-$A$2))/32 
29 =E3l*(NB($B$2:$B$35)($4$33-$4$2))/32 
30 =E32*(NB($B$2:$B$35)($4$33-$4$2))/32 
31 =E33*(NB($B$2:$B$35)($4$33-$4$2))32 
Figure: 66.71 - Formules pour obtenir les fréquences dans Microsoft Excel 14.0.6123 


D un Un B L'D  © 


ce qui donne: 
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D E E ( 


o 


Ca ñ Fréquences Pérnode 
39057127 0 - 

7256566 1 0.03 31.00 
5903872 2 0.06 15.50 
60995488 3 0.10 10.33 
586353 4 0.13 7.75 
156.79314 5 0.16 6.20 
87.699606 6 0.19 5.17 
59223727 7 0.23 4.43 
1664275 8 0.26 3.88 
11520919 9 0.29 3.44 
81.667708 10 0.32 3.10 
109.58174 11 0.35 2.82 
88.685208 12 0.39 2.58 
50.384324 13 0.42 2.38 
59.149296 14 0.45 2.21 
91.500628 15 0.48 2.07 
42670888 16 0.52 1.94 
91.500628 17 0.55 1.82 
59.149296 18 0.58 1.72 
50.384324 19 0.61 1.63 
88.685208 20 0.65 1.55 
109.58174 21 0.68 1.48 
81.667708 22 0.71 1.41 
11520919 23 0.74 1.35 
166.4275 24 0.77 1.29 
59.223727 25 0.81 1.24 
87.699606 26 0.84 1.19 
156.79314 27 0.87 1.15 
58.6353 28 0.90 1.11 
60995488 29 0.94 1.07 
5903872 30 0.97 1.03 
7256566 31 1.00 1.00 


Figure: 66.72 - Valeurs des fréquences de la TFR 


Soit graphiquement pour les 16 premiers points (les autres étant identiques par symétrie): 


4500 


3500 


3000 


1500 


1000 


*. + + + + + e 
010 0.20 030 0.40 050 
Figure: 66.73 - Tracé des pics de fréquence de la TFR avec Microsoft Excel 14.0.6123 
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Nous voyons donc que la transformée met en évidence une composante constante (de fréquence nulle) qui 
est très importante. Nous pouvons abusivement l'assimiler à la composante linéaire. 


Nous voyons ensuite que trois points sortent du lot avec les périodes respectives (inverse de la fréquence): 
31 mois, 15.50, 10.33. Mais nous n'allons considérer uniquement que les deux premières valeurs pour les 
associer respectivement au cycle (ayant la plus grande période par définition) et à la saisonnalité. 


Ainsi, la transformée de Fourier nous amène à considérer une tendance constante, un phénomène cyclique 
ayant une période 31 mois (alors que nous avons simulé un cycle ayant une période de 64 mois...) et un 
phénomène saisonnier ayant une période 15 mois (alors que nous en avions simulé un avec une période de 
12 mois). 


Nous voyons donc bien que ce type d'analyse a ses limites mais qu'il peut être utile en tant qu'outil d'aide à 
la décision. 


8.3. MODÈLES PRÉVISIONNELS DÉTERMINISTES 


L'analyse de séries temporelles comporte deux grandes approches: 
1. L'approche déterministe qui ne fait à la base aucunement appel aux outils statistiques 
2. L'approche statistique qui permet d'inférer sur les prévisions 


Il va de soi que la première méthode est plus simple que la deuxième mais que la deuxième inclut la 
première et est scientifiquement parlant plus acceptable puisqu'il va être possible de définir des intervalles 
de confiance. 


Ces concepts généraux étant présentés nous allons passer maintenant à la présentation de quelques 
modèles mathématiques de régression des séries temporelles. Il faut savoir à ce sujet que: 


1. Il en existe (à ma connaissance) une soixantaine 

2. Certains sont déterministes, d'autres stochastiques (ces derniers étant les meilleurs) 
3. Ils sont (à ma connaissance) tous empiriques 

4. Un logiciel comme Microsoft Excel suffit pour modéliser la majorité d'entre eux 


Voici la liste des noms des techniques les plus connues et utilisées par certaines multinationales dans la 
pratique: Moyenne Mobile, Single Exponential Smoothing (SES), Régression Logistique, Méthode 
Linéaire de Holt's, Holt's-Winters, Méthode de Brown, Stochastique Linéarisée, ARIMA, etc. 


Nous allons voir ci-dessous les démonstrations de celles qui nécessitent une démarche mathématique. Les 
autres n'étant que des boîtes à outils, elles n'ont pas leur place sur un site web tel que Sciences.ch. 


Nous allons dans ce qui suit bien évidemment nous concentrer d'abord sur les grands classiques scolaires 
de la première famille de modèles. 
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8.3.1. MOYENNE MOBILE SIMPLE (LISSAGE PAR MOYENNE MOBILE) 


La technique prévisionnelle de la moyenne mobile simple d'ordre k ou "Simple Moving Average" en 
anglais (MA) est certainement la technique empirique la plus simple et aussi la plus mauvaise en termes de 
pouvoir prédictif. Basée sur la définition de la moyenne mobile (cf. chapitre de Statistiques) elle est définie 


par: 


M- 
H 


MA(X) = Eu = i=+-k+l 


| 


et constitue donc une prévision déterministe portant uniquement sur une unique période ultérieure. 


Voyons un exemple avec la version anglaise de Microsoft Excel 11.8346 comportant une prévision sur 
l'horizon d'un mois avec des modèles de lissage par moyenne mobile dans les colonnes D et E (comme le 
domaine de la finance est essentiellement en anglais nous ferons toutes les captures avec la version 


anglophone du logiciel): 


3. Mois Périodes  F; 

LAN Janv 1 200 
LE Févr 2 135 
MEN Mars 3 195 
Avr 4 197 
MEN Ma 5 310 
VON Juin 6 175 
MIO Jui 1 155 
MIN Août 8 130 
Sept 9 220 
13] Oct 10 277 
M4, Nov 11 235 


Ü 
Lui 
Le] 
ni 
Le 


Figure: 66.74 - Tableau de base pour l'exemple du lissage MA dans Microsoft Excel 11.8346 


Avec donc les relations suivantes: 


(66.705) 


M6) M6) 

176.7 

175.7 

2340 207.4 
227.3. 202.4 
213.3 206.4 
153.3, 193.4 
168.3 198 
209.0 1914 
244.0) 203.4 
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Janv 1 200 

Févr 2 135 

Mars 3 195 

Avr 4 197 =AVERAGE(C4:C6) 
Ma 5 310 =AVERAGE(CS5:C7) 

Jun 6 175 =AVERAGE(C6:C8) =AVERAGE(C4:C8) 
Jul 7 155 =AVERAGE(C7:C9) =AVERZAGE(CS5:C9) 
Août 18 130 =AVERAGE(CS8:C10)  =AVERAGE(C6:C10) 
Sept 9 220 =AVERAGE(CS9C11) =AVERAGE(C7C11) 
Oct 10 1277 =AVERAGE(CI0:C12) =AVERAGE(CS8:C12) 
Nov 11 1235 =AVERAGE(C11C13) =AVERAGE(C9:C13) 

Déc 112 =AVERAGE(C12:C14) =AVERAGE(C10:C14) 


Figure: 66.75 - Formules pour obtenir les lissages MA(3) et MA(5) avec Microsoft Excel 11.8346 


et le graphique correspondant: 


—+— Yi —— MA (3) —+— MAO) 


Figure: 66.76 - Tracé des observations et des deux lissages avec Microsoft Excel 11.8346 


Nous n'avons pas utilisé l'outil d'Utilitaire d'analyse de Microsoft Excel 11.8346 (ce dernier intégrant un 
outil faisant automatiquement les calculs de la moyenne mobile) uniquement pour bien montrer au lecteur 
l'application explicite des relations mathématiques données plus haut. 


Le choix du nombre de périodes k à utiliser dans le calcul de la moyenne mobile simple dépend beaucoup 
des variations attendues dans les données. Ceci peut être illustré par deux caractéristiques de la prévision: 
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- Stabilité: En faisant la moyenne de plusieurs périodes, on atténue les fluctuations aléatoires afin que la 
prévision soit plus stable. La stabilité est la propriété de la prévision à ne pas fluctuer de manière 
désordonnée. Gagner en stabilité est un avantage s'il y a beaucoup de fluctuations aléatoires dans les 
données. Une moyenne mobile gagnera en stabilité si un plus grand nombre de périodes est utilisé dans le 
calcul de la moyenne. Un gain en stabilité est désirable seulement jusqu'au point où les fluctuations 
aléatoires sont atténuées. Si le nombre de périodes utilisées dans le calcul de la moyenne est trop grand, la 
moyenne sera tellement stable qu'elle ne répondra que trop lentement aux changements non aléatoires de 
la demande. 


- Réactivité: La réactivité est la propriété qu'a la prévision à s'ajuster rapidement à un changement dans le 
niveau moyen réel de la demande. L'utilisation d'une prévision réactive est appropriée dans le cas où les 
fluctuations aléatoires sont faibles. Plus le nombre de périodes utilisées dans le calcul de la moyenne 
mobile est petit, plus le modèle prévisionnel sera réactif. 


Remarque: Signalons que certaines techniques de prévision font des moyennes mobiles de moyennes 
mobiles. Dans la littérature spécialisée, cela s'appelle la "moyenne mobile double". Il y a encore des 
modèles qui appliquent des poids empiriques aux périodes passées, cela s'appelle la "moyenne mobile 
pondérée" et c'est à mon avis hors d'intérêt. 


8.3.2. MODÈLE LINÉAIRE AVEC COEFFICENTS SAISONNIERS 


La technique prévisionnelle linéaire avec coefficients saisonniers est simple à mettre en place et à 
comprendre. Elle associe une simple régression linéaire (cf. cha ( Numériques) et des 
coefficients saisonniers calculés sur la base des valeurs passées par rapport au modèle linéaire. Cette 
technique permet de dégager des tendances en lissant des séries chronologiques et en faisant apparaître 
des variations importantes dans le temps. Les moyennes mobiles sont des moyennes généralement 
calculées pour des données journalières ou hebdomadaires et qui sont ensuite décalées période par 
période. 


Voyons donc un exemple toujours avec Microsoft Excel 11.8346: 
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À 
N° Mois Ventes 
1 Janvier 1987 890.00 
2 Février 1987, 1115.00 
3 Mars 1987 1280.00 
4 Avri 1987, 1328.00 
1 Mai 1987) 1253.00 
6 Juin 1987 1124.00 
7 Juilet 1987, 1192.00 
8 Août 1987) 876.00 
9 Septembre 1987, 1'401.00 
MM 10, Octobre 1987 1'501.00 
124 11 Novembre 1937 1'065.00 
13N 12 Décembre 1937 976.00 
141 13 Janvier 1988 895.00 
15N 14 Février 1988! 1'179.00 
16N 15 Mars 1988 1'315.00 
12 16 Avril 1988) 1'452.00 
18! 17 Mai 1988) 1'325.00 
19N 13 Juin 1938 1202.00 
20! 19 Juilet 1988, 1175.00 
20 20 Août 1988) 933.00 
224 21 Septembre 1988, 1'412.00 
234 22 Octobre 1988) 1'528.00 
241 23 Novembre 1988 1171.00 


25 24, Décembre 1988 1012.00 
Figure: 66.77 - Valeurs de départ dans Microsoft Excel 11.8346 pour l'exemple 


Ce qui ressemble à: 


1300 
1600 
1400 
1200 
1000 

800 


0 1 23 4 5 6 7 8 9 1011 12 13 1415 16 17 13 19 20 21 22 23 24 


—+— Ventes 


Figure: 66.78 - Graphique des ventes correspondant dans Microsoft Excel 11.8346 
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La première chose à faire est de déterminer l'équation de la droite de régression (ce qui permet donc in 
extenso de faire aussi de l'inférence!). Ce qui est simple avec la méthode des moindres carrés démontrée 
dans le chapitre de Méthodes Numériques et extrêmement simple à obtenir avec les outils automatiques 
intégrés à Microsoft Excel 11.8346: 


1600.00 


y = 4.2713x+ 11383 


1500.00 
1'400.00 
1300.00 
1200.00 
1'100.00 
1'000.00 


900.00 


800.00 


—+— Ventes Linear (Ventes) 


Figure: 66.79 - Régression linéaire des ventes avec équations dans Microsoft Excel 11.8346 


Ce qui nous permet d'avoir deux nouvelles colonnes dans le tableau Microsoft Excel 11.8346. Une avec 
les valeurs du modèle linéaire et une autre avec le rapport entre les valeurs réelles et le modèle linéaire (ce 
qui correspond donc au coefficient saisonnier): 
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A B C D E 
1 [N° Mois Ventes Modèle Linéaire Coeff. 
D | Janvier 1937, 890.00 1142.57 | 0.78 
D 2 Février 1987, 1115.00 1146.84 | 0.97 
4 3 Mars 1987 1280.00 LIST TE 
5.| 4 Avril 1987, 1328.00 1155.39 | 1.15 
GE 5 Mai 1987  1'253.00 1159.66 | 1.08 
D 6 Juin 1987 1'124.00 1163.93 | 0.97 
8! 7 Juilet 1987) 1192.00 1168.20 | 1.02 
| 3 Août 1987 876.00 1172.47 | 0.75 
10) 9 Septembre 1987 1'401.00 1176.74 | 1.19 
MM 10 Octobre 1987  1'501.00 l'I8L01| 12 
124 11 Novembre 1987 1'065.00 1185.28 | 0.90 
194 12 Décembre 1987 976.00 1189.56 | 0.82 
141 13 Janvier 1938/ 895.00 1193.83 | 0.75 
15) 14 Février 1988) 1'179.00 1198.10 | 0.98 
161 15 Mars 1988 1'315.00 1202.37 | 1.09 
12) 16 Avril 1988 1452.00 1206.64 |: 1.20 
18\ 17 Mai 1988  1'325.00 1210.91 | 1.09 
19 13 Juin 1988) 1'202.00 1215.18 | 0.99 
20! 19 Juillet 1988 1175.00 1219.45 | 0.96 
21 20 Août 1988) 933.00 1223.73 | 0.76 
221 21 Septembre 1988) 1'412.00 1228.00 | 1.15 
231 22 Octobre 1988) 1'528.00 1232.27 | 1.24 
244 23 Novembre 1988) 1'171.00 1236.54 | 0.95 
25 24 Décembre 1983) 1'012.00 1240.81 | 0.82 


Figure: 66.80 - Report du modèle théorique avec rapport réel/modèle dans Microsoft Excel 11.8346 


Nous faisons ensuite une prévision sur la base de la régression linéaire multipliée par la moyenne des 
coefficients saisonniers de chaque mois. Ce que nous noterons dans le cas présent: 


FR ={a.f +b}.c a 121 (66.706) 


Il s'agit donc d'une méthode déterministe permettant de faire de la prévision sur autant de périodes 
ultérieures que désirées avec la possibilité de faire de l'inférence statistique si besoin est (c'est le seul 
modèle déterministe sur lequel l'inférence est directement possible). 


8.3.3. LISSAGE EXPONENTIEL SIMPLE 


La prévision Æ fournie par la méthode de lissage exponentiel (E WMA pour "Exponential Weighted 
Moving Average" ou SES pour "Simple Exponential Smoothing" en anglais), appelée aussi "moyenne 
mobile exponentielle pondérée", avec la "constante de lissage" $#e 10, 1] est donnée comme nous allons le 


démontrer plus loin par: 
t-l 


Fa =(1-8)> SH (66.707) 
En] 
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Cette définition repose sur une idée simple (mais néanmoins totalement empirique): nous supposons que 
les observations influencent d'autant moins la prévision qu'elles sont éloignées de la date t pour laquelle 
nous faisons la prévision et que cette influence décrofît exponentiellement. Nous voyons alors assez 
facilement dans un premier temps que: 


- Plus la constante de lissage est proche de 1, plus l'influence des observations passées remonte loin dans 
le temps et plus la prévision est rigide, c'est-à-dire peu sensible aux fluctuations conjoncturelles. 


- Au contraire, plus la constante de lissage est proche de zéro, plus la prévision est influencée par les 
observations récentes (prévision souple). 


Démontrons dans un tout premier temps que la définition précédente s'écrit sous une autre forme moins 
technique qui est la plus commune dans les livres de statistiques: 


t—l +-l 


Ea=(1-8)> 84 =(1- 8 D EP +(1- BIT, (66.708) 


i=0 i=l 
et nous avons aussi in extenso: 
#2 
EF =(1-8)5 #14 (66.709) 
= 


Dès lors si nous réindexons la somme: 


+ t1-1 
Eu =il- 815 E3, +(1- 8)X =(1- 6) DE r+i1- Br 


i=l 10 
S 4 . (66.710) 
=(i- 8 £8TEi ti 8ik = 801-881 +1- 817, 
i=Ù 3=0 
= BP, +(1- 6)F, 


La prévision Æ,, apparaît donc comme une moyenne pondérée entre la prévision Æ faite à la date t et la 
dernière observation FX, le poids donné à cette dernière observation étant d'autant plus fort que la 
constante de lissage est faible. 


En pratique, le choix de la constante de lissage est souvent fondé sur des critères subjectifs de rigidité ou 
de souplesse de prévision. Il existe cependant une méthode plus objective qui consiste à déterminer des 
outils de recherche opérationnelle (cf. chapitre de Méthodes Numériques), la constante qui minimise la 
somme des carrés des erreurs de prévisions. 


Attention!!! Dans la majorité des ouvrages de statistiques contemporains, la constante de lissage est 
définie comme étant: 


A=1- 8 (66.711) 


Il vient alors: 


+-l 


An=ADQ-Ær.=(-2A +4 =E+AR-EÆ) (6.712) 


0 
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écriture qui amène à considérer le lissage exponentiel simple comme une bête moyenne mobile pondérée. 


L'une et l'autre des écritures sont bien sûr équivalentes mais il faut sur certains logiciels faire attention de 
bien savoir à laquelle des deux constantes de lissage nous avons affaire. Nous allons continuer 
personnellement avec cette dernière forme pour la suite de nos développements. 


Maïntenant, repartons de la relation précédente pour l'écrire sous une autre forme en utilisant la 
récursivité: 
Fu = AP +0 A)F = AP +(1- 4) 47, +(1- 4)F,) 


t 


t-1 . (66.713) 
= >, A(- 4ŸF,, |+(- AY A 
i=0Û 


Montrons maintenant que la somme des poids est égale à l'unité afin de constater qu'il s'agit bien d'une 
pondération. Nous avons donc: 


t-l t-l t-l 
b Aû- x) +(1- 4ÿ = D (- »'}ra- A) = D s}ro- AŸ (66.714) 
2=0 = 10 


Nous avons démontré dans le chapitre de Suites Et Séries que: 


S =1 E (66.715) 


Il vient alors dans notre exemple: 


+ {1-9 
Si =üp 14 LIr = 1=(Z 2) (66.716) 
1-3 1x  1-i1- 4: 


Donc: 


cs 1-(1-4Ÿ 
AÏS À |+Q0-2ÿ = 4— 2 +0 4) 
ar 1—-i1- 4: . 
(66.717) 
1=(1-4) | ; | 
= +2) =1- (1-2) + (2) =1 


Enfin, parlons de l'origine du nom de cette technique. Nous avons donc: 


Fu =Q- A8 +4F =(-2)[(- 2)8 +47 ]+4r 
= (1- 2) Fu +A1- 4)}, 1 +47, 

= (1-4) [(- 2), +4%2]+40- 2)" +47 

= (1-2) 8, +40 AY 7. +40 0% +47 =. 


(66.718) 


Nous y retrouvons: 
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A 4) ,A(1- 4), 4 (66.719) 


et comme 1-— 4 est strictement inférieur à l'unité, les facteurs {1- 4)" décroissent de manière 


exponentielle (il suffit de représenter graphiquement la fonction): 
f()=(1-4)" (66.720) 
pour le constater avec » € N. 
Ceci étant fait, parlons du problème des valeurs initiales. Nous avons donc: 
BE = AR +il-AiA = AR +A-AÀA (66.721) 

Il est alors de convention de prendre: 

H=X# (66.722) 
Ce qui nous donne: 

FE = K (66.723) 
Raison pour laquelle un logiciel comme Microsoft Excel 11.8346 nous retournera pour Æ l'erreur #N/A. 


Pour la suite il est nécessaire que nous étudiions l'origine de l'expression du lissage exponentiel simple. 
L'idée à la base des mathématiciens était de réduire l'erreur entre la valeur réelle F,_; et la prévision 


considérée comme constante a: 
+-l 


E = 5" 1 
J=Ù 


3j = 4] (66.724) 


mais le but était aussi d'affaiblir les erreurs plus petites que l'unité et d'amplifier celles qui en étaient plus 
grandes en élevant les écarts au carré tels que: 


E=S (F_;—al (66.725) 


et enfin de pondérer celles qui étaient éloignées dans le temps de la prévision par un coefficient tel que 
nous ayons à minimiser au final: 
#1 2 
E = > 8° | F_;-a| (66.726) 
j— 


En prenant la dérivée de E par rapport à a, et en l'annulant il vient: 


t-l 
= 25 #(F,-a]=0 (66.727) 
F4 
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Nous obtenons alors pour £ # 1 : 


et donc au final: 


a = FE; (66.729) 


1=8< S'8 
1-6 5 
et pour t grand il vient: 


t-1 
az(1- 85 8°; (66.730) 
3=0 


Nous retrouvons donc la relation définie au début de l'étude de ce modèle et qui était: 


+ 


Fu ={1- BTS EE, =(1- BTS 8° Fu = (- E +8FÆ, (66.731) 
i=0 is] 


Il est à noter qu'il n'est pas du tout évident que la constante recherchée qui minimise l'erreur puisse être 
utilisée comme fonction de prévision. Cependant c'est l'usage qu'il en est fait par de nombreux praticiens. 
Certains spécialistes préfèrent noter ce dernier résultat sous la forme (il ne faut pas chercher à trop 
comparer cette notation avec celle de la relation précédente): 


S, = (1- SE + 88, = À, +i1- 418, (66.732) 


où S fait référence au "S" qu'il y a dans le mot "eStimé". Il y a même des logiciels de statistiques qui 
proposent à notre étonnement de faire une prévision à un temps £+x* en se basant sur cette méthode... ce 
qui nous semble un peu limite limite. (affaire à suivre). 


Remarque: Le lissage exponentiel simple a été suggéré en premier par Charles C. Holt en 1957, mais la 
formulation (forme de la relation prévisionnelle) est attribuée à Brown. Il s'agit d'une technique que 
l'on retrouve implémentée dans la quasi-totalité des logiciels de statistiques. 


Exemple: 
Nous voulons donc appliquer: 
Fu =(- 6, +8 = A7, +(1—-4)F, (66.733) 


Considérons le tableau suivant (la colonne C contient déjà le modèle mathématique dont nous allons 
détailler les formules juste après): 
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A [Ce E F 

| Période  Y4 SES  Écart relatif absolu Écart absolu 
4 1 143 143 
5 2 152 143.00 0.06 9.00 
6 3 161 143.00 0.11 18.00 
7 4 139 143.00 0.03 4.00 

5 137 143.00 0.04 6.00 
9 6 174 143.00 0.18 31.00 
10 7 142 143.00 0.01 1.00 
11 8 141 143.00 0.01 2.00 
12 9 162 143.00 0.12 19.00 
13 10 180 143.00 0.21 37.00 
14 11 164 143.00 0.13 21.00 
15 12 171 143.00 0.16 28.00 
16 13 206 143.00 0.31 63.00 
17 14 193 143.00 0.26 50.00 
15 207 143.00 0.31 64.00 
19 16 218 143.00 0.34 75.00 
20 F 229 143.00 0.38 86.00 
21 18 225 143.00 0.36 82.00 
22 19 204 143.00 0.30 61.00 
2 20 227 143.00 0.37 84.00 
24 21 223 143.00 0.36 80.00 
25 22 242 143.00 0.41 99.00 
26 23 239 143.00 0.40 96.00 
27 24 266 143.00 0.46 123.00 


28 143.00 


Figure: 66.81 - Données de départ avec modèle de lissage exponentiel dans Microsoft Excel 14.0.6123 


Nous n'allons pas utiliser l'outil d'Utilitaire d'analyse de Microsoft Excel 14.0.6123 (ce dernier intégrant un 
outil faisant automatiquement les calculs du lissage exponentiel simple) uniquement pour bien montrer au 
lecteur l'application explicite des relations mathématiques démontrées plus haut. De plus l'Utilitaire 
d'analyse de Microsoft Excel 14.0.6123 souffre d'un gros défaut: il demande la valeur de la constante de 
lissage plutôt que d'en calculer une valeur optimale automatiquement. 


Il n'y a que trois colonnes qui ont des formules, le reste étant des saisies statiques. Nous avons: 
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Périod 


k CO 
OO oO Jo LB LD) ON 


[ms] 
ne ee ee 
no yo bh  © 


19 


SES 

=P4 
=$1$3"B4+(1-$1$3)" C4 
=$1$3"B5+(1-$1$3)" CS 
=$1$3"B6+(1-$183)" C6 
=$1$3"B7+(1-$183)*C7 
=$1$3"B8+(1-$187)" C8 
=$1$3"B04+(1-$1$3)* C9 
=$1$3*B10+(1-$1$3)*C10 
=$1$3*B11#(1-$1$3)*C11 
=$1$3*B12+(1-$1$3)"C12 
=$1$3*B13#(1-$1$3)*C13 
=$1$3*B14+(1-$1$3)*C 14 
=$1$3*B15+#(1-$1$3)"C15 
=$1$3*B16#(1-$1$3)*C 16 
=$1$3*B17+(1-$1$3)"C17 
=$1$3*B18+(1-$1$3)"C 18 
=$1$3*B19+(1-$1$3)*C 19 
=$1$3*B20+#(1-$1$3)*C20 
=$1$3*B21+#(1-$1$3)*C21 
=$1$3*B22#(1-$1$3)*C22 
=$1$3*B23+(1-$1$3)"C23 
=$1$3*B24+(1-$1$3)"C24 
=$1$3*B25+#(1-$1$3)*C25 
=$1$3"B26+(1-$1$3)*C26 
=$1$3*B27+#(1-$1$3)"C27 


Écart relatif absolu  Écart absolu 


=ABS(CS-B5)E5 
=ABS(C6-Bé)Bé 

=ABS(C7-B7)/E7 

=ABS(C8-B8)BS 

=ABS(C9-B9)/R9 

=àBS(C10-B10)B10 
=àBS(C11-B11yB11 
=ABS(C12-B12)/B12 
=ABS(C13-B13/B13 
=ABS(C14-B14)/B14 
=ABS(C15-B15)B15 
=ABS(C16-B16YB16 
=ABS(C17-B17)/B17 
=ABS(C18-B18/B18 
=ABS(C19-B19)/B19 
=àBS(C20-B20)/B20 
=ABS(C21-B21)/B21 
=ABS(C22-B22)/B22 
=ABS(C23-B27)/B23 
=ABS(C24-B24)/B24 
=ABS(C25-B25)/B25 
=ABS(C26-B26)/B26 
=ABS(C27-B27)/B27 


=ABS(B5-C5) 
=ABS(B6-C6) 

=ABS(B7-C7) 

=ABS(B8-C8) 

=ABS(B9-C9) 

=àBS(B10-C10) 
=ABS(B11-C11) 
=ABS(B12-C12) 
=ABS(B13-C13) 
=ABS(B14-C14) 
=ABS(B15-C15) 
=ABS(B16-C16) 
=ABS(B17-C17) 
=ABS(B18-C18) 
=ABS(B19-C19) 
=ABS(B20-C20) 
=ABS(B21-C21) 
=ABS(B22-C22) 
=ABS(B23-C23) 
=ABS(B24-C24) 
=ABS(B25-C25) 
=ABS(B26-C26) 
=ABS(B27-C27) 


Figure: 66.82 - Formules correspondantes au modèle de lissage exponentiel simple 
avec Microsoft Excel 14.0.6123 


où le lecteur attentif aura remarqué la prévision à la ligne 28 sur un horizon de un mois. 


Avec un peu plus loin dans la feuille les valeurs indispensables à l'optimisation du modèle avec le solveur 


que nous allons de suite voir: 


Maïntenant, nous allons utiliser le solveur pour minimiser soit l'erreur MAPE, soit l'erreur MAD ou enfin 


À: 
Paramètre de lissage: =1-13 


MAPE: =ÉVERAGE(ES:E27) 


MAD: =AVERAGE(F5:F27) 


M$SD: =EUMK(F5:F27)*(F5:F 27) COUNT(F 5 F 27) 
Figure: 66.83 - Constante de lissage et indicateurs d'erreur pour optimiser le modèle 
avec Microsoft Excel 14.0.6123 


l'erreur MSD. Nous avons alors par exemple en minimisant l'erreur MAPE: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Rendre les varisbles sans contrainte non négatives 

Sélect. une résolution : GRG non inéaire 

Méthode de résolution 

Sélectionnez le moteur GRG non inéaire pour des problèmes non linéaires de solveur. 


Sélectionnez le moteur Simplex PL pour les problèmes inéaires, et le moteur Évolutionnaire pour les 
problèmes complexes. 


Figure: 66.84 - Paramétrage du solveur avec Microsoft Excel 14.0.6123 


Ce qui donne le résultat suivant: 


2:  0.64447 
Parametre de lissage: 0.355353 


MAPE: 7.89% 
MAD: 14.71 


MSD: ME 
Figure: 66.85 - Solution proposée par le solveur de Microsoft Excel 14.0.6123 


Soit graphiquement: 
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190 


——YŸt ——$SE#S 
Figure: 66.86 - Tracé de la comparaison des observations et du modèle SES avec 
Microsoft Excel 14.0.6123 (sans la prévision) 


et donc le tableau de valeurs devient: 


Ye SES  Écart relatif absolu Écart absolu 


4 l 143 143 
5 2 152 143.00 0.06 9.0û 
6 3 161 148.80 0.08 12.20 
7 4 139 156.66 0.13 17.66 
8 5 137 145.28 0.06 8.28 
g 6 174 139.04 0.20 34.06 
7 142 161.89 0.14 19.89 
11 8 141 149.07 0.06 8.07 
12 9 162 143.87 0.11 18.13 
13 10 180 15393 0.14 24.45 
14 11 164 171,31 0.04 4:31 
15 12 171 166.60 0.03 4.40 
16 13 206 169.44 0.18 36.56 
17 14 193 193.00 0.00 0.00 
1 15 207 193.00 0.07 14.00 
19 16 218 202.02 0.07 15.98 
20 17 229 212.32 0.07 16.68 
21 18 225| 223.07 0.01 1.93 
22 19 204 224.31 0.10 20.31 
2 20 déil. 4112 0.07 15.78 
24 21 223 221.39 0.01 1.61 
25 42 242 222.43 0.08 19.57 
26 23 239 235.04 0.02 3.96 
27 24 266 237.59 0.11 28.41 
2: 255.90 


Figure: 66.87 - Tableau correspondant après optimisation avec le solveur dans Microsoft Excel 14.0.6123 
et nous voyons donc la prévision à la ligne 28 du tableau qui vaut: 


Fay = 255.90 (66.734) 
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Pour clore, indiquons que si nous faisons l'hypothèse forte que pour tout temps t: 


te / \ > 
Pau=ate=e + 0,07, ÿ) (66.735) 
Alors dans le cas d'une série infinie (ou supposée comme telle..): 


F(Ea)=T fa- BE Sr.) (- 8* Sex.) 


=(1- 8ÿ7 Er +} 0- 8° r[E #i0..r)) 
i 0 i0 
t-1 


à 2 ; 
=(- AL Fo ge pi 8 > 6# (66.736) 


. gar-12 
I=# 
11-28" (1- 81(1- 68* | 
1- TT 1+$ 


3 1 , | 
= 0 gll- À Z# =, gll- 6) 


Or, comme £e |0,1[ et si t est suffisamment grand, il vient: 


: et 
ViFal= Op ET Ep É- Dr (66.737) 
et considérons l'erreur: 
e(t)=E-F, (66.738) 
Nous avons sous l'hypothèse que les deux termes soustraits sont indépendants...: 
ACOIET APT ET AP AETA PME AT AE AT 
(66.739) 


= 07 5+07 7" (EE 
SE à 2— À 2— À 


Il s'ensuit sous l'hypothèse de Normalité (ce qui est le cas depuis le début de ce développement) et que 


Fest l'espérance de F : 


et dons sous l'hypothèse que la variance est parfaitement connue, il vient: 
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VHC EREPOEIR [SCIENCES.CH] 
: 
FREE +Z,n0 ÿ 5-7 (66.741) 


Mais si l'écart-type est seulement estimé, il faut évidemment utiliser la loi de Student (cf. chapitre de 
Statistiques): 


—— (66.742) 


Et ce sera tout en ce qui concerne le modèle de lissage exponentiel simple. 
8.3.4. LISSAGE EXPONENTIEL DOUBLE À UN PARAMÈTRE (MÉTHODE DE BROWN) 


L'idée du lissage exponentiel double (DEBS: "Double Exponential Brown Smoothing" en anglais) est à 
nouveau de réduire l'erreur totale mais cette fois-ci en utilisant non pas une simple constante mais une 
droite au voisinage de t telle que: 


+-l 
; 2 
E= 8 (%;-laj+h)l (66.743) 
j= 


ce qui est écrit traditionnellement (le — est absorbé dans le paramètre a et le fait que les paramètres de la 
droite soient recalculés à chaque t est omis afin de ne pas le confondre avec l'indice de sommation..): 


t-l 
2 
E=X81k;-b +ajl (66.744) 


j— 
Pour minimiser nous différencions E: 
2E 1 
—=-2Y 8'iF_,-b+aji=0 
db pes 
j 
(66.745) 
2E t-l ! 
—=2  j# IT, -b+aji=0 
3=0 
d'où: 
t-l 1 +1 . 
D PK_;-bE 8 +a) 58" =0 
30 30 3=0 L 
(66.746) 
t-l  … t-l _ t-l 2 à 
DJ; -bTIE +a > j 8 =0 
30 3=0 3=0 
Simplifions tout cela en remplaçant d'abord lorsque t est grand: 
t-l 1= 1 
D Æ = ee — (66.747) 
5 = ES 
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Pour les autres, sous certaines conditions qui sont respectées dans notre cas, nous pouvons dériver terme à 
terme une série convergente pour obtenir la dérivée de celle-ci. Ainsi, étant donné que: 


d 21 t-l . 
DB = SR" (66.748) 
dé Ji 


et vu que dans les conditions susmentionnées: 


t-1 . 1 
SH =— (66.749) 


ad 
J=-0 


nous avons alors immédiatement: 


H | 1 | 1 
St ; 931 _ _ 
D i8T = = ——— (66.750). 
j=Ù d 6 1-6 (1- 8 


En multipliant par & à gauche et à droite nous obtenons au final: 


(66.751) 


qui est la deuxième simplification recherchée. 


Pour la troisième il suffit de dériver encore une fois l'égalité précédente. Nous obtenons alors: 


+-l 
Sa l 2 1-8) +2 1+ 
pps =. Pr £) ee (66.752) 
3-0 A6) (-#) (— 6) (— #6) 
Et nous terminons en multipliant à gauche et à droite par 8: 
t-l . i1+ &i 
8? nt (66.753) 
= (1— 6) 
Nous obtenons alors: 
1 #1 + . #1 ., b aË 
D'ÉT.,-bD 8 +a je = Er, - —+ ——- 
4 — LL par 1-8 1-8 
j=0 j=0 j=0 j=0 (1-81 
mi : mi : mi . E : asli+#) (66.754) 
Lit, -bE 8 +a PB = SRE, - + 
50 3=0 50 3=0 (-8) (-# 


Ce que nous pouvons écrire sous la forme: 
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#1 8 
- 85 ST, -b+a = 0 
1-8 


1 (+ 8 (66.755) 
cu i1+ 6 
(1- 6ÿ DJEF, _, —bB+a————— =0 
5=0 re l= ê 
Définissons la série lissée: 
es 
SE=i- BIS SE; = Fu (66.756) 
30 
et la série doublement lissée (d'où le nom de la technique….): 
t-j 1 
Shi=(- BE AS E-H=A- ÉTAT BA, y 
F=0 F0 par 
(66.757) 
t-11-j 1 
={l- DNA AE 
J=0 i=0 


Après le changement de variable à + j = & & —-i — j = —k nous obtenons: 


t-1 t-1 
Si£i=i1- TE (66.758) 


J=0 Re 7 


L'indice de la deuxième somme s'expliquant par le fait que k est la nouvelle variable d'indexation (donc 
elle doit forcément être dans l'indice!) et quand i est nul nous avons: 


i+j=kD0+i=kSke=) (66.759) 


Pour le suffixe de la somme il s'explique par le fait que pour la valeur maximale nous avons i=£-—;j-—1 et 
donc comme i+ ; =#, il vient si nous y substituons i: 


(£—j-1)+j=ké1t-1=84 (66.760) 
Ensuite, le lecteur vérifiera lui-même... sur papier que nous pouvons réarranger les termes de la manière 
suivante: 
#1 1 & 


St£i=i1- 81 Men =(1- NY Pe (66.761) 
328 K=0 j1 


Nous avons alors: 


t-1 & + 
Siti=t- BON AX, = 8 ŒE+DAX 
7 FAP - en . (66.762) 
= (1-8 DEBX,, +1 BD ZX = (1 BU DE BX,, +1 BIS, (41 

ki 0 


&=0 


En substituant ces résultats dans: 
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ê 
i1- &S 6E, _.—b+a = 0 
M OU 1-8 
(142 (66.763) 
ll (l 
i1— 6: 6 —b 6+a = 0 
£Ÿ Sup is bBte 
il vient: 
SÉ)-b+a LE, 
l- $ 
(66.764) 
&Bi1+ 8: 
SO (1- BIS O-bE+a— =0 


Il vient alors après simplification successives: 


_ a | — | | [= 
SO-b-ÉE Te 20-85 @- soi|-0 


1 
SO (SO -(1- 2SO -bA) = 


ee = __1, == 4 | (66.765) 
b rl S. 6) 5120 1- 818, (6) 
(1+81b-b8=i1+ 818 (6)-1S (6) 11 818 (E)) 

[+ 8-8]=11+8186)-5, 0 +1- 818) 


b=28()- 80) 
et donc aussi après simplifications successives: 


S@-b+a 0 


50-2508 +a - 


-0+50+a 20 


(66.766) 


1- 8 
= i Ê ES FA l 
F8. Si (6) 5, E) 


Résultats qu'il est d'usage de noter: 


= — MOBOIEFETOREYTOI 
b=28()-S (0 


(66.767) 


Donc: 


S; = a,j+b,| (66.768) 
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est la droite constituée d'un double lissage exponentiel qui approche au mieux (l'estimé) à un temps t les 
données réelles et qui minimise l'erreur totale. Contrairement au lissage exponentiel simple, nous pouvons 
par contre maintenant faire des prévisions (cependant cela reste un usage abusif du résultat mathématique) 
de par la présence de la variable j. 


Explicitement, cette droite s'écrira en changeant un peu les notations (ne pas oublier qu'au début nous 
avions implicitement injecté un signe négatif dans le terme a): 


À , 0 
a jt, = er En Fa lJ+l2Æn — Fu] (66.769) 


Il vient donc que notre prévision s'écrira: 


kB; = _ Ea-Eali+(2Eu-Æu) (6.770) 


Et évidemment, si nous voulons Fu , il faudra choisir ; =—1. Dès lors: 


LL À L L 
Eu = 1-3! Ben — Ra l+l2Æu — Au l] (66.771) 


Pour débuter les prévisions avec ce modèle, il faut un estimé de $,{0) et $,(0). Les premières prévisions 


seront grandement affectées par ces estimés. Il faut aussi toujours vérifier ce que les logiciels utilisent 
comme méthode de détermination pour ces premiers paramètres afin de la spécifier dans les rapports. 


Remarque: Le lissage exponentiel de Brown est rarement intégré dans les logiciels statistiques. On lui 
préfère le modèle de Holt que nous allons de suite voir après et qui le contient implicitement. 


Exemple: 


Considérons le tableau suivant dans Microsoft Excel 14.0.6123 qui contient les données observées dans la 
colonne B ainsi que le modèle dans les colonnes C à F dont nous allons détailler les formules juste après: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


ê ) G H | 
Y SESI  SES2 a Bb Projection 4+/| Écartrelatif absolu Écart absolu 


À 


4 1 14300 14300 143.00 - 143.00 143.00 
2 15200 14300 143.00 - 143.00 143.00 0.00 0.00 
6 3 16100 14555 14300 - 101 143.09 143.09 0.03 1291 
7 4 13900 14992 14372 - 245 156.12 156.12 0.12 17.12 
8 5 13700 14683 145.43 - 0353 143.18 143.13 0.08 11.18 
9 6 17400 14405 14586 072 142.24 142.24 0.18 31.76 
10 7 14200 15253 14535 - 283 15970 159.70 0.12 17.70 
11 8 14100 149.55 14733 - 086 151.71 151.71 0.08 10.71 
12 9 16200 14713 14799 034 146% 146.26 0.10 15.74 
13 10 18000 15134 147.75 - 142 15493 154.93 0.14 25.07 
14 11 16400 15945 14876 - 422 170.14 170.14 0.04 6.14 
15 12 17100 160.74 15179 - 353 169.69 169.69 0.01 1.31 
16 13 20600 163.64 15432 - 363 1729, 172.96 0.16 33.04 
14 19300 17563 15696 - 737 194.30 194.30 0.01 1.30 
18 15 20700 18055 16224 - 723 19885 193.35 0.04 8.15 
19 16 21800 18803 167.43 - 314 208.64 208.64 0.04 9.36 
20 17 22900 196.52 17326 - 918 21977 219.77 0.04 9.23 
21 18 22500 20571 17984 -10.21 231.58 231.58 0.03 6.58 
22 19 20400 211.17 137.16 - 943 235.18 235.18 0.15 31.18 
23 20 22700 20914 19396 - 599 224.32 224.32 0.01 2.68 
24 21 22300 21420 19826 - 6.29 230.14 230.14 0.03 7.14 
25 22 24200 21669 20277 - 550 23061 230.61 0.05 11.39 
26 23 23900 22385 206.71 - 6.77 241.00 241.00 0.01 2.00 
27 24 26600 22814 21156 - 6.55 24472 244.72 0.08 21.23 
28 233.86 21625 - 392 261.46 261.46 


Figure: 66.88 - Données de départ avec modèle de lissage exponentiel double de Brown 
dans Microsoft Excel 14.0.6123 


Indiquons les formules pour les C, D, E, F, G (H et I étant les mêmes que pour le lissage exponentiel 
simple). Il vient alors: 


Période Yi SES1 $SES2 + & Projection 4 +171 


« 143 254 143 0 =2"C4-D4  =E4"flt4+F4 
s Ë 152 =$L43"B4+(1-4L43)" C4 =4L43"C4+(t-$L43)"D4 0 =2"C5-D5  =E5"fL$4+F5 
« Ë 161 =$L43"B5e(1-$L43) CS =$L43"C5e(t-$L43)"D5 =$L45/(1-4L43)"(D6-C6) =2"C6-D6  =E6"#Lt4F6 
: E 133 =$L43"B6+(1-HL43)" C6 =$L43"C6+(1-$L43)"D6 =$L#3/(1-$L43)"(D7-CT) =2"CT-D7  =ET"#L#4+FT 
+ E 137 =$L$3"BTe(1-L43) CT =$L#3"CTe(1-$L43)"D7 =$L43/(1-4L43)"(D8-C8) =2"C8-D8  =E8"fLf4FS 
CI 6 174 =$L$3"B8+(1-fL43)"CS =$L+3"CS+{1-$L43) DS =$L$3/(1-$L43)" (09-03) =2"C9-D8  =E3"fLt4+F3 
1 142 =$L43"B39+(1-4L43)" CS =$L$3"C3e(1-$L43) 09 =$L43/(1-#L43)"(D10-C10)  =2"C10-D10  =E10"$L#4+F10 
“ E 141 =$L$3"B10(1-4L#3) CIO =$L#3"C10e(t-L43) 10  =$L#3/(1-$L43)"(D11-CH1) =2"CH-DN  =EN"$Lt4eFit 
À 162 =$L#3"B1te(t-fLH9) CN =$L#3"Cite(t-HL4S) ON =$L#S/(t-$L#3)"(Dt2-C12)  =2"C12-DI2  =E12"$L$4+F12 
ER 10 180 =$L43"B124(1-HL#3)"CIS © =$L#9"Ctée(t-#L#S) DIS  =#L#3/(1-#L49)(DIS-C13)  =2"C19-D18  =E19"$L#4+F1S 
CR 1 164 =$L43"B13+{1-4L43)" CIS  =$L43"C1Se(1-4L43)"DIS © =$L43/(1-#L43)'(D14-CH4) © =2"Cid-Did  =2E14"$L$4eF14 
CR 12 171 =$L#3"B4(tL4S) CIS  =$L43"Ci4e(t-#L#S)"DI4  =$L43/1-#L#3)DNS-CHS)  =2"CHS-DHS =E15"fLt4eFts 
CO 15 20€ =#$L43"B15+{1-4L43) CIS  =$L#3"C15e(1-HL43)"D15  =$L#3/(1-4L45) (D16-C16)  =2"C16-D16  =E16"$L$4+F16 
LA 14 193 =4L$3"B164(1-HL43) C6  =$L43"C16e(1-4LHS) DIS  =$L43/(1-HL83)(DNT-CIT)  =2"CHT-DNT  =ENT'#L$4e FT 
# 207 =$L#3"B1Te{-L#S)"CIT  =$L#9"CHTe(t-SL#S) OT  =HL#3/(-#L49)(DIS-C18)  =2"C18-D18  =E18"$L#4+F 18 
TR 16 218 =$L43"B18+{1-4L43)"CIS  =$L43"C18e{1-4L43)"D18 © =$L43/(1-$L43)'(D19-CI9)  =2"CI9-DI9  =E19"$L$4+F19 
ER 17 22€ =4L43"B184{1-4L43) CAS  =$L#3"C19+{1-#L43) DIS © =$L43/(1-$L43)'(D20-C20)  =2"C20-D20 -E20"fL#4+F20 
a 225 =$L$3"B20+(1-#L43)"C20 =$L#3"C20(1-#L43)"D20 © =$L#3/(1-$L45) (D21-C21) =2"C2t-D21  =E21"$L$4eF21 
EPA 15 204=$L#3"B21(1-#L43) C1 © =$L43"Cate(t-fL#3)"D21  =$L43/(1-HL43) (D22-C22) =2"C22-D22 =E22"$L$4+F22 
A) 20 227 =$L$3"B22+(1-HL45)"C22 =HL#3"C22e(t-4L43)"D22 =$L43/(1-4L43) (D23-C23) =2"C23-D23 -E29"#L#4+F23 
ER 21 225 =$L43"B23+(1-4L43)"C2S =fL3"C23e(1-#L43)"D25 © =$L43/(1-HL43)'(D24-C24) =2"C24-D24 =E24"fL$4+F24 


ÉCR 22 242 =$L#3"B24e(t-#L#3) C4 =$L43"C4e(t-#L#S) D24  =$L43/(1-HL43) (D25-C25) =2"C25-D25 =E25"fL$4eF25 
z EX 29€ =$L49"B25e(1-4L45) CS © =$L#9"C25e(#L4S) DSS © =$L#9/(1-4L49) (D26-C26)  =2"C26-D26 -E26"fL$4+F26 
EU 24 26€ =4L$3"B26+(1-4L43)"C26 =$L43"C26+(1-$L43)"D26 =$L43/(1-HL49)'(D2T-C2T) =2"C2T-DT =E2T"$L$4+FOT 
2 =$L#S"B8Te(L4S) CAT =fL45"C2T-SL#S) DT  =$L45/(1-HLHS) (D28-C28) =2"C28-D28 =E28"$L$4+F28 


Figure: 66.89 - Formules correspondantes au modèle de lissage de Brown avec Microsoft Excel 14.0.6123 


Avec un peu plus loin dans la feuille les valeurs indispensables à l'optimisation du modèle avec le solveur 
que nous allons de suite voir: 
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À: 0.283044871297282 
j (C0): 0 


Un += 


MAPE: =MOYENNE(H5H27) 


_ 


MAD: =MOYENNE(TS 127) 


EN  MSD: -SOMME(TS127)*(5 27) /NBTS 127) 
Figure: 66.90 - Constante de lissage et indicateurs d'erreur pour optimiser le modèle 
avec Microsoft Excel 14.0.6123 


La procédure pour minimiser soit l'erreur MAPE, soit l'erreur MAD ou enfin l'erreur MSD avec le solveur 
est exactement la même que pour le lissage exponentiel simple! Nous ne la détaillerons donc pas. 


Le résultat donnera graphiquement (et aussi en comparaison avec le lissage exponentiel simple): 


270 


250 
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190 


170 
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130 


T T T T T T T T T T T T T T T 


9 10111213 14 15 16 17 18 19 20 21 2223 2425 
—YŸt ——Lissage double ——Lissage simple 


© + 
— 
ND + 
&w) < 
HS + 
Lnh — 
Mn + 
=] 
co —< 


Figure: 66.91 - Tracé de la comparaison des observations et du modèle SES/DEBS 
avec Microsoft Excel 14.0.6123 (avec la prévision) 


Nous voyons que le lissage double est meilleur que le lissage simple (son MAPE minimisé étant de 6.90% 
contre 7.89% pour le lissage simple). Cette comparaison est pour rappel une forme de "back-testing". La 
projection à la 25ème période est par contre très proche. 


Ce qui est ensuite intéressant et particulier avec le lissage exponentiel double est de jouer avec la valeur 
de j. Ainsi, en imposant ; =—1, nous aurons pour chaque valeur de la colonne G, sa projection à la 


période correspondante à sa ligne plus | jl périodes. Évidemment, pour les deux premières lignes, les 


projections ne sont pas à prendre en considération! 


Faisons un petit exemple visuel. En posant j = —6 (donc projection à six mois...) nous avons alors: 
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5 


pere A+ 


Période 

l 143.00 
2 143.00 
3 152.88 
4 168.04 
5 151.62 
ô 139.65 
7 173.58 
8 156.87 
9 145.69 
10 162.35 
11 191.10 
12 188.33 
13 192.82 
14 232.13 
15 207.00 237.33 
16 218.00 252.41 
17 229.00 269.48 
18 225.00 287.20 
19 204.00 288.34 
20 227.00 261.50 
21 223.00 268.19 
22 243.00 264.55 
23 239.00 280.53 
24 266.00 283.20 
311.19 


Figure: 66.92 - Projection avec le modèle DEBS dans Microsoft Excel 14.0.6123 


Ainsi, nous pouvons observer qu'au quatrième mois (période), le modèle donne une projection de 168.04 
pour le dixième mois (période) et qu'en réalité il y a eu 180. Nous voyons un exemple d'une très mauvaise 
projection du modèle le sixième mois (période) où le modèle donne une projection de 139.65 alors qu'en 
réalité il y a eu 171... 


Ensuite, ce qui est intéressant c'est de se rappeler que si nous posons j = —-6, la 20ème période, projette 


alors pour 26ème, la 219€ sur la 27ème, etc. Nous obtenons alors graphiquement: 
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310 
230 + 
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—— Yt ——Projection —— Lissage double 


Figure: 66.93 - Projection sur un horizon de un semestre en utilisant le DEBS avec Microsoft Excel 14.0.6123 


Évidemment, comme tout modèle, il faut être très prudent avec des projets à 6 mois car le modèle ne 
prend pas en compte les facteurs de la bourse, des catastrophes naturelles, des pandémies, des guerres, etc. 
Donc tant qu'il y n'a pas d'inférence statistique, il n'est pas possible de donner un intervalle de confiance 
pour la prévision ce qui est scientifiquement parlant pas vraiment acceptable. 


8.3.5. MODÈLE DE LISSAGE EXPONENTIEL DOUBLE À 2 PARAMÈTRES DE HOLT (MODÈLE 
ADDITIF) 


Nous allons présenter ici une technique dont la construction est empirique et qui est due à Charles C. Holt 
(1957). Même dans l'article d'origine de Holt il n'y a pas de démonstration rigoureuse de la construction de 
ce modèle. Il s'agit donc plus d'ingénierie mathématique que de mathématique pure à proprement parler 
(donc la présentation de ce modèle n'aurait normalement pas lieu d'être présente sur ce site Internet). 


L'idée est la suivante comme pour le modèle précédent, d'avoir un modèle de la forme: 
F4; =a,j+8 (66.772) 
mais avec une approche empirique qui consiste à s'imposer que: 


- La pente 4; de la droite du modèle dont l'origine du repère est en t sera obtenue par lissage exponentiel 
simple de toutes les pentes des droites précédentes. 


- L'ordonnée à l'origine à; de la droite en t sera obtenue par lissage exponentiel simple de toutes les 
ordonnées à l'origine des droites précédentes. 


Rappelons d'abord que nous avions obtenu pour le lissage exponentiel simple: 
8, = (1 LE + HS, = AE +(1— 4)8,1 (66.773) 


Il est clair que la pente de chaque droite de l'estimé est donnée par (voir figure ci-dessous): 
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er 4 (66.774) 
À 


et pour le dernier estimé, plus spécifique, nous aurons: 


Figure: 66.94 - Schéma du principe de base de construction du modèle 


et l'idée étant de faire un lissage exponentiel de la pente de toutes les droites dont la pente se calcule de la 
même manière, soit (à comparer à l'expression du lissage exponentiel simple): 


ÀS, 
df = Bt Pia = BIS -S)+(1- Bla (66.775) 


Cette dernière expression est souvent appelée "estimé de la pente à la période t". 


Maintenant, pour l'ordonnée à l'origine, nous remarquons sur la figure que à; = $;. Dès lors, il vient dans 


un premier temps que: 
ÀS, 
df — BE 1- É&- — &ib% — by i+i1— £a (66.776) 


Une fois ce constat fait, nous choisissons un modèle où l'ordonnée à l'origine est un lissage exponentiel de 
toutes les ordonnées à l'origine avec sa propre constante de lissage précédente tel que: 


br =S, = af +il-@iiSs 1 +@ =, +i1-iib 1 +as il (66.777) 
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Ce qui peut paraître parfois déroutant ici, c'est la dernière parenthèse. Au fait, techniquement, on devrait 
plutôt l'écrire: 


[l Sr +ä;_ . é 1= (E7 +&ÿ_ . Âf [l (66.778) 


mais comme le À£ est toujours égal à 1, nous omettons son écriture. Donc la dernière parenthèse 
représente l'estimé à une unité de temps précédente à laquelle on ajoute l'accroissement d'une unité de 
temps de la pente de l'estimé au même temps t. 


L'expression: 
S = Gi +i1- ii +æ_ji (66.779) 
est un peu malheureusement appelée dans la pratique "estimé du niveau de la série à la période €". 


Au final, nous travaillons avec les trois relations: 


+; = a,j+à, 
a, = Bib, -b,,)+(1- 8)a,| (66.780) 


ë, = &F, +{l=@)(8 3 Fa) 


Pour débuter les prévisions avec ce modèle, il faut un estimé de £, et de 4. Les premières prévisions 


seront grandement affectées par ces estimés. Il faut aussi toujours vérifier ce que les logiciels utilisent 
comme méthode de détermination pour ces premiers paramètres afin de la spécifier dans les rapports. 


Exemple: 


Considérons le tableau suivant dans Microsoft Excel 14.0.6123 qui contient les données observées dans la 
colonne B ainsi que le modèle dans les colonnes C à F dont nous allons détailler les formules juste après: 
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Période 
1 
2 152 9.00 15200 152.00 0.00 0.00 
3 161 900 16100 161.00 0.00 0.00 
4 139 7.54 15904 170.00 0.22 31.00 
5 137 6.14 156.12 166.58 0.22 29.58 
6 174 6.69 16641 162.26 0.07 11.74 
7 142 5.22 162.11 173.10 0.22 31.10 
8 141 3.98 15802 167.33 0.19 26.33 
9 162 3.98 16200 162.00 0.00 0.00 
10 150 4.64 17093 165.98 0.08 14.02 
11 164 409 17148 175.58 0.07 11.58 
12 171 388 17396 175.58 0.03 4.58 
13 206 521 18779 177.84 0.14 28.16 
14 193 521 19300 193.00 0.00 0.00 
15 207 5.62 201.32 19821 0.04 8.79 
16 218 6.15 21085 206.94 0.05 11.06 
17 229 6.71 22124 217.00 0.05 12.00 
18 225 6.57 22691 227.95 0.01 2.95 
19 204 5.18 22306 233.48 0.14 29.48 
20 227 5.12 22780 228.24 0.01 1.24 
21 223 4.65 22942 232.92 0.04 9.92 
22 242 503 23687 234.07 0.03 7.93 
23 239 489 24088 241.90 0.01 2.90 
24 266 5.85 25292 245.77 0.08 20.23 
25 258.77 ; =1 
26 264.61 ; =2 
27 270.46 ; =3 
28 276.31 ; = 4 
29 282.15 ; =5 
30 288.00 ; -6 


Figure: 66.95 - Données de départ avec modèle de lissage exponentiel double de Holt 
dans Microsoft Excel 14.0.6123 


Indiquons les formules pour les C, D, E (G et H étant les mêmes que pour le lissage exponentiel simple). Il 
vient alors: 
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“Période &- be us 
4 fl 143 -E5-E4 =E4 
5 152 =$K$4"(DS-D4)+(1-$K$4)"C4  =$K$3(B5)#(1-FK$3)#(D4+C4)  =D4+C4 
: 161 =$K$4"(D6-D5)+(1-$K$4)"CS  =$K$3(B6)#(1-FK$3)"(DS+CS)  =D5+CS 
4 139 =$K$4*(D7-D6}+(1-$K$4)*CE =$K$3*(B7)+(1-$K$3)*(D6+C6) =Dé6+Cé6 
8e 137 =$K$4*(D8-D7)#(1-FK$4)*C7 =$K$3*(B8)+(1-$K$3)*(D7+C7) =D7+C7 
3 Ë 174 =$K$4*(D9-D8)+(1-FK$4)*CS =$K$3*(B9)+(1-$K$3)*(D8+C8) =D8+C8 

7 142 =$K$4*(D10-D9)4(1-$K$4C9  =$K$3"(B10)#(1-SK$3)(D9I+C9)  =D9+C9 
 E 141 =$K$4*(D11-D10)+(1-$K#$4)*C10 =$K#$3#*(B11}+(1-$K$3)*(D10+C10) =D10+C10 
re Ê 162 =$K$4#(D12-D11}+(1-$K$4)*C11 =$K$3*(B12)+(1-$K$3)#(D11+C11) =D11+CIl 


5 180 =-$K$4*(D13-D12)+(1-$K$4)*C12 =-$K$3*(B13)+(1-$K#3)#D12+C12) =D12+C12 
4 164 =$K$4*(D14-D13)+(1-$K$4)*C13 =$K$3*(B14)+(1-$K$3)#(D13+C13) =D13+C13 
CA 12 171 =$K$4*(D15-D14)+(1-$K$4)*C14 =$K$3*(B15)+(1-$K$3)#D14+C14) =D14+C14 
5 206 =$K$4*(D16-D15)+(1-FK$4)*CLS =$K$3*(B16)#(1-FK$3)*(D15+C15) =D15+C15 
TA 14 193 =$K$4*(D17-Dl6)+(1-$K$4)*CLS =$K$3*(B17)(1-$K$3)#D16+C16) =D16+Clé 
ER 15 207 =$K$4*(D18-D17)#(1-FK$4)*C17 =$K$3#(B18)#(1-$K$3)(D17+C17) =D17+C17 
5 218 =$K$4*(D19-D18)+(1-FK$4)*C18 =$K$3*(B19)#(1-$K$3)*(D18+C18) =D18+C18 
CR 17 229 =$K$4*(D20-D19)+(1-FK$4)*C19 =$K$3*(B20)#(1-$K$3)*(D19+C19) =D19+C19 
a KE 225 =$K$4*(D21-D20)+(1-$K$4)*C20 =$K$3*(B21)#(1-$K$3)*(D20+C20) =D20+C20 

19 204 =$K$4*(D22-D21)}+(1-FK$4)*C21 =$K$3*(B22)#(1-$K$3)*(D214+C21) =D21+C21 

20 227 =$K$4*(D23-D22)#(1-FK$4)*C22 =$K$3*(B23)#(1-$K$3)*(D22+C22) =D22+C22 
2 223 =$K$4*(D24-D23)#(1-FK$4)*C23 =$K$3*(B24)4(1-$K$3)*(D23+C23) =D23+C23 
25 > 242 =$K$4*(D25-D24)+(1-FK$4)*C24 =$K$3*(B25)#(1-FK$3)*(D24+C24) =D24+C24 
26 PE 239 =$K$4*(D26-D25)+(1-FK$4)*C25 =$K$3*(B26)#(1-FK$3)*(D25+C25) =D25+C25 

24 266  =$K$4*(D27-D26)+(1-FK$4)*C26 =$K$3*(B27)#(1-FK$3)*(D26+C26) =D26+C26 


25 =D27+C27 

26 =D27+C27+2 
30 PA =D27+C27+3 
1 25 =D27+C27+4 
ER 29 =D27+C27*5 
33 EU =D27+C27*6 


Figure: 66.96 - Formules correspondantes au modèle de lissage exponentiel de Holt 
avec Microsoft Excel 14.0.6123 


Avec un peu plus loin dans la feuille les valeurs indispensables à l'optimisation du modèle avec le solveur 
que nous allons de suite voir: 


&: 0.353501814151959 


4 8: 0.133684345261106 
EN MAPE: =MOYENNE(G5:G27) 
EN) MAD: =MOYENNE(HSH27?) 


MSD: =SOMME(HS H27)*H5 H27))NB(HS-H27) 
Figure: 66.97 - Constante de lissage et indicateurs d'erreur pour optimiser le modèle 
avec Microsoft Excel 14.0.6123 


La procédure pour minimiser soit l'erreur MAPE, soit l'erreur MAD ou enfin l'erreur MSD avec le solveur 
est exactement la même que pour le lissage exponentiel simple! Nous ne la détaillerons donc pas. 


Ce qui donne graphiquement (et aussi en comparaison avec le lissage simple et double): 
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Figure: 66.98 - Projection sur un horizon de un semestre en utilisant le modèle de Holt avec Microsoft Excel 14.0.6123 


Le lissage de Holt a un MAPE de 7.38% alors que celui de Brown à un MAPE de 7.12% (cette 
comparaison est pour rappel une forme de "back-testing"). Cependant l'avantage du modèle de Holt est 
qu'on peut faire des projections à plus d'une période. 


Il est bien évidemment intéressant de comparer les projections à six mois entre la méthode additive de 
Holt et le lissage de Brown: 


Brown Hoit's additif 


288.34 258.77 
261.50 264.61 
268.19 270.46 
264.55 276.31 
280.53 282.15 
283.20 288.00 


Figure: 66.99 - Comparaison entre modèle de Brown et Holt additif 


Nous voyons donc que le modèle de Holt's a presque toujours des valeurs de projection supérieures au 
modèle de Brown. 


Il convient avant de juger ces valeurs de les comparer aux observations qui seront constatées dans l'avenir. 


8.3.6. MODÈLE DE LISSAGE EXPONENTIEL TRIPLE À 3 PARAMÈTRES DE HOLT ET WINTERS 
(MODÈLE MULTIPLICATIF) 


Nous allons présenter ici une technique dont la construction est elle aussi empirique et qui est fortement 
inspirée du modèle de lissage exponentiel double de Holt. Je n'ai jamais trouvé de démonstration 
rigoureuse de ce modèle. Il s'agit donc probablement aussi plus d'ingénierie mathématique que de 
mathématique pure à proprement parler mais comme c'est un classique dans les logiciels de statistiques, 
nous allons nous attarder dessus un petit moment. 
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Winters (étudiant de Holt) s'est basé en 1960 sur la méthode de son professeur pour définir un modèle qui 
prend en considération la composante saisonnière. L'idée consiste à utiliser trois équations de lissage: une 
pour le niveau de la demande (désaisonnalisée), une pour la tendance et une pour la saisonnalité. 


Remarque: Il existe deux méthodes de Winters selon que la saisonnalité est additive ou multiplicative. 
Nous ne présentons ici que le modèle multiplicatif car c'est celui le plus couramment utilisé. Et puis 
nous ne pouvons pas présenter tous les modèles existants car ils sont tous empiriques et il en existe des 
centaines voire probablement des milliers! 


Soit N, le nombre de périodes dans chaque cycle saisonnier (cycle supposé constant!). Trois équations de 
lissage exponentiel sont utilisées à chaque période pour actualiser les estimés de la série désaisonnalisée, 
les facteurs saisonniers et la tendance. Ces équations peuvent avoir différentes constantes de lissage 
notées traditionnellement &, & et F. 


La première équation est définie assez naturellement par: 


# 
t-N 


= +{(1- lib; 1 +as1l (66.781) 


où ; est alors le niveau actuel de la série désaisonnalisée par le facteur saisonnier approprié C;_37 (nous 
retrouvons sinon la méthode de Holt). 
La deuxième équation est elle aussi naturellement définie par: 
at = lb —-bii+{l- Éla; (66.782) 
où nous retrouvons donc la pente de la tendance identiquement au modèle de Holt. 


La troisième équation est totalement nouvelle, ce qui n'empêche pas qu'elle est relativement intuitive et est 
donnée par: 


et finalement la prévision est resaisonnalisée (c'est la forme de la prévision qui fait que nous parlons de 
"modèle multiplicatif"): 


F4; = (4,j + 1Crty=N (66.784) 


Cette dernière équation assume que j < Ÿ.Si N < j < 2, le facteur saisonnier approprié serait C,,;-2py. 


Si 2N < j <3, le facteur saisonnier approprié serait C,4;_3 et ainsi de suite. 


Donc au final, nous avons le système: 
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F4; | aj+b Ci45-N 
a, = Bib, -b,11+11- 614, 


LA 
b, = a +{1-æœiib,, +a, il (66.785) 
t- 


F 
C, = Ft Fi Gien 


t 


Pour débuter les prévisions avec ce modèle, il faut aussi un estimé des paramètres initiaux. Encore une 
fois, les premières prévisions seront grandement affectées par ces estimés. Il faut aussi toujours vérifier ce 
que les logiciels utilisent comme méthode de détermination pour ces premiers paramètres afin de la 
spécifier dans les rapports. 


Exemple: 


Considérons le tableau suivant dans Microsoft Excel 14.0.6123 qui contient les données observées dans la 
colonne D ainsi que le modèle dans les colonnes E à H dont nous allons détailler les formules juste après: 


3 ée TrimestePériode  Ÿ_ a. b, (Ge F-  Écartrelatif absolu Écart absolu 
4 1 1 1 143 0.961 
5 1 2 2 152 1.022 
6 1 3 3  lél 1.082 
7 1 4 4 139 -006 148.75 0.934 
8 2 1 5 137 028 146.66 0961 14294 0.04 5.94 
g 2 2 6 174 055 15421 1022 149.59 0.14 24.41 
10 2 3 7 142 027 14705 1082 167.51 0.18 25.51 
f 2 4 8 141 012 148.13 0934 137.16 0.03 3.84 
3 1 9 162 0.59 154.72 0961 142.28 0.12 19.72 
13 3 2 10 160 131 162.13 1022 158.70 0.12 21.30 
14 3 3 11 164 090 159.54 1082 176.90 0.08 12.90 
15 3 4 12 171 168 167.82 0934 149.92 0.12 21.08 
16 4 1 13 206 323 18417 0961 162.95 0.21 43.05 
17 4 2 14 193 328 18788 1022 191.49 0.01 1.51 
18 4 3 15 207 328 191.19 1082 206.90 0.00 0.10 
13 4 4 16 218 463 207.8 0934 181.72 0.17 36.28 
20 5 1 17 229 5.54 220.46 0961 203.62 0.11 25.38 
a E 2 18 225 534 22410 1022 230.94 0.03 5.94 
22 5 3 19 204 392 216.02 1082 248.33 0.22 44.33 
23 5 4 20 227 472 22747 0934 205.53 0.09 21.47 
24 6 1 21 223 471 232.12 0961 223.21 0.00 0.21 
25 6 2 22 242 471 23683 1022 242.00 0.00 0.00 
26 6 3 23 239 399 23475 1082 261.43 0.09 22.43 
27 6 4 24 266 558 253.78 0934 223.09 0.16 42.91 
2 25 249.34 
26 270.73 
30 27 292.81 
31 28 258.01 
32 29 265.44 
33 30 265.44 


Figure: 66.100 - Données de départ avec modèle de lissage exponentiel triple de Holt et Winters 
dans Microsoft Excel 14.0.6123 


Indiquons les formules pour les E, F, G, H (I et J étant les mêmes que pour le lissage exponentiel simple). Il 
vient alors: 
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PR 145 =D4/FT 

CM 152 =D5/FT 

Ca 161 =D6/F7 

D1535 -((D8-D4)/4+(D3-D5)/4+{D10-D6)/4+(D11-D7)44 =MOYENNE(D4:07) =D7/FT 

Pl i3T =HM$4"(FS-FTJe(t-HMSA)"ET =HMS3"D8/G4+(t-HMSS)IFT-ET)  2MS'DS/FSe(t-MS)"G4  ={F7+ET)"G4 
Dlirs =Mf4"(FS-FE)e(t-HMSA)"ES =HMS3"D3/GSe(1-HMSS) FÉES)  =RT'DS/FS(1-RT)"GS =(F8+E8)"GS 

D 142 =$M$4"(F10-FS)e(t-HMSA)"ES =$M$S"DI0/G6+(1-HMSS)'(FS+ES)  =RS"DI0/FI0+(-R6)"G6  =(F9+E3)"G6 
141 =tm$4"(FH-F10)e(t-HMS4)"E10 =$MSS"DINGTe(I-$M43)"(F104E 10)  =2RS"DN/F Te (I-RS)"GT =(F10+E10)"GT 
Pics =$m$4"(FI2-Fitje(I-MSA) EN =$MSS"DI2/G8+(1-HMSS)'(FIREN)  =R10"DI2/FI2e(t-R10)GS  =(FiHE 11) GS 

PA 150 =tmt4"(F13-F12)e(-#MI4) "ENS =$M$S"DI3/GS(1-HMSS)FISEI2) =RADIS/FIS(-RN)GS  =(FI2+E12) GS 

PM i64 =tm$4"(FId-F13)e(t-HMIRA) ENS =HMASS"DI4/GI0e(t-HMSS) (PISE) =RA2"DH4/F4+(I-PA2) GO =(F13E13)"G10 
Pitt =tm$4"(F15-Fi4)e(t-SMISA) ETS =$MSS"D15/Gite(-HMSS)'(FI4E 14)  2G46"D15/F15e(1-G46) "Gt  =(FI4+E 14)" Gi 

DA 206 =$M$4"(F16-F15)e(1-SMIS4) ES =$MSS"DI6/G12+(1-#M83) (PISE NS) =2G47"D16/F6+{1-G47)"GI2 =(FIS-E 15) GS 

TA 133 =tmt4"(FIT-F6)e(1-SMSA)E16 =HMSS"DITIGISe (1-83) (FIGE 16) =2G48"D17/FITe(1-G48)"GIS =(FI6-E16) GS 

DA 207 =tm1$4"(F18-FITJe(I-HMSAN ENT =HM3"D16/G14+(t-HMSS)IFITENT) 2G49"D16/F18+(1-G43)"GI4 =(FIT-ET)"G14 

A 218 =tm$4"(F13-F18)e(1-#MIS4) "ENS =HMSS"DIS/GISe(1-HMSS) (FI8E18) =G50"D19/F19+(1-GS0)'GIS  =(F18E 18)" GS 

TA 223 =tm$4"(F20-F18)e(t-#MIS4)"E1S =$M$3"D20/G16+(1-#M43)"(F194E 13) =GS1D20/F20+(1-G51)"G16 =(F19E13)"G16 

M 22s =$mM$4"(F21-F20)e(t-HMS4)"E20 =$MSS"D21GITe(1-HMS3)"(F20+E20) =G52"D21/F21e(1-GS2) GNT  =(F20+E20)" GI 

PA 204 =tmt4"(F22-F21)e(t-#MS4)"E 21 =$MSS"D22/G184(1-HMSS)'(FSHES1) 2G55"D22/F22+(1-G53) 18 =(F21+E21) GS 

PA 227 =tmt4"(F23-F22)e{t-$MH4)"E22 =$M$5"D25/G194(1-HM$S)"(F22+E22 =2G54"D25/F23+(1-G54)"G19 =(F22+E22)"G19 

DPI 223 =$M$4"(F24-F23)e[1-#MS4)"E23 =HM$3"D24/G206(1-#M43)"(F23+E2E =G55"D24/F24+(1-G55)"G20 =(F23+E23)"G20 

CA 242 =tM$4"(F25-F24)e(t-HMS4)"E24 =HM3"D25/G21(1-HMS)'(F24+E 24: 2G56"D25/F25e(1-G56) GA =(F24+E24)"G21 

TA 253 =$M$4"(F26-F25)e(t-HMS4)"E2S =$M$3"D26/G22+{1-4M43)"(F25+E25 =2G57"D26/F26+(1-G57)"G22 =(F25+E25)"G22 

A 266 =tM$4"(F27-F26)e{1-#M$4)"E26 =$M$5"D27/G23+(1-HM4S)(F26+E26 =2G58"D27/F274(1-G58)"G23 =(F26+E26)"G23 

24 =(F27-E27)"G24 
29 =(F27-E27"2)"G25 
30 =(F27-E27"3)"G26 
31 =(F27-E27"4)"G27 
32 =(F27-E27"4)"G24 
33 =(F27-E27"4)"G24 


Figure: 66.101 - Formules correspondantes au modèle de lissage exponentiel de Holt et Winters 
avec Microsoft Excel 14.0.6123 


Avec un peu plus loin dans la feuille les valeurs indispensables à l'optimisation du modèle avec le solveur 
que nous allons de suite voir: 


3 œ: 0327469638 750293 
4 B: 0.105758348520427 
y: 0 


1 MAPE: =MOYENNE(S127) 


EN MAD: =MOYENNE(S:T27) 
DA MSD: =SOMME((8J27)*(8.J27)NB(8:127) 
Figure: 66.102 - Constante de lissage et indicateurs d'erreur pour optimiser le modèle 
avec Microsoft Excel 14.0.6123 


La procédure pour minimiser soit l'erreur MAPE, soit l'erreur MAD ou enfin l'erreur MSD avec le solveur 
est exactement la même que pour le lissage exponentiel simple! Nous ne la détaillerons donc pas. 


Ce qui donne graphiquement (et aussi en comparaison avec le lissage simple, double et le modèle additif 
de Holt): 
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Figure: 66.103 - Projection sur un horizon de un semestre en utilisant le modèle de Holt et Winters 
avec Microsoft Excel 14.0.6123 


1 23 4 5 6 7 8 


Le lissage de Holt avait donc un MAPE de 7.38% et celui de Brown à un MAPE de 7.12%. Le lissage 
saisonnier de Holt et Winters a un MAPE de 9.61%. Cependant l'avantage du modèle de Holt et Winters 
est qu'on peut faire des projections à plus d'une période avec cycles ainsi que nous pouvons le voir sur le 
graphique. 


Il est bien évidemment intéressant de comparer les projections à 6 mois entre la méthode additive de Holt 
et le lissage de Brown: 


Brown Hoit's additif Holt's-Winter 


288.34 258.77 249.34 
261.50 264.61 210543 
268.19 270.46 292.81 
264.55 276.31 258.01 
280.53 282.15 265.44 
283.20 288.00 265.44 


Figure: 66.104 - Comparaison entre modèle de Brown, et Holt additif et Holt et Winters 


Donc nous voyons encore une fois qu'en fonction de la technique choisie, les différences sont relativement 
importantes. 


8.3.7. RÉGRESSION LOGISTIQUE 


Il arrive toujours dans les entreprises que dans l'analyse d'un produit ou d'un service, que celui-ci voie son 
nombre de ventes croître, ensuite passer par un point d'inflexion et ensuite aller vers une asymptote pour 
diminuer à nouveau par la suite avec une caractéristique similaire. 


Le modèle logistique permettant de simuler un tel comportement dans le cadre de l'analyse des séries 
temporelles (à ne pas confondre avec la régression logistique vue dans le chapitre de Méthodes 


Numériques!) est défini ainsi: 
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ne 
Ÿ. = 
FT 1+brt 


CCC 7QC\ 
(66./00) 


Il s'inspire de nombreux modèles que nous retrouvons en physique et où »,. est le seuil de saturation 
(asymptote horizontale) qui peut être déterminé suite à un audit du marché et son % de pénétration. 


Remarque: Il faut aussi savoir que ce modèle est bien meilleur que celui utilisé par le lissage 
exponentiel compris dans l'Utilitaire d'Analyse de Microsoft Excel 14.0.6123 (même si comme nous 
l'avons vu mathématiquement, ils ne fonctionnent absolument pas sur les mêmes bases). Une simple 
observation comparative des résultats obtenus suffit à s'en rendre compte. 


b et r sont eux deux paramètres du modèle tels que: 


b>0 
QO<r<1 


le point d'inflexion est toujours donné par le cumul de 50% du seuil de saturation. Le résultat est alors une 
courbe en S du type suivant: 


300'000 


250000 


200'000 
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. Modèle — Mesures 


Figure: 66.105 - Comparaison mesures avec modèle logistique 


où en jaune a été représenté les données actuelles d'une entreprise et en bleu le modèle théorique 
prévisionnel associé. 


Pour déterminer l'équation de la courbe logistique, nous pouvons utiliser directement les solveurs de 
certains logiciels. Mais ceux-ci ont parfois besoin d'avoir des données de départ proches de la valeur 
théorique. Nous allons donc d'abord montrer comment ces valeurs de départ peuvent être déterminées 
avec un exemple. 


Considérons le tableau suivant fait avec Microsoft Excel 11.8346 (les ventes sont en centaines de milliers 
d'unités): 
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633.9 


n des semaines 


et le graphique associé: 
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Figure: 66.107 - Tracé des mesures précédentes 


qui pourrait être jugé comme linéaire suivant le moment auquel débute l'analyse descriptive des ventes 
dans l'entreprise. 
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Pour déterminer le modèle théorique, nous allons linéariser l'équation logistique en utilisant un seuil 
hypothétique (objectifs de ventes du marché) de 800. 


Donc: 


mr + 22e pe 1 Sin 2 1] 0 ét (66.788) 
+èr Y; Ÿ 


Soit à calculer la nouvelle variable à expliquer: 


Le 800 
V'r= n [2e ) =in S) (66.789) 
Y} Y; 


et nous écrirons le modèle linéaire correspondant: 


F, =at+ap+e (66.790) 


avec donc: 

a=h(r) =>r= eÂ 

(66.791) 

ap =in(b) —b= e® 

Soit: 
Vas Vas 
De = — (66.792) 
Foret 142740 


Dans notre exemple, la régression linéaire (cf. chapitre de Méthodes Numériques) donne: 


. =—0.2245+2.7908 (66.793) 


soit: 


Nous avons alors immédiatement: 


800 
1+16.294. 0.7988* 


Ilè 


Y4 (66.794) 


Soit sous forme graphique: 
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Figure: 66.108 - Comparaison mesures avec modèle logistique 


avec ce modèle formel, nous avons une somme des carrés des écarts entre les mesures et le modèle (cf. 
chapitre de Statistiques) de: 


SSE = 3520.828 (66.795) 


Maintenant, entrons ces données dans Microsoft Excel 14.0.6123 sous la forme suivante: 
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Ventes Modèle Différence"? 


1 44.70 57.08 152.31 
pa 61.00 70.20 84.67 
3 81.30 63.99 21.97 
4 105.80 104.81 0.97 
5 134.00 127.03 438.61 
6 165.60 152,91 160.92 
7 200.10 182.64 304.68 
8 236.90 216.22 427.48 


9 275.40 253.44 482.11 
10 315.00 293.84 447.61 
11, 355.20 336.72 341.66 
12 395.30 381.13 200.68 


13 434.80 426.02 11.05 
14 473.30 470.26 9.22 
15, 510.10 512.80 7.28 
16 544.90 232.12 61.34 


17 577.30 SEE, 146.24 
13 607.00 622.37 236.10 
19 633.90 651.48 308.94 

3520.82858 


Figure: 66.109 - Comparaison mesures et valeurs du modèle théorique 


avec la structure suivante: 
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Différence"2 
44.7 =$F$1/(1+$FF3*$F$2"A2) =(B2-C2ÿ "2 
61 =$F$1/(1+$FF$3*$F$2"43) —=(B3-C3 2 b: 
81.3 —$F$1/(1+$F$3*FFF2"A4) =(B4-C4)y"2 SSE : 
105.8 =$F$1/(1+$F$3*$F$2"A5) =(B5-C5)2 

134 —=$F$1/(1+$F$3*$F$2"46) =(B6-C6}"2 

165.6 =$F$1/(1+$FS3*$F$2"A7) =(B7-C7) 2 

200.1 —=$F$1/(1+$F$3*FFF2"48) —=(B8-C8}"2 

236.9 —$F$1/(1+$F$3*$FF52"A9) =(B9-C9)"2 

275.4 =$F$1/(1+$FF3*$F$52"A10) —{(B10-C10ÿ"2 

315 =$F$1/(1+$FF53*$F$2"A11) ={B11-C11}"2 

355.2 =$F$1/(1+$FF3*$F$2"A12) =(B12-C12}"2 

395.3 =$F$1/(1+$FF3*$F$2"A13) —(B13-C13}"2 

13 434.8 —=$F$1/(1+$F$3*$F$2"A14) ={B14-C14)*2 

5 KE! 473.3 =$F$1/(1+$F$3*$F$2"415) =(B15-C15} 2 

15 510.1 =$F$1/(1+$FF3*$FF52"A16) —(B16-C16}"2 

7 KE 544.9 =$F$1/(1+$F$3*$FF$2"417) =(B17-C17}"2 

8 fi 577.3 =$F$1/(1+$FF3*$FF52"A18) —(B18-C18;"2 

3 BE 607 =$F$1/(1+$FF3*$FF52"A19) —(B19-C19; 2 

20 HE 633.9 =$F$1/(1+$FF3*$FF52"A20) =(B20-C20ÿ"2 
=SOMME(D2:D20) 


Figure: 66.110 - Formules explicites pour le calcul du modèle théorique 


Ÿ max: 


: DAS a RCE J 
C9 -J Gi Lan LE LU) Nm 


ni ui O0 
1 © 


ti 
Le 


Si nous lançons le solveur de Microsoft Excel 14.0.6123 avec les paramètres suivants (nous avons mis 
0.0001 comme plus petite valeur puisque le solveur ne propose pas de relation d'ordre stricte): 
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L 


(V] Rendre les varisbles sans contrainte non négatives 
Sélact. une résolution : GRG non inéaire | 


Méthode de résolution 


Sélectionnez le moteur GRG non linéaire pour des problèmes non inéaires de solveur. 
Sélectionnez le moteur Simplex PL pour les problèmes Inéaires, et le moteur Évolutionnaire pour les 
problèmes complexes. 


Figure: 66.111 - Paramètres du solveur pour minimiser SSE 


Ce qui donne: 


Figure: 66.112 - Résultat du solveur 


Soit: 


717.94 
1+14.7744. 0.7849* 


Ilè 


LA (66.796) 


avec: 
SSE = 698.511 (66.797) 


soit nettement inférieur à notre approche utilisant la régression linéaire et donc meilleur. Effectivement 
voyons le tableau de résultat: 
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Figure: 66.113 - Valeurs données par le modèle obtenu par optimisation 


et graphiquement cela donne: 


Solveur __ Modèle 


— Mesures 


Figure: 66.114 - Comparaison entre mesures, modèle par régression et modèle par optimisation 
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Nous voyons nettement que le modèle du solveur (modèle numérique) est meilleur que le modèle formel 
donné par une régression linéaire et il est aussi meilleur comme déjà mentionné que le lissage exponentiel 
proposé par l'Utilitaire d'analyse de Microsoft Excel 11.8346! 


Pour en finir avec ces modèles de prévisions, rappelons que ceux-ci doivent être suivis régulièrement pour 
s'assurer que le modèle et les paramètres utilisés sont toujours appropriés. Comme le lecteur l'aura 
peut-être deviné, un modèle de prévision ne doit pas avoir de biais. La somme des erreurs doit donc 
voisiner zéro, avec parfois des surestimations et parfois des sous-estimations. Lorsque le modèle a 
tendance à toujours surestimer (ou sous-estimer), ce dernier a un biais et il doit être révisé. 


Afin de détecter que le modèle est biaisé, on fera typiquement le suivi de la différence entre la prévision et 
l'observation sur une carte de contrôle ( | Géni ustriel). 


Il faut aussi pour conclure rappeler qu'il existe une différence parfois importante entre les valeurs 
observées (ventes effectives) et les observations qu'il y aurait eu réellement si l'offre était infinie. 
Effectivement, les ventes observées ne prennent pas en compte les ventes ratées parce que faute de stock 
dans une des milliers de succursales que possède votre entreprise, un client est allé voir chez la 
concurrence. Ainsi, les ventes observées sont toujours un "minimum" faute des ventes loupées! 


Remarque: Indiquons qu'il est aussi trivialement possible de faire la différence de tous les points 
consécutifs dans le temps d'une série temporelle et ensuite de faire un histogramme pour déterminer la 
loi de probabilité des fluctuations, ce qui permet de faire de l'inférence statistique avec toutes les 
précautions nécessaires. 


8.4. MODÈLES AUTORÉGRESSIFS 


Dans l'étude d'une série chronologique, il est naturel de penser que la valeur de la série à la date t peut 
dépendre en partie des valeurs prises aux dates précédentes: 


À = JA At 


ce qui évidemment est une écriture limitée à une série univariée (nous n'étudierons par les séries 
multivariées), discrète, et dont la fréquence d'échantillonage est constante (au contraire que ce qui se fait 
dans dans certains domaines des transactions financières). 


Nous avons vu dans le chapitre de Probababilité que lorsque nous nous tenons uniquement à une 
dépendance avec l'instant t-1, nous parlons alors de "chaîne de Markov", ou plus rigoureusement de 
"chaîne de Markov d'ordre 1". Avant de continuer, ouvrons un paranthèse sur l'intérêt des chaînes de 
Markov (rappel orienté finance). Considérons que nous avons des valeurs boursières à une fréquence 
fixe (par exemple journalière ou horaire. peu importe!). Il est alors très aisé de calcul la proportion de 
Augmentations (À) versus les Diminutions (D) des valeurs d'intérêt. Ainsi, en prenant en compte 
l'ensemble de l'historique, nous aurons typiquement un tableau du genre (les valeurs proviennent des 
indices du S&P 500 entre 1947 et 2007): 


Proportion Proporitions Total 
Augmentations (A) | Diminutations (D) 
0.474 0.526 1 
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Mais bon cela ne sera pas vraiment à grand chose. Si nous compliquons un peu l'analyse en nous 
demandant quelle proportion nous avons deux augmentations successives (AA), diminutions successives 
(DD), ou alternance (DA) et (AD) dans l'ensemble de l'historique cela double le travail et pourrait nous 
donner typiquement un tableau du genre: 


À; = Total 


X., =(D 0.519 La 0.481 1 
(A) 0.433 0.567 1 
Tableau: 66.22 - Proportion de variations A/D sur Le par rapport à la période précédente 


Les valeurs ci-dessus peuvent donc bien évidemment être vues commes les probabilités conditionnelles: 
PI À; | X; | (66.799) 
Et si maintenant nous faisons une analyse non pas que sur la période précédente mais sur les deux 


dernières, cela signifie que nous calculons les proportions des séquences (DDD), (DDA), (DAD), (DAA), 
(ADD), (ADA), (AAD), (AAA) et cela double encore une fois le nombre de calculs: 


me 
X; es; A (D) Total 
(D) (D) | 0.501 0.499 1 
(D) (A) | 0.412 0.588 1 
(A) (D) | 0.539 0.461 1 
(A) (A) | 0.449 0.551 1 
Tableau: 66.23 - Proportion de variations A/D sur l'ensemble par rapport à 2 périodes précédentes 


Les valeurs ci-dessus peuvent donc bien évidemment être vues commes les probabilités conditionnelles: 
66.80( 
P(X | A2) (66.800) 


Nous voyons donc qu'en ajoutant à chaque fois une période précédente supplémentaire à l'analyse, nous 
doublons le nombre de calculs. Ainsi, en prenant les 20 dernières périodes, cela nous amène à près de 1 
millions de probabilités conditionnelles (proportions). Nous comprenons alors tout l'intérêt de nous 
restreindre à un faible nombre de valeurs antérieures ou a une seule valeur comme le font les chaînes de 
Markov. Ainsi, la probabilité que la séquence des 4 prochains jours soit AADA sera sans hypothèse 
simplificatrice: 


P(AADA)= P(X = A). P(X3 = A| Xi = A). P(X3 = D|X2 = A,Xj = À) 
PIX = A| 43 = D,4; = À,Â1 = À) 


(66.801) 
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mais se réduira dans l'hypothèse d'une chaîne de Markov (c'est-à-dire une dépendance seulement avec la 
période précédente) à: 


P(AADA) 
= P(X = A) PIX = A|X = Ai P(X3 = D|X2 = A) P(Xa=A|X3= D) (66.802) 
= 0.526. 0.567- 0.433. 0.481 z 0.062 = 6.2% 


Savoir si le modèle de probabilités conditionnelles totales ou la version simplifié de Markov est un vaste 
débat. L'hypothèse de la marche aléatoire (implicitement: le modèle de Markov) est défendue par une 
majorité d'économistes. mais cette hypothèse à bien évidemment aussi un certain nombre de 
condradicteurs. 


Il n'est généralement pas nécessaire de prendre en compte tout le passé de la série ou seulement le dernier 
événement et nous pouvons le plus souvent nous limiter à p valeurs: 


À+ — F| te Àt-2 re À tp i+ Et (66.803) 


où & est un bruit blanc 4/10, d lou processus de Wiener noté parfois WN. Plus rigoureusement, et pour 


des raisons d'application de techniques statistiques, un bruit blanc est défini par: 
E! Ët 1= Ô 
FE 2 | = À (66.804) 
E(&e)=0 Viet 


La seule différence par rapport au mouvement brownien standard c'est que comme nous le verrons plus 
loin, il y a ici la présence d'un facteur d'inertie noté traditionnellement & dans les cas simples qui 
influence fortement la dynamique du processus tel que: 


À+ = XX, + € (66.805) 


Effectivement, comme il est très facile de le faire dans Microsoft Excel conformément à la procédure 
indiquée lors de notre étude des processus de Wiener: 


Voici différents tracés de la série temporelle en fonction de quelques valeurs du facteur d'inertie: 
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0 100 200 0 100 200 0 100 200 


Figure: 66.115 - Processus autorégressif d'ordre 1 


Si nous considérons Z, comme une variable aléatoire spécifique (ayant une fonction de densité donnée 
f 
que nous noterions X et #;., comme une autre variable aléatoire spécifique (ayant une fonction de densité 


donnée) que nous noterions Y, alors rien ne nous empêche étant connues les fonctions de densité de 
chacune de ces variables, de calculer leur covariance: 


K()=cyy = cov(X,F}= cov(X,,4,,)= EX: x ) - Ë (x) E(X,,) (66.806) 


Par exemple, dans la pratique nous connaissons souvent les espérances des deux variables aléatoires 
aux deux moments différents ainsi que quelques-unes des valeurs de leurs distributions sous-jacentes 
(réalisations aléatoires). Alors, il devient aisé de calculer leur covariance. Mais ce n'est pas un indicateur 
vraiment utile. Rien ne nous empêche en supposant une relation linéaire d'utiliser le coefficient de 
corrélation linéaire: 


Cxy Cx,y Cxy 


À = —— 2 — —————]—]—]— 66.807 
RE PO Lot Mod Jecas 
DE XCE,Y 


Mais qui se note alors traditionnellement et trivialement dans le cas des séries temporelles: 


ÿ, (@) 


SON PTT ETC 


et est appelé "coefficient d'autocorrélation" souvent abrégé dans les logiciels de statistiques ACF. 
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Personnellement je préfère réécrire la relation précédente sous la forme explicite suivante (la covariance 
est explicitée): 


EÎ(& = #rs)(# - #:)] (66.809) 


Pxy} = 


Il faut savoir que lorsque nous faisons de l'analyse de séries temporelles, dans la pratique, nous comparons 
souvent une suite avec elle-même mais comportant un décalage temporel h. L'autocorrélation d'ordre h est 
donc la corrélation entre la série et elle-même retardée de h relevés. 


Ainsi, puisque les deux suites sont dépendantes et ont les mêmes caractéristiques statistiques, nous 
écrivons dans ce cas particulier dit de "processus stationnaire du second ordre" la relation suivante 
appelée "coefficient d'autocorrélation empirique": 


1 LC 
À, — XX, — 
E[(X, -4r)(4 - 4x) ] era A  4xr)(& 4x) 
RE rm 
ñn 
x — En) 
2-1 (66.810) 


> (Æ, - 4x )(4r 4x) 


(x _ h) Os 
où évidement il ne faut pas oublier que dans la pratique l'espérance et l'écart-type ne sont que des 
estimateurs bien que cela ne soit pas explicite dans la définition ci-dessus puisque le domaine de l'analyse 
temporelle n'indique que très rarement les petites chapeaux au-dessus des estimateurs (contrairement à ce 
que nous avons fait dans le chapitre de Statistiques). 


Évidemment dans le cas de l'analyse de séries temporelles où nous soupçonnons une cyclicité, la valeur la 
plus grande de © pour un h donné indique la fréquence (respectivement la périodicité) de la cyclicité 
sous-jacente à la série ce qui peut aider par exemple pour le choix du type de moyenne mobile (voir plus 
bas). 


Définition: Nous appelons "corrélogramme", le diagramme représentant les coefficients d'autocorrélatioon 
d'ordre 1, 2, 3, …, h, … de la série. 


Remarque: Il existe différentes variantes de cette relation dans certains logiciels. Il peut arriver 
d'obtenir des petites différences numériques par rapport à l'utilisation de la relation ci-dessus. 


Voici par exemple une famille de séries temporelles: 
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Figure: 66.116 - Quelques exemples de séries temporelles 


avec leur corrélogramme correspondant avec bien évidemment pour différentes valeurs de h en abscisse et 


la valeur de £ en ordonnée: 


1.0 
: [IT 
oo — 
0.5 
1.0 a 
2 4 6 & 10 12 14 16 
[ms »x2 | 


4 6 C2 10 12 14 16 


8 10 12 14 16 2 
| mm x4| 


(os xs | 


Figure: 66.117 - Corrélogrammes correspondants 


Faisons un exemple pratique de calcul de corrélogramme avec Microsoft Excel 14.0.6123 et des données 


fictives: 
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À B É 
Ventes Moyenne £ h 
144 15915  0.269596705 1 

151 159.15 0751831577 2 

134 159.15 0.159770276 3 

4 

5 


On 


J 


151 159.15 0663773644 
145 159.15 -0.032360218 


g 145 159.15 
10 141 159.15 
11 166 159.15 
12 151 159.15 
13 164 159.15 


LE: 151, 159.15 
15 176 159.15 


16 170 159.15 

180 159.15 
18 156 159.15 
19 187 159.15 
20 166 159.15 
21 182 159.15 
22 154, 159.15 
23 169 159.15 


Figure: 66.118 - Données avec moyenne et coefficients d'autocorréation 


Soit pour la partie qui nous intéresse: 


£ 

=SOMME(((A4:422)-(B4:B22))*((45:423)-(B4:B22))VECARTYPE($A$4:$4$23)"2(NB($A$4:#$A$23)-E4) 

=SOMME(((A4:421)-(B4:B21))*((46:423)-(B6:B23)) VECARTYPE($A$4:$4$25)"2(NB($A$4:$A$23)-ES) 

=SOMME(((44:420)-(B4:B20))*((47:423)-(B7:B23))YECARTYPE($4$4#$49$23)"2(NB($4$4#$4$23)-E6) 

=SOMME(((44:419)-(B4:B19))*((48:423)-(B8:B23)))ECARTYPE($4$4$49$23)"2(NE($A$4$A#23)-E7) 

=SOMME(((44:418)-(B4:B18))*((49:423)-(B9:B23)))ECARTYPE($4$4:#$49$23)"2(NE($A4$4#$A$23)-E7) 
Figure: 66.119 - Calculs des coefficients d'autocorrélation 


LU BU OND ee 


et donc le corrélogramme correspondant: 
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1 
0.8 
0 6 


Figure: 66.120 - Corrélogramme correspondant à l'exemple 


Définition: Une série temporelle est dite "stationnaire au sens faible" ou plus simplement un "processus 
stationnaire faible" si le premier (espérance) et second (variance) moment existent, sont finis et constants 
dans le temps (donc ne dépendant pas du temps): 


E(X)= 4, Viel.T 


(66.811) 
V(X)= ,Viel.T 


La première condition (constance de l'espérance) élimine donc toute tendance. Si la fonction de densité 
sous-jacente à chaque y, est une loi Normale, alors nous parlons de "processus Gaussien". Dans le cas 


contraire, nous dirons sur ce site qu'elle est non stationnaire. 


Remarque: Certains auteurs rajoutent à la définition des processus stationnaires faibles que ceux-ci 
doivent avoir une covariance qui existe, soit finie et indépendante des instants choisis, ou plus 
exactement ne dépende que de l'écart entre les instants choisis, c'est-à-dire: 


CO! Ætak À) = f(k) 


Considérons un cas important dans de nombreuses entreprises sur certaines périodes plus ou moins 
longues. Soit: 


_ 12 
#= 2 (66.812) 


+= 


la moyenne temporelle. Si Z, converge en probabilité vers # quand T 0 nous disons que le processus 
est "ergodique pour la moyenne". Donc quand 7 0: 


r 
À,= Du: —0 (66.813) 


+=l 
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8.4.1. PROCESSUS AUTORÉGRESSIFS AR(P) 


Présentons le concept de processus autorégressif en introduisant le cas particulier de processus 
autorégressif d'ordre 1, noté AR(1) et défini par la relation (à une constante additive près): 


À = PA +5 (66.814) 
Il s'agit donc d'une chaîne de Markov d'ordre 1. 


Nous disons que le processus autorégressif AR(1) est stationnaire si nous avons à toute date t: 
ElXi=u ViXi=0 (66815) 
En toute généralité, nous avons: 


L = EX, \=@E\X; i+ÆEis I =@pEiX. 1 


(66.816) 
où =ViX = pViX ui i+Viei= pi VX, +02 


et donc la stationnarité implique obligatoirement que (se rappeler que la constante additive a été posée 
comme nulle dans la définition ci-dessus, dans le cas contraire cela changer les conclusions ci-dessous): 


(66.817) 


[ef 1 


Donc la stationnarité implique in extenso les deux résultats utiles: 


E\X,\=pE(Xil=l EX )i= EX) 
(66.818) 
= oi 


Il est intéressant de remarquer que la variance est indépendante du temps et donc qu'elle ne diverge pas. 
Cependant, il ne faut pas considérer cela comme forcément positif car il n'est pas très cohérent dans la 
pratique que la volatilié soit constante (processus homoscédastique). Raison pour laquelle nous aborderons 
des modèles plus complexes dont la volatilité est dépendante du temps. 


Voyons ce que l'hypothèse de stationnarité implique et pour cela, nous allons d'abord avoir besoin de 
l'égalité suivante: 


Xe = Phys +8 = PIE) +84 146 = D Xy2 +061 +4 


h-1 (66.819) 
= Xp +7, CA 
k=0 


Donc in extenso: 
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MR) = covi À, Xe pi= EX Xi IE IE Le pl= EUX, Xp) 


h-1 
_ CE >, fa] %a]-riees ] = PElXE y | 


k=0 


(66.820) 


Et rappelons la relation de Huyghens (cf. chapitre de Statistiques): 
2 2 na 
W(X)= EX" I-Æ(XT (66.821) 


Il vient alors: 
2 
HG) = EI X2, = @ LH Lo hrEe,) |- VX nl=@'o8 (66.822 


Donc l'autocorrélation vaut: 


e(x) ___H@) d'or | À (66.823) 
# (0) #- n (0) JF ord ot 


Puisque la stationnarité implique que g< 1, les corrélogrammes (ACF) des processus AR(p) auront des 
allures décroissantes amorties: le processus oublie en quelque sorte les valeurs passées. 


Nous avons aussi pour un processus AR(1) stationnaire avec constante (offset): 
= MtAärite (06.824) 
l'espérance suivante: 


EX, )=El+gXi+el-c"+E(gxXi1l+E(&)=c"+@E(X,:)+0 


= +gEiX.1i+0=c"+gEiX,) 
(66.825) 


RE (X,)= À 
- a 


Donc si la constante est nulle nous retrouvons bien une espérance nulle comme démontré plus haut. La 
variance aura la même expression que celle déjà démontrée plus haut, c'est-à-dire: 


puisque l'ajout d'une constante ne change rien à la variance de la série. Nous avons donc obtenu ci-dessus 
l'espérance et la variance (inconditionnelles) d'un processus AR(1). 


Un processus AR(2) est un processus autorégressif qui vérifie une relation de la forme (à une constante 
additive près): 
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À = Ar FA 2 +& (66.827) 


Donc dans un tel modèle, l'influence du passé se manifeste par une régression linéaire sur les deux valeurs 
antérieures. Selon les valeurs de g et &; il n'est pas toujours possible de trouver un processus stationnaire 


vérifiant cette dernière relation. 


En général, un processus AR(p) est un processus qui dépend linéairement des p valeurs antérieures (à une 
constante additive près): 


P 
Xe = AA +. +Poden +84 = DA + &| (66.828) 
k=1 


8.4.2. PROCESSUS AUTORÉGRESSIFS MA(Q) 


D'abord une mise en garde. Il ne faut pas confondre ce processus stationnaire avec les moyennes mobiles. 
En effet, le terme n'est pas très bien choisi car s'il y a bien mobilité (ce qui est la moindre des choses de la 
part d'un processus), il est abusif de parler de moyenne... 


Nous sommes en fait dans le cadre d'une chronique de prévisions qui montrent des erreurs autocorrélées 
mais rien d'autre (au fait cela servira pour un mélange un peu plus loin). 


Présentons le concept de processus autorégressif de moyenne mobile en introduisant le cas particulier de 
processus autorégressif de moyenne mobile d'ordre 1, noté MA(1) et défini par la relation: 


À = & +66; (66.829) 
Pour un tel processus, nous avons par définition du bruit blanc: 


EIX.\=Æ (6, 1+8E(E i=0+8.0=0 
(66.830) 


ViXi= Vis i+8 Vis ii+2covi&,&4i= 07 +820? =a?|1+6?| 


Donc les deux moments sont indépendants du temps est nous avons affaire à un processus stationnaire 
faible. Cependant, il ne faut pas considérer cela comme forcément positif car il n'est pas très cohérent dans 
la pratique que la volatilié soit constante (processus homoscédastique). Raison pour laquelle nous 
aborderons des modèles plus complexes dont la volatilité est dépendante du temps. 


En ce qui concerne l'autocorrélation, nous avons d'abord (ne pas oublier de revoir les trois conditions qui 
définissent le bruit blanc et particulièrement la troisième): 


# (D = CO! À, Ày 1= COvV! Et + 6; > Et] + dE; i= Æ! À+ : À i— Ei À} F1 À ! 
= EX, Xui= Aa 1)+0E(88 2)+0E| el 1+ 8 E(e je, à) = 8El €: | 


(66.831) 


2 
=8|Visil+Elel | 


Le coefficient d'autocorrélation d'ordre 1 vaut donc: 
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= #0 COV(Xr ds) 00 
A1#+ (0) 741 (0) z (XViXu1t ler io |1+À) 

(66.832) 
8 8 


mir) 1+8 


Pour % > 1, nous avons immédiatement en faisant le même développement que: 
MG) = covi À, Lip = cov(& +661,6n +606_p = 0 (66.833) 
donc les coefficients d'autocorrélations d'ordre supérieur à 1 sont tous nuls! 
Un processus MA(2) est un processus autorégressif qui vérifie une relation de la forme: 
Àr= 8 +461 +662 (66.834) 


Et nous pouvons réitérer les mêmes développements que pour MA(1) avec enthousiasme... pour arriver 
aussi à la conclusion que l'autocorrélation (ACF) est nulle pour x > 2. 


En général, un processus MA(q) est un processus qui dépend linéairement des q valeurs antérieures: 


À = +461 +..+606 al (66.835) 


et donc pour un tel processus on peut admettre sans faire la démonstration générale que: 


EiX,\=0 


g (66.836) 
Fi À+ 1 = ou 5" & 
um 3 


i=0 


et que l'autocorrélation est nulle pour Ÿ# > 4. Ainsi, on peut facilement reconnaître un processus MA(q) 
car son ACF présente un "cut-off" à partir de q. 


8.4.3. PROCESSUS ARMA 


Nous pouvons bien évidemment envisager de combiner les deux modèles précédents (MA(q) et AR(p)) en 
introduisant: 


- Une dépendance du processus vis-à-vis de son passé avec un processus AR(p) 
- Un effet retard des aléas avec un processus MA(q) 


Con 1 | 


Un tel modèle, appelé "autorégressif-moyenne mobile non saisonnier" ou "ARMA non saisonnier", est 
caractérisé par le paramètre p de la partie autorégressive et le paramètre q de la partie moyenne mobile. 


Ainsi, un processus ARMA(p, q) non saisionner vérifie la relation: 


À$ = A Apa ++ Pot p +6 + Es +..86 à (66.837) 
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Le principal avantage des processus ARMA non saisonniers tient au fait qu'ils permettent de fournir des 
prévisions pour des échéances éloignées (du moins plus éloignée dans le temps que la prochaine date). 
Effectivement, rappelons que pour les processus AR(1), nous avons obtenu: 


E(X,)= EX, 1) (66.838) 

Nous avons alors: 

Ÿ =E X,|Z,1)= 4; (66.839) 
Soit in extenso: 

4 = E| X,ulÆ4 |=@X, (66.840) 
Les prévisions s'obtiennent ensuite de manière récursive: 

Lun =ElXulX)=6E(XulX)= x (6.841) 
Et donc d'une façon plus générale: 
Zur = GX, (66.842) 
et donc lors k devient très grand, nous avons alors: 
Lux —0 (66.843) 


Autrement dit, pour un ordre k élevée, le moële AR(1) se contente de fournir comme espérance 
conditionnelle la prévision la moyenne (historique) du processus. Quand l'espérance conditionnelle est 
nulle, nous disons alors dans le domaine des séries temporelles que "l'espérance est orthogonale à tout 
passé". 


8.4.4. PROCESSUS ARIMA 


Les modèles de séries chronologiques vus précédemment sont en réalité que des cas particuliers d'un 
modèle général empirique que l'on appelle les modèles "ARIMA"' pour "AutoRegressive Integrated 
Moving Average” connus aussi sous le nom de "technique de Box-Jenkins". 


Cette technique présuppose que la série chronologique est générée par un processus aléatoire (brownien 
ou autre) et que les valeurs futures sont liées aux erreurs passées. 


Cependant ce modèle a une limitation importante, et le fait que l'on retrouve à travers cette généralisation 
les lissages exponentiels signifie que ceux-ci ont aussi la même limitation: la série chronologique doit être 
stationnaire. Donc pour rappel, cela signifie que les moments comme l'espérance ou la variance et 
l'autocorrélation doivent être constants dans le temps. 


Un modèle ARIMA est souvent classifié sous la notation: 
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ÀRIM£A p,d,g1 


où p est le nombre de termes autorégressifs, d le nombre de différences non-saisonnales et q le nombre de 
termes d'erreurs dans l'équation de prédiction. Voici quelques exemples: 


- Moyenne: ARIMA(0,0,0) avec constante 

- Naïf: ARIMA(0,1,0) 

- Drift: ARIMA(0,1,0) avec constante 

- Lissage exponentiel simple: ARIMA(0,1,1) 

- Lissage exponentiel double de Holt: ARIMA(0,2,2) 

- Lissage exponentiel de Holt-Winters (multiplicatif): SARIMA(0,1,m+1)(0,1,0) 


Revenons un peu sur les techniques de projection (prédiction) des modèles ARIMA. Commençons par un 
cas partiulièrement simple (c'est à notre avis plus pédagogique) en considérant le processus noté AR(1) et 
défini pour rappel par la la relation (à une constante additive près): 


À = PA +E (66.844) 


Lorsque nous faisons l'estimation ponctuelle d'une projection de ce modèle, sur 1 unités de temps 
ultérieures, il est d'usage de noter la valeur ponctuelle estimée par différentes notations d'usage: 


À) Aus = PA + Etar (66.845) 


où æ est bien évidemment supposé avoir été detérminé à l'aide des valeurs historiques connues. 


Cependant, l'estimation ponctuelle projetée est. justement une estimation!!! ! Il nous faudrait donc 
connaître son espérance. L'hypothèse naïve la plus simple est alors d'utiliser l'espérance conditionnelle de 
la valeur projetée, qui nous avait mené (voir juste plus haut) au résultat: 


Lu = p! X, (66.846) 
qui tend donc vers 0 quand I tend vers l'infini comme nous l'avons déjà mentionné. Mais n'oubliez pas que 
ce modèle AR(1) est défini à une constante additive près (qui est souvent la moyenne arithmétique ou la 


médiane des valeurs connues de la série temporelle), donc dans le cas général cela tend vers une 
constante. 


Au passage, observons que nous avons explicitement l'erreur de prévision qui est donnée par: 
Le Î GG RAT) 
a) = ru — Ar) = ru — D Ag (66.847) 


Et rappelons que nous avons démontré plus haut que pour les AR(1): 


k-1 
— Ÿ: 66.848) 
À = FX +2, PE (66.848) 
k=0 


Et considérons h (respectivement 1) grand et [dl <1, nous avons alors: 
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œ 
k 
X= 2 P Eh (66.849) 
k=0 


Adapté à notre contexte de notation: 


LP) 
Xi Y ETES (66.850) 
k=0 


Soit, un processus A#4(coi. Alors: 


ra] Len] 
= Xu-RO=Xu px z Dans -e Dar 
SK 520 k=0 
1 (66.851) 


i+ 


Li ï 4 Î de 
Etui TPE +. HP Eu te + Eu tp EP  Ei —…… 


[+ 
Etai + PE + D Eu +..+9  &y 


Nous remarquons donc que l'erreur de projection + (}) est un processus du type M1? —1:. 11 vient alors 


de façon immédiate de ce dernier développement: 
Ele(?1=0 


Î 
Vle@i= o2 (1492 + pt +. +20 | 02 — 


(66.852) 


où la somme des carrées a été simplifiée en utilisant un résultat démontré dans le chapitre de Suites Et 
Séries. Nous voyons ainsi que la variance de l'erreur de prévision ne diverge pas (du moins dans le cas d'un 
AR(1)) et tend vers une valeur finie (ce qui n'est pas le cas de tous les processus) quand 1 tend vers l'infini 
à condition que [dl <1. La difficulté dans la pratique étant de choisir une technique pour déterminer 42 


(il en existe une quantité: adéquation, Monte-Carlo, Boostrapping, bayésienne, etc.!). Raison pour laquelle 
il ne faut jamais se limiter à l'utilisation d'un seul logiciel statistique pour faire des projections mais au 
moins à trois différents. 


Pourquoi revenir là-dessus penserez-vous peut-être??? Pour la simple raison qu'il nous faut un intervalle 
statistique de prédiction. Ainsi, étant donné que nous avons un estimateur ponctuel #;,; qui est la 


réalisation de la variable aléatoire de la valeur projetée et son espérance associée # +1 » NOUS pouvons 


écrire: 
Xu = Z,@+e (1 (66.853) 


Et faire l'hypothèse à la vue des développement précédents que l'erreur de prévision suit une loi Normale 
centrée: 
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Ele(i=0 e 

_ 42 ER - = (66.854) 

re @)= 1 £ — Hypothèse : e,(4) 1 
1 


Nous avons alors à un seuil de confiance donné si 2 est parfaitement déterminé: 


À #7 L h- 
AO ANT) er: SX À) +Z,pO Le (66.855) 


et si nous n'avons qu'un estimateur de {2 alors nous prendrons (cf. chapitre de Statistiques): 


: h-# 
LA, SAO+T (66.856) 
1-# f+i f CA 1-8 


La pratique de ces modèles de projections tendrait à montrer qu'ils sous-estiment le risque (la variance). 
Donc plutôt que de prendre un intervalle à 95% il vaut peut-être mieux prendre un intervalle plus élevé en 
fonction du retour sur expérience. 


Ê,0-Tnô 
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Notes personnelles: 
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67. TECHNIQUES DE GESTION 


LE de ce chapitre est d'introduire les principales techniques mathématiques de production et de 


gestion, de maintenance et de qualité dont l'utilisation est devenue indispensable aux ingénieurs, 
gestionnaires et cadres des entreprises modernes (ceux qui le peuvent font de la science, les autres de la 
méthodologie...) et qui constituent le minimum-minimorum de la connaissance du métier de la gestion en 
général. Ce sont des techniques qui datent du début du 20ème siècle et qui ont d'abord été utilisées par 
l'armée américaine pour la majorité pour ensuite se voir petit à petit implémentées dans les plus grandes 
entreprises mondiales. 


Par ailleurs, c'est un excellent chapitre pour la culture générale du physicien ou du mathématicien. et un 
acquis pour l'ingénieur! 


Beaucoup de techniques ne seront cependant pas présentées ici car ayant déjà été démontrées dans 
d'autres chapitres du site. Effectivement, les techniques de gestion complexes et critiques font un énorme 
usage des statistiques et probabilités, de la théorie de la décision, de la théorie des graphes (chaînes de 
Markov ou non, graphes complets pour la gestion de la communication), de l'analyse financière et des 
algorithmes d'optimisation. Des chapitres entiers y étant déjà consacrés sur ce site, 1l serait redondant d'y 
revenir! 


Remarque: Nous parlons souvent de 3M (Méthodes Mathématiques de Management) ou chez les 
anglophones de "scientific management" pour décrire l'ensemble des outils mathématiques appliqués à 
la gestion (il existe d'ailleurs un cursus de formation continue à ce sujet d'une cinquantaine de jours) 
ou encore de SciProM pour "Scientifice Project Management). Un terme anglophone courant et qui 
devient à la mode en Europe pour décrire ce domaine d'application est aussi le "decisioneering" 
faisant référence au fait que ce sont des outils d'aide à la décision pour les ingénieurs. 


Indiquons avant de commencer que malgré leur importance intrinsèque les techniques quantitatives de 
gestion (incluant aussi les techniques de recherche opérationnelle, modélisation par Monte-Carlo et le 
Bootstrapping vues dans le chapitre d'Informatique Théorique ainsi que Six Sigma vu dans le chapitre de 
Génie Industriel et la Théorie de la Décision) sont encore peu utilisées dans le monde industriel, soit à 
cause du manque de formation des décideurs (excepté dans le domaine de la finance), soit par le manque 
de pertinence de l'outil ou sa difficulté de mise en œuvre. Les principales craintes émises par les décideurs 
quant à l'application de modèles mathématiques dans l'entreprise sont: 


1. Les outils sont trop abstraits: Dans cette situation, je rappelle toujours que le concret, c'est de l'abstrait 
auquel on est habitué! 


2. Une prise en compte limitée des facteurs: Pour les questions stratégiques, la réponse pure et parfaite 
d'une solution mathématique semble rarement applicable de facto. Même si les techniques quantitatives 
intègrent beaucoup de facteurs, si certains aspects sont relativement faciles à modéliser au sens 
mathématique du terme (le coût, la rentabilité, la distance, la durée, la cadence, par exemple), d'autres 
éléments sont en revanche plus difficiles à modéliser: contraintes légales, volonté commerciale de faire 
barrage à un concurrent, importance des relations avec les élus, climat social, etc. Le poids de ces 
éléments dans la décision est pourtant important, parfois déterminant. 
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3. Un investissement important: L'outil mathématique lui-même exige un niveau élevé de connaissances 
mathématiques, une bonne aptitude à modéliser les problèmes et décrire les facteurs. Ces contraintes sont 
consommatrices de beaucoup de temps et d'une certaine somme d'argent (que ce soit par développement 
interne, qui consomme des ressources - ou par développement externe, qui consomme de l'argent). Il est 
alors nécessaire de trouver un équilibre entre l'investissement nécessaire et les retombées prévues. 


4. Pour des événements peu fréquents: L'entreprise ne bénéficie pas de l'effet d'expérience et donc d'une 
fois sur l'autre, le problème concerne un service différent, ou les responsables ont changé entre deux 
études. Il est donc difficile d'entretenir les compétences à l'intérieur de l'entreprise. Le décideur devra 
prendre ces différents aspects en compte lorsqu'il décidera ou non de mettre en œuvre des techniques 
quantitatives dans son entreprise. 


Nous pouvons aussi argumenter que ce qui fait que les techniques scientifiques de gestion (TQG) ou les 
méthodes mathématiques de management (3M) ne sont guère répandues est que: 


1. Dans un environnement peu exigeant le surcroît de puissance qu'offrent les TQG/3M ne justifie pas 
forcément les efforts nécessaires à leur apprentissage. 


2. Les TQG/3M sont exigeantes en raisonnements et rigoureuses, elles ne peuvent donc convenir aux 
personnes qui ne connaissent ni les uns ni les autres... 


Remarque: Méfiez-vous des entreprises - particulièrement des multinationales - qui recherchent des 
spécialistes en gestion de projets ou en logistique maîtrisant Microsoft Excel ou Microsoft Access. Car 
cela signifiera qu'elles utilisent des outils non professionnels pour faire un travail qui lui devrait 
pourtant l'être avec des outils adaptés (et Microsoft Excel ou Microsoft Access ne le sont pas)!!! Donc 
en termes d'organisation interne, vous pouvez vous assurer que ces entreprises organisent et analysent 
n'importe quoi, n'importe comment, avec un outil non adapté et donc que c'est le bordel général en 
interne. 


Nous avons choisi de présenter les techniques quantitatives de gestion les plus classiques dans un ordre 
croissant de difficulté (niveau de technicité). Cela nous semble à ce jour le choix pédagogique le plus 
pertinent. 


Redonnons un résumé schématique de la méthode scientifique vue dans le chapitre d'Introduction et qui 
s'applique assez bien au niveau du monde des affaires en ce qui concerne le managment scientifique: 
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Figure: 67.1 - Processus simplifié type 


Les sujets simples sont donnés sans exemples pratiques alors que ceux qui dépassent le niveau de l'école 
obligatoire sont accompagnés d'exemples pratiques plus ou moins détaillés. 


1. ANALYSE DU SEUIL DE RENTABILITÉ (POINT MORT) 


L'analyse du seuil de rentabilité ("break-even analysis" en anglais), appelé aussi "analyse du point mort", 
est l'ensemble des calculs permettant de déterminer le niveau d'activité minimum à partir duquel une 
organisation devient rentable pour elle-même par ses économies d'échelle, c'est-à-dire qu'elle cesse de 
perdre de l'argent sur cette activité. Évidemment, cette technique permet aussi de comparer plusieurs 
stratégies entre elles. 


Le point mort est donc assez intuitivement point d'intersection entre la courbe du chiffre d'affaires (car le 
chiffre d'affaires est normalement une fonction de plusieurs variables) et la courbe des charges (elle aussi 
une fonction de plusieurs variables) nécessaires pour produire ce chiffre d'affaires. En d'autres termes, il 
s'agit des coordonnées correspondantes à l'égalité des deux fonctions (dans la pratique on le représente 
rarement graphiquement car les variables sont trop nombreuses). 


Normalement cette technique doit permettre à un gestionnaire de déterminer des informations comme: 
- Prédire le volume de ventes pour couvrir tout juste les coûts (point mort) 


- Quel doit être le prix par unité pour couvrir tout juste les coûts (point mort) 
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- Quel est le niveau des coûts fixes qui équilibre tout juste les gains (point mort) 


- Comment les prix influent sur le volume de ventes correspondant à l'équilibre (point mort) 


L'analyse du point mot est basée sur l'hypothèse que tous les coûts relatifs à la fabrication d'un bien 
peuvent être divisés en deux catégories: coûts variables et coûts fixes. 


Le coût total 7 est défini par la relation: 
T7, = F+cO 


où F représente les coûts fixes, c le coût par unité (supposé indépendant de la quantité) de biens produits 
et Q la quantité correspondante. 


L'hypothèse que le coût par unité soit indépendant de la quantité permet est de simplifier le calcul pour 
avoir le coût total qui est une simple fonction linéaire, mais cette hypothèse n'est plus vraiment nécessaire 
aujourd'hui avec les tableurs. 


Si nous supposons que toutes les unités produites sont vendues, le revenu total 7. est défini par: 


où p est le revenu par unité vendue. 
Le point mort est alors l'égalité entre les deux coûts, ce qui signifie: 
pO=F+cQ 


Ainsi, nous pourrions alors par exemple après quelques opérations algébriques élémentaires, déterminer la 
quantité qui permet d'arriver au point mort: 


F 
p=é 


Ê= 


Ainsi, connaissant F (coûts fixes), p (revenus par unité produite) et c (coûts par unité produite), il est 
possible de déterminer la quantité Q à vendre pour arriver au point mort. 


Signalons qu'un point qui intéresse beaucoup les gestionnaires c'est l'étude de la variation de certains 
AN 


paramètres en fonction des autres variables. Nous appelons cela "l'analyse de la sensibilité". Evidemment 
dans le cas linéaire, cette analyse est assez triviale. 


Remarques: Depuis le début des années 1980, il existe des logiciels très simples à utiliser comme (@ 
Risk permettant de faire des simulations de Monte-Carlo pour déterminer le point-mort et ce même 
avec des solveurs qui permettent de résoudre des systèmes non linéaires et faire de l'analyse de la 
sensibilité très poussée. 
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2. DIAGRAMME DE PARETO 


Le diagramme de Pareto, comme nous allons le voir, est un moyen (parmi d'autres) simple pour classer les 
phénomènes par ordre d'importance. Mais la distribution de Pareto est aussi souvent utilisée en entreprise 
comme base de simulation stochastique pour des variables aléatoires représentant des investissements 
chiffrés de projets (à peu près aussi souvent utilisée que la distribution triangulaire, la distribution Bêta ou 
log-Normale dans l'industrie moderne). 


Rappelons alors qu'une variable aléatoire est dite par définition suivre une loi de Pareto si sa fonction de 
répartition est donnée par (cf. chapitre de Statistiques): 


X 


£ 
rue m=1-[% | (67.5) 


avec & ER, et x2x,,2 0 (donc x > 0) et pour l'espérance (moyenne): 


: &.x _ 
= (67.6) 
&—1 
et la variance: 
kx2 fkx Ÿ R2 
o= VX) = — = — x (67.7) 
k—-2 \k-1 (&—1Y (&-2) 


Pour illustrer ce type de représentation, nous supposerons qu'une étude de réorganisation du réseau 
commercial de l'entreprise LAMBDA conduise le directeur commercial à s'intéresser à la répartition des 
55'074 bons de commande (valeur en bas à droite du tableau) reçus pendant une année donnée selon la 
ville où sont domiciliés les clients (nous avons retenu ici les 200 premières villes du pays imaginaire d'où 
les 200 lignes réparties en 5 colonnes). 


Pour calculer les paramètres de la loi de Pareto, le lecteur devra se reporter au chapitre de Génie 
Industriel, car nous n'allons ici avoir qu'une approche qualitative comme le font les gestionnaires, 
l'analyse quantitative étant réservée majoritairement aux ingénieurs. 


Ces données sont reproduites dans le tableau ci-dessous: 
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Tableau: 67.1 - Dataset pour analyse de Pareto 
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où les 200 valeurs n, (nombre de bons de commande en provenance d'une ville i) ont été classées par 


valeurs décroissantes et cumulées dans une colonne N # 


La première ville se caractérise par 8'965 bons de commande (ce qui correspond à 16.28% du total des 
bons), la seconde par 4'555, ce qui fait que les deux premières villes ont passé 13'520 bons de commande 
(ce qui correspond à 24.55% des bons), les trois premières villes, ont passé 16'589 bons de commande (ce 
qui correspond à 30.12%), etc. Une autre façon de décrire ce phénomène consiste à dire: 0.5% des villes 
(classées par valeur décroissante du critère) ont passé 16.28% des bons, 1% des villes ont passé 24.55% 


des bons, etc. 


Ces calculs, sont partiellement présentés dans le tableau ci-dessous: 


Tableau: 67.2 - Données cumulées et normalisées pour analyse de Pareto 


traduits graphiquement (selon les traditions d'usage) ci-dessous sous la forme d'un diagramme de Pareto: 


Hombre de bons 
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DIAGRAMME DE PARETO 


on 
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Figure: 67.2 - Diagramme de Pareto 


ou de manière plus pertinente sous la forme d'un diagramme de Lorenz (l'abscisse des numéros des villes 
est remplacée par le cumulé de villes comme dans le tableau de données ci-dessus): 
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DIAGRAMME DE LORENZ 
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Cette analyse met en évidence qu'un nombre faible d'éléments est à l'origine de la majeure partie du 
phénomène étudié (par exemple, ici 31% des villes génèrent 80% des bons de commande). Ceci explique 
qu'elle soit l'une des grandes techniques utilisées dans le domaine de la "gestion de la qualité 

totale" (Total Quality Management) ET dans l'analyse de l'importance des causes d'un problème de 
qualité. Elle est également utilisée par les gestionnaires pour structurer l'organisation, en particulier pour 
différencier les processus en fonction de caractéristique de la demande (suivi différencié de la clientèle 
selon son importance, par exemple) et lorsqu'elle est utilisée pour définir 3 classes, cette technique prend 
souvent le nom de "Méthode ABC" ( ). 


La ligne en pointillés de ce graphique correspond, elle a ce que nous aurions observé en cas 
d'équirépartition du phénomène étudié, c'est-à-dire si chaque ville s'était caractérisée par le même nombre 
de bons de commande. 


De façon générale, plus une courbe de Pareto (ou de Lorenz) se rapproche de la droite d'égalité parfaite et 
plus la répartition de la masse considérée au sein de la population est égalitaire. En effet, dans ce cas, la 
masse (des salaires, de la richesse, du revenu, etc.) est peu concentrée sur quelques-uns. 


Remarque: La présentation de cette analyse a été faite en classant les observations par valeurs 
décroissantes, mais nous aurions pu tout aussi bien partir d'un classement par valeurs croissantes et, 
dans ce dernier cas, la courbe obtenue aurait été symétrique, le centre de symétrie étant le point de 
coordonnées (0.5,0.5). 


Dans un environnement industriel, les points d'amélioration potentiels sont quasi innombrables. On 
pourrait même améliorer indéfiniment, tout et n'importe quoi. Il ne faut cependant pas perdre de vue que 
l'amélioration coûte aussi et qu'en contrepartie elle devrait apporter de la valeur ajoutée, ou au moins 
apurer des pertes. 
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2.1. INDICE DE GINI 


Le phénomène étudié est d'autant moins équitablement réparti que la courbe s'éloigne de la droite 
d'équirépartition. Les économistes, gestionnaires ou responsables de départements d'entreprise utilisent 
parfois (pour leur tableau de bord de performance) un indicateur synthétique pour mesurer ce phénomène 
et son évolution, "l'indice de Gini" (appelé aussi "coefficient de Gini"). 


Ce coefficient est défini par le rapport: 


A 
A+B 


(67.8) 


où les surfaces À et B se rapportent à la figure ci-après. 


tir 


“ 


à répar 


à 


cumulé de la population 


cumulé de la masse 


cumulé de la population Yocumulé de la masse à répartir 


Figure: 67.4 - Les deux situations les plus courantes de l'indice de Gini 


Le coefficient de Gini est donc un nombre réel compris entre zéro et 1. En cas d'égalité parfaite, 1l est égal 
à zéro (car A—0). En cas d'inégalité totale il est égal à 1, car B=0. Par conséquent, à mesure que G 
augmente de 0 à 1, l'inégalité de la répartition augmente. 


Sachant que la courbe de Lorenz est 1x1 on voit que la surface A+B est égale à la moitié de cette surface. 
Nous avons donc: 


ArB=? (67.9) 

F 

Nous pouvons de ce fait écrire: 
 A4+B 1. (67.10) 

à 

De plus comme: 
1 
nr ou de (67.11) 


Finalement, nous pouvons écrire que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


g=-4_- 24=1-28 (67.12) 


A+B 


En utilisant la méthode de calcul d'intégrale des trapèzes (cf. chapitre de Méthodes Numériques) nous 
avons l'aire B qui est donnée par: 


nl n-l 
G=1-2. (&iæ)- 1- (43 +45) PAC) 
10 ; 


2=0 
. ; (67.13) 
=1- AD (Ga) + G))= 1-47 Oran +) 
:=0 10 


où pour rappel h est la longueur des intervalles supposés tous égaux (ce qui est toujours le cas dans le 
contexte des analyses de Lorenz) et si la configuration du tableau de données est telle que nous ayons le 


graphique suivant (ce qui est plutôt rare….): 


partir 


à répar 


x 


cumulé de la masse 


cumulé de la population 


Figure: 67.5 - Choix pour le calcul de l'indice de Gini 
Traditionnellement nous trouvons cette dernière relation sous la forme: 


1 n 
G=1-—5 (mu +») (67.14) 
# ;=2 


où n représente le nombre d'unités statistiques (la population). 


Dans la situation où le graphique est sous la forme (cas qui est nettement le plus fréquent en entreprise et 
correspond par hasard à notre exemple!!): 
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cumulé de la population 


cumulé de la masse à répartir 


Figure: 67.6 - Deuxième cas pour le calcul de l'indice de Gini 


La méthode des trapèzes nous amène alors à écrire: 


g=i-2(r-4ie) 1-24 (4 +Ap) PC EC) 
1=Ù 10 


. _ (67.15) 
= 1445 (fu) +) = 1449 (yen +%) 
;—0 iÙ 


Traditionnellement nous trouvons cette dernière relation sous la forme: 
1 ñn 
G=-1+-5 (ut) (67.16) 
# ;=| 


Dans le cas qui nous sert d'exemple depuis le début avec le tableau: 


ns fiézs pos res jos fase bos rss bos pre | 
nas hr fair hi so ki Pre ii 77 | 
ER JE DS TER LEON EN QU JE JE 


RE 


pr hs pue bp horhs br p pr | 
CES ROLE US EN DS 2 M UM 


22H 67.3 - Données LC et Ds pour CES de ms 


et en adoptant les notations en conséquence, cela donne: 


12 1 200 335.10 
GE HE LOM +H)E SL Mu %+N M )=-1+ —— 506 = 0.675 (67.17) 


i=1 
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3. PERT PROBABILISTE 


En restant toujours dans le cadre des statistiques et probabilités relativement aux techniques 
mathématiques de gestion, il existe une loi empirique en gestion de projet (domaine que nous supposerons 
connu par le lecteur car trivial) très utilisée dans le cadre des "PERT probabilistes" (Program Evaluation 
and Review Technic) et incluse dans nombres de logiciels spécialisés afin de faire des prédictions de coûts 
et de temps (cf es). Nous parlons alors de "Probabilistic Network 
Evaluation Technic" (P.N.ET.). 


Cette loi, appelée "loi bêta" ou encore "loi de Pert" est souvent présentée sous la forme suivante dans les 
ouvrages et sans démonstration (.….): 


CE) + 4'ér(T) +£ (7) 


tx (A) = 6 


et donne la durée probable (espérée) 4, d'une tâche élémentaire (non décomposable en sous-tâches) où 
nous avons 5,{y,é» qui sont respectivement les durées optimiste, vraisemblable et pessimiste de la tâche 


Æ. Nous allons démontrer plus bas la provenance de cette relation et en quoi elle est partiellement fausse! 


Remarque: Cette approche classique date de 1962 et est due à C.E. Clark. Elle serait basée sur une 
analyse de bases de données de tâches de projets. Il faut par contre vérifier systématiquement quel 
type de loi suivent les tâches dans votre entreprise et ne pas appliquer bêtement et simplement la loi 
bêta. 


Ses principes sont les suivants: 


La durée de chaque tâche du projet est considérée comme aléatoire et la distribution Bêta est 
systématiquement utilisée; les paramètres de cette loi que nous allons démontrer sont déterminés 
moyennant une hypothèse de calcul assez forte, à partir des valeurs extrêmes a et b que la durée 
d'exécution peut prendre, et du mode Àf, . 


Il suffit donc de poser les trois questions suivantes: 
1. Quelle est la durée minimale physiquement possible? 
2. Quelle est la durée maximale au pire? 


pour obtenir respectivement les paramètres &,b,f, , qui permettent ensuite de calculer la moyenne 
(espérance) et la variance de cette durée aléatoire. 


Ensuite, nous déterminons le chemin critique du projet (par la méthode des potentiels métra supposée 
connue par le lecteur), en se plaçant en univers certain et en utilisant les durées moyennes (espérées) 
obtenues avec la loi Bêta, ce qui permet de trouver le(s) chemin(s) critique(s). 
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Ensuite, nous nous plaçons en univers aléatoire et la durée du projet est considérée comme la somme des 
durées des tâches du chemin critique précédemment identifié. Nous utilisons alors le théorème de la limite 
centrale vu dans le chapitre de Statistiques (rappelons que ce théorème établit, sous des conditions 
généralement respectées, que la variable aléatoire constituée par une somme de n variables aléatoires 
indépendantes suit approximativement une loi Normale, quelles que soient les lois d'origine, dès que n est 
assez grand) pour approximer la loi de distribution de probabilités de la durée d'exécution du projet. 


L'espérance mathématique (ainsi que la variance) de cette loi Normale se calcule comme la somme des 
espérances mathématiques (ou des variances) de chaque durée des tâches du chemin critique (cf chapitre 
de Statistiques) tel que: 


k k 
E 2 nr (67.19) 


et dans le cas particulier où les variables sont linéairement indépendantes, la covariance étant nulle (cf. 
chapitre de Statistiques) nous avons aussi: 


2 2 
4 pr = 27 (4) (67.20) 


Rappelons que nous avons vu dans les chapitres de Statistiques et Calcul Différentiel Et Intégral que: 


_Tæ) Ta) 


pl ,g1 _— 
B(p,4) C@+0 [' (1-£)* df (6721) 


et 
Féx+D=x" (x) (6722) 


En gestion nous remarquons que souvent, les durées des tâches suivent une loi que nous appelons "loi bêta 
de première espèce" (cf. chapitre de Statistiques) donnée par: 


2,0 = 7-7 


f (1-t} dt 


1 
P.1 (67.23) 


Pour un intervalle [a,b] quelconque dans lequel x est compris, nous obtenons la forme plus générale: 


(x-a) =} 
fs) = Ka (67.24) 


a 
(b- aÿ**7* Fe (1-é) dt 


Vérifions que nous ayons bien: 


è 
LP ,(x)dx = | fra) (b-x) dx =1 


Pémn,  + 


(67.25) 


(b- a)*7*1 fr (1- #} dt 
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Par le changement de variable: 


(67.26) 


nous obtenons: 


? fe —a)u)"(® x) (b - a)du fe (b - x} du 
[Rs Car = D ——— — —— —_—_—- 
g G-a)7* f° (-9’d&t  @-aÿ fr (1-4) dt 


1 {b-x r 

[- F=) cdi 1 1 | 

a (lu) du =1 
1 (1- £)” dé Fe (1 - £)” dt 


(67.27) 


Déterminons maintenant l'espérance: 
1 : (e4 Fr 
fra) (b= ri" dx 


b 
pe = [x 2, GX = ——# —— 
. @-ay"*7"? joe ty" at 2 


(67.28) 


Toujours avec le même changement de variable, nous obtenons: 


Li = fr EP, ,(x)dx = —— fe +u(b-a)) u*(1-u)" du 

” [ES -{)" dt 
i (67.29) 
ee =at(b-a) 
(Le 


B(æ+2,7+D 
B(æ+1,7 +1) 


B(a+2,y+1) Tæ+2) T(y+1  Tæ+y+2) 

B(a+17+1 Céœ+y+3  T@+D'T(y+1 

_ _Tæ@+2) Tæ+y+2) _(æ+l)(@)l(a) Fæ+y+2) 

Féæ+y+3) T(æ+1) F(æ+7y +3) a (a) 
(æ+D(a)T (a) FE RF2lr EF] 


(a + y +2)T (+ 7 +2) a (a) a+y+2 


(67.30) 


Donc: 
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Calculons maintenant la variance en utilisant la formule d'Huyghens démontrée dans le chapitre de 
Statistiques: 


V(X)=ECX?)-E(XŸ (6732) 
Calculons d'abord E(X 2 ). 


b B 
EC") = fr" Rs Gdx = 1 x''{x-a) (b - x)” dx 
J (67.33) 


1 
@-a>"*7" fr -ty'at° 


Toujours par le même changement de variable, nous obtenons: 


E(X?) => 


1 

[le +u?(b-a) + 2a'u(b-a)}u*(1-u)"du 
1 {4} di 

@-a) 


2a(b-a) | 
B(æ+1,7+1 


B(a+3,7+1)+- EC -u)" du 
li -{)" dt 


—— | — 
2-0) (£ calculs psicédents) 
Si DD Th Peer nt 

aryr2 B(æ+1,7+1) 


(67.34) 


Ba+3,y+1)_T(@+3) T(y+D, Tæ+y+2) _ (æ+2)(@+tD 
B(@+1y+) I(@+y+4) T(@+l)I(G+) (@+y+3(a+y+2) 


Donc: 


E(X?) = a° NC RUE (æ+2)(æ+D 


aæ+y+2 G@+y+3@ry+2 (70 


Pour finir: 


VCX) = o? = E(X*)-E(X) = E(X°?) -4° 


2 
æ+l 


æ+2 071 
aæ+y+2 (67.37) 


NE 0 A 
nry+r2 DEVr3 dira 


{ere 


og. #1 .f a+2 _ a+ eee 


aty+2|aty+3 a+y+2 (æ+y+2Ÿ (a+y+3) 


Calculons maintenant la valeur modale À, de cette loi de distribution (pour rappel du chapitre de 
Statistiques il s'agit par définition du maximum global de la fonction de distribution): 
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(x-al Gex) 


P ,(x) = 
2 (x) (2 (6738) 


— +" — — 
(a= ci (1-6) dt 
Il suffit pour le calculer de résoudre l'équation: 


= =0 (67.39) 
à 


dr 2.8 (2) 
: 
Après dérivation, nous obtenons: 
aix-a) x)" - px -a)*(b- 7120 (6740) 
en divisant par (x - Ps -x)7 nous avons: 


Œb-x)-y(x-a) =0 (6741) 


c'est-à-dire: 


Maintenant, le lecteur aura remarqué que la valeur a est la valeur la plus petite et la b la plus grande. 
Entre deux il y a donc le mode 4. 


En gestion de projets, cela correspond respectivement aux durées optimiste £,, pessimiste £, d'une tâche. 
Ensuite, nous imposons une hypothèse assez forte: 


a=2+ÿ2,y=2-/2 oùuæ=2-V2y=2+42 (6743 


Ce qui implique que nous ayons: 


_ab+ya (2+V2)2+(2-42}a _ 2h+42b+9a-V2a  2a+b)+42(b-a) 
a+y 4 L 4 | 4 


M (67.44) 


ainsi que: 


@-a) (æ+1)(7+1) _@-a)(4+2-2+2+1) _(b-a)ÿ 


FX) = 
ss, (a+y+2) (æ+y+3) 76 6? 


(67.45) 


Et finalement: 
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a+1 _6a+(b-a)(2+/2 +1) 


E(X) = à + (b- a): ——— 
æ+y+2 6 
_6a+2b+V2b+b-2a-\2a-a _Satatb+b+2b+b-2a-N2a-a 
6 6 
_atb 2a+2b+(b-a)V2 _a+b AM) _a+4Mo+b 
6 6 6 6 6 


Ce qui nous donne sous forme synthétique: 


_ 2@+b)+2@-a) 


M : 

a(X)= = (67.47) 
a+ 4, +b 

EX) = —— 


Remarque: Les deux dernières expressions de la variance et de l'espérance sont celles que vous pouvez 
trouver dans n'importe quel livre de gestion de projets (sans démonstration bien sûr...) comme par 
exemple le fameux PMBOK. Malheureusement, il y a une erreur dans cet ouvrage de référence de 
gestion de projets à ma connaissance (elle a été confirmée et corrigée plus tard). Effectivement, la 
valeur modale y est imposée par le chef de projet alors qu'en toute rigueur elle doit être calculée avec 
la première des trois relations ci-dessus à partir de la durée pessimiste et de la durée optimiste de la 
tâche!!! 


Indiquons qu'exactement les mêmes développements effectués jusqu'ici sont valables avec la formulation 
suivante de la loi bêta: 


Ga)" (za) _(G-a"(x-a)” 


By = = 
? a)" B(a,y)| (67.48) 


Ï 
(b . a)*#7# fs” ( ee + fe 
0 


cette dernière formulation étant celle disponible dans les logiciels ou tableurs comme la version française 
de Microsoft Excel 11.8346 par exemple en utilisant la fonction LOI.BETA( }) et pour sa réciproque par 
LOI.BETA.INVERSE). 


Nous obtenons alors pour l'espérance: 


Ha ee EE 
B(E&, y) a+ 
et pour la variance: 
2 
de 
por= 05e) æ (67.50) 
(a+y) (a+y+1) 
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et le mode: 


_ &b-b+}7a-a 


M 
a+y-2 


(67.51) 


Avec: 


a=3+42,7y=3-4/2 (67.52) 
Sinon pour le reste, les résultats (expressions) restent exactement les mêmes! 
Exemple: 


Tracé de la fonction de distribution et répartition pour la fonction de bêta de paramètres 
(£a fy tp) = (0,1,3) : 


1 
0 
0 
04 
Q 
& oo 
bi. 
o ô Le se pe er ci S 9 co s _ — En a Fe] EC 


Figure: 67.7 - Fonction de distribution et de répartition de la loi bêta 


Nous définissons aussi le "risque d'action" par le rapport (dont l'interprétation est laissée aux responsables 
de projet et aux clients): 


_ Ep(T) = tof) 


ART 
EL t() 


(67.53) 


4. PROCESSUS SIX SIGMA (LEAN) 


Comme nous l'avons vu dans le chapitre de Statistiques, la loi Normale est une fonction en forme de 
"cloche" donnée par: 


(67.54) 


dont les écarts-types sont utilisés pour donner l'intervalle de probabilité cumulée de se situer dans ces 
bornes centrées sur la moyenne comme représenté ci-dessous: 
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| - 997% = Ho | 
| - 954% = 2 | 
| - 68.3% = +19 | 


30 20 17 a=N HT #20 #30 


Figure: 67.8 - Rappel des intervalles sigma de la loi Normale 


Ceci étant rappelé, nous avons également présenté dans le chapitre de Génie Industriel les probabilités 
conjointes dans le cadre de Six Sigma pour une chaîne de processus P connectés en série. 


Au fait les processus mentionnés ne sont pas forcément des processus industriels mais peuvent être 
assimilés sous des hypothèses identiques à des processus quelconques (administratifs, procédures, 
workflows, etc.). 


Nous avions vu que la probabilité conjointe (ou cumulée) est appelée dans Six Sigma "Rolled Troughput 
Yield" (R.T.Y.) ou "Rendement Global Combiné" (R.G.C.) et est donnée par (cf chapitre de Probabilités) 


RTY = ne =[I2 (67,55) 


Par exemple, l'application de la relation précédente donne pour un processus série en 4 étapes dont la 
fiabilité est de 90% chaque (sur des structures plus complexes, rappelons que nous parlons parfois 
"d'arbres de probabilités pondérés"): 


Processus À 184 C) RTY 
65.6% 


Rendement 90% 90% 90% 90% 
Figure: 67.9 - Processus série 


Nous nous retrouvons donc au final avec une fiabilité de 65.6% soit une probabilité cumulée de défaut 
pour l'ensemble du processus de 344%. 
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Remarque: Le lecteur attentif aura remarqué que le système série est toujours moins fiable que sa 
composante la moins fiable!! 


Redonnons le tableau au pire selon Six Sigma, soit le tableau en procédé non centré avec une déviation de 
la moyenne de +1.5 (donc à droite mais on pourrait prendre à gauche et les résultats sont les mêmes) 
par rapport à la cible et d'écart-type unitaire avec USL et LSL symétriques (ce qui restreint toujours le 
champ d'application): 


[05 OÙ SOS Mana 
0 7 | 
Do 0 7 2] 
OO 2] 
O0 2 | 
D 6 | 
59) | — 
D 
D 0 À 
a 
D 
a 
a 
A 
DE Se TE 


Tableau: 67.4 - Défauts et niveau de qualité Sigma en procédé décentré 


où nous avons démontré dans le chapitre de Génie Industriel que les valeurs PPM étaient données par: 


y UE GAY ; LSE -G-HY : 
PPM ao, =|1- —— e dx |: 10° +| —— e dx |-10 
Le mA nl 
3C, (x-1.50Ÿ —3(C,#1) (x-150ÿ 

Pres [e T7 a&|105+ — e 2 dxl.18 «6156 

27 À 27 À 

3C, _(x-1.5Ÿ | —3(C,+#1) _(x-1.5ÿ 
lie [ e 2 dxl.1Ô%+|—— [ e 2 dx|.10 

23T 0 277 0 


Ce qui donne pour un niveau de qualité de 3 sigmas: 


>evalf((1-1/sqrt(2*Pi)*int(exp(-(x-1.5) 2/2),x=-infinity..(1*3))))*1E6+evalf((1/sqrt(2*P1)*int(exp(-(x-1.5) 
N2/2),x=-infinity..-(3*(1+1)))))*1E6; 
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soit une valeur de -66'810 c'est-à-dire la valeur de la 6ème ligne. Ce qui correspond à -6.68% en termes 
de probabilité cumulée de non-qualité (66'810 divisé par 1 million et mis en pourcents) et donc 
respectivement à une probabilité cumulée de -93.32% de qualité. 


Nous avons le tableau suivant qui peut résumer certaines valeurs importantes du tableau précédent en 
utilisant la commande Maple 4.00b donnée précédemment: 


Tableau: 67.5 - Valeurs importantes de maîtrise du procédé 


Sous l'hypothèse que chaque étape d'un processus série suit la même loi avec les mêmes moments et les 
mêmes déviations par rapport à la cible nous avons alors pour le RTY: 


Étapes/ 


Qualité% is 


KE 


25.08 


TN 


Tableau: 67.6 - Niveau de qualité d'un processus/procédé ayant un nombre fini d'étapes 


En 


où chaque ligne représente le Rolled Troughput Yield (RTY) donc calculé avec: 


RTY = Ana =II2 (46757) 
è è 


où i est le nombre d'étapes du processus (1, 7, 10, 20, 40) et où les probabilités sont données par la 
première ligne (1). Ainsi, avec un niveau de qualité de +34 et une déviation à la cible de +1.54 nous 
avons pour un processus de 20 étapes identiquement distribuées: 


RTY=I[R=[]9332%-2508% (6750 
] 20 


1 
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ce qui est lamentable! Un procédé industriel en 20 étapes d'un produit complet devrait avoir au minimum 
un niveau de qualité de 4 sigmas pour être acceptable en termes de rendement et de qualité 


Ainsi, l'objectif du Lean Six Sigma dans une entreprise sera d'augmenter le niveau de qualité avec un RTY 
maximum pour un nombre donné d'étapes d'un processus. 


5. MODÈLE STATISTIQUE DE CONTRÔLE DES SALAIRES 


Basé sur les us et coutumes en statistiques, le contrôle statistique des salaires (C.S.S.) peut se justifier 
puisque l'outil et le principe de base est appliqué dans tous les domaines de l'économie (finance, médecine, 
ingénierie, qualité, biologie, projets, logistique, commerce, etc.) 


L'idée empirique, fort simple, est d'analyser la distribution statistique des salaires dans une population 
(nation, entreprise, département, niveau hiérarchique ou autre...) et de considérer tout ce qui est au-delà de 
99.9996% de probabilité cumulée comme une anomalie. Au contraire, ce qui est à l'intérieur de l'intervalle 
sera justifié conformément aux standards d'usage et ne nécessitera dont ni débat, ni explications 
hasardeuses. 


Déjà, une première règle empirique évidente, est que la variable aléatoire des salaires doit être catégorisée 
si sa distribution statistique est multimodale. Ce qui est fréquent dans certaines entreprises ou institutions. 
Il convient ensuite de choisir adéquatement les catégories qui seront fréquemment des niveaux 
hiérarchiques normalisés au sein de l'institution (ressources, responsables d'équipes, responsables de 
projets, directeurs de projets, direction...). 


Une fois ceci fait, 1l doit rester une distribution statistique unimodale dont la variable aléatoire est 
strictement positive (les salaires négatifs étant rares.….). 


Par exemple, pour l'ensemble des salaires bruts annuels fixes en fin de carrière dans le canton de Genève 
(Suisse) en 2004 (source: Office Cantonal Genevois du personnel), nous avons la variable aléatoire qui 
suit une loi log-logistique de paramètres: 


E =109157.-CHF 
= 54"238.- CHF 
M, =96"338.- CHF 
Mod = 35'224.- CHF 


(67.59) 


Nous avons ainsi: 


300000 


l'ableau: 67.7 - Centile de la répartition des salaires avec valeur correspondante 
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Ainsi, si nous nous basons sur les us et coutumes en statistiques de la gestion de portefeuilles et du risque 
dans les bons instituts financiers, un salaire annuel de plus de 300'000.- CHF à Genève, tous secteurs et 
hiérarchies confondus, est une anomalie. 


Si nous nous basons sur les us et coutumes en statistiques de la gestion du risque et de la qualité dans 
l'industrie des procédés de fabrication massive, un salaire annuel de plus de 2'030'000.- CHF à Genève, 
tous secteurs et hiérarchies confondus, est une anomalie. 


Si nous nous basons sur les us et coutumes des statistiques les plus pointues en termes de qualité et du 
contrôle du risque, un salaire annuel de plus de -13'040'000.- CHF à Genève, tous secteurs et hiérarchies 
confondus, est une anomalie. 


Ainsi, il serait contradictoire que les personnes dirigeantes qui imposent des critères statistiques à leurs 
collaborateurs en ce qui concerne les services et la production ne les respectent pas eux-mêmes en ce qui 
concerne leur salaire ou n'impose pas des règles identiques au département des ressources humaines (dont 
le concept de qualité statistique est souvent inconnu.….). 


Remarque: Le même raisonnement statistique peut s'appliquer pour la part variable du salaire. 


6. GESTION DES STOCKS 


L'enjeu de la gestion des stocks et approvisionnement est important: mettre en place des processus qui 
optimisent la fonction économique, sous contrainte d'une disponibilité en théorie sans faille. Tels sont les 
objectifs du gestionnaire de stocks. Cela suppose de disposer d'une visibilité sur ses stocks et des 
méthodologies appropriées aux différentes situations. 


Une production sans stock est quasi inconcevable vu les nombreuses fonctions que remplissent les stocks. 
En effet, la constitution de stocks est nécessaire s'il y a: 


- Non-coïncidence dans le temps ou l'espace de la production et de la consommation: le stock est 
indispensable dans ce cas, car 1l est impossible de produire là et quand la demande se manifeste. Les 
exemples classiques sont la fabrication de jouets ou la confiserie pour la non-coïncidence dans le temps, et 
les supermarchés pour la non-coïncidence dans l'espace. 


- Incertitude sur le niveau de demande ou sur le prix: s'il y a incertitude sur la quantité demandée, on va 
constituer un stock de sécurité qui permet de faire face à une pointe de demande (en prenant soin d'éviter 
l'effet "coup de fouet"). S'il y a incertitude sur le prix, on va constituer un stock de spéculation. Par 
exemple, les compagnies pétrolières achètent plus que nécessaire en pétrole brut lorsque le prix de celui-ci 
est relativement bas sur le marché. 


- Risque de problèmes en chaîne: il s'agit ici d'éviter qu'une panne à un poste ne se répercute sur toute la 
chaîne d'approvisionnement. Un retard d'exécution au poste précédent ou une grève des transports 
n'arrêtera pas immédiatement l'ensemble du processus de production s'il y a des stocks tampons. 


- Présence de coûts de lancement: dans ce cas, travailler par lots permet une économie d'échelle sur les 
coûts de lancement de production mais, en revanche, provoque une augmentation des coûts de possession 
du stock. 
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Le contrôle du stock et de l'approvisionnement d'une entreprise est donc aussi fondamental dans la vie de 
celle-ci. Afin de réduire (ou optimiser c'est selon...) un maximum les coûts divers qui tournent autour du 
stockage, il faut faire encore une fois appel à des connaissances en statistiques mathématiques comme 
nous allons le voir de suite. 


Remarque: L'application de ce type d'outils ne s'adressent pas vraiment aux P.M.E. de moins de 50 
employés produisant de petites pièces de manière irrégulière mais plutôt à des multinationales 
produisant en énorme quantité ou en faible quantité des objets de consommation de taille non 
négligeable et de manière régulière. Par ailleurs comme auteur de ces pages, je me suis renseigné dans 
de nombreuses entreprises (dont des multinationales!) et je n'ai trouvé encore aucun logisticien 
utilisant dans la pratique les modèles mathématiques qui vont être présentés ci-après. 


Dans un premier temps, nous allons établir comment déterminer le stock initial nécessaire à une entreprise 
en se basant sur des données statistiques et ce à partir de modèles simples ensuite de quoi nous ferons de 
même avec les modèles de réapprovisionnement dont la démarche d'approche est un peu différente et 
permet comme pour la première d'arriver à des résultats très satisfaisants à grande échelle. 


Les modèles que nous allons construire permettront ainsi: 

1. De réguler les aléas des flux de fournitures 

2. De permettre la production par lots (réduit les coûts de production) 
3. De faire face à des demandes saisonnières 


Des stocks supplémentaires pouvant engranger des "coûts d'intérêt" (capital immobilisé), des "coûts 
d'obsolescence" (les produits deviennent entre temps obsolètes), des "coûts de stockage", des "coûts 
d'assurances" (protection contre les accidents pouvant subvenir sur les produits) et de nombreux autres... 


Nous distinguons dans le domaine classiquement trois types de stocks: 


1. Le "stock minimum", appelé encore "stock tampon" ou "stock d'alarme" ou "point de commande" ou 
"seuil de réapprovisionnement" est la quantité de stock à partir de laquelle on lance une nouvelle 
commande pour augmenter les réserves. 


2. Le "stock de sécurité" qui permet de répondre aux aléas les plus fréquents liés à la consommation et à 
la livraison. 


3. Le "stock d'alerte", appelé encore "stock critique" qui est le niveau de stock pour lequel on déclenche 
une commande au risque de connaître une rupture. Par construction le stock d'alerte est donc la somme du 
stock de sécurité et du stock minimum. 


On considère souvent trois stratégies de gestion de stocks: 


1. La "gestion de stock par point de commande": l'approvisionnement du stock est déclenché lorsque l'on 
observe que le stock descend en-dessous du point de commande. 


2. La "gestion calendaire": l'approvisionnement du stock est déclenché à intervalles réguliers T, par 
exemple, chaque jour ou chaque semaine. 
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3. La "gestion calendaire conditionnelle": l'approvisionnement du stock est déclenché à intervalles 
réguliers T, mais uniquement lorsque l'on observe que le stock descend en-dessous du point de 
commande. 


Un stock est constitué pour satisfaire une demande future. En cas de demande aléatoire, il peut y avoir 
non coïncidence entre la demande et le stock. Deux cas sont évidemment possibles: 


1. Une demande supérieure au stock: nous parlons alors de "rupture de stock" 
2. Une demande inférieure au stock: nous parlons alors de "stock résiduel" 


Le critère de gestion généralement retenu en gestion des stocks est celui de la minimisation des coûts. 
Nous noterons cette fonction par la lettre C, suivie, entre parenthèses (ou en indice), de la ou des variables 
de commande du système. 


6.1. STOCKS EN AVENIR INCERTAIN 


Commençons notre étude par le cas le plus simple qui suppose que la consommation est statistiquement 
régulière dans le temps et sous contrôle. Il s'ensuit (cf sd itistiques et d i lustriel) que 
la consommation périodique suit alors une loi de Gauss. 


Prenons un exemple concret puisque la théorie a déjà été étudiée en long et en large dans le chapitre de 
Statistiques. 


Considérons un article dont la demande quotidienne suit approximativement une loi normale de 
paramètres: 


4= 50, = 20 


Le stock disponible au moment de la commande est de 500 unités et le délai de réapprovisionnement de 5 
jours. Nous souhaiterions savoir quelle est la probabilité cumulée d'être au-dessus ou égal à la rupture de 
stock ainsi que la probabilité cumulée d'être au-dessus de la consommation quotidienne supposée? 


Nous avons pour le premier point la consommation moyenne sur 5 jours qui est en utilisant la propriété de 
stabilité de la loi normale: 


y = 5.90 = 450 


a = 202 + 202 + 202 +202 + 202 = 20. 45 = 44.72 


Nous avons alors: 
P(X 2450) =13.17% 


soit en utilisant la version française de Microsoft Excel 11.8346: 
=1-LOI.NORMALE(500;450;44.72;1)-13.17% 
Et pour la consommation quotidienne, il vient simplement: 


=1-LOI NORMALE(500;450:44.72;1)-30.85% 
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Évidemment, dans la pratique la réalité est beaucoup moins simple et de plus, la loi normale peut avoir 
une faible probabilité de ventes négatives, ce qui est peu réaliste. Mais c'est déjà un premier modèle qui 
peut être confronté à la réalité pour voir sa puissance prédictive. 


6.2. STOCK INITIAL OPTIMAL EN GESTION CALENDAIRE ET À ROTATION NULLE 


Imaginons de suite un scénario afin de développer un autre modèle statistique mais un tout petit peu plus 
élaboré que le précédent (inspiré de l'ouvrage Gestion de la Production de Vincent Giard). Nous nous 
limiterons cependant ici à une loi statistique discrète et nous referons ensuite un exemple similaire avec 
une loi continue. 


Considérons pour cela que l'entreprise MAC est la spécialiste d'un certain produit dont le coût direct de 
fabrication par unité est de 25.- et le prix de vente 60.- par unité (prix supposés constants et donc 
indépendants de la quantité et sans escompte). 


La vente quotidienne de ce produit est, en semaine, de 2.5 en moyenne et le relevé des demandes pendant 
trois mois laisse supposer que celle-ci suit une loi discrète de type de Poisson (cette fois-ci le support est 
au moins positif contrairement à l'exemple d'avant...), c'est-à-dire que nous avons une distribution de 
probabilités du nombre X de ces produits au cours d'une journée. Nous tronquerons à x = 10 la réalisation 
de cette variable aléatoire car la probabilité de ventes supérieures à 10 sera supposée comme nulle. 


Tableau: 67.8 - Probabilités cumulées des ventes 


Nous avons alors le tableau ci-dessus qui nous montre que la quantité la plus souvent vendue à un agent 
économique est à peu près de 2 (valeur modale) et le calcul de l'espérance nous donne pour ce tableau: 


Fr-E(N) =25 


résultat qui peut aussi bien être interprété comme la moyenne des ventes quotidiennes que comme la 
moyenne du niveau de rupture des stocks. 
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Nous supposerons que le stock est à flux tendu. En d'autres termes, d'un jour à l'autre, aucune unité n'est 
reportée pour les ventes du lendemain car il n'est plus censé y en avoir (ce que nous appelons la "gestion 
des stocks par rotation nulle"). La question dès lors est de savoir, le tableau ci-dessus étant donné, 
combien de produits mettre en fabrication (ou commander) chaque jour pour maximiser le bénéfice et 
minimiser les pertes. 


Dès lors, dans l'optique retenue de minimisation du coût de possession C; (appelé souvent "coût 
unitaire" de possession) associé aux invendus est de 25.- par unité, tandis que le coût de rupture à 


(appelé souvent "coût unitaire de rupture") est égal au manque à gagner consécutif à la vente ratée, c'est- 
à-dire le prix de vente 60.- soustrait des 25.- soit, un coût de rupture de 35.- par unité. 


Remarque: Le coût de rupture n'est pas assimilé qu'à la perte engendrée par une vente ratée dans la 
pratique mais aussi au coût d'une solution de remplacement temporaire proposée par le vendeur à son 
client en attente de fournir le bon produit. En interne dans les entreprises, le coût de rupture entraîne 
souvent un chômage technique des postes en aval lorsqu'une pièce de la chaîne de fabrication n'est 
plus disponible. 


Une gestion rationnelle doit permettre de calculer le stock initial S (autrement dit le nombre de produits à 
commander ou à fabriquer pour la journée) qui minimise l'indicateur de "coût de gestion" C(S) défini 
comme étant la somme du coût de possession associé au stock moyen des invendus Z, (5) (appelé souvent 


"stock moyen possédé"), et du coût de rupture associé au stock moyen de ventes ratées 7, (51 (appelé 
souvent "stock moyen des invendus"): 


CIS) =CpipiS\i+CRrin(s 
Cette relation est cependant un simplification de la relation: 
CIS] = ChipiSi+CRiRiSi+Ceie (si 


où le dernier terme est le coût de commande. 


Minimiser la fonction de coût C(S) revient du point de vue mathématique à chercher un extremum 
(minimun) de la fonction de coût de gestion tel que pour la valeur optimale $° de l'approvisionnement 


initial le coût C(s , soit immédiatement inférieur à C(s “æ 1) c'est-à-dire inférieur par la droite et par la 


gauche. En d'autres termes: 


ou après réarrangement: 


inégalités que le schéma ci-dessous peut aider à mieux comprendre: 
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C 


S*-1 7 S*+1 


Figure: 67.10 - Exemple arbitraire d'extremum de la fonction C(S) 


À partir de maintenant la question est de savoir comment procéder pour déterminer $°. Au fait l'idée est 
subtile mais simple tant qu'elle est bien exposée et réfléchie. 


Reprenons la distribution de probabilités de la loi de demande quotidienne et supposons que nous 
voulions calculer les ruptures moyennes (donc l'espérance) pour un niveau donné du stock initial S: 


1,8 =4)= E(x -4) (67.67) 
et: 


1,(S = 5) = EX —5) (67.68) 


associées aux stocks initiaux respectifs par rapport à la distribution donnée (bien évidemment x doit être 
prix comme étant supérieur à S). Soit en toute généralité: 


h 
IR(S) = >» | x Si) P(X) (67.69) 
x=$# 


Evidemment, si la loi de probabilité est continue (ou du moins approximée comme telle), cette dernière 
relation s'écrira: 


œ 
IR(S) = | (x-Sif(rddx (6770) 
ÿ 


L'idée est d'alors d'écrire la distribution de densité de probabilité par rapport à la quantité manquante de 
stock et non plus vendue: 
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Tableau: 67.9 - Distribution de densité de probabilité par rapport à la quantité manquante 


Il ressort du tableau précédent que le fait de faire passer le stock initial S de 4 à 5, diminue la rupture 
moyenne en la faisant passer de 0.1708 à 0.062. Mais de ce résultat, nous ne pouvons rien faire pour 
l'instant car à notre niveau actuel du développement, cela signifierait qu'en prenant un stock initial de 10, 
nous aurions une rupture moyenne nulle (... ce qui n'avance pas à grande chose...) et que si nous prenons 
aucun stock initial, nous aurions une rupture de stock totale. 


Mais cependant nous pouvons tirer un résultat intermédiaire intéressant. Effectivement regardons la 
manière dont varie la différence de la rupture moyenne (résultat facilement généralisable - nous pouvons 
faire la démonstration sur demande au besoin): 


IS =4)-1,8=3= 8 (x-S)P(X=x)-D (x-S)PX = x) 


nn x= SH 
= CE 4\P(X = x - Sd x- S)PCX = x) 
x=Ù 
= 1P(X =5)+(2-DPCX = 6)+(3-2)P(X = 7) +(4-3)P(X =8) (67.71) 


+(5-4)PCX =9)+(6-5)PCX =10) 
= P(X =5)+ P(X =6)+ PCX = 7) + PCX = 8) + PCX = 9)+ PCX =10) 


= SPC = x) = P(X > 4) 
F5 


Le résultat étant identique si la loi de probabilité est continue! 


Autrement dit (soyez bien attentif!!!), la diminution de rupture moyenne occasionnée en augmentant d'une 
unité un stock préalablement dimensionné à 5 = 4 , est égale à la probabilité cumulée que la demande soit 
strictement supérieure à celle du stock initial PCA >4). 
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En d'autres termes, au cas où cela ne serait pas clair, le fait d'augmenter le stock initial diminue certes la 
rupture moyenne, mais impose en contrepartie qu'il y ait moins d'acheteurs qui risquent de satisfaire l'offre 
et les seuls qui le peuvent sont ceux qui correspondent à la probabilité cumulée P(Æ > 4). 


Finalement, nous pouvons écrire: 


DS TD 228) = PCA > S) (67.72) 


Le tableau ci-dessous représente la diminution de rupture moyenne que nous obtenons en accroissant 
d'une unité le stock (et respectivement la probabilité de clients capables de consommer le stock.….): 


Guns 


D fo [un 
Dofoso 5 


Tableau: 67.10 - Rupture moyenne en accroissant d'une unité le stock 


Maintenant regardons les invendus Z,($) en tant que fonction aléatoire du stock initial S. Leur espérance 
est bien évidemment donnée par (servez-vous des tableaux au besoin pour comprendre): 


(67.73) 


ÿ 
LB =Ù(S-DPX) 


X=Û 


Évidemment, si la loi de probabilité est continue (ou du moins approximée comme telle), cette dernière 


relation s'écrira: 


# 
IP(S)=|(S-x)f(Ddx (67.14) 
(sl 


Ce que nous pouvons écrire: 
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ÿ +0 ko 
Ip(S)=E(S-X)= D (S-HP(X)= DS -DP(X)- D (S-x)PCX) 
EI] E] m5 +1 


- sS PU = DxP(A) _ -ÿ = sr) 
(67.75) 


x=0 


= S-S'xPCX) - - > e-9r00)| se S'xPun) -[-A(s)] 
2m5+1 xD 


= S-S xP(X)+ 1,8) “S-2+1,(8) 
x=Ù 
d'où: 


LS =S-xX+17,(S) (67.76) 


qui est donc le stock résiduel de fin de période. C'est donc un résultat remarquable qui va nous permettre 

de déterminer $° seulement à partir de Z, (5). Nous pouvons aussi à nouveau considérer comme intuitif 
P & P 

que le résultat est identique si la loi de probabilité est continue. 


Cette dernière relation peut également s'écrire après réarrangement: 
X-LRS)=S IS) (67.77) 


où le terme de gauche représente la demande moyenne satisfaite et le terme de droite l'offre moyenne 
utilisée. Cette relation est donc une relation particulière d'équilibre entre une offre et une demande. 


Nous pouvons par ailleurs vérifier cela à partir des tables ci-dessous en mettant un exemple particulier en 
évidence: 


I,(S=4)=4-2.5 +0.1708 = 1.6708 
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RME 


Tableau: 67.11 - Espérance des invendus 


Finalement nous pouvons écrire une expression de C'{$"), fonction de la seule rupture moyenne: 
CS =C,(S-7+1,(9))+C12(S) (67.78) 

ou ce qui s'écrit après réarrangement: 
CS) = CLS -7)+(Cx + Cr)L2(S)| (67.79) 

Il s'ensuit que: 


Et ED=CI) 
a LAS +Ù= CPx Li (Ca LS Cr)lrtS dd D] = LAC _ Cx bé (Cr ” C?) (S)] (67.80) 
= Ch + (Cr + Cr)[Le(S +1 -Z2(S)] 
Ce qui donne avec les résultats obtenus plus haut: 
CS +D-C(S) = C, +10, + COCA > S)) (67.81) 
Dans ces conditions, les relations: 
+1)<0 c(s" +1)-c{s")>0 
-1)<0 c(s')-c(s"-1)<0 


(67.82) 


Deviennent: 
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d'où: 


d'où $° est optimal si: 


(67.83) 


CIC + ONCPCE SD 0 
C+(Cr CIC 28 = <0 


Ô. ’ 
2 _)PXD>S) 
C,+C 


P 2 - 
(67.84) 
C, 
—— « PÉXDS -D 
CrtCr 
+ Ch + 
PA DS) —"— < PÉX DS —-1)| (6785) 
C,+C, 


Dans notre exemple numérique, nous avons: 


avec: 


Ca 


—— =0417 (6786) 
CrtCr 


P(Æ > 2)=0.4562,P(X > 3)=0.2424 (67.87) 


d'où le stock optimal initial journalier appelé aussi "stock minimum!" à mettre en production (ou à 
commander) pour minimiser le coût de gestion: 


ta 
I 
Lea] 


(67.88) 


ce qui n'est ni 2 ni 2.5!!! Mais c'est un chiffre qui est bien évidemment très proche de la valeur modale de 


la distribution initiale. 


Il faut noter que cependant dans la pratique, les employés qui font du controlling logistique dans les 
multinationales n'ont aucune idée des prix, marges et coûts qui ont lieu chez leurs clients alors que ceux-ci 
leur demande conseil (ils les paient même pour cela!). Alors souvent on prend simplement la valeur 
modale ou la valeur correspondant à une couverture de 95% de de la demande périodique (cela devient 
assez arbitraire). Dans le cas de notre petite exercice, la valeur modale du stock initiale arrondi à l'entier 
supérieur le plus proche serait 2 et la valeur à 95% de 5. Par prudence il y a cependant une tendance à 
prendre plutôt la valeur modale. 


6.3. MODÈLES DE WILSON 


Il existe plusieurs modèles d'optimisation de gestion de stocks (Statistique, Wilson, ABC, 20/80...). Parmi 
ceux-ci, nous avons souhaité nous arrêter sur les "modèles de Wilson" avec ses trois variantes qui sont les 
plus connues (mais pas forcément les plus réalistes….). 


Nous considérons donc trois situations: 
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- L'entreprise se réapprovisionne par lots à l'extérieur et il n'y a alors pas d'inertie des stocks et elle relance 
une commande lorsque le stock de sécurité est atteint. Nous parlons alors de "modèle de Wilson avec 
réapprovisionnement". 


- L'entreprise se réapprovisionne par une production interne qui implique alors une certaine inertie pour 
revenir au niveau de stock désiré. Nous parlons alors de "modèle de Wilson sans 

réapprovisionnement" (dont la totalité des résultats se déduit très vite du premier modèle sans refaire tous 
les développements). 


- L'entreprise se réapprovisionne par lots à l'extérieur et il n'y a alors pas d'inertie des stocks et elle relance 
une commande lorsque le stock de sécurité est atteint mais avec une inertie et demande à ses clients 
d'attendre. Nous parlons alors de "modèle de Wilson avec attente". 


Remarque: Ce modèle appelé également "modèle du lot économique" permet de déterminer la 
fréquence et la quantité optimale de réapprovisionnement pour un magasin, une usine. Elle est 
couramment employée par les services logistiques de grandes structures. Elle a en fait été introduite 
dès 1913... 


Le but est de déterminer la stratégie qu'il faut adopter pour que le total périodique (annuel, mensuel, 
hebdomadaire, journalier, …) des commandes ou fabrications de pièces minimise le total des coûts 
d'acquisition et de possession de stocks pour l'entreprise. Nous parlons aussi quelquefois de "gestion à 
flux tendu". 


L'existence de stocks au sein de l'entreprise amène le gestionnaire à se poser la question du niveau optimal 
de ces derniers, en évitant deux écueils principaux: 


1. Le "surstockage", source de coûts pour l'entreprise (coût du stockage physique, manutention, locaux et 
surfaces utilisées, coûts annexes, assurances de gardiennage, coût des capitaux immobilisés). 


2. Le "sous-stockage" qui risque d'aboutir à des ruptures de stocks préjudiciables à l'activité de production 
ou à l'activité commerciale de l'entreprise (arrêt de la production, perte de ventes, perte de clientèle, etc.). 


Ainsi, les différents modèles de gestion des stocks ont pour objectif de minimiser le coût de gestion dans 
ce système de contraintes en déterminant la fréquence de réapprovisionnement et la quantité associée. 


Voyons d'abord une approche purement qualitative. Pour chaque référence, les quantités en stock évoluent 
dans le temps par exemple sous une forme: 
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(où 


Réavprovisionnement 


Réapprovisionnement 


Réapprovisionnement 


Rupture de Stock É 


Figure: 67.11 - Première stratégie de réapprovisionnement 


En simplifiant nous obtenons un graphique dit "en dents de scie": 
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Rupture de Stock É 


Figure: 67.12 - Diagramme simplifié correspondant en dents de scie 


où nous sommes donc dans une situation typique de "gestion de stocks à rotation non nulle" (c'est-à-dire 
lorsque l'invendu peut être vendu à une période ultérieure.) 


Pour éviter la rupture de stock, il faut bien évidemment faire en sorte que l'entrée d'une commande se 
fasse, au plus tard, lorsque la quantité en stock devient nulle: 
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(e) 
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Figure: 67.13 - Principe visuel de la stratégie 


Si nous considérons une consommation constante d'une quantité N par unité de temps (jour, mois, 
année...) et que nous connaissons à l'avance le délai d'approvisionnement (en jour, mois, année...) alors si 
le tout est mis en des unités équivalentes (journalières par exemple) nous avons le niveau critique qui est 
donné par: 


M=N.D, (67.8) 


qui est aussi assimilé à la terminologie justifiée de "point de commande" puisqu'il s'agit de la quantité que 
nous avons en stock à partir de laquelle il faut lancer une nouvelle commande d'approvisionnement: 


t 
t 


(8) 


éapprovisionnemen 
éapprovisionnemen 


point de commande 


h 
€ 


KRéaporovisionnement 


Sorties 


Ss 


Stock de sécurité 


Figure: 67.14 - Représentation du point de commande (diagramme en dents de scie) 


Ainsi, si la consommation est de 10 unités par jour et que le délai d'approvisionnement est de 15 jours, le 
niveau critique est alors de 150 unités. 


Pour éviter les aléas (grève, transports, variation de consommation, remplacements...) nous envisageons 
un stock de sécurité &', : 
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(9) 
a Niveau Critique (M) 


Consommation À 


Stock de sécurité 


7 
i Ù Ë 
Délai d'approvisionnement (D,) 


Figure: 67.15 - Représentation du stock de sécurité sur le diagramme en dents de scie 


Nous avons alors pour le niveau critique: 
N =Ss+N.-D, (67.90) 


Voyons maintenant l'influence du nombre de livraisons sur le coût de stockage (puisque plus le taux de 
détention est gros, plus les coûts de stockage sont élevés). Supposons pour cela que le marché consomme 
100 unités par mois et ce de manière régulière. Dans le cas d'un seul approvisionnement annuel, la 
consommation est représentée par le graphique ci-dessous (aucun stock de sécurité afin de simplifier 
l'exemple): 


600 


Figure: 67.16 - Représentation de l'effet d'un seul approvisionnement 


où nous voyons immédiatement que le stock moyen est de 600. Ce stock moyen est obtenu par simple 
moyenne arithmétique ou simplement en utilisant la définition de la moyenne intégrale de la fonction de 
consommation: 


12 
[(-100.:+1200)@= 600 (6701) 
0 


1 b 
k= 5] Où = 


Soit trivialement la moitié du stock maximum (ou autrement vu: la surface du triangle rectangledivisé par 
Fan 
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Et si nous divisons la gestion en deux approvisionnements, nous avons alors: 


300 


soit un stock moyen deux fois inférieur et dès lors un coût de stockage moyen deux fois moindre. Mais 
bien évidemment il faut y associer le coût d'approvisionnement. C'est à ce niveau de complexité 
qu'intervient justement la formalisation mathématique de Wilson. 


Chaque commande d'achat ou ordre de fabrication coûte donc à l'entreprise. Le "coût de lancement" ou 
"coût de passation" des commandes ou lancements de fabrications représente tous les frais liés 
(administratifs, réglages machines, préparation, communications...) au fait de passer une commande (ou 
une fabrication) et est supposé être proportionnel à la quantité. Ces coûts sont déterminés à l'aide de la 
comptabilité analytique. 


Ainsi, le coût d'une commande est obtenu en divisant le coût total de fonctionnement du service achat par 
une grandeur significative et pertinente. Par exemple, le nombre de commandes passées (ou ordres de 
fabrications) annuellement par exemple. Le coût d'un lancement en fabrication lui sera obtenu en divisant 
le coût total de fonctionnement du service ordonnancement, auquel, il faut, ajouter les coûts de réglage 
des machines et des préséries, par le nombre de lancements de fabrication. 


Ces valeurs dépendent essentiellement de l'entreprise, de ses choix en matière de comptabilité analytique. 
Il est difficile de définir une fourchette de valeurs standards. Bon nombre d'entreprises ne savent pas à 
combien leur revient une commande ou un lancement de fabrication (et bon nombre ne savent tout 
simplement pas faire une analyse.…..). 


Le coût de possession du stock est constitué des charges liées au stockage physique mais également de la 
non-rémunération des capitaux immobilisés dans le stock (voire du coût des capitaux empruntés pour 
financer le stock). Pour cette dernière raison, ce coût est considéré comme étant proportionnel à la valeur 
du stock moyen et à la durée de détention de ce stock. 


Le taux de possession annuel t% est le coût de possession ramené à une unité monétaire de matériel 
stocké. Il est obtenu en divisant le coût total des frais annuels de possession par le stock moyen annuel. 


Ces frais couvrent l'intérêt du capital immobilisé, les coûts de magasinage (loyer et entretien des locaux, 
assurances, frais de personnel et de manutention, gardiennage, etc.), les détériorations du matériel, les 
risques d'obsolescence. 


Ce taux oscille habituellement entre 15 et 35% de la valeur marchande stockée dans les entreprises, 
suivant le type des articles et la qualité de leur gestion des stocks. 
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Wilson a établi une relation basée sur un modèle mathématique simplificateur dans lequel nous 
considérons que la demande est stable sans tenir compte des évolutions de prix, des risques de rupture et 
des variations dans le temps des coûts de commande et de lancement (nous sommes alors en "avenir 
certain"). 


6.3.1. MODÈLE DE WILSON AVEC RÉAPPROVISIONNEMENT 

Les hypothèses très simplificatrices de ce modèle sont les suivantes: 

H1. La demande périodique est connue et certaine (déterministe) 

H2. Les quantités commandées sont constantes à chaque période 

H3. La pénurie (ruptures de stock) a lieu en fin de période (donc il n'y a jamais de défaut de stock) 
H4. Le délai de production est constant et l'approvisionnement supposé instantané 

HS. Les coûts (stocks, articles, passation...) sont invariables dans le temps 

H7. Le coût de possession est proportionnel à la valeur 

H&. L'horizon de planification est infini 


et selon les auteurs cette liste d'hypothèses varie plus ou moins (certaines hypothèses étant implicites ou 
relativement triviales). 


Remarques: 
R1. Nous supposerons que la gestion du stock s'effectue sur une période temporelle donnée. 


R2. D'après ces hypothèses, nous concluons qu'il y aura le même niveau de commande à lancer 
chaque fois, que le coût total de pénurie est nul. 


Nous noterons: 
- N la quantité correspondant à une demande ou respectivement à des pièces consommées par période. 


- Q la quantité d'approvisionnements ou de pièces lancées en fabrication en une seule fois pendant ce 
même temps (taille des lots). 


- À le prix unitaire d'achat de la pièce (supposé constant). 
- A, le stock de sécurité envisagé pour cette pièce (supposé constant) pour répondre aux aléas par période. 
- t le taux de coût de possession en % (supposé constant) et parfois appelé "taux de détention". 


- C’,; le coût d'approvisionnement/acquisition par commande ou de lancement de fabrication. 
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Nous définissons de par la même occasion, le "coût unitaire de stockage" calculé souvent (mais pas 
uniquement!) sur la base du prix unitaire d'achat d'une pièce: 


Cs =#%0'R (67.92) 
Propositions: 


PI. Le rapport: 
—— (67.93) 


donne "l'inertie des stocks" ou qui peut être vu de manière plus explicite comme étant le "nombre 
périodique de lancements" (ou la cadence de réapprovisionnement) pour satisfaire la demande. L'inertie 
des stocks a donc la dimension d'un inverse du temps. 


P2. Le "coût d'inertie" ou respectivement le "coût d'acquisition", ou encore "coût de lancement" est donc 
par unité de période de: 


n' 
—* C} (67.94) 


(e) 


Ce dernier est donc supposé proportionnel à la consommation! Ce qui est important ceci dit est de 
remarquer que le coût de lancement est inversement proportionnel à la quantité Q et donc qu'il tend vers 
zéro lorsque Q tend vers l'infini. Ceci dit, normalement on aura dans la majorité des cas théoriques: 


OSN (6795) 


P3. Le stock moyen dans l'entreprise dans l'hypothèse d'une consommation (décroissance linéaire du 
stock) et d'un niveau de sécurité constants dans le temps est trivialement par période: 


ÿ, + eg (67.96) 
2 


Le "coût périodique de possession", appelé encore "coût de possession" ou "coût de gestion" ou "coût de 
stockage" ou "coût de détention".…, est alors: 


C,=1%"E fs +ê] = Ce fs +?) (67.97) 


Il s'agit donc de la fonction d'une droite (dont l'ordonnée à l'origine est non-nulle si le stock de sécurité est 
non nul) si nous considérons que uniquement Q y est variable. Il est important de remarquer que ce coût 
ne prend pas en compte les concepts de remise de volume faite par les commerciaux... 


Ces propositions nous amènent donc à l'équation du "coût total d'approvisionnement", appelé aussi "coût 
total de stockage" que nous allons chercher à minimiser: 


C, = e +[£+s] 2 (67.98) 
© 2 
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et qui donne une "courbe (hyperbolique) des coûts cumulés" du type: 


(a) 2 4 ô 8 
Q 


Figure: 67.18 - Courbe des coûts cumulés 


Trouver la quantité économique ©, , c'est trouver la valeur de Q pour laquelle le coût total est minimal (en 
d'autremes termes c'est chercher la taille du lot qui permette de rentabiliser au mieux tous les coûts de 
stockage, fabrication,, etc.), c'est-à-dire mathématiquement la valeur ©, pour laquelle la dérivée du coût 
total par rapport à la quantité est nulle: 


ac 
—…— Re le = 0 (67.99) 
dQ Q? 2 


D'où la "relation de Wilson" (après un calcul élémentaire), appelée aussi simplement "formule de 
Wilson", pour le "lot/quantité économique optimal": 


(67.100) 


qui est donc pour rappel, le taille du lot qui minimise le coût total (indépendante du stock de sécurité qui 
s'annule lors de la dérivée). Nous constatons que la quantité économique est proportionnelle à la racine 
carée de la consommation. Donc grossièrement une article vendu 100 fois plus par une société nécessitera 
qu'un stock moyen 10 fois supérieur. 


Bien évidemment une fois connue la quantité économique, il devient facile de calculer le "coût de gestion 


optimal par période" €; en injectant ©, dans la relation obtenue plus haut: 


Ce AT + L+s ‘#%'Æ (67.101) 
[e) 2 
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ainsi que la "cadence ou fréquence optimale de réapprovisionnement" puisque donnée par le rapport: 


N__N [CSN [NE 
@  2NC; 2C; 2C; (67.102) 
Cs 


Nous avons alors après un peu d'arithmétique élémentaire le coût de gestion optimal par période qui est 
donné par: 


2NCy 2NCy 
CsN J e CsCLN \ C 
nn ET | 5 _ 4 enr, = JEUX CAN REA 


(67.103) 


G CiN DE S LE C 
® D — + +805 = 2 : +8 Cs = J2MiCs + SC 


Comme souvent, les gestionnaires aiment bien faire de l'analyse de la sensibilité (nous en avons déjà fait 
mention lors de notre étude du seuil de rentabilité). Dans le domaine de la gestion de stock il est de 
tradition de faire l'analyse de la sensibilité de la variation relative du coût total de stockage par rapport au 
coût de gestion optimale par période: 


Le +L%.P +5 8%. Le +Le+scs 
CG _@ 2 Q 2 (67.104) 


Ce  AMCCs+SCs  J2NCICs +5,05 


Mais comme le $,C' (coût du stock de sécurité) est supposé indépendant de la quantité, il est d'usage de 


ne considérer que la variation relative indépendamment de ce terme telle que: 


(67.105) 


Enfin, il est d'usage de simplifier la forme analytique de cette dernière relation sous la forme suivante 
après quelques manipulations algébriques élémentaires: 
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N Q 
Le +£c 
COR NE NC; _ DCS 


de . TONeñcics 2JNCiCs 
VNCICs QD 
- RCE PAG", 2NCLCs 
2 
C 


_PACICs ,_ 0 _APNCICs © _1 PNCiCs , © 


2Cs L2NC, 2QCs 2 20 Es 720 
Cs 


es D. (&+2) 


"AVC 2% 20° 2% 20 à 


(67.106) 


c'est donc un résultat assez esthétique. que le lecteur remarquera au passage comme étant toujours 
positif! 


Il est évident que nous tirons aussi de la relation de la fréquence optimale de réapprovisionnement la 
"période optimale de réapprovisionnement" donnée alors par (l'inverse de la fréquence par définition): 


= 2Cr _ Cr (67.107) 
CN UNE, 4% 


Si nous reportons sur un graphique les fonctions: 

- coût de lancement (approvisionnement) en fonction des quantités 
- coût de possession en fonction des quantités 

- coûts totaux en fonction des quantités 


alors la quantité économique se trouve à l'intersection des deux courbes, lancement et possession (lorsque 
le coût de possession est égal au coût d'acquisition), ou au point d'inflexion de la courbe cumulée. Dans la 
pratique toutefois, il est possible de commander exactement la quantité économique, on choisira une taille 
de lot répondant aux diverses contraintes et comprise dans la "zone économique": 
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— lancements —— possession — Cumul 


Zone ÉCOOtMiquE 


Figure: 67.19 - Représentation de la zone économique 


Évidemment dans certaines entreprises un objectif est plutôt d'essayer de diminuer le coût de stockage 
afin d'atteindre l'équivalent de la demande comme quantité économique. Nous avons alors avec un peu 


d'algèbre élémentaire: 
©, = BNC = Q? = N° E (67.108) 


soit au final le coût de stockage optimal si la quantité d'approvisionnement Q est imposée: 
2C 
Cse=—2Z (67.109) 
N 


Donc pour résumer, il faut savoir que l'on considère souvent que l'ensemble du modèle de Wilson se 
résume aux 5 relations ci-dessous: 


(67.110) 
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Il existe un autre type de cas de figure qu'il faut étudier. Si l'on commande en quantités plus importantes 
en bénéficiant ainsi d'une remise, on augmente certes les coûts de possession mais on réduit théoriquement 
le nombre de commandes annuelles. 


L'objectif pour le gestionnaire est bien sûr de vérifier mathématiquement que la remise consentie par son 
fournisseur n'entraîne pas de coûts induits supérieurs à la remise (ce serait une preuve d'incompétence du 
gestionnaire!). 


Pour ce faire, il faut ramener tous les coûts à une pièce telle que le coût total unitaire s'écrive: 


Lis l.#.r 


e -1G|.12 FE 
N 


cette relation est importante, car elle détermine la valeur de la remise pour que cette dernière soit 
intéressante. 


Pour connaître le seuil de remise R pour une quantité donnée, on remplace dans la relation précédente, Q 
par la quantité visée Q'et À par Æ(1- À), R étant la remise. 


Nous résolvons alors l'équation et nous obtenons: 


1%" P.(1-R) 


L'4s 
c, {&)- + + P(I-R) 


Nous déterminerons donc la valeur limite de R sous laquelle la remise ne compense pas les coûts internes. 


Dans la pratique nous ne pouvons commander exactement la quantité optimale ©, , notamment du fait des 


unités d'achats imposées par les fournisseurs (quantités minimales, conditionnements, etc.). Il est donc 
plus judicieux de s'intéresser à la "zone économique", constituée par la partie inférieure (le ventre) de la 
courbe des coûts totaux. 


Du fait des hypothèses simplificatrices, le modèle de Wilson ne peut fournir au mieux qu'un ordre de 
grandeur si consommation et/ou prix sont sujets à variations (puisqu'elle est extrêmement dépendante des 
deux paramètres subjectifs: coûts de stockages et lancements). 


Le recours aux lancements de fabrication économiques est "anti-flexible" par essence. Ce genre de 
politique amène fréquemment des conséquences importantes, risque de gonfler le stock de produits finis, 
reportant les coûts et pertes en aval du processus. 


Cependant, le modèle de Wilson a ceci d'intéressant qu'il peut s'appliquer également assez bien à des 
ressources humaines. 


Exemple: 


L'entreprise MAC utilise un article X330 pour lequel la consommation prévisionnelle de l'année N devrait 
être de 4'000 articles. Les données sont les suivantes: 


- Le coût unitaire de l'article X330 est de À =8 (peu importe le numéraire) 
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- Le coût de passation/lancement d'une commande est de C',; = 100 


- Le taux de possession du stock est de #%% = 10% par an 
- Le stock de sécurité est de 250 unités 


Le fournisseur de cet article, pour inciter ses clients à augmenter l'importance de leurs commandes, 
propose à l'entreprise les conditions suivantes: 


C1. Quantités commandées inférieures à 2'000 unités: prix unitaire À, = 8 

C2. Quantités commandées comprises entre 2'000 et 3'500 unités: remise de 2%. 
C3. Quantités commandées supérieures à 3'500 unités: remise de 3 %. 

Travail à faire: Dire quelle solution l'entreprise doit adopter. 


Le prix varie donc en fonction de la quantité tel qu'étant donnée une quantité choisie, la remise s'applique 
d'une façon équivalente à tous les articles (nous parlons alors de "remise uniforme"). 


D'après l'énoncé et en fonction de Q la quantité d'approvisionnement, nous savons que: 
1.SQ0<200—P=-A=-8 

2. Si 2'000< 0 <3'500= P =E =8-2%:8 = 7.84 

3.023502 =-2=8-3%'8= 71.16 


En fonction de la relation de Wilson du lot économique, nous allons calculer la quantité économique @, 


pour le prix le plus avantageux à savoir &: 


2NC "4 000: 
G= D je TOM ss a 
 P 7.76 10% 


Mais pour avoir droit à Æ il faut commander au minimum 3'500 articles il y a donc contradiction et cette 


solution est donc hors zone. Des calculs identiques (que nous laissons le soin de faire avec la calculatrice 
quand même...) montrent que seul le lot économique ©, de & correspond à la contrainte @ < 2'000. 


Dès lors, la période optimale de réapprovisionnement correspondante sera: 


7 = fe PO 2529125 [;] «rai 
CN 1(10%.8) 4'000 


et le coût de gestion optimal par période: 


Che = V2 CS +8, C5 = 4f2-4'000-100-(10% -8)+ 250-(10%-B)=1'000.— (67.115) 
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Attention! Pour ce dernier calcul, certains auteurs incluent dans la coût du stock de sécurité S, Ce la 


quantité N. Il s'agit d'un choix plutôt discutable et qui nécessiterait d'être précisé. 


Enfin, l'impact sur le coût total de gestion si nous augmentons ou diminuons la quantité de plus ou moins 
30% par rapport à la quantité économique est donné par: 


G : (&-2 = 5 = 1.0346 


Cte 210 € 2413 1 
| (67.116) 
Cte 210 € 240.7 1 


Donc évidemment, cela ne fait que d'augmenter les coûts et comme nous l'avons vu sur le graphique plus 
haut, la courbe n'étant pas symétrique, les deux résultats ne sont pas égaux. 


6.3.2. MODÈLE DE WILSON SANS RÉAPPROVISIONNEMENT 


Dans le modèle précédent, nous avons donc supposé une gestion de stocks en dents de scie de la forme 
suivante: 


e € a 
La] D Le] 
ë Ë ë 
'e) = S & 
Sn sh, Sn, 
" Si EP SIN 
\ Br ON [ \ RS 
ù BI DON ‘ 
s-N 9; w 2 | LA 8 | W 
4 &! s 8! e a! s 
 #!  #:  #! + 
No \ # \ #! " Point de commande 
noue D ON PRO CN MU RP RONDE YU HSE CEE nus 
Ss Sorties “! Sorties ! Sorties “| Sortes 


Stock de sécurité 


Figure: 67.20 - Représentation schématique du modèle de Wilson avec réapprovisionnement 


Dans le modèle qui va nous intéresser maintenant, nous allons considérer une gestion de stock avec une 
inertie du réapprovisionnement souvent due à une production à l'interne sous la forme suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


+ + 21 
S [= S 
Le] D Le] 
: 5 Ë 
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5 ! & & ! = k 
ET & 1 © 
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Stock de sécurité 


Figure: 67.21 - Représentation schématique du modèle de Wilson sans réapprovisionnement 


Donc dans la figure ci-dessus, nous pouvons observer que la demande de production se fait au point de 
commande et que pendant la production au rythme de P pièces par unité de temps pendant un temps ä, la 
consommation N par période T (rapportée à l'unité de temps de la production), tape déjà dans les stocks 
générés. 


Devons-nous donc refaire tous les calculs du modèle précédent? La réponse est: non pas en totalité! Car si 
nous réfléchissons un tout petit peu en observant la fonction hyperbolique du coût total de stockage que 
nous avons démontrée plus haut: 


C, = Le (£+s]er (67.117) 
Q 2 


Il est évident que le premier terme dû au réapprovisionnement n'a aucune raison de changer. Le troisième 
terme, dû au stock de sécurité, n'a aucune raison de changer non plus! Donc il ne reste que le deuxième 
terme représenté par le coût de stockage moyen qui est forcément différent! 


Donc le stockage moyen n'est plus: 


Nous pourrions calculer facilement la surface moyenne du triangle en utilisant la formule de Héron pour 
le calcul de la surface d'un triangle quelconque démontré dans le chapitre de Formes Géométriques. Mais 
le problème dans le cas présent, c'est que nous voulons faire apparaître Q dans le stock moyen. Nous ne 
pourrons alors utiliser la formule de Héron. L'idée va être la suivante (se référer à la figure précédente): 


Lorsque l'entreprise n'a plus de stock, elle en lance pendant un temps 4 la production à un rythme de P 
éléments par unité temporelle jusqu'à atteindre en cumul la quantité objectif Q. Nous avons alors: 


Q=P.4 (67.119) 


Mais en même temps qu'elle produit (et après aussi), l'entreprise consomme N éléments par unité 
temporelle. Le stock réel généré sera alors au temps 4 (sous la condition évident que P est supérieur à N) 
l'inventaire maximum: 
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nv =P. 4 -MN.4 =iP-Ni.4 (67.120) 
max 1 1 1 


Cet inventaire maximum correspond donc à la hauteur de notre triangle quelconque (toujours se référer à 
la figure précéente) mais nous souhaitons y faire apparaître le stocke obejctif Q. Donc, pour cela, il n'y a 
maintenant rien de plus simple en utilisant la relation antéprécédente: 


N 
Pvnex =(P-N)f -(e-, $-fi-5)e (67.121) 


Donc le stock moyen devient: 


1 N 
—|1-— (67.122) 
( Je 


Donc nous voyons que la seule différence entre les deux modèles est le facteur: 


7] 
1—— | (67.123) 
P 


Dès lors, dans relations obtenues dans le modèle de Wilson avec réapprovisionnement (du moins les plus 
importantes) et qui étaient pour rappel: 


Che = 2MC; Ce La Ce 


pe 
Ce S C L 
ÿ 


20; 
Le = CsN (67.124) 
2C 
Ce, = 2 
5,e N 
+. (+2) 
Ce 2 © (82 


deviennent (la dernière relation ne change pas): 
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Che = Latics i-2) EC 


2NC 
ee 

1-—|C 

| +) : 


(67.125) 


L'adaptation des relations du coût périodique de possession et du coût total d'approvisionnement sont 
quant à eux immédiats. 


Donc à la différence du modèle avec approvisionnement, nous voyons que seulement une nouvelle 
variable P apparaît est qui est donc la vitesse de production (éléments produits par unité de temps) pour 
permettre une production de N éléments par unité de temps. Ce que lecteur ne doit pas oublier lors de cas 
d'application numérique, c'est de rapporter P et N à la même unité de temps. 


6.3.3. MODÈLE DE WILSON AVEC RÉAPROVISIONNEMENT ET RUPTURE 


Dans les grands classiques d'études scolaires (le reste étant ensuite une combinaires cas des différents 
scénarios basé sur le même raisonnement), voyons le modèle de Wilson avec réaprovisionnement 
(instantané) mais où la rupture et la vente à découvert (en contrepartie d'une pénéalité) est autorisé (donc 
il n'y a pas de stock de sécurité!). Nous représenterons ce scénario par la figure en dents-de-scie suivante: 


mm 
‘ 


Figure: 67.22 - Représentation schématique du modèle de Wilson avec réapprovisionnement et rupture 


Nous considéreron C'} comme étant la perte financière (coût) par unité de pièce pendant la période à 


découvert (ne pas encaisser l'argent tout de suite fait que nous en perdons rien que par le fait que nous ne 
pouvons pas le placer sur des fonds à rendement 
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Pour ce cas là, nous n'avons pas trouvé de manière simple d'éviter de refaire les calculs des relations du 
modèle de Wilson avec réaprovisionnement (bon si quelqu'un a une astuce nous sommes preneurs). 


Cependant il s'agit toujours d'algèbre élémentaire donc le lecteur ne devrait souffrire d'aucune difficulté 
face à ce genre d'exercice de style. 


Nous avons d'abord trivialement en se référant à la figure ci-dessus: 


r-£ 
N 
M 
ü = — 
W (67.126) 
th =T-à SRE 
N N N 
m=Q0-M 
D'abord, le coût de stockage moyen est trivialement de: 
MC), a 
Ma Nio M pe (67127) 
UT 2 + 24 


Le coût moyen de vente en rupture est lui aussi donné trivialement par: 


2 

W | (Q-M\ (67.128) 

ne ————— "À" = ————— {5 ss 
2 2 # ON À 


2 M 
ce oc + 8 A) €, (67.129) 
2N 2N 


n 
C C M? - M 
RE PEN nn C6 + CR (67.130) 
(5) 


Le coût total moyen par période est alors de: 
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2 _ MY 
de, +84 ç,+ 878) 
e . 20 (67.131) 
M°(Co+C 
os CE PR PCR ie 
Q 20 2 


Le problème ici c'est que Q dépend de M et inversement. Nous allons donc devoir faire usage des dérivées 
partielles pouf fixer tantôt l'un et tantôt l'autre. Donc pour trouver la quantité économique, nous allons 
arbitrairement d'abord déterminer quelle est la quantité M qui va minimiser le coût total moyen par 
période (ceci afin de se débarasser par anticipation de la présence de la variable M dans l'expression de la 
quantité économique). Nous avons alors en prenant la dérivée partielle (donc sous-entendu que nous 
maintenons toutefois Q constant): 


a, MiCo+Cni 
eee 
GATE Q 
Soit: 


CRo 


e= = (67.133) 
Co +CR 


Maintenant, pour la quantité économique, nous avons respectivement en prenant la dérivée partielle (dons 
sous-entendu que nous fixons M): 


2 
oc; N c MW (Ce +Cr |, CR _9 


—=-—ÛC- (67.134) 
@ 0 2 
En y injectant le résultat antéprécédent il vient: 
2 
( 
Cr | Cs+CR| 
NC, (LCs+CR R 
œ 20° 2 (67.135) 
__ NC CÀ CR _o 


p? 21Co+CR| 2 
Soit après quelques manipulations algébrique élémentaires: 


2NC, _ CRCs 
ç? Ce +CTRr 


(67.136) 


Ce qui donne finalement: 
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Ce+C 2NC; [Co+C 
2NCr SUR = [EE SUR (67.137) 
CRrCs Cs CR 
Nous avons alors explicitement: 
.: CR e) : CR 2NCr Co +R : 2NCr CR (67.138) 
| CytCR Cot+tCRr\ Cs CR  VY Co NCs+CR L 


La période optimale de réapprovisionnement est alors: 


Ce +C Ce+C 
Tune =: DE Gris) 
& ES “fs sŸ 


La quantité m économique de rupture donnant le déclenchement de lancement de restockage est alors: 


2NCr Ce +Cr 2NCr 
Re Me Los Ta Ex ESA & 
5 R 
— — 
= = 


Un difficulté pratique de ce modèle est de déterminer CA . L'idée est alors de l'estimer sur la durée 


(67.140) 


maximale d'attente supposée du client ayant fait une commande lors d'une rupture. En partant de: 


=. _RerMe _ [2Cr | fCstCr_ | CR 
de AR N Ms EP Corte 


LE (Cs+CrliCs +CR) CRrCR 


= (CS +CRi c£ 

FE CET (Co +CRrICR 

NC'eCR (Ces +CRri 

Pdf aC 

= Q— TL Co + Cp-Cpl= 2 CS 

NC'eCR (Ces +CRri M'eCRiCs+Cri 
L 20: Ce 

Nr (Co +CR | 


Et en mettant au carré dans l'idée d'extraire C' : 


(67.141) 
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2Cr0 2e 
Maite = © CR (Co + Cpi = EE 
Nr { Ce + CR | É mi 
tite 
CC (67.142) 
= CÀ +CpCy = IS 
Himite 
Nous avons donc finalement une équation du deuxième degré: 
20e 
CAC = = 0 (67.143) 
Émite 
Dont les deux racines réelles sont: 
2C re 
2e Ed : : 
Nik CRy CRŸ + 2C1Cs (67.144) 
Cha © 2 2 2 
Ma 


(67.145) 


ae 


Avant de passer à l'exemple pratique, le résumé se réduit à: 


2NCr Ce +CRr 
Ts Ÿ ©. 
ÿ R 


> RAS [CR 
$ Ce Ce +CR 
_ 2Cr Co+CR 
NC Y Ch 
m = PMCL( [Cs+Cr_ | Cr De) 
si Ce CR Co+Cr 
un 20Ce 
ee ANDE (Ce dE | 


Exemple: 
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L'entreprise MAC livre un article X330. Dans le but de ne pas perdre ses clients, les gestionnaires 
décident d'un temps de rupture optimal (sous-entendu: maximuM) de 2 jours. Nous avons les données 
suivantes: 


Cy = 200 cs =] Mimi = 2 [jour], N=5 ue (67.147) 
restockage unitexjour jour 


Ce qui donne: 


CR=4 [au Lo, = 50 [unités], M4, = 40 [unités],me, =10 [unités], T = 10 [jour] (67.148) 
jour 


7. ANALYSE DE LA SENSIBILITÉ 


Dans le domaine de la gestion (projets, finance, statistique), l'analyse de la sensibilité est une technique 
simple basée sur l'utilisation du coefficient de corrélation linéaire (de Pearson) démontré dans le chapitre 
de Statistiques dont une écriture possible est: 


Re (7151) 


avec pour rappel: 


—1<R,, <+1 (67.151) 


L'idée est que si nous avons une variable principale qui dépend de manière sous-jacente de plusieurs 
variables alors nous calculons le coefficient de corrélation (ou le coefficient de détermination qui est 
simplement le carré du coefficient de corrélation) de la variable principale avec chacune des variables 
sous-jacentes. 


Prenons un exemple simple et particulier au monde de la gestion de projets. Imaginons un projet dont le 


planning est basé un chemin critique basé uniquement de deux tâches À et B. La première tâche A s'étale 
sur une durée dont la loi est Normale de paramètres: 


N(u,o)=N(8,1) (67.152) 
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soit une durée espérée de 8 jours et un écart-type de 1 jour et la tâche B s'étale sur une durée suivant une 
loi bêta (selon recommandation du PMI...) de paramètres (5,12), soit une durée optimiste de 5 jours et une 
durée pessimiste de 12 jours: 


Faisons pour l'exemple une simulation de Monte-Carlo à 1'000 itérations avec la version anglaise de 
Microsoft Excel 11.8346 (puisque la majorité des gestionnaires travaillent avec la version anglaise): 


: (x-a)*" (x ay : 
2 nn AM nm; … 


LG DAV (x 5 
778(3+42,3-42) 


= Gr 


Ga) Ban) (2-57 28-24 8(3+V2,3-\2) 


(67.153) 


=NORMINY(RANDEET WEEN(1:10000)10000:6;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)/10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)/10000:8;1] 
=NORMINY(RANDBET WEEN(1:10000)10000:6;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINV(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)/10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(1:10000)10000:8;1) 
=NORMINY(RANDBET WEEN(1:10000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(1:10000)/10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(1:10000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1] 
=NORMINY(RANDBET WEEN(110000)/10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8:;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(1:10000)10000:6;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 
=NORMINY(RANDBET WEEN(110000)10000:8;1) 


=BETAINY(RANDBET WEEN(1:10000)10000:3SQRT(2):3-SQRT(2):5;12) =C2+52 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SORT(2):5:12) 2C3+B3 
=BETAINY(RANDBET WEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) =C4+54 
=BETAINY(RANDBETWEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) 20585 
=BETAINY(RANDBET WEEN(1:10000)10000;:3SQRT(2):3-SQRT(2):5;12) 2C6+56 
=BETAINY(RANDBETWEEN(110000)/10000:3SQRT(2):3-SORT(2):5:12) 2CT+B7 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SORT(2):5:12) =C8+B8 
=BETAINV(RANDBET WEEN(1:10000)10000:3SGRT(2):3-SORT(2}:5:12) =C3+83 | 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SQRT(2):5;12) =C10+810 
=BETAINY(RANDBETWEEN(110000)10000:3SGRT(2):3-SORT(2):5:12) 2011511 
=BETAINY(RANDBETWEEN(110000)10000:3SQRT(2):3-SORT(2):5:12) 212512 | 
=BETAINY(RANDBETWEEN(110000)10000;3SGRT(2):3-SORT(2):512) 218818 | 
=BETAINY(RANDBET WEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) =C14+B14 
=BETAINY(RANDBET WEEN(1:10000)10000:3SGRT(2):3-SQRT(2):5:12) =2C15+B415 
=BETAINV(RANDBET WEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) =C16+816 | 
=BETAINY(RANDBETWEEN(110000)10000:3SGRT(2):3-SORT(2):5:12) 2C17B17 | 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SORT(2):5;12) =C18+818 
=BETAINY(RANDBETWEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) 2C13+819 
=BETAINY(RAMNDBETWEEN(1:10000)10000:3SQRT(2):3-SRT(2):5;12) =C20+B20 
=BETAINY(RANDBETWEEN(110000)10000:3SQRT(2):3-SORT(2):5;12) 2C21+B21 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SQRT(2):5:12) =C22+B22 
=BETAINY(RANDBETWEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) =C23+B23 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SORT(2):5:12) =C24+B24 
=BETAINY(RANDBETWEEN( 110000110000; SQRT(2):3-SORT(2):5:12) 2C25+B25 
=2BETAINY(RANDBETWEEN(1:10000)10000:3SGRT(2):3-SORT(2):5:12) =C26+B26 
=BETAINY(RANDBETWEEN(110000)10000:3+SGRT(2):3-SORT(2):5:12) =C27+B27 
=BETAINY(RANDBET WEEN(1:1000010000:3SQRT(2):3-SQRT(2):5:12) 2C28+B28 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SORT(2):5:12) =C29+B29 
=BETAINY(RANDBETWEEN(1:10000)10000:3SGRT(2):3-SQRT(2):5:12) =C30+B30 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SORT(2):5:12) 2C31+831 
=BETAINY(RANDBETWEEN(1:10000)10000:3SQRT(2):3-SQRT(2):5:12) =C32+B32 


Figure: 67.23 - Simulation de deux petites tâches respectivement avec une distribution Normale et bêta 


Ensuite, nous calculons toujours avec la version anglaise de Microsoft Excel 11.8346 le coefficient de 


corrélation: 


ce qui donne: 


Coef C/A Coeff CB 


=PEARSON(B2:B1001:D2:D1001) 


=PEARSON(C2:C1001:D2:D1001) 


Figure: 67.24 - Calcul du coefficient de corrélation entre les sommes et les tâches 


Figure: 67.25 - Corrélation correspondante 
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Soit sous la forme d'un graphique de type "tornado chart" comme il est d'usage dans le domaine de 
l'analyse de la sensibilité: 


+10 -09 -08 -0.7 -0.6 -0.5 -0.4 -03 -02 -01 - O1 02 03 04 05 06 07 08 09 10 
Figure: 67.26 - Tornado chart obtenu avec Microsoft Excel 11.8346 


Il est dangereux d'utiliser le coefficient de corrélation (de Pearson) lorsque la relation entre la variable 
principale et les variables sous-jacentes n'est pas linéaire! Cependant, les logiciels peuvent identifier de 
quel autre type de relation il s'agit (exponentielle, logarithmique, puissance, polynomiale) et faire une 
transformation pour ramener l'équation à celle d'une droite. Cependant, cette manipulation peut aussi 
amener à des erreurs grossières dans certains cas. La majorité des logiciels spécialisés utilisent alors la 
définition empirique de la régression que nous avons vue dans le chapitre de Méthodes Numériques: 


SCR 
R2 =1- = (67154 
id SCT ) 


et utilisent alors la recherche opérationnelle (cf. chapitre de Méthodes Numériques) pour déterminer les 
paramètres de l'équation qui minimisent le 2 selon la relation précédente. 


Un logiciel spécialisé pour obtenir très rapidement ce genre d'analyse sur des situations complexes est @ 
Risk de Palisade qui donne lui le graphique suivant: 
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CCS -(9)x 
Cosfficients de régression 
B 
À 
. [=] — ‘à M Le n © D e 
? [=] =) [=] © © =] (=) [=] =) 
Valeur de coefficient 
Su AT aie id ia AJ" »j Cross J 


Figure: 67.27 - Tornado chart de la même simulation obtenu avec @Risk 


Enfin, quand nous avons un très grand nombre de variables sous-jacentes, il peut être intéressant de 
regrouper les coefficients de corrélation par intervalles avec un graphique du type suivant (exemple pris 
de la bourse) où l'ordonnée représente le % du nombre de variables: 


35% 
30% 
25% 
20% 
15% 
19% 


5% 


Ps 


0.00 


1.00 to -0.75< 
-0.75t0 0.50< 
-0.50 to 0.25< 

-0.25 to 0.00< 

>0.00 to 0.25 

>0.25 to 0.50 

>0,50 to 0.75 

>0.75 t0 1.00 


Figure: 67.28 - Analyse des groupes de corrélation de variables 


Ainsi, par exemple, ci-dessus 32% des variables ont un coefficient de corrélation nul avec la variable 
principale (qui est l'indice de performance du portefeuille concerné) et 14% ont un coefficient de 
corrélation compris entre +0.75 et +1. 


Il est aussi courant de représenter l'influence en % de chaque variable sur la variable principale en faisant 
la moyenne des rapports entre les deux. Ce qui donne le graphique suivant si nous en avons un grand 
nombre: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


a — le 
+ 
+ 
+ + +. 
* +» 
+ 
— + + 
; + 
-150 120 + D50 s+" oho “te of ? 1.00 150 
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id +. s< i i 
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F 
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| | 


corrélation 


Figure: 67.29 - % d'influence sur la variable principale en fonction de la 


Ainsi, par exemple, nous pouvons observer sur le graphique ci-dessus qu'une variable a une influence 
moyenne de +4% sur l'indice du portefeuille avec une corrélation de +0.5. 


Bref... libre cours pour faire le graphique que l'on veut en fonction des besoins de son entreprise! 


8. BIENS D'ÉQUIPEMENT 


Les installations, les biens d'équipement subissent une dépréciation progressive due à l'usure ou à 
l'obsolescence. Cette baisse de valeur, enregistrée comme une charge en comptabilité, est appelée 
"amortissement comptable". Il ne faut pas confondre l'amortissement financier vu dans le chapitre 
d'Économie qui correspond au remboursement d'une dette et l'amortissement comptable qui est une 
diminution de valeur des moyens de production. 


Certains types de biens ont une perte de valeur assez uniforme dans le temps contrairement à d'autres qui 
se déprécient plus rapidement les premières années. Nous allons présenter ici quelques-unes des méthodes 
comptables utilisées en pratique qui décrivent l'un ou l'autre de ces phénomènes. 


8.1. AMORTISSEMENT LINÉAIRE 


Définition: Nous parlons d'un "amortissement linéaire" d'un bien lorsque sa valeur d'immobilisation est 
diminuée (amortissement) d'un montant périodique (annuel dans la comptabilité) constant durant sa durée 
de vie: 


Ainsi, si nous notons 4, le montant du k-ème amortissement et F la valeur initiale du bien d'équipement 
et Ÿ”, sa valeur finale souhaitée (qui dans la plupart des cas sera nulle), nous avons: 
Fr —F, 


A=A,="0 2 (67.155) 
# 


Il est possible d'obtenir la valeur d'amortissement en utilisant la fonction AMORLIN( ) de la version 
française de Microsoft Excel 11.8346. 
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Le taux d'amortissement équivalent constant basé sur la valeur d'achat et résiduelle est alors donné 
évidemment par: 


Po = Pa 
#% = ___#___ (67.156) 
0 


À remarquer que ce taux constant ainsi que la valeur finale sont parfois imposés par la législation dans 
certains pays (comme c'est le cas en Suisse par exemple) jusqu'à une valeur résiduelle nulle ou non nulle 
elle aussi définie par la législation! 


8.2. AMORTISSEMENT ARITHMÉTIQUE DÉGRESSIF 


Définition: Lorsque la valeur d'immobilisation (amortissement) d'un bien décroît inversement à l'ordre 
des périodes (années en comptabilité) nous parlons alors "d'amortissement arithmétique dégressif" (donc 
pas de taux d'amortissement imposé par l'État possible!). 


Par exemple, un bien d'une durée de vie de 4 ans, sera amortissable de 4/10 la première année, 3/10 la 
seconde, 2/10 la troisième et 1/10 la dernière. La base commune "10" (dans cet exemple) étant la somme 
arithmétique 1+2+3+4 afin que la totalité des fractions soit égale à l'unité. Il s'agit d'une règle purement 
fiscale américaine " Sum-of-Years Digits" (SYD). 


Remarque: I ne faut pas confondre "l'amortissement arithmétique dégressif" avec "l'amortissement 
dégressif" qui consiste à appliquer un coefficient multiplicateur (édicté par le fisc) au pourcentage 
d'amortissement linéaire correspondant et que nous ne traiterons pas sur ce site (sauf demande 
explicite d'un lecteur). Il ne peut être utilisé que pour des biens neufs et ne concerne pas tous les types 
d'immobilisation. Ce taux d'amortissement dégressif s'applique chaque année sur la valeur comptable 
résiduelle du bien. 


Soit 4, le k-ème amortissement et F; la valeur initiale du bien d'équipement et }, sa valeur finale 
souhaitée (qui dans la plupart des cas sera nulle) nous avons alors: 


4 
5 7) 
3 
. TILL -P,) 
(67.157) 
2 
“oUe -F,) 
_ 1 
: TLC ve) 
ce qui peut s'écrire: 
A—£+l n-&+l 
Aa 0 A) (1158) 


et comme nous l'avons démontré dans le chapitre des Suites Et Séries: 
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(x +1 
5, ee (67.159) 
ce qui nous amène à écrire: 
A PU 
06), (67.160) 
ax +1) 


Il est possible d'obtenir l'amortissement à une période k en utilisant la fonction SYD( ) de la version 
française de Microsoft Excel 11.8346. 


8.3. AMORTISSEMENT GÉOMÉTRIQUE DÉGRESSIF 


Définition: Lorsque la valeur d'immobilisation d'un bien décroît selon un taux d'amortissement constant 
basé sur la valeur résiduelle de la période précédente (donc en quelque sorte comme un intérêt composé à 
taux négatif), nous parlons alors "d'amortissement géométrique dégressif simple". 

Ainsi, la valeur du bien après n années est définie par: 


P=M(1-1%) (67.161) 


avec donc: 


É% =1-x (67.162) 


TES 


Remarque: Nous constatons que la valeur de t% étant comprise dans l'intervalle entre [0,1[ la limite de 
(= 2%) quand n tend vers l'infini n'est jamais nulle. Ainsi, la valeur résiduelle ne le sera jamais non 


plus ! 


Sachant par définition de cet amortissement que: 
A, =ViiË% (67.163) 
nous obtenons: 
A = (1-24) 4% (67.164) 


En injectant l'expression du taux dans la relation précédente, nous obtenons: 
1 k1 _ 
| F Z F F,|* fr. 
= |1-[1-1— 1-2 |=7 la 1-2 = |— 1-1 
“ 1 " Lu : 
7e JAPFIAT CR ES LAN à 
_# || | ==) -[+ 
F, PJ 1 F Fr 
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NS 


(67.165) 


nc 


Nous remarquons donc que les valeurs d'amortissement ne nécessitent pas de connaître le taux de manière 
explicite. Il suffit de connaître la valeur finale et initiale. C'est justement pour cela que la fonction DE ) 
de la version française de Microsoft Excel 11.8346 ne demande pas le taux d'amortissement. 


À remarquer que ce taux constant ainsi que la valeur finale sont parfois imposés par la législation dans 
certains pays (comme c'est le cas en Suisse par exemple) jusqu'à une valeur résiduelle nulle ou non nulle 
elle aussi définie par la législation! 


Remarque: L'amortissement géométrique dégressif convient particulièrement aux biens ayant une très 
forte dépréciation les premières années. 


8.4. CHOIX D'INVESTISSEMENTS 


Par définition, un investissement est l'acquisition ou le développement d'un bien (quelle que soit sa forme, 
matérielle ou non) par une entreprise, une collectivité ou un individu. Un investissement implique dans le 
cadre économique simple: 


1. Une dépense immédiate, payable en une ou plusieurs fois 
2. Des entrées futures, appelées "cash-flows" 
3. Une valeur résiduelle 


Il existe plusieurs critères et techniques pour les choix d'investissements, que nous présenterons ci-après, 
qui permettent d'opter pour un investissement À ou B: celui de la "valeur actuelle nette" (VAN), celui du 
"taux interne de rentabilité" (TRI) ou encore celui de "délai de récupération" (DR) appelé aussi "délai de 
recouvrement". 


Remarque: I ne faut pas oublier aussi que les techniques de décisions ( 
) ont une énorme importance lorsque les sommes considérées atteignent des 
valeurs non négligeables. 


8.4.1. VALEUR ACTUELLE NETTE 


Comme nous l'avons spécifié plus haut, un investissement implique trois points. Ce qui intéresse bien 
évidemment l'investisseur, c'est qu'en valeur actuelle, l'investissement rapporte plus que ce qui est 
dépensé. 


Voyons une situation-type: Une entreprise souhaite acquérir une nouvelle machine valant 6'000.-, ce qui 
devrait permettre d'abaisser les coûts de production de 1'000.- durant 5 ans. Nous estimons que dans 5 ans, 
la valeur résiduelle de cette machine sera de 3'000.-. Doit-on acheter cette machine si cet investissement 
peut être financé par un emprunt à 10%? 


Quelles informations avons-nous ici? 


1. La dépense immédiate F, = 6'000 


2. La valeur finale ou résiduelle du bien d'équipement après 5 ans F7, = 3'000 
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3. Les cash-flows de chaque année €’, = l'O00 (qui sont constants sur toute la période dans cet exemple) 


4. Le taux d'intérêt (taux géométrique moyen du marché) de l'emprunt correspondant #%% = 10% 


Quelles informations, ou questions intéressantes, financièrement parlant, pouvons-nous poser par rapport 
aux données ci-dessus?: 


1. Quel serait le capital initial qui au taux du marché nous permettrait de retirer 1'000.- par année pendant 
5 ans (jusqu'à ce que l'on solde le compte)?: 


æ é 


[pi 
L_+ Et 


1+4% (+84) (1+2%Y 


ce qui s'écrit si €, = €’ (nous retrouvons la relation de la rente certaine postnumerando vue dans le 
chapitre d'Economie): 


C C C 


++ + ————— = 


144% (1+8%4) (1+%) 


Ca: 


Dans notre exemple cette somme (après un petit calcul) revient à environ 3790... 


En d'autres termes, il nous suffirait de mettre en épargne 3'790.- pendant les mêmes 5 ans, pour en retirer 
1'000.- par année jusqu'à solder le compte. Donc pour l'instant, un investissement de 3'790 pour 
économiser (gagner) 1'000.- par année semble beaucoup plus favorable qu'en dépenser 6'000.- pour le 
même retour, sur la même durée. 


Déjà là, nous pouvons dire que l'achat de la machine est défavorable. 
Mais il ne faut pas oublier aussi un deuxième facteur. la valeur résiduelle de notre machine!!! 


2. Quel serait le capital initial qui au taux du marché nous rapporterait une valeur équivalente à la valeur 
résiduelle de notre machine (c'est une valeur immobilisée au même titre qu'une épargne, donc nous 
pouvons nous intéresser à ce qu'il adviendrait si cette somme provenait d'une épargne) ? 


” 


x 


(1+4%) 
Dans notre exemple, cette somme revient environ à 1'862.- 


En d'autres termes, il nous suffirait de mettre en épargne 1'862.- pendant les mêmes 5 ans, pour obtenir 
une somme égale à la valeur résiduelle de notre machine. Et alors? 


Eh bien la conclusion est assez simple... La somme: 


1, C, VA 


+ * 


ft) (1+:%) 


représente le retour sur la base d'une épargne initiale pour obtenir, par rapport aux informations de valeur 
résiduelle et de cash-flow, la somme finale équivalent à l'achat de notre machine. Or, dans cet exemple, 
cette somme nous donne environ 5'652.-. 
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Ce résultat est important car il est à comparer avec l'investissement que nous voulions faire initialement. 
Deux options s'offrent donc à nous: 


1. Acheter la machine à 6'000.- avec les cash-flows et les valeurs résiduelles que nous connaissons 


2. Épargner 5'652.- pendant la même période, avec les mêmes cash-flows pour nous retrouver avec une 
épargne finale qui devrait être équivalente à celle de la valeur résiduelle de notre machine. 


Or, que pouvons-nous conclure de notre exemple? Eh, bien simplement que nous nous trouvons dans un 
cas défavorable si: 


x 
ns ei Arr TE < 0 (67.170) 
(+4) (+24) D Arf (1+4%Ÿ" 


En d'autres termes, pour le financier (ou chef de projet), le calcul intéressant à faire est le suivant: 


7 


x _ 


FAN. = 2 #7) 


qui: 

1. Lorsqu'il est négatif correspond à un investissement qu'il vaut mieux éviter 
2. Lorsqu'il est nul est un investissement indécidable 

3. Lorsqu'il est positif est un bon investissement 


Dans certains cas scolaires et livres de gestion de projets, la relation de la VAN ci-dessus est simplifiée, 
car ils supposent que seul un investissement... est fait en début de projet. Ainsi, nous avons: 


Ce 


FAN. = D» —— 
us 


— #il (67.172) 


Enfin, précisons que le rapport: 


| 
(1+4%)" 


AN 


est souvent appelé "coefficient d'actualisation" de la n-période. 


Ainsi, la VAN est utilisée comme critère décisionnel dans les grandes entreprises pour chiffrer l'apport 
spécifique d'un projet au résultat financier de l'entreprise, en tenant compte du coût du capital utilisé via le 
taux d'actualisation. 
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Donc dans le cas d'un choix entre plusieurs investissements, nous choisirons celui dont la VAN est la plus 
grande. Si les cash-flows sont non déterministes il faudra alors calculer l'espérance et la variance de la 
VAN. Les spécialistes abrègent souvent le calcul de l'espérance de la VAN par l'abréviation VANEe pour 
"valeur actuelle nette espérée" ou plus fréquemment en anglais "expected net present value" (eN.P.V.) ou 
encore "risk-adjusted net present value" (rN.P.V.). Le lecteur pourra trouver un exemple de calcul de 
VANe dans le serveur d'exercice (sinon, sur demande, nous intégrerons directement l'exemple sur la 
présente page). 


Remarque: La VAN est aussi souvent appelée "quasi-rente actualisée" ou encore en anglais "net 
present value" (N.P.V.). Nous trouvons également souvent la dénomination "méthode des cash-flows 
actualisés". 


Si nous considérons en avenir certain avec un investissement initial unique de 10'000.- avec un taux 
d'actualisation constant de 10% et un cash-flow parfaitement périodique de 3'250.-, 3'750.-, 4'250., 
4"750.- nous avons la représentation tabulaire traditionnelle: 


Tableau: 67.12 - Actualisation détaillée sous forme comptable 


où dans le tableau ci-dessus F.N.T. signifie "Fond Net de Trésorerie", F.N.T.A. "Fond Net de Trésorerie 
Actualisé", C.A. "Coefficient d'Actualisation" et C.F.A. "Cash-Flow Actualisé". 


Ainsi dans ce tableau, l'investissement rapporte 2'491.- de plus qu'une opération de placement à 10% après 
4 ans en avenir certain (univers déterministe). 


8.4.2. TAUX DE RENTABILITÉ INTERNE 


Définition (technique): Le "taux de rentabilité interne" (TRI), appelé aussi parfois "taux limite de 
rentabilité" est le taux d'actualisation t% pour lequel la valeur actualisée des rentrées nettes de fonds 
résultant d'un projet d'investissement est égale à la valeur actualisée des décaissements requis pour réaliser 
cet investissement. 


En d'autres termes, cela revient à se demander quel est le taux moyen géométrique du marché pour lequel 
la V.A.N. du projet est nulle. Soit à satisfaire la relation: 


FAN NC 4 -F, = 0 
mt) (144%) 


(67.174) 
# C': Fr 


ul + x = F7 


e(+4%) (1+4%) 


qui ne peut que se calculer rapidement avec des outils informatiques (l'outil Cible dans 
Microsoft Excel 11.8346 par exemple). 
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Donc entre deux investissements, nous choisissons dans les entreprises celui dont le TRI est le plus élevé 
et satisfait aux contraintes internes. 


Ce type de calcul s'applique donc sur le retour sur projets contre investissements sur le marché et non pas 
au retour sur projets contre exploitation. Ainsi, il s'agit d'un outil calculatoire d'aide à la décision 
purement financier et non industriel ou commercial. 


8.4.3. DÉLAI DE RÉCUPÉRATION ET D'AMORTISSEMENT 


Le "délai de récupération" (DR), appelé aussi "délai de recouvrement" ou "pay back" (en anglais) est un 
autre indicateur pour l'aide à la décision dans le cadre des choix d'investissements de projets et plus 
simple à l'utilisation (et à la compréhension) que la VAN. 


Cet indicateur a pour simple et seul objectif de montrer quand, dans le temps, l'investissement sera 
remboursé. En d'autres termes, il indique le nombre de périodes nécessaires pour que la somme des cash- 
flows couvre l'investissement initial. C'est une information très simple à déterminer qui revient à chercher 
le plus petit entier p tel que: 


PF SC +Cit..+C, (67.175) 


ou Encore: 


el 


En d'autres termes, c'est le moment d'un projet où les cash-flows équilibrent l'investissement initial. 


Définition: Le "délai d'amortissement" est le nombre de périodes nécessaires tel que: 


C + C + Cy 


nm < — 5 + —— 
144% (1+4%Y (1+2%Y 


0 


ou Encore: 


A+4%) 


&1 
9. THÉORIES DES FILES D'ATTENTE 


Les théories des files d'attente sont des outils extrêmement puissants et vastes (une présentation complète 
nécessite au bas mot 300 pages A4) permettant de prendre en compte et de modéliser les goulots 
d'étranglement dans les processus des entreprises soit au niveau de la logistique, des centrales 
téléphoniques, des requêtes sur les serveurs, des caisses de grands magasins ou encore dans les toilettes 
des grands stades sportifs (...) en fonction des hypothèses et contraintes de départ. 
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Généralement, les clients voient évidemment dans l'attente une activité sans valeur ajoutée et, s'ils 
attendent trop longtemps, ils associent cette perte de temps à une mauvaise qualité de service. De la même 
façon, au sein de l'entreprise, des employés inoccupés ou des équipements inutilisés représentent des 
activités sans valeur ajoutée. Pour éviter ces situations, la majorité des entreprises ont mis en place des 
processus d'amélioration continue dont le but ultime est l'élimination de toute forme de gaspillage, 
notamment l'attente. Tous ces exemples révèlent l'importance de l'analyse des files d'attente. À remarquer 
qui si une entreprise ou administration n'a pas les moyens financiers ou intellectuels de faire de la théorie 
des files d'attentes, le respect minimum envers les clients est au moins d'indiquer à l'aide d'un affichage 
peu onéreux, le temps d'attente ou de mettre à disposition des moyens de distractions (télévision, journaux 
ou magazines)! 


RS PS A 


Tableau: 67.13 - Exemples de files d'attente typiques 


Ces théories se révèlent notamment utiles pour justifier des investissements, des embauches ou des achats 
d'équipements. De façon plus générale, elle est une partie intégrante des techniques mathématiques de 
gestion lorsqu'il est nécessaire de rechercher un optimum économique entre des coûts d'attente et des 
coûts de service d'un système. 


La problématique type dans les entreprises peut s'exprimer ainsi: 


- Quel est le nombre optimal de stations/terminaux à mettre en service permettant de traiter la demande 
tout en évitant une file d'attente trop importante et le départ de certains clients? 


- Quel est le temps d'attente moyen d'un client/employé devant la station/terminal? 

- Quel est le nombre moyen de clients en attente dans la file? 

Ces questions permettent d'exprimer des objectifs en matière de qualité et de niveau de service: 
1. Un temps d'attente moyen ou médian dans le service ou dans la file à ne pas dépasser 

2. Une probabilité d'attente maximale 


3. Un nombre de clients moyen en attente donné 
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En pratique, lorsque le client est externe à l'entreprise, le coût d'attente est difficile à évaluer, car il s'agit 
d'un impact plutôt que d'un coût pouvant être comptabilisé. Cependant, on peut considérer les temps 
d'attente comme un critère de mesure du niveau de service. Le gestionnaire décide du temps d'attente 
acceptable et il met en place la capacité susceptible de fournir ce niveau de service. 


Lorsque le client est interne à l'entreprise, nous pouvons établir directement certains coûts se rapportant au 
temps d'attente des clients (machines). Par ailleurs, il ne faut pas conclure trop rapidement que pour 
l'entreprise, le coût du temps d'attente d'un employé qui attend est égal à son salaire durant le temps 
d'attente. Cela impliquerait que la baisse nette des gains de l'entreprise, du fait de l'inactivité d'un employé, 
est égale au salaire de ce dernier, ce qui, a priori, n'est pas évident. L'employé, qu'il travaille ou qu'il 
attende, reçoit le même salaire. Par contre, sa contribution aux gains de l'entreprise est réellement perdue, 
car la productivité baisse. Quand un opérateur de machine est inactif parce qu'il attend, sa force 
productive (qui peut comprendre, outre son salaire, une proportion des coûts fixes de l'entreprise) est 
perdue. En d'autres termes, il faut tenir compte non pas de la ressource physique en attente, mais plutôt de 
la valeur (coût) de toutes les ressources économiques inactives, et évaluer ensuite la perte de profit à partir 
de la perte de productivité. L'objectif de l'analyse des files d'attente est de trouver un compromis entre le 
coût associé à la capacité de service et le coût d'attente des clients. 


Ces théories font donc appel à des méthodes statistiques et algébriques que nous avons étudiées dans les 
chapitres de Statistiques et de Théorie Des Graphes. Elles n'en sont alors que plus passionnantes. 


Pour présenter le sujet, plutôt que de faire une généralisation abstraite, nous avons choisi de développer la 
théorie autour d'un exemple concret et classique qui est le télétrafic. Une généralisation à tout autre cas 
d'étude se faisant ensuite relativement facilement par analogie. 


Considérons donc une centrale téléphonique regroupant les lignes d'un ensemble d'immeubles d'une ville 
et ne possédant pas autant de lignes allant vers le réseau que de lignes allant vers les différents particuliers 
qu'il dessert. 


Nous pouvons donc légitiment nous demander de combien de lignes nous avons besoin pour desservir tous 
ces abonnés. 


Pour dimensionner son réseau, un opérateur va devoir calculer le nombre de ressources à mettre en oeuvre 
pour qu'avec une probabilité extrêmement proche de 1, un usager qui décroche son téléphone puisse 
disposer d'un circuit. Pour cela, il va falloir développer quelques relations de probabilité de blocage. Ces 
relations vont demander une modélisation statistique des instants de début et de fin d'appels ainsi que des 
durées de ces appels. Les paragraphes qui suivent vont donc introduire les lois de probabilités utilisées 
pour ces dimensionnements. 


Enfin, avant de commencer, nous souhaitons mettre à disposition le tableau récapitulatif ci-dessous des 
notations les plus importantes que le lecteur découvrira au fur et à mesure de sa lecture et auquel il pourra 
se reporter en cas de confusion: 
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Flux d'arrivée de clients dans la file d'attente 
(communication), appelé également "taux 
moyen d'arrivée des appels", ou encore 
"fréquence moyenne d'arrivées". 


Ces: 


L'inverse 471 donne le temps moyen entre 
arrivées (appels) dans la file d'attente. 
Flux de départ de clients (communication) 
correspondant au taux de traitement. 


L'inverse 47! donne le temps moyen 


es | 


d'attente pendant le service (donc une fois 
arrivé en fin de file d'attente) appelé aussi 
temps moyen de service". 


Taux d'utilisation du service (par unité de 
serveur). Assimilé au concept de trafic (un 
peu abusivement) ou de charge. Est égal au 
apport À / { et doit être strictement 
inférieur à 1 pour éviter l'engorgement. 


ombre de clients au total dans le système 


ombre de clients en attente dans la queue 


ombre de clients en service (traitement) 
Temps d'attente dans le système 


Temps d'attente dans la queue 
Probabilité d'avoir k clients dans le système 


Tableau: 67.14 - Notations conventionnelles des files d'attente 


et précisons que les paramètres à prendre en compte son souvent: 

- Le type de processus d'arrivée des clients (données) 

- La distribution statistique du temps de service (traitement) 

- Le nombre de caisses (serveurs) 

- La capacité du système (souvent supposée infinie dans la pratique...) 
- La taille de la population 

- Le discipline du service 

9.1. MODÉLISATION DES DURÉES D'ARRIVÉES MM... 


Dans ce modèle M/M/... dont nous expliquerons l'origine de la notation plus tard, nous considérons des 
appels qui débuteraient de manière aléatoire. Prenons ensuite un intervalle de temps t et divisons cet 
intervalle en n sous-intervalles de durée t/n. 


Nous choisissons n suffisamment grand pour que les hypothèses suivantes soient respectées: 
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H1. Une seule arrivée d'appel peut survenir dans un intervalle t/n 


H2. Les instants d'arrivée d'appels sont indépendants les uns des autres (le taux d'arrivée n'est pas 
influencé par le nombre d'appels provenant de la population). Ce qui présuppose une population infinie. 


H3. La probabilité qu'un appel arrive dans un sous-intervalle donné est proportionnelle à un facteur 
constant près à la durée du sous-intervalle. 


Nous écrivons alors la probabilité de un appel > dans un sous-intervalle (1) de la manière suivante: 


Ë 
n(0=4— 
7 


où le 1 en indice du p représente donc l'analyse sur 1 appel, le 1 entre parenthèses le fait que l'analyse se 
fait sur 1 sous-intervalle et enfin le terme À représente le coefficient de proportionnalité entre la 
probabilité et la durée t/n du sous-intervalle. 


L'hypothèse de départ consistant à considérer comme nulle la probabilité d'avoir plusieurs appels dans un 
sous-intervalle s'écrit alors: 


+<o 
Pa) + (D +4,00 += pr (1) = 0 
k=2 
La probabilité de n'avoir aucun appel durant un sous-intervalle de temps tn s'écrit donc: 
+o 
Po) =1- 7% p3 (1) 
k=l 
En développant, nous obtenons: 
Ho 
PoD=1-n0D- > 7% (D 
k=2 


et en utilisant la propriété énoncée juste au-dessus: 
Pod) =1- p1(l) 


La probabilité d'avoir k arrivées d'appels durant n intervalles de temps s'obtient alors en considérant le 
nombre de manières de choisir k intervalles parmi n.. (puisqu'il ne peut y avoir plus d'un appel par 
intervalle). 


Pour chacune de ces solutions, nous aurons alors forcément k intervalles avec une arrivée d'appel et n-k 
intervalles avec aucune arrivée d'appel. Nous avons vu dans le chapitre de Statistique que la loi qui 
permettait d'obtenir la probabilité de choisir un certain arrangement d'issues binaires parmi un nombre 
total d'issues était la loi de Bernoulli donnée par: 


P= Dar 


Il vient donc dans notre cas de figure que la probabilité d'une des solutions sera: 
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D 20% (67.185) 


La probabilité globale s'obtient en sommant les probabilités de tous les cas, ce qui nous donne la loi 
binomiale (cf. chapitre de Statistiques): 


#! k MR _ ms FE n-k | 
PACE PESTE (1) 2a0) = Ci PQ) Po) (67.186) 


Ou encore, en remplaçant les probabilités par leurs valeurs en fonction de À,é,# : 
{ & { n—k 
PU)= CE fai) (- at) (67.187) 
# ñ# 


La limite de la probabilité p,(#) lorsque n tend vers l'infini va être égale à la probabilité d'avoir k 


arrivées d'appel durant un intervalle de temps t. Nous notons p4 cette probabilité: 
= lim A) rie 
Pr n5ko7 @) (67188) 
En reprenant alors les différents termes de l'expression de p4 (x) , il vient: 


a” 


ACTE. fa) (n-}) ifi-2i) 
(rai) =|# n = g NZ (67.189) 
À 


En utilisant les développements de Taylor (cf chapitre de Suites Et Séries): 
+o (- | id 
Infl+x)= ÿ  —— x" (67.190) 
n=l ñ 
Soit en ne prenant que le premier terme, c'est-à-dire en considérant x très petit: 


n(Î+zx)Z=x (67.191) 


Donc: 


Fr 


Cr-H)laf 4) 


(4 


et pour la dernière partie: 
4) . al (4) (AY 
Flu kl(a—#)l nf kl (-Dir 


(A) na D 2). (æ—-k+n _ (4 
kl À ask &l. 
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d'où après regroupement: 


k 
(#) ge” Àt| (67.194) 
k 


Pr = 


Cette fonction de distribution est donc extrêmement importante, car elle représente la probabilité 
d'observer k arrivées d'appels dans un intervalle de durée t (ou le nombre de clients qui se trouvent devant 
une caisse dans un intervalle de durée t) et il s'agit donc d'une distribution de Poisson (cf chapitre de 
Statistiques). Dans la pratique, il faut donc s'assurer avant d'utiliser les relations qui vont suivre que cette 
distribution soit bien respectée (avec un test du Khi-deux typiquement). 


Considérons maintenant la fonction de répartition, appelée "fonction de répartition d'Erlang", qui pour un 
intervalle de temps t donné donne la probabilité cumulée d'avoir un nombre k d'arrivées supérieur ou égal 
àn: 


k 
D (A 
F(E,k) = > gt (67.195) 
x Æ kl 
k=n | 


. is 7 La Pæ 487 * 
d a kl Z ki Z #l 
. k-1 k < l —; 
— Nr > © A0 À 27# > mind (67.196) 
al 
_ Il de At 
{x —lil 


et donc nous retrouvons une forme particulière de la fonction de distribution de la loi Gamma vue dans le 
chapitre de Statistiques. Rappelons au passage l'équivalence déjà présentée dans le chapitre de 
Statistiques dans la version française de Microsoft Excel 14.0.6123 entre la loi de Poisson, la loi du Khi-2 
et la loi Gamma: 


= LOLPOISSON N(x e N  VRAD 
=]1-LOLRHIDEUX N(2*4:2*(x+1} VRAI) (67.197) 
=]-LOL GAMMA N{ye x+ L VRAI) 


Il s'ensuit par analogie avec la forme générale de la loi de Poisson que le paramètre À est le taux moyen 
d'arrivée (taux moyen d'apparition) d'appels par unité de temps (ou en anglais "Poisson Arrivals See Time 
Average": PASTA...). Typiquement il s'agira d'un nombre moyen d'appels par seconde (voir les 
estimateurs de la loi de Poisson dans le chapitre de Statistiques). 


Ainsi, nous avons pour espérance et variance (cf chapitre de Statistiques) du nombre d'appels: 


Ek]= 4.5 Var(k)=.#| (67.198) 
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Exemple: 


Une TPE souhaitant mettre en place une hotline estime qu'au début elle recevra par journée de 8 heures, 4 
appels téléphoniques (soit une probabilité de 1 chance sur 2 d'avoir un appel par heure et donc un taux 
moyen À de 0.5 appels par heure). Alors la probabilité qu'elle reçoive exactement 4 appels (k) par jour et 
au moins 4 appels (k) par jour selon le modèle théorique de la théorie des files d'attente est de: 


4 
0.5.8 
n(&=4)s= (058) ose = POISSON, 0.5*x8:FAUX)=19.55% 
4 0.5.8 k (67.199) 
rL(k<4)z > Sr = POISSON(4,0.5x8;VRAT)=62.88% 
k=0 


où nous avons utilisé la fonction POISSON ) intégrée dans la version française de 
Microsoft Excel 14.0.6123. 


Maintenant, introduisons la variable aléatoire T représentant le temps séparant deux arrivées d'appel. 
Nous définissons pour cela la probabilité A(t) qui est la probabilité que le temps T soit inférieur ou égal à 
une valeur t: 


AG)= P(TSË) (67.200) 
Nous avons donc: 
At)=1-P(T>6) (67201) 


Or, P(T >£) représente la probabilité cumulée qu'il n'y ait aucune arrivée d'appels durant un temps t. 
Cette probabilité cumulée a justement été établie plus haut: 


(] 
(A) y  -x (67.202) 


PT >t)= Pop = Gi 8 = € 


Nous en déduisons: 
A =1-e" # (67.203) 


Il s'agit donc de la fonction de répartition d'une loi exponentielle! Nous pouvons aussi introduire la densité 
de probabilité de la variable aléatoire T . Nous obtenons ainsi: 


(67.204) 


a(ey= 20 = tt 
dt 


Remarque: Rappelons que dans le chapitre de Statistiques, nous avons souvent fait la démarche 
inverse. C'est-à-dire compte tenu d'une densité de probabilité a(t) nous cherchions la fonction de 
répartition A(t) via une intégration sur le domaine de définition de la variable aléatoire. 


La densité de probabilité permet donc de calculer la durée moyenne entre deux arrivées d'appel: 
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+<o +<co 
T=En= [sr atat= | ae dt (67205 
0 0 


En intégrant par parties, il vient: 


1 - 
E(r) = Àt ee du (67.206) 


csfageta-fe du” d=— 


Nous obtenons ainsi, que pour un taux d'arrivée de À appels par seconde, le temps moyen entre appel est 
égal à 1/ À (résultat relativement logique mais encore fallait-il le démontrer rigoureusement). 
Effectivement, si nous avons À qui vaut 2 appels par heure, le temps moyen d'arrivée est bien de 0.5 
heures (1/2) entre appels. 


Supposons maintenant qu'aucun appel ne soit arrivé jusqu'à un temps # et que nous souhaitions calculer 
la probabilité qu'un appel arrive durant une durée t après le temps #. 


Nous devons donc calculer la probabilité d'avoir une durée entre deux appels inférieure à £ +é, tout en 


étant supérieure à ég. 


Cette probabilité s'écrit PT ££ +41 |T > 4). En utilisant la formule de Bayes (cf. chapitre de 
Probabilités): 


PNA 
FEI 4 = 02 (67.207) 


mais avec les notations idoines, il vient: 


Pi <T<St+4) 


P(rSt+0|T>40)= P(r>4) 


(67.208) 


Cette probabilité peut encore s'écrire: 


P(r<t+h6)-P(T<t) P(r<t+4)-P(T<t) 


P(T£SE+4|T>4#4)= = 57.209 
Sn LE P(r>4) Pfreg) (72) 
En reprenant les expressions des différentes probabilités: 
fe 8%) (#0) Ath). -At 
—£ +e 
PES ES Q)—— ——— —@@ — 
1-[1-e ! e ‘0 
(67.210) 
À Al + 0 ue, = ÿ 
RE +1=1-e 
e “0 
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Nous voyons donc que la probabilité d'apparition d'un appel durant un temps t après une durée 
£ pendant laquelle aucun n'est arrivé est la même que la probabilité d'apparition d'un appel pendant une 


durée t, indépendamment de ce qui a pu arriver avant. Nous considérons donc que le phénomène (la loi 
exponentielle) est sans mémoire. 


9.2. MODÉLISATION DES DURÉES DE SERVICE MM... 


Dans ce modèle M/M/... dont nous expliquerons encore une fois l'origine de la notation plus tard, nous 
allons étudier les lois de probabilité qui modélisent les durées des appels (sous-entendu: en service une 
fois la fin de la file d'attente atteinte). Pour cela, nous procédons comme précédemment. 


Nous considérons donc un intervalle de temps de durée t que nous décomposons en n sous-intervalles de 
durée t/n. Nous choisissons n de sorte que les hypothèses suivantes restent justifiées: 


H1. La probabilité qu'un appel se termine durant un sous-intervalle est proportionnelle à la durée du sous- 
intervalle. 


Nous noterons: 


cette probabilité, expression dans laquelle # représente le coefficient de proportionnalité. 


H2. La probabilité qu'un appel se termine durant un sous-intervalle est indépendant du sous-intervalle 
considéré. 


Nous introduisons alors la variable aléatoire 4 représentant la durée d'un appel et la probabilité H(®) que 
la durée d'un appel soit inférieure ou égale à t: 


H(t)=P(8<t) (67212) 
La probabilité qu'un appel ayant débuté à t = 0 ne se termine pas avant t s'écrit alors: 
P(8>1t}=1-H() (67213) 


Cette probabilité est égale à la probabilité que l'appel ne se termine dans aucun des n sous-intervalles de 
durée tn: 


{ n 
1- A6) = fi-ui) (67.214) 
ñ 
En faisant tendre n vers l'infini, nous obtenons: 
t t 
| £ 7 nl 1-4 | n| —4- = . 
1- Aô)= lim fi-ui) = lime à ) lim X u =6 A (67215) 
#00 A 


Nous obtenons donc l'expression de la probabilité qu'un appel ait une durée inférieure ou égale à t: 


HO=1-e 4 (67216) 
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Nous pouvons en déduire la densité de probabilité associée, notée h(t): 


h(£) = 97@ _ ue 4 
dk 


qui correspond donc à une loi exponentielle (le temps qu'un client emploie pour être servi à une caisse - 
durée de service - ou pour que son appel soit traité une fois en fin de file d'attente suit donc une loi 
exponentielle!). Dans la pratique, 1l faut donc s'assurer avant d'utiliser les relations qui vont suivre que 
cette distribution soit bien respectée (avec un test du Khi-deux typiquement). 


De la même manière que dans les paragraphes précédents, la durée moyenne d'appel (laps de temps 
moyen entre deux fins d'appels en service) s'obtient en calculant (toujours la même intégration par parties 
que plus haut): 


= + 1 
8 = E(8)= | stoat = 
F 


En conclusion, nous avons # appels qui cessent par seconde et nous avons une durée moyenne d'appel en 
service égale à: 


1 


Hi 


Effectivement, si nous avons par exemple 2 appels en service qui cessent par heure, cela nous donne une 
durée moyenne de 0.5 heure (1/2) de service par appel. 


Le rapport: 


4=7 


Hi 


représente donc le nombre d'appels qui apparaissent dans la file d'attente sur le nombre d'appels en service 
qui se terminent pendant un intervalle de temps (temps de service moyen), c'est-à-dire qui représente en 
fait tout simplement le trafic (ou autrement dit: l'intensité de trafic) ou d'un autre point de vue l'utilisation 
moyenne du service dont l'unité est le "Erlang" (nous rappellerons cette définition plusieurs fois par la 
suite.….). 


Exemple: 


Dans un magasin, on compte 240 clients par heure et il faut 28 secondes en moyenne pour traiter un client 
(temps de service moyen). Sachant que la durée de service suit une loi exponentielle et la distribution des 

arrivées une loi de Poisson, quelle est l'intensité du trafic et le taux d'occupation des caisses si le magasin 
n'en a que deux? 


Le trafic est donc donné par le nombre de clients par heure divisé par le nombre de clients traités par 
heure. Comme il faut 28 secondes pour en traiter un et qu'il y a 3'600 secondes dans une heure, nous avons 
l'intensité de trafic suivante: 
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__ 240 
” 3'600 


28 


A = 1.866 Erlangs 


La charge moyenne (ou taux d'occupation) par caisse, sachant qu'il y en a deux, est donc de: 


= = 0.93= 93% 


C'est cette dernière valeur qui sera prise au final comme valeur du trafic À par station pour les calculs 
ultérieurs. 


Les probabilités d'apparition d'appels et de fin d'appels qui ont été développées dans les paragraphes 
précédents permettent de modéliser le processus complet d'apparition et de fin d'appels. 


9.3. NOTATION DE KENDALL 


Une notation a été développée par Kendall pour représenter les files d'attente suite aux développements 
intensifs (et nombreux) des modèles mathématiques les concernant. La forme réduite de cette notation est: 


A/B/C 


où À représente le processus d'arrivée des clients dans le système (loi de distribution), B représente la 
distribution du temps de service des clients du système (loi de distribution) et C le nombre de serveurs du 
système. 


Par exemple, la notation M/M/1 signifie que les clients arrivent dans le système selon une loi de Poisson 
modélisée par une chaîne de Markov (cf d 5), que le temps de traitement suit une 
distribution de type exponentiel (modélisé par une chaîne de Markov aussi) et le système constitué d'un 
seul serveur selon le principe du premier arrivé premier servi dans une file d'attente à population infinie et 
régime permanent. Ce qui correspond respectivement aux trois relations suivantes que nous avons 
démontrées plus haut pour la probabilité d'arrivée de k appels dans un temps donné: 


k 
(4) "At 
&l 


Pr = 
la probabilité que le temps de traitement (temps de service) soit égale à une certaine valeur: 
h (6) = ge #? 
et la probabilité d'avoir k clients (communications): 
Pr — # (I un A) 


La lettre M est utilisée pour indiquer que les processus employés sont du type markovien (sous-entendu 
exponentiels). 


En général, nous utilisons la notation: 


A/B/C/d:e 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


d représentant le nombre maximum de clients pouvant être présents simultanément dans le système. Ce 
nombre entier varie entre 1 et l'infini. Quand la capacité mémoire de la file est considérée comme 
illimitée, ce paramètre est souvent omis. Quant à e, il représente la discipline de service. Par exemple: 


- FIFO pour premier arrivé, premier servi (First In-First Out appelé aussi FCFS pour First Come-First 
Serve). Tous les modèles théoriques que nous allons développer ci-dessous seront de type FIFO! 


- LIFO pour dernier arrivé premier servi (Last In-First Out appelé aussi LCFS pour Last Come-First Serve) 
- SJF pour servir le travail le plus court d'abord (Shortest Job First) 
- SRO pour servir en ordre aléatoire (Service in Randon Order) 
et encore d'autres... 
Ce dernier paramètre est omis si la discipline est FIFO. Ainsi, MM s'écrirait sans rien omettre: 
MM {1/00 :FIFO 


On trouve également des variantes dans la littérature de la définition ci-dessus ce qui n'aide pas toujours à 
la lecture. 


9.4. MODÉLISATION DES ARRIVÉES ET DÉPARTS M/M/1 


À chaque instant un certain nombre d'appels vont apparaître et d'autres vont se terminer. Nous pouvons 
donc modéliser l'état où l'on se trouve à un instant donné comme une chaîne d'états. 


Chaque état représente le nombre d'appels en cours. Nous concevons donc bien que si, à un instant donné, 
il y a k appels, nous ne pouvons passer que dans deux états adjacents selon nos hypothèses: k-1 et k+1. 


Nous reconnaissons alors une chaîne de Markov ( apitre de Probal ). La probabilité de passer 
d'un état i à un état j pendant un temps dt sera donc notée: 


Pÿ (di) 
Nous introduisons alors les probabilités de transition d'état suivantes: 


- Étant dans l'état k, la probabilité ? &EH (dt) pour passer à l'état k + 1 durant un intervalle de temps dt 


sera notée A4 df 


- Étant dans l'état k, la probabilité P ; k (dt) pour passer à l'état k-1 durant un intervalle de temps dt sera 


notée {4 dé 


- Étant dans l'état k+ 1, la probabilité P ; HR (dt) pour passer à l'état k durant un intervalle de temps dt 


sera notée {4 dé 


- Étant dans l'état k - 1, la probabilité ? k-Lk (dt) pour passer à l'état k durant un intervalle de temps dt 


sera notée Aÿ-14f 
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MNT er ANENEETUEIN [SCIENCES.CH] 


Aÿ-1d Ajdt 
Figure: 67.30 - Schéma de principe 


Les grandeurs À, et {4 sont des taux d'arrivée (apparition) et de départ (fin) d'appels du même type que 


ceux utilisés lors des paragraphes précédents. La seule différence tient au fait que ces taux ont en indice 
l'état où se trouve le système. 


Nous pouvons alors introduire la probabilité d'état, c'est-à-dire la probabilité d'être dans un état k à un 
instant t. Notons pour cela p; (1) cette probabilité (à rapprocher de la notation ? ;(*) utilisée pour les 
chaînes de Markov à temps discret dans le chapitre de Probabilités). 


La variation de cette probabilité durant un intervalle de temps dt est alors égale à la probabilité de 
rejoindre cet état en venant d'un état k-1 ou d'un état k+1 moins la probabilité de quitter cet état pour aller 
vers un état k-1 ou vers un état k+1. 


Ce qui s'écrit: 


dpy (€) 
dt 


= À Pr(0 + HenPen() (A +4 )pe@) (67227) 


En supposant le système stable, c'est-à-dire en supposant qu'il se stabilise sur des probabilités d'état fixes 
lorsque le temps tend vers l'infini, nous pouvons écrire que: 


im dpy (€) _ 


t+0 dé 


O (67.228) 


Nous pouvons alors noter p; = p4{£) d'où finalement: 


À Pr © + Hp Pen €) — (A +4) px (©) = 0 (67.229) 


Nous aurions pu introduire cette dernière relation d'une autre manière: Elle exprime simplement le fait que 
la probabilité de partir d'un état est égale à celle pour y arriver (c'est peut-être plus simple ainsi). 


Cette relation est vérifiée pour tout & = 0 avec les conditions mathématiques suivantes (car sinon ces 
termes n'ont aucun sens mathématique): 


P_1 = 0, À = 0 (67.230) 
et la condition logique réelle suivante (des appels non encore existants ne peuvent finir….): 


£ = 0 (67.231) 
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Remarque: Insistons sur le fait que la stabilité des probabilités signifie qu'il y a une probabilité égale 
de quitter l'état p, que de le rejoindre. 


En écrivant le système d'équation précédent, nous trouvons: 


21 = À 70 
P2 = tata) Er re + 42 70 . 
Le A 2 Æ (67.232) 
AC +4) À pe ak, |, 
4 A A É3E2A 


Nous trouvons alors assez facilement la forme générale: 


&-1l À 
Pr =|II— (70 (67235) 


i=Ù Æ, il 


Le système se trouvant obligatoirement dans un des états nous avons la relation suivante qui doit 
obligatoirement être respectée: 


> Pr =1 (67.234) 
k=0 


En remplaçant avec la relation antéprécédente: 


+o f k-1 À 
> {II à) =] (67.235) 
=0 #4 


Ce qui donne aussi: 


&-l À 
Po +F II— 120 =1 (67.236) 


k=1 \1=0 46H 
et donc: 
_— 
Po +È [IA ) (67.237) 
k=1\1=0 4 
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VER nATerAN EN EAUEIR [SCIENCES.CH] 
Si nous considérons maintenant un système avec une seule ligne et de capacité infinie (régime permanent) 


, les grandeurs À; (taux d'arrivée des appels) et {4 (taux de départ des appels) auront des valeurs 
identiques pour tout k. C'est-à-dire que nous considérons que le taux d'arrivée ainsi que le taux de départ 
sont constants quelle que soit la position dans laquelle on se trouve dans la file d'attente. Nous avons alors 


la dernière relation qui se simplifie: 


l 1 
Por — fr = & 
À; 4 67.238 
k=1\1=0 #54 ka \ A 


En utilisant le résultat démontré dans le chapitre sur les Suites Et Séries (série de Gauss) nous avons sous 
des conditions précises nécessaires de convergence (A doit être strictement plus petit que 1): 


Il l 1 1 
Po — ie à Fran +o 1 ee, ia 
SU D — — (67.239) 
> (1) (À) 1 1-7 
À 


Puisque k représente le nombre d'appels, cette dernière relation donne la probabilité d'avoir 0 appel 


(clients) pour un trafic permanent donné À sur la ligne. 


En utilisant: 


&-1 À 
Pr =|[I[— {70 (67240) 


10 AH 
nous avons alors en toute généralité pour ce type de système la probabilité d'avoir k appels en régime 


permanent qui est donné par: 


& 
Px -[ (1- 4)= 4* (1-4) (67241) 
A 


Il en vient que l'espérance du nombre de communications (clients) dans le système (dans la queue + en 
service) est alors par définition de l'espérance: 
+0 + #0 
E(C)= D k. pe = DR (1- 4)=(1- 4) 5 &AË (67.242) 
k=0 k=0 k=0 
puisque ?, représente la probabilité pour qu'il y ait à tout instant k appels dans le système (file d'attente + 
en service). Or, nous avons vu dans le chapitre sur les Suites et Séries que: 


1=2" 


ñ . 
>'g = (67.243) 
i=0 l-g 


et si q est strictement inférieur à 1 et que n tend vers l'infini, nous avons immédiatement: 
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+o 


? 1 : 
D 4 =— (67.244) 
i=0 l= q 
Si nous dérivons cette dernière relation: 
d cs È - | 1 
—5q => iq 2 (67.245) 
et en multipliant par q il vient alors: 
Re q 
42 = Dig = 7 (67.246) 
i= i=0 (1 7 q) 


Il vient alors au final pour l'espérance du nombre de clients dans le système: 


_ +o Eh +0 à. _A4 _ A 
E(C)= (1 A2 (i 12 (I RTE 1-A 


Si nous souhaitons connaître l'espérance du nombre de clients en attente dans la queue uniquement, il faut 
bien comprendre qu'à chaque instant nous avons donc une probabilité >. qu'il y ait k clients dans le 
système mais comme 1 parmi ceux-ci est alors toujours en service (donc hors de la queue d'attente) il reste 
que nous en avons toujours k-1 réellement en attente. Donc: 


+0 +0 +o +o 
E(Co)= ZE t)pe = Die -Dp = (1- 4) D AA - (1 po) 
és _ Si _ (67.248) 
-_4 _y-_A _AÛTA)_A-A+# _ # 
i54 LA 14 —-A “1-4 


Connaissant le nombre de communications (ou de clients) que nous avons sur l'unique ligne dans tout le 
système, nous avons alors l'espérance du temps d'attente (temps d'attente moyen), notée E(T) qui sera 
donnée par le rapport de l'espérance du nombre de communications (clients) en régime permanent sur la 
ligne E(C) par le taux d'arrivée des appels. 


_ ECC) 


E(T) 2 


(67.249) 


Ce résultat, appelé "relation de Little" (ce dernier ayant démontré rigoureusement que la relation est 
valable pour n'importe quel type de file d'attente), est intuitif dans le cas présent. Effectivement, prenons 
un appel type au hasard. Quand il arrive dans le système, il va se trouver statistiquement face à E(C) en 
train d'attendre. Quand il quittera le système, il y aura été un temps moyen E(T). Donc pendant ce temps 
moyen, AF(T) appels seront arrivés derrière lui dans le système. En régime permanent, le nombre 
d'appels laissés derrière lors du départ doit égaler le nombre d'arrivées. D'où l'égalité AE(T) = Æ(C) dont 
on déduit alors immédiatement la relation de Little. 


Nous avons alors pour l'espérance du temps d'attente dans le système: 
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l 


Pour déterminer le temps d'attente dans la queue seule, il suffit de soustraire le temps de traitement/service 
de par la propriété de linéarité de la moyenne (durée d'appel moyenne en service): 


| 1 1 lf 1 1f1-1+4A 1f À 
ag) te) fé) ) (67.251) 
LH HA {4 {\1-AÀ £4\ 1-4 4\1- A 


Pour résumer, car il y a beaucoup de paramètres et résultats, nous avons donc pour une file d'attente de 
type M/M/1 (selon la notation de Kendall): 


Probabiité système vide | 14 
Publié datent 


Nombre moyen de clients dans le DE E(C)= 
1- F3 
j EE — moyen de clients en attente 
 — 


Nombre moyen de clients en service ne mnt te 


H=A 
Temps moyen d'attente dans la queue n 
CE 


Probabilité d'avoir k clients d'avoir k clients Pr = Es (1-4) 


Tableau: 67.15 - Résumé | relations importantes d'une file M/M/1 


Nous voyons que certaines relations divergents vers l'infini lorsque le trafic permanent A (rapport des 
entrées sur) tend vers l'unité. Raison pour laquelle nous avions imposé plus haut que ce paramètre soit 
strictement inférieur à l'unité. 


Il faudrait pour chaque type possible de file d'attente faire les démonstrations détaillées des relations 
correspondantes ce qui est long et laborieux (c'est un métier/spécialisation à part entière et il exixte des 
ouvrages de plus de 400 pages sur le sujet). 


Exemple: 


Supposons que l'on dispose d'une machine à commande numérique traitant des pièces une à la fois. 
Supposons que À = 8 piècesfheure (nombre de pièces arrivant en moyenne par heure) et que 
4= 10 pièces/heure (nombre de pièces sortant en moyenne par heure). Nous avons alors: 
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A=—=—=80% (67252) 
mr 


ce qui correspond au trafic ou taux d'occupation de la machine. Donc il y a 20% de probabilité pour que le 
système soit vide et 80% de probabilité pour qu'il y ait une attente. 


ET)=——=——=035 (67255) 
4 


ce qui correspond à un temps moyen de séjour de 30 minutes dans le système. 


lf À 1 0.8 
ar) (A) 4 or 
£4\1- A 1041-08 


ce qui correspond à une attente moyenne de 24 minutes dans la file d'attente. 


Et la probabilité qu'il y a ait 5 pièces dans le système (exécution + attente): 
_ & _ a ee (n) 9£& 
Pr =A'(-4=08 (1-08= 6.53% (67.257) 


9.5, PROBABILITÉ DE MISE EN ATTENTE M/M/K/K (FORMULE D'ERLANG-B) 


Nous allons nous intéresser ici à un système disposant de N canaux de communication (chaque canal est 
censé supporter un débit de un appel avec réponse immédiate). Si les N canaux sont occupés, les appels 
qui arrivent sont considérés comme perdus (absence de tonalité par exemple). Nous parlons alors de 
blocage ou ruine du système. Il s'agit donc d'une file d'attente limitée de type M/M/k/k selon la notation de 
Kendall, appelée également "système à perte". 


Nous allons chercher à estimer cette probabilité de blocage en fonction du nombre de canaux disponibles 
et du trafic. 


Compte tenu de ce qui a été énoncé sur le caractère sans mémoire du processus d'arrivée d'appels, nous 
pouvons considérer que la probabilité: 


Pr = À, dt (67.258) 
d'avoir k appels à l'état k est indépendante de l'état du système tel que: 


Pr = P= ÂAdf (67259) 
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Ainsi, à chaque état k du système la loi de probabilité de type Poisson est valable. La différence de 
traitement c'est que plutôt que de considérer des états, nous allons considérer qu'un canal de 
communication peut être envisagé comme un état propre. 


Pour la probabilité de fin d'appel, nous avons par contre: 
Pr = 44 dé = & Lidt (67.260) 


Effectivement, cette probabilité traduit juste le fait que si k appels sont en cours chacun a une probabilité 
Hdt de se terminer, d'où la somme qui donne Æd£ . Nous avons alors: 


y =&-H (67.261) 
Ainsi, en injectant ces relations dans: 
: 1 
ne, “È[TL# (67.262) 
k=1\1=0 4 
il vient: 


il 1 
PR 
À Nifa\'1 (67.263) 
1+ ——— | 19) É| = 
2 (Ur) Z b pe 


En introduisant alors (qui doit être strictement inférieure à 1 si nous voulons que les développements 
suivants convergent vers une valeur finie: chaîne de Markov ergodique): 


À 
A=— (67264) 


qui représente pour rappel le nombre d'appels qui apparaissent sur le nombre d'appels qui se terminent 
pendant un intervalle de temps (temps de service moyen), ce qui représente en fait tout simplement le 
trafic (ou autrement dit: l'intensité de trafic), il vient alors: 


1 
rer 
MIA. dés 
1+Y re 
k=1k £! 
ou encore en introduisant le 1 dans la sommation: 
> 1 
0-7 
> Ë | (67.266) 
04 #| 


Puisque k représente le nombre d'appels, cette dernière relation donne la probabilité d'avoir 0 appel 
(clients) pour un trafic permanent donné A dans le système. 
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En reportant ?9 dans l'expression suivante de p4 (probabilité d'être dans l'état k donc...) obtenue plus 
haut: 


k—1 À 
Pr = II —— Po (67267) 


0 É54] 


il vient: 


1-0 4 5=0 4 4 (67.268) 
| — 
k=0\ #! 


et en considérant le caractère sans mémoire, nous avons la relation: 


& 
=||——- II (67.269) 


Il vient: 


il il 
À | | À | 1 Ki 
px =|II— lr0= <= 
‘ Les Ur 1 >|) AE 
&=0 


où les k peuvent malheureusement porter à confusion. Il convient de faire un peu le ménage. Au 
numérateur, le k fait référence au nombre de canaux (serveurs, lignes, opérateurs ou terminaux) et au 
dénominateur le N aussi. Il convient donc de réécrire cela de manière plus convenable: 


CT 4 (67.271) 


qui donne donc la probabilité de mise en attente (et donc de saturation/blocage) d'un système disposant de 
N canaux à capacité finie selon le principe du premier/arrivé premier servi (FIFO: First In/First Out) et 
pour un trafic A (exprimé donc en "Erlang") et dans lequel les communications sont perdues si mises en 
attente. 


Cette relation est parfois notée dans les ouvrages spécialisés sous la forme: 
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M7 7 (67272) 
2) 


Cette relation est très importante en théorie des files d'attente et porte le nom de "formule d'Erlang-B". 


3 2 


Figure: 67.31 - Probabilité de saturation (plot de la fornction Erlang-B) 


Elle est à la base du dimensionnement des réseaux à commutation de circuits. En effet, le problème du 
dimensionnement d'un commutateur de circuits est le suivant: Étant donné le trafic en nombre de 
communications par unité de temps À en Erlang, trouver le nombre d'unités de service k tel que la 
probabilité qu'un appel arrive dans un système devenu bloquant soit inférieur à une certaine valeur. 


La probabilité obtenue représente alors la qualité de service offerte par le réseau du point de vue de 
l'usage. Quant au trafic À, il est estimé en fonction du nombre de postes téléphoniques existants et/ou à 
venir sur la base d'une activité moyenne par poste et par application (téléphone, télécopieur, terminal, 
serveur informatique, etc.). 


Exemple: 


ET. Quelle est la probabilité de saturation d'une hotline (dont la durée de service suit une loi exponentielle 
et la distribution des arrivées suit une loi de Poisson) sachant que le trafic A de la ligne est estimé à 2 
Erlang (1 appel par heure pour 1 appel traité par 2 heure - donc rapport de 2 sur 1) pour une seule ligne 
téléphonique (N-1) en utilisant le modèle d'Erlang-B?: 


ol 


M > 
Pr= 267% (67273) 


E2. Dans une entreprise, on a dénombré aux heures de pointe 200 appels d'une durée 

moyenne de 6 minutes à l'heure (temps de service moyen). Quelle est la probabilité de saturation avec 20 
opérateurs (sachant que la durée de service suit une loi exponentielle et la distribution des arrivées une loi 
de Poisson)? 
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La plus grosse difficulté ici est de calculer le trafic! Il y a donc 200 appels par heure avec 10 appels traités 
seulement par heure (puisque 6 minutes par appel dans une heure de 60 minutes font 10 appels). Le trafic 
A est donc de 200/10 soit 20 Erlang. En appliquant alors la relation précédente, nous avons: 


201 
Pr — 0 20 15.89% 67274) 


Dans l'industrie, on admet un taux de saturation de 0.01%. En jouant avec un tableur comme 
Microsoft Excel et l'outil Valeur cible, nous trouvons rapidement que N doit alors être égal à 30. 


9.6. PROBABILITÉ DE MISE EN ATTENTE M/M/K/c (FORMULE D'ERLANG-C) 


Considérons maintenant un système pour lequel les appels peuvent être mis en d'attente avant d'être servis 
lorsque les k serveurs sont bloqués. Il s'agit donc d'une file d'attente à capacité illimitée de type M/M/k/co 
selon la notation de Kendall. 


Avec ce système, nous avons toujours: 
Pr = P=Âdf (67275) 


mais pour la probabilité de fin d'appel l'analyse devient plus subtile. D'abord il y a la probabilité que les 
appels qui se trouvent sur les canaux N disponibles cessent et qui est donnée par: 


dt = kjidt VOSK<SN-T (67276) 


Mais dès que le nombre d'appels est plus grand que le nombre de canaux de communication disponible, la 
probabilité que cessent les appels est: 


dt = Muidt VEZN (67277) 


Ce qui exprime que quel que soit le nombre d'appels, N ont la probabilité d'être mis en attente dès que k 
(le nombre d'appels) est supérieur ou égal à N. 


Ainsi, pour résumer: 


(67.278) 


kudt VOSES N-1 
BE nude Vk>N 


En utilisant: 


&-1 À 
Pr = II Po (67.279) 


:=0 AH 


Nous obtenons par décomposition du terme produit: 
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NI 3 k1 } AN 4ËN 
Pr (HE) LE Po (67.280) 


co (Hi) Heu Nu NI né 


D'où finalement: 


AN 
_— Lt < = 
P . OS 67.281 
k — (67.281) 
AN 4ë-N 
En utilisant l'expression de 25: 
- j 
D &-1 9RI 
MX [TL a) (67.282) 
k=1\i=0 #4 
Nous pouvons décomposer la sommation: 
a l 
0 nf ko fk-l 
: (67.283) 
k=1 \i=0 ra k=N\i=0 Hi 
et décomposer le deuxième produit: 
" 1 
0 pie NT 2 
1+2 | Hs 
k=l [xs 2 ol 
: 1 
UT N1f-l NO yk-N 
A” A 
1+ À — 
> I |+ £| Nl +) 
: 1 
PNEU | | (67.284) 
él M NN 
: 1 
UNI 48 4N + Es 
mél NEA 
: l 
7 N1 4è AN (4) 
io &l NEA N 


Sous l'hypothèse que: 


AIN «1 (67.285) 
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La somme: 
+0 A k& 
> — (67.286) 
k=0 N 


peut être simplifiée. Effectivement, en posant: 
NIA=x (67.287) 


il vient: 


+<0 1 
ZE (67.288) 
k=0 À 


et comme nous l'avons montré lors de notre étude de la fonction Zeta (cf. chapitre de Suites Et Séries) 
cette somme peut s'écrire sous la forme: 


(67.289) 


Donc: 
SfAŸ 4 
(+ 7 A (67290) 
k=0 1 


Donc finalement: 


Po ya A A 
RS | 
AH M, A4 


NM 


Puisque k représente le nombre d'appels, cette dernière relation donne la probabilité d'avoir 0 appel 
(clients) pour un trafic permanent donné À dans le système. 


Nous avons donc pour Y& > M : 


AN ai AN AN 
NT MEN NI NÉ 
PR Ve FN P0 — NT 4 PES 1 NTI XE 4 NN (67292) 
LE kl = A 2% Ti NI N-A 
N 


4" AN 


La probabilité cumulée de mise en file d'attente se note C(N, A). Elle est égale à: 
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+0 Ho A4 AN 2 AéN 
CHA= Sp D pp = EN 
LP LT RE A 

LE NIN-A 


(67.293) 


+0 A4 AFS 


NI En NN Nl = 


4 = + — —— 
AE NIN-A ZE NIN-A 


qui donne donc la probabilité de mise en attente (et donc de saturation/blocage - c'est-à-dire que tous les 
serveurs sont bloqués) dès l'arrivée dans un système disposant de N canaux à capacité infinie selon le 
principe du premier arrivé/premier servi (FIFO: First In/First Out) et pour un trafic À (exprimé donc en 
"Erlang") et dans lequel les communications peuvent être mises en attente (à l'opposé du modèle Erlang- 
B). Cette dernière relation est appelée "formule d'Erlang-C". Traditionnellement on note: 


C(W,A)=P(#) (67295) 
le "W"' venant de l'anglais "Wait" (attendre). 


Le modèle proposé ci-dessus est bien évidemment critiquable, car en réalité la capacité de la file d'attente 
est finie et certains clients abandonnent lorsque l'attente est trop longue. 


Exemple: 


Si nous prenons un taux d'arrivée de 1 appel par minute et une durée moyenne de service de 5 minutes, 
nous avons alors: 


is (67.296) 


ln? 
H 4 


Si nous prenons un nombre N de 7 serveurs, nous avons: 


AUCUN NE 
: NI M — A : 7175 _ 


Donc 32.41% de probabilité cumulée d'être mis en attente. Ce qui un peu beaucoup... (une règle empirique 
consiste à chercher le nombre N de serveurs afin que cette dernière valeur descende en dessous des 20%). 
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10. ASSURANCES 


L'assurance est une opération pour laquelle une personne (l'assureur) groupe en mutualité d'autres 
personnes (les assurés) afin de les mettre en situation de s'indemniser mutuellement des pertes éventuelles 
(les sinistres) auxquelles les expose la réalisation de certains risques, au moyen des sommes (primes ou 
cotisations) versées par chaque assuré à une masse commune gérée par l'assureur. 


Le dénominateur commun de la majorité des lois définit le contrat d'assurance comme un contrat en vertu 
duquel, moyennant le paiement d'une prime fixe ou variable, une partie, l'assureur, s'engage envers une 
autre partie, le preneur d'assurance, à fournir une prestation stipulée dans le contrat au cas où surviendrait 
un événement incertain que selon le cas, l'assuré ou le bénéficiaire, a intérêt à ne pas voir se réaliser. 


Evidemment, l'opération d'assurance a pour effet le transfert (total ou partiel) des conséquences 
financières du risque subi par l'assuré vers une société d'assurance. Dès lors, à la souscription du contrat, 
l'assureur et l'assuré conviennent: 


- D'un événement ou d'une liste d'événements, repris dans la police d'assurance, et garantis par l'assureur. 
- D'une prime payée par l'assuré à l'assureur. 
Les dépenses prises en charge par l'assureur peuvent correspondre: 


- Soit à des indemnités à verser à des tiers, au titre de la responsabilité (civile, professionnelle ou autre) de 
l'assuré. 


- Soit à la réparation des dommages subis par ce dernier. 
Les hypothèses d'usage de l'assurance sont les suivantes: 


H1. D'un point de vue juridique, un contrat d'assurance est un "contrat aléatoire" valide uniquement pour 
couvrir des risques ayant une composante aléatoire. 


H2. La "règle du jeu" du risque doit être stable dans un laps de temps considéré comme long (au moins 
quelques années). 


H3. La perte maximale possible ne doit pas être trop importante par rapport à la marge de solvabilité de 
l'assureur. 


H4. La prime moyenne du risque doit être identifiable et quantifiable selon des variables statistiques 
explicatives bien choisies afin éventuellement de permettre une segmentation de la gestion des risques. 


HS. Les risques doivent être indépendants (et s'ils sont identiques distribués en termes de probabilités et 
de pondération c'est mieux...) et démontrables comme étant tels significativement en utilisant les outils 
statistiques. 


H6. Il doit exister un marché dans le sens que l'offre et la demande d'assurance doivent arriver à un prix 
d'équilibre (en quelque sorte l'équivalent de l'absence d'opportunité d'arbitrage en finance). 


H7. L'espérance mathématique est considérée comme le prix de la prime pure juste à faire payer aux 
assurés. 


Définitions: 
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D1. La "prime pure" est dans le domaine de l'assurance choisie comme étant l'espérance mathématique de 
la charge; elle correspond à la prime minimale que peut demander un assureur pour ne pas, 
statistiquement, faire ruine de façon certaine. 


D2. Le "chargement de sécurité" est le montant qui vient s'ajouter à la prime pure et permettant à 
l'assureur de pouvoir résister à la volatilité des remboursements. 


D3. Le "chargement de frais de gestion" est le montant qui vient s'ajouter aux deux précédents et est lié au 
fonctionnement de leur société, de la gestion des contrats, du recouvrement des primes, du placement des 
actifs (prime technique de base), des taxes... 


D4. Le "chargement de frais commerciaux" vient s'ajouter aux trois précédents et est lié à l'acquisition des 
contrats (commissions des intermédiaires, frais des réseaux commerciaux, publicité). 


DS. Au final, l'ensemble des coûts se retrouve dans la "prime commerciale" qu'est celle communiquée au 
client. 


Nous pouvons déjà en conclure que dans le cas d'un système d'assurance étatique obligatoire ou facultatif, 
les frais de gestion et commerciaux seront toujours inférieurs, sous l'hypothèse d'une méthode managériale 
égale, à un système privé. 


10.1. CALCUL DE PRIME 


L'assureur ne connaît donc pas exactement le montant des sinistres qui va survenir. En tarifant les contrats 
au niveau de la prime pure (et en supposant une distribution des pertes symétriques), l'assureur perd de 
l'argent une année sur deux. En l'absence de fonds propres, cette situation conduirait immédiatement à la 
faillite. 


Pour se protéger, l'assureur ajoute donc à sa prime un chargement de sécurité. De nombreuses méthodes 
permettant de le déterminer sont possibles, aucune n'ayant à ce jour supplanté largement les autres: 


- Chargement proportionnel à la prime pure. Le coefficient de proportionnalité reflète l'idée que l'assureur 
a de la volatilité du risque. 


- Chargement dépendant de l'écart-type des pertes. Cette méthode est une légère formalisation de la 
précédente. Elle pose problème, car elle introduira un chargement de sécurité qui dépendra des cas de 
gains (perte réelle inférieure à la prime pure) 


- Chargement dépendant d'un certain quantile des pertes (par exemple le troisième quartile). Un tel 
chargement permet de garantir que la prime sera suffisante dans un nombre de cas déterminé à l'avance, 
mais ne donne aucune information sur les cas de pertes techniques. 


Considérons le cas où la population serait hétérogène, in extenso deux classes S'4, #4 de risque coexistent 


dans la population de poids respectifs #4,## avec bien évidemment: 


# 
+ 


#B HA , 75 #4 TA 
A4 TA PT # # # 


= 100% 


Considérons une assurance maladie avec deux catégories d'assurés (jeunes en bonne santé A /seniors à 
risque B). 
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Pour simplifier l'exemple à l'extrême, imaginons que l'assureur sait, à l'aide de ses statistiques internes, 
qu'un individu du groupe À va coûter à l'assurance une somme définie par une loi de distribution 
statistique que nous noterons dans le cadre de ce chapitre: 


FÉ(R P(X,4 £x) (67.299) 


Soit à tout coût x est associée une certaine probabilité cumulée donnée par la fonction F ue . De même pour 
le groupe B: 


FÊ(x) =P(X3 <x) (67.300) 


Si nous prenons alors au hasard un individu dans le portefeuille, si 4 désigne le groupe (notation 
traditionnelle en assurance), l'assureur devrait donc réclamer en primes pures pour le groupe A: 


EfS4al= Æ[S18=A4]= 44 (67301 
soit l'espérance de la fonction FÉ. 
Idem pour le groupe B: 

E[Sp]= Æ[S18=28]=4p8 (67.302) 


Et pour un individu pris au hasard dans les deux groupes: 


us = E[S]= E[E(S16)]- “Aus + 4 (67.303) 


Au 


Ce dernier cas étant appelé "mécanisme de solidarité". Ainsi, les bons risques paient pour les mauvais 
risques... 


La variance de la prime pure sera elle donnée par la relation démontrée dans le chapitre de Statistiques 
lors de l'étude des propriétés de la variance (variance de deux séries statistiques): 


oÀ +np0 us) 
ca +m08 , ,, (Ha= Hs) (67.304) 
#4 +7 (x4 +73) 


où nous voyons que le terme: 


(£a — Hp ÿ >0 (67.305) 


au numérateur correspond à l'homogénéité des deux groupes. Et donc que l'hétérogénéité fait accroître la 
variabilité de la prime pure dans le mécanisme de solidarité. 


Imaginons maintenant le cas où: 


Ha <Hp (67.306) 
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et une assurance privée (1) qui pratique le mécanisme de solidarité et une autre assurance (2) qui ne le 
pratique pas. Dans le cas présent, nous devons distinguer deux situations d'un point de vue économique: 


Si tous les assurés sont rationnels (sous-entendus un peu... égoïstes) alors: 


- Les jeunes en bonne santé représentant le groupe À vont aller chez l'assurance privée (2) qui a segmenté 
les risques et permet donc aux jeunes de payer moins cher. 


- Les seniors en moins bonne santé représentant le groupe B vont allez chez l'assurance privée (1) qui n'a 
pas segmenté les risques, mais qui par idéologie a appliqué le principe de solidarité. 


La conclusion est que l'assurance privée (1) va rapidement faire faillite car: 
- Les bons risques ne compensent plus le rabais de solidarité par égoïsme 
- Nous sommes sur un marché concurrentiel où les assurances ne sont pas idéologiques. 


Ce constat s'appelle le "problème d'anti-sélection" ou de "sélection inverse" basée sur l'approche 
G. Akerlof, prix Nobel d'Économie en 2001. 


La conclusion est que la privatisation des assurances basées sur un principe étatique (législation) de 
solidarité ne peut pas fonctionner sans engendrer des coûts supplémentaires aux primes pures à cause 
d'une anti-sélection périodique qui engendre un flux constant d'assurés d'une assurance à une autre et donc 
engendre des coûts administratifs et informatiques phénoménaux! Donc en tout point la suppression de la 
concurrence reste meilleure en terme de solidarité mais par contre pas en termes d'emplois pour les 
salariés des assurances (qui se trouveraient alors en grande majorité au chômage...). 


Ainsi, la suppression de la concurrence pour des services d'assurances qui ont toutes des prestations de 
qualité équivalentes (comme c'est le cas pour l'assurance maladie en Suisse par exemple.) élimine le 
principe d'anti-sélection, applique de manière concrète le mécanisme de solidarité voulu par l'état et enfin 
diminue les coûts administratifs dus aux va-et-vient des assurés et des développements d'outils 
informatiques de gestion maison coûtant des millions à chaque assurance et qui engendrent des coûts qui 
au final sont répercutés sur le prix de la prime commerciale! 


À ceci, il faut rajouter que pour diminuer la volatilité globale (écart-type global), une assurance devrait en 
théorie segmenter les risques à l'infini ce qui en fait un système non viable pour certains domaines 
particuliers de l'assurance. 


Mais il faut se rappeler que cette conclusion n'est valable que si les prestations des assurances sont 
identiques (ou quasi similaires) sur un marché donné! 


Signalons également un souci récurrent dans le domaine des assurances, appelé "aléa moral", qui se base 
sur le constat que les personnes qui s'assurent ont tendance à être moins prudentes que les personnes qui 
ne s'assurent pas. En d'autres termes, l'assurance génère du risque. 


10.2. PRISE EN COMPTE DE L'EXPERIENCE 


Pour l'instant, pour déterminer une prime d'assurance, nous avons noté qu'il était possible d'intégrer des 
variables exogènes (sexe, âge, enfants, puissance du véhicule, nationalité, environnement, etc.). 


Mais un point important à ne pas négliger est le retour d'expérience des sinistres d'un assuré. Voyons en 
un exemple concret. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Supposons que le nombre de sinistres sur un an, pour un assuré donné, suive une loi de Poisson (loi des 
événements rares) donnée pour rappel par (cf chapitre de Statistiques): 


k 
k = .,-n (67.307) 
&| 
ce qui se note dans le domaine des assurances: 
& 
PF = a (67.308) 
81 


Supposons que la population des assurés est séparée en trois classes de risques suivant chacune une 
distribution de Poisson telle que: 


& 
P(8=1)=—e" 70% 


P(8= 2) = gg? 520% (67.309) 
j 

P(8=3)=—e% 10% 
gl 


En d'autres termes, il y a 70% de la population totale qui suit une loi de Poisson d'espérance 1 (classe de 
bons risques), 20% qui suit une loi de Poissons d'espérance 2 (classe de risques moyens), et 10% qui suit 
une loi de Poisson d'espérance 3 (classe de mauvais risques). 


Évidemment l'espérance globale d'un individu du portefeuille est alors de l'espérance de la "distribution 
mixte": 


4= E(8)=70%.1+20%.2+10%.3=14 (67310) 


Supposons que les coûts d'un incident soient fixes et de type indemnitaires de 1'000.-. Nous pouvons alors 
nous demander quelle devrait être la prime pour un assuré, sachant que la première année, il a eu 2 
sinistres. Ce qui revient à se demander, quel est le nombre d'accidents qu'il risque d'avoir la deuxième 
année. 


Si nous notons À; le nombre d'accidents de la première année, et Æ, le nombre d'accidents a posteriori 
connaissant À, nous nous retrouvons donc avec un problème de probabilité conditionnelle (une démarche 
bayésienne autrement dit.) conforme à ce que nous avons étudié dans le chapitre de Probabilités: 


PB |A =2)= ———_—<2 ———©Û———— (673 
( 2 | 1 ) P(X) P(X = 2) ( 11) 


où nous avons adopté conformément à la tradition dans le domaine la notion de 
probabilité conditionnelle. 


pour signaler la 


Mais nous ne pouvons pas calculer le numérateur, car nous ne savons pas à l'avance quelle sera la valeur 
de #,. Nous allons donc calculer l'espérance conditionnelle espérée afin de contourner ce problème: 
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E(X | X = 2) = = 2 - 0e) (67.312) 


Nous avons d'abord: 
Ê 2° F 
E(X = 2)= 70%. ll + 20% ei +10% TH =0.205 (67.313) 


Ce dernier calcul (espérance de la distribution mixte) étant noté dans le domaine de l'assurance de la 
manière suivante: 


E(X =2)}=Y P(O=-8)P(H=-210-6)=-5 P(@- ee (67.314) 


Si nous considérons les deux variables aléatoires comme indépendantes: 
E(XH =2N0X)=E((M =2)(X))=E(X =2)E(X2)=0.205.Æ(X>) (67315) 
Il vient alors immédiatement que: 


E(XÆnZX) E(X =2n2) 
EL =2= = — © <<" > EX (67.316 
(214 = 2) E(X) EE =2) (Æ2) (67316) 


Nous retombons donc sur une valeur connue correspondant à la prime pure: 


E(X3)= 70%. 84 +20% 8 +10%.& 


(67.317) 
= 70% .1+ 20%. 2+10%.3=14=EÆE(8) 


identique au calcul de: 
E(ZÆ)= 70% .84 +20%.& +10% &=14=2Æ(8) (67318) 
Donc les variables aléatoires 4,4, sont confondues avec celle de la classe de risque! 


Ce système n'est alors bien évidemment pas conforme au bonus-malus. Nous devons alors considérer que 
les deux variables aléatoires ne sont pas indépendantes (au fait c'est la définition même du bonus-malus!). 


Ainsi, si les deux variables aléatoires ne sont pas indépendantes, nous avons: 


À Ce 
E(X =2nXL\=E|— 8|=5 PS=0\ 6 *.9 
(4 =2nN 4) Le à | ZA (Le 
(67.319) 
l a 3 
= 70%. —e" 142006262410. .3= 0.304 


Et alors: 
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À comparer avec la prime pure sans bonus-malus de 1.4! 


Ce qui est délicat avec cette méthode, c'est que lorsque l'on cumule les années. cette approche bayésienne 
devient pénible. Effectivement, imaginons que nous souhaiterions déterminer la prime pure de la 
troisième année sachant que la deuxième année, l'assuré a eu 1 accident. Nous avons alors l'espérance 
conditionnelle: 


E(3; | À] = 2, À = 2) = GR Ie) (67.321) 


que nous laissons le soin au lecteur de développer... 


Nous remarquons de ce qui a été vu ci-dessus que l'espérance d'une distribution mixte définie par: 


n 


VX) = Pifr +. +pnfr = rifr ( (67322) 
i=l 


est donc trivialement: 


n 


E(X)=H= nl (61323) 


i=] 
10.3. FACTEUR D'ACTUALISATION D'UNE ASSURANCE RETRAITE 


Recherchons maintenant quelque chose qui n'a absolument rien à voir avec ce que nous venons de calculer 
et qui est le "facteur d'actualisation" par lequel nous devons diviser un solde d'épargne au début de la 
retraite, pour répartir ce montant sur chaque année durant la retraite, selon l'espérance de vie ainsi que les 
taux d'intérêt et d'inflation. L'approche ici sera donc de simplifier en se questionnant sur quel niveau 
d'épargne il sera nécessaire d'avoir accumulé au début de la retraite pour obtenir une rente de 1.- (réelle) 
chaque année durant la retraite. C'est à partir de ce niveau d'épargne nécessaire pour recevoir 1.- qu'il sera 
possible d'utiliser n'importe quel solde d'épargne pour dériver quelle rente sera disponible à l'épargnant. 


En premier lieu, nous allons définir les paramètres utilisés: 


- m Nombre de périodes à la retraite (années ou mois) 

- $x Solde d'épargne à la période k 

- p Prestation périodique (que nous supposerons ici annuelle) 

- i Taux périodique d'inflation (supposé ici constant et annuel) 

- R Taux de rendement moyen géométrique du marché (supposé constant et annuel) 
- 4m Facteur d'actualisation à l'âge m 


Ainsi, comme mentionné plus haut, nous sommes à la recherche du niveau d'épargne initial, Sp, qui 


permettra d'obtenir une prestation périodiques (donc annuelle dans le cas présent), p, égale à 1.- indexée 
sur l'inflation i. 
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En commençant à partir du solde initial Sy = $", en présumant que les prestations sont versées au début 


de l'année (praenumerando), nous pouvons dériver le solde restant à la fin de la première période de 
retraite ainsi: 


SH =(S—-pl(1+R) (67.324) 


Plus précisément, le retraité aura encaissé un montant p pour la première période, laissant le résiduel être 
exposé au rendement moyen géométrique du marché R. 


Ensuite, d'une manière similaire et en considérant que les prestations sont indexées sur l'inflation i, nous 
pouvons calculer ce solde en fin de deuxième période et de toute période k subséquente: 


8, =[iS-piti+Ri-(+iplil+Ri (67325) 
ou: 
2 2 à 
S3 = S(I+RI —-pil+ÀR) -pil+ARi(l+ii (67.326) 


ou Encore: 


S = | S(1+RŸ — p(1+RŸ — pÜ1+R)(1+i)- p(+52 |(1+R) 
3 


= S(1+RŸ -p(1+R) - p(1+RŸ (1+i)- p(1+R)(1+iŸ (67.327) 


= S(1+R) — p(1+R)(+? — p(1+RŸ (1+i)- p(1+RŸ 


et ainsi de suite. Il vient alors: 


k 
k | _k- 
S=SU+RT -pD +R (145) (67328) 
i=1 
ou autrement écrit: 
k j k 
k …k 1+À k k 
Sy =S(1+R) —-pil+i) > ss = S(1+R) -pli+i) > qŸ (67.329) 
j=l J=1 


Ainsi nous avons, à un terme près, une série géométrique de raison q connue dans le dernier terme. Nous 
avons effectivement démontré dans le chapitre de Suites Et Séries que pour j allant de 0 à n celle-ci vaut : 


S 


= —— (67.330) 


et donc: 
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14R 1+R 
RER (ter /terY fier) TT: 2. 
(Er) (ECS) 


(1H 1+i 1+i/ Q_IHR  Iti, 
1+i 1+R 


(67.331) 


j=0 


Il nous est donc possible de réécrire, pour la dernière période de retraite m, le solde de la manière 
suivante: 


(HA) 
D = S+RT - pil+ii” AL 
1+i …e 
1+À 


(67.332) 


Remarquons que dans le cas peu probable et particulier où le rendement moyen géométrique du marché 
est égal à l'inflation, c'est-à-dire si À =, nous avons: 


mn Î m Î 
s=saeR pat DIE) = SAR" -p0+ RP D (TE) 
ji 1+i = 1+2R 

(67.333) 


m . 
= SOH+RI - pit RIT DU = SRI -pli+RŸ m=(1+R) [S-p."|] 
j=1 


À ce stade, la raison pour laquelle le terme $,, est un paramètre important est qu'il s'agit du solde du 
retraité à la fin de sa période de retraite, c'est-à-dire au décès (mort). Il sera ici présumé que le retraité ne 
planifie pas de legs et donc que 


Sn =0 (67.334) 


Conséquemment, pour & # :, cela revient à trouver S pour lequel: 


(HA) 
Le = S(1+R\" — p(l+i pe_\ltis _, (67.335) 


Nous pouvons alors établir dans ce cas que pour À #i: 


1+RŸ 1+RYŸ 
a+ Far 
s— de | —— (67.336) 


gere 1H _. 
1+R IFR 


Et dans le cas peu probable et particulier où le rendement moyen géométrique du marché est égal à 
l'inflation, c'est-à-dire si À =i, nous avons: 
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Sn =(1+R) [S-p-”M]=0 (67337) 


et nous déduisons un résultat logique: 
S=p-m (67338) 


Pour la suite, revenons au cas réaliste où À + et donc avec: 


1+ À 1+3 _! 
1+À 
et notons: 
b= — =l+r (67.340) 
1+3 


La relation antéprécédente s'écrit alors sous une forme un peu plus condensée: 


Eté] 
S=}p in. (67.341) 


gt b-1 


où: 


(67.342) 


est donc le facteur d'actualisation. De plus, nous avons la relation suivante donnant l'espérance d'être en 
vie à l'age a (âge correspondant à l'âge supposé de décès dans le cas présent) démontrée dans le chapitre 
de Dynamique Des Populations: 


m=e(a,s)-a+1l (67343) 
avec pour rappel la fonction e(a,s) représentant l'espérance de vie conditionnelle à l'âge a et pour le sexes. 
10.4. ASSURANCES DE RENTES 


Nous allons maintenant étudier une rente qui n'est pas versée d'une manière certaine mais d'une manière 
"viagère", c'est-à-dire qui dépend de la survie de l'assuré. Il va donc falloir c'est multiplier chaque terme de 
rente par la probabilité qu'il lui soit versé. 


Évidemment, dans la majorité des cas, ce qui va nous intéresser sera la "valeur actuelle" des rentes 
viagères afin de savoir ce que devra payer l'assureur (et donc ce qu'il devra avoir capitalisé). Il existe deux 
types de rentes viagères courantes. Nous allons voir en quoi consiste chacune. Mais avant cela, rappelons 
que nous avons vu dans le chapitre de Dynamique Des Populations que la probabilité d'être en vie à une 

x + 1 sachant qu'on est en vie à un age x est donné par: 
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et rappelons (suite à la demande d'un lecteur) que la valeur actuelle d'un capital €. à taux constant 
PP q p 0 


payable dans 1 année est donné par (cf }: 


C 


Ci REA 
(1+5% 


Ce qui donne donc la somme à placer à un taux 1% pour avoir après un an le capital €;. 


En combinant probabilité de survie et valeur actuelle, nous pouvons définir dans le cas d'une rente la 
prime unique de la prestation comme étant: 


PU = Ch -1P 


Si l'assuré est en vie à l'échéance, c'est l'assuré qui gagne au jeu (en réalité ils gagnent très souvent les 
deux...), dans le cas contraire c'est l'assureur (qui alors lui dans ce cas là est vraiment très gagnant!). 


Bien évidement dans le cas ci-dessus, extrêmement simplifié, il n'y a qu'un seul versement de la part de 
l'assureur. Mais dans la réalité il peut y en avoir plusieurs (c'est ce que nous allons étudier), le versement 
de l'assuré peut ne pas être sous la forme d'une prime unique, le taux moyen géométrique du marché peut 
ne pas être constant (ce dernier cas étant traité normalement avec des simulations de Monte-Carlo). 


Donc même si ce que nous allons voir est très simplifié par rapport à ce qui se fait dans les assurances par 
les actuaires, cela donne déjà une piste de recherche pour des modèles plus élaborés. 


10.4.1. RENTE VIAGÈRE TEMPORAIRE 


La rente viagère temporaire consiste pour l'assureur à verser des termes de rentes, tant que l'assuré est en 
vie mais au maximum durant n années après qu'il ait atteint un âge x donné mais tout de suite après que 
l'assuré ait payé sa prime unique (qui correspond justement à l'âge x en question). L'objectif est donc de 
déterminer le capital (valeur actuelle) que doit avoir amassé l'assureur au moment du commencement du 
paiement de ces rentes (ce capital pouvant aussi être demandé sous forme de paiements multiples plutôt 
que sous la forme d'une prime unique). 


Evidemment ce cas est peu réaliste car peu de personnes vont payer une prime unique (grosse somme 
d'argent) à un moment x de leur vie pour commencer tout de suite à recevoir des rentes. Maïs c'est 
pédagogiquement intéressant avant d'aborder le type de rente viagère différée et qui est un peu plus 
réaliste. 


La rente viagère temporaire praenumerando (in extenso: la valeur actuelle de la rente viagère unitaire 
payable praenumerando tant que l'assuré est en vie mais au maximum pendant n années) est donnée par la 
relation suivante qui découle des développements effectués dans le chapitre d'Économie à la différence 
que l'on y trouve des coefficients de probabilité de survie: 
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il Des S 
à = 1+£ Su +2 Pat PMR nd Î DT 8 St Xx+f (67.347) 
f=0 


Sy Sy 


où pour rappel (cf. chapitre d'Economie), nous avons le facteur d'escompte (dans le cas présent nous 
devrions plutôt utiliser le terme de "facteur de capitalisation") qui est: 


1 
1+4% 


Le = 


(67.348) 


La rente viagère temporaire postnumerando (valeur actuelle d'une rente viagère unitaire payable 
postnumerando tant que l'assuré est en vie mais au maximum pendant n années) est elle donnée par: 


2 $ S 
“A + f2 < + + En Srtn DA er xH 


An = Je (67.349) 
Sy Sy S} Sy 


Exemple: 


Nous souhaitons verser une rente de 1'000.- durant 3 ans à un homme de 40 ans. La prime unique qu'il 
devra payer si ni l'intérêt, ni la mortalité n'interviennent dans les calculs, ensuite si seulement l'intérêt est 
considéré dans les calculs et enfin en prenant en compte l'intérêt et la mortalité est donnée respectivement 
par les trois relations suivantes: 


PU(y = 1000 +1000+1"000 =1'000 3 


_ 4: &. a 
PUty =1'000. f, +1'000. #2 +1'000. ZE =1'000- ax <?ve ——. 


PUty = 1'000./, - gi 000. f2 ce+r 000. À SE = 10002 a <PUo 


10.4.2. RENTE VIAGÈRE DIFFERÉE 


Les rentes viagères différées constituent la majorité des contrats d'assurance de rentes. L'assuré s'acquitte 
toujours d'une prime unique, pour recevoir une rente s'il est en vie à un certain âge (à l'âge de sa retraite 
par exemple), donc commencer à recevoir la rente k années après avoir payé la prime unique, mais cette 
fois-ci jusqu'à son décès. 


La rente viagère différée praenumerando (valeur actuelle d'une rente viagère unitaire différée de k années 
et payable praenumerando jusqu'à décès de l'assuré) est donnée par: 


S 
+ ee Xx+k-H 


où & est la dernière valeur (numéro de ligne) de la table de mortalité. Le lecteur remarquera peut-être que 
si nous posons k = 1 (sans différé) et & = x+ x, nous retombons sur une rente viagère temporaire 


postnumerando 4;;;]. 
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Donc normalement pour un même âge x et une même durée de rente supposée, la valeur actuelle de la 
rente viagère différée (prime unique) est inférieur à celle de rente viagère temporaire et ce d'autant plus 
petit que le différé est grand. 


La rente viagère différée postnumerando (valeur actuelle d'une rentre viagère unitaire différée de k années 
et payable postnumerando jusqu'à décès de l'assuré) est donnée par: 


S S 
 skH Pr L | ils 


4x — Je ES e 


Évidemment, les deux rentes ci-dessus ont la même fin car étant donné que c'est jusqu'à la mort, c'est 
difficile de payer en postnumerando de la mort... 


Signalons encore qu'il est possible mathématiquement de créer une rente temporaire ET différée maïs c'est 
rare et donc nous n'en ferons pas l'étude ici. 


Remarque: Contrairement aux rentes certaines, il n'existe pas ici de formule simplifiée permettant un 
calcul rapide de ces rentes basées sur les tables de mortalité. L'utilisation d'un tableur ou la 
programmation de ces fonctions permet de calculer facilement les valeurs actuelles des prestations 
viagères. À l'époque où l'informatique n'avait pas cours, on construisait des tables appelées "nombre 
de commutations" qui permettaient d'obtenir les informations voulues. 
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Notes personnelles: 
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68. MUSIQUE MATHÉMATIQUE (ACOUSTIQUE) 


L. théorie de la musique est l'ensemble des aspects théoriques d'un système musical particulier. Il 


existe, non pas une, mais une infinité de théories musicales, chaque type de musique possédant la sienne. 
Tout système musical repose en effet sur un certain nombre d'usages, plus ou moins contraignants, 
susceptibles de faire l'objet d'une théorisation, orale ou écrite. 


Une théorie de la musique possède fréquemment un point de départ religieux, philosophique ou magique ; 
d'autres fois, un point de départ arithmétique ou scientifique (acoustique). C'est à cette dernière que nous 
nous intéresserons ici évidemment... 


Nous allons pour commencer considérer dans ce chapitre les ondes élastiques dans un gaz, résultant des 
variations de pression dans le gaz. Le son constitue l'exemple le plus important de ce type d'ondes qui fait 
partie de notre environnement quotidien. 


1. ONDES SONORES LONGITUDINALES 


Dans les milieux élastiques: les gaz et les liquides, des ondes sonores longitudinales se propagent suivant 
le mécanisme suivant (pour les solides il s'agit d'ondes transversales déjà étudiées dans le chapitre de 
Mécanique des Milieux Continus): une couche du milieu se déplace dans le sens de propagation de l'onde 
(d'où le nom de longitudinal) et comprime la couche suivante, laquelle sous l'effet de la pression avance et 
comprime la couche suivante et ainsi de suite. Cela fonctionne aussi pour une couche qui recule: la 
pression sur la couche suivante diminue ce qui a pour effet de faire reculer la couche suivante laquelle 
diminue à son tour la pression sur la suivante, etc. 


La vitesse à laquelle se déplacent ces ondes longitudinales dépend comme souvent des caractéristiques, du 
milieu. En général, elle est plus faible dans les gaz que dans les liquides et plus faible dans les liquides 


que dans les solides. Par exemple - 340 [ms] dans l'air, - 1'500 Lo. s| dans l'eau et 


— 5'000 Lo. s'| pour les ondes transversales dans l'acier. 


En ce qui concerne les fréquences, il n'y a presque pas de limites. On peut générer des ondes sonores à des 
fractions de Hz jusqu'à des centaines de MHz. Par référence à la gamme de fréquences audibles à l'être 
humain, nous appelons "infrasons" des fréquences inférieures à 20 [Hz] et "ultrasons" des fréquences 
supérieures à 20 [KHZ]. 


En général, les ondes sont produites par une source de dimensions limitées et, à partir de cette source, se 
propagent dans toutes les directions. Dans des milieux isotropes le front d'onde d'une perturbation est 
sphérique. Nous éviterons d'introduire des coordonnées sphériques en nous limitant à traiter des parties de 
fronts d'onde suffisamment éloignées de la source et suffisamment petites devant la distance à la source 
pour que nous puissions assimiler le morceau de sphère à une surface plane. Autrement dit, nous ne 
traiterons que les ondes planes longitudinales. 


Il existe aussi une autre différence importante entre les ondes élastiques longitudinales dans un gaz ou 
liquide et les ondes élastiques transversales dans un barreau solide. Les gaz sont très compressibles, et si 
des fluctuations de pression s'établissent dans un gaz, sa densité subira le même type de fluctuation que la 
pression. 
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Considérons les ondes se propageant à l'intérieur d'un tuyau ou tube cylindrique (horizontal) de section S. 
Notons Æ, et &, la pression et la masse volumique à l'équilibre du gaz. Dans ces conditions d'équilibre, 


Æ et Æ sont les mêmes dans tout le volume gazeux du cylindre, c'est-à-dire indépendants de x. 
Si la pression du gaz est perturbée par exemple à l'une des deux ouvertures de cylindre creux, un élément 


de volume de celui-ci Sdx sera intuitivement mis en mouvement parce que les pressions P et P' sur les 
deux faces S, S " de ce petit volume seront différentes et produiront donc une force résultante. 


Remarque: Même si elles ont une très grande vitesse, dans un gaz les molécules subissent des chocs 
très fréquents les unes avec les autres. Elles parcourent au fait moins d'un micron en moyenne (libre 
parcours moyen), dans les conditions normales, avant d'en heurter une autre. 


Il en résulte un déplacement de la section S d'une quantité & et de la section S' d'une quantité différente 
&' nécessairement différente car l'équilibre de pression n'aura pas eu le temps de se faire. 


Ainsi, l'élément de volume au début a une largeur dx maïs après la variation de pression, il aura une 
largeur si les variations de pression sont petites en première approximation: 


dx+(Ëê-É = dx+dË (68.1) 


Cependant, en raison de la variation du volume, il y a également à présent une variation de densité due à la 
compressibilité du gaz. La masse contenue dans le volume non perturbé est initialement: 


Ms = SX (68.2) 
Si © est la masse volumique du gaz perturbé, la masse du volume perturbé vaut au final: 
M=pS(dx+d£) (68.3) 
La conservation de la matière demande que ces deux masses soient égales, c'est-à-dire que: 


£s (dx +dé) = LoSx (68.4) 


ou: 
dé 
e[+ = Æ (68.5) 
dx 
En résolvant en £ nous obtenons: 
qu 
82= | 
dé (68.6) 
ee 
dx 
. . | : , dÊ 
Comme nous considérons les variations de pression petites par rapport à la pression ambiante, nr est 
x 


petit, nous pouvons remplacer: 
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1 


8= D —— 
1446 (68.7) 
dx 


par son développement limité de Taylor (cf. chapitres de Suites Et Séries}: 


2 
p- afr-Je4[(fe) -. ra (1-56) (68.8) 


Soit: 


_ d 
Eu. 2 (68.9) 
© dx 


En admettant maintenant que la pression est uniquement reliée à la masse volumique (pour faire simple) 
nous pouvons écrire: 


P=f(@) (68.10) 


En utilisant la forme générale du développement de Taylor (cf. chapitre de Suites et Séries): 


x 1 f(x) É 
= D "(x x 68.11 
JO —E G-2) (10 
Nous avons alors: 
2, 1 d'f() k dP() 
= 2, — 25 —"(8-20) = +C-M)——— (68.12) 
La quantité: 
1 a[S 
— = . (68.13) 
LS 0) 
plus souvent notée: 
1 (2e) 
É=—| —— (68.14) 
2 \AP Jo a 


est appelée "coefficient de compressibilité" ou plus techniquement "coefficient de compressibilité 
isotherme". 


Rappelons maintenant que nous avons démontré dans le chapitre de Génie Météo à partir de la loi de 
Laplace lors de notre étude du modèle atmosphérique adiabatique que: 
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où pour rappel, # est le "coefficient de Laplace", appelé aussi "coefficient adiabatique" défini par: 


Cp 
F= c, (33.16) 


Alors nous obtenons (relation que nous utiliserons plus loin): 


1 P 1 
— = M}———-=ÿy? (6817) 
£ & € 


Le coefficient de compressibilité isotherme s'écrira bien évidemment dans le cas général: 


1fd 
r=(f) (68.18) 
2\dP 


Au passage, remarquons qu'en passant de la masse volumique au volume, il vient: 


fr) dP | dP dP F 


_p 


dP 


mn 1 1 
4,40, 
(SE) 1 F F y D | (Se) (68.19) 
dP 


souvent notée #7 dans le domaine de la Thermodynamique. 


Revenons aux deux relations: 


l dP = d 
= e et Loue PA (68.20) (68.21) 
l'a d 0 A © dx 
et injectons les dans le développement de Taylor fait plus haut. Nous avons alors: 
dé 


- —% — . 
pape ml. "#%l , 261 (68.22) 
 # % € dx K 


Cette expression relie la pression en tout point du gaz à la déformation au même point. 


Nous avons ensuite besoin de l'équation du mouvement de l'élément de volume. La masse de l'élément est 


a 
ÆS4x et son accélération —: 
dt 


Nous avons naturellement en termes de force (le signe moins indiquant que la force qui varie la pression 
s'oppose à la pression initiale dans le cylindre): 


d?8 
_SaP= (Sax) 2 (68.23) 
(Sax) 23 
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soit: 


Dans ce problème, il y a deux champs, le champ des déplacements £ et le champ des pressions P. Nous 
pouvons les combiner de la manière suivante en prenant: 


PE B-—— (6825) 


et en dérivant par rapport à x et en nous rappelant que À, est indépendante de la position dans le gaz. 
Nous avons alors: 


dP 14e 
—Z=———— (68.26) 
dx La dx° 

Ce que nous pouvons combiner avec: 
dP dé 
—=-f 7 (68.27) 
dx dt? 


Nous retrouvons donc au final une équation d'onde de la forme (rappel) d'une équation de Poisson (plus 
particulièrement il s'agit d'une équation de d'Alembert): 


— = ———;>| (68.28) 


dé? ko dx |. 
Nous obtenons donc une relation similaire à ce que nous avons obtenu dans le chapitre de Mécanique 
Ondulatoire pour les ondes mécaniques ou dans le chapitre d'Électrodynamique dans l'équation de 


propagation des ondes. Nous en concluons que le déplacement dû à une perturbation de pression dans un 
gaz se propage à la vitesse: 


l yP Y #kT Der [reRT vRT 
V = — = — = —— = — = — = —— 58.20 
Een pen & M M M, es 


où pour rappel la constante des gaz parfaits vaut 8.314 [7 7 mor | , 


P 
V = Lis (68.30) 
\& 


est parfois appelée "relation de Newton-Laplace". 


La relation: 
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Si nous considérons l'air comme un gaz parfait diatomique alors (cf. chapitre de T'hermodynamique) nous 


avons Y = 7/5= 1.4... de masse molaire 29:10 F2 moi! | (moyenne pondérée des masses molaires 


de Ÿ, et ©,) il vient à une température de 300 [K]: 
v = 347 Lo. s1] (68.31) 


Ce qui est en parfait accord avec l'expérience! Par contre, lorsque l'on dit qu'un avion vole à Mach 2 (le 
Mach est le rapport entre la vitesse d'un avion et celle du son), on ne connaît pas vraiment la vitesse du 
son (ni de l'avion) ni la température. 


Or, nous avons aussi le résultat suivant (cf. chapitre de Mécanique des Milieux Continus): 


Le - 0-27) 


(68.32) 
E 


Or, nous avons démontré dans le chapitre de Génie Mécanique que le coefficient de Poisson # respectait: 


1 
7 <— (68.33) 
2 
: nue 1 
En prenant l'approximation que pour un gaz # Æ 3 … nous avons alors: 
1 
Æ=— (68.34) 
E 
et donc: 
y = (68.35) 


La vitesse du son est alors donnée par le même type d'expression pour les fluides ou les solides! Ainsi, la 
propagation d'une déformation longitudinale dans un solide est donnée par: 


Nous avons aussi: 
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CREER & (z La). 1 & (as) 
he ne. 1 


« a? 


(68.38) 


En divisant ces deux égalités membre à membre, nous obtenons: 


ÿP 14 (de) 
a «alex 
ES 2 (à) 
Soit après simplification: 
GP. 1 oP 
7 =——7| (68.40) 
dé &Æ£b 8x 


Pour l'usage en laboratoire, ce modèle d'onde sonore est plus pratique que le précédent, car nous mesurons 
plus facilement des variations de pression dans un liquide ou un gaz, que des déplacements de molécules. 
Il est intéressant de savoir alors que toutes les analyses que nous avons faits avec l'équation d'onde des 
cordes (cf. chapitre de Mécanique Ondulatoire) ou des ondes (cf. chapitre d'Électrodynamique) peut alors 
s'appliquer aussi à l'équation ci-dessus (aspect énergétique, solutions particulières, diminution de 
l'amplitude en fonction de la distance à la source, etc.). 


Le mouvement des ondes dans les gaz est un processus adiabatique (cf. chapitre de Thermodynamique) 
donc il n'y a aucun échange d'énergie sous forme de chaleur par élément de volume du gaz. 


1.1. PUISSANCE TRANSPORTÉE PAR UNE ONDE SONORE 


Nous avons vu plus haut que: 


Notons les variations de densité dues à l'onde sonore par: 
dé 
Ps = —Fb— (68.42) 
dx 


Nous ne ferons le calcul de la puissance transportée que pour le cas des ondes sinusoïdales. Dans ce cas 
& sera de la forme: 


ê= dpcos(—Ax) (68.43) 


Comme & est connu, nous pouvons calculer la pression correspondante en utilisant: 
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et en utilisant: 


Il vient: 


BE =-@" dE san 
dx 


Nous avons alors: 


P =-œ7v 
5 pen Fe 


24 (& cos(a@é — x) 


=-kv"épsin(at-ix)=-Rsin(@t- x) (68.48) 


Pour calculer la puissance transportée par une onde sonore, nous allons calculer le travail effectué, 
pendant une période, sur une surface S située sur un plan perpendiculaire à l'axe des x et de coordonnées x. 


La force exercée sur cette surface sera: 


F=S.À (68.49) 


Le travail effectué quand cette surface se déplace de 4£ sera: 


aW = 


Fdé=S.P dé (6850) 


Comme nous faisons un calcul pour les déplacements £ d'une couche dont la position d'équilibre x ne 


varie pas, seule la variable t varie: 


dê= Éd =-œésin(at-kx)df (68.51) 
£ 


En remplaçant nous obtenons: 


dW=S.P.dé=-S.P,.œésin(a -kx)at 
=-5.(-@tv/ésin(at-Ar)) op sin(a-Ar)dé (60.52) 


= Spb @ef sin” (at -kx)dt 


Le travail exercé pendant une période: 
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27 


sera: 
24 


&@ 
W = Sa of | sin? (@t-kx)dt (559 
0 


Nous avons déjà démontré l'expression de ce type d'intégrale dans le chapitre de Calcul Différentiel Et 
Intégral: 


(sin? (at — Àx) dt = 2 (sin? (y)dy = nt cos(y)sin(y)+yi (68.55) 
: ti trs 


d'où: 


[a 


27 


Ï sin? (at — kx) di= (a (-coster- 20 sin(@t —kx) +(@ -)]" 
0 


= L(e(o2t x) (a%-x) (02) 
2 æ æ æ 


. (- cos(—Xx)sin (—kx) +(-kx)) 


(68.56) 


(cos (4x) sin (&x)+27— k&x) - (cos (&x) sin (&x)— k&x) 
æ 
En remplaçant il vient: 
F = Sak'e T = Sox (6857 
@ 
Pour calculer la puissance, il faut diviser ce travail par le temps dans lequel il a été effectué: 
27 
T=— (6858) 
@ 
et pour calculer la puissance transmise par unité de surface, il faut diviser par la surface: 
FF à Hire be 


2 
Fi 27 2 & (68.59) 


Si nous remplaçons k par: 
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æ 
&=— (68.60) 


Nous obtenons: 


P Eva” du. 
= —— (68.61) 
S 2 & 


Avant de continuer, signalons qu'il existe plusieurs façons de mesurer l'amplitude d'un son, et par 
extension, d'un signal quelconque de nature ondulatoire: 


- l'amplitude moyenne (la valeur moyenne arithmétique du signal positif) 

- l'amplitude efficace (amplitude continue équivalente en puissance) 

- l'amplitude crête (maximale positive) 

- l'amplitude crête à crête (l'écart maximal d'amplitude positive et négative) 
Ampltude 


Amplitude 


Amplitude 


crète à crete 
Amplitude 


cfhcace 


Temps 


Figure: 68.1 - Types d'amplitudes 


Dans la pratique, l'amplitude moyenne présente peu d'intérêt et n'est pas utilisée. En revanche, la valeur 
efficace ou RMS, pour Root Mean Square en anglais, soit la racine carrée de la valeur quadratique 
moyenne du signal est universellement adoptée pour mesurer la valeur des tensions alternatives, dans le 
cadre général autant qu'en acoustique. Un amplificateur qui est donné pour 10 watts RMS fera 14 watts en 
crête et 28 watts en crête à crête (aussi noté cc). Les mesures de puissance crête à crête sont assez souvent 
appelées "watts musicaux" par les vendeurs de matériel audiovisuel, car les chiffres sont plus flatteurs. 


L'unité de mesure de l'amplitude dépend de la grandeur physique mesurée: 

- Pour une corde vibrante, c'est une distance. 

- Pour une onde sonore, c'est la pression de l'air, ou des mouvements du diaphragme 

- Pour le rayonnement électromagnétique, l'amplitude correspond au champ électrique. 


- Pour un signal électrique, cela correspond à la valeur maximale. 
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Pour les régimes sinusoïdaux (ou plus généralement périodiques!), il est facile de démontrer que quel que 
soit le domaine de la physique la valeur efficace (racine carrée de la moyenne du carré du signal) est la 
valeur de crête divisée par la racine carrée de deux: 


2... Go 
— SH = (68.62) 
7x © 


Dons en valeur efficace (il s'agit uniquement d'un choix arbitraire et rien d'autre il faut juste savoir de quoi 
on parle par la suite!!), la relation antéprécédente s'écrit: 


== ave et = ml ot] (68.63) 


Comme nous avons l'amplitude de la pression qui est égale à: 
À = Ok? 6, = P0@vVé (68.64) 


et sa valeur efficace par: 


LP = PE g = AovEg| (68.65) 


Finalement, nous avons pour la puissance (que nous représenterons par la suite par un P majuscule stylisé 
afin de ne pas confondre avec la pression): 


D 
rm = avcae, = (ares) = (68.66) 


1.2. MESURE DE L'INTENSITÉ DU SON 


Pour caractériser le son, on a inventé une unité de mesure: le "Bel" et son sous-multiple le "décibel" qui 
vaut 1/10 de Bel. Cette intensité acoustique, assimilée à la "sonie" ou "force sonore", a été définie à partir 


de la pression sonore efficace (le £# donné plus haut) et de la pression sonore d'une onde (à une 
fréquence précise!) à la limite du seuil auditif d'une petite élite de l'humanité (environ 10%). 


Cette pression efficace de référence vaut: 
Pris = 2-10 [Pa] (68.67 


L'intensité sonore d'une onde dont la pression acoustique efficace est £g vaut par définition et par 
convention: 


7 | [Beis] (68.68) 
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et est souvent notée simplement S dans la littérature spécialisée pour signaler qu'il s'agit de la "sensation 
physiologique" de l'oreille humaine. Comment est-on arrivé à cette relation? Eh bien en constatant sur un 
panel d'individus que la sensation physiologique de l'oreille n'était pas linéaire mais que les variations 
absolues de la sensation sont proportionnelles aux variations relatives de pression telles que: 


dP 
di, =" (6:65) 


Soit après intégration: 
F 
ls — do = c® In F (68.70) 
À 


où par convention la sensibilité minimale est posée comme étant nulle et pour des raisons historiques on 
prend les logarithmes décimaux au lieu des népériens. Il vient alors: 


P 
= ce 10810 F (68.71) 


Dans certaines sources, nous trouvons la définition du Bel à partir d'une intensité de référence de (à 1 
[KHz]): 


10712 La m? | (68.72) 


Il vient alors (la définition est équivalente puisqu'il s'agit d'un rapport et que la puissance est directement 
proportionnelle au carré de la pression comme nous l'avons démontré plus haut): 


2 2 
1, =logpy|——|=1logp| — | |Beis| (68.73) 
10 Ps 10 a) ] 


En réalité, le Bel est rarement utilisé et on lui préfère le décibel (la plupart des êtres humains peuvent à ce 
jour déceler une différence d'intensité entre deux sons dont l'intensité diffère de 1 [dBl): 


2 


É = 10 10810 


PF 
ef s _ 
=20.1lo déciBeis (68.74) 
810 Ë 2. [ ] 


ef réf 


Le décibel est donc par construction un dixième de Bel... d'où son nom... 


La raison de ce choix logarithmique est que la sensation auditive est aussi logarithmique: on a la même 
impression d'augmentation du son quand celui-ci passe de 1 à 10 que quand il passe de 10 à 100. 


Pour donner une idée de la valeur d'un décibel, voici un tableau de valeurs typiques (pour une fréquence et 
une pression de référence donnée): 
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[___ Décibels 
140 
120 


D foomvematonneme 
EE ei de Faudion 


Tableau: 68.1 - Amplitudes relatives typiques de différentes sources sonores 


Comme nous l'avons déjà dit la pression efficace sonore minimum qui provoque une sensation auditive est 
de: 


2-10 [Pa] (68.75) 


c'est-à-dire environ 10712 fois plus petite que la pression atmosphérique. Il faut tout de même que la 
fréquence de cette onde se situe autour de 3 [KHZ], là où la sensibilité est maximum. 


Il est très intéressant de calculer à quelle amplitude efficace de déplacement cela correspond. Nous 
utilisons alors la relation démontrée plus haut: 


Lg = PhaVÉg (68.76) 


Donc pour le cas limite et à 1 [KHz], aux conditions normales de température et de pression, nous aurons 
un déplacement de (valeurs prises dans les tables de la commission romande de mathématique): 


Lg = —— = —— "5% 743.10 7 [»] (6877 


et la valeur crête sera donc de: 
= Ég-V221.10 7% [we] (68.78) 


Cette valeur est inférieure au rayon des atomes selon le modèle de Dalton. La nature nous a doté d'un 
organe d'une sensibilité exquise! 


Il est facile de calculer à quelle valeur de puissance par unité de surface correspond une onde sonore à la 
limite de l'audition. En utilisant la relation démontrée plus haut, nous obtenons: 


P 
S 


2 1 
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Comme la surface de la section du canal auditif fait moins d'un 4+#°, la puissance qui arrive au tympan est 
inférieure à 10715 [#]. 


2. ONDES SPHÉRIQUES 


Dans la réalité les ondes sonores sont générées par des sources d'étendue finie. À des distances plus 
faibles ou comparables à l'étendue de la source, la forme du front d'onde qui s'éloigne de la source peut 
être très compliquée (imaginez le front d'onde d'un tonnerre provoqué par un éclair tarabiscoté). Mais, loin 
de la source, elle est vue comme un objet ponctuel et le front d'onde devient de plus en plus sphérique à 
mesure que l'on s'éloigne de la source. 


Si nous regardons un petit morceau de la sphère, la petite surface sphérique sera très peu incurvée et nous 
pourrons l'assimiler à une surface plane sans faire trop d'erreur. Nous retrouverons les ondes planes... mais 
pas tout à fait! 


La différence est que l'énergie transportée par l'onde sonore est distribuée dans une surface qui s'agrandit 
comme &* (où R est la distance à la source). Donc la puissance par unité de surface doit diminuer comme 
1/R2 (exactement selon le même développement mathématique que celui pour les ondes 
électromagnétiques vues dans le chapitre d'Électrodynamique) et comme la puissance par unité de surface 
est proportionnelle à 4 ou à PE cela implique que dans une onde sphérique, aussi bien le déplacement 


&g >» que la pression sonore 2,4, doivent diminuer comme 1/R. 
Dans le cas des ondes sinusoïdales, il faudra modifier l'équation d'onde: 
&= Épcos(@ x) (68.80) 


en ajoutant un coefficient 1/R. Si nous appelons r la distance entre la source et la position d'observation, 
et que, à la place de mesurer la position avec x nous le faisons avec r: 


cos(@t— kr) on 
ê _ É ——— (68.81) 
x 
et de même pour la pression sonore: 
sin (@t— kr)  . 
E = —À, EE (66.02) 


3. EFFET DOPPLER 


Dans ce qui a été étudié jusqu'ici, la source S et l'observateur O de l'onde ont toujours été considérés 
comme immobiles l'un par rapport à l'autre. L'effet Doppler explique les variations de fréquences de l'onde 
observée lorsque S et O sont en mouvement relatif. 


3.1. SOURCE FIXE-OBSERVATEUR EN MOUVEMENT 


Considérons donc le premier cas où la source est fixe et l'observateur en mouvement rectiligne et 
uniforme: 
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Figure: 68.2 - Schéma de principe d'une source fixe et d'un observateur en approche 


Soient: 


la fréquence de la source S et Vpmase la vitesse de propagation de l'onde dans le milieu, supposé 
immobile. 


Si O reste immobile, il voit arriver les fronts d'onde à la vitesse Vpase et il n'y a pas grand-chose à dire. Si 


O se dirige vers S à vitesse vs , il reçoit les fronts d'onde à la vitesse: 


Vphase + Vobs (68.84) 


et franchit les distances 4 en des temps égaux: 


À 
LEE (6685) 
Vphase + Vobs 
Pendant chaque intervalle Â£ il perçoit un cycle complet de l'onde. Il en déduit que Â£ est la période 
T' d'une onde de fréquence f ‘: 


0 1 vV +v V + 1 y 
Famroche ER D Re RS 1+ —Ss (68.86) 
T À Vphase T T Vphase 


Donc au final: 


Û y 
Faproche = F|1+ |» f) (6887 


Le son devient donc plus aigu lorsqu'on approche une source. 


Si O s'éloigne de S à vitesse vs , il reçoit les fronts d'onde à la vitesse: 


Vphase — Vobs (68.88) 
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et les mêmes développements nous amènent alors à: 


[l Vo 
Jétoignement = f|1- —Æ- |< | (68.89) 
Vphase 


La limite de validité de cette relation étant pour Vobs © VpHase. Le son devient donc plus grave lorsqu'on 
s'éloigne d'une source. 


Remarque: Si la vitesse de l'observateur est orientée de manière quelconque, par rapport à la ligneOf, 
seule la composante radiale est à prendre en compte. 


3.2. SOURCE EN MOUVEMENT-OBSERVATEUR FIXE 


Il n'est pas forcément intuitif de voir que le système n'est pas symétrique. Mais en prenant un cas 
particulier on se rend vite compte que ça ne l'est effectivement pas. En effet, si le récepteur fuit l'émetteur 


à une vitesse supérieure à Vphase, il ne recevra jamais d'onde, alors que si l'émetteur fuit un récepteur 
immobile, celui-ci recevra toujours une onde. On ne peut pas inverser le rôle de l'émetteur et du récepteur. 


Dans le cas classique, il y a donc dissymétrie dans le décalage fréquentiel selon que l'émetteur ou le 
récepteur est en mouvement. 


Considérons dons la situation suivante: 


Figure: 68.3 - Schéma de principe d'un observateur fixe et d'une source en approche 


Soient: 


Fe 


(68.90) 


CE 


la fréquence de la source S en mouvement rectiligne et uniforme et Vpase la vitesse de propagation de 
l'onde dans le milieu et O l'observateur supposé immobile. 


Si la source se déplace à vitesse Vv.r, elle parcourt une distance: 
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d = Vsonce : T (68.91) 


entre chaque cycle. La longueur d'onde vue par l'observateur varie donc de: 
d=BA=V, ue: T (6892) 


Pour l'observateur, elle diminue telle que: 
1 Vsource 
À'= À — Vsorce  T'= À (68.93) 


Nous avons alors: 


f! _ Vphas _ Vphase Vphase = Vphase en 
proche 9 
À Â— Ysawce phase __ Vsouwrce Vphase — Vsource 
f À i 


Donc après simplification: 


Û 1 
amroche = f|———|5>f]| (68.95) 
1— “source 


Vphase 


La limite de validité de cette relation étant pour Vscurce © V phase . 


Il vient donc: 


Faproche > F (68.96) 


Le son devient donc plus aigu lorsque la source s'approche (donc même sensation que lorsque c'est 
l'observateur qui s'approche). 


De même, lorsque la source s'éloigne de l'observateur, nous avons immédiatement: 


l 
Jétoigrement = f y <f 
1 + source 


Vphase 


(68.97) 


Le son devient donc plus grave lorsque la source s'éloigne (donc même sensation que lorsque c'est 
l'observateur qui s'éloigne). 
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Remarque: Dans le cas d'ondes électromagnétiques, la vitesse de l'onde est la vitesse de la lumière qui 
ne dépend pas du référentiel. Nous devons alors traiter le problème dans le cadre de la relativité 
restreinte et on s'attend alors à trouver un effet parfaitement symétrique puisqu'on ne peut pas 
distinguer entre vitesse de l'émetteur et vitesse du récepteur, seule comptant la vitesse relative entre 
les deux (voir les développements dans le chapitre de Relativité Restreinte). 


3.3. OBSERVATEUR ET SOURCE EN MOUVEMENT 


Si les deux (source et observateur) sont en mouvement rectiligne sur une droite commune, les deux effets 
s'ajoutent. Nous avons alors lorsqu'ils se rapprochent: 


1 Vobs 
J æproche — J| 14 
Vphase 
1 Y. 1 
Jasroche = À Re | éd) 
' 1 Vphase 1- Vsource 
JL æproche — Î NE Volume 
1 “source 
Vphase 
Et s'ils s'éloignent: 
Vobs 
Jétoigrement = f|1-—— 
Vphase 
Vobs 1 ec. 
J'éoigmement = F1 | —— | (68.99) 
' 1 Vphase Vsource 
_ 1+-2<< 
Jétoigrement = f ET Volase 
1-+ “source 
Vphase 


4. ONDES DE CHOC 


Les ondes de choc se produisent dans un gaz pour des perturbations très intenses. Par exemple, l'onde du 
choc du Concorde (bang supersonique) fait au niveau du sol une surpression d'environ 100 [Pa]. Le son 
est très fort, de l'ordre de 140 [dB], mais la surpression n'est que d'un millième de la pression 


atmosphérique! Les ondes à la sortie des armes à feu ont des surpressions de l'ordre de quelques 10° [Pa]. 


Nous avons démontré que la vitesse des ondes dans un gaz dépendait de la température mais si nous 
prenons en compte que les ondes sonores produisent des variations de pression, celles-ci produisent donc 
elles-mêmes des variations de température (cf. chapitre de Thermodynamique). Donc, une augmentation 
de pression augmente la température ce qui augmente la vitesse. Pour le cas d'une sinusoïde, les sommets 
de pression se retrouvent à voyager plus vite que les creux... La sinusoïde se déforme, la pente entre les 
sommets et les creux de devant augmente ce qui a tendance à créer un front d'onde abrupt entre la partie 
chaude, derrière le front d'onde et la partie froide juste devant. C'est ce que l'on appelle "onde de choc". 
Cette onde de choc se propage à la vitesse qui correspond à sa température et qui est supérieure à celle du 
son normal. 
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À mesure que le front d'onde se propage, son amplitude diminue et à la fin, l'onde de choc devient une 
onde sonore normale. Ce qui est remarquable est que les ondes de choc, aussi bien celles qui sont en 
surpression (plus chaudes et plus rapides) que celles qui sont en dépression (plus froides et plus lentes) 
fusionnent avec les ondes qu'elles rattrapent ou qui les rattrapent. En effet, une onde normale qui se fait 
rattraper par une onde de choc se retrouve à voyager dans une zone chaude dont la vitesse est celle de 
l'onde qui l'a rattrapée. 


5. GAMMES MUSICALES 


Lorsque nous faisons vibrer une corde de guitare, de violon ou autre instrument à cordes dont les 
extrémités sont fixes (onde stationnaire), nous avons démontré dans le chapitre de Mécanique Ondulatoire 
que nous sommes dans des conditions dites de Dirichlet. 


Nous avions obtenu après de nombreux calculs, le résultat suivant: 
” F[x7 
Cl (68.100) 
&\ £ 


a Î[Æ 
— Œ— (68.101) 


"ZAVa EL 


Soit: 


Jn 


donc la fréquence (qui est un des facteurs de la sensation de la "hauteur" d'un son chez l'être humain) est 
bien inversement proportionnelle à la longueur L d'une corde fixée aux extrémités (comme l'aurait déduit 
Pythagore bien avant que la théorie soit établie). 


La relation précédente le met en évidence; plus la partie vibrante est longue (plus n est petit), plus le son 
sera bas (basse fréquence) et plus elle sera courte (n grand), plus le son sera aigu (haute fréquence). 


Rappelons que pour # = 1, nous parlons de "fréquence fondamentale" et pour # > 2 de "fréquence 
harmonique". Ainsi, # = 2 est la première harmonique, # = 3 la deuxième harmonique, etc. 


Définitions: 


D1. Nous disons que deux fréquences (ou deux ondes périodiques) sont "à l'unisson" l'une de l'autre si le 
rapport de leurs fréquences est égal à l'unité: 


Unisson: — =1 (68.102) 


D2. Nous disons que deux fréquences (ou deux ondes périodiques) sont "à l'octave" l'une de l'autre si le 
rapport de leurs fréquences est égal à deux: 


Octave: —=2 (68.102) 


Remarquons que la première harmonique correspond à l'octave de la fondamentale: 
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Ainsi, certaines chanteuses sont capables de jouer sur 8 octaves (c'est-à-dire un rapport de fréquences de 
16). Ainsi, dans le cas d'un instrument à cordes avec conditions de Dirichlet cela équivaut bien 
évidemment à pincer la corde en son milieu (pour les guitares cela correspond à appuyer la corde sur la 


frette de la 12" case par rapport à la fréquence de la corde à vide pour avoir une octave). 


D3. Nous disons que deux fréquences (ou deux ondes périodiques) sont "à la quinte" l'une de l'autre si le 
rapport de leurs fréquences est égal à 3/2: 
F " 


, 3 
unte: — = — 
Q 15 


Hormis l'octave, cet intervalle est le plus simple de tous, et depuis toujours, dans la musique occidentale, 
il a été considéré comme l'intervalle consonant par excellence, donc le plus remarquable à l'oreille. Pour 
cette raison, la quinte a joué un rôle essentiel dans l'établissement des gammes musicales, la gamme de 
Pythagore (gamme pythagoricienne) étant même exclusivement construite sur cet intervalle particulier. 


Nous remarquons que nous arrivons à mettre au plus un nombre entier de 2 quintes dans une octave (au- 
delà nous dépassons la valeur d'une octave). 


D4. Nous disons que deux fréquences (ou deux ondes périodiques) sont "à la quarte" l'un de l'autre si le 
rapport de leurs fréquences est égal à 4/3: 


D5. Le rapport des fréquences de deux sons (ou deux ondes périodiques) éloignés l'un de l'autre d'un "ton" 
peut être de 9/8. Il s'agit alors du "ton majeur”: 


D6. Le "ton mineur" a pour rapport de fréquences 10/9. 


Lorsqu'un instrument à cordes a ses vibrations à vides qui sont dans un rapport de fréquences 
correspondant à la quinte, nous disons que l'instrument est "accordé de quinte en quinte”. 


Remarque: L'octave, la quinte, la quarte et le ton sont appelés en musique des "intervalles". 


Évidemment, si nous souhaitons faire de la musique, il faut choisir un repère. Comme la gamme de 
fréquences est infinie, il a été choisi une fréquence à laquelle l'oreille humaine actuelle est la plus 
sensible: 440 [Hz] que l'on appelle le "la" et qui est noté (A) chez les Anglo-saxons. 


Au solfège, les étudiants occidentaux apprennent la suite empirique suivante de 7 notes et dont l'origine 
écrite est purement mnémotechnique (on retrouve cette suite sur les accordeurs électroniques avec le 
système Anglo-saxon qui utilise certaines lettres de l'alphabet): 
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do (C) - ré (D) — mi (E) - fa (F) - sol (G) - la (A) -si (B)— do (C) 


Do Ré Mi Fa Sol Si Do 
e) 


où les lignes de la symbolique solfégique ci-dessus représentent une quinte dans la gamme 
pythagoricienne. Entre le premier do et le deuxième do, nous avons donc un intervalle d'une octave. Par 
ailleurs, ce nombre de notes à l'intérieur de l'intervalle d'octave est souvent insuffisant pour faire de la 
bonne musique et des artistes ont ajouté d'autres notes par altération des fréquences de ces 7 notes, en les 
diésant (multiplication de la fréquence par 25/24) ou en les bémolisant (multiplication par 1-25/24). 


Signalons qu'il existe une dizaine de manières de découper l'octave solfégique et qui sont presque toutes 
encore utilisée au début du 21ème siècle (elles sont toutes complétement empiriques donc nous 
n'entrerons pas dans les détails): 


- La "gamme naturelle" (appelée aussi "gamme harmonique") 

- La "gamme tempérée" 

- La "gamme pythagoricienne" 

- La "gamme chromatique" 

- La "gamme de Zarlino" (appelée aussi "gamme des physiciens") 
etc. 


La méthode et l'ordre d'apprentissage susmentionné est une aberration mathématique (mais on est plus à 
ça près en musique. qui est un art empirique). 


6. OSCILLATEUR HARMONIQUE 


Considérons le système mécanique de la figure ci-dessous constitué d'un ressort de constante k, d'une 
masse m et d'un amortisseur visqueux de constante c. Ce système est souvent assimilé à la mécanique d'un 
haut-parleur (ou d'un micro) où l'air sert d'amortisseur visqueux et le champ magnétique de l'aimant 
excitateur de force d'application ou encore d'un amortisseur de voiture: 


& 


Figure: 68.4 - Schéma de principe de l'oscillateur harmonique 
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Nous avons démontré dans le chapitre de Génie Mécanique que pour un ressort de type hélicoïdal nous 
avions: 


4 
F = ie x=ÀX.x (68.107) 
8-7: D 


et c'est l'expression de la force avec laquelle le ressort s'opposera à une force extérieure de compression 
ou de traction. À l'équilibre, nous avons forcément la somme des forces qui est nulle: 


Ext + Éessot = 0 (68.108) 
soit: 
mx+k-x=0 (68.109) 


Nous avons démontré dans le chapitre de Mécanique Des Milieux Continus que la loi de Stokes dans le 
cadre d'un cylindre était donnée par: 
F=67mHRvV=C.v (68.110) 


Nous supposerons que notre amortisseur visqueux est basé sur une loi du même type où la force de 
résistance est proportionnelle à la vitesse. À l'équilibre, nous avons forcément la somme des forces qui est 
nulle: 
F ext + Fressort + amortisseurs 0 (68.111) 
soit: 
mXx+c.x+k£.x= 0 (68.112) 


Nous allons simplifier cette expression: 
mm. C . 
—X+—.x+x=0 (68.113) 
& À 


Nous nous retrouvons donc avec une équation différentielle exactement identique à celle d'un circuit RLC 
série en régime constant (cf. chapitre de Génie Electrique): 


LC-G+RC-G+g=0 (68.114) 
Nous avons donc de la même manière, la viscosité critique: 


Ce = 24m k (68.115) 


au lieu de la résistance critique du circuit RLC: 


k = 2 (68.116) 


qui va déterminer si le système est en régime critique: 
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C=C,; (68.117) 


en régime apériodique (hypercritique): 
C>C; (68.118) 
ou pseudo-périodique (oscillations amorties) avec: 
C<Cs (68.119) 
Dans le cas des voitures ou haut-parleurs, il est souvent intéressant de s'arranger pour être en mode 


pseudo-périodique. Nous retrouvons alors exactement les mêmes résultats que le circuit RLC avec 
oscillations amorties puisque l'équation différentielle est la même. 


Les spécialistes de l'acoustique ou de la mécanique s'arrangent alors pour s'approprier le concept de 
"facteur d'amortissement" du circuit RLC: 


R 
Œ=— (68.120) 
“ie 
qui s'écrira dans le cas présent par identification des termes: 
ÀA=—— (68.121) 
Avec la pulsation propre: 
—— (68.122) 
qui s'écrit dans le cas présent: 


& 
@=,|— (68.123) 
3 


L'oscillateur amorti perd de l'énergie au cours du temps. Calculons cette perte. Nous avons (cf. chapitres 
de Mécanique Classique et Génie Mécanique): 


E=E,+E,= . + (68.124) 


d'où: 


pa = XX +AXX = imX+AX)X (68.125) 
FA 


Or, selon l'équation du mouvement: 


mxX+c x+k.x=0—mx+k x=-c.x (68.126) 
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Il vient alors: 


dE .2 
—=-c.X* (68.127) 
dé 


La perte d'énergie (ou puissance dissipée) est proportionnelle au carré de la vitesse instantanée. 


Nous avons démontré dans le chapitre de Génie Électrique pour le circuit RLC qu'en régime d'oscillations 
amorties, nous avions: 


ALL TT | 
g=—2 cos ( @t — 
cos Ÿ 
(68.128) 
9 “37 . 
i=- À, 21 sin(æt) 
cos” # 
Ce qui devient ici: 
_£, 
x= 0 , 21 cosié -#i 
cos ÿ 
(68.129) 
, xp “37. 
X=— . e 21 siniæ@éi 
cos” # 
Dès lors: 
dE 2 R, R + 
- ŒXn . ee nr 
ne = € à sini@til e L =cy sin2iæie L (68.130) 
Ê cos“ 


6.1. L'OSCILLATEUR FORCÉ 


Considérons toujours le même l'oscillateur mais excité cette fois-ci par une force harmonique (donc en 
régime forcé) tel que: 


mxt+c-x+k.x= Æjsini@i (68.131) 


Encore une fois, il s'agit exactement du même type d'équation différentielle que pour l'oscillateur RLC en 
régime forcé étudié dans le chapitre de Génie Électrique pour lequel nous avions: 


2 dg 1 
LT+RT + y=Uosin(a) (68132 
2 à C 0 


Il s'ensuit les mêmes résultats et conclusions que le lecteur pourra trouver dans le chapitre de Génie 
Électrique. 
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Notes personnelles: 
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AIL 


Ingénierie 


69. GÉNIE MARIN & MÉTÉO 


L. météorologie est l'étude des phénomènes atmosphériques tels les nuages, les dépressions et les 


précipitations pour comprendre comment ils se forment et évoluent. C'est une discipline qui traite 
principalement de la mécanique des fluides appliquée à l'air mais qui fait usage de différentes autres 
branches de la physique et de la chimie. Elle permet donc d'établir des prévisions météorologiques en 
s'appuyant sur des modèles mathématiques à court comme à relativement long terme. Elle est également 
appliquée pour la prévision de la qualité de l'air, pour les changements climatiques et pour l'étude dans 
plusieurs domaines de l'activité humaine (construction, trafic aérien, etc.) 


La météorologie est liée à une grande quantité de variables dont il serait très difficile de faire une liste 
même non exhaustive. Cependant sur notre planète Terre, un facteur important à ne pas négliger est celui 
constitué par les surfaces océaniques et leur dynamique intrinsèque dont nous tenterons de présenter au 
travers d’une étude mathématique sommaire quelques-unes de leurs propriétés. 


Ce chapitre est une introduction générale de base au domaine des applications techniques de la 
thermodynamique et de la mécanique des fluides. Il permettra au lecteur de se familiariser avec le langage 
et certaines méthodes de calculs fondamentales utilisées par les ingénieurs de cette branche. Bien sûr, il 
faut compléter cette étude par des travaux pratiques en laboratoire. 


1. HORIZON VISUEL 


Étudions d'abord un petit sujet sympathique faisant souvent débat lors des vacances ou plus 
sérieusement. Dans certains logiciels de météorologie, il est demandé de saisir la distance de l'horizon 
visuel lors de mesures de température et pression... or celle-ci est difficile à déterminer par très beau temps 
lorsque nous sommes en hauteur. 


Pour cela, considérons la Terre de rayon R et un point de perspective de hauteur h par rapport au niveau 
de la mer que nous noterons À. La question est de savoir à quelle distance se trouve le point C donné par 
définition par la tangente AC qui est simplement la ligne d'horizon. 


D Ligne d'horizon 
(tangente) 


Figure: 69.1 - Configuration de l'expérience... 
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Le lecteur observera déjà que l'étude va principalement faire appel à de la trigonométrie et de la géométrie 
élémentaire. 


L'angle Oc'4 est un angle droit. En effet, une droite tangente en un point d'un cercle est perpendiculaire 
au rayon en ce point. Le triangle OCA est donc rectangle en C. 


Nous avons donc: 


o0C oC . 
COS(A)= — = (69.1) 
OA OB+BA 


Or, nous avons ©8 = OC = R. D'où nous déduisons: 


R | ”. 
(69.2) 
À 


cos() = = = acces À 


La distance AC est la distance à vol d'oiseau entre le point de vue (belvédère) et le bateau que nous 
observons sur l'horizon. La distance qui nous intéresse cependant ici est BC: c'est la distance que nous 
devrions parcourir à l'altitude O pour rejoindre l'autre bateau. 


Dans la suite, nous poserons BC'= 4. 


Lorsque l'angle & varie de 0° à 360° (tour complet), nous décrivons toute la circonférence de la Terre, 
c'est-à-dire 27AÀ puisque la Terre est supposée être ronde. 


Utilisation de la règle de trois: 


Si un angle de 360° correspond à une distance de longueur 272 alors un angle de & correspond à une 
distance: 


27TR ITR _ 
d=—a=—4 (69.3) 
360 130 


| 
(69.4) 
k 


& = arccos 
À + 


Or, nous avons vu précédemment que: 


D'où, finalement: 


FR FR À »: 
d == ——arccos (69.5) 
180 180 R+k 


Avec À = 6378 [k#], nous trouvons (h doit être exprimé en kilomètres): 


6'378 
d =111.32arccos| ———— | (69.6) 
6'378+h 


Nous avons alors dans le vide, dans un paysage sans obstacles. la table suivante: 
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Altitude h [m] | Distance de l'horizon d [km] 
5) 8 
10 113 
00 25.3 
100 35.7 

200 00.5 
400 71.4 
600 87.5 
800 101 
1000 113 
2000 159.7 
3000 195.6 
4000 225.8 
5000 252.5 
10000 357 


Tableau: 69.1 - Horizon visuel en fonction de l'altitude 


Remarque: Si nous ne tenons donc pas compte de la réfraction atmosphérique, nous constatons qu'il 
faudrait une altitude de l'ordre de plusieurs kilomètres pour voir au-delà de 200 [km] de distance. 
Pourtant, sans aller très loin, depuis les hauteurs de Nice (Alpes-Maritimes), il est possible d'observer 
la pointe du Cap Corse qui se trouve à environ 220 km du continent!!! La réfraction atmosphérique 
joue donc un rôle dans ce phénomène. 


2. DIRECTION DES VENTS 


Nous allons démontrer mathématiquement maintenant quelque chose de tout à fait intuitif: que les vents se 
déplacent des hautes vers les basses pressions (c'est bête comme ça maïs il faut tout de même le montrer). 


Nous savons (cf. chapitre de Mécanique Des Milieux Continus) que la force de pression s'exerçant sur une 
surface S est normale à cette surface et vaut sous forme scalaire P.#. 


Pour une parcelle d'air de volume 4Ÿ = £x5y@z la force de pression totale selon la direction x vaut alors: 


Fp = P(x)-6yôz- P(x+0x)6yôz (69.7) 
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De plus, nous avons (cf. chapitre de Calcul Différentiel Et Intégral): 


P(x+ Ôx) — P(x) _ 9P 
ôx x 


(69.8) 
Donc: 
OP F 
Fp = P(x)-6yôz - P(x+0x)0yôz = Ta PAONGE (69.9) 
5 


La force de pression massique est donc: 
Nous pouvons faire le même calcul selon y. Finalement, la force de pression horizontale massique sera 
donnée par: 


2P 
… de de 
fr = | 5 


D 


d 
Ainsi, la force de pression (massique ou non) est opposée au gradient horizontal. La transmission de 


l'information (de la force) se fait à la vitesse du son pour cette équation (ce qui explique la vitesse des 
appels d'air dans votre maison ou appartement et la force pouvant faire claquer les portes ou fenêtre). 


Elle est donc: 
- Dirigée des hautes vers les basses pressions, perpendiculaire aux isobares 
- Inversement proportionnelle à l'écartement des isobares. 


Si nous relevons les valeurs de la pression atmosphérique en différents points du globe et que nous relions 
entre eux les points de pression identique, nous obtenons une série de courbes, appelées "isobares". Le 
vent est directement déterminé par ce relief atmosphérique, puisque c'est un déplacement d'air entre des 
hautes vers les basses pressions. 


La vitesse du vent est donc fixée par le gradient de pression: autrement dit, si la pression atmosphérique 
varie rapidement avec la distance, le vent soufflera fort, tandis qu'il sera faible dans un "marais" 
barométrique où cette pression reste quasiment inchangée sur de grandes distances. En résumé, plus les 
isobares sont rapprochées, plus le vent soufflera fort. 


Les isobares sont traditionnellement indiquées par un pas de 5 millibars sur les cartes météo tel que le 
montre l'exemple ci-dessous: 
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cn, 
Figure: 69.2 - Représentation typique des isobares (sur une dépression) 


Ensuite, les météorologues ont défini empiriquement (c'est sympathique pour la culture générale) une unité 
de mesure des vents qui n'est qu'une correspondance entre la force du vent et la distance séparant 2 
isobares (5 en 5 [mbl): 


Distance entre isobares [km] | Unité [Beaufort] | Vitesse [m/s] 
600 (brise légère) 2 1.6-3.3 
500 (brise moyenne) 4 3.4-5.4 
400 (brise fraîche) 5 8-10.7 
300 (vent fort) 6 10.8-13.8 
200 (grand vent) 7 13.9-17.1 
100 (tempête) 9 20.8-24.4 


Tableau: 69.2 - Distance entre isobares et vents 
3. MODÈLE ATMOSPHÉRIQUE EXPONENTIEL 


Considérons que l'atmosphère est un fluide parfait dans un champ de gravité. Alors à partir de la relation 
du théorème de Bernoulli suivante, démontrée dans le chapitre de Mécanique Des Milieux Continus 
(fluide statique): 


P=-pogz+c* (69.12) 
Il vient alors: 


P- (69.13) 
& LL 


Ainsi, pour connaître la variation de pression avec l'altitude dans l'atmosphère ou la profondeur dans 
l'océan, nous avons pris comme hypothèse "l'équilibre hydrostatique", soit que la variation de pression 
avec la hauteur/profondeur est proportionnelle à la gravité et à la densité du fluide. 


Ceci n'est bien évidemment pas valide dans le cas de mouvements rapides de convection, comme dans les 
orages, mais se vérifie assez bien dans les mouvements plus lents et à grande échelle: l'échelle synoptique. 


Nous allons alors combiner cette dernière relation avec une équation d'état, par exemple celle du gaz 
parfait à la température T et de densité £ dont les particules constituantes ont pour masse m. Nous avons 
donc l'équation des gaz parfaits (cf. chapitre de Mécanique Des Milieux Continus): 
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ART = PkT " 
F mr 


P.V =n8T = P = p="#* Go 
ET 


avec pour rappel P est la pression exprimée en Pascals, V le volume exprimé en mètres cubes, R qui est la 
constante des gaz parfaits, T la température exprimée en Kelvins, n le nombre de moles, k est la constante 
de Boltzmann, © la densité de particules, m la masse totale des particules. 


Dans le cas isotherme (par exemple dans la stratosphère Terrestre, au-dessus de 10 [km] d'altitude où la 
température est quasi constante autour de -55 degrés Celsius), l'intégration s'effectue facilement: 


—=-pg D —=-——Zg (69.15) 
k. 
Donc, à une pression donnée, le gradient vertical de pression est inversement proportionnel à la 
température. 


Considérons maintenant la relation suivante: 


dP = Se = In(P) = ME PU, (69.16) 
P ET ET 


En utilisant l'exponentielle: 


Le _— 
P=c" e(-2) = Ae KT | (69.17) 


La pression décroit donc exponentiellement avec l'altitude. Æ, étant la pression au niveau du sol. 


Revenons aussi à la relation: 


oP m.P | 
—=-———g (69.18) 
4 ET 


Elle peut bien évidemment aussi s'écrire sous la forme: 


4 La 
—=—-————7T (6919) 


qui nous dit que la distance z entre les surfaces isobares est directement proportionnelle à la température. 


Voyons également une autre approche courante. Repartons pour cela de la relation démontrée plus haut 
mais pour une masse m de 1 kilo: 


et notons cette relation sous la forme suivante: 


d,P(z) __ 
Piz)  KT(z) 
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(69.21) 


Rappelons que (cf. chapitre de Calcul Différentiel Et Intégral): 


d,In(f(x)) = EL (x) (69.22) 


Donc: 


d, In(P(z)) = — (69.23) 


_8_ 
KkT(z) 


et supposons maintenant que la variation de température est linéaire dans l'atmosphère (ce qui n'est pas 
loin de la vérité pour les 10 à 20 premiers kilomètres de l'atmosphère) tel que: 


T(z)= 7% +4:-Z (69.24) 


avec À < 0 qui est le gradient de température en [°K/m|. 


Altitude 1an KT: Masse volumique de À ir au mem 
, Pression (er 1Ps1 
129 
11) 
169 
99 
CA 
?9 
&û 
58 
42 
3û 
2€ 0, 10 
Cirrus L10 
PM MR den or 
IC | MtEverest luages 
27 © MtBlanc HO eo _ Troposphère  , 
Û | = L L TE + | 40 
100 80 -60 -40 -20 0 20 40 60 
Temperature #0 C: 


Figure: 69.3 - Profil type de la température et de la pression sur Terre (fin 20ème siècle) 


Nous avons alors: 


£ -gik 
À NP) = - © = — (60. 
z n(P(z)) HR +42) Zide 0 
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Soit: 


1 _T -g'£ 
Ja in(P(2)) = Er 


% £ 


Ce qui donne: 
In(P(z)) — In(P(z0)) = + no +42 (6927 


Après simplification: 


. Aa) Eu(nts _—. 


P(z0) &k À |L+4-Z 
Soit: 
+ 
D+Az | #4 box 
P(A)= re (2 | (69.29) 
0 +42 


Soit écrit de manière plus esthétique: 


EN 
T+A-z | 64) (6930) 
T +42 


ro=R | 


Un bon exemple d'application courant de cette relation est les planeurs et les deltaplanes. Ceux-ci 
attendent de la météo que celle-ci leur communique l'altitude de l'isotherme du zéro degré lors de ses 
bulletins. Ils en déduisent alors le gradient de température par mètre. Pour ces sportifs, une bonne 
condition est d'avoir un gradient de 1 [°C] pour 100 mètres. Il est dès lors aisé avec la relation précédente 
de calculer la pression à une altitude de 2'000 mètres et d'en déduire le gradient de pression qui leur 
permet d'utiliser certains ascendants pour leurs exercices de voltige. 


4. MODÈLE ATMOSPHÉRIQUE ADIABATIQUE 


Le gradient thermique adiabatique est, dans l'atmosphère terrestre, la variation de température de l'air avec 
l'altitude (autrement dit le gradient de la température de l'air), qui ne dépend que de la pression 
atmosphérique, c'est-à-dire: 


- Sans considération d'échange de chaleur avec l'environnement (autres masses d'air, relief) 
- Sans considération de condensation (formation de nuages) ni de précipitation. 
Ce concept a une grande importance en météorologie, ainsi qu'en navigation aérienne et maritime. 


Nous avons démontré dans le chapitre de Thermodynamique la loi de Laplace (satisfaite que sous 
certaines conditions! ): 
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PYY = (69.31) 


avec le coefficient de Laplace: 
C 
y=—À (69.32) 
Cy 
Soit sous forme massique: 
(3 
—=C (69.33) 


Nous pouvons en prendre le logarithme: 


in 2 = in (c*) =in(P)-yin(p)=c"* =in(P)=yin(o)+e* (69.34) 
8 


Or en prenant la différentielle logarithmique: 


d(yin(o)) | PL = d(yin(o)}= 8 (69.35) 
de 8 pe) 
d(c*)=0 


Nous avons alors (relation que nous retrouverons dans le chapitre de Musique Mathématiques): 


Nous aurions aussi pu trouver ce résultat directement à partir de la relation démontrée dans le chapitre de 
Thermodynamique: 


a[”) 

av dP dP av re) l 4e 

ie PE du À ey | | . 
re) 


En prenant aussi la différentielle logarithmique de loi des gaz parfaits où n est le nombre de moles: 
PF =nRT (69.38) 


Mais sous la forme massique pour une mole: 


(69.39) 


où Àf,, est donc la masse molaire, nous avons: 
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Info) = In (ee) =in(d,P)-In(RT) (69.40) 


Soit: 


Nous obtenons alors: 


1dP dP dT dT dP 1dP dT y-1dP 
= = —— (69.42) 
YP PT T P yP T P 


Soit: 


Il vient alors: 


Nous avons donc une atmosphère à gradient thermique constant et négatif (la température diminue de 
manière linéaire avec l'altitude): 


ce Ie ME 54e 


La dernière forme utilisant la masse molaire étant plus pratique car elle permet de caractériser le milieu 
étudié. À remarquer que c'est un modèle qui semble très très bien marcher pour une altitude de 0 à 90 [km] 
sur la planète Vénus mais nettement moins bien pour la planète Terre. 


Nous avons alors par exemple pour la Terre (donc tout en sachant que le modèle n'est pas très bien adapté) 
g= 9.81 Lo. ni R=8.314 [UK moi | et le coefficient adiabatique pour l'air y = 1.4, et sa masse 


molaire M, = 28.96.10 | Kg-moi” | 


Soit: 
x = -00976 [& mr | = ILE 4m |] (69.47) 


ce qui correspond à l'idée courante (un degré pour 100 mètres). 
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5. ÉQUATION HYPSOMÉTRIQUE 


Nous avons donc pour l'équilibre hydrostatique: 


OP  m.P 
—_=-———g (69.48) 
œ &T 


où nest le nombre de moles par kilogramme. 


Nous pouvons intégrer cette relation si nous connaissons T en fonction de P ou z. La mesure directe de P 
dans la pratique est plus facile (les altimêtres simples sont en fait des baromètres). 


Nous pouvons alors séparer les variables: 


Te =—Mmg@z (69.49) 


En intégrant entre deux niveaux a et b: 


b b 
k[Ta(in(Pi)=-{mgaz (69.50) 
a a 
Puisque: 
d{in(P)) _1 dP 
=——=ûfin =— (69.51) 
dP F (Ia(P) F 


Ensuite pour continuer nous allons utiliser une astuce. Nous allons définir la température moyenne par la 
relation: 


ë 
[Ta (in(P)) 
(T}= —— (6952) 
[a (in(P)) 
Ce qui nous permet alors d'écrire: 
ë 
b b [a (in(P)) b b 
k[TA (In(P)) = & [TA (In(P))E 2 = KT} [a (in(P)) = -[ mar (69.52) 
a a [a {in(P)} a a 
Soit: 
MEUZa —Zpl= krn[ à (69.54) 
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où autrement écrit: 


Za —Zp = À r\n à (69.55) 


PRE a 


Les deux relations encadrées sont appelées chacune respectivement "équation hypsométrique" (du grec 
"hypso" pour "hauteur"'): 


& _ o HT) (69.56) 
FE 


Remarque: En météorologie, z, est posé comme étant égal à 0 au niveau de la mer où la pression Æ, 


est supposée connue. Ainsi, nous avons trois paramètres libres. En en connaissant deux sur les trois, il 
est facile de déterminer le troisième. 


À l'armée, par exemple, les ballons-sondes donnent la température et la hauteur du ballon et les 
militaires au sol mesurent z; et Æ . Ensuite toutes ces informations sont communiquées aux chars 


d'assaut qui peuvent calculer la pression À, à différentes hauteurs et donc l'influence de celle-ci sur la 
trajectoire de leurs obus... via la différence de force. 


6. BALLON-SONDE 


Un joli petit exemple intéressant d'application des mathématiques appliquées au génie météo est l'étude 
des fameux ballons-sondes et particulièrement la caractéristique de leur volume en fonction de l'altitude 
qui est souvent sujet à débat dans des groupes de discussion lorsque personne n'y formalise le problème 
une bonne fois pour toute. Vous aurez donc compris que c'est ce que nous allons étudier ici et surtout nous 
allons tenter de déterminer le diamètre théorique de ceux-ci à une altitude donnée. 


L'énoncé du problème souvent débattu est le suivant: 


Un ballon-sonde en PVC (Polyvinyl-Chloride) de masse m sert à emmener à haute altitude un appareillage 
en vue d'effectuer des mesures. L'enveloppe du ballon contient n moles de gaz parfait d'hydrogène A, 


ayant donc une masse molaire de: 
M, (A) =2lg -mol1] (69.57) 
L'atmosphère sera assimilée à un gaz parfait, de masse molaire moyenne: 
M, (air) = 29[g: moi] (69.58) 
aux C.N.T.P. (Conditions Normales de Température et de Pression). 


Nous voulons d'abord chercher quelle est la force ascensionnelle Æ ressentie par le ballon? 
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Ensuite, nous voulons évaluer la quantité de matière minimale #4 assurant le décollage de celui-ci pour 


une masse totale (ballon compris!) de 2.6 [Kg]. puis le volume }, correspondant, à l'altitude de départ. 


Rappelons deux choses pour résoudre déjà ce premier point: 


1. Tout corps plongé dans un liquide (ou un gaz) subit une force vers le haut égale au poids du volume qu'il 
déplace (force d'Archimède) selon la relation démontrée dans le chapitre de Mécanique des milieux 
continus: 


F, =90.gV= FE, (69.59) 


2. Tout gaz parfait ayant une masse en grammes égale à la masse molaire occupe selon la loi des gaz 
parfaits un volume de 22.4 [L] à 273.15 [K] et à une pression de 1 [atm] comme nous l'avons démontré 
dans le chapitre de Chimie Thermique. Ce qui donne aux C.N.T.P: 


T 
F=nR—=1.8.314.  _ 22[Z] (69.60) 
Fr 1.01325.10 


Donc pour que le ballon flotte à hauteur constante (sans monter mais sans tomber aussi...) avec juste la 
quantité #, d'hydrogène suffisante, il faut donc d'après le principe d'Archimède que le volume d'air qu'il 
déplace ait un poids égal à la masse totale du ballon et de la sonde, soit 2.6 [Kg] dans notre cas! 


Donc puisque 22 [L] d'air pèsent environ 29 grammes, il faut que le volume soit tel qu'il déplace 2.6 [Kg] 
d'air. Soit en faisant une simple règle de trois: 


2.6 [Ke] 


.22 [Zlz 1'972[Z1= 1972[»°1=7 (69.61) 
0.029 [Ke] [2] [£] [me] = ) 


Donc si le ballon est sphérique, cela donne un rayon de: 


4 


É 
PF =27rR = R =3l=F z078 (69.62) 
o = 37785 — Rj : 270 = 0.78/»x] 


Soit un diamètre d'environ 1.56 [m] au sol. Ce qui est conforme à la réalité! 
Il nous faut encore déterminer le nombre de moles d'hydrogène. Il vient immédiatement: 


0 = = Z 90 [roles] (69.63) 


Maintenant que nous connaissons le nombre de moles dans le ballon, si nous connaissons la température et 
la pression à une hauteur de 22'000 [m] (altitude type d'un petit ballon-sonde) il ne nous reste qu'à 
appliquer la loi des gaz parfaits pour connaître le volume à cette altitude donné alors par la relation 
démontrée dans le chapitre de Mécanique des Milieux Continus: 


T 
W=ngR— (69.64) 
E 


ainsi à 22'000 [m] d'altitude, nous avons environ selon les tables disponibles sur Internet: 
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Taz218[K] 
Pz4.10° [Pa] 


(69.65) 


Mais au fait le rayonnement solaire est environ 30% plus élevé à cette altitude et le ballon est considéré 
comme un système adiabatique (sans échange de chaleur) et ne restitue donc pas la puissance 
emmagasinée à l'environnement extérieur. Nous considérons alors que la température est au moins 30% 
plus élevée ce qui nous donne comme chiffres: 


Tz 283[K] 


3 (69.66) 
Pz4.10 [Pa] 


Nous avons donc: 


r 283 
V = #nR— = 90.8.314. = 53[# ] (69.67) 
0 p 5.4.10° 


Nous aurions pu également utiliser (hypothèse adiabatique oblige!) la relation de Boyle-Mariotte (ci. 
chapitre de Mécanique Des Milieux Continus) pour arriver au même résultat: 


BR" 


LV =pP.y=ÿy-= 0 0 (69.68) 


Ce qui donne un rayon d'environ 2.33 [m] (diamètre donc d'environ 4.6 [m]) au lieu des 0.78 [m] au sol! 
Soit une augmentation du diamètre d'environ 300%. Il est plus important cependant de s'intéresser à 
l'augmentation de la surface pour déterminer les forces de contraintes élastiques sur le PVC. Nous avons 
donc avant: 


So = 47R$ = 4x. 0.78 = 7[m°] (69.69) 
et après: 
S=47R? = 47. 2.33% = 68[m°] (69.70) 


Soit une augmentation de la surface d'environ 1'000% alors qu'un élastomère-type (dont le PVC fait partie) 
ne résiste pas à une variation relative de 500%!!! Il est donc beaucoup plus aisé de comprendre sous le 
point de vue de la surface, pourquoi le ballon ne résiste pas à une augmentation du diamètre d'environ 
300%. 


Par ailleurs si nous appliquons de manière un peu abusive la loi de Hook au ballon (cf. chapitre de 
Mécanique des Milieux Continus), avec le module de Young du PVC qui est compris entre (source 
Wikipédia): 


2.9.107-3.3.107 [Mme ?] (69.71) 
nous avons. 


[AR] aie 00 


E Lg.e- 8 PA =5.9.107 [NW 2]=59 [MPa] (69.72) 
ÿ R 
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Ce qui est conforme aux données des tables numériques qui donnent une valeur limite inférieure élastique 
de 50 [MPa] et une limite supérieure de 80 [MPa] pour le PVC (source Wikipédia). Il nous est alors 
possible de calculer la hauteur minimale et maximale théorique que le ballon peut atteindre. 


Ainsi pour la hauteur minimale, nous écrivons d'abord: 


F 
ar = À 8 = 70732117 [er] TU 
Ce qui correspond alors à un rayon final de: 
R= Kj+138=19[#] (69.74) 
Ce qui correspond à un volume de: 
r=° R°=28.7[m°] (69.75) 
En appliquant Boyle-Mariotte: 
EF. F 
P- L 1.01325.10" 2.151 75.107 [Pa] (69.76) 


qui est une pression correspondante à une hauteur d'environ 18'000 [m] selon les mesures expérimentales 
(www.engineeringtoolbox.com) et c'est effectivement une hauteur à laquelle certains rares ballons en PVC 
éclatent. 


Maintenant faisons de même avec la hauteur maximale: 


F 
10? 69. 
lAR| = LR 0732 1.88 () NE 


Ce qui correspond alors à un rayon final de: 
R= Rp+1.88=2.61[#] (69.78) 
Ce qui correspond à un volume de: 


r == RŸ=745[m] (69.79) 


En appliquant Boyle-Mariotte: 


EVA $ 
p= _ 1:01325.10 PAT 10 [Pa] (6.80) 


qui est une pression correspondant à une hauteur d'environ 24'000 [m1] selon les mesures expérimentales et 
c'est effectivement une hauteur à laquelle les ballons en PVC les plus hauts éclatent. 
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7. CYCLOGENÈSE ET ANTICYCLOGENÈSE 


L'essentiel de la masse atmosphérique est contenu dans les 20 premiers kilomètres d'altitude, si bien que la 
météorologie à grande échelle se déroule sur une mince coquille sphérique (assimilable à de la mécanique 
des fluides bidimensionnelle). 


Le moteur de la circulation atmosphérique dans les tropiques est le réchauffement solaire. À cause de 
l'inclinaison de 23.5 degrés de l'axe de rotation de la Terre, le Soleil n'est jamais plus qu'à quelques 
dixièmes de degré du zénith à midi tout au long de l'année dans les tropiques, ce qui donne un maximum 
de réchauffement autour de l'équateur géographique. 


Il faut donc distinguer la circulation au voisinage des tropiques, caractérisée par de forts mouvements 
verticaux, dus aux convections thermiques, et la circulation des latitudes moyennes, faites quasiment que 
de mouvements horizontaux: 


Figure: 69.4 - Schéma simplifié de la circulation des vents sur Terre 


Supposons un moment que nous arrêtions complètement le mouvement de l'air dans l'atmosphère 
relativement à la surface de la planète, et que nous le laissions ensuite recommencer à tourner d'Ouest en 
Est (de gauche à droite sur les images) partir du repos. La force du gradient de pression pousse l'air à se 
mouvoir des régions de haute pression vers les régions de basse pression (appel du vide). Ces mouvements 
de convections sont appelés des "cellules de Hadley". 


Toutefois, dès que le mouvement s'amorce la force de Coriolis (due à la rotation de la Terre) dévie donc 
les vents Nord-Sud en direction de l'Ouest et les vents Sud-Nord vers l'Est pour un observateur se situant 
au pôle Nord. Nous observons dès lors la formation de cyclones tournants dans le sens contraire des 
aiguilles d'une montre dans l'hémisphère Nord et inversement dans l'hémisphère Sud (à cause de la 
direction du vecteur & dans cette partie de l'hémisphère). 
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Plus la vitesse de l'air augmente, plus la force de Coriolis augmente de concert en accentuant la déviation. 
Éventuellement la force de Coriolis atteint une valeur égale et opposée à celle de la force du gradient de 
pression, produisant ainsi un écoulement d'une vitesse constante (sans accélération), parallèle aux isobares 
définissant ainsi la limite géométrique de la cellule de Hadley. C'est ce que nous appelons"l'équilibre 
géostrophique". En pratique, l'écoulement en dehors des tropiques est presque toujours en quasi-équilibre 
géostrophique. 


En l'absence d'observations de vent, les météorologues peuvent estimer la force du vent en un point donné 
en mesurant sur une Carte d'analyse météo le gradient de pression et la latitude. L'approximation 
géostrophique est purement diagnostique. Elle n'a pas de valeur prédictive, car son équation ne contient 
aucun terme de changement. 


Dans les tropiques, où la force de Coriolis est de plus en plus faible jusqu'à être nulle à l'équateur, ce sont 
d'autres forces, comme la force centrifuge, qui viennent équilibrer la force de gradient de pression. 


C'est ce que nous allons démontrer ici mathématiquement à l'aide de la mécanique des milieux continus 
(fluides) et la mécanique classique (voir chapitres correspondants). 


Nous savons que dans notre système intervient donc les forces de pression (gradient), les forces 
centrifuges, les forces de pesanteur (gravité). Forces auxquelles il ne faut pas oublier d'ajouter la force 
(implicitement: l'accélération) de Coriolis interne au système (sous-entendu le cyclone) de pulsation & 


(cf. iQ sique): 


&, = 28XV 


et la force (implicitement: l'accélération) de Coriolis par unité de masse de fluide (la raison de ce choix 
d'unité paraîtra évidente quelques paragraphes plus loin) relativement à la pulsation & de la Terre: 


=2Q0xr 


Ainsi, comme nous le savons (cf. « Classique), la force de Coriolis va tendre à dévier 
tout mouvement descendant vers la droite (Est) dns l'hémisphère Nord et tout mouvement montant vers 
la gauche (Ouest) dans l'hémisphère Sud (selon que l'on se place dans la direction du fluide en mouvement 
selon la figure précédente). 


C'est ainsi que l'air à la base des cellules de Hadley, voyageant à basse altitude du tropique vers l'équateur 
sera dévié vers l'Ouest pour donner les Alizés de vents d'Est. 


Nous avons par ailleurs démontré dans le chapitre de mécanique des milieux continus une forme 
particulière de l'équation d'Euler de 2ème forme qui était: 


2 
0$v +15 
2 


+24u|+28=5-5 
re) 


Remaniée, cette relation s'écrit aussi: 


2 
= 0-5u-[a5+9% +20) 
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Or, nous avions aussi démontré que: 


—VU=S (69.85) 


Il vient dans le référentiel Terrestre: 
> PR 
Vp = p|£g- ire. (69.86) 


Il s'agit donc de l'équation définissant la pression à l'intérieur du fluide considéré comme isolé. À cette 
relation, il faut donc encore soustraire les forces de pression de Coriolis dues au référentiel géocentrique 
pour obtenir la dynamique du système "cyclone": 


Fr = p20x5 (69.87) 


Ce qui donne finalement: 

_ L Law | 

Vp = 0|£g- de dE (69.88) 
Soit sous forme condensée traditionnelle: 


Vp=p(g-(3+2)) (69.89) 


Représentons maintenant la Terre dans une tranche Nord-Sud: 


Figure: 69.5 - Tranche Nord-Sud de la Terre 


Si nous agrandissons la repère lié au cyclone et y translatons le vecteur pulsation de la Terre, nous avons: 
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Figure: 69.6 - Repère lié au cyclone avec la pulsation plane 


Soit: 
fi, 0 0 
{= 62, |= [Acos(2) =|£dcos A| (69.90) 
Q, Q, cosfri2- 4j] sin 


Nous avons donc: 


0 v, v, cos À — v, sin À 
20 x5 = 2] Qcos A|x v, [= 292 v, sin À (69.91) 
Sisin 4} y V, COs À 


Comme nous étudions les mouvements (quasi) horizontaux dans l'atmosphère à cette latitude, nous 
pouvons considérer que les particules de fluide sont assujetties à demeurer dans le plan horizontal (&, ê, ) 


. Les composantes de la force de Coriolis pour un mouvement plan sont alors (v, = 0 ): 


v, cos À—v, sin À —V —V 


} La } 
&e = 2x5 = 20 v, sin À = 2Qsin 4| v, |=f| v, | (69.92) 
V, COs À 0 0 


où f est appelé "paramètre de Coriolis". Donc la force de Coriolis en océanographie et en météorologie est 
traditionnellement notée: 


Fe = PA (69.93) 


Le nombre f, positif dans l'hémisphère Nord, négatif dans l'hémisphère Sud, varie de 0 à 1.458 aux pôles 
alors que la force est de l'ordre du millième de Newton pour les masses de fluide (courants océaniques) et 
du même ordre de grandeur (car la vitesse compense la faible densité) pour les gaz (courants 
atmosphériques). 


Nous appliquons maintenant l'approximation de l'équilibre géostrophique, c'est-à-dire que nous 
considérons que l'air est animé d'un mouvement rectiligne uniforme (vent géostrophique), en d'autres 
termes, nous négligeons l'action de la force centrifuge due à la rotation du tourbillon devant celle de la 
force de Coriolis due à la rotation de la Terre, ce qui revient à supposer que: 


f.væR.@? (69.94) 
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avec R étant le rayon du tourbillon et & sa pulsation. Puisque (cf. chapitre de Mécanique Classique): 
æ=v{ÀR (69.95) 


cette dernière inégalité devient: 


“1 (69.96) 
J'k 
où: 
V 
R, = (69.97) 
. 


est appelé le "nombre de Rossby" et n'a pas de dimensions. 


Remarque: Pour les moyennes latitudes ( 4 = 45°), l'expérience et les mesures donnent 
f = 107 [wi s] et v=10[#fs]. La valeur limite pour laquelle À, =1 est À = 100 [km]. Pour une 
échelle supérieure, comme c'est le cas pour les cyclones où À = 100 [km], nous sommes donc proche 


de l'équilibre géostrophique. Pour une échelle inférieure, Coriolis est négligeable et le vent est accéléré 
des hautes vers les basses pressions. 


Le nombre de Rossby représente donc le rapport entre les forces d'inerties et les forces dues à la rotation 
qui caractérisent le mouvement d'un fluide dans un repère tournant. 


Ainsi, nous pouvons faire la différence entre un écoulement géophysique à fort nombre de Rossby ou à 
faible nombre de Rossby. Si le nombre de Rossby est très supérieur à l'unité, alors les forces de Coriolis 
dues par exemple à la rotation terrestre sont négligeables devant l'inertie de l'écoulement. Dans le cas 
contraire d'un nombre de Rossby très inférieur à l'unité, les forces de Coriolis dominent le mouvement du 
fluide. 


Ainsi, si on se rapproche de l'équateur, f tendant vers 0 le nombre de Rossby devient très grand et aux 
pôles il devient respectivement très faible. 


Dans le cadre de cette approximation, notre équation d'Euler peut alors s'écrire sous la forme: 
Vpz o(8-à.)= e(g — 20 x5) (69.98) 


et puisque nous nous intéressons qu'au plan horizontal de l'atmosphère cela ce simplifie encore plus sous la 
forme: 


es 


 . Ty | 
Vip -p2(à x5),, =-0f (69.99) 


V, 


Soit totalement sous forme vectorielle développée et en reprenant la majuscule P pour la pression comme 
il est d'usage en météorologie: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


a? 
ox TV y 

= — 69.100 
op 2? ré ns 
9 y 


Il vient ainsi que: 


êP aP 


PAP tb, 2 ic 
_ efl&æ| of &| 


Vs 
dy dy 
soit: 
9P 
| 1} &x (69.102) 
v,) pf|_0P 
dy 
Donc sous forme conventionnelle: 
_0P 
” L 1 ln, 
x, -| | the: —5, x(VP) (69.103) 
v,] pÉ| & | ef 
êx 
La norme étant donnée par: 
y = DE -1&æ 1 op (69.104) 
ef £f & 
Soit: 
1 dP| 
V=———| (69.105) 
Lf dR 


relation qui est appelée "équation des vents (géostrophiques)". 
Quatre scénarios sont à considérer: 


1. Nous sommes dans l'hémisphère Nord et donc f est positif. Supposons que dP/dR soit positif, la pression 
augmente alors en s'éloignant du centre du tourbillon (qui lui est donc un minimum de basse pression). Dès 
lors v est positif et nous avons un tourbillon appelé "dépression" dans l'hémisphère Nord. Ainsi, le fluide 
(le vent) souffle autour de la dépression dans le sens antihoraire (vers l'Ouest) dans l'hémisphère Nord. 


Définitions: 
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D1. Une "dépression" (ou "basse pression") est une zone où la pression atmosphérique diminue 
horizontalement vers un centre de basse pression, c'est-à-dire un minimum local de pression. 


D2. Les systèmes atmosphériques intenses à circulation autour d'un centre fermé de basse pression 
(comme un aspirateur cela attire les nuages d'où le fait que les cyclones sont visibles sur des photos 
satellites) reçoivent systématiquement le terme plus général de "cyclone" ou de "cyclone tropical". 


Remarque: Nous associons les dépressions au mauvais temps, car la dynamique qui entoure une 
dépression présuppose l'existence de courants ascendants (peuvent difficilement entrer dans le sol 
donc la seule voie d'échappement est le haut!) qui provoquent des nuages et de la précipitation. De 
plus, le gradient de pression autour d'une dépression peut engendrer de forts vents. 


2. Nous sommes toujours dans l'hémisphère Nord et donc f est positif. Supposons que dP/dR soit cette fois 
négatif, la pression diminue alors en s'éloignant du centre du tourbillon (qui lui est donc un maximum de 
haute pression). Dès lors v est négatif et nous avons un tourbillon appelé "haute pression" dans 
l'hémisphère Nord. Ainsi, le fluide (le vent) souffle autour de la haute pression dans le sens horaire (vers 
l'Est) dans l'hémisphère Nord. 


Définitions: 


D1. Une "haute pression" est une zone où la pression atmosphérique augmente horizontalement vers un 
centre de haute pression, c'est-à-dire un maximum local de pression. 


D2. Les systèmes atmosphériques intenses à circulation autour d'un centre fermé de haute pression 
(comme un ventilateur cela rejette et disperse les nuages d'où le fait que les anticyclones ne sont pas 
visibles de manière simple sur les photos satellites) reçoivent systématiquement le terme plus général de 
"anticyclone”. 


Remarque: Les anticyclones généralement apportent du beau temps et des ciels clairs. La dynamique 
atmosphérique fait en sorte que l'air aux altitudes moyennes y est relativement chaud et sec, et donc 
sans nuages. 


3. Nous sommes toujours dans l'hémisphère Sud et donc f est négatif. Supposons que dP/dR soit positif, la 
pression augmente alors en s'éloignant du centre du tourbillon. Dès lors v est négatif et nous avons un 
tourbillon appelé "haute pression" (ou "anticyclone") dans l'hémisphère Sud. Ainsi, le fluide (le vent) 
souffle autour de la haute pression mais dans le sens antihoraire (vers l'Ouest) dans l'hémisphère Sud. 


4. Nous sommes toujours dans l'hémisphère Sud et donc f est négatif. Supposons que dP/dR soit négatif, la 
pression diminue alors en s'éloignant du centre du tourbillon. Dès lors v est positif et nous avons un 
tourbillon appelé "basse pression" (ou "cyclone") dans l'hémisphère Sud. Ainsi, le fluide (le vent) souffle 
autour de la basse pression dans le sens horaire (vers l'Est) dans l'hémisphère Sud. 


Remarque: Il est donc possible de dire de manière générale sur les grandes dimensions que le vent 
arrive des hautes pressions (Anticyclone) pour se diriger vers les basses pressions (Dépression). 


Voici un exemple d'une image de dépression (anticyclone) et haute pression (cyclone) dans l'hémisphère 
Nord tel que le représentent les professionnels de la météorologie: 
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Figure: 69.7 - Basse pression et haute pression 


Nous pouvons effectivement observer que la dépression (D) tourne dans le sens antihoraire et la haute 
pression (A) dans le sens horaire (et inversement dans l'hémisphère Sud). 


Remarque: L'air au centre d'un anticyclone (A) descend vers la surface, subissant une compression et 
par conséquent un échauffement. Pour une dépression (D), c'est le phénomène inverse qui se produit. 


8. MARÉES 


Parmi les phénomènes de la nature, la marée est l'un des plus majestueux par son ampleur et par sa 
puissance, l'un des plus surprenants par sa régularité et par la discrétion de ses causes. On comprend sans 
peine non seulement qu'il se soit imposé à l'attention des navigateurs mais encore qu'il ait, depuis la plus 
lointaine antiquité, suscité les recherches des savants les plus émérites. 


Pour aborder le sujet des marées de manière simple, nous pouvons partir d'un constat logique: Si 
l'attraction lunaire était identique en chaque point de la Terre, il n'y aurait pas de marées. Il faut donc 
aborder l'étude des marées sur les différences de forces. L'influence de la Lune sur la marée est appelée 
"composante diurne”. 


8.1. PREMIÈRE APPROCHE 


Considérons pour l'étude naïve du phénomène une masse d'eau m à l'équateur et aux pôles. Nous allons 
calculer la force d'attraction sur cette masse par rapport au centre de la Terre et en prenant en compte 
l'influence de la Lune de masse f;. 
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Terre 


Figure: 69.8 - Configuration Terre-Lune pour l'étude des marées 


Commençons par calculer la force À, à l'équateur au point le plus proche de la Lune relativement à la 
figure ci-dessus. 


Nous avons alors: 


M M (Ron) 
AF; = Fa = GE - GI =G pin 
(R-r) R R?(R-7r) 
(69.106) 
R?-R?+2Rr-7r°? 2Rr 


= GmM, = GnMs Er = 20OmMr = = 2 


RŸ-2R°r+ Rîr° 
en considérant que RA:- et en notant la "force de marée statique": 
r 
J = Gm — (69.107) 
R 
Une application numérique pour une masse m de 1 [Kg] donne: 


f=1.10 6 [#52] (69.108) 


Sous forme vectorielle nous avons bien évidemment: 


ET 


r 


(69.109) 


Æ 


Comme la distance Terre-Lune atteint environ 60 rayons terrestres, l'intensité de l'accélération varie à peu 
près linéairement (...) le long de la portion terrestre d'une droite passant par le centre de la Lune. C'est 
notamment le cas pour le segment qui relie les deux points antipodaux A et C de la figure ci-dessus. Nous 
pouvons donc écrire, O désignant le centre de la Terre: 


F,= À +AË, 


. E _" (69.110) 


Nous devons maintenant séparer les deux contributions de la Lune. 
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- La force F qui s'applique sur le centre de masse G est donc uniforme à la planète par construction. 
C'est cette force qui est responsable de la révolution de notre planète autour du centre de masse commun 


aux deux astres. 

- Le terme résiduel +AR, se superpose et prend des valeurs opposées aux antipodes. Elle est responsable 
des marées (en première approximation dans ce modèle simpliste). 

Ainsi, la force due à la Lune est de signe opposé sur l'horizontale. Nous avons alors deux marées (lunaires) 
par jour à des lieux antipodaux: 

- Celle de la Lune qui attire (de ce côté-ci de la Terre) 


- Celle de la Lune qui repousse (du côté opposé de la Terre) 


Soit sous forme schématique (sans aucun respect des proportions réelles): 


dé s 
Pod  . ; Le" 
d Orbite a 


f 5 
/ lunaire 
x 


Fond des \ 
océans et \ 
mers | 


5 
Ë 
CD 
Lai 
Ê 
ni 


\ Surface des 
Le 
\ océans et 
\ ners / 
\ / 


—— — 


Figure: 69.9 - Lieux antipodaux des marées 


Si l'on considérait la surface de la Terre comme parfaitement sphérique et recouverte d'eau, elle prendrait 
alors la forme d'une ellipsoïde dont l'axe serait dirigé vers l'astre générant la marée. Nous observerions 
alors des marées dont les pleines et basses mers auraient lieu deux fois par jour et toujours à la même 
heure. Nous appelons cette situation la "marée statique" et le modèle correspondant "modèle statique des 


marées". 
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Il convient de préciser que le jeu subtil entre la rotation de la Terre et la Lune produit des frottements 
gigantesques au niveau des masses d'eau qui ont pour effet de ralentir la vitesse de rotation de la Terre 
d'environ 1 seconde tous les mille ans. 


8.2. DEUXIÈME APPROCHE 


Pour la deuxième approche, qui vaut la peine d'être vue pour la culture générale et aussi parce qu'elle 
présente un autre aspect intéressant de l'explication de l'attraction entre deux astres, considérons le 
schéma suivant: 


Figure: 69.10 - Approche schématique de l'approche 


Nous avons démontré dans le chapitre de Trigonométrie le théorème du cosinus (formule d'AI-Kashi) qui 
nous donne: 


d?=a? +r? -2arcos@ (69.111) 


d'où le potentiel gravitationnel (cf. chapitre d'Astronomie): 


d 2 


d +r? — ar cos 8 (69.112) 


: 2rcos 8 


4 d 

Mais: 

Fr 

—<# 1 (69.113) 

e: 
et le potentiel gravitationnel est de la forme: 

l 
FX)=——— (69.114) 


V1+ x 


que nous pouvons développer en série de Maclaurin (cf. chapitre Suites Et Séries) jusqu'à l'ordre 2: 
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l l go , 1 1 2 
_ = += 0 À = (I 
f(x) Fe 0 017 Vo) * 17 () 7 (0x 
il 1 11 1 . 1 l ne 
= mm ———— (69.115) 
Ole 2eme 214 4m 2 
-1_11,,132 -1-1,,3,2 
O1 112 214 2 8 
Le potentiel gravitationnel devient alors: 
2 
CM 1 GM|,_1fr? _2rcos8) 3fr 2rcos8 
EE  —_ _— 1-— En _ 7 
a Sncde a 2l x a M a 
F8 
me a (69.116) 
GM 


+=| —-2 
2 a? æ 8 a & a? & 


1 rcos 8 E 2rcos8 r7 , 4r° e)] 


Si nous ne gardons que les termes de puissance 1 et 2 en r/a, il reste: 


CM Fr 
P= — Pre cer 3 = —— 


1+2 co 50 + — 
a 8 a 2 


a? 2 1 


1 r2 _ GM 


1 r? 1 3r? cos? | 


(69.117) 
GM 


a 2 #2 


& ä 


2 
ir | 3cos? g— I 


Le premier terme du potentiel est : 


GW 
=—— (69.118) 
& 


C'est le potentiel pour > = 0, c'est-à-dire le potentiel crée par la Lune au centre de la Terre. 

Ce terme ne contient aucune variable, il est constant et donc son gradient est nul, il ne donne lieu à aucune 
force puisque: 

F=-mY.g=0 (69.119) 

Le deuxième terme: 


CM 
=——rcos# (69.120) 
a? 


contient les deux variables r et 4. Son gradient ne sera pas nul. Il va générer une force de gravitation que 
nous allons calculer, mais en utilisant une astuce. 


Puisque: 


x=rcos@ (69.121) 
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Il vient: 


GW | 
P = x (69.122) 
& 


Dès lors, le gradient en coordonnées cartésiennes se réduit pour la masse dm se situant au point À à: 


= _ ) 8,\GM CM 
dE =-dmV.@ =-an| «Je --àn| «JE ren a? (69.123) 


dy dy a 0 


Donc tous les éléments de la Terre subissent de la part de la Lune des forces parallèles (selon l'axe X 
seulement) dirigées vers la Lune. La masse totale de la Terre est la somme de toutes ces masses et la force 
totale que subit la Terre de la part de la Lune est la somme des forces élémentaires. Donc: 


GM;\ (GMrMi 


F= 5 -amV.p, => dm a |= _ (69.124) 
( ( 


et donc la force totale est seulement selon l'axe X et est donnée par: 


_ GMrMi 


a? 


F, (69.125) 


Cette force est la même que si toute la masse de la Terre était concentrée au centre T 


et si toute la masse de la Lune était concentrée au centre L. La Lune subit de la part de la Terre la même 
force de sens contraire, c'est le principe des actions mutuelles. C'est cette dernière qui oblige la Lune à 
tourner autour de la Terre. 


Le troisième terme est celui responsable des marées: 


2 
= a 3cos% 4-1) (69.126) 


cd 2 a 


La force dérivant du gradient en coordonnées polaires étant donnée par: 


2) ] 
FE ne 2 
F=-m Fe -B=-Mm sé ra (69.127) 
12 19/74 2e 
r 08 r 08 


Donc, la composante radiale de la force est: 


2 
Be = 2 2 —— — — | 3cos° 9-1|= D [3cos? 8-1| (69.128) 
êr & à a? æ 


la composante orthoradiale: 
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2 G 
D Ch, 2 g-1]=- rep) g-1| 
r 08 (a: 2 D 28 


—7_|cos? 81 = Du d i—-2 cos 8 sin 8 = _. 8 sin 9 
2a 86 2@ & 


(69.129) 


Donc: 


GraMr (> 2 g-1 


- (E 
F = F = 30 (69.130) 
9 TT cos Bsin 8 
a 


Pour une masse m d'eau, la force de marée est: 


F=-mÿ.g (69.131) 
7 : : 
Pour 8 = SA la composante orthoradiale Æ; s'annule. Nous avons alors pour ces trois angles: 


Ga Mr 


2 F, — |3cos? 8-1] 
F = | & (69.132) 
® 0 
Pour 8=0 la force est uniquement radiale: 
E, nr e-1)=- 28 | 12 Aie (69.133) 
& & & 


Le signe de cette force est positif et il est dirigé vers la Lune. Pour 8= x la force est aussi uniquement 
radiale et on retombe sur la même expression: 


Æ PR ol PRE pi. 
æ æ æ 


Donc, l'amplitude est la même pour l'angle 8= 0 = x. 
Par contre, si le lecteur se rappelle que pour revenir en composantes cartésiennes nous avons: 


x=rcos 8 
| (69.135) 
y=rsin ê 


Nous voyons alors que pour 8 = 0, la force est orientée dans le sens positif de l'axe X puisque x sera 
positif (mais nulle selon Y). Il y a donc une marée dans la direction de la Lune (intuitif) 


Nous voyons aussi que pour 8= x, la force est orientée dans le sens négatif de l'axe X puisque x sera 
négatif (mais nulle selon Y). Il y a donc une marée dans la direction opposée à la Lune (contre intuitif). 


Pour 8= x} 2,37 f 2, la composante x est nulle et la composante radiale sera: 
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Cr [3cos? 8-1|= Cr 


La 
”. … 


(69.136) 


et elle est dirigée vers le centre de la Terre puisque: 


x=rcos8 
2 (69.137) 
y=rsin 8 


Nous voyons alors que pour #= x} 2, la force est orientée dans le sens positif de l'axe Y puisque y sera 
positif (mais nulle selon X). Nous voyons aussi que pour 8 = 3xr/ 2, la force est orientée dans le sens 
négatif de l'axe Ÿ puisque y sera négatif (mais nulle selon x). 


En réalité, les marées sont beaucoup plus complexes que le modèle ci-dessus (excentricité de l'orbite 
lunaire, superposition de la marée diurne, orbite lunaire, alignement Lune-Soleil, inclinaison du plan de 
l'orbite de la Lune, équinoxes, etc.). Voici une superbe animation de l'élévation de la surface des océans en 
mètre, sur 1 cycle de marée, calculée à partir d'un modèle plus élaboré: 


Figure: 69.11 - Complexité réelle des marées sur Terre (source: Wikipédia) 


Remarque: Le phénomène est donc dû à la déformation de la surface des océans par suite des 
attractions combinées des corps célestes. Ce mouvement peut même détruire l'astre qui le subit: si la 
force de marée l'emporte sur la force de gravitation de ses constituants, l'astre se désagrège. Cette 
limite où les forces de marées l'emportent sur la force gravitationnelle s'appelle "limite de Roche" (cf. 
chapitre d'Astronomie). 


Outre la marée diurne due à l'attraction de la Lune, il faut compter en plus sur une marée due à la force 
centrifuge du mouvement de la Terre et de la Lune autour de leur centre de masse (mais cela dépend des 
latitudes, du relief et de plein d'autres paramètres objectivement car sur certains endroits de la planète il 
n'y a qu'une seule marée par jour). Effectivement, la Terre et la Lune tournent autour du centre de masse 
qui définit l'orbite de couple Terre-Lune (les échelles ne sont pas respectées): 
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Force centrifuge 
du centre de masse 


Centre de masse et donc de 
rotation 


Orbite dite "Terrestre" 
considérée comme 
circulaire 


Figure: 69.12 - Principe des marées superposées aux marées diurne 
et nous ferons l'impasse sur les marées d'équinoxes et autres. jusqu'à ce jour... 


9. ÉQUATION DE LORENZ 


La "convection libre" ou "convection naturelle" est le régime d'écoulement obtenu lorsque nous chauffons 
un fluide sans qu'il n'y ait d'écoulement extérieur imposé. C'est le cas des mouvements de convections de 
l'atmosphère (gaz chauds dans gaz froids), des mouvements de convections de la roche en fusion 
responsable de la tectonique des plaques, des mouvements de l'eau chaude sous pression dans les geysers 
et de bien d'autres phénomènes... 


Ces écoulements sont inexplicables si nous ne couplons pas les équations de la dynamique et de la 
thermodynamique! 


Nous allons dans ce contexte établir le fameux système des équations de Lorenz au prix cependant de 
nombreuses approximations et hypothèses afin de simplifier au maximum les calculs et les outils 
mathématiques utilisés (car à l'époque du développement du modèle les ordinateurs n'étaient pas ce qu'ils 
sont aujourd'hui). 


Nous montrerons ainsi dans le cadre de la convection (une des dynamiques importante de notre 
atmosphère) que les équations qui déterminent certains paramètres du mouvement sont très sensibles aux 
conditions initiales ce qui a pour but de montrer la difficulté de la prévision à plus ou moins long terme 
avec des modèles théoriques déterministes (raison pour laquelle en météorologie il est fait usage de nos 
jours de la méthode des éléments finis). 
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A priori, la densité & est fonction de la température et de la pression par la loi d'état des gaz parfaits (cf. 
chapitre de Mécanique Des Milieux Continus). Il est donc naturel de penser que si nous chauffons une 
paroi, la température du fluide environnant augmente par diffusion. La stratification de pression s'en 
trouve changée, le gradient de pression crée le mouvement. 


Dans tous les chapitres du site, nous avons jusqu'à présent négligé toute variation de &. Mais le 
découplage n'est plus valable ici puisque c'est le chauffage qui provoque le mouvement. Nous allons donc 
permettre une variation de la densité avec le chauffage en supposant cependant que cette perturbation est 
petite. Il faut donc réintroduire une variation de © autour d'une position d'équilibre: le repos. En revanche 
la viscosité sera supposée constante. 


Soit donc un fluide au repos et à la température T,, au loin, il est en présence d'une paroi chauffée à la 
température 7, . Pour obtenir la dépendance de &, rappelons les coefficients thermo-élastiques classiques 


(cf. chapitre de Thermodynamique): 


- Coefficient de compressibilité (ou de dilatation suivant l'écriture en termes de densité) isobare: 


187 1 Me Li _ 
Te (69.138) 
VW OT Me 8T p8 


- Coefficient de compressibilité isotherme: 


14 __ 1 Me _ 18 
V &  Mp dP  pôP 


En admettant maintenant que la densité est principalement reliée à la température (pour faire simple) nous 
pouvons écrire (cette hypothèse marche bien pour les fluides mais pas trop... pour les gaz!!): 


2= f(T) (69.140) 


En utilisant la forme générale du développement de Taylor (cf. chapitre de Suites et Séries): 


d* 
f)= 2 . (x 


— x) (69.141) 
Nous avons alors c'est une approche à la façon ingénieur...: 


1 d* f(x) k d'OUTe) 
TT -TYŸ so t+T-Te = Do + (TT - To 
LE de T— To) = Po + } QT “tan ( } 


= Po (+7 -To))= Ro (1+ TT -T))= Po (1+ 7€) 


ET) = 


Soit: 


P= B(1+TE)| (69.143) 


où 7 est donc un coefficient sans dimensions (comme £.…..) plus facilement mesurable 
expérimentalement. 
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L'équation de continuité (cf. chapitre de Thermodynamique) ou de bilan de masse: 


PDG (o(T)-5) = 0 (69.144) 
devient alors: 
Gre IFTe _ _ n aT SAS — Q 14 
PT) (a (1476) 5)» ane LT - 2 (14 76)9 052 (69.145) 


au premier ordre en £. De plus, nous avons montré dans le chapitre de Mécanique des Milieux Continus 
que si le fluide est incompressible: 


Voÿ=0 (69.146) 
Retenons qu'en première approximation le fluide est incompressible. Il ne reste alors que: 


ae =0 (69.147) 
4 


Comme nous souhaitons étudier un écoulement en présence de gravité, il serait judicieux de poser: 
P=p+£00£8z (69.148) 


et donc de ne s'intéresser qu'aux variations autour de la position d'équilibre hydrostatique ($2 est sans 
dimensions!). Nous avons démontré toujours dans le même chapitre de Mécanique des Milieux continus 


que dans le cas du fluide incompressible avec viscosité, l'équation d'Euler de 1°" forme (équation du 
mouvement): 
pd,5 =-VP+ 4 VEv+ of (69.149) 
Intéressons-nous dans un premier temps aux deux termes: 
—ÿP+pf (69.150) 
qui s'écrivent selon l'axe Z: 
© p+pf Cie. O (69.151) 
—— = —— — (69. 
&z : 4 
Lorsqu'il y a mouvement, la projection suivant Z fait donc apparaître: 
2 P+pg (69.152) 
niss 0J.194 
&z 


que nous récrivons alors: 


(pra g)+oe=-ne 7 p + 0£ no (69.153) 
& & & 
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Soit: 
6] | 
A P+t(P-Re)e (69.154) 
puisque: 
(8- Po)= PoET (69.155) 
Il vient: 


Ge) oc 
TP + L0€18 (69.156) 
Il reste donc une force de flottabilité dirigée vers le haut. 
La variation de la densité en fonction de la température dans le produit &4,Y de la relation: 
pdÿ=-VP+of (69.157) 


sera négligée (,d,v = 6,4,v) car nous nous restreindrons au cas où la vitesse est petite. Nous avons alors 


en réintroduisant la viscosité…: 
Pod? = —Vp + 0 ETRE, + Hu V2v (69.158) 
et nous avons la dérivée particulaire (cf. chapitre de Mécanique des Milieux Continus): 
d,ÿ = (5 o V)5+ 8, (69.159) 
soit aussi une autre relation utile: 
d,=voV+8, (69.160) 


Nous avons alors comme expression de la densité de force: 


Fa (5(5 o ÿ) +8,ÿ) = —Vp+ Pa ETRE, + 4 V2v (69.161) 


Pour continuer, nous allons chercher à déterminer la loi d'énergie de l'équation de comportement 
démontrée dans le chapitre de Mécanique Des Milieux Continus: 


2 s ——— 
Ty =-pô,- SH (Voÿ) 4, +248 (69.162) 


pour qu'elle rende également compte de la relation entre les contraintes et les caractéristiques 
thermodynamiques du fluide, comme le flux de chaleur et la température. Nous allons le faire en 
caractérisant la diffusion de l'énergie dans le milieu due aux effets (supposés découplés) de la viscosité du 
fluide et de la conduction thermique du fluide. 


Nous réécrivons cette relation avec de nouvelles constantes et une autre notation pour la divergence: 
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y = pô; + Adiv(v)à, +24438; (69.163) 


où {,, A] sont dans ce contexte appelés les "coefficients de Lamé”. 

Nous avons aussi démontré dans le chapitre de Mécanique des Milieux Continus la relation: 
od,ÿ =V(à &)+ef (69.164) 

Soit: 


p((5°v)5+a5 s)= Va &)+pf (69.165) 


Ce qui donne: 


ee 
+ 
Le) 
FT 
Ÿ 
La] 
<t 
LL. 
<} 
Il 
<t 
FT 
1 


)+28 (69.166) 


Notons l'énergie totale comme: 


Ë, 


2=E,+U= Ê dé el 157 +e)ar (69.167) 

où e est l'énergie interne massique du fluide (rapportée donc à une unité de masse de fluide). Or la 
variation instantanée d'énergie interne du fluide est égale à l'apport d'une puissance mécanique et de 
l'apport de chaleur (selon ce qui a été vu dans le chapitre de Thermodynamique): 


d l aW à 
IE +e jer- + p+0 (69.168) 
dé : 2 dt à 


où P donne la puissance des efforts extérieurs au système donnée forcément par la force du champ de 
potentiel environnant et des forces mécaniques données par le tenseur des contraintes uniquement (nous 
sommes toujours dans la situation d'un fluide parfait...). Soit: 


P= [ PE °vdV + [ (oÿ)aË (69.169) 
D D 
et en utilisant le théorème d'Ostrogradsky (cf. chapitre de Calcul Vectoriel)}: 


P=[o(ge5)ar +[(Voaÿ)a” =[0(2e5)a47 +[av(oÿ)ar 
D D D D 

e(cv,) (69.170) 

= [Les o5+div(oÿ) ]ar = [logv, + = ar 

D D 6x, 


ce qui a bien les unités d'une puissance et nous avons bien: 
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Gi 2 3 


D Gi + Gi2V2 + Gi3Vs 
div(aÿ)} = Vo T] Ta T3 Le = Vo TU +TnVa + T3 
Le) 


Ty To y Ta + TV + TasVa 


2(Gm + G2v2 +3 ) " (SM + TV + Ov) : (Sy + 3V2 + sav) (69.171) 
x 0x 0x3 


Pour la puissance chaleur @ c'est très facile aussi grâce aux développements que nous avions fait dans le 
chapitre de Thermodynamique où nous avons obtenu l'équation de la chaleur: 


+78, =4+vo®, = 0 (69.172) 
f 


Soit: 
Q = Jaar = -| Vo®,dÿ (69.73) 
D D 
Nous avons finalement: 


d tf1- - à 
a ef(2s +e)ar » fLos+ dv(os)jar - [rever 
(69.174) 
= [og +aiv(av)- Vo, [a 
D 


Donc tout cela nous donne alors l'équation de l'énergie d'un fluide: 


dfl- ; Là 
PES +e)= 085 +dv(05)-008, (69.175) 


dt 2 

Soit: 
po 4 pg5 + dv(05)-Vo$ (69.176) 
dt 2° df * 


et comme (cf. chapitre de Thermodynamique) le flux de chaleur suit la loi de Fourier: 
P,=-«'V:T (69177) 


Nous avons alors: 


de 1 dÿ° à - - 
pts peÿ +div(aÿ)-Vo[-kVT) (69.178) 


Soit en utilisant la définition du laplacien d'un champ scalaire: 
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de 1 d° oo 
P— +0 — = 080 + div(ov)+kV<T 
dt 2 dt Hi] 
de 1 à (vv,) 0Gv, aT 
— +0 — << = pg,v, + + — 
dt 2° di 8x; x 
(69.179) 
Maïntenant, en faisant le produit scalaire de: 
pd,ÿ = V(&)+,908 (69.180) 
avec la vitesse ÿ nous obtenons le bilan de l'énergie cinétique: 
podÿ=voV(a)+@og 
V.Y. 1 à (my | 0; [2] 
vid, = O4, pa oi : : UT, PE: 
(69.181) 


En soustrayant [2] de [1], nous obtenons une relation locale de l'énergie interne spécifique e: 


PT = vo 0(8)+div(ov)+<V°T 

de 09; (a, } ) (69.182) 
Ê8— = —Y,; ———— + 

dt 8x, &x, Px, 


Or, nous avons aussi (dérivation d'un produit): 


dr, ac. 
av) où, 2 (69.183) 
8x, : x; ° 6x; 
Soit: 
| &,v, 8. ; 
Ld 5) 2, (69.184) 
x, 6x; , x; 
Effectivement: 
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2(av,) _ 8(Giu + Gi2v2 + Ga) " On + pv + Env) L O( TN + pv + vs) 
0x 07% x) 0x3 


Gen Ge Bar En 
= non ga + GE + Ga 5 GE + Oo 
1 1 1 1 1 À] 
ôT. dv. 
+ 21 + ou + en. de + —E + ox — 
2 0x) x 0x) x x 
Ein Ga 
+ Lo po 200 po 22 pu 208 0 28 
e) à 3 à 3 x; 0x; 0x; 
(69.185) 


Nous avons donc: 


Nous avons donc: 


Ce qui est parfois noté: 


PT =o:D+KV?T (69.189) 
? 


où n est appelé "tenseur des taux de déformation" et à: D représente le produit doublement contracté 
du tenseur des contraintes et du tenseur des taux de déformation. 


Nous avons montré dans le chapitre de Mécanique des Milieux Continus: 


2 à = Fos 
C=-pêy Hi (Pos) +28, =-pa +2u(a -5(Ver)a ] (69.190) 


T= 2/4 (a _ (F5) à | (69.191) 


Ainsi, il est simple de différencier forces normales et forces tangentielles. Bref pour en revenir à l'équation 
de l'énergie: 
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PT =0:D+xV?T (69.192) 
£ 


Nous avons donc: 
de 1 2 
pr = Pa D+ 2 &--(Vor)a, D+#V°T (69.193) 


Mais dans notre cas: 


8; = D (69.194) 
Soit: 
de ls 2 
PT = -Pédy +24 dy-Z(Veÿ)a, dy +kV°T (69.195) 
Mais nous avons: 
Ê,dy = dÿ Hu. — en = D... (69.196) 
21 6x Gx,) &x, 
Nous avons donc: 
PT =-p($ 05)+ 2uyd, 4 + Le (F5) +KVÊT (69.197) 
dt 3 
Soit sous forme technique et condensée: 
de s 2 
— Voy]+2;% DD+A[Vov] +£&V*T (69.198) 
PE = -p(Ve5)+24DD+A(705) 


Il est clair qu'au niveau de l'entropie, nous avons: 
= J'esar (69.199) 
D 


Nous avons aussi: 


dU = TaS - pdV = 48 = + (69.200) 


Soit réduit au rapport massique: 
ds = L+ — PTds = Pde+ ep.dW (69.201) 


La variation temporelle donnant: 
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ds de dm 
ET — = p—+p,, nn (69.202) 


Or, nous avons l'équation de continuité (cf. chapitre de Thermodynamique): 


..… PE o{mŸ) (69.203) 
dt dt 


Ce qui nous donne finalement: 


ds de 


PT er +pVoÿ (69.204) 
ou autrement écrit: 
PT = PTE pVoÿ (69.205) 
Injectée dans: 
de s — = 12 2 
pe -p(Vo5)+2uyd;d, +A(Voÿ) +4&V2T (69.206) 


Cela donne: 


TE 2 Had, +4(V05) +4V2T (69.207) 
? 


Si nous considérons le gradient de vitesse comme étant très faible (quasi-statique) nous pouvons alors 
écrire l'approximation: 


ds 2 2 
T—2= 02 d. | +4&W°T (69.208) 
8 dt PA ) 


Maïntenant donnons l'expression de l'entropie (différentielle totale exacte) en fonction des paramètres de 
température et de pression seuls: 


s-[à) aT(à) dP (69.209) 
at), æ ), 


soit sous forme massique: 


a-(À) ar(à) dP (69.210) 
OT }p dP /r 


Or nous avons démontré dans le chapitre de Thermodynamique la relation suivante: 


(à) -c-(#) (69.211) 
OT }p OT /p 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


soit sous forme massique: 


Ce qui nous donne: 


à -Gars(à) dP (69.213) 
T a), 


Or, nous avons démontré avec dans le chapitre de Thermodynamique une des relations de Maxwell: 


(Te) S) 
—| =-|[— | (69.214) 
8T), Ve), 


soit sous forme massique: 


d'où: 
Cp 

ds=——àT-|—— | dP (69.216) 
P 

Soit: 

87 T 2) | 

Ts = àT-0T| | d4P- AT -—| | dP (69.217 
PIS = € p 8 E ] £Cp (2 : ( ) 


Soit notre relation: 


ds 2 2 
T—=2 d:] +4&V°T (69.218) 
8 di Ha | .) 


peut alors s'écrire: 


äT Tfdo\ dP_ 2 2 
per T-T(E) Seule) +AVÉT (69.219) 


Si nous admettons que la variation de la densité avec la température est faible, nous avons alors à l'échelle 
atmosphérique : 


ds. 2 2 , 
otre TE ik (4) +4V<T (69.220) 


et en se rappelant que: 
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d,=%0o%+8, (69.221) 


Il vient finalement: 


Pacp(FeV+8,)Te 244 (dy Ÿ +<V2T| (69.222) 


Nous avons maintenant deux équations importantes: 

Po ((FeV)5+8,5)=-Vp+ 06728, + a V°v 
(69.223) 
. 2 
Pacp(FoV+0,)Te 24 (d;) +4V?T 


Soit: 


Lo Le (69.224) 
Pacp(FoV+8,1T= 23 (a,} +4&VŸT 


Examinons maintenant rapidement le problème de Rayleigh-Bénard qui consiste en deux plaques limitant 
un fluide une étant plus chauffée que l'autre. 


Nous pouvons alors observer des rouleaux longitudinaux parallèles dans un film de fluide visqueux (huile 
de silicone) maintenus entre deux plaques à une température chaude en bas et froide en haut. Voici une 
photo de ces rouleaux vus de côtés: 


Figure: 69.13 - Rouleaux de convection de Rayleigh-Bénard (instabilité) 


vue de dessus: 


Figure: 69.14 - Instabilités de Rayleigh-Bénard vues du dessus 
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Il s'agit d'un problème de convection naturelle: le fluide chauffé en bas se dilate et remonte entraînée par 
la force d'Archimède, arrivé en haut il se refroidit et retombe. C'est ce mouvement qu'il faut expliquer qui 
est similaire à celui de l'atmosphère terrestre 


Nous remarquons également que les mouvements de convection se font approximativement selon un tore 
(voir la photo vue de côté). Nous pouvons tirer parti de cette symétrie pour simplifier l'analyse. 


Considérons donc une boucle verticale de fluide circulant à vitesse constante (donc sans trop de 
turbulences...): 


Froid 


qay 


Chaud 


Figure: 69.15 - Boucle verticale de fluide avec gradient 


La configuration sera imposée comme étant la suivante: 


G-T 
Froid 


Chaud 
G+A 


Figure: 69.16 - Configuration imposée pour le modèle théorique 


où 7, est la température moyenne du fluide (attention: ne pas oublier que ce n'est pas une grandeur 


extensive!) et où nous avons indiqué respectivement les températures à l'intérieur du tore et à l'extérieur 
(soit de l'environnement) qui peuvent toutes varier en fonction du temps. 
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Nous voyons que la différence de température est de 27; entre le haut et le bas et de 27; entre la droite et 


la gauche. 


Nous posons que la température varie linéairement avec la hauteur (ce qui bien évidemment est faux dans 
un modèle atmosphérique…): 


Z 
Tr=%-A-=1+hcos$ (69.225) 
[a 
Nous remarquons qu'il possible de paramétrer la température le long de l'intérieur du tore avec la relation 
suivante (équation paramétrique du cercle): 
ÂT=T-T=Tcosf#+7sin# (69.226) 
Nous avons alors conformément au schéma: 


T(0)=Z cos0 +7, sin 0 = 7, +7, 
T(D = Bcosn+Tsinm=-7 +7 (69.227) 


Ceci étant posé, revenons à: 


ee + ETE + a V2y (69.228) 


SR … 


Nous allons passer ce système en coordonnées polaire correspondant le mieux à la géométrie de notre 
problème. Rappelons d'abord que dans terme: 


(5'e v)5" (69.229) 


l'opérateur différentiel *; est la divergence. Or, nous avons démontré dans le chapitre de Calcul Vectoriel 
que celui-ci s'écrivait alors en coordonnées polaires: 


Or, si nous nous basons sur l'hypothèse que dans le volume du tore, la vitesse ne varie ni en fonction de 
l'angle, ni à l'intérieur du tore (donc ne varie pas selon le rayon r) alors en coordonnées polaires: 


COUDE O (69.231) 


Nous avons alors: 


a = LR A +ETe + g2, (69.232) 
8 


co co 


Nous allons réduire l'analyse à une seule dimension qui sera celle comme quoi le phénomène ne dépend 
que de l'angle. Nous avons alors en coordonnées polaires et en explicitant tous les termes: 
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où nous avons fait par la même occasion la projection selon l'axe z tel que: 
&=ge, =gsing# (69.234) 


Le coefficient différentiel du dernier terme va nous embêter. Nous le remplaçons par un coefficient que 
nous supposerons constant et qui s'oppose au mouvement tel que nous ayons: 


1 
8,v = tee (TR }sin g—IV (69.235) 


Per Ô 


Ou plus explicitement: 


8,v= _ 1 + + ge(Z cos #+ 7 sin #) san @—IvY (69.236) 
Per 0 


Nous intégrons maintenant l'ensemble sur l'entier de la boucle en fonction de #. Nous avons alors: 


f av dÿ=-— LI? Laptee( (Z cos sin #+ 7 sin #)dg- r] WP 
ae 
= 
Nous avons alors le terme pression qui disparaît, car il n'y a pas de gradient de pression au long de la 
boucle. Ainsi: 
24 
26,v = eg | (Ts cosdein d+ Tin f)d #22 v (69.236) 


0 


Nous avons ensuite (cf. chapitre de Calcul Différentiel Et Intégral): 


24 
[ cos fsin = 0 (69.239) 
0 
et: 
2% 
[ sin? gdÿ=7 (69.240) 
0 


Il nous reste donc: 
278,v = eg; - 27 V (69.241) 


Soit: 
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T 
8,v = £g _ —Iv (69.242) 


Nous voyons dans cette équation que le mouvement est piloté par la différence de température horizontale 
T;. 


Maintenant, revenons sur: 


l'a 
= tr (69.243) 


L # 2 2 
a,T+500T= 8 (a) eve 


Lo€ p ; 
Si nous négligeons les forces tangentielles à l'intérieur de fluide, nous avons alors: 
8,7+ÿoVTæ DVÈT (69.244) 
où D est le coefficient de diffusion thermique (cf. chapitre de Thermodynamique). 
En coordonnées polaires cela se réduit à: 


1 8 1 
OT +v-—T=D-——T (69.245) 
La 


0$ r of 


et nous allons aussi faire une autre approximation: 
v ôT 
O,T+-—2=XT (69.246) 
r 0$ 


Et nous avons les deux relations: 


Tr = + cos 
(69.247) 
T-7 = 8 cosf+7 sin Ÿ 
En soustrayant: 
Tg-T=(R-T)cos#-Tsing (69.248) 


Soit: 


a+ [(A-Z)cos #-T sing] (69.249) 
Fr 


et encore: 
8,(+Zcos+T;sin PEUR +T, cos #+T sin #)= K(T-T,\cos#— KT; sing (69.250) 
r 


Soit: 
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co + sin g+® TIR Le K(Z- T cos $- KT; sing (69.251) 


Après dérivation: 


àT- àT; 
De 05 #4 sin #— TT; sin #4 LB cos = K(Z- T cos $- KT; sin g (69.252) 
Ê dé 


Nous regroupons les termes: 


dT,  vT: B 
RE Le 64 [TE 27 |sn ge K(G-T)cos#- KTssing (69.253) 
r 


Nous avons alors les trois équations différentielles suivantes qui gouvernent la dynamique du système: 


at, VB. 
—<+—2z KIT -T 

BE rm -7) 

dt v 

23 Vr __yr (69.254) 
d r° 4 

dv a 

ARE à 

FRS 


Nous terminons les multiples simplifications en posant….: 


nO=7-20 


Ce qui nous donne: 


27, A(R- RC) 47e y VE 


dé dé dé 

48 __yr 4 4e. VE _ VI (69.255) 
dé Fr Fr 

Le = nn. -[Iv 

dé ë 


En remettant cela au propre: 


dv T; 
—=—-]v+ — 
m7 °89 
dé r r 
de _ gp à VE 
dé Fr 


Maintenant, introduisons les variables sans dimensions suivantes: 


pav yes 9 8€ hp (69257 
rk 2rl K 2rI K 
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où nous pouvons assimiler: 

- X à la vitesse adimensionnelle 

- Ÿ à la différence adimensionnelle de température entre courants ascendants et descendants 
- Z à la déviation adimensionnelle de l'équilibre de convection. 


Nous avons alors effectivement: 


al 
rk -rv,r get 
dtK KrK Ko2rlK 
a( geT; | 
2rTK) ge A BE v gel % (6929 
diK 2rIK 2rlKrK 2rlKrK 
a[-2€% 
2rTK)/. El . 887 v 
dt& 2rlK 2rlKrK 
Soit: 
dE LD Y+Prr 
dt' 
2 pipe (69.259) 
di” 
CRUE à 
dt' 


De manière encore plus condensée et traditionnelle: 


X'=Pr(7 -X) 

F'=rX-YF-XZ]| (69.260) 

Z'=-Z+FX 

où nous avons: 
Hal À 
nee Po r 0 - Ha Pa CP o26n 
K 1 P Pot « « 
F af Pop 


ce qui correspond au "nombre de Prandtl" et: 
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F 
1 1 73 
— E —Z 
rTK u 1 F 2 F 2 LD (69.262) 
2 ED) D] — 
Po (r 86 of 


ce qui est assimilé au "nombre de Rayleigh". 


Ce système de trois équations est essentiellement le même que celui du célèbre système de Lorenz. À une 
différence près, le système de Lorenz (réel) contient un facteur b dans la dernière équation (ce qui change 
peu de toute façon le résultat puisque l'on obtient quand même un attracteur étrange au bout du compte 
comme nous allons de suite le voir): 


= pyrinr 

d£' 

ar =} +rX — XZ (69.263) 
dé' 
az 


= —b2 +1X 


Pr, Re et b sont strictement positifs, et on pose souvent Pr = 10,7 = 28, = 8/3 où le nombre de Prandtl 
correspond à la valeur de l'eau. 


Les équations de Lorenz décrivent les phénomènes de convection d'un fluide idéal à deux dimensions, 
dans un réservoir chauffé par le bas. 


Nous voyons par cette démonstration que contrairement aux dires non démontrés sur Internet que: 
1. Le système n'est de loin pas simple mathématiquement et est très approximatif 


2. Qu'il existe des systèmes vraiment plus simples et eux aussi chaotiques (cf. chapitre de Dynamique des 
Populations). 


L'intérêt des équations de Lorenz réside cependant dans la sensibilité aux conditions initiales et à la 
convergence des variables adimensionnelles. 


Voyons un exemple avec Maple 4.00b: 

>with(DEtools): 

>lorenz:=diff(x(t),t) = 10*(y(t)-x(t)),diff(y(t),t) = 28*x(t)-y(t0)-x(0*z(t),diff(z(t),t) = x(t)*y(D-8/3*7(t); 
>DEplot3d({lorenz}, [x(t),y(t),z(t)], t=0..100, stepsize-0.01, [[x(0)-10, y(0)-10, z(0)-10]], orientation= 
[-35,75], linecolor = t, thickness = 1); 


Ce qui donne pour les 100 premières unités de temps adimensionnel: 
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Figure: 69.17 - Espace des phases du système des équations de Lorenz 


Ou pour les dix premières unités de temps adimensionnel: 


Figure: 69.18 - Espace des phases du système des équations de Lorenz 


Bon jusque-là on s'en rend compte que les paramètres adimensionnels tournent autour de deux points que 
nous appelons les "attracteurs étranges". 


Définition: Dans l'étude des systèmes dynamiques, un attracteur (ou ensemble-limite) est un ensemble, 
une courbe ou un espace vers lequel un système évolue de façon irréversible en l'absence de perturbations. 


Maintenant toujours pour les mêmes valeurs du temps adimensionnel, nous prenons x{0) = 10.1, soit un 
changement relativement faible des conditions initiales. Nous avons alors: 
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Figure: 69.19 - Petite variation dans les conditions initiales 


Nous remarquons donc que le phénomène n'est plus vraiment semblable. 


Considérons par exemple la variable x en prenant comme condition initiale x(0 = 10,y(0) = 10,z{0 = 10 
puis x{0) = 10,y(0) = 10.1,z(0) = 10 soit une légère variation de 0.01 sur la valeur de y{0). 


Soit dans Maple 4.00b: 


>DEplot({lorenz}, [x(t), y(t), z(t)], t=0..15, stepsize = 0.01, [[x(0)-10, y(0)-10, z(0)-10],[x(0)-10, 
y(0)=10.01, z(0)-10]], scene = [t,x], linecolor = [blue,green], thickness = 1); 


15 


10 


À VU MIN 
| | 


& 


10 


Figure: 69.20 - Analyse de la variable adimensionnée x pour une faible variation des C.I. 


Nous voyons que le système se décale assez rapidement du modèle initial alors qu'au début il reste 
identique mais la forme globale reste. 
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Autre chose. suivant les paramètres le système peut converger. Effectivement, en changeant le facteur 28 
par la valeur 22 nous avons par exemple (convergence à gauche): 


Figure: 69.21 - Convergence du système 


ou avec la valeur 19 le résultat est encore plus trivial: 


Figure: 69.22 - Convergence directe 


ou encore avec une valeur proche de 1: 
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8 
10-4 
Figure: 69.23 - Encore plus rapide 


On remarque un dernier cas intéressant, c'est que si le nombre de Prandtl vaut 1 alors le système est stable: 


Figure: 69.24 - Stabilité du système 


Cette sensibilité aux conditions initiales, ainsi que la forme de l'attracteur étrange de Lorenz a amené les 
météorologues à faire une métaphore avec la phrase suivante: le battement d'ailes d'un papillon au Brésil 
peut-il provoquer une tornade au Texas? (en taisant la dissipation de l'erreur dû aux échelles 
considérées...). 


D'où la dénomination par la suite de "effet Papillon" pour l'étude de l'attracteur de Lorenz appelé aussi 
dans le domaine le "papillon de Lorenz". 
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10. VAGUES 


Quand on se retrouve sur un bateau, le mouvement de l'eau rend beaucoup de personnes malades. C'est 
aussi le cas quand on se trouve dans la galère de calculer ce type de mouvement... En effet, les vagues 
dans l'eau ne sont ni des ondes transversales, ni des ondes longitudinales. Elles sont un peu des deux. Les 
particules d'eau décrivent des cercles ou des ellipses, dans un plan vertical parallèle au déplacement de la 
vague. Le gros problème est qu'une des conditions limites se trouve à la surface de l'eau et que l'on ne sait 
pas où se trouve cette surface. C'est précisément une des inconnues. 


Le problème est assez ardu pour que ce calcul ne figure pas dans les ouvrages de physique générale ou 
spécialisés francophones. Nous avons alors tenté de l'inclure ici en simplifiant énormément et en ne 
gardant que les cas les plus simples. Le calcul qui suit peut être pris comme exemple de la façon comme 
les physiciens se simplifient la vie en faisant des approximations et aussi comme exemple magistral d'un 
phénomène banal mais complexe à modéliser. 


Nous ne calculerons pas l'équation d'onde. Nous devons calculer le mouvement des particules depuis la 
surface jusqu'au fond de l'eau, puisque le mouvement s'étend jusqu'au fond. Mais comme les particules 
décrivent des ellipses, il faut au moins deux variables par point: il nous faut un champ vectoriel. Nous 
calculerons donc le champ vectoriel des vitesses des particules, mais nous ne le calculerons pas 
directement. Ce que nous allons trouver, c'est un potentiel scalaire de vitesses dont le gradient sera le 
champ vectoriel de vitesses. 


Un dernier mot sur les ondes que nous allons calculer. Ces ondes s'appellent "ondes de gravité", parce que 
c'est le poids de l'eau qui sert de force de restitution pour faire descendre les sommets et remonter les 
creux. 


Je tiens à remercier Monsieur Louis Peralta pour sa maîtrise mathématique et sa pédagogie sans qui ces 
développements passionnants n'auraient jamais pu être présentés sur le site web. Je lui suis redevable, avec 
son accord, d'un copier/coller de 99% de son support de cours. 


Nous allons faire des calculs dans le cas le plus simple: des ondes dans un canal rectiligne de section 
rectangulaire et de largeur et profondeur constante. Ceci réduit les dimensions du problème à deux 
(puisque la troisième à un profil identique de vague quel que soit l'endroit où l'on se positionne en largeur): 
la profondeur et la direction d'avance des vagues. Bien entendu, nous négligerons la friction sur le fond ou 
les parois du canal et. bien d'autres choses. 


Le système de coordonnées choisi est alors: 
- x horizontal, positif dans le sens d'avancement des vagues (sens de la longueur du canal) 


- y horizontal dans le sens perpendiculaire à l'avancement des vagues (sens de la largeur du canal). Encore 
une fois, aucune variable ne dépendra de y pour les raisons déjà susmentionnées 


- Z Vertical et positif vers le haut. Le zéro étant choisi à la surface de l'eau non perturbée. Sous l'eau, z sera 
donc négatif. La profondeur du canal étant h, le fond de l'eau se trouvera alors à z = -% 


Maintenant, rappelons que nous avons démontré après de très longs développements dans le chapitre de 
Mécanique Des Milieux Continus, que si le fluide est incompressible (divergence du champ vectoriel des 
vitesses est donc nul %;.ÿ = 0 ) et que la viscosité dynamique l'est aussi, nous avons alors l'équation 


d'Euler de 1°" forme: 
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pd$=-Ÿ.p+of=-V.p+oU=-V.p-pog (69264) 


car U est pour rappel le potentiel scalaire du champ gravitationnel. 


Ce que nous écrirons explicitement sous la forme suivante dans le cas de notre étude des vagues: 


es 


d,v = ur V:p+poU] (69.265) 

2 
Avant de continuer, nous allons changer la forme du terme 4, qui est une dérivée totale et non partielle. 
Examinons une des deux composantes (x ou z) de ce terme. Prenons la composante x du vecteur vitesse et 
utilisons ce que nous avons vu dans le chapitre de Calcul Différentiel Et Intégral (nous avons omis la 
composante y puisque le système n'en dépend pas): 


of of 
dfix y)= dx +=à 69.266 
f(x, y) _ > D «| ) 


Nous avons dans notre situation: 


Ein R0 . 
dV, (2,26) = — dt+—dx+—dz (69.267) 
x 4 


Il vient alors: 


dv 


x 


Ov, dt Ov, dx Ov, dz ©, ©, , Se 
= — + — + — = = Le e. Ve (69.268) 
dt Œ dt Ox dt Oz dt © x (24 


Le premier terme 4,v est un terme linéaire, par contre les trois autres sont des termes quadratiques (car ils 


comportent le produit d'une vitesse par la dérivée d'une vitesse) qui sont une infection dans tous les calculs 
formels. Nous allons donc limiter nos calculs aux cas où ces termes quadratiques sont négligeables devant 
les termes linéaires (ce qui signifie implicitement la vitesse doit varier très peu sinon quoi cette hypothèse 
n'est plus valable). Avec cette restriction, nous avons alors: 


D 
—Z— (69.269) 
a 
Nous pouvons alors écrire: 
a 1,5 . 
Lénine (69.270) 


Nous allons rajouter une restriction supplémentaire à nos calculs. Cette restriction consiste à imposer que 
le rotationnel de la vitesse est nul: 


Ÿxÿ=0 (69.271) 
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Cela revient à dire, comme nous l'avons vu dans le chapitre de Mécanique Des Milieux Continus, qu'il n'y 
a pas de tourbillons dans l'eau. Nous avions déjà imposé que la vitesse était nulle dans le sens des y, ce qui 
empêche les tourbillons verticaux (axe de rotation vertical). Maintenant nous éliminons la possibilité de 
tourbillons avec l'axe de rotation horizontal. Ce n'est pas, en fait, une trop grande restriction, nous savons 
qu'un objet abandonné aux vagues ne tourne pas sur lui-même à moins d'être pris dans des rouleaux. Dans 
les cas que nous allons calculer, les amplitudes sont limitées, nous sommes dans le cas linéaire et, surtout, 
pas dans celui des rouleaux. 


Nous avons démontré dans le chapitre de Calcul Vectoriel que lorsque le rotationnel d'une variable 
vectorielle est nul, la variable peut être exprimée comme le gradient d'un potentiel scalaire: 


ro grad(fr]=Vx(Vf)=0 (69.272) 


Il vient alors que nous pouvons écrire: 
F=Ÿ# (69.273) 


Nous avons alors: 
fais 1,23 
8,1V#)=-—{V.p+00) (69.274) 
2 
Ce qui peut s'écrire: 
. 1 ” 
Y. [a+ — p+ œ) = 0 (69.275) 
2 


Cette équation tient lieu d'équation d'onde, même si elle ne décrit pas directement la position ou la vitesse 
des particules. Une fois résolue l'équation et la fonction #{x,z,f) trouvée, nous pourrons déduire les 


vitesses: 


(69.276) 


Il ne faudra pas oublier que puisque la divergence du champ vectoriel des vitesses est nul: 


er 


Vor=V.p=-0=V(V#=V2#= AS (69.277) 
donc le laplacien scalaire de # est nul: 
g 9 
Ag=—"+—"=0 (69.278) 
x? &° 


Soit: 
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$ _## 


ÿ (69.279) 
2 


RÉ & 
avec —} <z <0. 


La solution doit satisfaire des conditions limites. La plus évidente est que la vitesse verticale doit être nulle 
au fond de l'eau. 


LUS O (69.280) 


Pour trouver les conditions limites à la surface, nous allons définir la variable £{x,f) qui est égale au 


déplacement vertical d'une particule d'eau située à la surface de l'eau dont la position d'équilibre (en 
absence de vagues) est x (à ne pas confondre avec l'autre x!). La hauteur de la surface de l'eau, mesurée 
par référence au niveau de l'eau sans vague, sera donnée donc par #(x,f). Ainsi, la vitesse verticale v, à 


la surface de l'eau sera: 
y. = =—Z (69.281) 


C'est une astuce très subtile et pas évidente du tout à anticiper! 


À la surface, nous pouvons considérer que la pression p est toujours égale à la pression atmosphérique 
pour toutes les positions en x et en £#. Dès lors, à priori rien ne changera si la pression atmosphérique 


change, et il est plus commode de la considérer nulle. Avec ceci, l'équation: 
- l 
V.|8,g9+—p+g |=0 (69.282) 
2 


Devient: 
V.(8,g+gzi=0 (69.283) 
Dont nous déduisons: 
0,$=-gz (69.284) 
Si nous nous plaçons à la surface, ce qui correspond à z = 0, la relation précédente devient: 
0,$=-gé (69.285) 


et en dérivant cette dernière relation par rapport au temps, nous obtenons: 


ok 


2 
5) ÿ _ 26 (69.286) 
2 8t 


puis en utilisant la relation démontrée juste plus haut: 
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V, = =—— (69.287) 


Il vient: 


ï 
$ ad (69.288) 


Résumons les conditions que le potentiel scalaire # doit satisfaire: 


æ 2 
 ” —h <z <0 
x 74 
96 _ z=-k (69.289) 
4 
2 
84 (r4 


Nous allons chercher seulement des solutions du type séparable (cf. chapitre de Calcul Différentiel Et 
Intégral). C'est-à-dire que #, qui est une fonction de x, z et t pourra s'écrire comme le produit de trois 
fonctions qui dépendent, chacune, d'une seule variable. De plus, nous travaillerons seulement en régime 
sinusoïdal (une intuition. de l'observation du réel) et en utilisant le formalisme des phaseurs (cf. chapitre 
de Mécanique Ondulatoire). Dès lors, nous avons: 


dUx,zt\= y(x)wz)e ®f (69.290) 


Comme d'habitude, nous retiendrons seulement la partie réelle des phaseurs des solutions à la fin. 
Calculons les deuxièmes dérivées partielles par rapport à x et z: 


PÉ  _. jo 
Pel = 7 ue? 
: (69.291) 
2) " 
. = y ga 
L'équation suivante: 
rs —h<z<0 (69.292) 
D 


nous dit que sous la surface, ces deux expressions sont égales au signe près: 
que tt = — que ri (69.293) 


d'où nous déduisons: 


À (69.294) 
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À ne peut être qu'une constante, car les deux côtés de l'expression dépendent de variables indépendantes 
(ce qui est très astucieux comme observation!). Cette constante peut prendre, en principe, n'importe quelle 
valeur réelle ou complexe. 


Ce qui nous donne le système de deux équations différentielles indépendantes du deuxième ordre: 


v'A7=0 
g'+AY= 0 


(69.295) 
Il s'agit donc d'un système d'équations différentielles linéaire d'ordre 2 indépendantes, quasiment identique 
à celui résolu dans le chapitre de Thermodynamique lorsque nous avons étudié l'équation de la chaleur. 


Ceci étant dit, nous ne connaissons pas le signe de la constante 4. Ce que nous savons d'après ce que 
nous avons étudié dans le chapitre de Calcul Différentiel Et Intégral c'est que si b est positif alors la 
solution de l'équation différentielle en z: 


w"+Aw= 0 (69.296) 


aura des solutions harmoniques. Ce qui serait très surprenant. et contre intuitif avec ce que nous 
observons dans la réalité. Donc nous allons imposer 4 négatif et dès lors nous avons vu dans le chapitre 
de Calcul Différentiel Et Intégral que nous aurons en adoptant à peu près les mêmes écritures: 


7= AIX) + BAG HBXXET) 
_ cotilz+t) + pe +6) 


(69.297) 


où nous avons le discriminant de la deuxième équation différentielle ( 
) qui vaut: 


at Naf -4b | Va” 4 =+/4 (69.298) 
2 


Donc en d'autres termes: 
& = =À (69.299) 
Il vient alors: 


7= Ae(tEXX#T) + BR ÉEXX+T) 
(69.300) 


y= CoN(z+t) + De #z+6) 
et le discriminant de la première équation différentielle sera purement complexe: 
ati8=HfA (69.301) 
et donc peut s'écrire: 
+jk (69.302) 


Notre système se simplifie alors encore plus: 
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7= Ag C+T) ". Be tx+t) 


69.303 
= co(z+t) + De #(z+0) ( ) 
Si nous considérons l'avance (déphasage) nulle nous avons: 
2 — Ad +B'e tx | 
4 (69.304) 
y= Ce + De” 
Puisque: 
bix,z.ti= p(r)yzhe ®t (69.305) 
Nous avons: 


(x,zt}=[Cer +De7% | (4 (0848) 4 pret) (Go 306) 


Donc dans la deuxième parenthèse, nous avons simplement deux vagues qui vont dans des sens opposés. 
Gardons-en qu'une des deux pour simplifier l'analyse (peu importe laquelle!): 


(x,z,t\ = (Ce + De \l At) | (69.307) 


Pour déterminer les constantes, nous allons utiliser la condition limite donnée plus haut: 


0$ 


= ——=0 (69.308) 
54 
ce qui nous donne dans le cas présent: 
tion D \(4 ot) 6 (69.309) 


Alors évidemment nous n'allons pas simplifier totalement de manière à avoir K étant nul sinon cela ne 
correspondrait pas avec la réalité. Par contre, nous allons simplifier de la manière suivante: 


hi 


k| Ce _ De |=0 (69.310) 


ce qui impose dans le cas non trivial que: 
Ce _ ph (69.311) 


Nous pouvons donc choisir ce que nous voulons, mais si nous souhaitons nous simplifier la vie en 
anticipant ce qui va venir... il vaudrait mieux prendre le choix suivant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Ce L Det == (69.312) 
Dès lors: 
c= l Eh 
‘ (69.313) 
D = Let 


Ainsi, il vient: 
| Kz+h) , —K(z+#) 
bx,zt)=[Ce + De" il A'gPrHx) | LE A'e®t#x)) (69.314) 


En utilisant les fonctions hyperboliques (cf. chapitre de Trigonométrie) nous avons: 


pu (z+à) +e —X(z+h) 


#1 s20-| 5 


Jasters) |=cosh(&(z +) 1 Alert) | (69.315) 


Nous allons continuer à tenter de déterminer les constantes en utilisant la deuxième condition limite: 
6 __ 06 z=0 (69.316) 
Il vient alors (pour la dérivée du cosinus hyperbolique voir le chapitre de Calcul Différentiel Et Intégral): 
—@ A'cosh k(z +) Je tr) —gkA'sinh(&(z +) elPt#x) (69.317) 
et en posant donc z = 0: 


— @ A'cosh {4 109) L = gkA'sinh (ie (146) (69.318) 
et en simplifiant: 
-@ cosh(khi=-gksinhk#i (69.319) 
ou autrement écrit: 
h 1 


tanh(&h) =———— (69.320) 
g kh 


En se rappelant que (cf. chapitre de Mécanique Ondulatoire): 
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æ 


x = 


(69.321) 
Vyhase 


La relation antéprécédente n'a pas à ma connaissance de solutions permettant d'exprimer directement la 
vitesse de phase à partir d'une expression analytique (elle est donc transcendante) fonction de la 
profondeur h et de la fréquence (implicitement la pulsation) de la vague sans passer un développement de 
Maclaurin (cf. chapitre de Suites Et Séries) de la tangente hyperbolique pour de petites valeurs de kh telles 
que: 


ah 1 


tanhi kh1Z kh = kh = 
g kh 


(69.322) 


d'où nous tirons donc lorsque la profondeur et k aussi sont petits en faisant une simplification élémentaire 
de la relation précédente: 


Vohase = Ver (69.323) 


Relation qui est appelée "formule de Lagrange". Par exemple, pour un tsunami, les longueurs d'onde sont 
immenses (de l'ordre de la centaine de kilomètres) donc le produit hk est petit (de l'ordre de 0.25 dans les 
océans). 


Si au contraire la profondeur h est très grande ainsi que k nous avons alors en développant en série de 
Taylor (cf. chapitre de Suites Et Séries): 


tanhikhiz1l (69.324) 


d'où nous tirons alors aussi après une simplification élémentaire: 


Vohese = E (69.325) 


Relation qui est appelée "formule de Newton". 


Cependant nous pouvons résoudre numériquement la relation: 


ah + 


tanh(kh} = — (69.326) 
E 


et nous avons alors: 
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a a 2 | 
h SsHQ 


151} era 


77 ,fh = 1000 


10 ré 


Vitesse 40 — VA F & s 


; > h = 100 
en m/s rh ——— 
PL A 1 
4 


| d 1.5 2.5 l (n 11 15 25 40 60 100 151 250 


Période en secondes 


Figure: 69.25 - Espace des phases du système des équations de Lorenz Source: LPFR 


Nous pouvons en observant ce graphique comprendre pourquoi les vagues se brisent (flux supercritique). 
Effectivement, puisque la vitesse de phase pour une période donnée augmente en fonction de la 
profondeur h, la partie supérieure de la vague va plus vite que la partie inférieure et finit donc pas 
s'effondrer faute de support. La partie supercritique de la vague est destructrice dans le cas des tsunamis 
car elle l'eau est accélérée dans sa chute par la gravité. 


Il en découle aussi que les plus grandes vagues rattrapent les petites et que leurs amplitudes se superposent 
sur une certaine distance. Nous déterminerons plus loin la fonction reliant l'amplitude de la vague à la 
distance. 


Revenons maintenant sur: 
SUx,z,éi=cosh{k(z+#)il A'et®t#)) (69.327) 


en ne conservant que la partie réelle: 
®{x,z,t) = A'coshik(z+h)icos(@é+kxi (69.328) 


Rappelons que nous avons vu au début: 


V, = (69.329) 


of 
(4 
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Pour obtenir Z il faut donc dériver la relation antéprécédente par rapport à z, puis intégrer le résultat par 
rapport au temps. 


La dérivée donne donc: 
V, = —= & = kA'sinh(k(z+hjicos(æt +kx) (69.330) 

Soit: 

dz = kA'sinh (k(z+h)icos(@é +kx)d£ (69.331) 
La primitive donne: 

[æ = [xd'sinh kiz+h)}icos(a@t +Ax)dt = kA'sinh(k(z +h)i Î cos(@t+kx)dt (69.332) 

Soit: 

FA LA ‘sanhikiz+h)isin(@f+Ax) (69.333) 
Or nous avons vu au début de notre étude qu'en nous plaçant en z = 0 nous avions donc en surface: 

ê= 2 A'éinh| khisin(@f+kx) (69.334) 
et en notant R l'amplitude de la vague: 
Ê= Rsin(@i+Ax) (69.335) 

Avec ceci le déplacement vertical Z devient: 


sinh(k&iz+h)\. 
LL = R————sintat +kx) (69.336) 
sinh(t#) 


et en se rappelant que le potentiel de vitesses est donné par: 
gUx,z,ti= A'coshik(z+h)icos( @é+kxi (69.337) 


Nous avons avec cette nouvelle constante R: 


æcosh(k&iz +) 
PUX,Z = R——— 2 cos Mé+kx) (69.338) 
&  sinh(t#) 


La vitesse horizontale d'une particule d'eau sera alors: 
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V, = 06 = dx = Pa a CS PORTE (69.339) 
6x dt sinh(k#) 


et le déplacement horizontal sera l'intégrale de la relation précédente par rapport au temps: 


r cosh(k(z+#)1 coshik(z+h)lie 
| dx = | RE sin it + kxidt = RD 7 | sin +kxidt (69.340) 
‘ sinh(i#) sinh(k#) 


Soit: 


cosh(k(z+)) 


X = R— "cost +kx) (69.341) 
sinh(k#) 
et à la surface en z = Ü: 
cosh 4h 
= R———— cost +kx) (69.342) 
sinh(t#) 


10.1. PROFONDEUR DES VAGUES 


Il est maintenant intéressant de calculer la profondeur de pénétration de la vague. En effet, nous savons 
par vécu que les vagues se font sentir de moins en mois à mesure que l'on s'enfonce dans l'eau. 


Rappelons que nous avons donc: 


sinh(k(z+#)\.  . 
Z'= R——— inter +kx) (69.343) 
sinh(t#) 


qui correspond au déplacement vertical de la vague. Si: 


kh = Ty 1 (69.344) 


où nous considérerons que la longueur d'onde des vagues est petite et que la profondeur h du milieu dans 
lequel elles se propagent est grande. 


Nous avons alors: 


ke _ ik 
sin(kh) = DE EE = — (69.345) 


et: 


Kk(z+h) __ —k(s+h) kis+h) _ zh k(z+h) 
sinik(z+h)i= | 
2 2 2 


(69.346) 


et nous voyons que pour que cette approximation soit satisfaite, il faut que: 
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eg 1 (69.347) 


Donc pour que la suite des calculs soit valable, nous imposerons de petites valeurs de z (donc près de la 
surface). 


Dès lors: 
gr) 
> atr+h) 
Z=R a — ain(@é + x) = R . sin(@é + x) = Re sin(@é + kx) 
7: \é (69.348) 
2 


a ikhie® sin(at +kx) = 2 Are sin(@é + kx) 
æ ‘ æ 


Sans oublier que —% <z <0 (donc z est négatif pour rappel!). L'amplitude des mouvements diminue donc 
exponentiellement dans ces conditions avec la profondeur. Le lecteur pourra par contre vérifier que pour 
certaines valeurs de kh petites, nous avons: 


sinh {&(z +) 
©" - 
sinh(t#) 


(69.349) 


ce qui montre les limites du modèle avec cette approche. 


10.2. AMPLITUDE DES VAGUES 


Pour l'amplitude du mouvement horizontal la situation est la même. C'est-à-dire pour: 


kh = … æ1 (69.350) 


où nous considérerons que la longueur d'onde des vagues est petite et que la profondeur h du milieu dans 
lequel elles se propagent est grande. 


Comme nous avons: 


cosh(k(z +) | 
À = R————— cost +kxi (69.351) 
sinh(k#) 


il vient alors: 


EH) + a th) 
coshik&iz+}) 


= 8 cos | + x) = R—— È — cos( at +kx) 
sainh(t#) e —e 
2 
Rz+h) (69.352) 
2 ’ L4 / & 1° f & 
= À pr cos +Axi = Àe cos(e+kr)= Ash (4 Je cosi@é +xi 
e 
& 
me 2 At) cos(at+ x) 
2&@ 
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où pour rappel, nous avons toujours —% «z «0 et que ce modèle n'est valable que près de la surface. 


Donc pour ces deux approximations, nous avons alors lorsque z est petit en valeur absolue par rapport à h 
(donc en eau peu profonde): 


A'e"* sin(at +kx) 
(69.353) 
X = A'e% cos( at +kx) 


Ainsi, nous pouvons observer que pour le cas de & > 1 et en eau peu profonde (pour z petit), les 
particules d'eau décrivent un mouvement circulaire (puisque les deux composantes Z et X ont même 
amplitude). 


Par contre, dans le cas général, nous avons: 


sinh(&(z + h)) 


= R ——— sin + kx) 
sinh(i#) 
(69.354) 
cosh{k(z+})\ 
= À ———— cosi ét + x] 
sinh(i#) 


Les amplitudes ne sont dès lors plus les mêmes et les mouvements sont alors elliptiques. 
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Notes personnelles: 
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70. GÉNIE MÉCANIQUE 


L. Génie Mécanique désigne l'ensemble des connaissances liées à la mécanique, au sens physique 


(sciences des mouvements) et au sens technique (étude des mécanismes). Ce champ de connaissances va 
de la conception d'un produit mécanique au recyclage de ce dernier en passant, bien sûr par la fabrication, 
la maintenance, etc. 


Ses applications sont très importantes dans de nombreux domaines de la vie de tous les jours que ce soit 
pour la fabrication de machines, de jouets, d'appareils électro-ménagers ou encore d'immeubles ou de 
toutes sortes de moyens de transports. et la liste est encore longue... 


Encore une fois, nous allons nous concentrer ici uniquement sur la formalisation mathématique de cas 
pratiques d'applications courantes! Donc ce chapitre est seulement une introduction générale des 
applications techniques de la mécanique et doit être complété par des travaux pratiques en laboratoire 
ainsi que par la lecture du chapitre de Thermodynamique où l'équation d'état des solides y est traitée. 


Remarque: Il serait prétentieux de prétendre dans le présent chapitre vouloir faire aussi bien et 
complet que les PDF gratuits d'Éléments de machine et de Résistance des Matériaux de 

Nicolet Gaston Raymond qui sont inégalables en matière de contenu et de qualité à ce jour (même 
comparés aux ouvrages payants sur le sujet!). Il est donc fortement recommandé au lecteur de s'y 
référer s'il veut une information complète sur le génie mécanique (voir la section de téléchargement du 
site). 


1. ENGRENAGES 


Un engrenage est un système mécanique composé de deux roues dentées engrenées servant à la 
transmission du mouvement de rotation entre elles ou à la propulsion d'un fluide (nous parlons alors de 
pompe à engrenages): 


effort de 
rotation 


Roue motrice 
(Entrée) 


Roue résistante 
(Sortie) 


Figure: 70.1 - Système d'engrenage à deux roues dentées circulaires 


L'inventeur de la roue dentée est non moins que le célèbre mathématicien, ingénieur et physicien 
Archimède. 


Nous trouvons les engrenages absolument partout dans notre quotidien: voitures, vélos, montres, chaises 
réglables, etc. Nous conseillons par ailleurs vivement au lecteur de penser aux engrenages (plateaux et 
pignons liés par une chaîne de transmission) de son vélo pour interpréter les résultats qui vont suivre. 
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Il m'a semblé donc important de présenter très brièvement comment calculer le pas de denture d'une roue 
cylindrique en fonction d'une autre pour le plus connu des engrenages qui est "l'engrenage cylindrique" 
comme celui représenté ci-dessous: 


/ 
/ 
ed KW 
= 
« cd . . D. ’ 
- | | \" - 


Figure: 70.2 - Engrenage cylindrique avec grammaire 


Pour assurer l'entraînement, nous devons donc faire en sorte que les dents d'une des roues cylindriques de 
diamètre 2} s'intercalent bien entre les dents d'une autre roue de diamètre 2, . Pour cela, il nous faut 


introduire la notion de "pas" de la denture de chaque roue que nous noterons respectivement À et &. 


Pour cela nous allons utiliser l'hypothèse que le point de friction des dents est assimilable aux diamètres 
(représentés ci-dessous par des cercles noirs) qu'auraient les roues cylindriques s'il n'y avait pas de 
glissement (et donc pas besoin de dents.) de la même façon que l'engrenage. Ces cercles sont appelés 
"cercles primitifs", ou "cylindres primitifs" ou encore "diamètres primitifs". 


Le pas des dents va s'exprimer donc en fonction de la circonférence et du nombre de dents sur chaque 
roue. Si nous notons Z, le nombre de dents d'une roue cylindrique 1 et Z; le nombre de dents d'une roue 


cylindrique 2, nous avons alors les pas qui valent respectivement: 


Fi Pin à 


Z Z 
(70.1) 
27x.k nb, 
BP, = ——< == 
23 22 


et comme pour que l'engrenage fonctionne il faut que les deux pas soient égaux: 


R=B (702) 
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Nous obtenons alors: 


=## (70.3) 


où m est appelé le "module de denture". Nous retiendrons donc que: 
D =mZ D =m.Z; (704) 


Nous observons aussi de par les relations ci-dessus que le pas est donc proportionnel au module de denture 
(le choix d'un gros module donne un nombre de dents faible et le choix d'un petit module un grand nombre 
de dents). 


Le choix du module d'un engrenage s'effectue (parmi des valeurs normalisées) à partir de critères de 
résistance à la rupture ou de résistance à l'usure. 


1.1. RAPPORTS DE TRANSMISSION 


Le "rapport de transmission" appelé aussi "rapport de réduction" d'un engrenage ou d'un système de 
poulies très important dans le domaine de la mécanique et est défini par: 


48 
= dE -46 (70.5) 
æ, d8, d8 
Le € 
ct 


et donc si la vitesse de rotation (pulsation) est constante (voir le chapitre de Mécanique Classique pour les 
calculs détaillés de la cinématique du mouvement circulaire) et ne varie plus entre le démarrage et le 
fonctionnement nominal, il vient: 


Il s'agit d'une technique très utilisée dans les voitures (en général presque dans tous les moteurs): 
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Figure: 70.3 - Moteur avec quelques poulies et courroies de transmission 


aussi bien que dans presque toutes les montres mécaniques: 


Figure: 70.4 - Système d'engrenage avec rapport de transmission particulier d'une montre 


Nous avons aussi bien évidemment: 


Donc, le rapport des vitesses de rotation (pulsation) entre l'arbre de sortie et l'arbre d'entrée est égal au 
rapport des angles parcourus entre l'arbre de sortie et l'arbre d'entrée. 


Nous avons de même: 
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æ 
r=—+= + (708) 
De 


A 


107 


L.4 


et comme au point de contact il y a frottement sans glissement alors les deux vitesses sont égales et donc 
au final: 


L'égalité: 


est souvent appelée aussi "rapport de réduction". Il est bien évidemment important de considérer un 
rapport de réduction sous forme fractionnaire comme une chose qui existe. Ainsi, pour un r donné il faut 
chercher la fraction la plus proche. 


Il paraît clair que si l'engrenage est réducteur de vitesse alors: 


æ & R, Z, D, 
r== si #2 2 €] (7011) 
æ, 8, K, Z, D, 


Raison pour laquelle en vélo, lorsque nous sommes en descente et que la roue motrice tourne très 
rapidement, nous allons favoriser un grand plateau et un petit pignon (Z, très grand par rapport à Z,). 


Ainsi, avec à 60 [km/h] en descente, une roue de vélo de cours de rayon d'environ 35 [mm] aura une 
vitesse de rotation: 


æ, = 47.6 [rad #1] = 7 [turs.s” ] (70.12) 


or il n'est pas concevable de tourner les jambes aussi vite pour aller encore plus vite. Donc avec un 
rapport plateaux/pignons de 53/12, nous aurons: 


a, =@ La, 471 2 075 [rade ]= 1,55 [teurs. s"] (70.13) 


ce qui est déjà beaucoup plus acceptable. pour aller encore plus vite. 


Maïntenant observons ce qui se passe au niveau du moment de force (qu'il est dur par exemple en vélo de 
grimper une côte avec un grand plateau et un petit pignon et nous allons voir pourquoi il vaut mieux 
favoriser un petit plateau avec un grand pignon). 


Revenons sur notre schéma en représentant un moment de force constant dont le module À est appliqué 
sur un pignon à l'engrenage d'entrée de rayon À, selon (cf. chapitre de Mécanique Classique): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


PAC x =R.|Al-siniai=R EE | Go19 


La force Ë tangentielle sur l'engrenage d'entrée est la même que celle qui fait tourner l'engrenage de 
sortie 


Figure: 70.5 - Engrenage cylindrique avec forces sur pont de contact 


Nous avons alors pour les deux engrenages, en l'absence de force de frottement et en considérant que la 
force au point de contact des deux engrenages est perpendiculaire aux deux rayons respectifs, les relations 
suivantes : 


A R=M 
(70.15) 
FE R=A.R=M, 
Nous égalisons alors: 
M, M 
À = 12 ZE (016) 
1 2 
et donc: 
M. 
1221 017 
2 
et donc: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


(70.18) 


Ainsi, pour reprendre notre exemple du vélo... si nous souhaitons appliquer le plus grand moment de force 
possible à la roue arrière en minimisant le moment de force que nous fournissons sur le pédalier alors la 
meilleure stratégie selon la relation déterminée ci-dessus est de mettre le plus petit plateau possible associé 
au plus grand pignon (l'idéal serait d'avoir un plateau plus petit que le plus grand des pignons pour avoir un 
rapport de transmission supérieur à l'unité). 


Attention! Le principe des poulies/engrenages avec rapport de transmission est un fantastique 
démultiplicateur de force mais en aucun cas il démultiplie le travail! 


Remarque: La norme ISO 1122-1 donne la définition inverse et note le rapport de transmission i au 
lieu de r: 


æ, & 
j=t=t= © (7019) 
æ, & é 


1.2. ASSOCIATION D'ENGRENAGES 


Pour des raisons de contraintes géométriques ou mécaniques, il est parfois nécessaire de construire des 
étages d'engrenages comme le montre par exemple le train de rouage à 4 roues de la figure ci-dessous 
(nous allons voir un exemple une fois les notions de base introduites): 


Figure: 70.6 - Exemple de train d'engrenage en 3D 


Soit sous forme schématique technique (non conforme aux normes VSM Suisses mais pratique): 
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2 6 


Figure: 70.7 - Train d'engrenage 2D équivalant 


Le rapport de transmission global sera alors donné pour la vitesse de rotation par: 


DO A 4 [Tres 
où la quatrième égalité se simplifie parce que dans le cas particulier ci-dessus: 


B=Mmetæ = (7021) 
Nous pouvons aussi exprimer la transmission totale en termes de diamètres. Puisque nous avons démontré 
que: 


il vient alors immédiatement: 


Z; Za Zs Lis 


F=ñg=— — = (70.23) 


Z2 Z4 Z6 LL Zraees 


expression que nous ne pouvons pas simplifier! 


Ainsi, dans le cadre d'une transmission d'une montre à complication astronomique, le rapport de 
transmission a été obtenu en déterminant la fraction rationnelle 1802/217. Cela étant très difficile à mettre 
en oeuvre avec uniquement deux engrenages, nous allons construire simplement à l'aide de trois axes et 
quatre roues (à 7, 31, 34 et 53 dents) le même rapport — qui heureusement n'est pas irréductible - de la 
façon suivante: 
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_1802 34.53 34 53  [ [Zee 


= © = = = (70.24) 


217 7-31 7 51 [ln 


Exemple: 


Nous souhaitons avec un train à 4 roues sur 2 axes, entraîné par l'axe des heures (qui fera un tour en 12 
heures), réaliser un rapport r de transmission très précis, pour réaliser l'entraînement d'une complication de 
montre incluant une phase de lune par le classique disque portant 2 lunes et tournant derrière un masque. 


Le nombre maximum de dents par roue ne devra pas excéder 300 dents et ne descendra pas en dessous de 
7. La précision sera la meilleure permise dans les limites de ces nombres de dents. 


Nous prendrons pour la lunaison 29 jours 12 heures 44 minutes et 2.9 secondes, soit 2'551'442.9 secondes. 


Le calcul du rapport recherché est relativement simple. Le disque à deux lunes fait un tour complet en 2 
lunaisons, soit en 5'102'885.8 secondes. La roue du garde-temps fait un tour en 12 heures, soit 43200 
secondes. 


Pour un tour du disque à 2 lunes (axe mené) l'axe de la roue 12h (axe menant) fait : 


r= = # (0008465798 (70.25) 
T 5102'885.8 


et en arrondissant comme ci-dessous, nous avons une erreur d'environ 3 dix-millième de seconde par 
tranche de 12 heures. Soit environ 0.2 secondes par année de retard. Ce qui est acceptable pour une 
montre mécanique. 


En arrondissant à: 


r= <= 7 2=z000846579 (70.26) 
TT 35102"885.8 


nous avons une erreur d'environ 30 secondes par année ce qui reste toujours acceptable pour une montre 

mécanique. Si nous enlevons encore une décimale, nous avons alors un retard de 6 minutes par année, en 
enlevant encore une décimale supplémentaire, nous aurions un retard de 49 minutes (ce qui reste toujours 
acceptable pour nombre de montres mécaniques). Par contre au-delà ce n'est plus acceptable! 


Maïntenant, pour trouver la fraction rationnelle décomposable la plus proche de ce chiffre il existe de 
nombreuses méthodes empiriques (par tâtonnement ou en utilisant un arbre de Brocot) et des tables mais 
la moins pire. pour moi. est celle utilisant les fractions continues (cf. chapitre de Théorie des Nombres) 
quand elle est applicable. 


Rappelons que nous avons vu démontré que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


sg je à = + 1 
“a bin Eat 


ñn{n 


1 (70.27) 


en considérant: 


(70.28) 


Si nous notons x le rapport a/b alors les relations ci-dessous nous donnent que 4, est la partie entière de x, 
g2 la partie entière de h/f soit de b/i(x-g)-b1=1/(x-g) et ainsi de suite 


Nous avons alors dans notre cas: 
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0.008465798 


= Qt = ES 
1 118.1223553881.. 
0.008465798 
A 1 118+8.17291347.... 
0.1223553881... 
= ES nl = O+ l ] 
118+ 1184 
e+ 1 8+5.78323935.... 
0.17291347.... (70.29) 
= 0+ Î : = 0+ Î 
118+ 118+ 
1 1 
8+ 
1 5+1.2767489. 
0.78323935.... 
= 0 1 
118+ 
8+ 
ni 
1+.... 


Soit après une mise au dénominateur commun: 


1 1 1 1 49 
STE RRE NPONE MDEPEREE Wa 6 
118+ DB 18 118 3788 2030) 
dE += SEA 43 
5+] 6 F 


Si la différence (erreur) entre cette fraction et la valeur exacte est acceptable (il suffit de calculer l'erreur 
de temps que cela provoque après une année de fonctionnement de la montre par exemple), nous nous 
arrêtons ici. Mais il y a un deuxième critère. le numérateur et le dénominateur doivent être 
décomposables de manière satisfaisante relativement aux exigences du nombre de dents. Or dans le cas 
présent, le dénominateur (5788) n'est pas décomposable de manière satisfaisante par rapport à nos 
contraintes (faites la décomposition avec la commande ifactor de Maple 4.00b et vous verrez!). 


Si nous continuons à développer notre fraction continue, nous ne trouverons pas de solution acceptable 
avant que le numérateur ou le dénominateur dépasse la valeur maximale admise de 3002. 


Dès lors, nous revenons par exemple à la fraction (bon ce n'est pas une approximation acceptable car dans 
la réalité le déréglage de la montre se fera trop vite): 


49 
5788 


et nous trichons un peu par essais successifs jusqu'à trouver un bon rapport: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


49 


5792 


Ensuite, comme nous avons un train à quatre roues, nous devons avoir: 


PE —=—. 


Z, Zy 32 181 


2. RÉSISTANCE DES MATÉRIAUX (R.D.M.) 


La résistance des matériaux (R.D.M. se dit "ResDem" pour les intimes...) est, comme tous les autres 
chapitres de ce site, un domaine extrêmement vaste dont le niveau de détail et la complexité des calculs 
peut exploser. Nous allons dans les paragraphes qui suivent nous attarder sur l'essentiel que l'ingénieur (en 
entreprise) doit savoir. Les développements sont simplifiés à l'extrême pour des cas particuliers triviaux 
(barres et poutres rectilignes). Dans la réalité, il faut utiliser le calcul tensoriel, les plans d'expérience ou la 
modélisation informatique avec les MEF (méthodes des éléments finis). 


Avant de commencer à étudier quelques cas concrets simples faisons quelques rappels des démonstrations 
issues du chapitre de Mécanique des Milieux Continus: 


Le solide considéré comme rigide n'existe pas, ce n'est qu'une approximation commode. L'expérience 
montre en effet qu'un solide est toujours légèrement déformable sous l'effet de forces extérieures. 


Les relations entre déformations et tensions sont en général compliquées par suite de l'anisotropie des 
réseaux cristallins. Cependant, les solides n'étant généralement pas des monocristaux mais des substances 
polycristallines, constituées d'assemblages de microcristaux associés au hasard, ils peuvent être considérés 
comme isotropes. 


Ensuite, il convient de considérer globalement les hypothèses suivantes relativement aux développements 
qui vont suivre: 


H1. La matière est homogène, c'est-à-dire pour rappel de même constitution physique et de même 
structure dans tout le volume de la pièce. 


H2. La matière est isotrope, c'est-à-dire pour rappel que ses propriétés mécaniques sont les mêmes en tout 
point du corps. 


H3. La matière est parfaitement élastique, c'est-à-dire pour rappel qu'après élimination des efforts 
extérieurs, la pièce reprend immédiatement ses dimensions primitives (au contraire de la limite plastique!). 


H4. Les déformations (déplacements des points de la ligne caractéristiques) sont petites par rapport aux 
dimensions des objets étudiés. 


H5. Toute section droite (sections transversales) avant déformation reste droite après déformation 


(hypothèses de Navier-Bernoulli). 
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H6. Les résultats obtenus en R.D.M. ne s'appliquent valablement qu'à une distance suffisamment éloignée 
de la région d'application des efforts concentrés (Hypothèse de Barré de Saint Venant). 


H7. Dans le domaine élastique, la matière obéit à la loi de proportionnalité et dons les déformations sont 
liées par la loi de Hooke démontrée dans le chapitre de Mécanique Des Milieux Continus. Cette loi 
linéaire permet d'appliquer le principe de superposition des forces et des déformations à la résistance. 


Nous avons vus dans le chapitre de Mécanique des Milieux Continus que la loi de Hooke stipule, lorsque 
les déformations sont réversibles, qu'il y a proportionnalité entre tension et déformation (une des variantes 
de formulation de la loi de Hooke): 


F=kjau= te E-S.£=E.S.E (7035) 


ou: 
—==Ë£.E (70.36) 


où E est le module de Young, £& la déformation normale et & la contrainte normale. Indiquons que le 
rapport: 


est souvent appelée "raideur de la barre" dans la littérature spécialisée et est souvent notée k. 
Nous avons également démontré dans le chapitre de Mécanique des Milieux Continus que la contrainte 


tangentielle était donnée par: 


E 
T= Gran" G-Y (70.38) 


où G est le module de cisaillement, Yest l'angle de déformation et 7 le coefficient de Poisson, nombre 
sans dimensions. Nous avons donc une relation entre le module d'élasticité et de rigidité valable dans le cas 
des petites déformations. 


Nous avons vu également dans le même chapitre que pour un solide ou un liquide soumis à une 
surpression isotrope uniforme nous avions: 


3(1- 2 
LL = Cm =d-.K=x.AP (70.39) 
Fi E 


Le coefficient de compressibilité £ est donc un nombre positif, par conséquent en utilisant la relation 
précédente, nous avons: 


K>0—(1-27) >0—27 <1 (70.40) 


et vient alors un résultat connu: 
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1 
€— (70.41) 
/ 2 


Donc le coefficient de Poisson ne peut pas être plus grand que ! et il peut être négatif (dans ce dernier cas 
nous parlons alors de matériaux auxétiques). 


Enfin, rappelons que nous avons vu dans le chapitre de Mécanique des Milieux Continus que la 
contraction unitaire selon l'axe z était donnée lors d'une traction selon l'axe x par: 


EE, =— = €, (70.42) 
EE — 7} E LL 7} x DE 
Soit autrement écrit (en se concentrant sur le plan XZ): 
AZ, | lAZ, | 
Lo D, 
Soit: 
IA, | 
= dos. - (Es = los os (70.44) 
142, | (Z, — Lo, Lo 
D, 


Figure: 70.8 - Traction sur une pièce test 


Nous avons également démontré dans le chapitre de Mécanique des Milieux Continus la relation suivante 
lors de notre étude du module de flexion: 
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qui exprime le moment de flexion pour une poutre sous un effort M (moment de force), la travée 
d'écrivant alors un arc de cercle de rayon de courbure R et où I caractérise la "rigidité de forme" du 
matériau ayant une aire transversale donnée. C'est une relation très importante dans de nombreux 
domaines de la construction (navale, automobile, architecture, etc.). 


Remarque: I est appelé le "moment d'inertie statique" ou “moment quadratique" comme nous l'avons 
déjà spécifié dans le chapitre de mécanique des milieux continus. 


2.1. MOMENTS QUADRATIQUES 


Voyons les trois moments d'inerties statiques 7, classiques du domaine de la RDM car souvent rencontrés 
dans la pratique (construction). 


Remarque: La théorie des moments d'inertie est pour rappel présentée dans le chapitre de Mécanique 
Classique. Dans le chapitre sur les Formes Géométriques nous avions démontré en détails les moments 
d'inerties des volumes les plus courants. 


1. Moment d'inertie statique transversal de la plaque rectangulaire de côté b et hauteur h: 


Figure: 70.9 - Plaque rectangulaire et axe d'inertie 
Le domaine occupé par la plaque est donné par: 


S={(xy\eR?|-b/2<x<bi2,-h12<y<h2) (70.46) 
| 


Nous avons alors: 


k/2 à/2 k/2 k/2 b k /2 3 
Î, - | | Ydxdy = [ ee 1. dy = [ by° dy = dl = (70.47) 
—k 2-32 -k 2 -k}2 -k 12 


2. Moment d'inertie statique transversal d'un disque de diamètre: 


Figure: 70.10 - Disque et axe d'inertie 


Ici le domaine d'intégration est: 
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S={(x,y) eR°|x° +y?< a? 4) (70.48) 


où d est le diamètre du disque. 
Nous avons toujours: 


l, = [>dxay (70.49) 
É. 


Pour calculer cette intégrale, nous utilisons les coordonnées polaires: 


x=rcos #8 
| (70.50) 

y=rsin 8 
Le jacobien de la transformation est égal à r (cf. chapitre de Calcul Différentiel Et Intégral), Nous 
obtenons: 

&/223 412 4 
2 à 
1 r°(an8) d&dr=n| dr (7051) 


3. Moment d'inertie statique d'une couronne de diamètre extérieur D et diamètre intérieur d: 


Figure: 70.11 - Couronne et axe d'inertie 
Ici le domaine d'intégration est: 


S={(x,y)eR?|d/4<x+y<D7/4) (7052) 


où D et d sont respectivement les diamètres du grand et du petit disque. 


Si nous notons $, le domaine du grand disque et £, celui du petit disque alors: 


x(D* -d* 
E = [drap _ [>*axdy = CD) (70.53) 
E $ 4 
(l 
en utilisant le moment d'inertie statique du disque. 


Pour résumer, nous avons donc: 
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Î, = [pas = Il ydxdy 
: , (70.54) 
4, = [ras = Il x dxdy 
5 5 


et enfin il existe aussi le moment quadratique polaire de S par rapport à un point O: 


2 3 
L = fr ds = If (x +y )dxdy = ir (70.55) 
F: F 
Il est donc aisé dans des cas simples de connaître le moment d'inertie polaire et celui-ci est très utile dans 
le cadre de l'étude de la torsion. 


Il découle de ces outils que plus les éléments de la section sont situés loin de l'axe, plus le moment 
quadratique sera important et plus (nous le démonterons dans ce qui suit) les flèches seront faibles. 


2.2. ÉQUATION DE LA LIGNE ÉLASTIQUE 


Pour cet exemple de cas d'école mais très utilisé dans la pratique nous allons d'abord devoir obtenir 
mathématiquement la forme géométrique que prend la fibre neutre d'une poutre soumise à des efforts de 
flexion. 


Remarque: Si toutes les réactions d'un système sollicité se trouvent à partir des équations d'équilibre 
statique, le problème est dit "statiquement déterminé" ou "isostatique". Lorsque les équations de la 
statique ne permettent pas de trouver l'équilibre d'un système, le système est dit "hyperstatique" ou 
"statiquement indéterminé". Nous disons aussi que tant qu'il y a une "liberté de mouvement" malgré n 
points de liaison, nous sommes en isostatique. 


En faisant l'hypothèse que les déformations sont faibles et que le poids de la poutre est faible devant la 
force qui plie la poutre, nous pouvons faire le schéma suivant: 


Z 


Tangente en À 


Élément 2£ de la fibre neutre 


TR # Fibre neutre 
s 


R 
Figure: 70.12 - Poutre (simplifiée...) soumise à un effort 
Par définition de la dérivée et en vertu de l'hypothèse des faibles déformations (cela fonctionne donc 


quand même bien jusqu'à 45°...): 


dz | 
— =tan = (70.56) 
dy 
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Soit en dérivant encore une fois: 


D'autre part, la figure montre que (cf. chapitre de Trigonométrie): 


D amet (70.58) 
R dL 


Mais du fait que la courbe de la fibre neutre s'écarte peu de l'axe y (déformations faibles), nous pouvons 
écrire: 


dy= d£ (70.59) 


Donc: 


= —=—| (70.61) 


qui est donc l'équation différentielle donnant z = f{y), appelée "équation de la ligne élastique". 


Une autre approche courante mais moins intuitive pour obtenir la même relation est de partir de: 
M = &'1 (70.62) 


et de rappeler que le rayon de courbure R est donné par (cf. chapitre de Géométrie Différentielle): 


(25.63) 


E.] E.1 
1 13/2 
(1+z*] (25.64) 


F"| 
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et en négligeant la dérivée première pour les faibles déformations nous retrouvons bien: 


2 
M=ite _Ê ep1l" D La 
R  {14,2] D. pis 
"| 


Exemples: 


E1. Poutre encastrée que d'un seul côté dite "poutre en porte à faux" (cas classique dans la construction et 
les habitations) avec charge concentrée (ponctuelle) à l'extrémité: 


es 


F 


Figure: 70.13 - Poutre encastrée d'un seul côté avec force ponctuelle 


Dans la section S quelconque, le moment de force (de flexion) vaut donc: 


EI _ F.(L£- l 
MO)= FL) =— = 2 (70.66) 
D'autre part: 
d?z 1 
Fe = 70.67) 
En éliminant R entre ces deux relations, il reste: 
_ = TG y) (70.68) 


La figure montre que les conditions aux limites sont: 


Y=0—=42 : (70.69) 


Nous tirons après intégration: 
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d F L. 
— — FE _—_— 
à a 2” 
: | (70.70) 
z=——|1-y- 
nl 2? ÿ) 


Soit: 


Soit la déformation verticale maximale de l'extrémité pour une poutre encastrée que d'un côté est 
finalement: 


Toutes les données de cette relation nous sont connues (force, longueur, module de Young, inertie statique) 
et il est alors possible de déterminer si la barre va casser ou non car il suffit d'appliquer la relation 
démontrée plus haut: 


©: Î : M 
M =— =|4- EL 7074) 
y FJ Î 
Et donc grâce à la relation: 
o LT (70.75) 


et sachant expérimentalement à partir de quelle valeur expérimentale de & le matériau casse on saura 
quand la barre cassera (du moins approximativement!) en connaissant la flèche f, le moment fléchissant M 
et le moment quadratique 1. 


Nous avons donc un résultat qui va nous être utile par la suite: 


1 2 | 
Ê = FF — y“ (70.76) 
one | 


et en intégrant de 0 à L nous retrouvons la flèche de notre poutre précédente! 


E2. La poutre soutenue (appelée aussi "poutre à 2 appuis simples" ou "poutre isostatique") est l'exemple le 
plus classique en construction et donc en architecture (et ceux qui ont joué pendant l'enfance à mettre des 
lattes de bois pour passer par dessus une petite rivière). Il s'agit d'une poutre homogène, de section 
constante, reposant sur deux appuis libres à ses extrémités et soumis à une charge F en son centre: 
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Figure: 70.14 - Poutre soutenue avec force ponctuelle centrée 


Nous pouvons donc considérer que tout se passe comme si nous avions F/2 aux deux extrémités de deux 
poutres de longueur L/2 (ainsi la somme vaut bien F, c'est-à-dire le moment fléchissant). Remarquons que 
nous négligeons le poids de la poutre devant F, mais F peut être tout simplement le poids de la poutre! En 
utilisant la dernière relation de l'exemple précédent, nous avons: 


F 1 >: | 
df =———y“dy (70.77) 
1 EN lv 
Soit: 
= — —— dy = 70.78) 
f 51" BEI 


Soit la déformation verticale maximale d'une poutre posé des deux côtés est finalement (en changeant un 
peu la notation): 


F:? 


LT: 


(70.79) 


Ainsi, pour une même longueur de poutre, à F identique la flèche est donc 16 fois moindre que pour une 
poutre encastrée! Il était intuitif qu'elle soit moins élevée pour une force identique mais difficile de deviner 
qu'elle le serait d'un facteur 16! 


C'est cette relation qui est aussi utilisée pour les poutres IPN (fameuses en construction!). 


E3. Poutre encastrée que d'un seul côté dite "poutre en porte à faux" (cas classique dans la construction et 
les habitations) avec charge linéique constante w: 
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Figure: 70.15 - Poutre encastrée d'un seul côté avec force linéique constante 


Le développement est simple mais certaines simplifications sont astucieuses afin d'obtenir un résultat 
élégant. 


Nous partons toujours de l'équation de la ligne élastique en adoptant les écritures à la configuration 
choisie: 


2 
a Y LM 080 
dx EI 
Soit explicitement: 
2 
. Fe - à " 

d’y = D Fax | {| qax | dx , |wxax : Léa (70.81) 
dx? El EI EI El 


Lu cu 
d? Y _ 2 (70.82) 
x EI 
En intégrant encore une fois, il vient: 
5 3 
y'= dy _ | FN T ii h ie 
x Æi° 2 EI 6 


Comme pour x = L par hypothèse la déformation est nulle, nous avons la constante qui est alors donnée 
par: 
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3 3 
ee £ 0. __WE (7084) 
ET 6 6EI 


Soit: 


.. W DO wE vw ) 
=——-— = —||— —] (70.85) 
EI 6 GEI 6ÆATI\L 


En intégrant encore une dernière fois: 


, 4 
= (PF) = HE Br} (70.86) 


Et comme en x = L nous avons y qui est aussi nul, il vient pour la constante: 


Soit: 


4 
LE Re LME (70.88) 
GET 


et comme la flèche est de toute façon en x = 0, nous avons alors: 


2.2.1. ÉQUATION DES POUTRES (EULER-BERNOULLI) 


Considérons maintenant le cas d'une poutre encastrée des deux côtés (cas encore plus courant que les 
deux exemples précédents!). L'analyse va être un peu plus difficile et il va nous falloir introduire plusieurs 
concepts. 


Une poutre en pratique doit résister aux efforts suivants: 


- Tension ou compression: 
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T 


Le 


Le 
Q 


- Cisaillement (effort tranchant): 


a 


Du 


- Flexion (effort fléchissant): 


a 
= 


Si une poutre est en équilibre, alors les efforts internes doivent satisfaire en tout point: 


SF =V'f -f 

Zi Fhorizontaes = 2, psicanedie 0 

+ Foticales = >, EF isattenent = 0 (70.90) 
S' À vi =Ÿ 

Z 4 ni Fleñon 


Considérons maintenant une poutre encastrée à ses deux extrémités (poutre bi-encastrée) et prenons en un 
tranche de longueur infinitésimale dy telle que localement sa courbure soit nulle. La poutre sera supposée 
soumise à une force (poids) uniforme sur toute sa longueur (force qui peut aussi être assimilée à son 
propre poids comme nous l'avons déjà précisé plus haut). Il est alors d'usage de noter ÿ; la force par unité 


de longueur (poids total divisé par la longueur) qui est bien évidemment une charge linéique: 
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Si la poutre est à l'équilibre une fois déformée (faiblement ou beaucoup déformée cela importe peu!) alors 
les sommes des forces de tension, compression, cisaillement et flexion doivent être nulles en chaque point 
comme nous l'avons déjà dit! Cela ne veut cependant pas dire qu'en chaque point de la ligne élastique les 
valeurs de chacun des forces est égale! Bien au contraire. Il y a bien évidemment des différences (sinon 
quoi il n'y aurait pas déformation). 


Faisons alors d'abord la somme des forces locales de tension et de compression (horizontales) de l'élément 
de longueur dy. Nous avons alors schématiquement: 


w 


, dy 
T(y) ee ——+ (y +dy) 


Soit algébriquement (le variationnel pouvant être négatif ou positif peu importe!): 
D Éporizontales = &(y+dy)-& ()=&+d8-&=d#=0 (7091) 


Si maintenant nous nous occupons des forces verticales à la source du cisaillement. Nous avons alors 
schématiquement: 
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Soit algébriquement (le variationnel pouvant être négatif ou positif peu importe!): 
D Évaticales = TO +dy)-T (y) = T+dT-T-dy=dt-wMdy=0 (7092) 


Et finalement pour les moments de flexion la somme est aussi forcément nulle à l'équilibre. Cependant 
contrairement aux deux sommes algébriques précédentes où nous pouvions utiliser seulement le 
différentiel, nous devons pour les moments de flexion choisir un point R de référence puisque pour 
rappel... le moment de force est par définition le produit d'une force par une distance. Nous choisirons 
donc naturellement le centre de gravité: 


La charge linéaire uniforme ;; sur la longueur dy génère une de force à mi-distance de: 


Ë; = (&{y)dy =& = &(y)dy? (70.93) 


1 
2 
mais comme elle est confondue aux chois de notre repère, alors son moment de force est nul! 


Nous avons alors algébriquement: 
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LA = Oo) EE È 
=M+dM- M +(r+48) © + L Pa +r +48 41Ÿ (70.94) 
y) M) ro =F(-7) 


s dy 


= AM +T dy +dT7-—= Ù 


et si nous négligeons les différentiels d'ordre deux: 
dif +Tdy = 0 (70.5) 


Nous avons donc au final: 


: 48 _5 
dä&=Ô id 
dt-ñdÿy=0t8 = (70.96) 
dif + tdy = Ô . 
di = 
— =—# 
dy 


Pour déterminer le moment de fléchissement à partir de la charge linéaire (ce qui intéresse en priorité le 
praticien), nous dérivons deux fois la troisième relation et faisons une substitution: 


q a) = _4 y» —W (70.97) 


la) 
Soit: 
d'M 
—75 =-W (70.98) 
dy 


Le problème avec cette dernière relation est la connaissance des moments. Il faudrait nous débarrasser 
absolument de ce terme. Ce que nous connaissons facilement c'est la fonction de déformation et nous 
avons démontré plus haut que: 

dz 1 M 


——=—=— (70.99) 


d? R EI 


Il vient alors immédiatement en substituant la relation précédente dans l'antéprécédente: 


4 
Fi =-w(y) | (70.100) 
dy 
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Il s'agit de la relation la plus important de la théorie des poutres car elle permet en connaissance la charge 
linéaire de déterminer la fonction de déformation ou inversement! Elle est tellement important qu'on 


l'appelle "équation des poutres" ou encore en honneur à ceux qui l'ont déterminé: "équation d'Euler- 
Bernoulli". 


Comme il s'agit d'une équation différentielle d'ordre 4 qui va générer quatre constantes à chaque 
intégration, il nous faudra alors 4 conditions initiales pour la résoudre complètement. 


Exemple: 


Nous souhaiterions calculer la déformation d'une poutre fixée des deux côtés et chargée uniformément 
connaissant sa longueur L, son module d'élasticité E, son moment d'inertie 1. Nous partons alors (nous 
changeons les notations pour montrer que selon les ouvrages les axes pris peuvent être notés 
différemment): 


dy _ 
dx 


EI —W(x) (70.101) 


avec les conditions initiales: 


ÿ(x=0)=0, y{x=1)=0, P'(x=0)=0, P'(x=1)=20 C010) 


dx dx 
Et intégrant à répétition, nous avons: 
3 2 2 3 2 
LR 27. +CxtCO = AS +Cx+C 
dx" El dx*  2Æ1 dx 6EÆAI 2 
(70.103) 
4 3 2 
—Wx" Ca, C2x 
X)=—— + ——+—<—+0C;xt+C 
ARE TT Dr Er CE 


Des deux conditions initiales: 


Il en découle que: 
C3 = Ca =09 (70.105) 


Avec les deux autres conditions restantes, nous obtenons le système suivant qui doit nous permettre de 
déterminer les deux constantes restantes: 


"£ CÉË CP 
+ + ii = 


0 
ie e 2 (70.106) 
ME GE Lo r=0 
GEI 2 
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Après il s'agit simplement de résoudre un simple système linéaire (cf. chapitre d'Algèbre Linéaire): 


"M CP CÉ  |24 ue à 
me gs le 7 +4C£ +120, = 0 Go 
3 C2? wi? _— art (70.107) 
ie scr-0 |? + 6C,L +12C, = 0 C, = 
6H 2 L 127 
Donc une poutre bi-encastrée idéale soumise à une charge uniforme et décrite par: 
4 2.2 2 2 
nr wLré wlx -wx ; 2 2 MX 
x]= = = x —2LxtE |= x—ÂZ) (70.108) 
(x) ID rr- Lie, 


247 12EÆ7 247 24ÆI 


Pour déterminer la flèche, il nous faut donc chercher le point x où cette relation a un optimum. Nous 
avons alors: 


MES -[r (x-2ÿ = 2x(x-£LŸ +2x (42) =2x{x-£L)(x-2 +x)= 2x(x-£)(2x-2) = (70.109) 


Il s'ensuite que la flèche à un maximum en x = L/2.En injectant cela dans y(x) nous obtenons la fameuse 
relation souventé donnée dans la littérature mais rarement démontrée: 


4 4 
_ w  £ _ wE (70.110) 


DAEI 16 384EI 


Il s'ensuit que la flèche d'une poutre est proportionnelle à la puissance quatrième de la longueur de la 
poutre! Une si forte dépendance impose des limitations significatives dans les constructions civiles basées 
sur des poutres. 


Remarque: La charge linéique constante, soit sur la longueur totale de la poutre, soit par tronçons 
successifs, est une sollicitation fréquente dans les pièces à axe horizontal. Elle peut provenir du poids 
propre de la pièce à section constante ou d'une charge provoquée par une poussée extérieure (gravité 
par exemple). 


2.2.2. ÉNERGIE POTENTIELLE ÉLASTIQUE 


Après un survol rapide des diverses déformations élastiques des pièces sollicitées par les efforts 
fondamentaux, nous allons établir ici l'expression générale de l'énergie élastique accumulée dans une barre 
de forme quelconque sollicité par des efforts extérieurs. 


Rappelons pour cette étude que nous pouvons écrire la loi de Hooke (cf. chapitre de Mécanique Des 
Milieux Continus) sous la forme suivante: 
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et l'énergie potentielle élastique d'un ressort démontrée dans le chapitre de Mécanique Classique est 
donnée par: 


1 
Ertastique = Pal (70.112) 
ou en déplacement relatif: 
1 2 +. 
Eprastique = ns (70.113) 


Dans le domaine de traction (ou compression) longitudinale des barres, il est d'usage de considérer la barre 
comme un ressort (...) et alors d'utiliser la constante de raideur de la loi de Hook... en espérant que cela 
colle à l'expérience: 


où conformément à l'usage, nous notons le déplacement longitudinal L au lieu de x. En injectant la loi de 
Hook (oui... ça tourne un peu en rond...): 


2 2 
Egtast _ Fh) _F à ous 
M TALARS]) DES 


Il suffit alors de diviser par la longueur de la barre pour avoir l'énergie linéique élastique: 


F2 
2.E.S 


Erastique) inéique (70.116) 


L'énergie volumique, notée traditionnellement comme en thermodynamique par une minuscule, est alors: 


2 2 2 : 
F'.L FE F (© 1 (70.117) 
S) 2ÆE 2Æ 


2.3. TORSION 


Rappelons au lecteur d'abord une étude faite dans le chapitre de Mécanique Classique sur le pendule de 
torsion où certains éléments avaient volontairement tus. Étudions cela plus en détails car très utile pour les 
arbres de transmission ou les ressorts dans la vie de tous les jours. 


Considérons maintenant un fil cylindrique fixé en sa base et soumis à un moment de torsion jf. Sous 
l'effet de ce moment de torsion, la face supérieure du fil est décalée d'un angle 8 par rapport à la face 
inférieure, la matière subissant une tension de torsion (ou cisaillement T ): 
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Figure: 70.16 - Fil sous torsion 


Imaginons à l'intérieur du fil un tube élémentaire de rayon r, d'épaisseur dr, et observons l'effet de la 
torsion sur ce tube déroulé (cela nous permettra une approche approximative du phénomène intéressé): 


Figure: 70.17 - Extraction un élément du fil sous torsion 


Cherchons une relation entre le moment de torsion jf et l'angle de torsion 8. 


Pour le tube déroulé, appliquons les relations du cisaillement: 
G'y=T- = = dF = yGdS (70.118) 


or la figure montre que (les déformations étant faibles) au premier ordre en série de Taylor (cf. chapitre sur 
les Suites et Séries): 


() r-8 
y = arctan T7 = (70.119) 


d'où: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


dF = TÉ cas (70.120) 


Le moment élémentaire dû à cette force est par définition du moment de force: 
dM =Fxdf (70.121) 


Soit puisque > et A sont perpendiculaires: 


dM = r2dS (70.122) 
Le moment total vaut alors: 
r 8.G'T 8.G 
M=[am- 7 [ras-7 x cou 
2 L L 
r=0Ù r=Ù 


donc: 


M = Ë )e = - Tue —k8 (70.124) 


Nous retrouvons donc la relation du pendule de torsion que nous avions posé lors de notre étude du 
pendule de torsion dans le chapitre de Mécanique Classique avec comme différence que cette fois la 
constante k, la "constante de torsion" est explicite! !!! 


Le numérateur de la constante k est appelé dans le domaine dans la résistance des matériaux "rigidité 
torsionnelle" et la constante k elle-même est souvent appelée "raideur de l'arbre" au lieu de "constante de 
torsion". Dans la pratique on cherche surtout à trouver la valeur numérique de l'expression suivante: 


_M.L 
ci? 


g (70.125) 


puisque cela donnera l'amplitude angulaire de la torsion. 


Voyons donc une application très importante au ressort de compression de type hélicoïdal (l'approche est 
approximative à nouveau à défaut de mieux...) travaillant en torsion. 


D'abord il faut bien se rendre compte que lorsqu'une force est appliquée au ressort, les extrémités vont 
tourner d'un angle 8 alpha faible (torsion) correspondant au parcours d'une distance x qui elle-même 
correspond au rétrécissement du ressort (ben oui! il faut bien que cette longueur soit reprise quelque part). 


Soit alors un ressort de rayon extérieur R (soit de diamètre D), de module de cisaillement G, avec un 
diamètre de corps d (diamètre du cylindre plié dont est composé le ressort): 
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Figure: 70.18 - Ressort spiral sous effort 


Pour l'analyse nous aurons besoin simplement de mélanger plusieurs de relations démontrées jusqu'à 
maintenant. En premier lieu l'angle de torsion d'une poutre de longueur L (longueur du ressort en 
l'occurrence!): 


ML 
g= (70.126) 

EIFA 

Avec: 
4 4 4 
M=1,+1, = Ad”, 74 _7d (0127) 

64 64 32 

et: 


L=n.x.D (70.128) 


Par ailleurs, le moment de torsion s'écrit: 


M=FR-F (70.129) 


Nous arrivons donc à: 


ML FRA D jp.» p? 
ER 4 (70.130) 
Gh x G.d 
32 


Remarque: Le rapport M j 8, au même titre que pour l'arbre, est appelé la "raideur du ressort". 
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Le déplacement (déformation) x vaut lui (cf. chapitre de Trigonométrie): 


x =R6=TE (70.131) 


Nous arrivons finalement à: 


D16.F.n.D° S8.F.n.D 
X=— = ————— 


ne — (70.132) 
2 G.d* G.d* 


ce qui nous amène à la relation mondialement connue dans le monde dans la R.D.M. en ce qui concerne 
les ressorts: 


G.d* 
F = — x=X&.xl (70.133) 
8-#-D 


où k est la constante de "raideur du ressort"!! Si maintenant, nous utilisons l'expression de l'énergie 
potentielle élastique d'un ressort démontrée dans le chapitre de Mécanique Classique: 


1 
Errastique = 5 (70.134) (70.135) 


nous pouvons alors déterminer l'énergie qu'un ressort spiral peut absorber. 


2.4. FLAMBAGE 


Nous terminons cette étude de la R.D.M. avec le flambage (cas d'étude classique en construction et 
mécanique) qui consiste à déterminer (dans un cas particulier simple) la force minimale Æ, à partir de 


laquelle une barre de longueur L, de module de Young E fixée à ses deux extrémités peut plier (avec un 
rayon À) jusqu'à casser sans qu'il y ait besoin de trop augmenter la force Æ; (il s'agit donc à nouveau d'une 


valeur d'indication!). 


Dans l'étude de ce phénomène, nous considérons que dès que la barre commence à plier nous avons alors 
Æ, (et nous ne sommes alors plus très loin de la force permettant de la casser). 
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Ed 


Figure: 70.19 - Exemple de flambage 


Lorsque la barre commence à plier nous avons alors une force Ë, qui s'applique à chaque élément de 


volume de la barre mais comme ceux-ci ne sont pas distribués de la même manière selon l'axe z, ils ne 
créent pas le même moment de force! 


À l'équilibre de la force de flambement, la barre soumet un moment de rappel. Nous avons alors: 
M(z)=-Zz.F (70.36) 


En exprimant le moment de flexion M au moyen de la relation: 
Il vient: 


En utilisant l'équation de la ligne élastique et en substituant, nous obtenons: 


d? 
z.M+E.1—=0 (701%) 
dy 


soit: 


d'z Fo d?z 
+. 


—— +£X =0 (70.140) 


qui est l'équation différentielle de flambage permettant de calculer la force de flambage avec les 
conditions initiales: 
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y=0—z=0 
ei s=i 


(70.141) 
Indiquons que la relation: 
2 


d 
z'# +E I — = Ô (70.142) 
dy 


est très souvent écrite sous la forme suivante dans la littérature: 


—=-—=— | (7014) 


— +——Zz=—+02 =0 (70.144) 
d 
est relativement aisée (cf. chapitre de Calcul Différentiel Et Intégral) puisque l'équation caractéristique 


est: 
k'4+ À 208, = + Fo (70.145) 
E.] / VE; 


Nous avons alors la solution homogène: 
| ñ . [A 
dial Pen 

Z, = Ae EF +Be “EI 


| F F F F (70.146) 
- ses | pe) 60| A) 


La condition y = 0 = z = Ü impose: 


Zn =A+B=0—B=-A (70.147 


| FÆ 
= 2 Ai 70.148 
Z | E. >) ( ) 


La deuxième condition y =0 =z = Z impose: 


z=?24A;sin Fo ; = 0 (70.149) 
VE. 
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Il vient alors: 


Donc il vient immédiatement que: 


LT =ÿ7z (70.150) 
E.1 


avec # = 1 (car k valant zéro n'est pas une solution physique possible et k entier supérieur à 1 signifierait 
que la barre plie sur plusieurs périodes ce qui n'est pas le cas puisqu'elle le fait seulement sur une 
demi-période comme le montrait la figure plus haut). Soit: 


_T-E1 


(70.151) 
72 


F 


Cette relation est parfois appelée "formule d'Euler" (à ne pas confondre avec la formule du même nom en 
théorie des graphes) et la charge limite la "charge ou force critique d'Euler" pour une poutre parfaitement 
encastrée aux extrémités. L'ensemble de l'étude étant le "flambage d'Euler". 


2.5. TRACTION 


Considérons maintenant le cas d'une barre suspendue seulement à son propre poids. La surface de sa 
section circulaire est S et h la hauteur totale de cette barre. Le module de Young du matériau est noté E 
(cf. chapitre de Mécanique des Milieux Continus) et £ sa masse volumique. 


Il est facile de constater qu'une section située à une altitude z supporte le poids du morceau de barre situé 
sous elle: 


F(z)=PgS(h-7z) (70.152) 


La contrainte n'est alors pas constante dans la barre: 


Oz) = —- = eg(h _ Z) (70.153) 
et la déformation non plus: 
O(z) __Pg : 
Efz)=——©=—{(}—-Zz) (70.154) 
(z) RE “E (2) 


z étant l'abscisse sur la barre, la déformation inhomogène est liée au déplacement par la relation: 


E(z) = du (z) (70.1 


55) 
Après intégration, nous obtenons la forme générale du déplacement: 
2 


2 
du (z) = E(z)&e = _ (h-2)& —u(z)= au = + (70.156) 


où la constante est à déterminer en utilisant les éventuelles conditions de liaison aux extrémités de la 
barre. Si l'extrémité supérieure est encastrée, le déplacement y est donc nul: 


u(z=0)=0—c"*=0 (70.157) 
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Le déplacement en tout point de la barre s'exprime donc: 


2 

ÊE Z 
= | hr — — 70.158 
u(z) 2 à ( ) 


L'allongement de la barre est l'écart en déplacement entre les deux extrémités de la barre: 
Âh=u(h)-u(0) (70.159) 


Nous avons alors trivialement: 


== | (70.160) 
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Notes personnelles: 
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71. GÉNIE ÉLECTRIQUE 


Na allons voir dans ce chapitre l'étude - sous son aspect mathématique - générale des circuits, 


montages, puces, et machines, émetteur/récepteurs que l'ingénieur doit savoir formaliser, analyser, 
comprendre, fabriquer et simuler à la suite de ses études. Pour cette raison, nous avons choisi sur ce site 
de nous concentrer sur des cas mathématiques d'applications pratiques (utiles!) dans la vie de tous les jours 
en mentionnant les éventuels pièges et dangers du montage. 


Nous traiterons ici dans l'électronique analogique, ensuite de l'électronique de puissance 
(électrotechnique), de l'électronique numérique ainsi de que la physique des semi-conducteurs pour bien 
comprendre les fondements de certains éléments. 


Le génie électrique est donc une hiérarchie de modèles. C'est la seule façon d'aborder la conception de 
systèmes complexes. En principe, le fonctionnement de nombreux dispositifs peut, certes, toujours se 
ramener à l'application des équations de Maxwell (cf. chapitre d'Électrodynamique), mais il est cependant 
humainement impossible de comprendre la conception de certains systèmes en ce cantonnant à un niveau 
aussi théorique. 


Il est alors d'usage dans l'industrie de hiérarchiser l'analyse en 5 niveaux: 


NO. Physique du solide: Ce modèle est essentiel pour l'analyse des propriétés électriques et magnétiques de 
la matière. Il s'appuie sur les lois de la physique quantique et mène essentiellement à la description de 
bandes d'énergie et au calcul de leur degré d'occupation. Ce modèle explique par exemple les propriétés 
fondamentales des semi-conducteurs. 


N1. Électromagnétisme: Ce modèle est essentiel pour l'analyse des dispositifs travaillant aux 
hyperfréquences et celle des dispositifs électromagnétiques. Il s'appuie sur les relations de Maxwell et fait 
appel à la théorie mathématique des équations aux dérivées partielles. Ce modèle ne permet plus 
d'analyser l'influence d'un atome car les objets étudiés sont à un niveau plus macroscopique, décrits par 
leurs dimensions, leur permittivité, leur conductibilité, etc. 


N2. Théorie des circuits: Ce modèle est essentiel pour l'analyse des dispositifs électroniques dans le cas 
très courant où les dimensions du dispositif sont largement inférieures à la longueur d'onde du phénomène 
étudié. Ce modèle s'appuie sur les lemmes de Kirchhoff et la définition d'une demi-douzaine d'éléments 
discrets, résistance, capacité, inductance, cours, etc. Il n'y a plus de géométrique dans un tel modèle mais 
seulement une topologie. On peut calculer le courant et la tension, grandeurs scalaires, alors que les 
champs n'ont plus de sens. Les techniques mathématiques sont celles des équations différentielles 
ordinaires, transformations de Laplace, calcul complexe et matriciel, etc. 


N3. Schémas fonctionnels: À ce niveau, nous ne tenons plus compte de courants ou de tensions, in a 
fortiori de la géométrique du système. Celui-ci est constitué par la connexion de blocs remplissant des 
fonctions caractérisées par des relations entre grandeurs de sortie et d'entrée. 


NA. Systèmes: À ce niveau, nous schématisons en bloc fonctionnel un ensemble de blocs du niveau 3. Un 
ordinateur est par exemple une interconnexion de différents systèmes logiques réalisant chacun une 
fonction particulière. 
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N5. Logiciel: À partir de ce niveau, l'ingénieur n'ajoute plus de dispositifs supplémentaires, ne les combine 
plus en des systèmes plus vastes, mais il programme la machine. Les méthodes théoriques se rapprochent 
alors plus souvent de la linguistique que de la mathématique. 


Ce chapitre doit permettre de se familiariser avec le langage et certaines méthodes de calculs utilisées par 
les ingénieurs de cette branche pour les 4 premiers niveaux. Cependant en toute rigueur toute formation 
dans ce domaine doit être complétée par des travaux pratiques en laboratoire! 


Nous avons tenté de respecter aux mieux dans les schémas la série de normes NF EN 60617 pour les 
symboles des composants électriques. Comme ces derniers sont très nombreux, nous proposons ci-dessous 
un tableau uniquement des composants utilisés ou mentionnés jusqu'à maintenant dans ce chapitre. Ce 
tableau évoluera donc au fil du temps: 
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Courant alternatif av 


Polarité positive ù j 


Polarité négative = 


Source idéale de tension 


Liaison 


Points de liaison ® (e) 


Liaison en T | | 


Résistance —-—- 
1 

Condensateur EE 

Inductance seen 


Contact à fermeture, à retour automatique 


Inductance à noyau magnétique | sÉbie | 


Transformateur à deux enroulements au 
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Tableau: 28.1 - Symboles utilisés de la norme NF EN 60617 


1. COURANT ALTERNATIF VS COURANT CONTINU 


Le lecteur va remarquer que tout au long de ce chapitre du site, nous allons principalement travailler avec 
du courant alternatif. Il nous semble important d'expliquer l'origine de cet attrait du monde industriel 
contemporain pour le courant alternatif avant d'aller plus loin. 


Au fait, l'origine de cet attrait est relativement simple: 


Quand des centrales électriques virent le jour, surtout dans les régions éloignées des centres urbains, il 
fallut transporter l'énergie électrique produite sur des longues distances. Mais les câbles qui transportent 
l'électricité ont une certaine résistance et cela posa un problème majeur. 


Effectivement, une ville moyenne peut largement avoir besoin d'une puissance d'environ 10 [MW]. Si cette 
quantité devait être transportée sous une tension modeste d'environ 100 [V], comme P=£&7 (cf. chapitre 
d'Électrocinétique), le courant devait être énorme: 100'000 [A] ! 


Mais l'effet Joule dans le cuivre de 1 [cm] de diamètre a une résistance linéaire de À = 0.4 [{2/ #]. Avec 
un courant de 100'000 [A], la perte d'énergie par effet Joule serait d'environ (en négligeant la chute de 
potentiel): 


P=R.1*=4'000 [MW/km] (711) 
… On voit très vite le problème! 


Au prix de 0.1 [$/&W#. x], cela représentant un coût (perte) d'environ: 
C=04.10 [$.x"ml] (12) 


humm...! 


Il n'y avait d'autres choix économiques que de baisser le courant. En clair, si la tension atteignait 10° [77] ; 


la même puissance pourrait être transportée efficacement par 100 [A]. Ainsi, en élevant la tension par un 
facteur 1000, nous pouvons réduire le courant d'un facteur 1000 aussi, et donc la perte Joule par un 
facteur 106. 


Comme il existait déjà un dispositif simple pour élever et abaisser la tension alternative (les 
transformateurs) sans aucun dispositif comparable pour la tension continue (du moins à l'époque), la 
course a été gagnée par les adeptes du courant alternatif. 


Il faut rajouter également comme deuxième intérêt que certains composants électriques linéaires (voir plus 
loin) n'ont pas beaucoup d'intérêt en courant continu... nous y reviendrons! 


Voyons un montage simple pour générer du courant alternatif monophasé: 
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Courant de 1ensron 
= 


Figure: 71.1 - Exemple de générateur de courant alternatif 


La tension (respectivement le courant) est déterminée par la loi de Faraday démontrée dans le chapitre 
d'Électrocinétique: 


qui donne donc la force électromotrice (ou tension dans le cas d'un générateur sans résistance...) induite. 


Nous avons bien évidemment dans la situation ci-dessus si l'aimant est permanent et la longueur de la spire 
carrée est L: 


es 


a? Beds __Lpdcosg 
di dt dé 


_ps d cos(æt) 


= BSæsn(æf) (71.4) 


Nous voyons déjà que pour obtenir une certaine force électromotrice, il sera préférable de jouer avec la 
fréquence de rotation plutôt qu'avec la surface ou l'intensité du champ magnétique... ou encore 
d'augmenter le nombre de spires par un montage permettant d'arriver à la relation suivante: 


e= NBS@sin(@) (71.5) 


Il convient d'indiquer pour les sceptiques qu'il y a bien conservation de l'énergie dans ce système! 
Effectivement, l'énergie nécessaire à faire tourner la spire sera celle en partie utilisée par le système (et 
c'est pourquoi les barrages font tourner des turbines avec de l'eau et les centrales nucléaires avec de la 
vapeur et les éoliennes avec du vent...). 


Évidemment le cas inverse comme un courant alternatif injecté dans la spire la fera tourner dans le champ 
magnétique. Donc dans une situation, nous avons un générateur électrique et dans le cas inverse un 
moteur électrique. 


Il est possible avec un appareillage similaire de produire une tension continue à peu près fiable de la 


manière suivante appelée “"dynamo": 
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L 
I RM  3r 28 t 
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Balai 
Figure: 71.2 - Exemple de générateur de courant continu 


Le générateur simple donné en premier avec quelques aimants en fer à cheval produisant le champ 
magnétique était très utilisé au début de l'ère de la technologie électrique mais à des tensions élevées 
(plusieurs [kVT) et des courants internes élevés aussi (plus de 50 [A]). Les balais métalliques et les bagues 
collectrices produisaient alors des étincelles et s'abîmaient relativement vite. Actuellement, cette machine 
à armature tournante n'est plus très utilisée. 


Pour éviter les difficultés associées aux tensions dépassant environ 600 [V], nous faisons aujourd'hui 
tourner des électroaimants autour d'une armature immobile. Le courant qui alimente les électroaimants 
tournants (qui peuvent aussi être des aimants permanents), est relativement faible et il ne pose aucun 
problème au fonctionnement des bagues et balais. Cette configuration est appelée alors un "alternateur" 
(l'exemple le plus commun étant la vieille lampe à vélo abusivement appelée dynamo alors que ce n'est pas 
une!). 


Avec des composants linéaires électriques il est aussi possible au besoin de redresser la tension (nous 
verrons cela beaucoup plus loin). Nous avons alors une dynamo! 


1.1. PUISSANCE MOYENNE 


Nous avons défini dans le chapitre d'Électrocinétique que la puissance joule était donnée par en régime 
constant pour un conducteur par: 


P=U.I=R.I? (16) 


En régime alternatif périodique et à basse fréquence (afin de considérer la résistance comme constante) 
nous avons dans le cas purement résistif: 


ptj=R.i(é? (717) 


Il vient alors (cf. chapitre de Calcul Différentiel Et Intégral) pour la valeur moyenne d'un signal périodique 
de période T: 


1° 


+T +7 
— | 
T 


1 
u(9 Ed = R| > [icÿæ| «18 


H H 


p= 


Le terme entre parenthèses peut donc être comparé à la valeur qu'aurait un courant continu produit la 
même puissance joule. Donc: 
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+ +T 


1 
P=RI"=R T | i()* dt (71.9) 
HA 


Nous appelons ce courant équivalent la "valeur efficace du courant" ou "courant root mean square" 
(abrégé "courant RMS") et la notons: 


1 
Lg = : | i@)dé (7110) 


t 


Sr E 1 
— 15 | cos (8148 = [—1m= D (7111) 
2 > 27 Na 


Dès lors nous avons: 
| À 
PAROMOQ (71.12) 


Et, par la même méthode, en souhaitant calculer la puissance moyenne, nous obtenons en régime 
sinusoïdal: 


Ü 


- Lo (71.13) 
F0 


Donc pour une tension et un courant ayant même phase, nous pouvons écrire: 


En toute rigueur il nous faut généraliser cette dernière relation pour des situations où le courant et la 
tension sont déphasées d'un angle (ou temps) @. 


Remarque: Malheureusement de nombreux ouvrages d'électronique ou mêmes d'articles de recherche 
ont défini une puissance qui n'a aucun sens physique et qui est appelée la "puissance RMS" et mesure 
des... "Watts RMS" définie par analogie de la manière suivante: 


+7 
| p(6}? dt (71.15) 


t 


Même si ce terme est utilisé par les annonceurs et certains rédacteurs, il n'a pas sa place dans une 
publication technique digne de ce nom. Il apparaît souvent pour donner un semblant d'expertise 
technique. 
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Considérons maintenant une autre approche de la puissance cette fois-ci du point de vue instantané dans 
un cas plus général que purement résistif. Dans le cas général, nous avons en régime permanent sinusoïdal 
le droit d'écrire la tension et le courant avec des cosinus sous la forme suivante (forme qui implicitement 
prend aussi en compte le déphasage du courant et de la tension): 


u (8) = Di cos(@t + a) 


(71.16) 
i(£) = do cos(@t + 6) 


Nous avons alors en utilisant les relations remarquables trigonométriques: 
PE) = u(#)i(#) = oo cos(@é + d)cos(@f + 8) 


(æ— 81+ 2 ++ FA) Ur À 
TE D cos(2at + a+ f) (71.17) 


2 
= eff la cos (+ Dig ler cos(2@f + + 6) 


où nous avons choisi de poser: 
g=a-#8 (71.18) 


tel que ce terme soit positif ou nul (nous pouvons toujours faire le choix de soustraire l'un des deux termes 
à l'autre afin d'avoir une valeur de & strictement positive ou nulle sans que cela change les 


développements et conclusions qui vont suivre!) et où nous avons utilisé les résultats obtenus 
précédemment: 


Ainsi, dans l'expression: 


p)= Leg Lg cos | Pi+Ug Lg cos(2@t+&+ 8) (71.20) 


la puissance instantanée comprend donc une composant constante (premier terme) et une composante 
pulsée et de fréquence double de celle du courant et de la tension. En utilisant: 


ainsi que la relation trigonométrique remarquable suivante (cf. chapitre de Trigonométrie): 
cos 2@t+a+ 6i=cos2m+24-@pi=cos{picos( 2 +24)+sainipiani2ææ+2æ) (7122) 


Nous avons alors: 
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PE) = Leg Lg cosioi + lg [cos(icos(2at +2@)+sin(@isin (2at +24] 


(71.23) 
= eff le cos | pi[1+cos. 24 +2@) ]+ Log eg sin(@isin(2@t+2&) 


Cette dernière relation met en évidence que la puissance instantanées peut toujours être ramenée en 
régime sinusoïdal permanent à la somme de deux termes où: 


- le premier est une composante pulsée, toujours positive (par construction), qui oscille autour de la valeur 
moyenne Leg Î gy C9 Pi et qui traduit un échange d'énergie unidirectionnel entre une source et une 


charge. 


- le deuxième est une composante alternative qui varie sinusoïdalement avec une amplitude 
y Lg sin { Pi et une valeur moyenne nulle. Elle est donc alternativement positive et négative et traduit 


un échange oscillatoire d'énergie entre une source et une charge. 


Lorsque g= 0 (charge purement résistive parfaite), nous avons alors: 
cos(@i=1,sin(gi=0 (71.24) 


La valeur moyenne Leg Fi gy ©9S{ Pi est alors maximum et égal à De Î 47 > alors que le deuxième terme (la 


composante alternative) est nul. 


Par contre, lorsque g=+:r/f2 (charge purement réactive comme inductance ou capacité idéales), alors: 


cos(@i=0,san(@)=+1 (7125) 


et dans ce cas, la puissance instantanée se réduit à la seule composante alternative. De ceci il découle les 
définitions suivantes: 


Définitions: 
D1. Nous appelons "puissance active" le terme: 
Dogr ler cos(@) (71.26) 


mesurable par un wattmètre et qui correspond à une fourniture réelle d'énergie convertible en travail ou en 
chaleur et qui est donc maximale dans le cas d'une charge purement résistive (idéale) et nulle en cas de 
charge purement réactive (idéale). 


D2. Nous appelons "puissance réactive" le terme: 
Dog leg sin(@) (71.27) 
qui n'est pas mesurable par un wattmètre puisque nul par alternation. 


D3. Nous appelons "puissance apparente" le produit: 
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Deglg (71:28) 


qui est en apparence une puissance, mais ne fournit pas nécessairement un travail, d'où son nom... Par 
tradition c'est la puissance apparente qui est indiquée sur des grosses installations industrielles. On peut la 
reconnaître car les unités sont souvent indiquées en volts-ampères VA plutôt qu'en watts W (car il ne s'agit 
pas totalement d'une puissance). 


2. TRANSFORMATEUR 


Un transformateur électrique statique est une machine électrique permettant de modifier les valeurs de 
tension et d'intensité du courant délivrées par une source d'énergie électrique alternative, en un système de 
tension et de courant de valeurs différentes, mais de même fréquence et de même forme. 


Rappelons que nous avons démontré dans le chapitre d'Électrocinétique que: 


Si nous arrivons d'une manière ou d'une autre à faire passer le flux d'un premier solénoïde, appelé alors 
"enroulement primaire", ayant: 


à un deuxième solénoïde, appelé alors "enroulement secondaire", et ce sans aucune perte (ou du moins 
une perte négligeable) tel que: 


db di 
= —=—Î9 — (7131) 
2 7 
Il vient alors par identification terme à terme: 
1... 
e MN 


et si les résistances internes sont négligeables la force électromotrice induite est égale alors à la tension 
aux bornes, il vient alors: 


et si toute l'énergie du champ magnétique est transmise dans l'enroulement secondaire, nous avons: 
Æ = B Li = Ul (71.34) 


d'où: 
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U 
U à M 


Ainsi, le rapport du nombre de spires primaires sur le nombre de spires secondaires détermine totalement 
le rapport de transformation du transformateur qui peut être utilisé alors comme station de transformation 
de la tension en montant ou abaissant celle-ci en fonction du nombre de spires de l'enroulement 


secondaire. Il convient aussi de noter qu'un transformateur qui augmente la tension diminue simultanément 
le courant et inversement. 


Un instrument historique et pédagogique typique permettant de faire cela est le transformateur monophasé 
à noyau ferromagnétique: 


1] 1 
S 2% enroulement 
= 


À secondaire 


Fr à Üuener 7 
Er Naneer 
| 


hgnes de champ 
magnétique 


ferromagnétique 
Figure: 71.3 - Exemple type de transformateur monophasé à noyau ferromagnétique 


Dans la pratique, les transformateurs monophasés bas de gamme ont les enroulements qui sont 


concentriques pour minimiser les fuites de flux. Un isolant est inséré entre le circuit primaire et le 
secondaire: 
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Figure: 71.4 - Transformateur monophasé concentrique type (source Wikipédia) 


Les transformateurs de par leur possibilité d'augmenter la tension et de réduire le courant (économie au 
niveau de la perte Joule comme nous l'avons déjà mentionné) jouent un rôle important dans la transmission 
de l'électricité des infrastructures domestiques (basse tension: BT, moyenne tension: MT, haute tension 
HT). Ainsi nous retrouvons les transformateurs élévateurs (TE) et les transformateurs abaisseurs de 
tension (AT) dans la vie de tous les jours: 


Ligne haute tension (HT) 


12'000[71  240000[7] 230 [7] 


8000 [77 


Figure: 71.5 - Installation civile typique de transformation de tension 
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3. CIRCUITS LINÉAIRES EN RÉGIME CONSTANT 


Nous allons voir ici des circuits composés d'éléments simples comme une résistance, une capacité et une 
impédance. Ces circuits, dont l'équation représentative est une équation différentielle linéaire, sont appelés 
"circuits linéaires". Par ailleurs, ils sont un excellent exemple pour voir la lourdeur des développements en 
utilisant des représentations mathématiques classiques à l'opposé d'autre s techniques beaucoup plus 
souples et puissantes (représentation par phaseurs et transformées de Laplace). 


3.1. CIRCUIT RC SÉRIE 


Tout circuit possédant un condensateur possède également une résistance, ne serait-ce que celle des fils de 
connexion. De tels circuits RC série sont très courants et parfois d'une grande importance (stimulateur 
cardiaque par exemple). Effectivement, quand nous fermons un circuit qui ne contient que des résistances 
(circuit purement résistif), le courant monte à sa valeur nominale dans un temps extrêmement bref, de 
sorte que nous pouvons considérer que le courant et la tension sont constants avec une excellente 
approximation. Ainsi, le régime permanent s'établit après un régime transitoire très bref. Au contraire, dans 
un circuit RC série, tension et courant prennent un certain temps pour atteindre leurs valeurs nominales. 
Cette dépendance en fonction du temps a de multiples applications et permet de produire toute une 
gamme de signaux modulables dans le temps en fonction des besoins. 


Figure: 71.6 - Circuit RC série 


Nous supposons qu'initialement le condensateur est chargé et qu'il ne circule aucun courant (interrupteur 
ouvert): 


gé=0)=@ etié=0)=0 (7136) 


Quand nous fermons l'interrupteur les électrons partent du condensateur C. Nous avons alors aux bornes 
de la résistance: 


aux bornes du condensateur: 


L'équation du circuit est alors: 
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RE 0 (71.39) 
dt C 


Soit: 


1 1 
—dq =-——df (7140 
g RC (71.40) 


q 


Équation différentielle triviale dont la solution est avec les conditions initiales: 


Soit: 
g=Qet'#Æ (7142) 
Le courant a alors la forme suivante: 


ei gt!RC (71.43) 


i=-— 


RC 


Il s'agit donc d'un système où le courant décroît exponentiellement et ce d'autant plus vite que le facteur 
RC appelé "constante de temps" est petit. Nous voyons ce genre de système lorsque la lumière à l'intérieur 
d'une voiture s'éteint document après fermeture des portes. 


Lorsque l'on met ce régime sous une tension permanente £/,, nous avons alors une équation de la forme: 


dg 1 
R—=+—g=Un (71.44) 
4 ee © 


Une solution particulière évidente est alors: 
g=@=CU (7145) 
Nous avons alors la solution générale: 
g=-Qpe FE +CU, (7146) 


soit pour le courant: 


Et pour la tension aux bornes du condensateur: 


g=- 2 -1RC +T} =—{} {RC LT} = 1e t"8 (71.48) 
c 0 Œ 0 0 


l 
gr C 
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ce qui représente donc la tension aux bornes du condensateur lors de la charge. Donc au final nous avons 
les deux relations: 


; - ©0 ,-#RC 
RC (71.49) 


ue = Ua | 1-8" t/RC | 


Ainsi, en posant L, =, nous avons respectivement à la fermeture et ouverture du circuit: 


Uk t) 


Figure: 71.7 - Charge et décharge du condensateur lors de l'ouverture/fermeture de l'interrupteur 


Étudions maintenant l'aspect énergétique qui est important en ingénierie puisque la consommation ou perte 
de puissance (rendement) est un facteur de vente important dans certaines applications! 


Pour cela reprenons la relation: 


dg 1 dq 
Mt g=R pur =U (7150) 
met x C0 


À 


et multiplions par i: 
Ri? +upi= Uni (7151) 


Ce que nous écrivons: 


Puisque: 


Le 14h. 2e 
C dt Cd C dé 


où nous voyons donc que dès que le régime transitoire de charge ou décharge est terminé, la tension aux 
bornes du condensateur étant nulle alors le courant est nul. 


Nous avons alors: 
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de pt (ice) (71.54) 
£ dt \2 


Uni = Ri° +u,C 


où le premier terme est la puissance fournie par le générateur au circuit, le second est le terme d'effet Joule 
et le troisième est la puissance stockée dans le condensateur: 


L'énergie fournie par le générateur se retrouve stockée dans le condensateur et dissipée par la résistance 
par effet Joule. 


Ce qui est le plus important c'est de faire un bilan sur toute la durée de charge du condensateur pour 
signaler la puissance dissipée dans les caractéristiques de vente (cela passe mieux que de mettre des 
équations..). Pour cela, il suffit d'intégrer la relation précédente de O à l'infini pour obtenir l'énergie 
dissipée. 


Le premier terme à gauche de l'égalité donne: 


+o ko ko du +0 
[ Uoidt = U, [ idt = ] de = UC [de 
0 0 0 0 (71.55) 


= UnC(u, (Ho) -1,(0)) = UoC (Un -0)= CUË 


Le second terme s'intègre en utilisant i(t): 


2 2 
Tax = Le D RC | y Te TS) are |, _ Us ET? 
2 TE 
(El (el RC 0 À C À 0 


+0 
Up? (Here) ”_ 
2 


(71.56) 
Un C ; 2 1re 1" : Up?C : lr; 2 
2 ( 1h a Pb oC 


Q 
Le troisième terme s'intègre immédiatement puisque nous avons déjà la primitive: 
+ +0 
à fl l 1 
[<lscu la [al-cuèl--cu 157 
: 2 n \2 2 
Nous obtenons finalement: 


CUË = SU += UC (71.58) 


Ainsi, pour des durées grandes, la moitié de l'énergie fournie par le générateur est dissipée par effet Joule 
et l'autre stockée dans le condensateur. 
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3.2. CIRCUIT RL SÉRIE 


Considérons le circuit suivant: 


q 


ee — 
î 
Figure: 71.8 - Circuit RL série 
Quand nous fermons l'interrupteur, nous avons alors aux bornes de la résistance: 
üg =R-i (7159) 
et aux bornes de l'inductance: 


Uy = L£ (71.60) 


et L, aux bornes du générateur de tension continue. 


L'équation du circuit est alors: 


LA LR =U, (7161) 
dt 


Soit: 
008 (71.62) 
dt 
En inversant: 
1 
— dt = -di (71.63) 
FA 0 — Î 


Faisons un changement de variable: 


U, — À = > = -R (71.64) 
3 


Alors: 


À 


© ns, + 


U,-RI 1 
[ —dx (71.65) 
MS 
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Il vient alors après intégration: 


1 1 U,-R | 1, [Uo- ki . 
FA 07 E [no — Ri)-In(Ü)]= FL (ue) (71.66) 


Multiplions les deux membres par -R, puis prenons l'exponentielle des deux membres: 


Fa Ua 
et: 
| R 
Le —g L (7168) 
U5 
Alors: 
U | uv ” 
=—0|j 671 = {1e - 4 (71.69) 
À À 


où nous avons la constante de temps définie par: 
T=Li{R (7170) 


Ainsi, à la fermeture de l'interrupteur, le courant croît de manière exponentielle avec une asymptote à la 
valeur TL; { À. Donc contrairement à au circuit RC, le courant tend vers une valeur fixe non nulle lorsque t 


tend vers l'infini!!! 


Nous avons donc: 


ER ER 
#)= L——|1- = ——|]|- = —°—| 8 1 |={Ue Ê (7171 
uz () at re" LA R dt 0 
Donc au final nous avons les deux relations: 
i=0{-e tr) 
+ (71.72) 
LT = Üpe L 


Étudions maintenant l'aspect énergétique qui est important en ingénierie puisque la consommation ou perte 
de puissance (rendement) est un facteur de vente important dans certaines applications! Comme pour le 
circuit RC, nous allons directement faire un bilan sur toute la durée du régime transitoire pour signaler la 
puissance dissipée dans les caractéristiques de vente (cela passe mieux que de mettre des équations...) 
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Multiplions les termes de l'équation différentielle par i(t): 


LÀ +8 > POITE = Uni (7174) 
di 2 dt 


Ce que nous écrivons: 
Pit) +pr()=PeË) (7175) 


Pour calculer l'énergie dissipée, nous procédons de la même manière que pour le circuit RC série. Nous 
avons après intégration: 


1 ,f.2 2 T2 
SE (oo) (0))+ [ Ra = [Did (170 
0 (a) 


soit: 


(E] (n] 
71:77 
py2 + : py2 + _& a 
| l=e tr | = 2 | 1-e E lat 
R; R 3 


Contrairement au cas du circuit RC, nous ne pouvons intégrer ci-dessus avec les bornes données à cause 
du "1-" qui est devant l'exponentielle car celui-ci fait tendre la puissance consommée vers l'infini ce qui est 
logique, contrairement au circuit RC qui finit lui par se bloquer une fois la capacité chargée (le courant i 
tendant vers zéro très vite). 


Donc soit, nous intégrons seulement jusqu'à un t temps limite suffisamment grand par rapport aux valeurs 
des éléments passifs (deux ou trois T), soit nous nous intéressons à titre purement indicatif à la valeur 
instantanée de la puissance. Nous avons alors: 


Pe)=D'i=U (i-et)s % (1er 
PRISE ER: Bet : (1er) (71.78) 


R 2 
mu DE - 
= - I Of tri DO -tfrfs ir 
pité) =u;(é)-i=Uie R (1 e )= 8 (1 e ) 


Et donc à la fin du régime transitoire quand £ — +: 
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Pa) = 


2 
= 
A 

2 71.70 
Di (71.79) 
AR 


PRE)= 
Pité)=0 


donc en régime stable la résistance est le seul élément dissipatif d'énergie dans le circuit et il suffit de 
multiplier alors la puissance dissipée par l'intervalle de temps désiré pour avoir une estimation de l'énergie 
dissipée. 


3.3. CIRCUIT RLC SÉRIE 


Un fil électrique (une antenne par exemple) n'est pas un conducteur parfait. En réalité il peut être assimilé 
à une résistance, une capacité et une inductance interne en série. Si nous prenons le cas par exemple des 
générateurs, souvent on ne considère que la résistance interne comme non négligeable et celle-ci fait bien 
évidemment diminuer la tension nominale du générateur d'un facteur en première approximation 
proportionnel au courant qui le traverse. 


Pour étudier le comportement d'un tel élément souvent appelé "circuit RLC" nous le représentons d'abord 
sous la forme suivante: 


Figure: 71.9 - Circuit RL série 


Nous supposons qu'initialement le condensateur est chargé et qu'il ne circule aucun courant (interrupteur 
ouvert): 


gt =0)=g etié =0)=0 (7180) 


Quand nous fermons l'interrupteur les électrons partent du condensateur C. Nous avons alors aux bornes 
de la résistance: 


up = Ri=R— (7181) 
aux bornes du condensateur: 
Un = L g (71.82) 
l' — — .0< 
Ce 


aux bornes de la bobine: 
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La somme des différences de potentiel du circuit est égale à la différence initiale de potentiel d'où: 


2 
ja rpe,k, =0 (7184) 
dé dd © 
ou autrement écrit: 
2 
LC uirca +g=0| (71.85) 
dt dé 


Il s'agit d'une équation différentielle linéaire du second ordre très connue en physique (nous la retrouvons 
à l'identique dans d'autres domaines avec juste des constantes différentes). Pour la résoudre il faut 
chercher les racines de l'équation caractéristique associée (cf. chapitre de Calcul Différentiel Et Intégral}: 


LC +RCx+1=0 (71.86) 


Celle-ci a pour discriminant: 
A=R?C?-4LC (7187) 


La valeur de la résistance pour laquelle ce discriminant est nul est appelée "résistance critique": 
R,=2 E (71.88) 
C 
Nous pouvons ceci dit écrire le discriminant sous la forme suivante: 
L 
À = c? (2° 4®) =C?(R-RE) (7189) 


Les solutions de l'équation différentielle sont différentes selon le nombre et le type des racines de 
l'équation caractéristique. 


3.3.1. RÉGIME CRITIQUE 


Il s'agit du cas où À = À. L'équation caractéristique admet alors une racine double réelle puisque: 
£ 
À = C? (r° 45) = C?(R?-R£)=0 (7190) 
C 
Nous avons alors: 
= Fr. (71.91) 


avec: 
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T=4LC (7192) 


L'équation différentielle admet alors une solution du type suivant lorsque le discriminant est nul (cf. 
chapitre de Calcul Différentiel et Intégral): 


t 


+ ct E TC 71.93 
g ( + je : ” 
en omettant le retard. 


Ce qui donne pour l'intensité: 


+ 
NF € | HE 
dt fa lc JEc 


Les constantes sont définies par les conditions initiales: 
gŒ=0)=C =40 

C C (71.95) 

«= 0=[c- £ jo=c RE 


VLC 


Nous obtenons donc pour la solution globale: 


(71.96) 
* ARE 
ay = Te tft 
Donc au final, nous avons les deux relations: 
: E | -= 
i=40 fi+i}e te 
# (71.97) 


Les figures suivantes illustrent l'allure de l'évolution temporelle de la charge du condensateur et de 
l'intensité au travers de l'inductance. L'intensité est maximale pour £ =+T dans l'inductance: 
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g(£) 


i(é) 


T FA 


Figure: 71.10 - Comportement du courant dans le circuit lors de la décharge du condensateur 
3.3.2. RÉGIME APÉRIODIQUE (OU HYPERCRITIQUE) 


Il s'agit du cas où À > À. L'équation caractéristique admet alors deux racines réelles distinctes: 
£, 
A=Cc (re 4%) > 0 (71.98) 


Soit: 


-rca fe] (&- =) -actcfe- 42 be cn 2-42 


D ets Pc 


Les deux racines sont de même signe, car en utilisant les relations de Viète (cf. chapitre de Calcul 
Algébrique) nous avons: 


l 
K,K:3 =——>0 (71100) 
12770 


Les deux racines sont donc obligatoirement négatives. Nous notons leurs valeurs absolues: 


Ces deux racines sont donc négatives. Nous notons leurs valeurs absolues: 
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2 _ p2 
si (& 6) (71.101) 
Hal 2£ 
qui vérifie donc: 
K & = _ (71.102) 
de | 


Nous avons vu dans le chapitre de Calcul Différentiel Et Intégral qu'à ce moment la solution (sans 
déphasage) est de la forme: 


g = AeŸ +Bef% (71.103) 
Ce qui donne pour l'intensité: 
i= AKjeŸ +BK6%® (71.104) 


Les constantes À et B sont définies par les conditions initiales: 


(71.105) 


at =0)= A+B = 40 
i(é= 0)= KA+K,B=0 


Ce qui nous donne: 


Soit sous forme conventionnelle: 


E:90 B= Ko 


A=-270 = 
K -K&, K -&£; 


(71.107) 


Soit en reportant dans les expressions de la charge et de l'intensité: 


q= KE. nr (ke** - Ke) 
: (71.108) 
. KE%0 (e** et) 
K - 3 


Les figures suivantes illustrent l'évolution temporelle de ces fonctions (se rappeler que les racines sont 
négatives!). 
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g(£) 


(6) 


T É 
Figure: 71.11 - Comportement du courant dans le circuit lors de la décharge du condensateur 


3.3.3. RÉGIME PSEUDO-PÉRIODIQUE (OU DES OSCILLATIONS AMORTIES) 


Il s'agit du cas où À < À... L'équation caractéristique admet alors deux racines complexes conjuguées: 
3 2 4 2 2) R 
ré EE — Re nn _ EE) (R _. _ LÀ ns (71.109) 
13 


qui sont assimilées à la résistance du circuit. Nous l'appelons "impédance complexe". 


Nous allons voir que contrairement à l'intuition de l'époque, les racines complexes ont une signification 
physique réelle. 


Notons pour cela & et & les valeurs absolues des parties réelle et imaginaire de ces racines: 


K2=-&t+tiæ (71110) 


avec: 


” 


&= K2 = . (71.111) 


et: 
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| 2 _ pa 2 2 
Ne K _R _ LE ur (71.112) 
22 4Ë A Ve T 


Nous avons vu dans le chapitre de Calcul Différentiel Et Intégral que la solution de l'équation différentielle 
s'écrit alors: 


q4 = AeË + BefË = 9% (A'cos (@é) + B'cos (æt)) =C'e ® cos (œé — f) (71.113) 
Ce qui nous donne pour l'intensité: 


i= a ce cos( at #) =-ac'e * cos (at _ #) -C'e % sin (@i- # 
dt (71.114) 


=-C'e € [æcos(aæ —#)+ æsin (@ = &)] 


Les constantes C'et # sont déterminées par les conditions initiales: 


gt = 0)= C''cos($#) = 4) 


(71.115) 
i(£ = 0) = -C'[æcos (—-#)+æsin (-#)] = 0 
Ce qui nous donne: 
C'= 70 tan(—#) = = (71.116) 
cos Ÿ æ 
Soit: 
C'=-7 et tang- ue (71.117) 
cos # cos # æ 


Soit en reportant dans les expressions de la charge q et du courant i: 


g= rer cos(æé—#) (71.118) 
et: 
__ 40 -« L : : 
i er à [cos (at #)+æsin(æt #)] 


(71.119) 


LR ça pre]  cos(at- + 2 sin (at 
. + #)+ > sin (@é ] 


Cherchons à simplifier un peu cette dernière égalité. D'abord nous avons démontré juste avant que: 
@ = @ tan? $ (71.120) 


d'où: 
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“à 
Ja + = 4/a° tan? #+ = œftan? g+l= . ÿ ,; 


2 
cos" ÿ (71.121) 
æ : æ 
L sin? Ê+ cos? g = 
cos Ÿ cos # 
Ce qui nous donne: 
. 30 «+ : 
1=—-——8 &cos|—-#]+æsn| dé — 
6% [æcos(ar-)+ on (ar -#)] 
(71.122) 
0 {ét Œ & . 
= -——2 ee CE] 
2 
LES Va + Va +? 
Or, nous avons aussi: 
1 cos # 
D—— © œ =Cos® (71.123) 
a“ +æ æ 
et: 
1 COS sin : 
a = 4 NT EN s = 6 (71.124) 
ad + æ? & cos ÿ 


Nous avons alors: 


: e [- sin cos (@t - $) + cos sin (a _ #)] 


= —5-e" [sin gcos (@f — #\— cos sin (@t- #) | (71.125) 


ee - ri —œ : 
e  sin(—@f) = — 20 ge gin(@f) 
cos" ÿ 


Nous avons au final les deux relations suivantes: 


90 “31, 
ee 2L cosi at — fi 
cos 
R (71.126) 
æ er. 
"0, 21 info 


cos? Ÿ 


Donc un tracé de i dans l'inductance et de q de la capacité donnera: 
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10) 


10 


Figure: 71.12 - Comportement du courant dans le circuit lors de la décharge du condensateur 


5 
Il 
| 


(71.127) 


est le "facteur d'amortissement". Si nous voulons avoir de belles oscillations peu amorties, il y a intérêt à 
avoir ce terme le plus petit possible donc une valeur de R petite. 


Lorsque R est nul nous avons alors: 
1) =-@gn sin(@é) (71.128) 


avec donc: 


FA 
@ 1 (71.130) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Il faut donc jouer alors avec C ou L pour obtenir la période désirée dans le cas où la résistance est nulle. 
Signalons également que cette situation particulière est appelée "oscillateur harmonique". 


Enfin, de par les résultats obtenus, nous avons donc la généralisation des circuits RC, RL ou LC série. 


Maintenant, supposons que dans le circuit nous posions une alimentation continue en série dans le circuit. 
Nous avons alors: 


L'équation différentielle linéaire à coefficients constants a maintenant un second membre (constant dans 
ce cas). Nous trouvons alors immédiatement une solution particulière qu'il suffit ensuite d'ajouter à toutes 
les solutions que nous avons obtenues précédemment. 


Une solution particulière est donc: 


g=C" (71132) 
Donc: 
d°g _da 1 _ 
LS +R— + g=L.0+R0+—g=—g=U (71133) 
2 po et ot 
Soit: 
up 
=— (71.134) 
7 D 


Cette solution particulière qui est à ajouter aux solutions précédentes, n'a aucune influence sur les 
équations du courant (sa dérivée étant nulle). Par contre, elle décale sur les graphiques le tracé de q(t) vers 
le haut. Voilà donc l'effet qu'il y a à rajouter une source de tension constante (comme une simple pile par 
exemple). 


4. CIRCUITS LINÉAIRES EN RÉGIME FORCÉ 


L'objectif sera pour commencer, d'étudier le comportement d'un circuit linéaire RLC série excité par un 
générateur de tension sinusoïdale puisqu'il est une généralisation des circuits RL ou RC (il suffit d'annuler 
L ou C respectivement pour tomber sur les solutions d'un circuit RC ou RL). 


Nous avons alors: 


d? dg 1 
La RE + 4 = Unsin(at) (71.135) 


qui est une équation différentielle de forme connue et donc importante dans le domaine de l'acoustique car 
nous l'y retrouvons identiquement pour l'étude des haut-parleurs. 
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Nous pourrions très bien rajouter un déphasage au terme sinus à droite de l'égalité (arbitraire de phase). 
Cela ne changerait rien aux développements qui vont suivre et rappelons aussi que le cosinus n'est qu'un 
sinus avec un déphasage bien précis! 


Enfin, le plus important, c'est que si nous trouvons une solution particulière à l'E.D. ci-dessus, alors 
puisque l'amplitude et la pulsation peuvent prendre n'importe quelle valeur à un déphasage arbitraire près 
alors nous avons donc une infinité de solutions particulières. Et comme nous avons démontré lors de notre 
étude des équations différentielles que la somme de solutions particulières est aussi solution alors cela 
signifie qu'une excitation obtenue avec une série de Fourier aura aussi une solution et en passant à la limite 
nous avons une transformée de Fourier! 


Donc passons à notre étude. Pour cela, dérivons cette relation par rapport à t: 


di di 1 | 
Fe —i=Uiæcos(æf) (/1.156) 
dt? d C 


Cherchons alors une solution particulière de la forme: 
i = a cos(@t) + b sin(@é) 
. = -a@ sin(@f) +bæcos(æ) 
Ê 


d’ 2 2 
— = -a@ cos(@t) ba sin(a) 


Nous remarquons que cette proposition de solution est en tout point identique à la fondamentale d'une 
série de Fourier dont le terme 4, est nul (qui est la moyenne du signal ou la composante continue si elle 


existe)! 
Puis injectons ces relations dans: 


di di 1 
FR RT+ —i=Unæcos(æf) (/1.158) 
dt? dt C 


en regroupant les termes trigonométriques de même nature: 
2 1 2 L, 7. | 

-a® L+b@R FA cos(@)+|-b@ L-aækR+ ri an(@f) = Di@cos(æf) (71.139) 

Ce qui est équivalant à: 
1 1 
(az +b@R +re) cos(@t)+ (ef —aæR+ 7e ra = Djæcos(æt)+0-sin(@f) (71.140) 
d'où en identifiant les termes: 
am L+b@R +7 = U,@ 


1 (71.141) 
ba L-amR+—b=0 
C 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Nous pouvons factoriser: 


a (éL- à +b@R=U@ 


, (71.142) 
-aor-d( 1 à) = 0 
C 
Et en simplifiant par &: 
l 
—4 (oz ——) +bR=U 
Ce 
(71.143) 
a-b(et-) = 
Ce 
et en changeant de signe la deuxième ligne: 
l 
—à (oz _ =) +bR=U 
Cæ 
(71.144) 


aR sa) =0 
Cæ 
Il s'agit donc d'un système de deux équations à deux inconnues a, b que nous résolvons en posant: 
À = ab 25 - Xe (71145) 
æ@C 


où nous retrouvons donc la réactance inductive et la réactance capacitive introduits dans le chapitre 
d'Électrocinétique. 


Ce qui nous donne immédiatement: 


—aX +bR = Un | 
(71.146) 

aR+bX =0 

d'où: 
—aR X2+R? —XU, 
aX+ TREU a ————— = Up > q= 0 (71.147) 
Fa ra X? + R2 

et donc: 


= VTT Ur 
rx 0 = ——— (71.148) 
X° + 


X? +R? k? 


Nous posons de plus traditionnellement que (nous verrons plus tard que cette expression pourra être 
assimilée au concept d'impédance par analogie avec la norme d'un vecteur): 
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Zz= x? +R2 (71149) 


Ce qui donne la solution particulière suivante: 


ir DR . U Ë | x | 
Él = ————— À + ————— Hi= —| — É) — — Pr A 71.150) 
i(£) oe cos(@t) sin(@t} |. sin(@f} - cos(æt}| ( 


à l'arbitraire de phase près. 


Il est possible de trouver 8 tel que: 


sin 9 = cos g = (71.151) 


N | 


Ou autrement écrit (ainsi on voit mieux que l'on balaie toues les valeurs possibles hors singularités): 


Nous avons alors en utilisant les relations trigonométriques remarquables (cf. chapitre de Trigonométrie): 
D Æ . 5 . 
i= | c01(9 sin(é@é) — Z sin(g) co(at)) = = sin(@t — 8) (71153) 


8 est donc la phase du courant, soit l'avance ou le retard du courant sur la tension. Si 4 = 0 alors nous 
avons: 


ant =0= Lx cos(0) = 1 28 =Z= AX2 +RT=N0 +R? =R (71154) 
et donc: 
=“ sin(ar) (71.155) 


nous disons alors qu'il y a résonance du circuit avec donc: 


277 


EE — 
À 


1 
Ce JLC 


Soit lorsque la réactance inductive est égale à la réactance capacitive. 


(71.156) 


4.1. FILTRE PASSE-BAS PASSIF 


Considérons le cas où L est nul. Nous avons alors: 


Re 2. (71.157) 
Cæ Cao 


Donc: 
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2 
Z=NxX2+R?- =) R =. /icor (71.158) 
Ca Ca 


D'où: 
.… dgq Ce 
De Pr En sin(@é — 8) (71.159) 
f+(Cer) 
Soit: 
C'eU Ca, 
à= = — sin (at — Bjdt = | sin(ar - 8)de 
1+(Ca@R) 1+(C@R) 
Lee / (71.160) 
= = 6) = = ——"—cos(@i- &) 
Ÿ +(CoRŸ né 1+(CœRYÿ 
Nous avons alors aux bornes du condensateur: 
1 1 
oi RS Vo cos(@—8) (1161) 
1+(C@R) 


Nous voyons donc que la tension aux bornes du condensateur fait office de ce que nous appelons un "filtre 
passe-bas". C'est-à-dire que l'amplitude de la tension aux bornes du condensateur par rapport à la tension 
d'excitation du circuit sera amoindrie et ce d'autant plus que la fréquence sera grande. 


Ce genre d'outil est très pratique pour par exemple éliminer les harmoniques à haute fréquence d'un signal 
périodique obtenu par série de Fourier ou pour nettoyer un bruit à haute fréquence. On peut également 
utiliser des filtres passe-bas en cascade afin de réaliser des analyseurs de spectre. 


Voici le tracé du facteur: 


l 


ES (71.162 
1+(CaR) 
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Nous voyons bien qu'aux basses fréquences (à gauche) l'amplitude est conservée (le filtre passe-bas laisse 
donc passer les basses fréquences). Au-delà, le signal est coupé. 


Le rapport: 


pr _ 1 
7 (71.163) 
Vo f+(Corÿ 


est souvent exprimé en décibels soit par définition en utilisant la mesure: 


4 
dB = 201ogl —€ | (71.164 
af | ( ) 


et porte alors le nom de "fonction de transfert" du filtre. 


4.2. FILTRE PASSE-HAUT PASSIF 


Pour ce qui est de la tension aux bornes de la résistance, nous avons: 


RC&@ . 
Up = À à = ———— Ù) sin(é@é — 8) (71.165) 


2 
1+(C'æ@R) 
ce qui est traditionnellement remanié sous la forme suivante: 


üp = ——% sin(@é — 8 : 
1+ (71.166) 


(CæerY 


Nous voyons donc que la tension aux bornes de la résistance fait office de ce que nous appelons un "filtre 
passe-haut". C'est-à-dire que l'amplitude de la tension aux bornes de la résistance par rapport à la tension 
d'excitation du circuit sera amoindrie et ce d'autant plus que la fréquence sera faible. 
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Voici le tracé du facteur: 


l (71.167) 


"0 2 4 6 8 40 


Nous voyons bien qu'aux basses fréquences (à droite) l'amplitude est conservée (le filtre passe-haut laisse 
donc passer les hautes fréquences). Au-delà le signal est coupé. 


Le rapport: 


U 71.168 
0 14 1 (71.168) 


(CæRr) 


est souvent exprimé en décibels soit par définition en utilisant la mesure: 


ié 
dB = 20log| —Ë | (71.169) 
a[# | 7 


et porte alors aussi le nom de "fonction de transfert" du filtre. 


Avec différents types de filtres assemblés nous pouvons ainsi supprimer (mais jamais complètement) des 
plages de fréquences. Nous parlons alors de filtre coupe-bandes. C'est la technique utilisée par exemple 
pour la réception d'une certaine radio ou chaîne de télévision se trouvant dans une plage de fréquence bien 
précise. Ou encore en musique électronique pour atténuer sons graves ou aigus. Ou encore pour séparer le 
signal ADSL de la voix d'une ligne téléphonique. 


Un filtre passif se caractérise donc par l'usage exclusif de composants passifs linéaires (résistances, 
condensateurs, bobines couplées ou non). Par conséquent, leur gain (rapport de puissance entre la sortie et 
l'entrée) ne peut excéder l'unité. Ils ne peuvent donc qu'atténuer en partie des signaux, mais pas les 
amplifier, car cela nécessiterait un apport d'énergie (ce qui est le rôle des "filtres actifs"). 
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4.3. INTÉGRATEUR ET DÉRIVATEUR 


Nous avons donc aux bornes du condensateur: 


ue = a fisc = Fou sin(at — 8)dt Mu Uy sin(at - 8)dt 
œ (71.170) 
» ———| U, sin(@t — 8)dt 
—+(CR) 


æ 
Maintenant, si & = Es ; NOUS avons: 
RC 
üp = sin(@é —8)d£ (71.171) 
CR 


Si nous faisons en sorte que 4 = 0 nous devons avoir: 


R= ee (71.172) 
Ce 
Soit: 
Le à (71.173) 
LÉ 
Dès lors: 


1 
Ur = [Ce sin(@}dt (71.174) 


Le circuit est alors ce que nous appelons assez logiquement... un "intégrateur". 
Regardons maintenant du côté de la résistance: 
üp =R.ig (71.175) 


Or, nous avons: 


fr. due 1. dti ee 
un=—|lidt= =; =;ji =C—— (71.176) 
- al POUCE ot ty 
Donc: 
Up RCE (71.177) 
dé 
Comme: 
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1 
Up = EE eee à Us cos(@é — 8) (71.178) 
1+(Cæ@R) 
Nous avons alors: 
Up = ee _# D, cos(@ét — 8) = RE Tr: D, cos(@t — 8) 
\i+(Cer) dt 1 à dt (71.179) 
2 


Si & & Le alors: 
RC 


Up = RÉ Un cos —8) (71.180) 
Si nous nous arrangeons pour avoir: 
g= (71.181) 
alors: 


4 a 4 
up =-RC EU, cos[at-7) =-RC TU, cos[a + = RC Upsin(æt) (71182) 
at 2 at 2 at 


Le circuit est alors ce que nous appelons assez logiquement... un "dérivateur. 


L'utilité d'un circuit intégrateur est par exemple de transformer un signal périodique en une constante 
(puisque la moyenne temporelle d'un signal périodique ayant un offset ne sera jamais nulle). 
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Notes personnelles: 
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72. GÉNIE CIVIL 


L. Génie Civil représente l'ensemble des techniques concernant les constructions civiles et les outils 


qui y sont associés. Les ingénieurs civils s'occupent eux de la conception, de la réalisation, de 
l'exploitation et de la réhabilitation d'ouvrages de construction et d'infrastructures urbaines dont ils 
assurent la gestion afin de répondre aux besoins de la société, tout en assurant la sécurité du public et la 
protection de l'environnement en théorie. Très variées et intéressantes, leurs réalisations se répartissent 
principalement dans cinq grands domaines d'intervention: structures, géotechnique, hydraulique, transport, 
et environnement. Comme à l'habitude sur ce site, nous allons nous concentrer uniquement sur la 
formalisation mathématique de cas très courants et qui ont une application pratique dans la vie de tous les 
jours 


Signalons qu'en génie civil, il est parfois fait usage du calcul des surfaces minimales. Ceci est déjà traité 
par un exemple concret dans le chapitre de Mécanique Analytique. En ce qui concerne les efforts des 
poutres à la chaleur, ceci est déjà traité aussi dans le chapitre de Thermodynamique. 


Nous allons nous limiter dans ce chapitre à des calculs démontrables de manière précise et non à des 
formules expérimentales afin d'avoir une introduction générale aux techniques du génie civil et de se 
familiariser avec le langage et certaines méthodes de calcul utilisées par les ingénieurs dans ce domaine. 
Dans la pratique, les ingénieurs en génie civil font usage d'un paquet de normes avec formules incluant des 
coefficients ou basées sur des tables ou encore des cartes géographiques. Par exemple, en Suisse, les 
ingénieurs en génie civil se réfèrent aux normes SIA (Société suisse des Ingénieurs et des Architectes) qui 
contiennent entre autres ces fameuses formules. L'approche théorique est évidemment insuffisante et toute 
formation dans ce domaine doit être complétée par des travaux pratiques en laboratoire. 


Remarque: Il serait prétentieux de prétendre dans le présent chapitre vouloir faire aussi bien et 
complet que le PDF gratuit de Statique de Nicolet Gaston Raymond qui est inégalable en matière de 
contenu et de qualité à ce jour (même comparés aux ouvrages payants sur le sujet!). Il est donc 
fortement recommandé au lecteur de s'y référer s'il veut une information complète sur le génie civil 
(voir la section de téléchargement du site). 


1. STATIQUE 


Le génie civil utilise énormément la statique pour la construction. Nous n'allons donc pas récrire ici tout le 
chapitre de Mécanique Classique avec le principe fondamental de la statistique et tout ce qui va avec, ni 
l'analyse statique des poutres déjà effectuée dans le chapitre de Génie Mécanique, mais seulement 
présenter quelques aspects applicatifs du principe. 


Pour commencer ce chapitre, intéressons-nous au moins au plus petit cas non trivial que l'on rencontre 
dans la pratique. Nous souhaiterions poser contre un mur un objet massif et nous souhaiterions savoir la 
force que devra supporter ce mur. Nous pouvons représenter cela basiquement par le schéma suivant: 
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4 


Figure: 72.1 - Objet massif contre un mur 


Pour que le mur tienne, il faut (mais n'est pas une condition suffisante, elle est juste nécessaire) que le 
moment de force de la gravité égalise le moment de force du mur. Nous avons alors: 


me 0066 = Foy Lsin®g (721 


d'où: 


In extenso, il faut que les fondations du mur soient aptes à contrer le moment de force opposé. 
2. POULIES 


Dans le cadre de la statique des forces, il y a un exemple industriel qui est fameux et que nous croisons 
quasiment toutes les semaines en marchant ou en roulant devant des chantiers (grues), des gares 
(tendeurs), des ports (bateaux) ou en allant dans des salles de fitness ou garages: la poulie! Son origine est 
encore une idée d'Archimède (paraît-il...) qui l'appliqua pour le déplacement de grosses masses nécessaires 
dans divers chantiers de son époque. La relation avec le génie civil est donc toute justifiée! Voyons donc 
cela de plus près (exceptionnellement il y a très peu d'équations). 


Considérons la situation suivante appelée "poulie simple fixe" avec une masse de 10 [Kg] (soit une force 
de 100 [N] avec la gravité terrestre arrondie à la dizaine la plus proche) accrochée une corde glissée dans 
la gouttière d'une poulie: 
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100 [W] 


Figure: 72.2 - Poulie simple fixe(source: Wikipédia) 


Une poulie simple fixe n'a l'avantage mécanique que de pouvoir exercer la force dans une direction 
différente à celle du déplacement, la force qui doit être appliquée est la même que celle qui est requise 
pour déplacer l'objet sans la poulie! 


Le point d'ancrage de la poulie doit lui supporter la force nécessaire au déplacement de l'objet plus la force 
de traction, soit environ deux fois cette force au pire. Sinon le charge totale que doit supporter le point 
d'ancrage est fonction de "l'angle de tire" du cordage (compris entre 90° et 180°) bien évidemment: 


Figure: 72.3 - Angle de tire à 180° 


Pour un angle de 180° le coefficient de charge est de 200%. Une charge de 10 [Kg] sur le cordage 
représente une charge de 20 [Kg] sur la poulie. 
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Figure: 72.4 - Angle de tire à 90° 


Pour un angle de 90°, le coefficient de charge est de 140%. Une charge de 10 [Kg] représente une charge 
de 14 [Kg] sur la poulie. 


Considérons maintenant une situation où nous fixons une extrémité de la corde au support et de tirer avec 
l'autre extrémité, pour déplacer à la fois la poulie et la charge de 10 [Kg]. Cette configuration est appelée 

"poulie simple mobile" ou "poulie inversée" (la légende veut dit que c'est ce système qu'Archimède utilisa 
pour tirer un bateau): 


50 [M] e 


LI 


50 [W] 


ù 
L: [M] 


Figure: 72.5 - Poulie simple mobile (source: Wikipédia) 


Au fait dans ce système (mis en place à la verticale ou à l'horizontale peu importe!) c'est comme s'il y avait 
deux individus qui se partageaient l'effort du déplacement: le mur et la partie libre de la corde (celle qui est 
tirée). 


La poulie simple mobile permet donc de réduire la force nécessaire au déplacement de moitié (le point 
d'ancrage supportant l'autre moitié) et en rajoutant ainsi des poulies mobiles, nous continuons à diviser 
l'action à exercer! C'est bête mais il fallait y penser! 
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Ce système par contre nécessite un déplacement de l'extrémité de corde tirée du double de la distance du 
déplacement de la charge et ce indépendamment du rayon de la poulie. 


Indiquons aussi que plus la poulie à un rayon grand, plus le moment de force le sera aussi! Donc dans le 
cas de très lourdes charges nous privilégieront de grands rayons pour les poulies si le système qui tire ne 
peut fournir qu'une faible force. 


Une configuration plus réaliste (car nous allons rarement nous placer au-dessus du point d'ancrage pour 
tirer la corde et en plus le système précédent est peu stable mécaniquement parlant...) de la poulie libre 
présentée ci-dessus est la suivante: 


20 [cm} 


10 COR 


Figure: 72.6 - Poulie simple fixe et mobile mixte (source: Wikipédia) 


Évidemment, quand nous représentons des systèmes comme ceux-ci dans les cas scolaires, nous 
négligeons de manière simplificatrice la masse des poulies elles-mêmes qu'il faudrait en toute rigueur 
prendre en compte! 


Quand nous utilisons des systèmes de plusieurs poulies qui travaillent ensemble, nous disons que nous 
avons une configuration de "poulies composées". La configuration de ce type la plus commune est le 
""palan": les poulies sont distribuées en deux groupes (ou moufle), l'un fixe, l'autre mobile: 
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100 [W] 


Figure: 72.7 - Système de poulies combinées fixes et mobiles (source: Wikipédia) 


Dans chaque groupe nous installons un nombre arbitraire de poulies qui démultiplient donc d'un même 
facteur la charge initiale. La charge est bien évidemment unie au groupe mobile. 


Nous avons donc 25 [N] au bout de la corde. Le lecteur peut donc chercher à s'amuser à trouver les 4 
points d'accroches dans l'illustration précédente et les deux poulies qui divisent chacune par deux la force 
nécessaire. Si jamais voici la même configuration mais représentée sous une formé "dépliée": 
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PSS ITEMS S 


10 COR 


Figure: 72.8 - Système déplié de poulies combinées fixes et mobiles (source: Wikipédia) 


Nous voyons déjà que la grosse poulie supérieure ne sert à rien excepté à changer la direction de la force 
de tirage. Au fait, les deux poulies qui servent à diviser chacune la force par deux sont les deux 
inférieures, le reste n'étant là que par commodité pour le mouvement de la corde. 


Rappelons au lecteur qu'en réalité il faudrait prendre en compte les frottements de la corde sur la poulie 
(science de la tribologie) et que nous avons démontré dans le chapitre de Mécanique Classique que la 
force (tension) réelle d'une extrémité par rapport à l'autre était donnée par: 


ra = Zelis8 (30.3) 


et donc que la force (tension) réelle utile pour soulever un poids était donnée par: 


Z 
Æ = <T| (30.4) 
Dr D ( 


Donc la force (tension) fourni pour soulever l'objet étant T, la force (tension réelle) soulevant le poids 
étant T,, la différence donne la force (tension) faisant tourner la poulie par l'intermédiaire du frottement. 


Nous avons alors: 


Tp=T -7% sr" 7 = (e#s# _;| (30.5) 
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Le moment de force de la poulie de rayon R est alors: 


MeRmennlet-1}e 27 ot || (30.6) 
rt 


Voyons une application connue des poulies dans certaines gares ferroviaires: 


Figure: 72.9 - Système réel de poulies combinées fixes et mobiles 


Il s'agit d'un palan pour tendre les câbles électriques avec un contrepoids non visible sur la photographie 
(en bas à droite) qui assure une certaine force donc une certaine tension. L'avantage de ce système est 
qu'il permet de rajouter des poids au fur et à mesure que le câble se détend et ceux-ci sont alors quatre fois 
plus élevés au niveau du câble électrique grâce aux deux poulies mobiles (à gauche). Les poulies à droite 
ne sont là que par commodité pour le mouvement de la corde et la direction de tirage en ce qui concerne la 
poulie à l'extrémité droite. 


Dans le cas d'un levage horizontal ou vertical, il est facile de déterminer le rapport de démultiplication D. 
Effectivement, si nous considérons F la force nécessaire pour soulever l'objet d'une hauteur h en tirant la 
corde sur une longueur d'et F, la force de gravitation sur la masse tirée, nous avons alors en négligeant les 


frottements et le poids des poulies mobiles: 


_h 
3 C2 


Enfin, remarquons qu'il est possible de jouer avec le rayon de la poulie de déviation pour diminuer la force 
à fournir tout en gardant constant le moment de force (nous parlons alors de "palan différentiel") mais au 
final l'énergie dépensée restera toujours la même pour soulever un objet à une même hauteur (et il faudra 
tirer la corde encore plus pour soulever la charge à la même hauteur). 
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3. SPIRALE DE CORNU 


La clothoïde est une courbe transcendante plane dont la courbure est proportionnelle à l'abscisse 
curviligne. Elle est également appelée "spirale de Cornu", en référence à Alfred Cornu, le physicien 
français qui l'a inventée. Plus rarement, elle peut apparaître sous le nom de radioïde aux arcs, spirale 
d'Euler ou spirale de Fresnel. 


Cette forme est également adaptée aux fins de courbes dans les tracés des chemins de fer parce qu'un 
véhicule suivant ce tracé à une vitesse constante subit une accélération angulaire constante, ce qui réduit à 
la fois les efforts sur les rails et l'inconfort des passagers dans les voitures. 


Enfin, les sabots montés sur les pylônes de téléphériques, et qui supportent le câble porteur, adoptent cette 
forme. De fait, il est possible de faire circuler la cabine à sa vitesse maximale sur le pylône, sans 
incommoder les passagers. 


De même cette courbe est utilisée pour les boucles verticales ou loopings dans les montagnes russes pour 
le confort des passagers, afin que l'accélération verticale subie soit continue 


Figure: 72.10 - 


Lorsqu'un véhicule aborde une courbe circulaire,, il va subir une forme F = x perpendiculaire à sa 
direction (force centrifuge) donc de norme (cf. chapitre de Mécanique Classique): 


dès le début de son entrée dans la courbe. Cet effet est problématique car pour une voiture de poids 
moyen sur une autoroute, la force centrifuge peut égaler la force de pesanteur (lorsque sa vitesse est dans 
les valeurs légales!). 


Ainsi, l'accélération passe brutalement de 0 à 2 ; 2 aussi, les ingénieurs relèvent les courbes pour 


améliorer l'adhérence, mais il est aussi possible d'essayer de trouver des courbes pour lesquelles 
l'accélération sera plus progressive. Par exemple si la courbure C donnée par (cf. chapitre de Géométrie 
Différentielle): 


est proportionnelle au trajet s (abscisse curviligne) parcouru dans la courbe, nous aurons au début de la 
courbe €’ =0 donc l'accélération sera nulle 


Ce que nous cherchons est alors des courbes telles que: 
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C=k:s (72.10) 


Pour cela, rappelons que nous pouvons aussi écrire naturellement pour un cercle, la courbure sous la 


forme: 


=-— (72.11) 


Effectivement, si nous tournons d'un angle 48 alors nous nous déplaçons d'une longueur 45 = 848 (cf. 
chapitre de Trigonométrie). 


Nous avons donc la relation: 


Soit: 


d'où: 


dO= ksds (72.13) 


& 5 

1 
J48 = [sas > g= SK = Ks? (7214 
(E] (E) 


De plus rappelons que l'équation paramétrique du cercle est: 


Nous avons donc: 


Soit: 


ge Rcos 8 
(72.15) 


y= Àsin 8 


ru dR cos 8 + Kd(cos 8 = Rcos 48 = Rcos #ds} R ne 


dy = dRsin 8 + Rd (sin 9) = À sin 848 = À sin Sds/ À 


ad = cos 8 
5 
(72.17) 
ay = sin 8 
ds 


Nous pouvons donc maintenant écrire: 


Soit: 


dx = cos dds = cos (Ks° as 
(72.18) 
dy = sin ds = sin (ks?) ds 
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avec un petit changement de variables: 


u? = KE? = u= Ki ELLE ET DS (72.20) 


dt VK 


il vient: 


en prenant x = ÿp = Ü (nous pouvons toujours faire une translation par la suite). 


Les deux intégrales s'appellent des "intégrales de Fresnel" et ne sont pas calculables directement. Nous 
pouvons cependant les exprimer sous forme de développement de Taylor (cf. chapitre Suites Et Séries) 
sous la forme: 


5 9 13 


y y Ly 
RE Et à 
VKx=e 5.21 9.41 13.61 


3 7 PL 
5 5 
VE =—-—— + —.. 
d 3 7-31 11.5! 


(72.22) 


Le plot de l'intégrale de Fresnel donne dans Maple 4.00b: 


>plot([FresnelC(t),FresnelS(t),t=-5..51); 


Figure: 72.11 - Plot de l'intégrale de Fresnel sous Maple 4.00b 
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En zoomant sur la partie qui nous intéresse: 


0.3 


0.2 


0.1 


Û 0.1 02 03 04 05 06 O7 


Figure: 72.12 - Zoom sur l'origine de l'intégrale de Fresnel 
La même chose à une constante près en utilisant la série de Taylor présentée antérieurement: 
0.3 
0.25 
02 
0.15 
0.1 


0.05 


0 0.2 0.4 0.6 0.8 


Figure: 72.13 - Développement en série de Taylor équivalant 


Les bureaux d'ingénieurs utilisent des logiciels spéciaux intégrant des spirales des clothoïdes dans des 
environnements 2D ou 3D sur la base de relevés topographiques fait par des géomaticiens. 
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4. CÂBLES SUSPENDUS 


Galilée, fut sans doute le premier à s'intéresser à la chaînette qu'il prit pour un arc de parabole. Jean 
Bernoulli, Huygens et Leibniz trouvèrent (indépendamment) en réponse au défi lancé par Jakob Bernoulli, 
sa véritable nature en 1691: engendrée par un cosinus hyperbolique. 


Figure: 72.14 - Câbles suspendus des lignes HT (source: chronomaths) 


NT. -td 


LU la if 


Figure: 72.15 - Câble suspendu pour gazoduc par-dessus une rivière 


4.1. CÂBLE SUSPENDU LIBRE (CHAÎNETIE) 


Considérons (source: ChronoMath) pour l'étude un câble homogène libre, flexible, attaché en deux points 
A et B. Dans sa position d'équilibre, le câble pend dans un plan vertical et semble prendre une forme 
parabolique. En fait, pas vraiment... 


Lug 


Figure: 72.16 - Configuration pour l'étude des câbles suspendus 
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Créons dans ce plan un repère orthonormé (©,5, j}, où O désigne le point le plus bas du câble et notons 


£ le champ de pesanteur à son endroit. 


Appelons 4 la tension (force) au point O faisant échec à la tension en M de sorte que la portion de câble 


[OM] de longueur L, soumise à son poids linéique 4. & au point G, soit en équilibre au sens statique: 


T+T+uLg=0 (7223) 


Remarque: Le produit 4. & de la masse linéaire avec la force gravitationnelle est aussi très souvent 
noté w comme nous l'avons fait dans le chapitre de Génie Mécanique pour représenter la charge 
linéique. 


Projetons sur les axes de coordonnées en notant & l'angle #. 

Nous avons alors les décompositions suivantes: 
T= TE +T,j - (fees a)i+ (fs a)j 
Ter 2.2 
R=-fF 


ALE =-uL|g|; 
Nous pouvons alors écrire le système: 


(Flcosa)r Fer =5 


(Fin a)3- 421815 = 5 


us 
NI 
N 
N 
Ü1 


Soit après simplification: 
Flese-fRl-c 
F]sin a- gL|£|=0 


nn 
NI 
N 
N 
(ep) 


Soit: 


Fleesa- fo] 


[sin «= u2|g| 


2.2 


En calculant le rapport: 


Pr 
#4 _2 


Ml Wl * 


PAT A 


Pour obtenir une équation différentielle différentions.. (là c'est subtil...): 
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d (tan a)= © 


(72.29) 
où dL est donc l'abscisse curviligne du câble (souvent notée ds dans la littérature conformément à ce qui se 
fait en géométrie différentielle). 


Ensuite: 
)= Jar + _, ee (72.3 
La 


Mais la tangente c'est aussi la dérivée de la fonction décrivant la chaînette. Donc: 
Il vient alors: 


Suite à l'intervention d'un lecteur, nous allons proposer deux manières de résoudre cette équation 
différentielle. La première est celle d'origine et elle est un peu compliquée et la deuxième (disponible 
beaucoup plus bas) est celle proposée par un lecteur qui est peut-être plus élégante et simple. 


Première approche: 


Posons #4 = y' et cherchons la primitive du membre de gauche dans un premier temps (celle du membre 
droite étant évidente). Les calculs faits dans le chapitre de Calcul Différentiel Et Intégral dans la 
détermination des primitives usuelles nous donnent: 


[ = ———@ di = | -—© = =in[u +141 ]+c (72.33) 


Nous avons donc: 


en passant à l'exponentielle: 


—+ 72.35 
D'Hfit+y ser" 0757) 
en remarquant que dans notre problème en x = 0 nous avons bien y'= 0. 


Pour trouver y' nous utilisons une astuce: Nous savons que la fonction est symétrique. Donc si nous 
remplaçons x par -x la tangente change aussi de signe et passe de y' a -y": 
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Vincent ISOZ [v3.0 - 2013] REA te LXe"] 
—4 
+" 
y +1+(6>) =eÀ D 


En soustrayant: 


fe 


ul —x 
+ 4e" 
y'+ f+ y? =eÀ et y h+y2 + (72.37) 


il vient: 
x x TH + 
Den EL #8 (72.38) 
2 
Donc après intégration: 
: “ et 
e — 8 x (72 
D = &———— = kcosh (a+ | + os 
2 & 


où l'expression après la première égalité est appelée "courbe caténaire". Il vient au final: 


T 
Y= A con[ fe +) + | (72.40) 
HE 


où les constante seront déterminées par les conditions initiales. 
Nous voyons bien avec Maple 4.00b la différence entre une parabole et la chaînette: 


> plot([x"2,cosh(x)],x=-4...4); 


-4 -2 (: 2 4 


Figure: 72.17 - Plot entre une chaînette et parabole avec Maple 4.00b 
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Considérons maintenant deux points dans le plan {x,,»,), (x;,y,) et déterminons l'équation de la 


chaînette de longueur L ayant ces deux points comme extrémités. 
Nous avons les deux équations: 


= kcosh Ë +) +c> 
La 
(72.41) 


2 = Eco 2 L +df }+eÿ 


Nous obtenons une troisième équation à l'aide de la longueur L qui est connue. En effet (cf. chapitre de 


Mécanique Analytique): 


A Î 1+ y'?dx = 1+ sinh ? (E+er Jére foost[E+ai ar 
# (72.42) 


_ =#[si(2 " +#)- sinh Ë ni) 


où nous avons toujours: 


Te 
k=0 (743) 
4-8 


Ainsi, nous obtenons un système non linéaire de trois équations à trois inconnues (&,ef ,cS 


x 
= kcosh Ë +) +c® 
La 


32 = &cosh (2 +4) +cŸ (72.44) 


L=k&|sinh (2 +c] . — sinh (a+ | 
& & 
Déterminons à titre d'exemple la chaînette de longueur 38 cm passant par les points(—9,0), (9,10) 
Il faut alors résoudre le système suivant: 
_. € 
0= IE +ci “res 
& 
9 
10 =£cosh É +4) + 
383=k snh(? +) —- snh( = +#') 
La Le 


Voici les commandes Maple 4.00b qui nous permettent d'obtenir le résultat. 
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>el:=0=k*cosh(-9/k+c1)+c2; 
>e2:=10=-Kk*cosh(9/k+c1)+c2; 
>e3:=38-k*(sinh(9/k+c1)-sinh(-9/k+c1)); 
>fsolve({e1,e2,e3},{k,c1,c2},{k=0..infinity}); 


Maple donne: 
k= 4073758798, c1 = .2694982504, c2 = -14.46356329 


Graphiquement nous avons alors: 


Figure: 72.18 - Tracé d'une petite chaînette avec Maple 4.00b 


Deuxième approche: 


Pour cette deuxième approche de résolution de l'équation différentielle, nous allons garder la notation 
proposée par le lecteur qui nous a contacté. Nous repartons de l'équation différentielle: 


Il vient alors: 
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du 1 2 ue 
—=—Vl+u4" (72.48) 
dx À 
Puis: 
du dx 
== = —— (72.49) 
1+42 # 


L'intégration donne conformément à la primitive usuelle démontrée dans le chapitre de Calcul Différentiel 
Et Intégral: 


: X 
arcsinh (1 = p re (72.50) 


Et la condition: 


en x =0 (point le plus bas de la chaînette) impose que la constante d'intégration est nulle et donc que les 
points d'accroche sont par symétrie situés à même hauteur. Nous avons alors: 


d 
ue Ven T (72.52) 
& dx & 


Soit: 


y = Æcosh (2) +) (72.53) 


à comparer avec la méthode précédente où nous avions obtenu: 


VE : 
y = cosh xË E 4 + (72.54) 
AE T 


La constante d'intégration est déterminée par les points d'attache de la corde distants de D où nous avons 
y=0enx--2;2 eten x =D ;2 (donc les extrémités sont sur la même horizontale). Nous avons alors: 


vin Host (=) — cosh 2) (72:55) 


C'est sous cette dernière forme que l'équation de la chaînette a été obtenue indépendamment par Leibniz, 
Huyghens et Bernoulli à la fin du 17ème siècle. 


On peut alors maintenant facilement calculer la déviation maximale (le "flèche" comme disent les 
ingénieurs en génie civil que nous noterons f comme dans le chapitre de Génie Mécanique) par rapport à 
l'horizontale passant par les points d'attache: 
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D 9 CG 
M0 == Hi -cocn (%) (72.56) 


Enfin il peut être intéressant de calcul la longueur du câble à l'équilibre. Pour cela, rappelons que nous 
avons démontré plus haut que: 


#3 #2 a 
L= 1+ y'? dx = Ltsih[E+e je = co Jar 
[ nd ps 1 [ £ 1 


#1 


- [sn Ë +4) — sinh Ë ) 


Dans le cas où les attaches sont à même hauteur, la chaînette est symétrique et nous avons alors: 


Lu x 12 
L=2: | coche jar - 2 san He) = sinh (c** ) (72.58) 
0 a & 2 


Reste à déterminer la constante! Si D est nul alors L doit être nul. La constante vaut alors zéro et il reste: 


# 


(72.57) 


£= 2ksinh 3) (72.59) 
& 2 


Dans le cas des lignes de chemin de fer électrifiées, nous pallions à la flèche rédhibitoire par un câble 
porteur principal de la caténaire: le câble supérieur (ci-dessous à droite) subit une flèche acceptée, ce qui 
diminue les tensions entre les pylônes. La caténaire reste ainsi bien linéaire grâce aux accroches auxiliaires 
multiples à un câble auxiliaire. 


Figure: 72.19 - Chaînette des Chemins de Fer (source: Chronomaths) 


Sinon signalons que nous retrouvons aussi les chaînettes dans tous les endroits de la vie de tous les jours 
où un câble est suspendu entre deux points sur une même horizontale. 
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BExemple: 


Considérons un câble suspendu avec les données suivantes: 


g= 0.5 [kg-m] 


2 
g=9.81 [ms | (72.60) 
D= 20 [we] 
% = 45 [N 


Nous avons puisque la charge linéique du câble est constante (en reprenant la notation du chapitre de 
Génie Mécanique au passage): 


k=——=— 2917[#] (7261 


et donc: 


vO=f #- cosh (2)E >rf- co _ ] = —6 [me] (72.62) 


Seal 


Ainsi la flèche du câble est 6 mètres en-dessous de l'horizontale des deux accroches. 


4.2. CÂBLE SUSPENDU PORTEUR (PONT SUSPENDU) 


Considérons le pont suspendu suivant portant une charge linéique constante, donc la flèche h est imposée 
par l'architecte, ainsi que la distance D entre les 2 piliers: 


Figure: 72.20 - Pont suspendu (source: ISBN 0-13-814929-1) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


La subtilité de cas d'étude réside dans le fait que la charge linéique n'est plus dans le câble lui-même mais 
dans la travée du pont qui est de masse linéique bien supérieur. Nous ne pouvons plus alors utiliser les 
analyses faites plus haut. Le développement fait pour le câble suspendu normal reste valide jusqu'à la 
relation: 


d (tan æ)= 22 (72.63) 
k 
Maïntenant, il faut se rappeler que nous avons aussi: 
& aL 
d'itan æi= 4?) =— (72.64) 
dx l'a 


en réarrangeant et en dérivant encore par dx: 
d fd 1 4L 
(2 =—— (72.65) 


Sur le pont cependant chaque portion dL du câble est négligeable devant la portion dx du pont. Ceci 
marque toute la différence entre le pont suspendu et la simple chaînette tel que nous devons remplacer dL 
par dx (c'est assez subtile avec cette démarche mais il y a plusieurs approches possible à ce 
développement). Nous avons alors la relation précédente qui devient: 


Soit après réarrangement: 
2 1 .. 
d“y=|—dx|dx (72.67) 
& 
En intégrant une première fois il vient alors: 
1  . 
dy=|-dx|x+C" (7268) 
k 
et une deuxième et dernière fois: 
1 2 . 
=—x +Cx+C2 (72.69) 
2 


Les constantes sont déterminées par les conditions initiales. L'endroit où nous avons posé le repère impose 
que y = 0 en x =0 et que dy/dx = 0 en x = 0, nous avons les deux constante qui sont nulles et il reste alors: 
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le #82_W"32 70 
X° 2 2% 


Il s'agit donc de l'équation d'une parabole et non plus d'une chaînette! Un petit souci est que nous ne 
connaissons pas la tension dans le câble. Il faudrait nous en débarrasser. Or du fait que l'architecte impose 
que la flèche soit h en x = D/2, il vient alors: 


et donc: 


Encore une fois cela reste une parabole et ce indépendamment du poids porté! Cela étant dû au fait qu'il 
soit uniforme. 


Il nous reste alors à déterminer la longueur du câble. Pour cela nous reprenons la relation déjà rappelée 
plus haut (démontrée dans le chapitre de Mécanique Analytique ou de Formes Géométriques): 


x 
L= | 1+y'2ax (72.73) 
% 


Par symétrie de la fonction du pont suspendu nous pouvons écrire: 


D/2 D/2 
| LES) 1+ (Ha) dx = 2 + à] à 
Est 


(72.74) 


Dans le chapitre de Calcul Différentiel Et Intégral lors de nos démonstrations des primitives usuelles, nous 
avons démontré que: 


: 2 
[ Va? + x dx = Lin(x+ Ve +x JE a +xt (7275) 


Il vient alors: 


(72.76) 
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BExemple: 


Considérons les caractéristiques du Golden Bridge de San Francisco. Sa flèche h est d'environ 230 mètres 
et sa portée principale est de 1280 [m]. Nous avons alors: 


4,3. CÂBLE TRÈS TENDU 


D/2 


2 
] +x2| |21383[wm] (279 


Rappelons que dans le cas général nous avions obtenus la relation suivante: 


Prenons-en la différentielle: 


Soit pour la composante y: 


Mais nous avons aussi: 


T+T+uLlg=0 (7278) 


aT +4 +ugdL=0 (70 
si 


âTy + agd£=0 (7280) 


T 
F7 = a _ tan æ (72.81) 
TJ “M 


Donc injecté dans la relation précédente cela donne: 


Soit: 


à 
T,d (à) +yugdl=0 (7282) 
dx 


ra[? 
à. 


x 


}- -ugadl (72.83) 


Et sous l'hypothèse que le câble est très tendu: 


Il vient alors: 


d£zdx (72.84) 
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T,d (à) =-g{gadx (72.85) 


Après une première intégration il vient: 
ä 
T = -pgx+c (72.86) 
dx 


Avant d'aller plus lois remarquons que la constante est facile à déterminer puisque en x = L/2, la dérivée 
doit être nulle. Nous avons alors: 


Le 2 = —/{igx + HE Ë (72.87) 
dx 2 
Après une deuxième intégration (où la constante d'intégration est nulle): 
T,Y= À xL — x? | (72.88) 


Nous avons alors pour la déformation de la corde: 


= | xl x?) | (7289) 


x 


Ainsi, au milieu de la corde la flèche est alors de: 


2 2 
f #2) _ #8 (72.90) 


x 


Ou respectivement si on connaît la flèche et qu'on cherche à déterminer la tension: 


LL ugl? 


(72.91) 


et nous pourrions aussi calculer la longueur de la corde en utilisant la même technique que pour le pont 
suspendu. 


5. BARRAGES 


Considérons le barrage de hauteur z, de longueur L et stockant de l'eau de densité © ci-dessous: 
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Figure: 72.21 - Approche simplifiée pour l'étude de pression sur un barrage 


Nous avons vu dans le chapitre de Mécanique des Milieux Continus que la pression hydrostatique était 
donnée par: 


P=Æ+h.p.g (7292) 
mais dans cette situation, nous avons évidemment: 
P=Æ+(h-2) 9-g (7293) 
Ainsi lorsque nous nous plaçons à la surface de l'eau en z = x: 
P=Æ# (729,4) 
soit la pression de l'air à la surface du lac de barrage. 
Sur un élément de surface d'aire dS il s'exerce une force élémentaire: 


dF =P.dS.ÿ=P.Ldi.ÿ (7295) 


Or: 
cos Œ = 7 = di = e (72.96) 
Î cos & 
Ainsi: 
_— L d | . 
dF=P.Ldi ä=(AR+(k-2) 0 g) L -# (72.97) 
cos & 
d'où après intégration 
É L Lh 1 
F=P.Ldl=[(R+(h-2).0.8). dz = (R +50) (72.98) 
ü cos & cos æ 2 


Il s'agit donc de la force exercée sur la face immergée. La force sur la face émergée (à gauche sur 
l'illustration) est simplement donnée en posant £ = 0. Nous avons donc: 


Lh 


Cos 
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F = 


À (72.99) 


Remarque: En moyenne à vide et à plein un barrage se déplacerait de 80 cm. 
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Notes personnelles: 
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73. GÉNIE AÉROSPATIAL 


D. ce chapitre, nous allons voir quelques cas pratiques mathématiques utiles et simples de ce que 


nous avons étudié dans les chapitres de Géométrie Analytique, Mécanique Classique, d'Astronomie 
dans le cadre du Génie Aérospatial qui est donc la discipline scientifique qui rassemble les techniques 
de l'aéronautique de l'ingénieur (déplacement dans l'atmosphère, utilisant des avions ou des hélicoptère 
par exemple) et celles de l'astronautique (déplacements spatiaux, c'est-à-dire trajets hors atmosphère et 
interplanétaires, en utilisant des navettes spatiales ainsi que des fusées). 


Le lecteur découvrira certainement qu'il s'agit au fait que d'exemples que nous trouvons souvent dans 
les livres scolaires en tant qu'exercices 


Nous ne reviendrons pas ici sur la théorie des côniques (très importante pour la mise en orbite de 
satellites) vue dans le chapitre de Géométrie Analytique, ni la théorie du Gyroscope très utile pour 
orienter/forcer l'axe de rotation (spin) des satellites et déjà vue dans le chapitre de Mécanique Classique 
(par contre nous ne pourrons pas utiliser la théorique balistique se trouvant dans ce même chapitre 
puisque nous y avions supposé la vitesse initiale constante...) ou la théorie des points de Lagrange utile 
parfois pour mettre en orbite des satellites sur des astres lointains (ce qui ne veut pas dire que nous 
n'utiliserons pas les résultats théoriques des sujets que nous avions étudié). De plus par hypothèse nous 
considérerons les corps dans un mouvement non relativiste ce qui est à ce jour le cas le plus fréquent. 


Dans ce chapitre nous négligerons en réalité pas mal de choses comme les frottements, les vibrations les 
cas à plus de deux corps (astres...) et autres nombreux facteurs. Nous ne verrons pas non plus les 
bricolages propres à l'ingénierie spatiale (comme le fait que certains satellites ont des poids attachés par 
des câbles réglables pour augmenter ou diminuer leur moment cinétique gyroscopique). 


Remarque: Certains détails vous sembleront négligeables mais il faut savoir que le prix au kilo de 
l'ancement se situe entre 20'000 et 30'000$ sans compter les assurances. (du moins en ce début de 
20ème siècle). Donc tout ce qui peut être optimisé sans accroître le risque doit pouvoir l'être! 


Avant de commencer sur les sujets purement mathématiques, abordons quelques notions purement 
pragmatiques. 


Le fait de placer le décollage proche del'équateur sera d'une aide non négligeables puisque la vitesse 
tangentielle (horizontale) de la rotation de la Terre est donnée par (application de la cinématique 
circulaire triviale étudiée dans le chapitre de Mécanique Classique): 


v=@.R=465 [ms] (73.1) 


Soit un peu plus de la vitesse du son au sol dans des conditions normales de température et de pression 
et qui représente environ 5% de la première vitesse cosmique que nous traiterons juste un peu après 
(c'est déjà ça de pris pour économiser du carburant!). Et puis évidemment, comme la Terre tourne sur 
elle-même d'Ouest en Est il vaut mieux faire partir la fusée vers l'Est plutôt que tout droit ou même pire 
encore. vers l'Ouest (signalons au passage que pour des raisons de sécurité des agents au sol ce serait 
encore mieux si elle part à l'Est au-dessus d'un océan). 
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Il faut aussi noter que nous cherchons bien sûr à acquérir de la vitesse verticale pour quitter rapidement 
les couches denses de l’atmosphère mais nous voulons aussi communiquer au lanceur une composante 
horizontale de la vitesse: c'est-à-dire celle-ci qui permet la mise en orbite des satellites (d'où une raison 
supplémentaire pour tirer vers l'Est). 


Quant à la différence de l'accélération gravitationnelle elle est un facteur aussi à prendre en compte. 
Effectivement certains sites spécialisés donnent: 


Zaguawwr = 9.178039 [me 5?] 
Bat nma = 983217 [ms ?] 


Ainsi, une différence d'environ 0.527% ce qui sur le poids d'une navette spatiale n'est pas négligeable 
pour une fois encore économiser du carburant. 


1. VITESSE COSMOLOGIQUES 


La "première vitesse cosmique" ou "vitesse de satellisation minimale" représente la vitesse minimale à 
laquelle doit être portée un corops minimale pour se trouver en orbite basse autour autour de la. Elle est 
déterminée par la relation qui équilibre force centrifuge et force centripète (cf. chapitre de Mécanique 


Classique): 
2 
v _GM  ., 
—_— (73 3) 
R 2 
d'où nous déduisons trivialement: 
GW 
v=,]— | (734) 
À 


En réalité dans nos temps actuels (...) une orbite échappe à l'usure de l'atmosphère terrestre que si elle 
est à une altitude supérieure à 200 kilomètres. Nous avons alors (vitesse qui correspondrait à peu près à 
celle de l'ISS d'après plusieurs recoupements): 


v = z 71900 [m5 ]z 28500 [4] (7325) 


La "deuxième vitesse cosmique" correspond à la vitesse de libération d'un corps quittant la Terre. C'est 
la vitesse minimale au-delà de laquelle un corps peut s'éloigner définitivement de la Terre, en tout cas 
tant que l'on néglige la présence du Soleil et de notre Galaxie. Nous avons déjà démontré la relation y 
relative dans le chapitre de Mécanique classique donc inutile d'y revenir. Rappelons jusque que la 
relation obtenue était: 


Ce qui donnait pour la Terre (en prenant le rayon moyen au niveau de la mer...): 
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PA Sn ls [m.57]z 40000 Lkn-x (73.7) 
R 


Du fait de l'atmosphère terrestre, il est difficile (et peu utile) d'amener un objet proche de sa surface à 
cette vitesse, celle-ci étant située trop avant dans le régime hypersonique pour être réalisable par la 
plupart des systèmes de propulsion. En outre, elle provoquerait une destruction de la plupart des objets 
par friction ou compression atmosphérique. En pratique, un objet serait tout d'abord placé en orbite 
terrestre circulaire basse puis accéléré à partir de cette altitude puisque les frottements y sont quasiment 
nuls, la poussée a alors un très bon rendement. Par ailleurs, la table ci-dessous fournies par la NASA 
atteste de cette stratégie (Vous pouvez remarquer qu'à partir de 105 kilomètres d'altitude le gain de 
vitesse est très efficace): 
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VIRE AN erAN ER EPUEIR [SCIENCES.CH] 


-8 0 


À 


2.45 

| 20 1244 139 18.62 
| 40 5'377 298 16.37 
| 60 11617 433 19.40 
| 80 19872 685 24.50 
| 100 31'412 1'026 24.01 
| 120 44726 1279 8.72 
| 140 57396 1373 9.70 
| 160 67893 1490 10.19 
| 180 77485 1'634 10.68 
| 200 85'662 1800 11:17 
220 92481 1986 11.86 

| 240 98'004 2191 12.45 
| 260 10'301 2417 13.23 
| 280 105321 2'651 13,92 
300 107449 2915 14.90 
320 108'619 3203 15:97 

| 340 108'942 3516 17:15 
| 360 108'543 3'860 18.62 
| 380 107690 4216 20.29 
| 400 106'539 4630 22.34 
| 420 105142 5'092 24.89 
| 440 103775 °'612 28.03 
| 460 102'807 6'184 29.01 
| 480 102'552 6760 29.30 
| 500 103'297 7327 29.01 
| 220 105'069 7581 0.10 


Tableau: 73.1 - Données ascensionnelles de la navette Discovery (source: NASA) 
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2. ÉQUATION FONDAMENTALE DE LA PROPULSION 


Un lanceur spatial a pour mission de placer une charge en orbite, pour cela il doit fonctionner dans 
l'atmosphère et le vide. Les principes utilisés sont ceux de l'action et de la réaction de Newton, et de la 
conservation de la quantité de mouvement: grossièrement nous pouvons affirmer qu'une fusée accélère 
en éjectant des gaz à grande vitesse (le ballon baudruche qui se dégonfle donne une bonne idée du 
phénomène). Après une étude mécanique simple, nous pouvons obtenir l'équation fondamentale de la 
propulsion. 


En considérant les différentes parties mobiles et indépendantes de la fusée (en fait la structure 
principale séparément des gaz éjectés), nous pouvons affirmer à l'aide du principe d'action et réaction 
(cf. chapitre de Mécanique classique) pour un système donné, la somme des forces extérieures est: 


DE = Ma = — (73.8) 


Ainsi, en prenant le système fusée et gaz ensembles, nous avons: 


dB, = 
—?2=0 (739) 
2 dé 


Soit que: 
= te > 
> Pr; =€C (73.10) 


Le principe de la propulsion s'énonce alors grâce à la conservation de la quantité de mouvement, que 
nous avons établie. 


Considérons une fusée de masse m et de vitesse v,, la vitesse d'éjection des gaz étant v.. Au temps t, 
f £ 


nous avons: 
P=mvs (7311) 
au temps t+dt nous avons: 
p=(m-dm)(v,; +dv,)+dm(v, +dv,—v.) (7312) 


mais le dm est une perte de masse donc il faut changer son signe sinon la relation précédente ne 
correspond pas à l'interprétation de la réalité. Ainsi: 


p=(m+dm)(v,; +dv,)-dm(v, +dv, -v,) 
d'après le principe de conservation de la quantité de mouvement: 
mv, = (m+dm)(v, +dv,)-dm(v, +dv,-v) (731) 


d'où après simplification: 
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d'où: 


dm 
dv =—v, — (73.3) 
f ca 


ce qui par intégration donne "l'équation fondamentale de la propulsion" ou le "delta-v" comme on dit 
souvent dans la littérature américaine et ce pour une fusée (non-relativiste…) hors champ de gravité et 
dans le vide à vitesse d'éjection constante des gaz...: 


Av; =V, In Mraitiale 


FA Sinaï € 


La différence entre masse initiale et masse finale étant souvent appelée "poids mort" dans le domaine. 


Nous comprenons alors aisément pourquoi les fusées sont composées de plusieurs éléments de 
propulsion dont elles se séparent. Cela leur permet d'accroître leur vitesse finale en se débarassant de la 
masse des réservoirs qu'elles emportent initialement avec elles. 


Nous en déduisons donc qu'un lanceur accélère d'autant plus que la vitesse des gaz est grande, que la 
poussée dépend de la quantité de gaz fournis et de leur vitesse, et le rapport des masses initiale et finale 
doit être maximum pour favoriser la propulsion, c'est-à-dire que la structure du système est voulue 
négligeable (la masse finale est alors minimale). 


Remarquons que nous avons par extension aussi la relation suivante entre l'accélération de la fusée et le 
débit de masse éjecté: 


dv, VE dm 


— (55) 
É mm dt 


à 


Cependant, dans un champ gravitationnel (bien évidemment il faut que l'accélération de la fusée soit 
supérieur à celle de la gravité à tout moment...) il faut ajouter le terme qui freine la fusée (la "perte par 
pesanteur") et qui donnera donc l'expression: 


v=v,in Mnitiole —g't| (73.6) 
m(£) 


si nous supposons la gravité g comme constante pendant la phase d'accélération principale. Cette 
dernière relation serait parfois appelée "formule de Tsiolkovski". En notant par 2, le débit massique 


des propulseurs, nous retrouvons parfois cette dernière relation sous la forme suivante où le temps 
n'intervient plus explicitement: 


” pe: | …. —#lÉi] 
rs (73.7) 
Métis Det mé 


puisque: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


Mtios — MAÉ) 
| D 


€ 


Ë 


Cependant, il faudrait aussi prendre en compte la variation de la gravité en fonction de la distance 
comme nous l'avons démontré dans le chapitre d'Astronomie. Nous avons alors: 


. R\°? 
Vv = LA in (es) LA Ë £ (73.9) 
lé Fr 


Donc si nous supposons la vitesse d'éjection des gaz constante et la trajectoire en ligne droite depuis le 
corps d'attraction nous avons donc que plus le temps passe plus va vitesse de la fusée augmente à cause 
de la diminuation de sa masse (bien évidemment elle finira par être constante) mais en même temps 
moins l'influence de la gravité est grande. 


La valeur théorique de l'altitude atteinte, même si son expression est très simple à déterminer, est 
tellement fausse que cela ne vaut même pas la peine d'en faire mention. 


Les navettes ne vont donc pas à la vitesse de libération avec qu'un seul étage de propulsion et même. 
elles n'ont souvent comme seul objectif d'aller seulement à la vitesse de mise en orbite basse. 
(première vitesse cosmique). La navette n'est donc dans la pratique pas libérée de l'attraction terrestre, 
loin de là! 


Exemple: 


Calculons la vitesse finale de la première phase de lancement d'Ariane 5 en supposant la gravité 
constante, en connaissant la vitesse d'échappement des gaz (supposée constante), la masse totale 
initiale de la fusée, la masse éjectée et le débit massique (supposé aussi constant...). Nous avons alors: 


700 "000 — 260000 
ii RE - à ss T7: [ms] (310) 
260'000 3'900 
avec: 
y "situe = (6) _ 700'000 - 260'000 _ , Le] 319 


D, 3'9300 
Alors que la valeur réelle est comprise entre 2'000 et 2'800 mètres par seconde d'après le recoupement 
de plusieurs sites Internet et vidéos du centre de contrôle de lancement d'Ariane (donc nous sommes 
très loin de la première vitesse cosmique!). Si nous ajoutions la variation de la gravité avec l'altitude le 
résultat calculé serait encore plus proche des 2'800 mètres par seconde (pour information la séparation 
des boosters de la première phase se ferait environ à 80 kilomètres d'altitude d'après le recoupement de 
plusieurs sources environ 132 secondes après l'allumage). 


Cela reste cependant un ordre de grandeur convenable (et de plus similaire aux décollages des navettes 
américaines) compte tenu de la non prise en compte des frottements de l'air (qui pour rappel à ce que 
nous avons démontré dans le chapitre de Mécanique Des Milieux Continus sont proportionnels au carré 
de la vitesse dans le cas subsonique pour le moins...!!!). 
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Déterminons maintenant la distance atteinte après un temps t donné dans le cas de l'approximation à 
champ de pesanteur constant. Nous avons alors bien évidemment dans un premier temps (nous 
changeons un peu la notation afin de la condenser) 


Fr #4 


Soit: 


Nous allons faire le changement de variable suivant: 


u=1l-—<$# (7314) 


F9 


Soit: 


D 
du=-—<dt (7315) 
F3 


Ce qui nous donne (cf. chapitre de Calcul Différentiel Et Intégral): 


V 


D Î In {2 1 du — g[tat 


st)= Ÿ, finie | dia -g| dt = 
[4 


(u in (x u)-2ef +c"* 


C4 


(73.16) 
nl, le 6 Lin 
D, Le "9 y 2 


Su. 1- 2e, in 1- 2e, —1 ne 
D LEA 2 


F0 
Déterminons la constante d'intégration avec le fait qu'au temps t = 0, nous devons avoir z(t) qui est nul. 
Il vient alors immédiatement que: 


é 
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Soit au final: 
V #2 D D 1 y 
z(E) = - (2-2) lee (73.18) 
D, #9 #9 2 EL 


où nous pouvons à nouveau nous débarasser de la variable explicite du temps en réutilisant le fait que: 


LC mi 
E D 


é 


{ (73.19) 


mais dont nous changeons la notation sous la forme plus condensée et simple suivante: 


Ce qui nous donne: 


2 
2(0= 0) | 20 |; ne st 1 À EP (73.21) 
D, #9 2 2, D, 


Exemple: 


Calculons la hauteur de la première phase de lancement d'Ariane 5 en supposant la gravité constante 
avec les mêmes données numériques que l'exemple précédent. Cela donne alors: 


 inz 3600: 260"000 (20000) - 10 7( 100-000 2601000) 3'600. 260000 
73900 700" 000 2” 3900 3900 (73.22) 
2 106725 = 100 [kr] 


Ce qui d'après le recoupement de plusieurs site Internet et vidéos du centre de contrôle de lancement 
d'Ariane ne serait pas trop faux car les propulseurs principaux (EAP: étages accélérateurs à poudre) 
seraient largués à environ entre 70 et 125 kilomètres d'altitude (entre 132 secondes et 205 secondes 
après leur allumage) et même la coiffe qui protège les satellites ainsi que l'étage à propulsion (EPC: 
étage principal cryotechnique) sont parfois largués juste quelques secondes après (cela fait toujours 
quelques tonnes de moins!). 


Donc comme nous l'avons vu avec les calculs de l'exemple précédent, il reste encore environ 100 
kilomètres avant d'atteindre l'orbite basse et sa vitesse cosmique correspondante à l'aide de l'étage à 
propergols stockables (EPS). 


Remarquons que si nous faisions décoller la fusée avec une accélération égale à celle de la pesanteur 
(en supposant de plus cette dernière constante), nous obtiendrions une hauteur égale à: 


ziéi= a =lo7.(112Ÿ + 60'838 [m]z 60 [we] (73.23) 
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N 


Donc nous pouvons approximativement en conclure que la pousée d'Ariane 5 est significativement 


supérieur à celle opposée de la pesanteur. 
Nous pouvons aussi calculer la variation de l'intensité de la pesanteur à l'altitude de 100 kilomètres pour 


voir si sa variation est significative ou non en % de celle au sol: 


2 . 2 
Âg | R Jef rase) 297% (73.24) 
R+z 6 "378137 +100 "000 


&o 


donc nous voyons que cela fait 3% ce qui est non négligeable. 


Par ailleurs, voici un graphique soit disant tiré d'un ouvrage d'Arianespace montrant l'accélération 
horizontale du lanceur Ariane 5 en multiple de la pesanteur locale au pas de tir: 


ES EX NE EE 
sf.) D DES el Fe Lens : 

| | 

0 | RS PR PS D ES ER RTE DRE 
40 À... d | nnscess lee scravesocces coudes ec cmcmuescal eme cmcmensccteluemte cine amas ec loss tee ectes 

| F H2 

L ! ! 
5 / 
U 25 d.. 1 ÉREPA IN EE ER E SE PO EEE RE EE EEE DONNE ARE PRE AP ARRERR EE RER A RSS RER ER ER RUE Or EEE ER RARE ER gt CNRS 
= Î Il 
Len ! f 
2 ' | ll 
# l H 
5 Î / # 

Se ESDRE IRON DRRRRES RE SRE oh ee Er a ES is 


100 1202 


600 
Time (s) 


0 200 
Figure: 73.1 - Profil de l'accélaration horizontale d'Ariane 5 (source: ?) 


Supposons maintenant qu'en se basant sur la relation: 


nous savons la masse totale éjectable limité. Nous aurons alors aussi le temps de combustion qui sera 


limité. Notons cela: 
— 

és = is Mir 2 (73.26) 

D 


En utilisant les relations obtenus plus haut dans le cas à champ gravitationnel constant, nous avons alors 
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bien évidemment: 


(73.27) 


2 
Fr — 

il 72 |-1 Le UT | 
y 2 D, D, 


Après avoir atteint la vitesse finale, la vitesse de la fusée sera donnée par la relation classique de la 
cinématique rectiligne (cf. chapitre de Mécanique Classique): 


v=y, —glé-t,] (73.28) 
et la hauteur aussi: 
_ 1 | 1 | e 2 9 


En y injectant les relations obtenues plus haut, nous avons d'abord pour la vitesse: 


(#9 — "1, | Mo — 
v=v,—glé-é,]= Y fs) “a(s- 0 ü 


(73.30) 


et pour la hauteur: 
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1 , 2 


LA) 1 V #7 Pa | 

=| 22 in )ie 3242 |+ly (| (£é—t, | 
É RE 5 Um, 4 ? 
2 


3 1,2, Ve de Pg 2 
us (2), nf) eee n( |; 


1 2 3 


v_#rR LC) Y — 2 9 
= à In es —] HET + y fin 7. a ie ue à in 0: 2 (73.31) 
2, #7 D, LOF D, LOS 2 
VA FR 12 VA Y 
— Cr in + = | LE 4 sin Li à PME PA Lu AL TS Po À, 
D, y 2, My D, M, LE, ms) 2 
VA FR y V 
— Ca in MA +in PA 1 HET 4 sin 0: ii UT bis à 
D, 7% my D, m,] D, Um,) 2 


V Ms V v 
A Dep la +v,tin “APR 7 ; 7 ne 
D, D, "; D ", 2 
_ v 
=v, f +v,tin D: Le, ie À 1,2 
À M EL my] 2 


Mais lorsque la hauteur maximale est atteinte, la vitesse est nulle, nous avons alors: 


V 
v=v,in + - gt = Ein ba À (73.32) 
M; v=Û £ "M; 


Soit injecté dans la relation précédente cela donne: 
2 
— v V v 
2=v, © L+y, If à In BUT Les. M PE g| <in his 
2, g |; M, 2, My g Um, 
2 2 
— l y 1 
= y, — AT v, In LD JS ds. In Li. 5) vin bia À (73.33) 
D, £ M$ D, my | 2g My 


2 
ee v, In F4. Eu Te Lu 
D, 2g M$ D, my 


Les deux premiers termes sont positifs. Les troisième et dernier terme est négatif. Dès lors, nous voyons 
que pour maximiser la hauteur atteinte, le mieux est de faire tendre le débit massique vers l'infini (soit: 
donner toute l'impulsion dès le début!). Dès lors, nous avons: 
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hole 
FR D 027 DE "; 


Exemple: 


Calculons la hauteur maximale de la première phase de lancement d'Ariane 5 en supposant la gravité 
constante avec les mêmes données numériques que l'exemple précédent. Cela donne alors: 


; 2 
CR + | 36001 ir) z 655274 [m]z 650 [kw] (73.35) 
D, +0 2.986 260'000 


Donc il s'agit de l'altitude à partir de laquelle la fusée aurait une vitesse ascenionelle nulle et 
commencerait à retomber. Comme nous pouvons le constater, c'est largement au-dessus de l'orbite 
basse mais aussi très en-dessous de l'orbite géostationnaire comme nous allons le calculer par la suite. 


3. ORBITE GÉOSTATIONNAIRE 


L'orbite géostationnaire est une orbite située à 35'786 kilomètres d'altitude au-dessus de l'équateur de la 
Terre, dans le plan équatorial et d'une excentricité orbitale nulle. C'est un cas particulier de l'orbite 
géosynchrone (dans le cas contraire la période orbitale correspond toujours à la durée de la révolution 
de la Terre mais l'orbite s'écarte également au Nord et au Sud de l'équateur en décrivant un analemme 
dans le ciel lorsqu'il est observé depuis un point fixe de la surface de la Terre). 


Cette caractéristique est particulièrement importante pour les satellites de télécommunications ou de 
diffusion de télévision. La position du satellite semblant immobile, un équipement de réception muni 
d'une antenne fixe pointant dans la direction du satellite géostationnaire suffira pour capter ses 
émissions. Cette orbite est également utilisée pour l'observation de la Terre depuis une position fixe 
dans l'espace comme c'est le cas pour les satellites météorologiques géostationnaires. 


Les satellites géostationnaires sont donc nécessairement situés à la verticale ou au zénith d'un point de 
l'équateur ou, en d'autres termes, situés dans le plan équatorial de la Terre. 


Pour calculer la position de l'orbite géostationnaire, nous allons d'abord utiliser la seconde loi de 


Newton (cf. chapitre de Mécanique Classique): 
F=m.a (73.36) 


et nous avions démontré dans le chapitre de Mécanique Classique que lorsque le mouvement est 
circulaire, nous avons: 


Et nous allons utiliser la loi de la gravitation présentée dans le chapitre de Mécanique Classique (et 
démontrée dans le chapitre de Relativité Générale): 
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Nous allons utiliser ces relations avec la masse de la Terre f, = 5.9736.10% [kg], 2, la masse du 


satellite, le rayon de la Terre Àr = 6378.14 [&#] à l'équateur en moyenne, h la hauteur du satellite par 
rapport au sol et v la vitesse du satellite. 


Sur l'orbite géostationnaire, il y a donc équilibre entre les forces de gravitation et la force centrifuge du 
satellite et la force d'attraction gravitationnelle de la planète: 


En adoptant les notations citées précédemment cela donne donc: 


GM pm, w 
— 5 =", ———— (7340) 
{ Àr +}) Àr + 
Nous voyons que la masse du satellite se simplifie. Donc l'orbite géostationnaire en est indépendante! Il 
est important aussi de noter que puisque la vitesse v est après simplification indépendante la masse du 
satellite pour une orbite circulaire, alors un astronaute à l'intérieur de celui-ci aura la même vitesse et 
sera donc en apesanteur à l'intérieur de celui-ci (il en va de même pour tous les objets proches à 
l'intérieur ou à l'extérieur du satellite). 


La vitesse pour une trajectoire circulaire est le rapport de la circonférence du cercle sur la période de 
temps nécessaire pour le parcourir en entier. Nous avons donc: 


, - 2ARr +h) 
E T 


(73.41) 


Donc T étant égal par définition dans ce contexte particule d'orbite géostationnaire à la durée de la 
journée sur Terre, nous avons en prenant les tables disponibles: 


T=23.93419.60. 60 = 86163.084 [s] (73.42) 


Retournons à la relation antéprécédente pour la simplifier: 


et y injectant la relation explicite de la vitesse: 


2 
CM. (F2 =?) (73.44) 


Rr+h T 
Soit: 
in 143 
ST = Rp+h (73.45) 
47 


Il vient enfin: 
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143 
2 
hk = ME — Rr=35"784[l#] (73.46) 
47 
et la vitesse du satellite: 
2 Rr + À 
= TRr À) 3074 [ms 1] (349 


Remarquons qu'en utilisant les relations précédents, si le rayon de l'orbite d'un satellite non 
géostationnaire nous est donné ainsi que la masse de la Terre, nous pouvons alors aussi déterminer sa 
période de révolution sans avoir à connaître sa vitesse. 


La force centrifuge est souvent utilisée dans le calcus de génie spatial. Par exemple pour calculer le 
vitesse de rotation que devrait avoir une laboratoire circulaire spatial de rayon r pour simuler la gravité 
terrestre comme ci-dessous: 


Figure: 73.2 - Station spatiale simulant gravité 
nous appliquons simplement à nouveau l'analyse de la force centrifuge: 
2 


mg=m— (73.48) 
Fr 


et nous voyons de suite que la masse se simplifie pour obtenir: 


Le reste (trajectoires des sondes spatiales) viendra quand j'aurais du temps à disposition. 
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Notes personnelles: 
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74. GÉNIE INDUSTRIEL 


L. Génie Industriel englobe la conception, l'amélioration et l'installation de systèmes. Il utilise les 


connaissances provenant des sciences mathématiques, physiques et sociales, ainsi que les principes et 
méthodes propres à l'art de l'ingénieur, dans le but de spécifier, prédire et évaluer les résultats découlant de 
ces systèmes. 


Nous pouvons résumer tous les domaines qui touchent au génie industriel (et pas seulement. cela peut 
s'appliquer avec adaptation ad hoc à l'administration) par l'objectif d'optimiser et contrôler les 
performances globales de l'entreprise (coûts, délais, qualité) car: 


On ne peut améliorer que ce que l'on mesure! 


Remarquons que certaines techniques de génie industriel ont déjà été abordées dans d'autres chapitres 
comme les techniques de gestion quantitatives, l'optimisation (recherche opérationnelle), l'analyse 
financière, l'analyse des files d'attente, etc. et que ce domaine englobe le "génie qualité". 


Dans ce chapitre, nous traiterons uniquement des aspects théoriques minimaux du SQC (Statistical Quality 
Control) relatifs au contrôle statistique de la qualité (dont c'est le métier du "qualiticien") dans le cadre de 
la fabrication et de la mise en production de biens ou de services et qui constitue le minimum-minimorum 
de la connaissance de tout ingénieur qualité actif dans une organisation quelconque (industrielle ou 
administrative) sous peine d'avoir aucune crédibilité! Par ailleurs méfiez vous des entreprises - 
particulièrement des multinationales - qui recherchent des spécialistes qualité maîtrisant Microsoft Excel 
ou Microsoft Access. Car cela signifiera qu'elles utilisent des outils non professionnels pour faire un travail 
qui lui devrait pourtant l'être avec des outils adaptés (et Microsoft Excel ou Microsoft Access ne le sont 
pas)!!! Donc en termes d'organisation interne, vous pouvez vous assurer que ces entreprises organisent et 
analysent n'importe quoi, n'importe comment, avec un outil non adapté et donc que c'est le bordel général 
en interne. 


Selon l'utilisation, nous distinguons trois domaines principaux qui dans l'ordre conventionnel sont: 


1. Contrôle statistique de processus, surveillance de fabrication ou réglage de qualité (Statistical 
Process Control, SPC). Il s'agit de la surveillance d'un processus de fabrication pendant la production de 
produits de masse, pour découvrir des différences de qualité et pour pouvoir intervenir et conduire 
directement. 


L'ingénieur doit obligatoirement consulter la norme ISO/TR 13425:2006 Lignes directrices pour la 
sélection des méthodes statistiques dans la normalisation et la spécification ainsi que la norme ISO 8258 
Cartes de contrôle de Shewhart et enfin ISO/TR 18532 Lignes directrices pour l'application des 
méthodes statistiques à la qualité et à la normalisation industrielle avant de mettre en place des outils 
SPC au sein de son entreprise. 


2. Contrôle de réception ou examen d'échantillon de réception (Acceptance Sampling, AC). Il s'agit du 
contrôle d'entrée, d'un contrôle pendant la production et d'un contrôle final des 

produits dans une entreprise (ou usine) sans influence directe sur la production. Ainsi, le montant de rebut 
produit est mesuré. Le contrôle initial sert aussi à refuser la marchandise arrivante. Elle n'influence par 
conséquent la production que de manière indirecte. 
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L'ingénieur doit obligatoirement consulter la famille de normes ISO 3591 Règles d'échantillonnage pour 
les contrôles par mesures et par attributs avant de mettre en place des outils de contrôle de réception au 
sein de son entreprise. 


3. Maintenance préventive et contrôle du vieillissement et de la défaillance et impacts critiques (Analyse 
des Modes de Défaillances, de leurs Effets et de leur Criticité, AMDEC). II s'agit principalement de 
calculer la durée de vie de composants ou de machines afin de prévoir des remplacements à l'avance et les 
actions y relatives à mener pour éviter les situations critiques humaines ou financières. 


L'ingénieur doit obligatoirement consulter les normes CEI 61649 Analyse de Weibull et NF EN 13306 
Terminologie de la maintenance avant de mettre en place des outils de maintenance préventive au sein de 
son entreprise. 


Ces trois domaines utilisant les statistiques en général, l'ingénieur devra toujours se référer à la famille de 
normes ISO 3534 Vocabulaire et symboles, ISO 3534-1 Probabilité et termes statistiques généraux, 
ISO 3534-2 Maîtrise statistique de la qualité, ISO 3534-3 Plans d'expérience. 


Indiquons que depuis la fin du 20ème siècle, il est à la mode de regrouper les deux premiers points dans 
une méthodologie de travail appelée "Six Sigma" que nous allons aborder immédiatement. Enfin, signalons 
que dans la pratique, pour avoir un intérêt de la direction d'une entreprise, il faut toujours trouver une 
relation quantitative entre non-qualité et les coûts pour pouvoir faire bouger les choses... 


1. SIX SIGMA 


Deux objets ne sont jamais rigoureusement identiques. Quelles que soient les techniques utilisées pour 
fabriquer ces objets, si précis soient les outils, il existe une variabilité dans tout processus de production. 
L'objectif de tout industriel est que cette variabilité naturelle demeure dans des bornes acceptables. C'est 
une préoccupation majeure dans l'amélioration de la qualité industrielle. 


Un des outils utilisés pour tendre vers cette qualité est la Maîtrise Statistique des Processus (MSP).Si vous 
produisez un certain type d'objets, et si vous souhaitez conserver vos clients pour pérenniser votre 
entreprise, vous devez vous assurer que les lots que vous leur livrez sont conformes à ce qui a été convenu 
entre vous, le plus souvent par contrat. Tout industriel sérieux effectue des contrôles sur les lots produits 
pour en vérifier la qualité, qu'il en soit le producteur ou bien qu'il les réceptionne. Diverses techniques 
statistiques liées aux prélèvements d'échantillons sont alors utilisées pour éviter, dans la plupart des cas, de 
vérifier un à un tous les objets contenus dans un lot. Ce contrôle d'échantillons prélevés dans des lots est 
indispensable si les contrôles à effectuer détruisent l'objet fabriqué, comme lors d'une analyse de la dose de 
composant actif contenue dans un comprimé. Il existe cependant des cas où l'on préfère vérifier tous les 
objets (il est par exemple souhaitable que les freins d'une voiture fonctionnent et un contrôle du freinage 
sur un échantillon dans la production d'un lot d'automobiles ne garantit pas que tous les véhicules freinent 
correctement... 


Lorsqu'un lot est contrôlé, il est conforme ou il ne l'est pas. S'il est conforme, on le livre (fournisseur) ou on 
l'accepte (client). S'il n'est pas conforme, on peut le détruire, en vérifier un à un tous les éléments et ne 
détruire que ceux qui ne sont pas conformes, etc. Toutes les solutions pour traiter les lots non conformes 
sont onéreuses. Si le lot n'est pas conforme, le mal est fait. La MSP se fixe pour objectif d'éviter de 
produire des lots non conformes en surveillant la production et en intervenant dès que des anomalies sont 
constatées. Une bonne MSP permet de supprimer un nombre important de contrôles in fine des lots 
produits en mettant en place des outils statistiques de surveillance des processus de fabrication. 
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Pour résumer, la MSP consiste donc à contrôler le procédé en cours de fabrication et à agir sur le procédé 
plutôt que sur le produit si des problèmes sont détectés. Cette approche tente donc de remonter la chaîne 
de production le plus haut possible pour prévenir l'apparition de produit défectueux. Nous parlerons dans 
ce cas en particulier de contrôle de procédés. 


Six Sigma est à l'origine une démarche qualité limitée dans un premier temps aux techniques de "maîtrise 
statistique des procédés" (M.S.P.) appelée aussi "statistiques des processus qualité" (S.P.Q. ou S.P.C. en 
anglais pour Statistical Process Control). Le lecteur francophone pourra se référer à la norme AFNOR 


X06-030 ou différentes normes ISO dont nous ferons référence plus tard dans le texte. 


C'est une méthodologie de travail utile pour satisfaire les clients dont l'idée est de délivrer des 
produits/services de qualité, sachant que la qualité est inversement proportionnelle à la variabilité. Par 
ailleurs, l'introduction de la qualité doit être optimisée afin de ne pas trop augmenter les coûts. Le jeu subtil 
entre ces deux paramètres (qualité/coûts) et leur optimisation conjointe est souvent associé au terme de 
"Lean management". Si nous y intégrons Six Sigma, nous parlons alors de "Lean Six Sigma”. 


Six Sigma intègre tous les aspects de la maîtrise de la variabilité en entreprise que ce soit au niveau de la 
production, des services, de l'organisation ou de la gestion (management). D'où son intérêt! Par ailleurs, 
dans Six Sigma un défaut doit être paradoxalement la bienvenue, car c'est une source de progrès d'un 
problème initialement caché. Il faut ensuite se poser plusieurs fois la question "Pourquoi?" 
(traditionnellement 5 fois) afin de bien remonter à la source de celui-ci. 


Nous distinguons deux types de variabilité dans la pratique: 


- La "variabilité inhérente" au processus (et peu modifiable) qui induit la notion de distribution des 
mesures (le plus souvent admise par les entreprises comme étant une loi Normale). 


- La "variabilité externe" qui induit le plus souvent un biais (déviation) dans les distributions dans le temps. 


Les processus de fabrication dans l'industrie de pointe ayant une forte tendance à devenir terriblement 
complexes, il faut noter que les composants de base utilisés pour chaque produit ne sont pas toujours de 
qualité ou de performance égale. Et si de surcroît, les procédures de fabrication sont difficiles à établir, la 
dérive sera inévitablement au rendez-vous. 


Que ce soit pour l'une ou l'autre raison, au final bon nombre de produits seront en dehors de la normale et 

s'écarteront ainsi de la fourchette correspondant à la qualité acceptable pour le client. Cette dérive est fort 
coûteuse pour l'entreprise, la gestion des rebuts, des retouches ou des retours clients pour non-conformité 

générant des coûts conséquents amputant sérieusement les bénéfices espérés. 


Comme nous allons le voir dans ce qui suit, une définition possible assez juste de Six Sigma est: la 
résolution de problèmes basée sur l'exploitation de données. C'est donc une méthode scientifique de 
gestion. 
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1.1. CONTRÔLE QUALITÉ 


Dans le cadre des études qualité en entreprise, nous renonçons souvent à un contrôle à 100% à cause du 
prix que cela engendrerait. Nous procédons alors à une prise d'échantillons. Ceux-ci doivent bien 
évidemment être représentatifs, c'est-à-dire quelconques et d'égales chances (in extenso le mélange est 
bon). 


Le but de la prise d'échantillons étant bien évidemment la probabilité du taux de défaillance réel du lot 
complet sur la base des défaillances constatées sur l'échantillonnage. 


Rappelons avant d'aller plus loin que nous avons vu dans le chapitre de Statistiques la loi 
hypergéométrique (et son interprétation) donnée pour rappel par (cf. chapitre de Statistiques): 


CE CPE —& 
Hk&)=———— (741) 
c® { 


P 


où la notation du coefficient binomial est conforme à celle définie et choisie dans le chapitre de 
Probabilités (donc non-conforme à la norme ISO 31-11). 


Lors d'un échantillonnage, nous avons normalement un paquet de n éléments dont nous en tirons p. Au lieu 
de prendre m (nombre entier!) comme le nombre d'éléments défectueux, nous allons implicitement le 
définir comme étant égal à: 


où p», est la probabilité (supposée connue ou imposée...) qu'une pièce soit défectueuse. Ainsi, nous avons 
pour probabilité de trouver k pièces défectueuses dans un échantillon de p pièces parmi n: 


Lan Pan Pan MI-pa) 
CC C0 _—. 
HG)= PE LE PE (43 
Cr Cp 


La probabilité cumulée de trouver k pièces défectueuses (entre 0 et k en d'autres termes) se calcule alors 
avec la distribution hypergéométrique cumulative: 


k Cia” sie Pa) 
DETCE H(0)+Æ(1)+...+ H(&) = D ——— (744) 
x=Ù y 


Exemple: 


Dans un lot n de 100 machines, nous admettons au maximum que 3 soient défectueuses (soit que p, = 3% 
). Nous procédons à un échantillonnage p à chaque sortie de commande de 20 machines. 


Nous voulons savoir dans un premier temps qu'elle est la probabilité que dans cet échantillonnage p, trois 
machines soient défectueuses, et dans un deuxième temps quel est le nombre de machines défectueuses 
maximum autorisé dans cet échantillonnage p qui nous dirait avec 90% de certitude que le lot de n 
machines en contienne que 3 défectueuses. 
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X H(x) S H(2) 
x 

0 0.508 0.508 

1 0.391 0.899 

2 0.094 0.993 

3 0.007 1.000 


Ainsi, la probabilité de tirer en une série de tirages trois machines défectueuses dans l'échantillon de 20 est 
de 0.7% et le nombre de pièces défectueuses maximum autorisé dans cet échantillon de 20 qui nous 
permet avec au moins 90% de certitude d'avoir 3 défectueuses est de 1 pièce défectueuse trouvée 
(probabilité cumulée)! 


Les valeurs H(x) peuvent être calculées facilement avec la version française de Microsoft Excel 11.8346. 
Par exemple, la première valeur est obtenue grâce à la fonction: 


=LOILHYPERGEOMETRIQUE(0;20;3;100)-0.508 


1.2. DÉFAUTS/ERREURS 


Intéressons-nous donc à exposer pour la culture générale un exemple pratique et particulier de ce qui n'est 
qu'une application simple de la théorie des statistiques et probabilités. Pour comprendre l'importantance de 
la qualité et du concept "zéro défauts", considérons l'exemple général suivant de l'inventeur de la méthode: 


Considérons que le montage d'une voiture de tourisme comprend 2500 opérations et que chaque opération 
est parfaite 99 fois sur 100. A priori, réussir une opération dans 99 % des cas est le signe d'une maîtrise 
quasi parfaite de la qualité. Mais en fait, la perfection de l'ensemble suppose que 2500 fois de suite, les 
opérations soient parfaitement réalisées. Si la production quotidienne se monte à 2'000 unités, sur les 5 
millions d'opérations effectuées quotidiennement dans notre usine, il y a 1% de défauts de montage soit 
50'000, et en moyenne 25 défauts par voiture, ce qui est difficilement acceptable. Aussi, admettons que 
cette usine imaginaire soit dotée d'un service de contrôle intervenant à la fin du montage de façon 
systématique. Cela représente un coût considérable en heures de travail de contrôle. Si les défauts peuvent 
être corrigés, il faudra faire des retouches, remplacer des pièces peut-être, et travailler dans des conditions 
imprévues pour corriger les défauts. S'ils sont trop importants, ces défauts rendent les produits inutilisables, 
et les rebuts sont extrêmement coûteux. Pire encore, si le service de contrôle voit 99% des défauts, il en 
subsiste 500 quotidiennement, et cela suppose des retours et réparations coûteuses ainsi qu'une 
détérioration significative de l'image de marque selon les performances de la concurrence. 


Cet exemple faisant office de cas d'école, imaginons pour la suite une entreprise fabricant trois copies d'un 
même produit sortant d'une même chaîne, chaque copie étant composée de huit éléments. 


Remarque: Nous pouvons tout aussi bien imaginer une société de services développant (fabricant) trois 
copies d'un logiciel (produit) sortant d'une même équipe de développement (chaîne), chacun composé 
d'un nombre égal de modules (éléments). 


Supposons que le produit P1 a un défaut, le produit P2 zéro défauts et le produit P3 deux défauts. 
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Ici, Six Sigma suppose implicitement que les défauts sont des variables indépendantes, ce qui est 
relativement rare dans les chaînes de fabrication machines mais plus courant dans les chaînes dans 
lesquelles des humains sont les intervenants. Cependant, nous pouvons considérer lors de l'application de 
la SPC sur des machines qu'un échantillonnage du temps dans le processus de mesure équivaut à avoir une 
variable aléatoire!! 


Remarques: 


R1. Dans le cadre de l'exemple du logiciel pris plus haut, l'indépendance est peu probable si nous ne 
prenons pas un exemple dans lequel les modules sont personnalisés selon les besoins du client. 


R2. L'inconstance des résultats de production de certaines machines dont les réglages bougent pendant 
le fonctionnement. (ce qui est courant), voir que la matière première change de qualité pendant la 
production (ce qui est aussi courant!) posent donc de gros problèmes d'application des méthodes SPC. 


La moyenne arithmétique des défauts nommée dans le standard Six Sigma "Defects Per Unit" (D.P.U.) est 
alors défini par: 


nombre total de défauts observés 
DPO = ——— (45) 
nombre total d'unités de production observées 


et donne dans notre exemple: 


DPU = - =]1 (74.6) 


ce qui signifie en moyenne que chaque produit a un défaut de conception ou fabrication. Attention! Cette 
valeur n'est pas une probabilité pour les simples raisons qu'elle peut d'abord être supérieure à 1 et 
qu'ensuite elle a comme dimension des [défauts]/[produits]. 


De même, l'analyse peut être faite au niveau du nombre total d'éléments défectueux possibles qui 
composent le produit tel que nous sommes amenés naturellement à définir selon le standard Six Sigma le 
"Defects per Unit Opportunity" (D.P.O.): 


D —— 


nombre total d'éléments par produits 


ainsi, dans notre exemple, nous avons: 


et ceci peut être vu comme la probabilité d'avoir un défaut par élément de produit puisque c'est une valeur 
sans dimensions: 
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défauts 
DPU : unité 


DPO = 
see | 


(74.9) 


total — 
unite 


Par extension, nous pouvons argumenter que 87.5% des éléments d'une unité n'ont pas de défauts et 
comme Six Sigma aime bien travailler avec des exemples de l'ordre du million (c'est plus impressionnant) 
nous avons alors les "Defects Per Million Opportunities" (D.P.M.0O.) qui devient: 


DPMO = DPO.1'000"000 = a 10$ (74.10) 
ni 


ce qui dans notre exemple donne: 
DPMO = 125'000 (74.11) 


Comme la probabilité D qu'un élément d'une pièce soit non défectueux est de 87.5% (soit 12.5% de taux 
de rebus) alors, par l'axiome des probabilités conjointes (cf. chapitre de Probabilités), la probabilité qu'un 
produit dans son ensemble soit non défectueux est de: 


8 
| N 2 = ][{-DPO)=(-DPOŸ (74) 
i=1.8 = 


ce qui dans notre exemple donne: 


| N 2 = 0.875° = 0.3436= 34.36% (74.19) 
2=1.8 


ce qui n'est pas excellent. 
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Remarque: Dans Six Sigma, les probabilités conjointes sont aussi naturellement utilisées pour calculer 
la probabilité conjointe de produits non défectueux dans une chaîne de processus de production P 
connectés en série. Cette probabilité conjointe est appelée dans Six Sigma "Rolled Troughput Yield" 
(R.T.Y.) ou "Rendement Global Combiné" (R.G.C.) et vaut: 


er =e[ne) =]I2 (419 


Processus À C C) BIT 
65.6% 


Rendement 90% 90% 90% 30% 


Ce type de calcul étant très utilisé par les logisticiens qui nomment le résultat "taux de disponibilité" 
ainsi que par les chefs de projets pour la durée d'une phase d'un projet lorsqu'ils considèrent les durées 
des tâches comme indépendantes (sur des structures plus complexes, on parle parfois "d'arbres de 
probabilités pondérés"). 


Ainsi, dans une chaîne industrielle basée sur l'exemple précédent pour avoir une quantité Q bien 
définie de produits (supposés utiliser qu'un seul composant de chaque étape) au bout de la chaîne, il 
faudra à l'étape A prévoir: 


_E - Q =15242% (7415) 
RTT 656% 


soit 52.42% de composants À de plus que prévu. Il faudra prévoir à l'étape B: 


= e =137.17% (74.16) 
90% - 90%. 90%  72.9% 


soit 37.17% de composants de plus. Et ainsi de suite. 


Rappelons maintenant que la densité de probabilité d'avoir k fois l'événement p et N-K fois l'événement q 
dans n'importe quel arrangement (ou ordre) est donné par (cf. chapitre de Statistiques): 


ñ al & n-k 
P(n,k) = CT. P= 2 _— 74.17 
É —  R 


et est appelée la loi binomiale ayant pour espérance et écart-type (cf. chapitre de Statistiques): 
L=n.p T= J#-p'4q (74.18) 
Ainsi, dans le standard Six Sigma, nous pouvons appliquer la loi binomiale pour connaître quelle est la 


probabilité d'avoir zéro éléments défectueux et 8 autres en bon état de marche sur un produit de la chaîne 
de fabrication de notre exemple (si tous les éléments ont la même probabilité de tomber en panne...): 
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1 0 8 0 
D .0.8755 = 0.125. 0.87 = 0.3436 = 34.36% (74.19) 


et nous retombons bien évidemment sur la valeur obtenue avec les probabilités conjointes avec: 


4=8-0.125=1= DPU 


= 48-0.125.0.875 =0.935 


Ou la probabilité d'avoir un élément défectueux et sept autres en bon état sur un produit de la chaîne de 
fabrication: 


(74.20) 


| | 
.0.125!. 0.875? = 8! 5125 .0.8757 = 0.3436= 39.26% (74.21) 


PED= 1171 


nous voyons que la loi binomiale nous donne 39.26% de probabilité d'avoir un élément défectueux sur 8 
dans un produit. 


Par ailleurs, dans le chapitre de Statistiques, nous avons démontré que lorsque la probabilité p est très 
faible et tend vers zéro mais que toutefois la valeur moyenne #:? tend vers une valeur fixe si n tend vers 
l'infini, la loi binomiale de moyenne #=#-P avec k épreuves était alors donnée par une loi de Poisson: 


ui 
BE. = P(X =k)= p(b) = FL (74.22) 


avec: 


Remarque: Dans un cadre pratique, il est fait usage de l'estimateur de maximum de vraisemblance de la 
loi exponentielle pour déterminer la moyenne et l'écart-type ci-dessus (cf. chapitre de Statistiques). 


Ce que Six Sigma note naturellement: 


k 
p(E = DPUT or (74.24) 
&l 
avec: 
= DPF 
(74.25) 


a=YDPU 


Ainsi, dans notre exemple, il est intéressant de regarder la valeur obtenue (qui sera forcément différente 
étant donné que nous sommes loin d'avoir une infinité d'individus et que p est loin d'être petit) en 
appliquant une telle loi continue (la loi continue la plus proche de la loi binomiale en fait): 


& & (n] 
pk) = et = À gnr = 4,008 _ ae” = 0.3679= 36.79% (7426) 


| kl 0! 
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avec: 


el gel (429 
ce qui est un résultat encore plus mauvais qu'avec la loi binomiale pour nos produits. 


Cependant, si p est fixé au départ, la moyenne # = #-P tend également vers l'infini théoriquement dans la 
loi de Poisson de plus l'écart-type #2? :4 tend également vers l'infini. 


Si nous voulons calculer la limite de la distribution binomiale, il s'agira donc de faire un changement 
d'origine qui stabilise la moyenne, en 0 par exemple, et un changement d'unité qui stabilise l'écart, à 1 par 
exemple. Ce calcul ayant déjà été fait dans le chapitre de Statistique, nous savons que le résultat est la loi 
Normale: 


Ainsi, dans notre exemple, nous avons {= 1 et l'écart-type est donné par l'estimateur sans biais de 
l'écart-type (cf. chapitre de Statistique): 


ce qui dans notre exemple donne g=1. 


Pour déterminer la probabilité nous calculons la valeur numérique de la loi de Gauss-Laplace (loi Normale) 
pour &=0,æ=1,{4=1: 


1 
e A = ee 2-02419=2419% (7130) 


1.27 27 


Ainsi, en appliquant la loi Normale, nous avons 24.19% de chance de tirer au premier coup un produit 
défectueux. Cet écart par rapport aux autres méthodes s'expliquant simplement par les hypothèses de 
départ (nombre d'individus fini, probabilité faible, etc.) 


P(0,11) = 


Remarque: Ceux qui penseraient utiliser la loi triangulaire (cf. chapitres de Statistiques) doivent tout de 
suite l'oublier. Effectivement, comme en qualité la valeur optimiste sera le zéro par définition, la 
probabilité que le nombre de défauts soit égal à 0 sera immédiatement de zéro. 


1.3. INDICES DE CAPABILITÉ 


Six Sigma (et aussi la série de normes ISO 22514) définit plusieurs indices permettant de mesurer pendant 
le processus de fabrication la capabilité de contrôle dans le cas d'un grand nombre de mesures de défauts 
répartis souvent selon une loi de Gauss-Laplace (loi Normale). 


Basiquement, si nous nous imaginons dans une entreprise, responsable de la qualité d'usinage d'une 
nouvelle machine, d'une nouvelle série de pièces, nous allons être confrontés aux deux situations 


suivantes: 
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1. Au début de la production, il peut y avoir de gros écarts de qualité dus à des défauts de la machine ou de 
réglages importants mal initialisés. Ce sont des défauts qui vont souvent être rapidement corrigés (sur le 
court terme). Dès lors pendant cette période de grosses corrections, nous faisons des contrôles par lot 
(entre chaque grosse correction) et chacun sera considéré comme une variable aléatoire indépendante et 
identiquement distribuée (selon une loi Normale) mais de moyenne et écart-type bien évidemment 
différent. 


2. Une fois les gros défauts corrigés, nous n'allons avoir en théorie plus que des défauts minimes très 
difficilement contrôlables et ce même sur long terme. Alors l'analyse statistique ne se fait plus forcément 
par lot de pièces mais par pièces et l'ensemble des pièces sur le long terme est considéré comme un unique 
lot à chaque fois. 


Ces deux scénarios mettent en évidence que nous n'effectuons alors logiquement pas les mêmes analyses 
en début de production et ensuite sur le long terme. Raison pour laquelle en SPC nous définissons plusieurs 
indices (dont les notations sont propre à ce site Internet car elles changent selon les normes) dont 2 
principaux qui sont: 


D1. Nous appelons "capabilité potentielle du procédé court terme" ou "indice dispersion court terme" le 
rapport entre l'étendue de contrôle E de la distribution des valeurs et la qualité de Six Sigma (6 sigma) 
lorsque le processus est centré (c'est-à-dire sous contrôle statistique - les caractéristiques du produit 
fabriqué varient peu) tel que: 


E 
C,=— 
7 6 
ce qui s'écrit aussi: 
é = USZ — LSL 
Tr 


où USL est la limite supérieure de contrôle/tolérance ou "Upper Specification Level" (USL) de la 
distribution et LSL la limite inférieure ou "Lower Specification Level" (LSL) que nous imposons souvent 
(mais pas toujours!) dans l'industrie comme à distances égales par rapport à la moyenne Æ théorique 
souhaitée. La capabilité ci-dessus est donc un indice que nous chercherons à maximiser (puisque 
l'écart-type au dénominateur doit être minimisé!). 


Ce rapport est utile dans l'industrie dans le sens où l'étendue E (qui est importante, car elle représente la 
dispersion/variation du processus) est assimilée à la "voix du client" (ses exigences) et le 6 sigma au 
dénominateur au comportement réel du procédé/processus censé inclure quasiment toutes les issues 
possibles. Il vaut donc mieux espérer que ce rapport soit au pire égal à l'unité! 


Voici typiquement un exemple en gestion de projets où, lorsque le client ne paie pas pour une modélisation 
fine du risque fine (le mandataire accepte alors par contrat une variation des délais et coûts qui peut 
dépasser les 50%), on tombe sur ce type de distribution : 
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USL 

1 Voix du client 
(étendue) 

! Voix du processus 
\ (six sigma) 


Limite de tolélance 
450% 


! 
100% -80%  -60% ; -40% -20%] 3 150% 80% 100% 


Variation des délais/coûts en % de la planification initiale 


= 


Figure: 74.1 - Tracé typique d'un plot de contrôle avec étendues et limites 


Remarque: En MSP, l'étendue E est souvent notée IT, signifiant "intervalle de tolérance". 


L'écart-type au dénominateur étant donné par la relation démontrée dans le chapitre de Statistiques dans le 
cas de k variables aléatoires indépendantes et identiquement distribuées selon une loi Normale (mais 
d'écart-type et moyenne non-identique): 


£ 
2 (74.33) 


i=l fl 


où CT est l'abréviation de "court terme" (abréviation souvent non précisée dans la pratique car supposée 
connue dans le contexte). Cet écart-type est bien évidemment le meilleur pour le premier scénario dont 
nous avons fait mention plus haut. Car entre chaque grosse correction, les lots sont considérés comme 
indépendants et ne peuvent pas être analysés comme un seul et unique lot (ce serait une aberration!). 


Avant de continuer, voyns qu'il nous est possible de construire facilement un test d'hypothèse pour 
l'indicateur €’, . Effectivement, en se rappelant que nous avons démontré dans le chapitre de Statistique 


que: 


Lne _Lno 
us S D ces e Ds De (7.34) 


F 
APTE À-af2.28-1 
Il est alors immédiat que: 


(2 — 1) 5° (x —1)$ 
7 d'< 2 
Laf2.n-1 di-at2,2-1 


LA 


et in extenso: 
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Et dès lors: 


2 
À-a/22-1 


(x—1) 


(7.37) 


2 
La 2x1 


ou encore: 


RE 
(#2 —1) 


et nous pouvons appliquer le même raisonnement pour tous les types d'indicateurs du même genre que 
nous verrons par la site! 


Remarque: Dans le cadre de notre étude plus loin des cartes de contrôle, nous verrons qu'il est possible 
d'utiliser des expressions particulières pour l'écart-type lorsque nous travaillons avec des échantillons 
de mesures. Ces expressions seront basées pour l'une sur la loi du Khi-deux et pour l'autre les 
statistiques d'ordre. 


Attention cependant! Comme souvent dans la situation court terme (lors de la correction des grosses 
sources d'erreurs donc) les lots de tests sont petits, même très petits, afin de diminuer les coûts en 
production. Dès lors l'écart-type se trouvant sous la racine (qui est l'estimateur de maximum de 
vraisemblance de la loi Normale) n'a pas une valeur vraiment correcte. Il est alors bon d'utiliser soit 
d'autres méthodes de calcul assez empiriques comme le font de nombreux logiciels, soit de calculer un 
intervalle de confiance de l'indice de capabilité en calculant l'intervalle de confiance de l'écart-type court 
terme comme nous l'avons vu dans le chapitre de Statistiques. 


D2. Nous appelons "Performance globale du procédé long terme" le rapport entre l'étendue de contrôle E 
de la distribution des valeurs et la qualité de Six Sigma (6 sigma) lorsque le processus est centré tel que: 


P = E (74.40) 
” 6x 
ce qui s'écrit aussi: 
USL — LSL 
F, = (74.41) 
6Tir 
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L'écart-type au dénominateur étant donné cette fois par le cas où nous considérons tous les gros défauts 
corrigés et le processus stable afin de considérer toutes les pièces fabriquées comme un seul et unique lot 
de contrôle: 


Tir = 


où LT est l'abréviation de "long terme" (abréviation souvent non précisée dans la pratique car supposée 
connue dans le contexte). Cet écart-type est bien évidemment le meilleur pour le deuxième scénario dont 
nous avons fait mention plus haut. Car les variations étant maintenant, par hypothèse, toutes petites, 
l'ensemble de la fabrication peut être supposé comme étant un seul et unique lot de contrôle sur le long 
terme (bon cela n'empêche pas qu'il faut parfois nettoyer les valeurs extrêmes qui peuvent se produire). 


Le tolérancement des caractéristiques est donc très important pour l'obtention de la qualité et de la fiabilité 
des produits assemblés. Traditionnellement, une tolérance s'exprime sous la forme d'un bipoint [Min, Max]. 
Une caractéristique est alors déclarée conforme si elle se situe dans les tolérances. 


Le problème du tolérancement consiste à tenter de concilier la fixation des limites de variabilité acceptable 
les plus larges possibles pour diminuer les coûts de production et d'assurer un niveau de qualité optimal sur 
le produit fini. 


Deux approches tentent de résoudre ce problème: 


1. Le tolérancement au pire des cas garantit l'assemblage dans toutes les situations à partir du moment où 
les caractéristiques élémentaires sont dans les tolérances. 


2. Le tolérancement statistique tient compte de la faible probabilité d'assemblages d'extrêmes entre eux et 
permet d'élargir de façon importante les tolérances pour diminuer les coûts et c'est donc à celui-ci que nous 
allons nous intéresser ici comme vous l'aurez compris. 


Un processus est dit "limite capable" (soit limite stable par rapport aux exigences du client en d'autres 
termes) s'il le ratio donné ci-dessus (en choisissant 6 fois l'écart-type) est supérieur à 1. Mais dans 
l'industrie, on préfère prendre en réalité la valeur de -1.33 dans le cas d'une distribution Normale des 
données. 


Bien évidemment, la valeur & de l'écart-type peut être calculée en utilisant les estimateurs de maximum 
de vraisemblance avec ou sans biais vus dans le chapitre de Statistiques mais il ne s'agit en aucun cas dans 
la réalité pratique de l'écart-type théorique mais uniquement d'un estimateur! Par ailleurs, nous verrons 
plus loin qu'en fonction de l'écart-type utilisé, les notations changent! 


Remarque: En entreprise, il faut faire attention car l'instrument de mesure rajoute son propre écart-type 
(erreur) sur celui de la production. 


Comme nous l'avons démontré au chapitre de Statistiques, l'erreur-type (écart-type de la moyenne) est: 
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Dans la méthodologie Six Sigma, nous prenons alors souvent pour les processus à long terme et sous 
contrôle: 


LCE = + 

. (74.44) 
UCL= u+ Te 

À 


quand nous analysons des cartes de contrôle dont les variables aléatoires sont des échantillons de n 
variables aléatoires indépendantes et identiquement distribuées et que les limites n'ont pas été imposées par 
un client ou par une politique interne ou des contraintes techniques! Bien évidemment, il faut bien être 
conscient que UCL et LCL n'ont pas la même expression dans des cas plus complexes et donc pour des 
distributions autres que la loi Normale! 


Par ailleurs, l'expression précédente diffère aussi pour les processus à court terme, car l'exemple donné 
ci-dessus est pour un cas de mesures sur le long terme uniquement pour rappel! 


Le lecteur remarquera que nous avons maintenant: 


_ USE -ESL 


= (7445) 
? UCL-LCL 


Normalement, au sein des entreprises, l'étendue de contrôle est fixe (le numérateur) et donc quand la 
valeur de l'écart-type est grande (plus de variations, moins de contrôles) la valeur de l'indice est faible et 
lorsque l'écart-type est faible (moins de variations, plus de contrôles) la valeur de l'indice est élevée. 


Comme le montrent les deux exemples ci-dessous: 


36 66 
——— 
LSL u USL LSL u USE 
(a) Cp =1 (b) Cp = 2 


Figure: 74.2 - Deux plots de mesures sous contrôle statistique avec une capabilité différente 


L'indice €, impose que la moyenne (l'objectif) est centrée entre LSL et USL. Dès lors, la moyenne est 


confondue avec ce que nous appelons la "cible" T du processus. 


Mais la moyenne # dans la réalité peut être décalée par rapport à l'objectif T initial qui doit lui toujours 
(dans l'usage courant) être à distance égale entre USL et LSL comme le montre la figure ci-dessous dans le 
cas particulier d'une loi Normale: 
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LSL T u USL 
Figure: 74.3 - Mesures sous contrôle statistique décalé par rapport à la cible 
Mais ce n'est pas forcément le cas dans la réalité où les ingénieurs (quelque soit leur domaine 
d'application) peuvent choisir des LSL et USL asymétriques par rapport à la moyenne ne serait-ce que 


parce que la loi n'est pas toujours Normale (typiquement le cas en gestion de projets..)! D'où la définition 
suivante: 


D2. Nous appelons alors "Capabilité potentielle décentrée court terme du procédé" (dans le cas décentré) 
ou "Process Capability Index (within)" la relation: 


Ck=C,(-E) (7446 


P 
avec: 
:_-_ FA _Tr4 
(74.47) 
= CUS _LSE) Cp 


où # > 0 est appelé le "dégré de biais" ou "indice de position" et T le "target" donné naturellement par: 


_ USE + LSL 
2 


Fi (74.48) 


qui donne le milieu de la distribution relativement au bi-point [LSL,USL] imposé (ne pas oublier que 
l'écart-type au dénominateur de la relation antéprécédente est l'écart-type court terme!). 


Au fait cet indicateur de capabilité de contrôle peut sembler très artificiel, mais il ne l'est pas totalement. 
Effectivement, il y a quelques valeurs remarquables (celles qui intéressent l'ingénieur) qui permettent de se 
faire une bonne idée de ce qu'il se passe avec celui-ci: 


1. Si la moyenne et la cible sont confondues, nous avons alors: 
T =}{ (7449) 


nous nous retrouvons donc avec & = Ô et donc C’,K, = €, et le critère de jugement de la valeur de l'indice 


sera basé sur l'indice de capabilité centré court terme. 


2. Si faute d'un mauvais contrôle du processus nous avons: 


[7 -gl> 0.5. (USL-LSL) (74.50) 
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alors la moyenne # est soit au-dessus de USL soit en dessous de LSL ce qui a pour conséquence d'avoir 
& >1 et donc Cy <0. 


3. Si nous avons: 
0 <[T- y] <0.5-(USZ-LSL) (74.51) 


alors la moyenne # est comprise entre les valeurs USL et LSL ce qui a pour conséquence d'avoir 0 < & <1 
et donc 0 <Cy <C,. 


4, Si nous avons: 
Î7-4|=0.5.(OSZ-ELSE) (7452) 


alors cela signifie simplement que la moyenne est confondue avec USL ou LSL et nous avons alors £ =1 et 
Ce = 0 
pi ; 


Comme l'interprétation reste cependant délicate et difficile, nous construisons les indices de capabilité 
unilatéraux "Upper Capability Index CPU" et "Lower Capability Index CPL" donnés par: 


CPU = USE 4 CPL = A=LSE (74.53) 
3 3 


que nous chercherons bien évidemment aussi à maximiser. Voyons d'où viennent ces deux valeurs et 
comment les utiliser: 


Démonstration: 
D'abord, nous avons besoin de deux formulations particulières du degré de biais k. 
Si: 


US£ + LSE . 


4 (74.54) 
2 


alors nous pouvons nous débarrasser de la valeur absolue: 


1 
r- 1 S(USL+LSL)- 4 a==(USL+ LSL) 
£ = ————————————— = EE — = ep 
(US -1S£)  (USL- LS) S(USL-LSE) (7455) 


__ 24  USL+LSL 
USL-LSL USL-LSL 


Si: 


USL + LSE 
pr 


(74.56) 


alors nous pouvons nous débarrasser de la valeur absolue: 
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(USL+LSE)- y 


ND 
a 
+ 
D 
[on] 
sr 
| 

E 


l 


7 (USE - LS) (USL — LSL)\ (USZ— LSL) (7457) 


_US£+LSL 2y 
USL-LSE USL-LSL 


Nous avons alors lorsque F > {{: 


c,0-=0,1-(REtE- 244 ] 
US£-LSL USL-LSL 
cf 244 ] 

PL  (USL-LSE USL-LSL 
He) (te 244 ] 


6 USZL — LSE  USL-— LSE (74.58) 


DR USE +LSE | USE — LSE 24 | 
6 6  USL-LSL 6  USL-LSE 
_ [EE L eu) (2544) (5) 
6 6 6 6T 6€ 3 


et respectivement lorsque T < j{: 


c,(-#=C, 1-[ 24 +) 
USL-LSL USL- LSE 


=. h-{ 244 ee) 

“ USL-— LSL USL-—LSL 
| 244 nr) 

6 USL- LSL USL-LSL 
—— 244 eee | 


(74.59) 


6 6 DSL — LST, 6 DSL — LS, 
: (= — LS : 24 F USE, = : Es : æ) 
_ 6 6 6 CU 6ea 6 
: USE — 4 : 1 Zi 
37 3 


[ C.Q.FD. 


À long terme, dans certaines entreprises, il est intéressant de savoir qu'elles sont les plus mauvaises valeurs 
prises par les indices CPU et CPL (c'est le cas dans le domaine de la production mais pas forcément de la 
gestion de projets) 


Page: 4403/4839 


[v3.0 - 2013] 


Les plus mauvaises valeurs étant trivialement les plus petites, nous prenons souvent (avec quelques unes 
des notations différentes que l'on peut trouver dans la littérature spécialisée): 


. Ji 1 
Ci = min {CPU, CPE) = min(C.. Cu) = min Lara) (74.60) 
Voici par exemple un diagramme d'analyse de la capabilité généré par le logiciel Minitab 15.1.1 (en 
anglais) avec les différents facteurs susmentionnés sur un échantillon de 68 données suivant une loi 
Normale (un test de normalité a été fait avant): 


Process Capability of C1 


Target 
Process Data Potential Within) Capability 

145 Cp 2.10 

15,5 CPL 1.07 

16,5 CPU 3,13 

Sample Mean  15,0085 Cpk 1.07 

Sample N 68 
StDev(Within) 0.158884 


HAE CLS MS GTS ON IG ETOS 


Observed Performance Exp. Within Performance 
% «LSL 0.00 % «LSL 0.07 


% > USL 0.00 % >» USL 0.00 
% Total 0.00 % Total 0.07 


Figure: 74.4 - Diagramme de capabilité généré avec Minitab 15.1.1 


Deux lectures typiques sont possibles (nous expliquerons la partie inférieure gauche du graphique plus 
loin): 


1. En production: Le processus est capable (valeur >1.33) mais avec une (trop) forte déviation vers le 
gauche par rapport à la cible définie, ce qui n'est pas bon (CPL ayant la valeur la plus petite) et doit être 
corrigé. 


2. En gestion de projets: Les tâches redondantes sont sous contrôle (valeur >1.33) mais avec une forte 
déviation vers le gauche, ce qui peut être bon si notre objectif est de prendre de l'avance par rapport au 
planifié (rien à corriger). 


Il faut vraiment prendre garde au fait que dans la réalité, il n'est pas toujours possible de prendre la loi 
Normale, or tous les exemples donnés ci-dessus sont basés sur cette hypothèse simplificatrice. 


Toujours le cadre de la gestion de la qualité en production, la figure ci-dessous représente bien la réalité 
dans le cadre d'un processus court ou long terme: 
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Figure: 74.5 - Processus court/long terme (source: MSP/SPC de Maurice Pillet) 


Chaque petite gaussienne en gris clair, représente une analyse de lots assimilé au concept de "dispersion 
instantanée". Nous voyons bien que leurs moyennes ne cessent de bouger pendant la période de mesures 
(que cette variation soit grande ou très faible) et c'est ce que nous appelons la "dispersion globale". Le but 
dans les organisations (industries ou administrations) est de faire en sorte que la variabilité instantanée ou 
globale soit limitée au maximum. 


Or la relation définissant C’, supposait, comme nous l'avons mentionné, que le processus est sous contrôle 


centré (donc toutes les gaussiennes sont alignées) et sur une optique court terme. 


De même, la relation définissant €’, supposait, comme nous l'avons mentionné, que le processus est sous 


contrôle, sur une optique court terme et décentré par choix (ou à cause du fait que la loi n'est pas 
Normale). 


Par contre, si le processus n'est pas centré parce qu'il n'est pas sous contrôle alors qu'il devrait l'être, la 
variable aléatoire mesurée est la somme de la variation aléatoire des réglages X de la machine et des 
variations aléatoires non contrôlables des contraintes des pièces Y. 


L'écart-type total est alors, si les deux variables aléatoires suivent une loi normale, la racine carrée de la 
somme des écarts-types (cf. chapitre de Statistiques): 


g= dé + oi = + (74.61) 


Or, si nous n'avons qu'une seule mesure, il vient en prenant l'estimateur biaisé (c'est un peu n'importe quoi 
de l'utiliser dans ce cas-là mais bon...): 


ci = (7-4) (7-1) (74.62) 
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Or dans le cas d'étude qui nous intéresse Y représente la moyenne expérimentale (mesurée) du processus 
qu'on cherche à mettre sous contrôle. Cette moyenne est notée traditionnellement m dans le domaine. 


Ensuite, £# n'étant pas connu on prend ce qu'il devrait être: c'est la cible T du processus. Ainsi, nous 
introduisons un nouvel indice appelé "Capabilité potentielle décentrée moyenne court terme du procédé": 


c _ USZ —LSL _ USL-LSL 


M pm — Ja > (74.63) 
j 6 sf+(m-T) 


où encore une fois il faut se rappeler que l'écart-type dans la racine au dénominateur est l'écart-type court 
terme! 


Nous voyons immédiatement que plus €’, est proche de C’, mieux c'est (dans les domaines de 


production du moins). 


Nous avons donc finalement les trois indices de capabilités court terme centré et non centré les plus 
courants (nous avons délibérément choisi d'uniformiser les notations et de mettre le maximum d'infos dans 
celles-ci): 


DSL — LSE USL — 4 Ji — LSE DSL — LSE 
5. = Ca Se, Cm = EEE | (4.64) 
Ter STer 0er 6foèr +(4-T) 


De même nous avons aussi les trois indices de capabilités long terme centré et non centré les plus courants 
(nous avons délibérément choisi d'uniformiser les notations et de mettre le maximum d'infos dans 
celles-ci): 


USL — LSE CSL 44 ji LSE US£ — LST 
D = ——— Ex = can ae Em = > || (74:65) 
Or Or Oir 6ulo?r +(u-T) 


Enfin, indiquons que bien que ce soit pas très pertinent, il arrive parfois que certains ingénieurs fassent les 
deux analyses (court terme + long terme) en même temps sur la même base de données de mesures. 


Cependant, pour faire de l'analyse objective sur les indices de capabilité vus jusqu'à maintenant, il faudrait 
d'abord que les instruments de mesure soient eux-mêmes capables... ce que nous appelons souvent les 
"méthodes R&R" (Répétabilité, Reproductibilité). 


Le principe de base (car le principe avancé consiste à faire une ANOVA à deux facteurs avec répétition) 
consiste alors à évaluer la dispersion courte terme ou respectivement long terme de l'instrument de mesure 
afin de calculer une "capabilité de processus de contrôle" définie par: 


E 


= ——— (74,66) 
pe ) 

LT AE 
Dans les cas classiques, nous déclarons le moyen de contrôle capable pour un suivi MSP lorsque cette 
capabilité est supérieure à 4 et nous allons de suite voir pourquoi. Rappelons pour cela d'abord que: 
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(74.67) 
P 69 


Mais la variance observée est au fait la somme de la "vraie" variance et de celle de l'instrument telle que: 


_E£E E 
pobsenmé ET (74.68) 
6g 6 Fi T De 
Or nous avons: 
E 
pri = =— et Cyovni = (74.69) 
6T% 1 (1 4 PS 
En mettant le tout au carré, nous en déduisons: 
_ #* E? 
2, 0bseÉ À _ 
36 (oi + honte E? E? 
2 2 
360% ai CT" 
(74.70) 
: 1 : 1 
_ 7 f m2 2 
re 1 Con FL pvi 
2 2 2 2 
Ces Ce nérroranté C, vrai | Ce 
D'où: 
2 2 
c? » = Con Core (74.71) 
p,obseré — 2 2 ° 
cu + (8 op 


Ce qui nous donne: 


2 2 2 2 2 2 2 2 2 2 
C'aobservé (c2 + SE — ot | Cr — Ed Le = En (c?, un un (74.72) 


Soit: 
c _ Ci ser Ce L Ch ervé 
BR | 
Ce E C'yobservé i- C'ycbservé (74.73) 
C s 


Ce qui se traduit par le graphique de la figure suivante qui montre bien l'intérêt d'un C’,, au moins égal à 
4! 
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Relation entre Cp vrai et Cp observé 


| 


| 
| a | | 
3 ms | 


Cp observé 


0.3 0.5 0.7 09 1.1 1.3 1.5 1.7 19 2.1 23 235 27 29 31 33 3.5 3.7 39 41 
Vrai Cp 


Figure: 74.6 - Relation entre capabilité vraie et mesurées 


Dans la pratique, signalons que pour déterminer C’,, on se sert d'une pièce étalon mesurée par 


interférométrie LASER et s'assurer ensuite que tous les essais répétés de mesure se fassent sur les deux 
mêmes points de mesure. 


Une fois ceci fait, on effectue plusieurs mesures de la cote étalon et on prend l'écart-type de ces mesures. 


Ce qui donnera le & nent : 


L'étendue E est elle imposée par le client ou par des ingénieurs internes à l'entreprise. Elle sera souvent 
prise comme étant au plus dixième de l'unité de tolérance d'une pièce. 


Par exemple, si nous avons un diamètre intérieur de 36 +1 [{4##] (étendue de tolérance de 2 microns ce qui 


est déjà du haut de gamme niveau précision, car à notre époque le standard se situe plutôt autour des 3!), 
notre appareil devra alors avoir selon la règle précédemment citée une étendue de 0.2 microns. Il est alors 
aisé de déterminer qu'elle devra être l'écart-type maximum de l'instrument si on se fixe une capabilité de 
processus de contrôle de 4 (et encore. 4 c'est grossier!). 


Certains ingénieurs apprécient de savoir à combien d'éléments en millions d'unités produites (parties par 
million: PPM) seront considérées comme défectueuses relativement. 


Le calcul est alors aisé puisque l'ingénieur a à sa disposition au moins les informations suivantes: 


O,H,USL,LSL,T (74.74) 


et que les données suivent une loi Normale alors il est immédiat que (cf. chapitre de Statistiques): 
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1 à CA 
PPM}j == [e 2 dx.10 (7475) 
V2 
et: 
1 (ra 


e 2 gxl.10 (74.76) 


ln. 


valeurs très aisées à obtenir avec n'importe quel tableur comme Microsoft Excel par exemple. 


Nous avons alors 


il en est de même pour la capabilité long terme (il suffit de prendre alors l'expression correspondante de 
l'écart-type). 


1.4. NIVEAUX DE QUALITÉS 


Signalons un point important relativement à Six Sigma. Au fait, objectivement, l'idée de cette méthode est, 
certes, de faire de la SPC (entre autres, mais ça ce n'est pas nouveau) mais surtout de garantir au client 
selon la tradition couramment admise avec un écart-type ayant une borne supérieure de «= 1 avec une 
déviation à la moyenne (en valeur absolue) de 1.547 par rapport à la cible, ce qui garantit au plus 3.4 PPM 
(c'est-à-dire 3.4 rejets par million). 


Remarque: Ce choix empirique vient de la mise en pratique de la méthode Six Sigma par son créateur 
(Bill Smith). Il a observé dans son entreprise (Motorola) que sous contrôle statistique, il avait 
quasiment systématiquement une déviation comprise entre 1.2 et 1.87 à la moyenne pour tous ses 
procédés industriels. 


Voyons d'où vient cette dernière valeur à l'aide des deux tableaux suivants: 


1. D'abord construisons un tableau de type idéal qui présente des données d'un procédé court terme (mais 
les calculs sont parfaitement identiques pour du long terme) centré sur la cible (de cible nulle ici, ce qui est 
un cas typique), de moyenne nulle (donc sur la cible et alors donc €, = C4 ) et d'écart-type unitaire avec 


USL et LSL symétriques (ce qui restreint par contre le champ d'application): 
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133614 o Mauvais 

0.6 0.6 71861 1.8 
0.7 0.7 35729 21 
0.8 0.8 16395 2.4 
0.9 0.9 6934 2.7 

1 1 2700 3 
1.1 1.1 967 3.3 
1.2 1:2 318 3.6 
13 1.3 96 3.9 Limite 
1.4 1.4 27 4.2 
1.5 1.5 6.8 4.5 
1.6 1.6 1.6 4.8 
1.7 1.7 0.34 Gel 
1.8 1.8 0.067 5.4 
1.9 1.9 0.012 7 

2 2 0.002 6 Excellent 


Tableau: 74.2 - Capabilité, Niveau de qualité Sigma et P.P.M. dans procédé centré 


où toutes les données sont obtenues à l'aide des relations suivantes à partir de l'indice de capabilité 
potentielle uniquement: 


ISL=(T+ih OSE=(T4E0 DSL-0 ERL. US 


CR - PSE _ USE 

37 37 3e _ 3o 3 6 
cer -T+4)-ESL _(T+0)-ESL _O-LSL _ LS | 
_ 3 _ 3 3 3 


si l'écart-type est réduit (ce qui peut toujours être fait et ne change point la justesse des résultats!). Et 
puisque dans le tableau ci-dessus LSL et USL sont symétriques par rapport à la cible: 


= Cr = min{CPU,CPL} = LSE = -USL = —3C, (74.79) 


et les PPM sont conformément à ce que nous avons vu juste avant donnés par: 
|, UE FA ARE 
PEM rx =|1-—— [ e 2ax|.10$ + [ e 2dx|.105 (74.80) 


27 F] 


et donc puisque dans l'exemple ci-dessus LSL et USL sont symétrique par rapport à la cible cela se 
simplifie en: 


i 3C, — 
PPM 75 = A [ e 2ax|.10.2 (7481) 
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où, par exemple, la valeur du PPM donnée à la ligne "Limite" est obtenue avec Maple 4.00b à l'aide de la 
commande: 


>evalf((1-1/sqrt(2*Pi}*int(exp(-x/2/2),x=-infinity..3.9))*2)*1E6: 
ou avec la version anglaise de Microsoft Excel 11.8346: 
=(1-NORMDIST(3.9:0;1;1))*1E6 


Rappelons que le "niveau de qualité sigma" noté &, est au fait donné à l'aide du tableau suivant que nous 


avions construit dans le chapitre de Statistiques: 


19, 68.26894 317311 
25, 95.4499 45'500 
30, 99.73002 2700 
49, 99.99366 63.4 
5G, 99.999943 0.57 
65, 99.9999998 0.002 


Tableau: 74.3 - Capabilité, Taux de non-défection en % et PPM 


et pour lequel nous avions donné la commande Maple 4.00b pour obtenir les valeurs qui sont valables pour 
tout écart-type et toute espérance! 


2. Maintenant construisons le tableau au pire selon Six Sigma, soit un tableau en procédé non centré (c'est- 
à-dire où €, = C,{ n'est pas satisfait) avec une déviation de la moyenne de +1.5a (donc à droite mais on 
pourrait prendre à gauche et les résultats seraient les mêmes) par rapport à la cible et d'écart-type unitaire 
avec USL et LSL symétriques (ce qui restreint toujours le champ d'application): 
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501350 5 Mauvais 

0.6 0.1 382572 1.8 
0.7 0.2 27412 2,1 
0.8 0.3 184108 2.4 
0.9 0.4 115083 2,7 

1 0.5 66810 S. 
1.1 0.6 35931 33 
1.2 0.7 17865 3.6 
1.3 0.8 8198 3.9 Limite 
1.4 0.9 3467 4.2 
1,5 1 1350 4.5 
1.6 d1 483 4.8 
1.7 12 159 5.1 
1.8 1.3 48 5.4 
1.9 1.4 13 7 

2 1.5 3.4 6 Excellent 


Tableau: 74.4 - Capabilité, Niveau de qualité Sigma et P.P.M. dans procédé décentré 


où toutes les données sont obtenues à l'aide des relations suivantes à partir de l'indice de capabilité 


potentielle uniquement: 


USE —(T +15 
ceu- SE (T+150) _USL-T US C,-05 
3 3 3 
T+15o)-2S2 = 
cp -Utt$e)2SL _T-ISE LS  LSE 6 _ C,+0.5 
3 3€ 3 
et donc: 
Cy = min{CPU,CPL} =C,-0.5 (74.83) 
d'où: 


USL =3.0, 


LSL = 3. A +1) on 


et les PPM sont conformément à ce que nous avons vu juste avant donnés par: 


(74.82) 
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USE _(x-xŸ LSE _(x-xŸ 
PPMya=|1-—= [e 7? ax|10+ "lé + à&lw 
27 27 
j 3€, 2 | —3.(C,+1) Hess ’ 
= Ne L e dx |-10° + = L e dx|-10" (7485) 


: i —3(C,+#+1) _(x-1.5ÿ ; 
e 2 adx|.19% +| —— e 2  ax|.10 


27 à | 27 


Il 
dt 
| 


où la ligne "Limite" du tableau précédent est par exemple obtenue avec Maple 4.00b à l'aide de la 
commande: 


>evalf((1-1/sqrt(2*Pi)*int(exp(-(x-1.5}2/2),x=-infinity..(1.3*3))))“1E6+evalf((1/sqrt(2*Pi)*int(exp(-(x- 
1.5)2/2),x=-infinity..-(3*(1.3+1)))))*1E6; 


ou avec la version anglaise de Microsoft Excel 11.8346: 
=(((1-NORMDIST(3*1.3;1.5;1;1))+ NORMDIST(-3*(1.3+1);1.5;1;1)))*1E6 


On comprend enfin en voyant cette fameuse ligne "Limite", pourquoi un procédé sous-contrôle est dit 
"limite capable" avec un indice de capabilité potentielle de 1.33 étant donné le nombre de PPM! 


Donc, le but dans la pratique c'est bien évidemment d'être dans la situation du premier tableau avec pour 
valeur correspondante dans ce premier tableau à un niveau de qualité sigma de - 474 pour avoir 
l'équivalent des 3.4 PPM du deuxième tableau (car il est plus facile de centrer un procédé que de contrôler 
ses écarts). 


Toute l'importance des valeurs calculées ci-dessous est dans l'application de procédés de fabrication à 
n-étapes en série (considérés sous la dénomination de processus"). Cette application sera présentée dans 
le chapitre sur les Techniques de Gestion. 


Exemple: 


Faisons un résumé de tout cela en considérant une nouvelle petite production de # = 50 pièces par lot de 
10 (afin d'ajuster en cours de production). La mesure de côtes de 5 pièces chaque heure pendant 10 heures 
avec une tolérance de 10+0.07 soit en termes de centièmes une étendue de: 


Fe. T= Id (480) 


et une cible de T = Q (en termes d'écarts). Nous avons les données suivantes: 
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| Ina pate ter fe pe po 
H214 10/4103) 0|11| 


Bolslo 21 2)0l1l1/2 
Hiloi3i1 00/1/1131 
H:i1/2/2/2:0/10)41{0 
Hi:1300 33/2/1110 
4[06/-14/-18/-0.2| 1.4 10.2 [1.2/0.4/1.6 10.5 
T |1.14/.07/1.30/1.48/1.67/1.79/1.79/1.14/1.95 1.14 


Tableau: 74.5 - Application d'analyse de maîtrise statistique des procédés 


Nous voyons immédiatement que le processus de fabrication a été non stationnaire pendant cette première 
production, il faudra donc apporter des corrections à l'avenir: 


035 


8 7 6 -5 4 -3 -2 -1 0 1 2 3 4 5 6 7 8 


Figure: 74.7 - Preuve par un tracé que le processus est non stationnaire 


ou sous forme de carte de contrôle (comme je les aime) avec la représentation d'un écart-type de 347 (ce 
qui est suffisant pour des petites quantités des pièces bon marché à fabriquer): 
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—USL ——LSL ——T —4— Moyenne 


Figure: 74.8 - Petite carte de contrôle empirique 


Donc, on devine quand même que le processus est limite. 


Remarque: Une chose intéressante c'est que l'on peut analyser aussi ce graphique en utilisant les outils 


mathématiques de l'analyse des séries temporelles (cf. chapitre d'Économie),. 


D'abord, si nous voulons faire une étude statistique pertinente des différentes données ci-dessus nous 
pouvons calculer la moyenne générale des écarts qui sous l'hypothèse d'une distribution Normale est la 
moyenne arithmétique (cf. chapitre de Statistiques): 


XZ=0.12 (74.87) 
Ensuite l'écart-type des données de toutes les pièces est de: 


Srr = 1.80 (74.88) 


en utilisant l'estimateur de maximum de vraisemblance de la variance de la loi Normale: 


(x -À) (74.89) 
À 


nous avons une valeur supérieur à 1 ce qui est donc non-conforme à ce que Six Sigma exige dans son 
niveau de qualité. 


Donc, l'erreur-standard (l'estimateur de l'écart-type de la moyenne) est de: 


o,= Être 0.25 (74.90) 
À 


Donc, l'intervalle de confiance à 95% de la moyenne est de (cf. chapitre de Statistiques): 
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_ S _ £ 
X-196-L<eu<X+196-E (7491) 


A A 
Soit dans notre cas: 


—0.379 << 0.619 (74.92) 


Et l'inférence statistique avec notre écart-type long terme utilisant le test d'hypothèse bilatéral du re 
donne (cf. chapitre de Statistiques): 


GDS eo, x CDS 
Lar2 02 — 1) H-xr262—1) 


(74.93) 


Ce qui nous donne dans notre cas: 

2.268<a?r<5.047 (74.94) 
soit: 

1.506<a;r <2.246 (7495) 


Nous remarquons alors que sur une analyse long terme, nous avons les intervalles: 


—0.644 < 4 < 0.884 
(74.96) 
1.506<ar < 2.246 


Calculons maintenant la performance globale du procédé long terme (si supposé centré donc!). Nous 
avons: 
_USL-LSE  E 14 


P,=———— == =1294 (7497 
6S cr 6S:r  6-1.80 


Mais avec un instrument ayant un ,, de 4, cela correspond réellement à: 


PF 


qi = EE = 1,574 


| Le cheré (74.98) 


F 


pe 


De plus, indiquons que comme nous savons faire un calcul d'intervalle de confiance pour &;- (voir le 


calcul fait précédemment), il est alors aisé d'en avoir un pour . aussi! 


Si l'analyse de la performance globale du procédé long terme est non centrée (ce qui est le cas ici) nous 
utilisons donc: 


USE - X = = 0.12-(-7) 
RE  —  — —_ __— — 


Pj = min | À= min (12711316) = 1.27 (74.99) 
Gr de 3.180 ° 31.80 
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et nous savons encore une fois qu'à cause de l'instrument, cette valeur est un peu sous-évaluée! Nous 
avons bien évidemment: 


Px #Æ, (74100) 


donc le processus n'est pas centré (on s'en doutait...). Alors, il faut calculer la capabilité potentielle 
décentrée moyenne long terme du procédé ,, selon les relations déterminées plus haut: 


Fe Z1.291 (74.101) 


Bref, que ce soit de la valeur de F4, À, où F,,, nous voyons que les valeurs sont toutes limites capables 


(c'est-à-dire que la valeur est supérieure à 1 - voir définition plus haut pour un rappel de ce que signifie 
"limite capable"). 


Si nous faisons alors nos calculs de PPM selon les relations obtenues plus haut avec la valeur de $;- et de 
X obtenues, nous avons alors: 


ir . . 
FFM, = PPMir + PPM 5 = 114 (74.102) 
Ensuite, dire que ce chiffre est bon ou mauvais est difficile, car il nous manque l'information de savoir quel 
est le coût de production, le coût de revient et de réparation d'un produit et le tout est lui-même dépendant 
de la quantité totale fabriquée! Mais nous pouvons utiliser aussi le modèle de Taguchi pour connaître la 
valeur des paramètres (moments) calculés qu'il serait préférable de ne pas dépasser! 


Calculons maintenant les indices de capabilité court terme! Pour cela, il nous faut l'estimateur de la 
moyenne de l'ensemble en considérant chaque individu comme une variable aléatoire. Nous savons (cf. 
chapitre de Statistiques) que cette moyenne est aussi la moyenne arithmétique dans le cas d'une loi 
Normale et elle est strictement égale à celle que l'on calcule en considérant l'ensemble des individus 
comme une seule et unique variable aléatoire. Donc, il vient que: 


X=0.12 (74103) 


En ce qui concerne l'écart-type par contre ce n'est pas pareil. Mais nous savons (cf. chapitre de 
Statistiques) que la loi Normal est stable par la somme. Par exemple, nous avions démontré qu'étant 
données deux variables aléatoires indépendantes et distribuées selon une loi Normale (en imaginant que 
chaque variable représente deux de nos dix échantillons), nous avions pour leur sommee.: 


Z+T= NHysr: Oxar) = N[ux + ay, eZ +c) (74.104) 


Or nous avons aussi démontré dans le chapitre de Statistiques que de par la propriété de linéarité de 
l'espérance, nous avons: 


X+F\ 1 1 + 
#D=E( | _ Ax TAy 


ce qui est conforme à notre remarque précédente pour la variance: 
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d$ + oi = or +o (74.106) 


Donc in extenso: 


(74.107) 


et dans notre cas particulier: 


(74.108) 


nous avons une valeur supérieur à 1, ce qui est donc non-conforme à ce que Six Sigma exige dans son 
niveau de qualité. 


Donc l'erreur-standard (l'estimateur de l'écart-type de la moyenne) est de: 


Gy=27=0.707 (74109) 
ps 


Donc l'intervalle de confiance à 95% de la moyenne est de (cf. chapitre de Statistiques): 


_ S _ à 
X-196 Léuer+196 Te (40) 


dE VE 
Soit dans notre cas: 


—1.267<<1.507 (74.111) 


Nous remarquons donc qu'en court terme, l'intervalle est beaucoup plus large qu'en long terme, ce qui est 
normal étant donné la faible valeur de k (qui vaut donc 5 dans notre exemple). 


Et l'inférence statistique avec notre écart-type long terme utilisant le test d'hypothèse bilatéral du re 


donne (cf. chapitre de Statistiques): 


(2 — DS or nu (74.112) 


Lai202— D B-ar202— 1) 
Ce qui nous donne dans notre cas: 
0.899 < aèr <20.692 (74.113) 
soit: 


0.948 £ Gor <4.549 (74.114) 
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Nous remarquons alors que sur une analyse long terme avec les intervalles: 


1.267 < y <1.507 
0.948 < Gor < 4.549 


(74.115) 


Les variations peuvent donc être énormes avec une probabilité cumulée de 95% et il faudra prendre garde 
dans un cas pratique d'apporter des réglages au plus vite afin de diminuer au maximum les moments! 


Calculons maintenant la capabilité potentielle du procédé court terme (si supposé centré donc!). Nous 
avons: 


USZ — LSZ E 14 
Ce, = ————— > —— 7 —— "71475 (74.116) 
ÉSer 6C:r 6-158 


Donc, nous avons: 

C, > É (74.117) 
ce qui est normal, car si les mesures que nous avons étaient vraiment faites sur une longue période alors ce 
serait très problématique alors que sur une courte période, c'est déjà un peu plus normal. D'où cette 


relation d'ordre entre les deux indices. 


Mais avec un instrument ayant un €’, de 4, cela correspond réellement à: 


c ; 
Ed 
(74.118) 


De plus, indiquons que comme nous savons faire un calcul d'intervalle de confiance pour #7 (voir le 


calcul fait précédemment), il est alors aisé d'en avoir un pour €’, aussi! 


Si l'analyse de la capabilité potentielle du procédé court terme est non centrée (ce qui est le cas ici) nous 
utilisons donc: 


USE - X RL (ee 0.12-(-7) 


Ca = min | | = min {1.44,1.49}=144 (74.119) 
: 3Sor * 3Ser 31.583 3.1.583 


et nous savons encore une fois qu'à cause de l'instrument, cette valeur est un peu sous-évaluée! Nous 
avons bien évidemment: 


Cyr #C,y (74120) 


donc le processus n'est pas centré (on s'en doutait..). Alors, il faut calculer la capabilité potentielle 
décentrée moyenne court terme du procédé C’,,, selon les relations déterminées plus haut: 


C'onen = == ——#1,296 (74121) 
6 6Srr 6-18 
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Bref, que ce soit de la valeur de C5, C, ou C’,,, nous voyons que les valeurs sont toutes limites 
capables. 


Si nous faisons alors nos calculs de PPM selon les relations obtenues plus haut avec la valeur de $:.- et de 
X obtenues, nous avons alors: 


PPMT = PPMy + PPMyr =10 (74.122) 


Ensuite, dire que ce chiffre est bon ou mauvais est difficile, car il nous manque l'information de savoir quel 
est le coût de production, le coût de revient et de réparation d'un produit et le tout est lui-même dépendant 
de la quantité totale fabriquée! Mais nous pouvons utiliser aussi le modèle de Taguchi pour connaître la 
valeur des paramètres (moments) calculés qu'il serait préférable de ne pas dépasser! 


Pour clore cette partie, voici la sortie d'un logiciel comme Minitab 15.1.1 dans lequel nous retrouvons tous 
les calucls effectués ci-dessus plus des cartes de contrôle dont nous ferons les démonstrations détaillées 
plus loin (se réeferer au chapitre de Méthodes Numériques pour les test AD d'Anderson-Darling): 


Capability Sixpack du procédé de Échantillon 1 ; …; Échantillon 5 


E Carte X barre Histogramme des capabilités 
2 2 LCS=2,259 LS: ©oe Lss 
5: 
£ : 
= 0 X=0,12 
. 
d 2 LCI =-2,019 ‘ 
2 LUI 3 T4 US ONU INE ETS I € 4 2 0 2 4 € 
Carte R Diag. probab. de Normale 

| LOS =7,841 AD : 0,500, P : 0,020 
< DE Cl 
: EC 
24 rs K=3,708 A 
È A 
pr] ÉD 
= EEE me =“ ill 

1 2 3 4 5 6 7 8 9 10 5 0 E] 
Derniers sous-groupes de 10 Graphique des capabilités 


L 


44 
— ljithin 
Echantillon —— Overall 


Figure: 74.9 - Analyse de capabilité Six Pack de Minitab 15.1.1 


Valeurs 
n e 
LE 
4 
LA 
Lu 
S 


1.5. MODÈLE DE TAGUCHI 
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Dans le cadre des SPC (Statistical Process Control), il est intéressant pour un industriel d'estimer les pertes 
financières générées par les écarts à la cible (attention on peut appliquer également cette approche dans 
d'autres domaines que l'industrie!) 


Nous pouvons avoir une estimation relativement simple et satisfaisante de ses pertes (coûts) sous les 
hypothèses suivantes: 


H1. Le processus est sous contrôle (écart-type constant) et suit une loi de densité symétrique décroissante 
à gauche et à droite par rapport à la cible (qui peut être une côte, un nombre d'erreurs par périodes, etc.) 


H2. Le coût est nul lorsque la production (ou le travail) est centrée sur la cible (minimum). 


H35. Le coût augmente de manière identique lorsque la production se décentre sur la gauche et sur la droite 
(ce qui n'est par contre plus le cas dans le domaine de l'administration par exemple). La fonction de coût 
passe donc selon H2 et H3 par un minimum sur la cible. 


Dès lors, si nous notons Y le décentrage par rapport à la cible T et L la perte financière ("loss" en anglais 
d'où le L). Nous avons: 


L= f(?) (74123) 


Même si nous ne connaissons pas la forme de cette fonction, nous pouvons l'écrire sous forme de 
développement de Taylor (cf. chapitre de Suites et Séries) autour de T tel que : 


25 (Y- ) (74.124) 


L,()= 


xl 


Si nous développons au troisième ordre: 


0 1 2 
As 2210 État LD y _7y 414 LD {y _rÿ 


à D 2 dÿ° (74.125) 

dL(T) 1 d'L(T) 2 

= L(T) + F-T)+— Y-T 

DE CT ae 077) 

Or par l'hypothèse H2, nous avons L(T) qui est nul. Il reste alors: 
dLi(T) 1 d°L(T) de 
L(P)= F-T)+— F-T (74.126) 
Ce uit Lee ou CU à 


et comme par H3, la dérivée de la fonction L(Y) est nulle en T puisqu'il s'agit d'un minimum alors: 
L(P)= 2 = Tÿ (74.127) 


Ce qui est noté en SPC: 


L(F)=k(Y-T)| (74128) 


Page: 4421/4839 


[v3.0 - 2013] 


et est appelée "fonction de perte de Taguchi (centrée)" ou plus simplement "fonction perte de qualité 
(centrée)". 


Bon c'est bien joli d'avoir cette relation mais comment doit-on l'utiliser? 


Au fait, c'est relativement simple. Sous les hypothèses mentionnées plus haut, si nous avons en production 
des mesures de défauts (côtes, retards, pannes, bug, etc.) alors il suffit de calculer leur moyenne 
arithmétique Æ# (estimateur de la moyenne d'une loi Normale) et ensuite de savoir le coût financier ou 
horaire L que cela a engendré pour l'entreprise ou l'institution (parfois cette moyenne est calculée sur la 
base d'un unique échantillon..). 


Donc, la relation précédente devient: 
dd 
Laæk(yu-T) (74129) 
avec Let # connus. 


Et comme T est donné par les exigences du client ou du contexte alors il est aisé d'obtenir le facteur k: 


L 


& D 
(u-TŸ 


Ilè 


(74.130) 


qui est au fait mathématiquement parlant le point d'inflexion de la fonction mathématique L . 


Cette dernière relation est parfois notée: 


Une fois que nous avons k avec une bonne estimation, il est possible de connaître L pour toute valeur Yet 
ainsi nous pouvons calculer en production le coût d'une déviation quelconque par rapport à la cible. 


Exemple: 


Considérons une alimentation pour une chaîne stéréo pour laquelle T vaut 110 [V1]. Si la tension sort des 
110 +20 [FT] alors la stéréo tombe en panne et doit être réparée. Supposons que le coût de réparation est 
(tous frais directs et indirects compris!) de 100.-. Alors, le coût associé pour une valeur donnée de la 
tension est: 


L(y)= Sr L-110) = 0.25(y- 10° (74.132) 


Voyons maintenant une manière élégante de calculer le coût moyen de Taguchi (perte unitaire moyenne). 
Nous avons bien évidemment dans une chaîne de production sur plusieurs pièces d'une même famille: 


El 


= LG) +208)+2420,))2 [01-77 462277 +405, -7Ÿ] 
(74.133) 


[ x? +X2+..+242| 
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où les a sont des variables aléatoires normales (gaussiennes par hypothèse car le procédé de fabrication 


est sous contrôle statistiques). Or, nous avons démontré dans le chapitre de Statistiques lors de notre étude 
de l'intervalle de confiance sur la variance avec moyenne empirique connue que: 


Donc: 


Dès lors: 


LA 
ï 


Cette dernière expression présente l'avantage de montrer très clairement que pour minimiser la perte, il 
faut agir sur la dispersion et l'ajustement de la moyenne sur la valeur nominale. 


Or nous avons démontré dans le chapitre de Statistiques que (il est important dans les présents 
développements que nous utilisions les notations qui distinguent les différents estimateurs!): 


L 1 
à “=—g* (74137) 


Donc: 


Et si n est grand, nous avons alors pour un lot de produits: 


£= ko+(a-7) | (74.139) 


où le premier terme entre crochets représente donc la variance de Y autour de sa propre moyenne et le 
deuxième terme la déviation de Y par rapport à la cible T. 


Indiquons que l'on retrouve cette dernière relation dans la littérature et dans les logiciels souvent sous la 
forme suivante: 


L=k[s? HF — Yi F (74.140) 
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où l'indice N signifie "nominal". Évidemment, quand la cible T (ou la valeur nominale) est prise comme 
étant nulle, les relations se simplifient encore d'avantage. 


Maïntenant, rappelons les propriétés suivantes de l'espérance et de la variance (cf. chapitre de 
Statistiques): 


E(aX)= &E(X) 
Tax = Ar 


(74.141) 


Dès, lors si le processus est décentré et que nous devons corriger la variable aléatoire pour la recentrer, il 
vient intuitivement que ce facteur sera alors: 


Dès lors, il vient immédiatement: 
2 2 2 
S 
L=k| s ex) 1 =h}|—| 0414 
ÿ F 


Donc pour minimiser L, sachant que les autres termes sont imposés, il faut minimiser le rapport: 


ge 

— (74.144) 
—2 

4 


ou, ce qui revient au même, maximiser le rapport inverse (qui reste sans dimensions): 


Ce nombre étant souvent très grand, il est d'usage dans la littérature et dans les logiciel de statistiques d'en 
prendre le logarithme en base 10 et de multiplier par 10 (c'est une idée inspirée de la physique acoustique). 
Nous avons alors ce que nous appelons le rapport signal/bruit (en anglais: signal/noise), donné en décibels 

par: 


SN = 10log;p 7 [dB]| (74146) 


pour ce que les ingéieurs appellent "le nominal est le meilleur". 


Relation que l'on retrouve telle quelle dans un logiciel comme Minitab lors de l'analyse de plans 
d'expérience de Taguchi (voir plus loin ce que sont les plans d'expérience). Certains très rares logiciels 
proposent également le cas particulier suivant: 
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s2 
SIN =10logp E = 101ogp (7? |- 10100 (8? | =—-101ogg[S?| (74147) 
p=1 


ç2 
Pour la suite revenons à la relation: 


L 


LLG1)+L02)++20,)]=2[01-7) +027 4.408 -7) 
(74.148) 


CHR 


[ x? +X2+..+2X2] 


Les ingénieurs parlent de minimiser la fonction perte de qualité quand T (la cible) doit est nul et donc qu'il 


faut minimiser tous les }; . Donc la relation précédente se réduit finalement à: 


1 .2 
> y (74.149) 
: 


Ce que les ingénieurs aiment parfois bien résumer sous la forme suivante (alors qu'à mon avis prendre le 
logarithme en base 10 ainsi que de mettre un signe "-" dans ce cas ne se justifie vraiment pas... bien au 
contraire): 


—101og x (74.150) 
À j 


et même parfois il disent que c'est quand même un rapport signal/bruit. alors que de toute évidence il n'y 
a aucun bruit dans ce cas particulier qui est appelé: "le plus petit est le meilleur" (PPEM). C'est 
exactement sous cette forme que l'on peut trouver cet objectif écrit dans le logiciel Minitab. 


Dans le cadre d'un paramètre à maximiser il est d'usage de dire qu'on cherche alors plutôt à minimiser: 


2 ï 2 

- k É J É J É J : 

LE=||—-—| +|—-—| +, + —-— (74.151) 
a|ln T » T Yn T 


car vu que T tend vers l'infini il serait difficile de faire quoi que ce soit mathématiquement parlant. 


Donc justement vu que T tend vers l'infini, cette dernière relation se réduit à: 
* __. 
2, 7 (74.152) 

e 


Ce que les ingénieurs aiment bien résumer parfois sous la forme suivante ( ici le logarithme en base 10 se 
jusitife!): 


-ie[15 +] (74.153) 
# ji Y 
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et même parfois il disent que c'est quand même un rapport signal/bruit. alors que de toute évidence il n'y 
a aucun bruit dans ce cas particulier qui est appelé: "le plus grand est le meilleur" (PGLM). C'est 
exactement sous cette forme que l'on peut trouver cet objectif écrit dans le logiciel Minitab. 


Il est cependant, en étant malin, 


Pour cela écrivons: 


Posons: 


Alors dans ce cas, en utilisant la 


Nous avons alors: 


1 5° 
+ 


ñ# 


et sous contrôle statistique nous 


2 
# | 
pré 


possible d'introduire le bruit dans la relation: 


1 
2, 7 (74.154) 
# : }; 
ls l 5 1 
. 27 CT a 74.155) 
«| Te D Lê TR Du ( 
pal pa 
x= À Æ  (a156 


série de Taylor démontrée dans le chapitre de Suies Et Séries: 


1 


2 
de Zz1-2x+3x (74.157) 
i1+xi 


2 
"ER el 
Li (74.158) 


avons: 


<<? Y — À 
— 
: 


—Û0 (74.159) 


et en supposant que nous travaillons sur l'ensemble de la population de pièces, nous avons: 


Il vient alors: 


n 2 
> 1% —-4) (74160) 
i=1 


m 


Hate) ee 


1 
ra 4 


1+3— 
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Donc au final en remplaçant un peu abusivement par les estimateurs, il vient: 


2 
SIN =-10logn _ Po 
Y ÿ 


2. MAINTENANCE PRÉVENTIVE 


L'évolution des techniques de production vers une plus grande robotisation des systèmes techniques plus 
complexes a augmenté l'importance de la fiabilité des machines de production. Aussi, un arrêt imprévu 
coûte cher à une entreprise. De même, dans l'industrie aéronautique et spatiale, les problèmes de fiabilité, 
de maintenabilité, de disponibilité sont capitaux. La maintenance garantit le niveau de fiabilité pour 
l'ensemble des composantes (mécaniques, électromécaniques et informatiques). 


L'existence d'un service de maintenance a pour raison le maintien des équipements (systèmes) et aussi la 
diminution des pannes. En effet, ces dernières coûtent cher, elles occasionnent: 


- Des coûts d'intervention, de réparation 
- Des coûts de non-qualité du produit 
- Des coûts indirects tels que des frais fixes, pertes de production, la marge bénéficiaire perdue... 


De ce fait, il faut tout mettre en oeuvre pour éviter la panne, agir rapidement lorsqu'elle survient afin 
d'augmenter la disponibilité du matériel. Pour ce faire, il faut modéliser la vie des équipements. L'ensemble 
des méthodes et techniques relatives à ses problématiques sont habituellement classifiées sous le nom de 
"Analyse des Modes de Défaillance, des Effets et de leur Criticité" AMDEC. 


Nous distinguons principalement deux classes de systèmes: les systèmes non réparables (satellites, bien de 
consommations à faibles coûts, etc.) et les systèmes réparables (machines de production, moyens de 
transports, etc.) où les approches théoriques sont différentes. Pour la deuxième catégorie, il est possible 
d'utiliser aussi les chaînes de Markov (où les états représenteront le nombre de composants fonctionnels ou 
en panne d'un système conformément à la norme ISO 31010), les réseaux de Petri ou la simulation par 
Monte-Carlo. 


L'idée est dans les textes qui vont suivre de faire un petit point sur ces méthodes, d'en rechercher 
l'efficacité et de permettre aux praticiens ingénieurs ou techniciens de mieux appréhender ces problèmes. 
Une large place sera faite au modèle de Weïbull, qui a une implication importante dans le domaine. 


2.1. OBSOLESCENCE PROGRAMMÉE 


L'obsolescence programmée va à l'encontre de la maintenance préventive dont le but premier est de 
fournir un produit de qualité et respectueux de son environnement en connaissance précise de la durée de 
vie du produit et du risque quantifiable de désuétude. 
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L'idée de l'obsolesence programmée est de réduire la durée de vie ou d'utilisation d'un produit afin d'en 
augmenter le taux de remplacement par le consommateur (stratégie parfois motivée par les politiques..). 
La demande ainsi induite aurait pour but (non démontré sur le très long terme...) de profiter au producteur, 
ou à ses concurrents Le secteur bénéficie alors d'une production plus importante, stimulant les gains de 
productivité (économies d'échelle) et le progrès technique (qui accélère l'obsolescence des produits 
antérieurs) et maintient l'emploi d'une démographie toujours croissante est qui est donc problématique par 
définition. 


Le lecteur aura donc compris que je suis farrouchement contre ces méthodes et que tout ingénieur et tout 
scientifique travaillant pour un entreprise se doit de refuser par déontologie ce type de demande par la 
hiérarchie quitte à dénoncer ces méthodes anonymement sur Internet ou des associations de 
consommateurs. 


2.2. ESTIMATEURS EMPIRIQUES 


Dans le cadre de l'étude de fiabilité non accélérée (le vieillissement accéléré est un sujet trop complexe 
pour être abordé sur ce site), nous sommes amenés à définir certaines variables dont voici la liste: 


- N, sera le nombre d'éléments bons à #, (instant initial) 

- M, le nombre d'éléments bons à 4 

- x, le nombre d'éléments défaillant entre 4 et 4,, noté aussi A, 
- À, l'intervalle de temps observé égal à 4, -4. 

Définitions: 


D1. Nous définissons le "taux de défaillance par tranche temporelle" A+ par la relation: 


qui s'interprète donc comme étant le nombre d'éléments défectueux par rapport au nombre d'éléments 
survivants sur une tranche de temps donnée (il s'agit donc d'un pourcentage de non-confirmités relatives 
par tranche temporelle). 


Cette dernière relation est aussi parfois appelée "hazard ratio" (HR) ou "survie relative" et souvent notée 


# 


h(£,). 


D2. Nous définissons la "fonction de défaillance" par la relation (densité de probabilité de défaillances à 
l'instant 4 ): 


en remarquant bien que le dénominateur n'est pas le même que celui qui définit le taux de défaillance par 
tranche! 
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Cette fonction s'interprète donc comme étant le % d'éléments défectueux dans la tranche de temps étudiée 
par rapport au nombre total d'éléments initialement testés. Il s'agit de l'indicateur qui intéresse le plus 
souvent l'ingénieur! 


D3. Nous définissons naturellement la "fonction de défaillance cumulée" par: 
"MX M Gauss) 
W W M 
que tend vers 1 lorsque le temps tend vers l'infini. 


Cette fonction s'interprète donc comme étant le % d'éléments défectueux cumulé par rapport au nombre 
total d'éléments initialement testés. 


D4. Nous définissons in extenso la "fonction de fiabilité" par (il s'agit du deuxième terme de la précédente 
relation): 


=1-Ê() (74166) 
Son nom provient par l'interprétation du rapport dans le cadre de la définition de la fonction de défaillance 


cumulée. 


Il faut se souvenir que R provient de l'anglais "reliability" qui signifie "fiabilité" alors que le F en anglais 
signifie "failure" qui signifie en français “panne”. 


Par suite nous avons aussi: 


= À(L)— Â(4) A, = 2 AG) (74167) 


Cette dernière relation servant au calcul des lois de fiabilité! 


Puisque: 
FG)A <1et lim D ()As =1 (74168) 
i 


la fonction de défaillance peut être vue comme une probabilité, ce qui nous conduit à définir naturellement 
son espérance: 


ET) = APM = Xe] Ga160) 
0 


Relation très utile dans la pratique qui donne en théorie le pourcentage moyen d'éléments en panne à 
l'instant £. 


BExemple: 
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Nous avons relevé sur un lot de 37 moteurs d'un type donné les défaillances suivantes répertoriées par 
tranches (données par des clients ou mesurées en interne sur des bancs d'essais): 


ont 4 | 7 | 1 | nu 2 


Tableau: 74.6 - Défaillances des moteurs par tranches d'effort 


Il faut que nous estimions la valeur de la fonction de fiabilité Ê(£), la fonction de défaillance #(4,) et la 


défaillance par tranche À(£). Les calculs sont élémentaires et nous obtenons le tableau suivant: 


mme . . t 
10 [s ] 
CS _ 37 0 100% | 0 - 
1 36 1 97% | 2.7% 27 
4 32 5 86% | 10.8% 111 
7 25 12 67% | 18.9% 218 
12 13 24 35.1% | 32.4% | 480 
11 2 35 54% | 5.4% 846 
5 0 37 0% ; 1 


Tableau: 74.7 - Analyse des défaillances des moteurs par tranches d'effort 
Nous voyons ci-dessus par exemple que le taux de défaillance n'est pas constant bien évidemment! 


Le taux de panne #(£,) serait de l'ordre de 2.5 à 3% par an en 2013 pour les réfrigérateurs, lave-vaisselles, 


etc. Pour le matériel audio-visuel il tournerait autour des 1.5 à 2% par an. 


Concernant les taux de défaillance, les ingénieurs reconnaissent souvent trois tranches d'analyses suivant 
que certains objets étudiés soient jeunes, en fonctionnement normal ou considéré en vieillissement. 


On considère alors assez intuitivement (et parfois grossièrement) que le taux de défaillance suit une courbe 
en baignoire comme représenté ci-dessous (dans les tables techniques c'est souvent le taux de défaillance 
en fonctionnement normal qui est donné): 
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A(#) 


L 7 


Jeunesse Fonctionnement normal Vieillissement 


alors que si vous observez le tableau précédent, le taux de défaillance ne suit pas du tout une courbe en 
baignoire (c'est donc un contre-exemple). 


Les ingénieurs en fiabilité découpent souvent la baignoire en trois parties visibles ci-dessus, mais sous la 
dénomination technique suivante: 


- D.FR. pour "Decreasing Failure Rate": les composants jeunes ayant des problèmes de fabrication non 
identifiés lors de procédé sont éliminés du lot ce qui a pour effet de diminuer le taux de défaillance. La loi 
de Weibull est relativement bien adaptée pour modéliser cette phase. 


- C.FR. pour "Constant Failure Rate": les composants sont dans un état stationnaire. 


- LER. pour "increasing Failure Rate" les composants sont en fin de vie et leur taux de défaillance 
augmente. La loi de Weibull est à nouveau relativement bien adaptée pour modéliser cette phase. 


La loi de Poisson est relativement bien adaptée pour modéliser les arrivées de pannes, et la loi 
exponentielle pour modéliser le temps entre pannes successives. Ce constat découle de démonstrations 
mathématiques disponibles dans le chapitre sur les Techniques De Gestion (théorie des files d'attentes). 
Donc, cela signifie que pannes sont souvent considérrées comme indépendantes. Dès lor, la loi sur le 
nombre de pannes dans une période donnée est alors une loi "sans mémoire" et on peut modéliser par une 
loi de Poisson (démonstration aussi faite dans le chapitre sur les Techniques De Gestion). 


Remarque: Contrairement à ce que pas mal de théoriciens pensent..., les logiciels informatiques grand 
public ont aussi leur taux de défaillance qui suit une courbe en baignoire. Effectivement, au début il y a 
des bugs non détectés qui font que la défaillance va diminuer au fur et à mesure de leur détection et 
leur correction. Ensuite, à cause des mises à jour fréquentes de l'environnement qui ont tendance à 
rajouter d'autres problèmes (service pack), le taux de défaillance se maintient à peu près constant. 
Enfin, avec le temps, l'évolution des technologies environnantes (framework) rendent l'applicatif 
obsolète et des fonctions ne répondent ou n'agissent plus correctement ce qui fait à nouveau augmenter 
le taux de défaillance. 


Vis-à-vis de l'efficacité de la rénovation, indiquons qu'elles peuvent (en simplifiant) très fréquemment se 
ranger en trois catégories: 


Page: 4431/4839 


[v3.0 - 2013] 


1. "As good as new": C'est de la maintenance préventive dans le sens que nous changeons une pièce 
lorsque sa durée de vie l'amène à un taux de défaillance que nous considérons comme trop élevé et dont la 
rupture non anticipée coûtera plus cher que sa non-anticipation. 


2. "As bad as old": C'est de la maintenance déficiente dans le sens que nous changeons une pièce que 
lorsqu'elle est arrivée à rupture, ce qui engendre majoritairement des coûts d'arrêts plus élevés que la 
maintenance préventive qui consiste elle à anticiper au plus juste la casse. 


3. "Restauration partielle": C'est de la maintenance préventive minimale dans les sens que nous réparons la 
pièce défaillante plutôt que de la remplacer par une nouvelle. À nouveau le problème du coût doit être 
calculé en faisant un audit des besoins et des délais de l'entreprise. 


Revenons-en à d'autres définitions au passage à la limite du continu. 


Nous savons donc que le "taux de défaillance instantané" aura pour unité l'inverse du temps tel que 
[4]= 5"!. Ce taux est, dans le cadre de notre étude, pas nécessairement constant dans le temps comme 


nous avons pu le constater! 


Soit R(t) le pourcentage cumulé d'objets analysés toujours en état de bon fonctionnement d'un échantillon 
testé au temps t. Le nombre d'objets tombant en panne durant le temps infinitésimal dt est donc égal à: 


AGE) R(£jdt (74.170) 
ce qui correspond donc à la diminution du stock initial en bon fonctionnement au temps t. 
Nous pouvons alors écrire la relation: 
dF(E)= AG) R(fjdt (74171) 
soit: 


dF(t) _ F(t+dt)-F(t) 


= ————— = ff). df (74172) 
R(£) R(6) 1-F() 


Que l'on retrouve souvent dans la littérature sous la forme suivante: 


CO 
ns à dtR(E)  R(t) ts 


Définition: La "probabilité conditionnelle de défaillance" (rien à voir avec les probabilités conditionnelles 
cependant...) entre t et t + dt est définie par: 


F(é+dt)-F() _ 4F@ 


dote F0) 


(74.174) 


où F(t) et R(t) sont respectivement la fonction cumulée de défaillance (probabilité cumulée de tomber en 
panne au temps t) et la fonction fiabilité appelée également "fonction de survie". R(t) valant 1 au temps 0 
et. 0 après un temps infini comme nous l'avons déjà vu avant! 
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Dès lors, 4(£)df peut s'interpréter comme la défaillance instantanée! En analyse de survie, le facteur de dt 


est nommé aussi parfois "fonction de risque". 


Remarque: Par la même démarche intellectuelle, plutôt que de définir une fonction de défaillance F(t) 
et de survie R(t) avec sa fonction de risque, nous pouvons définir une fonction de réparabilité avec sa 
fonction de M(t) qui serait alors une "fonction de maintenabilité". 


Si nous intégrons (attention u représente maintenant le temps!): 


dF(u) 
je u )du = FE Fu) 
pu ET (74.175) 
1- Fu) 


ue F(u))|; 
Comme F(4, = 0)=0 nous avons: 


fat) “a(-#0)S (ja =1-Æ(f) (74176) 


d'où: 
[ac 
RÉ) =e 
: (74.177) 
[au 
F(t =1-e à 


Par ailleurs, puisque nous avons vu que f(,)= À(t, ) À (+), nous avons alors la "fonction de 


densité/répartition de défaillance instantanée": 


[au (74178) 


JG) = AG)R(E) = AGe * 


Nous pouvons obtenir cette relation et interprétation sous une autre manière: 


HAE __ = A(t}e ue (74.179) 


où nous retrouvons donc F(t) la fonction de probabilité cumulée de défaillance. Évidemment pour 
déterminer la loi f(t), nous utilisons les outils statistiques d'ajustements habituels (cf. chapitre de 
Statistiques). 


Nous avons alors la relation très importante (voir la plus importante!) dans la pratique qui relie la loi de 


densité de la défaillance instantanée et la loi de fiabilité: 
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sms RE = (74.180) 
10 dt dt dt 


Nous avons ci-dessus les trois expressions les plus générales liant les lois de fiabilité et le taux instantané 
de défaillance. Ajoutons encore que nous avons la fonction de hasard instantée suivante qui en découle: 


_dRO 
: _J@) __& _ZRO _4 , \= À (1- \ (4181) 
A6 =) a In (RG)))= S(-n(1- FO 


Il s'ensuit alors immédiatement que: 


t t t 
POE [acodt =[ À (in (1 FC) =-| din(1- F()i=-in(1- F(if 
A à dé û (74.182) 


=—in(1- F(#) =-In(R(6)) 


Puisque f(t) est la fonction de densité de défaillance, l'espérance mathématique de la défaillance est alors 
donnée par: 


Ho 
E@= [#@d (418 
(n] 


Ainsi, si la répartition des pannes est équiprobable (fonction de densité uniforme), ce qui est plutôt rare, la 
moitié des équipements seront hors service à E(t). 


Remarque: En observant 100'000 disques durs, des ingénieurs de Google auraient observé en moyenne 
8% de pertes par an! Donc un taux de perte plus élevé que celui qu'aurait. annoncé des fabricants qui 
serait d'environ 300'000 heures! Le taux de perte est plus élevé les 3 premières années! Mais peut-être 
que les disques qui survivent vivent plus longtemps! 


Nous avons aussi en utilisant l'intégration par parties et la relation précédente: 


Et) = bis Je JAGROE I EE 


+o +o 
= —t4R()E" + [ R(t)dt = [ R(t)at 
(el 0 
D'où une autre manière de l'exprimer: 


+<o 
E(£) = [ Ra (74.184) 
0 
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Nous avons donc la relation: 


Ho +0 
EQ = | odt = | ROa 


0 0 


Avant de continuer donnons quelques définitions d'indicateurs de maintenance dont les plus importantes 
sont dans la norme européenne de maintenance NF EN 13306:2010 (je précise car on trouve sur le web le 
pire et le meilleur concernant les définitions de ces indicateurs...): 


- La T.B.M ou "Time Between Maintenance" est le temps contractuel entre deux visites ou contrôle de 
maintenance (non défini dans la norme). 


- La M.O.T.B.F. ou "Mean Operating Time Between Failures" applicable uniquement pour des éléments 
réparables est l'espérance mathématique du temps opérationnel d'un système entre la fin de la première 
défaillance et le début de la prochaine (défini dans la norme). Dans l'industrie la M.O.T.B.F. est aussi notée 
M.U.T. pour "Mean Up Time”. 


- La M.TB.F. ou "Mean Time Between Failures" applicable uniquement pour des éléments réparables est 
l'espérance mathématique du temps opérationnel d'un système entre le début de deux défaillances (défini 
dans la norme). Cet indicateur inclut donc les temps de non-fonctionnement. Dans le domaine des services, 
la M.T.B.F. est parfois notée M.T.B.S.A pour "Mean Time Between System Accidents". Dans le domaine 
des lignes de production la M.T.B.F. est notée M.T.B.D. pour "Mean Time Between Defects" (on arrête 
pas la production parce que l'on a détecté un défaut conformément à ce que nous verrons les de notre 
étude des cartes de contrôle). Dans le domaine de l'informatique la M.T.B.F. est notée M.T.B.E. pour 
"Meat Time Between Errors" (on arrête rarement un logiciel ou un site web parce que l'on y a détecté une 
erreur!). 


- La MTT.F. ou "Mean Time To Failure" applicable pour des éléments réparables ou non est l'espérance 
mathématique du temps opérationnel d'un système jusqu'à sa première panne (non défini dans la norme). 
Au fait c'est ce dernier que l'on calcule le plus souvent dans les laboratoires de tests. 


- La M.R.T. ou "Mean Repair Time" applicable uniquement pour des éléments réparables est l'espérance 
mathématique du temps de réparation (défini dans la norme). 


- La MTTR ou "Mean Time To Restore" applicable uniquement pour des éléments réparables est 
l'espérance mathématique du temps de redémarrage (défini dans la norme). Dans le domaine des services, 
la M.TTR. est parfois notée M.T.T.R.S. pour "Mean Time To Restore Service". 


- La M.D.T. ou "Mean Down Time” est égale à l'espérance mathématique du temps pendant lequel le 
système n'est pas opérationnel. Cet indicateur (non défini dans la norme) inclus donc la M.RT. Il en 
découle que la M.T.B.F est égale à la somme de la M.O.T.B.F. (M.U.T.) et la M.D.T. 


- La M.TTD. ou "Mean Time To Detection" est égale à l'espérance mathématique du temps pendant 
lequel le système n'est pas été détecté comme étant non opérationnel. Cet indicateur (non défini dans la 
norme), au même titre que la M.R.T., est inclus dans la M.D.T. 


- La M.TT.A. ou "Mean Time to Answer" est égale à l'espérance mathématique du temps pendant lequel 
l'utilisateur a attendu une réponse ou intervention du fabricant après avoir signalé une panne. Cet 
indicateur (non défini dans la norme), au même titre que la M.R.T. et la M.T.TD., est inclus dans la M.D.T. 
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- Le T.R.S. ou "Taux de Rendement Synthétique" dans le domaine de la maintenance est défini 
traditionnellement comme étant simplement le rapport entre le temps de fonctionnement opérationnel et le 


temps attendu de fonctionnement opérationnel (non défini dans la norme). 


- Le S.A. ou "Service Ability" qui dans le domaine de la maintenance est souvent donné par les deux 
relations suivantes et dont le but est qu'il soit le plus proche possible de 1 (c'est-à-dire de faire tendre vers 


zéro la M.D.T.).: 


MTBF — MDT MOTEF 
A = —_— "© = (74.186) 
MTBF MOTBF + MDT 
et on peut en définir encore beaucoup d'autres en dehors de la norme... 


Voici un schéma qui résume peut-être un peu mieux tout cela: 


État S 
MTTF MTIBFE. MTBD.MTBE. MBTBSA 


+4 
.…. 
…. 


MTTD MITA MRT MTTR 


Figure: 74.11 - Résumé des indicateurs de fiabilité les plus importants 
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Remarques: 


R1. Pour chacun de ces indicateurs on indiquera s'il a été pris en compte des causes extérieures ou non. 


R2. Si la taille du lot testée est très petite, il est d'usage d'utiliser la moyenne arithmétique comme 
estimateur de l'espérance. Évidemment cela peut amener à de grossières erreurs. 


R3. Il est bien évidemment possible à partir des indicateurs définis de calculer si une machine 
(élément) est apte à garantir le service souhaité (comme par exemple un nombre de pièces par année à 
fabriquer!). Donc non seulement ces indicateurs peuvent être mesurés, mais ils peuvent donc aussi être 
utilisés pour vérifier l'atteinte d'un objectif souhaité! 


RA4. En ce tout début de 21ème siècle les pays devraient en toute rigueur légiférer pour obliger tous les 
industriels à communiquer la M.T.T.F. de leurs produits afin que le consommateur puisse mieux faire 
son choix à l'achat et comparer les valeurs par rapport à la garantie fournie! Malheureusement, ce n'est 
pas le cas et cela permettrait de mettre en évidence une mauvaise tradition actuelle dans l'industrie des 
produits grand public qui est de fabriquer des composants dont la durée de vie tourne autour des 
200'000 heures afin d'assurer aux industriels un renouvellement de leur marché. 


Exemple: 


Une machine est censée travailler 24 heures sur 24, 7 jours sur 7. Elle a tourné jusqu'à aujourd'hui pendant 
5'020 heures mais avec 2 arrêts d'un total de 20 heures (donc inclus dans les 5'020 [h]). Donnez les 
indicateurs classiques relativement au peu d'informations communiquées: 


MTBF = = 2510 [#. 


MDT = = 10 [ #.] 
5020 — 20 74.187) 
MOTBF = MUT = ———— = 2500 [#.] 
MOTBF 2500 


= ————————— ñz ——— 2 99.60% 
MOTBF +MDT  2500+10 


La classification des systèmes en terme de disponibilité conduit communément à 7 classes de non prise en 
compte (système disponible 90% du temps, et donc indisponible plus d'un mois par an) à ultra disponible 
(disponible 99.99999% du temps et donc indisponible seulement 3 secondes par an): ces différentes classes 
correspondent au nombre de 9 dans le pourcentage de temps durant lequel les systèmes de la classe sont 
disponibles (une année comporte 525'600 minutes): 
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Type sn Pourcentage disponibilité 
non géré 50'000 (-35 jours) 90% 1 
géré 5'000 (-3.5 jours) 99% 2 
bien géré 500 (-8 heures) 99.9% IE 
tolérance fautive 50 99.99% 4 
haute disponibilité 5 99.999% 5) 
très haute disponibilité 0.5 99.9999% 6 
très grande haute disponibilité 0.05 99.99999% 7 


Tableau: 74.8 - Classes de défaillances AMDEC 


L'usage de ces paramètres dans le cadre de fiabilité font dire que nous avons une "approche en valeurs 


moyennes". 


Attention cependant à une chose! Ce n'est pas parce qu'un événement à une probabilité plus petite ou 
infiniment plus petite qu'une autre qu'il en est moins important!! Effectivement il faut bien évidemment 
pendre en compte (de façon certes un peu empirique) la gravité de la défaillance. Aïnsi, une centrale 
nucléaire à beau être peut-être 1'000 fois plus sûre qu'une central thermique en termes de probabilités. il 
n'en est rien en termes de gravité lorsqu'un défaillance majeure se produit! Effectivement dans le cas d'une 
central thermique il peut y avoir au pire 500 personnes touchées alors qu'avec une centrale nucléaire c'est 
une autre histoire. 


Signalons enfin un cas simple: Certains composants (électroniques typiquement) ont dans leur période de 
maturité un taux de défaillance constant. La loi de probabilité cumulée de la défaillance qui en découle 
s'en déduit alors immédiatement puisque la fonction de hasard instantanée est donnée par Af£) = À: 


t 
F()=1-exp| -[ AG)é |=1-67# (74188) 
0 


Indiquons que nous retrouvons très souvent cette dernière relation sous la forme suivante dans la 


littérature: 


1- Fil = R(£) =e”"#f (74.189) 
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Les fonction de hasard et de survie sont alors graphiquement de la forme suivante: 
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Figure: 74.12 - Plot de la fonction de hasard et de survie de la loi exponentielle 


un 


La fonction de densité des éléments défaillants au temps t est alors: 


aF(E) | 


J (&) = Fr 


Âe7*? (74190) 


Elle suit donc une loi exponentielle! Cette loi et ses moments nous sont connus (cf. chapitre de 


Statistiques). Il devient alors facile déterminer le M.T.T.F. et son écart-type (inverse du taux de défaillance) 
ainsi qu'un intervalle de confiance. 
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Par ailleurs, si nous calculons la fiabilité R(t) au temps correspondant à la M.TT.F. (inverse du taux de 
défaillance dans le cas de la loi exponentielle) nous obtiendrons toujours une probabilité cumulée de 
36.8% (donc en gros une chance sur trois de fonctionner à ce moment là et 2 chances sur 3 de tomber en 
panne) et non de 50% comme on peut le penser intuitivement (ce qui est le cas seulement si la loi de 
probabilité est symétrique). 


Étant donné que les tables techniques de fiabilité dans l'industrie supposent presque toujours le taux de 
fiabilité constant alors nous comprenons mieux l'importance de celle-ci (nous en aurons un exemple lors de 
notre présentation des topologies de systèmes). 


Rappelons aussi que nous avons vu dans le chapitre de Probabilités que si nous avons un ensemble 
d'événements indépendants (mécanismes indépendants) avec une probabilité donnée, alors les probabilités 
calculées sur l'ensemble dans sa totalité implique la multiplication des probabilités. 


Donc dans un mécanisme ayant des pièces indépendantes mais essentielles (système dit en "série") la 
fonction de densité de fiabilité globale sera égale à la multiplication des lois de probabilités cumulées R(t) 
et ce qui équivaut donc dans le cas d'une loi exponentielle d'avoir une seule loi exponentielle dont le taux 
de défaillance global est égal à la somme des taux de défaillance des différentes pièces. 


Un autre exemple: En mécanique, où le phénomène d'usure est à l'origine de la défaillance, le taux de 
défaillance est souvent du type linéaire (il augmente donc de manière constante avec le temps et est non 
nul lors du premier allumage de l'appareil): 


AE) = at +b 
Alors: 
f at? 
F(£) = 1-exp —[ (at+b)at =] 
0 
Soit: 
PU Re res at? 
= = {& ex = — 
dt P n 


Comme (pour un matériel dont le temps de réparation est négligeable): 


+o Ho at? 
MTBF = | R(dat = | exp ja 
0 0 


cette intégrale ne peut se calculer que par une méthode numérique. Dès lors on préfère prendre des lois 
rapprochées à l'aide d'ajustement du Khi-deux, comme par exemple la loi de Weïbull, qui est un peu la 
poubelle à tout mettre dans le domaine... 


Il faut savoir que dans les banques de données de fiabilité communes et gratuitement disponibles sur le 
marché sont normalement donnés: la dénomination du matériel ou du composant, la MTBEF, la taux de 
défaillance moyen, le patrimoine statistique, un coefficient multiplicatif du taux de défaillances dépendant 
de l'environnement ou des contraintes d'utilisation. 
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2.3. MODÈLE DE WEIBULL 


Encore une fois, les techniques de maintenances utilisent les probabilités et statistiques donc nous 
renvoyons le lecteur au chapitre du même nom. Cependant, il existe dans le domaine de la maintenance (et 
pas seulement) une fonction de densité de probabilité très utilisée appelée "loi de Weibull". 


Elle serait complètement empirique et est définie par: 


_ EI | F7) 
x) = —| — exp|- (74.195) 
7Ù 7 7 


où f(x) 2 0,x 2 0 avec $£ > 0,7 > 0,-œ < y < +w qui sont respectivement appelés "paramètre d'échelle 
7 , "paramètre de forme" £ et "paramètre d'emplacement" #. 


Remarque: Les ingénieurs dans les entreprises doivent obligatoirement se référer à la norme CEI 61649 
Analyse de Weibull pour en faire usage de manière standardisée! 


La loi de Weiïbull est aussi souvent notée sous la forme suivante en posant X:=x-Y,#7:=8, 8=« 
(dans ce cas le paramètre d'emplacement est implicitement posé comme étant nul): 


&-l & & 
f{)= . _ © = _ x exp (3) (74.196) 


Elle peut être calculée dans la version française de Microsoft Excel 11.8346 sous cette dernière forme en 
utilisant la fonction LOI. WEIBULL ). 


Remarque: Elle peut être vue comme une généralisation de la fonction de distribution exponentielle 
(nous allons voir plus loin pourquoi!) avec l'avantage qu'il est possible de jouer avec les trois 
paramètres de manière à obtenir presque n'importe quoi. 
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Figure: 74.13 - Fonctions de densité et de distribution de Weibull pour différentes valeurs de alpha (source: Wikipédia) 
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En annulant le paramètre d'emplacement #, nous obtenons la "distribution de Weïbull à deux paramètres": 


qui a une application pratique importante et dont nous avons calculé les estimateurs des paramètres dans le 
chapitre de Statistiques. 


En posant encore une fois y = et en assumant que #= €‘ =“ nous avons la "distribution de Weïbull à 
un paramètre" (c'est un peu iditio comme définition mais bon...): 


c C-1 [eg 
sw ff] sol (5) | (74.198) 
77 7 


où le seul paramètre inconnu est le paramètre d'échelle 7 . Nous assumons que le paramètre & est connu a 
priori d'expériences passées sur des échantillons identiques. Remarquons que la fonction de distribution de 
Weïbull à un paramètre est la dérivée de la fonction de répartion (probabilité cumulée) suivante (il y a trois 
dérivées intérieurs successives pour retomber sur la fonction de distribution. ce qui constitue un bon 
exemple de ce que nous avons vu dans le chapitre de Calcul Différentiel Et Intégral): 


AA 
F(x) = 1- exp {+ (74.199) 


Il s'ensuit alors dans l'ingénierie de la faibilité que dans ce cas particulier, nous avons alors: 


5 Ÿ :Ÿ 
R()=1- FE =1- 1-es(-() | -s[-(;) | (74.200) 
7 7 


Nous retrouvons également parfois cette relation dans la littérature sous la forme: 
Ja)=C 1) 2 EXP {> = cf) x EXP {2 x 
"ut 7 7 7 (74.201) 
=a.b.x1 exp(-b.x°) 


Remarquons que si & est égal à l'unité, nous retrouvons alors une loi exponentielle d'espérance 7 : 


8 BY x 
sw=#fx Exp {> 1 (74.202) 
7 \7 7 7 


La MTBF est alors donnée par l'espérance de la loi de Weibull avec Y non nul: 


Page: 4442/4839 


[v3.0 - 2013] 


+0 +0 8 . #£#-1 E £ 
E(X) = [x fax - [Ets = JE À exp| - 27] lx (74.203) 
J Jr 7 7 


Posons: 


2 À | 8 (x- £ - 
£= FT sm PE UIT | ggm EE jix = dxm Xl (74.204) 
7 x=-Y| 7 nl ê 


avec: 
LV 
= É , > #87 +y=x (74.205) 
7 


Ce qui donne: 


+o 


+0 -l + 
sa-pAE (srrepeqeno 


. ke : (74.206) 
Pre + eee = 7 É et dt+y 


La première intégrale nous est déjà connue, nous l'avons déjà vue dans le chapitre de Calcul Différentiel. Il 
s'agit de la fonction gamma d'Euler: 


D (x) = [ee =xl= r [LA] = FERA (74.207) 
Nous avons finalement: 
- L£ + £#+1 
E(X) = MTBF De ed+ty=y+7l. La (74.208) 


En annulant paramètre d'emplacement # il vient le cas courant en fiabilité: 


E(A) = #1 2 fs 2) (74.209) 
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Remarque: Si par le plus grand des hasards #1e N , alors comme nous l'avons démontré lors de notre 


étude de la fonction Gamma d'Euler: 


; 1Ÿ (4210) 
E = MTEF = y+ r, D | 
@ +7 (;] | (3 


Dans le cas où #1 IR il faut faire appel aux tables numériques obtenues par les algorithmes vus dans 
le chapitre de Méthodes Numériques. 


De même: 


E(X?)- feras - né +) et dt=pT., [AT , + er | 5 | + aa) 


7 


Finalement lorsque paramètre d'emplacement est nul, il vient: 


2 
oc? =Var(X)= E(X°)-E(X) -r[r (#2) fe) | (74.212) 


Remarque: Certains spécialistes, lorsqu'il est fait usage des deux moments d'ordre deux dans l'analyse 
probabiliste de la défaillance, parlent parfois "d'approche en moyenne quadratique".… 


Pour clore, signalons qu'il est d'usage de considérer 5 situations importantes et pertinentes de la loi de 
Weïbull en fonction des valeurs de ses paramètres 


1. La fonction de densité de survie ressemble à une décroissance exponentielle et dès lors, la fonction de 
risque (taux de défaillance) est élevée au départ et diminue au fil du temps (première partie en forme de 
"baignoire" de la fonction de risque). Il s'agit typiquement d'une situation où les défaillances sont précoces 
car les défaillances se produisent dans la période initiale de la vie du produit. 


2. La fonction de densité de survie ressemble à une décroissance exponentielle. Dès lors, le risque de 
défaillance est constant au cours de la vie de la pièce (deuxième partie en forme de "baignoire" de la 
fonction de risque). Il s'agit typiquement d'une situation où les défaillances sont aléatoires et sources de 
multiples causes. Dans cette situation, la loi de Weïbull modélise la phase de "vie utile" du produit. 


3. La fonction de densité de survie s'élève jusqu'à un sommet puis décroît avec une asymétrie assez 
prononcée (densité forte à gauche) et dès lors, la fonction de risque (taux de défaillance) augmente 
rapidement au début et finit par se stabiliser. Il s'agit typiquement d'une situation où l'usure initiale est très 
rapide. 


4. La fonction de densité de survie s'élève jusqu'à un sommet puis décroît avec faible asymétrie assez 
(densité un peu plus élevée à gauche) et dès lors, la fonction de risque (taux de défaillance) augmente de 
manière linéaire. Il s'agit typiquement d'une situation où le risque de défaillance est dû à l'usure et 


augmente de façon constante au cours de la durée de vie du produit. 
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5. La fonction de densité survie ressemble à une gaussienne large et la fonction de risque (taux de 


défaillance) croît rapidement (croissance de type exponentielle). Il s'agit typiquement de la situation où l'on 
arrive à la fin de la vie d'un ensemble de pièces (troisième partie en forme de "baignoire" de la fonction de 


risque). 


Voici quelques exemples types de fonction de risque (hasard) de Weibull: 


5 1.05 

4 1.025 
53 É 
LA & I 
# É 
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Figure: 74.14 - Plot de 4 fonctions de hasard de Weibull pour différentes valeurs des paramètres 


avec les fonctions de survie correspondantes: 
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Figure: 74.15 - Plot de 4 fonctions de survie de Weibull pour différentes valeurs des paramètres 
Exemple: 


Un constructeur de voiture connaît la distribution du temps jusqu'à la première panne d'un de ses véhicules 
dans des conditions moyennes de conduite. La fonction de répartition de Weïbull obtenue de par les essais 
est fonction de Weïbull à deux paramètres donnée par: 


x # 6 122 , 
FG)= 1 exp|- à =1-exp|-(7.7.107 x) (74.213) 


où x est la distance parcourue un kilomètres des véhicules tests. 
Si nous voulons trouver la garantie en kilomètres englobant 5% des véhicules, nous devons alors résoudre 
l'équation: 


1.22 
1- exp (- Œ 106 x] | =5% (74.214) 


Soit avec un peu d'algèbre élémentaire: 


,_Lin(95% Îiiss 


— 211381 [le] (04215) 
77.107 
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2.4. TOPOLOGIE DES SYSTÈMES 


Lorsque nous travaillons avec des systèmes réels non réparables (mécaniques, électroniques ou autres), 
nous sommes confrontés à des contraintes différentes suivant le type de montage que nous avons. L'étude 
de ce type de systèmes est aussi appelée "Reliability Block Diagramm". 


Les deux hypothèses principales de l'étude de ces systèmes sont: 

H1. La panne d'un composant est indépendante des autres 

H2. Pas de pannes arrivant conjointement 

Nous reconnaissons 5 topologies principales dont chaque composant est représenté par un bloc: 
T1. Topologie série: 


Si un seul composant est défectueux le système ne fonctionne plus (les exemples sont tellement nombreux 
et simples à trouver que nous n'en citerons pas). 


Alors dans l'hypothèse où la panne d'un composant est indépendante des autres, la probabilité cumulée de 
défaillance est égale au produit des probabilités cumulées (cf. chapitre de Probabilités). 


Figure: 74.16 - Topologie série 


Dans le cadre des arbres de défaillance probabilistes (voir plus bas), cette topologie correspond à une porte 
OÙ (OR) avec n entrées car il suffit qu'un des blocs soit en panne pour que la sortie ne fonctionne plus: 


Le 


OU 
Figure: 74.17 - Porte OU (OR) 


Comme souvent il est fait usage de la loi exponentielle, la multiplication de plusieurs termes de probabilités 
cumulées étant relativement longue à écrire, nous lui préférons l'utilisation de la probabilité de fiabilité 
cumulée R. 


Ainsi, la fiabilité (probabilité de fonctionnement) d'un système série est donnée par: 


Rs=1-Æ = [IR | (74216) 
al 


Ce qui nous amène bien à une valeur nulle pour la fiabilité si au minimum un bloc a une fiabilité nulle. 


Ce qui se note traditionnellement dans le domaine: 


el 
g{x) = min(x,22,...,2x,) = | LÉ (74.217) 
a 
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Remarque: Le lecteur attentif aura remarqué que le système série est toujours moins fiable que sa 
composante la moins fiable! 


Attention!! Dans le cas des composantes électroniques, le taux de défaillance est souvent considéré 
comme constant par souci de simplification et la fonction de densité est alors celui de la loi exponentielle: 


f(t)= A6" # (74218) 


Or, nous avons démontré que dans le cas d'un système non réparable: 
+0 
E@ = [#@at=MTBF (14219) 
0 
Et comme nous avons démontré dans le chapitre de Statistiques que l'espérance de la loi exponentielle est: 
M 1 
E(E) = [ te #4 = 2 MTBF (74.220) 
0 


Nous avons aussi démontré plus haut que: 


dF __dR(!) 


JO di 


Donc: 
1 


: nt (4500 
R(O=e #=9 MIBF (V9 


Alors pour un système série à taux de défaillance constant: 
er {x me) 
Rs = [Ie * =[]e MIBF _, (FMIBE] (74.223) 
è è 


Ainsi, dans ce cas particulier: 


| 
ñn 
MTBF, = b 1 | (74.224) 
ou autrement écrit: 


À = +2 À; (74225) 
i=1 


et. le problème sur Internet c'est que les pages web qui parlent de systèmes à topologie série (ou parallèle) 
font implicitement usage d'une loi exponentielle, d'où parfois de grosses erreurs de la part des praticiens 
qui utilisent cette dernière relation sans avoir étudié les détails mathématiques sous-jacents. 


Page: 4448/4839 


[v3.0 - 2013] 


T2. Topologie parallèle: 


Contrairement au système précédent, le système continue à fonctionner si au moins un composant 
fonctionne (typiquement les systèmes de redondance dans les avions, les fusées ou les centrales 
nucléaires). 


Figure: 74.18 - Topologie parallèle 


Dans le cadre des arbres de défaillance probabilistes (cf. chapitre Techniques De Gestion), cette topologie 
correspond à une porte ET (AND) avec n entrées car il faut que tous les blocs soient en panne pour que la 


sortie ne fonctionne plus: 


Le 


ET 
Figure: 74.19 - Porte ET (AND) 


En d'autres termes, il s'arrête de fonctionner si et seulement si: 


n 


[IE = [I[(1-2R)=1 (74226) 
i=l 


=1 


Donc, il vient immédiatement que: 


n 


Rs=1-I] 


= 


F.| (74.227) 


Remarque: En gestion de projets ce type de structure parallèle est typiquement utilisée lorsque l'on 
souhaite connaître la fiabilité totale de plusieurs fournisseurs de pièces identiques (comme cela si l'un 
d'eux à des retards ou autres problèmes, les autres doivent permettre d'atténuer l'impact négatif) en 
connaissant ou en estimant bien évidemment la fiabilité de chacun... 


Obervons (utile pour plus tard) que dans le cas très particulier où la fiabilité de tous les éléments est égale, 


nous avons: 
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R=1-[[Æ=1-F#"=1-(1-R) (74228) 
il 


Nous avons donc pour le système parallèle dont les composantes sont à taux de défaillance constant et 
tous identiques (pour simplifier l'étude): 


te] 
Rs =1- IA =1- IIG-R)=1 -IT(:- -e*) (74.229) 
= 
Nous avons alors: 


MTBF, = [il -II(-e* le = ÏT:- (i-e*) le (74.230) 


En posant: 
_ #4 La At 4.93 
u=1l-e" = du = Âe “dt= A(l-u)dt (74231) 
et en remplaçant dans l'expression antéprécédente, nous avons: 


1 ñ ln 
l- x lru"-1 
d du (74.232 
[ 1 L 7 ) 


MTBF; = [== [| 
o 4 - &) Au 


Il n'est pas possible d'intégrer cette dernière relation de manière formelle, mais si on compare pour 
différentes valeurs de n fixées alors nous voyons très vite que: 


ñn 
MTBF; = ch (74.233) 
=] À 


cs 21h 
As=À| 5 (74.234) 
i= “1 


Faisons quand même le développement détaillé pour un système parallèle à deux composantes dont le taux 
de défaillance est constant et non identique. Pour cela, nous partons de la relation démontrée plus haut: 


ou autrement écrit: 


n ñn 
Rs=1-IIÆ=1-I[(-R) (4235 
i=l =] 
Soit dans le cas où n vaut 2, nous avons: 
Rs =1-(1- Rii1- R )= À +R -ARk (74.236) 


et donc: 
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+® 2 ven 
MTBFS = | 1e) dé = | (A +R ARR \d£ 
(sl Î=| (I 
Ch Ai, 1 ii Fads Â © (a +4.) 
= feat [era le to tue (eat [et [e Vial carsn 
(sl Û (I (il 0 (I 
RE RE ER EE 
Donc si À, = À;, nous avons: 
M ne (74.238) 
À À 2ÀA À 24 2À 


Soit: 
2 
À =—À (74.239) 
Ts 


Avant de continuer avec d'autres topologies, voici un exemple d'un petit devoir scolaire (avec solution) 
mélangeant topologie parallèle et et série qui montre que cela ne s'applique pas seulement à des machines. 


Exemple: 


Un laborantin doit quotidiennement effectuer 3 tests différents sur un échantillon, donné : Les tests À , B 
et C dans l'ordre donné! Nous savons que les laborantins ratent le test À une fois sur quatre mais peuvent le 
recommencer 2 fois en cas d'échec (donc ils peuvent le faire 3 fois au total), ils réussissent le B dans 96% 
des cas et peuvent aussi le recommencer une fois en cas d'échec (donc ils peuvent le faire 2 fois au total), 
il ratent le test C une fois sur deux et ne peuvent pas le recommencer. Quelle est la probabilité qu'un 
laborantin réussisse les 3 tests de suite? 


Pour résoudre cet exercice il faut voir chacun des tests reproducible comme un processus parallèle et 
l'ensemble des tests comme un processus série. Nous avons alors la probabilité totale qui est: 


il 


3 2 3 
&=-f-112,)(1-r1r.]a-r- 1-[7) (1-(4%)°|(1- 50% ) = 41.34% 

_ u (74.240) 
Rs Apæoñeie Rs 2 pæaïeie 


Ra ke Ro 
T3. Topologie k/n: 


Ce système fonctionne si k parmi n composants de même loi de fiabilité R fonctionnent. C'est typiquement 
le cas des disques RAID en informatique pour lesquels il en faut plus d'un qui fonctionne toujours à la fin 
et ce nombre est déterminé par le volume de données. Il s'agit aussi principe de fonctionnement des 


système de vote à redondance dans les avions où nous avons un système 2/3 appelé "triplex". 


Nous avons alors la représentation schématique suivante: 
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Figure: 74.20 - Topologie k/n 


Dans le cadre des arbres de défaillance probabilistes (cf. chapitre Techniques De Gestion), cette topologie 
correspond à une porte k-OU (Voting OR) avec n entrées car il faut au moins que k blocs soient en panne 
pour que la sortie ne fonctionne plus: 


HR 


OÙ 
Figure: 74.21 - Porte k-OU (VWting OR) 


Donc chercher la loi de probabilité cumulée de fiabilité revient à se poser la question de la probabilité 
cumulée d'avoir k éléments qui fonctionnent parmi n qui sont non distinguables. 


Cela revient donc à utiliser la loi binomiale (cf. chapitre de Statistiques) pour laquelle nous avons démontré 
que la probabilité cumulée était donnée alors par: 


n 
Rs = DC; R°(1—-R)" "| (74.241) 
x= 


Cette relation ext extrêmement importante dans la pratique de l'ingénerie de la fiabilité!!! Nous 
remarquons ainsi que pour k égalant n nous retrouvons la fiabilité d'un système série dont les éléments ont 
tous la même fiabilitié: 


A| 


Re =D CYR" RIT = CYR'(I- RIT = R'(1-R) "= R" (74.242) 


rer nl(x-2)l 


Et pour k égalant 1, nous retrouvons la fabilité d'un système parallèle dont les éléments ont tous la même 
fiabilitié (revoir les propriétés du coefficient bionomial dans le chapitre de Calcul Algébrique si 
nécessaire): 


Re = DCR RTE DCR (IR CRR (1 RŸT 


+2 x=0 (74.243) 


=(R+(1-R)) -C(1-R)" =1"-(1-RŸ =1-(1-R) 
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Dans le cas du triplex, nous avons donc: 


3 3 3 


= | 2 
Re = D'CÈR (RQ = SR RT 
12 222 XlG— x)l 
: 31 2/1 p 3-2 31 3/1 2133 
ac-ni OR ti US (74.244) 
| | 
= À ph pie pi RÛ 2 3R2 (1 RI+R 3 -3R +R 
21 3101 
= 3R?-2R° 


Par exemple, si la fiabilité est donnée par une loi exponentielle où nous avons déjà démontré que: 


_ armee (74.245 
RO=e "= MIBF US) 


Nous avons alors: 


Fe bi 5 
MTBE = | (3R2()-2R(lat= [ (3e 2 2 4246) 
A : 64 À 


Donc la MTBF globale du système 2/3 est plus grande qu'un système simple ce qui évidemment est le but 
recherché. 


T4. Topologie série/parallèle et parallèle/série à configuration symétrique: 
Ce sont simplement des compositions simples des deux premiers systèmes étudiées précédemment. 


Nous avons d'abord le système série/parallèle: 


Figure: 74.22 - Topologie série/parallèle symétrique 


Or, comme les systèmes séries sont donnés par: 


x 
Rs=1-F;=1[[2R (474247) 


= 
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et les parallèles par: 


Rs=1-[[Æ=1-[I(1-R) (74248) 


= = 


la composition des deux donne trivialement dans notre cas ci-dessus: 


R=1-[I(1-8,)=1- FI[: : [TR (74.249) 
ia jil 


Et nous avons dans la famille aussi le système parallèle/série: 


ES ie DE be 


Figure: 74.23 - Topologie parallèle/série symétrique 


où en utilisant exactement la même démarche que précédemment nous avons: 


Lie] 


Rs = [IA = [I 1- (1-8) (74.250) 


= = 3=l 
T5. Topologie complexe: 


Au fait, il ne s'agit pas vraiment de systèmes complexes mais ils nécessitent simplement une petite maîtrise 
des axiomes de probabilités. L'exemple particulier qui va nous intéresser est le suivant (typiquement filtre 
RLC en cascade): 


Figure: 74.24 - Topologie complexe 
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dénommé "réseau avec bridge”. 


Et nous devinons que ce qui rend le système complexe est le composant 5. Nous pouvons alors considérer 


une première approche qui est de décomposer le problème. 


Le système par rapport au composant 5 sera soit dans l'état: 


Figure: 74.25 - Décomposition du système (première étape) 
s'il est défectueux avec une loi de densité probabilité: 


Fs=1-R$ (74251) 


et ayant lui-même une fiabilité de: 
2 2 
Ra =1-[[|1-[I[R;|=1-(-RR)(-RR4) (74252) 
3=l 2=l 
selon nos résultats précédents du système complexe série/parallèle. 


Soit dans l'état suivant s'il est fonctionnel avec une loi de densité probabilité &; : 


Figure: 74.26 - Décomposition du système (deuxième et dernière étape) 


et ayant lui-même une fiabilité de: 
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2 


Ba =] i-TIG-R8,)[=(1-(G-2R)(-28))(1-(1-28)(1-28)) (4255) 


J=l 


selon nos résultats précédents du système complexe parallèle/série. 


Comme le système ne peut pas être dans les deux états en même temps, nous avons affaire à une 
probabilité disjointe (cf. chapitre de Probabilités) soit la somme des densités auxquelles nous devons 
associer les autres composants. Dès lors nous avons: 


Rs=(1-Rs)[1-(1- RR2)(1- Rs) [+ Rs [(1-G-8)(- 8))(1-(1-28,)(1- R))] (74.254) 


Nous pouvons alors à l'aide de l'ensemble des 5 topologies précédentes faire une évaluation de la fiabilité 
d'un système quelconque! 


Une autre stratégie pour les systèmes complexes consiste à les décomposer en système séries ou parallèles 
simples. Si cela n'est pas possible, nous pouvons calculer la fiabilité de chaque configuration du système 
qui est considérée comme fonctionnant et faire ensuite la somme des probabilités de fonctionnement de 
chaque configuration. 


Faisons un exemple en considérant le cas particulier suivant: 


Figure: 74.27 - Cas particulier de système supposé comme complexe 


Et considérons la table de vérité suivante avec les 5* configurations possibles: 


Étatn®  Bloci Bloc2 Bloc3 Soie 
1 0 0 0 0 
2 fL 0 0 0 
3 0 1 0 0 
4 fL 0 1 fL 
5 0 1 1 [1 
6 fL 1 1 fL 
7 [1 1 " 0 
8 0 0 1 0 


Tableau: 74.9 - Table de vérité d'un système de maintenance préventive 


Le principe (il faut le savoir...) consiste à dire qu'un état UP (valant donc: 1) est affecté à la valeur À; du 
bloc i concerné et que l'état DOWN (valant donc: 0) est affecté à la valeur 1-— À, du bloc i. Chaque valeur 
sera multipliée avec les autres pour obtenir la fiabilité totale du système à un état donné. 
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Ainsi, dans l'exemple précédent, nous avons donc que 3 états qui permettent au système de fonctionner. 
Calculons leur fiabilité respective. Les états n°4 et n°5 donnent donc par définition: 


Rose = RRok3 (74.255) 
L'état n°6 donne lui par définition: 

Rse = RR2k3 (74.256) 
et nous sommons le tout comme indiqué ultérieurement: 


Rs = Rsa + Res + Re = RR(1-R)+RR(-R)+RRR 


Et nous pouvons vérifier que cette approche est effectivement correcte en prenant la relation générale d'un 
tel système démontrée plus haut: 


8 Fa -f0-H6-8,))-(5-11(-8.)/1-10-2,)] 


= 3=1 3=l 3=l 


2 2 
= p- fu -8,)}(- (1-R))= P-r(- s.)}e (74.258) 
j= J=1 
=(1-(-R)(-R))R=R-R(-R)(-R)=R-(R-RR)(-R) 
=R-(R-RR-RR+TRRR)= RR+TRR -RRR 


ce qui montre que nous avons bien le même résultat et que l'approche par décomposition fonctionne aussi. 


Enfin, signalons pour terminer que lorsque nous incluons dans les systèmes des éléments qui permettent de 
tolérer ou d'accepter certaines erreurs, nous parlons alors de "tolérance aux fautes" et nous en distinguons 
principalement de trois types: 


- Redondance active: Dans ce cas tous les composants redondants fonctionnent en même temps. 


- Redondance passive: Un seul élément redondant fonctionne, les autres sont en attente, ce qui a pour 
avantage de diminuer ou de supprimer le vieillissement des éléments redondants, mais en contrepartie 
nécessite l'insertion d'un composant de détection de panne et de commutation. 


- Redondance majoritaire: Cette redondance concerne surtout des signaux. Le signal de sorite sera celui de 
la majorité des composants redondants. 


2.4.1. ARBRES DE DÉFAILLANCES PROBABILISTES 
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Un arbre de défaillances (aussi appelée arbre de pannes ou arbre de fautes) ou "fault tree analysis" en 
anglais est une technique d'ingénierie très utilisée dans les études de sécurité et de fiabilité des systèmes 
consistant à représenter graphiquement les combinaisons possibles d’événements qui permettent la 
réalisation d’un événement indésirable prédéfini. Une telle représentation graphique met donc en évidence 
les relations de cause à effet. Cette technique est complétée par un traitement mathématique qui permet la 
combinaison de défaillances simples ainsi que de leur probabilité d'apparition. Elle permet ainsi de 
quantifier la probabilité d'occurrence d'un événement indésirable. 


Le principe est très simple tant que l'on fait appel à des probabilités binaires, par contre dès qu'il faut 
utiliser des fonctions de distributions continues (cas le plus fréquent dans la pratique), il faut passer par des 
simulations de Monte-Carlo (cf. chapitre de Méthodes Numériques) avec typiquement des logiciels comme 
Weïbull++. 


Considérons l'arbre de défaillance ci-dessous qui comporte donc 5 événements primitifs et 3 événements 
combinés avec les probabilités des événtements primites supposés connus: 


Chambre noire 


P(ES) 


nterrupteur nè 
s'est pas 
déclenché 


P(E3)-6% 


Pas d'électricité Les deux ampoules 


ont grillées 


FE P(E6) 


Problème de 
fusible 


Anomalie dans 
l'alimentation 
P(E1)Y-5% 


‘ampoule n°1 a 
grillé 
P(E4ÿ-10% 


‘ampoule n°2 à 
grillé 
P(E5Y-10% 


P(E2}-3% 


Figure: 74.28 - Arbre de défaillance simple à probabilités binaires et portes ET/OU seules 
Nous avons alors pour l'événement E6 la probabilité suivante puisqu'il s'agit d'une porte ET (assimilable à 


un système parallèle): 


5 
PIR)=R=I[A=PIE)PIE)=0101=001=1% (74250) 


im 
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et pour l'événement E7 puisqu'il s'agit d'une porte OÙ (assimilable à un système série), nous avons. 


2 
P(E )=F, =1-[[(1-% i=1-(1-P(Æ)l1- PE il 
id (74.260) 


=1-(1-0.051.(1- 0.031 =0.0785 = 7.85% 
Et donc au final: 


P(E)=Æ = -(1-Æ (1 À \(1-Æ, j=1-(1-P(E ))(1-P(4))(1-2(£, il 
=1-11-0.06111-0.0785111- 0.011= 0.1424 = 14.24% 


(74.261) 


Ainsi, la probabilité d'avoir la chambre de travail sans lumière est de 14.24%. 


2.5. MÉTHODE DU MAXIMUM DE VRAISEMBLANCE 


Nous avons étudié dans le chapitre de Statistiques que l'utilisation de la technique du maximum de 
vraisemblance permettait d'estimer la valeur maximale ou minimale des paramètres d'une loi statistiques 
sous les hypothèses d'indépendance des événements. 


Cette technique,bien qu'empirique et tout à fait discutable, peut être utilisée dans le domaine de la fiabilité. 
Comme la théorie a déjà été fait dans le chapitre de Statistiques, voyons de suite des cas pratiques. 


Exemples: 


E1. Considérons un système dont les intervalles de temps entre deux pannes est distribué selon un loi 
exponentielle: 


FE) = ——— e (74.262) 


aF(t) _ y -ar 
d'£ 


de paramètre 4 inconnu et où nous considérerons (comme toujours.) que chaque panne est indépendante. 


Des observations nous ont donné le nombre de mois suivants entre chaque panne: 10, 5, 11, 12, 15. 


En utilisant alors le maximum de vraisemblance qui consiste donc à maximiser la propabilité totale 
d'événements indépendants (donc il faut multiplier), nous avons: 


Ls(A)= de 10. 26754. ge la ge, 152 D 950-584 (74.263) 


Donc déterminer le taux de défaillance qui maiximise la vraisemblance consiste à calculer quand la dérivée 
s'annule: 


dls(A) d#e 
dA  dà 


(544-534 je 954 = 34(5_534)e 34 =0D (74.264) 


Nous avons alors deux racines triviales qui sont: 
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5 (74.265) 


et évidemment nous allons conserver la deuxième racine comme taux de défaillance de notre système. 


E2. Nous considérons les mêmes données qu'avant mais avec cette fois-ci une loi de Weïbull avec la 
notation simplifiée suivante: 


œ 

Œ x x æ-1 æ > 

J(x)=—x  exp|-| — = ŒÂx  expl—Ax | (74.266) 
# ê 


et donc: 


L(e,4)=#f(10)f(5)#(11)/ (12) (15) 


= [400% exp (210%) ]l &25% 1 exp(-45%) |] 411% exp(-211% )] 
Lat12% 4 exp( 212% )][ a215% exp (415 )] bé 


= 510% 15% onto (22 (10% + 5% +11 +192 +152 )) 


Pour cherche à maximiser ce genre de fonction formellement il n'existe pas de méthodes connue (du moins 
à ma connaissance..). Par contre, un tableur comme MS Excel avec son solveur permet de trouver les 
deux paramètres de cette loi de Weïbull en trois clics! 


E3. Nous supposons que nous mettons sous observation 10 éléments de fabrication identique. Parmi les 10, 
nous avons observé un arrêt de 4 d'entre eux après 700, 800, 900 et 950 heures. Les 6 éléments restants 
seront considérés comme dépassant les 1'000 heures mains nous arrêtons l'observation à partir de cette 
valeur. En supposant que la loi de défaillance est à nouveau exponentielle, nous avons alors (l'idée est 
subtile mais simple): 


A0 ( À) = 7 (700). (800),7 (900).7 (950) 
07002 3,800 3,-9002 3,-0502 1 _ | _,-1'0004 Ÿ (74.268) 


- a42733504,-6"0004 _ A449773504 
Il vient alors: 


dE (4) dA%e7 73502 
dA  dÀÂ 


=(445 -913502% 6 -7"35024 L 334913590416 7 3504 2 Q (74.269) 


Nous avons alors deux racines triviales qui sont: 
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et évidemment nous allons conserver la deuxième racine comme taux de défaillance de notre système. 


2.6. MODÈLE DE SURVIE DE KAPLAN-MEIER 


Dans des domaines comme l'industrie, la médecine ou en biologie, nous intéressons souvent aux: 
- Durée de survie après un événement grave 

- Durée de rémission après un traitement ou une opération 

- Durée d'un symptôme après une anomalie 

- Durée d'une infection sans symptôme 

Nous cherchons très souvent à distinguer au moins "l'événement d'intérêt": 

- Arrêt du système après l'événement grave 

- Fin de la rémission 

- Fin d'un symptôme après anomalie 

- Début d'un symptôme lors d'une infection 

de la variable a expliquer "durée avant l'apparition de l'événement d'intérêt": 
- Temps écoulé avant l'arrêt du système 

- Temps écoulé avant la fin de la rémission 

- Temps écoulé avant la fin du symptôme 

- Temps écoulé sans symptôme 

Définitions: 


D1. Nous appelons "rémission", la diminution d'une maladie ou d'un dysfonctionnement de façon 
temporaire. 


D2. La "durée de survie" ou "durée de vie" T désigne le temps qui s'écoule depuis un instant initial (début 
d'un traitement, diagnostic, panne, etc.) jusqu'à la survenue d'un événement d'intérêt final (décès du 
patient, rechute, rémission, guérison, réparation, etc.). Nous disons que l'objet de l'étude "survit au temps t 
si, à cet instant l'évènement d'intérêt final n'a pas encore eu lieu. 


Remarque: Bien que ce type d'étude puisse être associé à la maintenance préventive, les statisticiens 
l'associent plutôt au domaine de "l'analyse de la survie". 
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Nous nous intéresserons dans le cas présent à un cadre particulier mais qui peut être facilement généralisé: 


- Cohorte/Essai clinique où nous étudions la durée de survie de chaque patient (machine). 


- Tous les patients (machines) n'ont pas la même durée d'observation (instants différents d'entrée dans 
l'étude). 


- Nous avons des informations sur le temps de survie de chaque patient (machine) mais nous ne savons pas 
quand il arrive exactement. 


Des deux derniers points, nous concluons que le temps de survie peut être censuré. Donc les techniques 
statistiques habituelles ne s'appliquent pas directement car les données censurées demandent un traitement 
particulier (bien évidemment, nous enlevons les données censurées nous perdons de l'information). Il va 
sans dire que ce type de situation est extrêmement fréquent et donc l'étude de l'estimation de 
Kaplan-Meier est très importante. 


Définition: La durée T est dite censurée si la durée n'est pas intégralement observée. Les différents types 
de censures sont: 


- La censure de type I: fixée à droite. Dans cette situation, la durée n'est pas observable au-delà d'une 
durée maximale, fixe appelée "censure fixe" et imposée. Donc, soit nous avons l'opportunité d'observer la 
vraie durée de l'événement d'intérêt pour l'élément s'il a lieu avant la censure fixe, soit nous nous 
contenterons de la durée de la censure fixe s'il l'événement d'intérêt n'a pas eu lieu avant. 


- La censure de type I: fixée à gauche. Dans cette situation, la durée d'étude n'est pas observable avant une 
date connue appelée "censure d'attente" et imposée. Donc soit, l'événement d'intérêt a lieu au moment de 
la censure d'attente, soit après. S'il y a lieu après, nous considérerons la durée entre la date de la censure et 
la date de l'événement d'intérêt. 


- La censure de type Il: attente. Dans cette situation, nous observons les durées de vie de n individus 
jusqu'à ce que m individus aient vu l'évènement se produire (décédés). La durée considérée est donc celle 
du début de l'expérience jusqu'à l'événement d'intérêt pour le m-ème. 


- La censure de type III: aléatoire à gauche. Dans cette situation, nous ne connaissons pas quand 
l'événement d'intérêt a eu lieu (car nous avons commencé à observer le sujet d'étude trop tard). Nous ne 
pouvons alors pas traiter des "durées" dans le sens mesurable du terme et il nous faudra nous limite à un 
simple comptage. 


- La censure de type Ill: aléatoire à droite. Dans cette situation, nous ne connaissons pas quand 
l'événement aura lieu (car nous avons arrêté d'observer le sujet avant qu'il y ait lieu pour une raison 
quelconque). Nous ne pouvons alors pas traiter des "durées" dans le sens mesurable du terme et il nous 
faudra nous limite à un simple comptage. 


- La censure de type IV: aléatoire par intervalle. Dans cette situation, nous avons un mélange de la censure 
aléatoire à gauche et à droite. C'est-à-dire que pour certains sujets d'étude, nous ne savons pas quand 
l'événement d'intérêt a commencé, et pour d'autres, nous ne savons pas quand il aura lieu (s'il a lieu....). 


Dans l'industrie des machines, nous savons souvent affaire à la censure de type I: fixée droite. Dans le 
domaine médical, lors d'essais cliniques, nous avons souvent affaire à une censure aléatoire à droite. Dans 
le cas des pandémies, nous avons affaire à des censure de type aléatoire à gauche. 
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Supposons que l'étude soit un essai clinique portant sur deux groupes de patients recevant deux types de 
traitements. Deux questions importantes se posent aux médecins: 


Q1. L'un des deux traitements est-il plus efficace que l'autre en matière d'amélioration de la survie des 
patients? 


Q2. Peut-on mettre en évidence des facteurs prognostiques, c'est-à-dire qui améliorent/détériorent la 
survie? 


Pour répondre à la question Q1 nous pouvons mettre en place des méthodes statistiques qui vont permettre 
de comparer les deux groupes de patients qui reçoivent les deux types de traitement. 


Pour répondre à la question Q2 nous pouvons proposer un modèle qui relie la durée de survie des patients 
à des variables explicatives et mettre en évidence des facteurs pronostiques. 


Accompagnons la théorique directement d'un exemple et considérons le tableau suivant ou deux cohortes 
de patients (nous passons de l'ingénierie mécanique à l'ingénierie humaine.) de même taille initiale atteints 
de leucémie aiguë testent un médicament (6-MP) contre un placebo de façon bien évidemment aveugle. 


Nous avons les durées de rémission suivantes pour 21 patients (le tableau indique donc le nombre de 
semaines pendant lesquelles un patient est considéré comme guéri après traitement avant de rechuter): 


| 6-mercaptopurine (6-MP) Placebo 
6 1 
6 1 
6 2 
6+ 2 
7 3 
D 4 
10 4 
10+ 5) 
11+ 5) 
13 8 
16 8 
17+ 8 
19+ 8 
20+ 11 
22 11 
23 12 
25 12 
52 15 
32+ 17 
34+ 22 
SO+ 25 


Tableau: 74.10 - Analyse de survie de deux cohortes avec censure à droite 
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Le signe + correspond à des patients qui ont quitté l'étude à la semaine considérée. Ils sont donc censurés. 
Par exemple, le 4ème patient est perdu de vue pour une raison quelconque au bout de 6 semaines de 
traitement avec le 6-MP: il a donc une durée de rémission supérieure à 6 semaines. Donc dans l'étude 
6-MP, il y a 21 patients avec et 12 données censurées. 


Remarque: Le modèle théorique suppose que la censure est indépendant du temps de survie (censure 
non informative). Mais si la censure est du à l'arrêt du traitement, l'hypothèse d'indépendance n'est pas 
valide. 


Pour le groupe placebo il est simple de faire une courbe de survie. Il suffit de produire le tableau suivant 
(pour les semaines omises, on impose bien évidemment le nombre de rémission comme constantes): 


0 21 100% 

1 19 19/21-90% 
2 17 17/21=-81% 
3 16 16/21-76% 
4 14 14/21-67% 
5) 12 12/21=57% 
8 8 8/21-38% 
11 6 6/21-29% 
12 4 4/21-19% 
15 3 3/21=-14% 
17 2 2/21=-10% 
22 1 1/20=0.05% 
23 ( ( 


Donc si les données ne sont pas censurées, la survie S{£) peut être estimée par la proportion d'individus 
ayant survécu à l'instant t, qu'il est d'usage d'écrire sous la forme mathématique suivante: 


k 
2 1 
Stti= RIT >= lp (74270 
#8 i=i 
L'idée est donc d'estimer: 


PIT >t1= Piprobabilité de survivre jusqu'au temps £i (74.272) 


par la la proportion de patients ayant survécu jusqu'au temps t. 


Si les données sont censurées, l'estimation de la fonction de survie nécessite des outils spécifiques. Kaplan 
et Meier ont proposé dans ce cas particulier le calcul suivant: 
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Piêtre en rémission àlai-ème semaine 


= Pine pas rechuter à la à la i-ème semaine. Piêtre en rémission à la ii — lième semaine) 


(74.273) 


Voyons cela sous une forme un peu plus mathématique. Si nous notons Æili£ Æi21<..<Xixi les 


instants (ordonnées) où un évènement s'est produit (décès ou censure), nous avons alors: 
PIT > X(k)i=PIT > X(K)|T > X(k-1)) P(T > Æ(k&—-1)) (74274) 
Avec bien évidemment: 
PIT»0)]=1 (4275) 


Nous estimons: 


ñ dy 
E. = n-4) (74.276) 
Rk 


où d; est le nombre de décès observé au temps correspondant à l'événement Æ(#) et À; est le nombre 
d'individus à risque (exposés au risque de décès) juste avant Æ(&). 


Nous définissons l'estimateur de Kaplan-Meier pour tout Æi0i<£ <Æiki: 


1 -# 


É ea © = [â I(1- 


21/21-100% 100% 

6 21 18/21=85.7% 100%*85.7%=85.7% 
fi 17 16/17-94.1% 85.7%*94.1%=80.7% 
10 15 14/15=93.3% 80.7%*93.3%=75.3% 
13 12 11/12=91.7% 75.3%*91.7%=69% 
16 11 10/11=-90.9% 69%*90.9%=62.7% 
22 7 6/7=85.7% 62.7%*85.7%=53.8% 
23 6 5/6=83.3% 53.8%*83.3%—44.8% 


Nous retrouvons donc les mêmes valeurs que celles données par exemple par le logiciel de statistiques 
Minitab 15.1.1. 


2.7. MÉTHODE ABC 
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Dans une entreprise, les tâches sont nombreuses et les équipes d'entretien et de maintenance sont 
systématiquement réduites à leur minimum par les temps qui courent. De plus, les technologies les plus 
évoluées en matière de maintenance coûtent cher ou peuvent coûter très cher, et ne doivent pas être 
appliquées sans discernement. 


Il convient par conséquent de s'organiser de façon efficace et rationnelle. L'analyse ABC (on devrait dire 
en toute rigueur "objectif ABC"), utilisant implicitement la loi de probabilité cumulée de Pareto (cf. 
chapitre de Statistiques), permet d'y remédier relativement bien. Ainsi, un classement des coûts par rapport 
aux types de panne donne des priorités sur les interventions à mener (cette méthode empirique est aussi 
utilisée dans de nombreux autres domaines dont un qui est très connu: la gestion de stocks). 


L'idée consiste dans un premier temps comme pour l'analyse de Pareto (cf. chapitre de Techniques de 
Gestion) de classer les pannes par ordre croissant de coût de maintenance (ou de coût d'impact en cas de 
panne) chaque panne se rapportant un système simple ou complexe et à établir un graphique faisant 
correspondre les pourcentages de coûts cumulées aux pourcentages de type de panne cumulés. 


Ensuite, nous distinguons par tradition dans l'industrie trois zones: 


- Zone A: Dans la majorité des cas, environ 20% des pannes représentent 80% des coûts et il s'agit donc de 
la zone prioritaire. 


- Zone B: Dans cette tranche, les 30% de pannes suivantes coûtent 15% supplémentaires. 
- Zone C: 50% des pannes restantes ne revient qu'à 5% des coûts. 


Le domaine du web participatif considère lui des zones (objectifs) de respectivement 90-9-1 pourcents 
donc on trouve vraiemnt de tout et n'importe quoi... 


Voyons un exemple en considérant que les données suivantes ont été recueillies et que nous aimerions faire 
une analyse du % de machines sur lesquelles il faudrait que nous nous concentrions pour diminuer le coût 
d'heures de pannes d'environ 80% (dans la réalité on s'intéressera plus au % du coût financier!). 


MIO Aa Narbins 
IN” de Machine 


Machine n°1 


Machine n°2 

Machine n°3 50 4 
Machine n°4 19 14 
Machine n°5 4 3 
Machine n°6 30 8 
Machine n°7 40 12 


Machine n°8 80 
Machine n°9 55 
Machine n°10 150 
Machine n°11 160 
Machine n°12 5 
Machine n°13 10 
Machine n°14 20 8 


Tableau: 74.11 - Analyse ABC sur pannes machines 


CHR E NS RIRE NS 
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Ensuite, dans un tableur comme Microsoft Excel ou autre. nous pouvons aisément établir le tableau 


suivant: 


21.19% 4 4.30% 
10 150 310 41.06%  b 9 9.68% 
il 100 410 04.30% 4 13 13.98% 
8 80 490 64.90% 2 15 16.13% 
9 55 045 72.19% BB 18 19.35% 
5 si) 695 78.81% 4 22 23.66% 
fi 40 635 84.11%  |12 34 36.56% 
2 32 667 88.34% 115 49 52.69% 
6 30 697 92.32%  B 07 61.29% 
14 20 717 94.97% 8 65 69.89% 
4 19 736 97.48%  |14 74 84.95% 
13 10 746 98.81% 8 87 93.55% 
12 5) 751 99.47% 1 90 96.77% 
D 755 100.00% 5 93 100.00% 


Tableau: 74.12 - Normalisation des données pour analyse ABC 


Nous avons alors graphiquement: 


100% 


90% 


80% 


70% 


60% 


50% 


40% 


%Cumulé coûts [h] 


30% 


20% 


10% 


0% 


0% 


10% 20% 


Figure: 74.29 - Graphique de la méthode ABC 


40% 


%Cumulé pannes 


50% 


70% 


90% 100% 


où les zones À, B et C sont arrondies à des points existants. Ainsi, la zone critique À compte les machines 
11, 10, 1, 8, 9 et 3. Une amélioration de la fiabilité de ces machines peut donc procurer jusqu'à 78.8% de 
gain de temps sur les pannes. 
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Maïntenant déterminons les paramètres de la loi de répartition de Pareto: 


k 
P(X£x)=B=1- (=) (74.277) 
4 


Nous devons déterminer x,, et k les autres paramètres nous sont donnés par nos mesures (le tableau). 


Nous pouvons jouer de la manière suivante: 


& 
= x 2) (74.278) 
x; ZX; 


d'où: 
mn li 1 
eatg-8a) el ( 2) ]rate(sotte( -2) (74.279) 


Donc à l'aide de: 


Xj-] î 


log (AP) = klog ee - 1) +klog(x,) (74280) 
Z. 


on doit pouvoir déterminer les deux paramètres recherchés en considérant l'expression comme l'équation 
d'une droite dont k est la pente et klog(x,) l'ordonnée à l'origine: 


log (AP) =ax+b (74281) 
Une régression linéaire simple (cf. chapitre de Méthodes Numériques) nous donne: 
t=06129 et klog(x,) =—1.2234 (74.282) 


donc: 


12254 
x,=10 # =00105 (7%? 


Nous avons donc au final: 


x; 


k 06189 
P(X< p=P.e1-[e) (2) (74.284) 


Ce qui donne alors le tableau suivant (les x; de la loi de Pareto sont les %Cumulé de panne): 
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21.19% 4.30% 61.76% 
10 41.06% 9.68% 78.01% 
1 04.30% 13.98% 82.89% 
8 64.90% 16.13% 84.48% 
9 72.19% 19.35% 86.29% 
3 78.81% 23.66% 88.05% 
84.11% 36.56% 91.12% 
2 88.34% 52.69% 93.08% 
6 92.32% 61.29% 93.75% 
14 94.97% 69.89% 94.29% 
4 97.48% 84.95% 9570 
13 98.81% 93.55% 95.32% 
12 99.47% 96.77% 95.43% 
s 100.00% 100.00% 95.53% 


Tableau: 74.13 - Comparaisons données expérimentales/théoriques 


Nous pouvons alors obtenir la vraie courbe de Pareto correspondante facilement dans 
Microsoft Excel 11.8346: 


100% 
90% 
680% 
70% 
60% 
50% 


40% 


%Cumulé coûts [h.] 


30% 


20% 


10% 


0% 
0% 10% 20% 30% 40% 50% 60% 70% 60% 90% 100% 


%Cumulé pannes 
Figure: 74.30 - Graphique de la méthode ABC associé à une courbe de Pareto 


La différence entre la courbe expérimentale est la théorique est non négligeable. Comme k est inférieur à 
1, alors comme nous l'avons vu démontré dans le chapitre de Statistiques, la loi de Pareto n'a ni espérance, 
ni variance. 


Il faut faire attention au fait que dans le domaine de la gestion, la loi de Pareto est utilisée un peu tort et à 
travers alors qu'une autre loi de probabilité pourrait être beaucoup plus adaptée. 
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Par ailleurs, un simple test d'ajustement du Khi-deux ( ) nous montre qu'il faut 
rejeter l'approximation par une loi de Pareto. Par ailleurs, des logiciels spécialisés comme @Risk rejettent 
l'approximation par Pareto au-delà des 20 meilleurs ajustements, le meilleur ajustement étant selon ce 
même logiciel une loi log-normale. 


3. PLANS D'EXPÉRIENCE 


Le comportement des produits industriels est généralement fonction de nombreux phénomènes, souvent 
dépendants les uns des autres. Pour prévoir ce comportement, le produit et les phénomènes sont modélisés, 
et des simulations sont effectuées. La pertinence des résultats des simulations dépend évidemment de la 
qualité des modèles. 


En particulier, dans le cadre de la conception ou reconception d'un produit, les modèles font généralement 
intervenir un certain nombre de grandeurs physiques (paramètres) que l'on s'autorise à modifier. Le 
comportement des produits industriels est généralement fonction de nombreux phénomènes, souvent 
dépendants les uns des autres. Pour prévoir ce comportement, le produit et les phénomènes sont modélisés, 
et des simulations sont effectuées. 


Or, ces essais sont coûteux, et ce d'autant plus que le nombre de paramètres à faire varier est important. En 
effet, la modification d'un paramètre peut par exemple exiger un démontage et un remontage du produit, 
ou bien la fabrication de plusieurs prototypes différents (cas d'une pièce produite en série), ou encore 
l'interruption de la production pour changer d'outil (cas d'un processus de fabrication)... Le coût d'une 
étude expérimentale dépend donc du nombre et de l'ordre des essais effectués. 


L'idée consiste alors à sélectionner et ordonner les essais afin d'identifier, à moindres coûts, les effets des 
paramètres sur la réponse du produit. Il s'agit de méthodes statistiques faisant appel à des notions 
mathématiques simples le plus souvent. La mise en oeuvre de ces méthodes comporte trois étapes (mais 
mieux vaut se référer à la norme ISO 3534-3:1999 sur le sujet pour être plus rigoureux!): 


1. Postuler un modèle de comportement du système (avec des coefficients pouvant être inconnus) 


2. Définir un protocole d'expérience, c'est-à-dire une série d'essais ("runs" en anglais) permettant 
d'identifier les coefficients du modèle 


3. Faire les essais, identifier les coefficients ("constrasts" en anglais) et conclure. 


Les plans d'expériences ("Design of Experiment" (D.O.E.) en anglais abrégés PEX en français) permettent 
d'organiser au mieux les essais qui accompagnent une recherche scientifique ou des études industrielles. Ils 
sont applicables à de nombreuses disciplines et à toutes les industries à partir du moment où l'on recherche 
le lien qui existe entre une grandeur d'intérêt, y (quantité de rebus, défauts, détections, amplitude, etc.), et 
des variables x, dans un but d'optimisation. Raison pour laquelle il existe des logiciels pour les traiter 


comme Minitab ou principalement JMP pour ne citer que les plus connus. 


Indiquons également que les plans d'expérience sont un des piliers de la chimiométrie (outils 
mathématiques, en particulier statistiques, pour obtenir le maximum d'informations à partir des données 
chimiques). 
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Au cours des dernières années du 20ème siècle, l'application des plans d'expérience s'est développée, 
particulièrement en raison du fait reconnu que ceux-ci sont essentiels pour l'amélioration de la qualité des 
biens et des services. Bien que la maîtrise statistique de la qualité, les solutions managériales, les 
inspections, et autres outils de qualité remplissent également cette fonction, le plan d'expérience représente 
la méthodologie par excellence dans le cas d'un environnement de paramètres complexes, variables et 
interactifs. D'un point de vue historique, les plans d'expérience ont évolué et se sont développés dans le 
secteur de l'agriculture. La médecine a également bénéficié d'une longue histoire de plans d'expérience 
élaborés avec soin. Actuellement, les environnements industriels témoignent de bénéfices considérables de 
la méthodologie, en raison de la facilité d'initiation des efforts (logiciels d'application conviviaux), d'une 
meilleure formation, de défenseurs influents, et des nombreux succès obtenus grâce aux plans 
d'expérience. 


Il existe trois grandes familles de plans d'expériences: 


1. Les "plans de criblages": dont l'objectif est de découvrir les facteurs les plus influents sur une réponse 
donnée en un minimum d'expériences. C'est la plus simple des familles car proche de l'intuition 
expérimentale (elle est parfois considérée comme une sous-famille de la deuxième famille car elle fait 
abstraction des interactions des facteurs et se réduit donc à un modèle purement additif). 


2. Les "plans de modélisation": dont l'objectif est de trouver la relation mathématique qui lie les réponses 
mesurées aux variables associées aux facteurs soit via une démarche mathématique analytique ou 
purement matricielle. Les plans factoriels complets et fractionnaires (2 niveaux par facteurs avec modèles 
linéaires) ainsi que les plans pour surfaces de réponse (au moins 3 niveaux par facteurs avec modèles du 
second degré) font partie de cette famille. 


3. Les "plans de mélange": dont l'objectif est le même que la deuxième famille, mais où les facteurs ne sont 
pas indépendants et sont contraints (par exemple leur somme ou leur rapport doit être égale à une certaine 
constante). 


La technique des plans d'expérience à pour objectif d'être scientifiquement plus avantageux que les 
techniques consistantes à changer seulement un facteur à la fois (en laissant donc fixes les autres facteurs) 
car cete dernière ne permet pas de faire faire une étude statistiques approfondie des erreurs et (surtout!) 
masque complément les interactions. 


Le principe général de la stratégie des plans d'expérience se base sur le fait que l'étude d'un phénomène 

peut, le plus souvent, être schématisé de la manière suivante: nous nous intéressons à une grandeur, y qui 

dépend d'un grand nombre de variables, x, ,x: et leur ordre n'a pas d'influence... ce qui est par 
12222. An 


contre problématique en chimie..). 
La modélisation mathématique consiste à trouver une fonction f telle que: 
ÿ — fa , À2 eo) 


qui prenne en compte l'influence de chaque facteur seul ou des facteurs combinés (interactions). Cette 
fonction est donc déterministe (la réponse dépend uniquement des facteurs sans aucune incertitude 
possible, ce qui revient à ignorer les bruits tels que les erreurs de mesure) et invariant (le comportement 
n'évolue pas au cours du temps). 
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Une méthode classique d'étude consiste en la mesure de la réponse y pour plusieurs valeurs de la variable 
x, tout en laissant fixe la valeur des (n-1) autres variables. Nous itérons alors cette méthode pour chacune 


des variables. 


Ainsi, par exemple, si nous avons 8 variables et si l'on décide de donner 2 valeurs expérimentales à 
chacune d'elles, nous sommes conduits à effectuer 25 - 56 expériences. 


Ce nombre élevé dépasse les limites de faisabilité tant en temps qu'en coût. Il faut donc réduire le nombre 
d'expériences à effectuer sans pour autant perdre sur la qualité des résultats recherchés. 


L'utilisation d'un plan d'expérience donne alors une stratégie dans le choix des méthodes 
d'expérimentation. Le succès des plans d'expériences dans la recherche et l'industrie est lié au besoin de 
compétitivité des entreprises: ils permettent une amélioration de la qualité et une réduction des coûts. 


Remarque: La méthode des plans d'expériences a été mise au point au début du siècle, dans les années 
1920, par Ronald A. Fisher (celui du Test de Fisher). Elle a pris un essor considérable avec le 
développement de l'informatique et la puissance de calcul qui l'accompagne. 


Le traitement des résultats se fait enfin à l'aide de la régression linéaire simple ou multiple et l'analyse de 
variance. 


Avec les plans d'expériences, le but est donc d'obtenir le maximum de renseignements (mais pas tous!) 
avec le minimum d'expériences (et donc le minimum de coût) dans le but de modéliser ou d'optimiser des 
phénomènes étudiés. 


Un expérimentateur qui lance une étude s'intéresse à une grandeur qu'il mesure à chaque essai. Cette 
grandeur s'appelle la "réponse", c'est la grandeur d'intérêt. La valeur de cette grandeur dépend de plusieurs 
variables. Au lieu du terme "variable" on utilisera le mot "facteur". La valeur donnée à un facteur pour 
réaliser un essai est appelée "niveau". Lorsque l'on étudie l'influence d'un facteur, en général, on limite ses 
variations entre deux bornes (oui faut bien s'avoir s'arrêter un jour et être raisonnable...) appelées 
respectivement: "niveau bas" et "niveau haut". 


Bien évidemment, lorsque nous avons plusieurs facteurs x,x3,...,x, Ceux-ci représentent un point dans 


p* appelé alors "espace expérimental". 


L'ensemble de toutes les valeurs que peut prendre le facteur entre le niveau bas et le niveau haut, s'appelle 
le "domaine de variation du facteur" ou plus simplement le "domaine du facteur". Nous avons l'habitude de 
noter le niveau bas par -1 et le niveau haut par +1 quand tous les facteurs n'ont que deux niveaux, sinon 
est d'usage de noter les niveaux de 1 à n (nombre de niveaux). Bien évidemment, en fonction de la 
notation choisie, il faut adapter les expressions du modèle mathématique en conséquence. 


Donc par exemple pour un facteur ayant un domaine de variation compris entre un niveau haut de 20 [°C] 
correspond à +1 et un niveau bas de 5 [°C] correspondant à -1 nous devrons à la fin de notre étude 
transformer toutes les valeurs expérimentales en "unités centrées réduites" dans lesquelles doivent être 
utilisées les x,. 


Ainsi, nous avons deux points d'entrée (20,5) et deux de sorties (+1,-1). Toute valeur intermédiaire est 
donnée simplement par l'équation de la droite: 
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Figure: 74.31 - Principe de construction des unités centrées réduites 


La pente est donc triviale à obtenir..., pour déterminer b, nous avons simplement une équation à une 
inconnue: 


+1= 2% +b = b=+1- 250 =-1.6 (74286) 
(20-15) 5 
ou (ce qui revient au même): 
—1= |; => b = er =-1.6 (74287) 
(20-15) 5 


Donc le passage de variables non normalisées, notées x, aux normalisées, notées X, s'écrit alors: 


=——x+b| (74.288) 


soit dans un cas de sorties (+1,-1): 
2 
A =—x+|1l-— 1x, (74289) 


et inversement….: 


(74.290) 


soit dans un cas de sorties (+1,-1): 


x = £-(1-2) ru _ (74.291) 
Âx 2 


Le regroupement des domaines de tous les facteurs définit le "domaine d'étude". Ce domaine d'étude est la 
zone de l'espace expérimental choisie par l'expérimentateur pour faire ses essais. Une étude, c'est-à-dire 
plusieurs expériences bien définies, est représentée par des points répartis dans le domaine d'étude. 


Par exemple, pour deux facteurs, le domaine d'étude est une surface et l'espace expérimental est m2: 
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Facteur 2 x 


Facteur 1 x 


G | -] 


Figure: 74.32 - Exemple à deux facteurs 


Les niveaux x, centrés réduits représentent les coordonnées d'un point expérimental et y est la valeur de la 


réponse en ce point. On définit un axe orthogonal à l'espace expérimental et on l'attribue à la réponse. La 
représentation géométrique du plan d'expériences et de la réponse nécessite un espace ayant une 
dimension de plus que l'espace expérimental. Un plan à deux facteurs utilise un espace à trois dimensions 
pour être représenté: une dimension pour la réponse, deux dimensions pour les facteurs. 


Lorsque nous avons déterminé le modèle mathématique, à chaque point du domaine d'étude correspond un 
ensemble de réponses qui se localisent sur une surface appelée la "surface de réponse" (raison pour 
laquelle ce domaine d'étude est parfois appelé: "plans d'expérience pour l'estimation de surfaces de 
réponse") par exemple avec deux facteurs: 


Réponse 
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' 
t 
L 
: 
=. À 
l 
l 
' 
' 
' 
' 
' 
t 


-] #1 


Figure: 74.33 - Deux facteurs avec la surface de réponse 


Le nombre et l'emplacement des points d'expériences est le problème fondamental des plans d'expériences. 
Nous cherchons à obtenir la meilleure précision possible sur la surface de réponse tout en limitant le 
nombre d'expériences! L'ingénieur va donc rechercher une fonction mathématique continue qui relie la 
réponse aux facteurs. 
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Pour cela, nous simplifions le problème en se rappelant (cf. chapitre de Suites et Séries) que toute fonction 
quelle que soit sont nombre de variables, peut être approchée en une somme de série de puissance en un 
point donné 


Nous prenons alors un développement limité de la série de Taylor: 


18 18 
19) 2 Go) + RE (x 59) + IEC 7) L 
ê æ | (74.292) 
a 26) D (=) 20) 10 6 vo |. 


Soit autour de xj = 0, y, = 0 (ce que nous pouvons nous permettre car nous prenons toujours des unités 


centrées réduites comme vues plus haut!), nous avons la série de Maclaurin au deuxième ordre et en 
changeant de notation pour ; =1.2: 


y= f(x,x) 
lès 


2 2 2 
= (0 02e On + + a (D +2 + On + an + an +22 0 


=ap+) ax + axx; = ap +) ax +) ax, +Daxx 


EX] 
(74.293) 
où y est donc la réponse et les x; les facteurs et les 45,4 ,4,,,4;; sont les coefficients du modèle 
mathématique adopté a priori. Ils ne sont pas connus et doivent être calculés à partir des résultats des 
expériences. 


L'intérêt de modéliser la réponse par un polynôme est de pouvoir calculer ensuite toutes les réponses du 
domaine d'étude sans être obligé de faire les expériences en passant par un modèle appelé "modèle 
postulé" ou "modèle a priori". 


Deux compléments doivent être apportés au modèle précédemment décrit: 


1. Le premier complément est le "manque d'ajustement". Cette expression traduit le fait que le modèle a 
priori est fort probablement différent (ne serait-ce que par l'approximation de l'approche) du modèle réel 
qui régit le phénomène étudié. Il y a un écart entre ces deux modèles. Cet écart est le manque d'ajustement 
("lack of fit" en anglais). 


2. Le second complément est la prise en compte de la nature aléatoire de la réponse (sans que cette 
dernière soit toutefois stochastique sinon il faut utiliser d'autres outils!). En effet, si l'on mesure plusieurs 
fois une réponse en un même point expérimental, on n'obtient pas exactement le même résultat. Les 
résultats sont dispersés. Les dispersions ainsi constatées sont appelées "erreurs expérimentales". 


Ces deux écarts, manque d'ajustement et erreur expérimentale, sont souvent réunis dans un seul écart, 
notée e. 


Le modèle utilisé par l'expérimentateur s'écrit alors au deuxième ordre et au premier degré: 
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Ye+)ax+) dy XX; +€ (74.294) 
1#ÿ 


et est appelée parfois "modèle synergique”. 


Remarques: 


R1. Si nous prenons en compte les termes du deuxième degré, nous parlons alors de "modèle 
quadratique complet". 


R2. Si nous arrêtons le développement au premier ordre et au premier degré (sans interactions), nous 
parlons alors de "modèle affine". 


Dans la pratique nous notons cette dernière relation (nous enlevons le terme d'erreur): 
Y Æ do + A + MX + M2 M X2 (74.295) 
où nous avons la notation abusive pour ce qui est d'suage d'appeler dans le domaine le "terme rectangle": 
2 := dy +2 (74.296) 


Dès lors, il vient que pour 2 facteurs, l'expression contient 4 termes, pour 3 facteurs elle contient 8 termes, 
pour 4 facteurs, 16 termes, etc. Il s'agit donc toujours de puissances de 2. 


Ce modèle sans erreur est souvent appelé "modèle contrôlé avec interactions" (linéaire d'ordre 2). Par 
exemple, une surface de réponse associée à une relation du type précédente est avec Maple 4.00b: 


>plot3d(5+3*x1+2*x2+4*x1*x2,x1=-10..10,x2=-10..10,view= 
[-10..10,-10..10,-10..10],contours=10,style-PATCHCONTOUR.,axes=-frame,numpoints=10000); 
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10 -10 
Figure: 74.34 - Exemple générique d'interaction pour deux facteurs (paraboloïde hyperbolique) 


où nous avons représenté les isoclines (lignes dont les réponses de la fonction sont égales quelle que soient 
les valeurs des variables d'entrée). Ce qui permet de recherche les combinaisons les moins coûteuses pour 
un résultat égal! 


Évidemment, si nous supprimons les termes d'interactions, nous avons simplement un plan: 


>plot3d(5+3*x1+2*x2,x1=-10..10,x2=-10..10,view= 
[-10..10,-10..10,-10..10],contours-10,style-PATCHCONTOUR,axes=frame,numpoints=10000); 
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-10 10 


Figure: 74.35 - Exemple générique de modèle additif pour deux facteurs (plan) 


Évidemment, plus le degré du polynôme utilisé est élevé plus nous avons, théoriquement, de chances 
d'avoir un modèle proche de la réalité. Mais les polynômes de degré élevé réclament beaucoup de points 
expérimentaux et leur validité peut vite diverger en dehors du domaine expérimental. Si l'étude l'exige, 
nous préférons utiliser des fonctions mathématiques particulières pour mieux ajuster le modèle aux 
résultats expérimentaux. 


Cependant, en pratique, les interactions d'ordre élevé ont souvent une influence très faible sur la réponse 
(bon cette affirmation dépend fortement du domaine d'activité...!). Il est donc possible de ne pas les inclure 
dans le modèle, ce qui conduit à faire moins d'essais. Ce principe est utilisé dans la construction de 
nombreux plans d'expériences, comme nous le verrons dans la partie suivante. Dans de nombreuses 
applications, on obtient des résultats tout à fait satisfaisants en se limitant aux interactions doubles. 


Pourquoi nous satisfaisons-nous de cette relation approchée de quatre termes? Pour la simple raison que: 


1. La réponse peut être non nulle lorsque tous les facteurs sont nuls (c'est le premier coefficient 4) 


2. La réponse dépend trivialement (intuitivement) de la somme des effets du premier et deuxième facteurs 
x, de manière indépendante (coefficients & ,4& ). 


3. La réponse dépend aussi des interactions entre les deux facteurs x,,x, (coefficients 42). 


Chaque point expérimental dont les x, sont données permet alors d'obtenir une valeur de la réponse y. 
Cette réponse est modélisée par un polynôme dont les coefficients sont les inconnues qu'il faut déterminer. 
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3.1. PLANS FACTORIELS COMPLETS 


Donc dans un plan d'expérience de 2 facteurs à 2 niveaux, nous avons besoin d'au moins (et au plus pour 
des raisons de coûts!) de 4 mesures pour avoir un système de quatre équations à quatre inconnues qui sont 
les coefficients 4,4 ,42,412. 


Remarque: Pour une étude de 2 facteurs à 3 niveaux, nous ne pouvons plus prendre le modèle linéaire. 
Il nous faut alors prendre les termes quadratiques du développement de Taylor. 


Puisque pour chacun des facteurs nous devons nous fixer un niveau bas et un niveau haut pour pouvoir 
travailler raisonnablement... alors si nous avons deux facteurs, nous avons un espace expérimental défini 
par 4 points { (haut, haut), (bas, bas), (haut, bas), (bas,haut)}, correspondant aux 2 fois 2 niveaux (22), qui 
nous suffit pour obtenir alors nos 4 équations à 4 inconnues et alors de déterminer les 4 coefficients. 


Ainsi, les points à prendre pour notre expérience correspondent naturellement aux sommets 
(géométriquement parlant) de l'espace expérimental. 


Nous avons alors le système d'équations (rappelons que cette approche ne fonctionne que pour des 
facteurs ayant 2 niveaux, le cas à trois niveaux étant traité bien plus loin avec un exemple): 


# = Le + & AL] + ds À3 -1 + 241 -] A2] 
Ji = F4 + 422% +212 
M3 = 9 +4 +24 + 2% -1%2 4 


Va = do FA +d2% 4 +24 224 


(74.297) 


ou explicitement écrit: 


N € +at-D+a (D + DD = 40 - à — 43 +ap 
V2 € 9 +4 (H) +4, CT + DC = 20 +4 —- 2 —- an 
3 = 49 +46 D+a(H)+a CDD = a - à +4, -a 
Va € do +4 (1) + a D +2 DH = a0 + à +4 + a 


(74.298) 


Comme, nous nous intéressons aux coefficients (et que les variables sont connues!), il s'agit en fait 
simplement de résoudre un système linéaire (cf. chapitre d'Algebre Linéaire). 


Si les variables n'étaient pas codées, nous aurions par exemple pour un plan factoriel complet à deux 
niveaux avec une variable (vitesse du véhicule) ayant pour valeur basse 40 [km/h] et pour valeur haute 50 
[km/h], ainsi qu'une deuxième variable (pression de pneus) ayant pour valeur basse 1.5 [Pa] et pour valeur 
haute 3 [Pa] le système suivant à résoudre sachant que nous avons obtenu respectivement pour chaque 
combinaison les distances parcourues suivantes 32'700, 32'680, 31'710 

33'220 [km]: 
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an -1+@ (40) + a (1.5) +a2 (60) (1.5) = 32'700 
ag -1+a (50) +& (1.5) +a42(50)(1.5) & 32680 


(74.299) 
an -1+&4 (401 +43 (3) +a3 (40)(3ÿ = 31'710 
äÿ : 1+4 (50) +4 (3) + &,2(50)(3) z 33'220 
Soit sous forme matricielle: 
40 15 60 & 32700 
50 15 75||[« : 32'680 (74.300) 


40 3 120|[a: | |31'710 
50 3 150||æ2| |33'220 


ui it mt ui 


En résolvant ce système à la main (cf. chapitre d'Algébre Linéaire), ou avec un logiciel de calcul (tableur 
ou logiciel de statistiques), nous obtenons: 


Constante Vitesse Pression 
32700 
32680 
31710 


33220 


Coefficient 
10 39890 

-0.2 0.2 0.1 -155 
-3.33333 2666667 3333333333  -2.666666667 -4740 
0.066667 -006667 -0066666667 0066666667 102 


Figure: 74.36 - Mise en équation et résolution implicite sous la version anglaise de Microsoft Excel 14.0.6123 


soit explicitement: 


Vitesse#Pression 


Vitesse 


Coefficient 
=MMULT(48:D11:E2:ES 
=MMULT(48:D11:E2:ES 


=MINVERSE(42:D5) =MINVERSE(42:D5) =MINVERSE(42:D5) =MINVERSE(42:D5) 
EMI =MINVERSE(42:D5) =MINVERSE(42:D5) =MINVERSE(42:D5) =MINVERSE(42:D5) 
=MINVERSE(A2:D5) =MINVERSE(A2:D5) =MINVERSE(42:D5) =MINVERSE(42:D5)|=MMULT(48:D11:E2:ES 
=MINVERSE(42:D5 =MMULT(AS:D11:E2:ES 
Figure: 74.37 - Mise en équation et résolution explicite sous la version anglaise de Microsoft Excel 14.0.6123 


Donc la fonction est finalement: 


»  39'890-155x —4740x +102x%2 (74.301) 
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soit exactement les mêmes coefficients que ce que nous donne un logiciel spécalisé comme Minitab 15.1.1. 


Pour en revenir à notre système avec les variable codées, il vient alors en résolvant le système 
algébriquement (relations valables que si et seulement si les variables sont codées!): 


1 
= 30 + Ya +3 +) 
1 
a= tnt» +) 
: (74.302) 
42 = on V2 +33 +34) 
1 
&2= 301-223 +94) 
qui peut s'écrire sous la forme matricielle suivante: 
dp +1 +1 +1 +illn 


111 +1 1 HN» 
d 4-1 -1 +1 +1|| y: 
&) lol À ÆLl)l 


(74.303) 


Ce qui s'écrit de manière générale pour des modèles linéaires du deuxième ordre sous la forme générale 
(cf. chapitre d'Algèbre Linéaire): 


La matrice X contenant 2* lignes est appelée "plan factoriel complet (PFC) 2" avec interactions" (le terme 
"factoriel" venant du fait que tous les facteurs varient simultanément). 


La matrice X dans la pratique est appelée "matrice d'expérimentation" ou encore "matrice des effets" et est 
souvent représentée de la manière suivante dans le cas particulier précédent: 


| Essain° | Repos | Facteur Facteur? | Facteur 12 | Réponse 
+1 1 1 +1 ñ 


1 

2 +1 +1 1 1 M 
3 +1 1 +1 1 3 
4 +1 +1 +1 +1 Ya 


Tableau: 74.14 - Matrice d'expérimentation 


Mais l'on voit tout de suite que dans la pratique, la deuxième colonne (Repos) est inutile, car elle vaut 
toujours +1 et elle est implicitement implémentée dans les logiciels. 


Il en est de même pour la cinquième colonne (Facteur 12), car elle se déduit automatiquement de la 
troisième et quatrième colonnes (c'est la multiplication des termes ligne par ligne. ce que certains 
appellent la "multiplication de Box"). 
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Le lecteur remarquera aussi qu'en passant d'une colonne à l'autre ou d'une ligne à l'autre, il y a toujours 
deux facteurs qui changent de niveau! Par contre, si nous nous concentrons uniquement sur les colonnes 
Facteur 1 et Facteur 2, nous voyons qu'en passant d'une ligne à l'autre, il n'y a qu'un facteur qui change à 
la fois. 


Remarque: Observez donc que la première colonne vaut toujours +1 et il y a toujours aussi une ligne 
avec uniquement des +1! 


Ainsi, dans la pratique (logiciels) et dans de nombreux ouvrages, on représente à juste titre uniquement le 
tableau suivant (ce qui masque le fait que nous avons affaire à une matrice carrée): 


| Essain® | Facteur 1 | Facteur2 | Réponse 
1 | s ñ 
2 #1 7 » 
3 -1 +1 Y3 
4 +1 +1 Ya 


Tableau: 74.15 - Matrice d'expérimentation simplifiée 


pour un plan d'expérience de 2 facteurs à 2 niveaux avec interactions en modèle linéaire (sans erreur) nous 
avons encore plus extrême ("notation de Yates"). en termes d'écriture: 


| Essain° | Facteur | Facteur2 | Réponse 
1 - - ñ 
2 LA : Y2 
3 - Æ Ya 
4 + + Ya 


Tableau: 74.16 - Matrice d'expérimentation avec notation de Yates 


Nous voyons que dans cette forme d'écriture qu'outre le fait que les deux colonnes Facteur 1 et Facteur 2 
sont orthogonales (la norme ISO 3534-3:1999 parle de "contraste orthogonal"), elles sont aussi 
"balancées", dans le sens qu'il y a autant de + et de - dans chacune des colonnes. 


Remarque: Par défaut, la majorité des logiciels randomise l'ordre des essais du plan (qu'il soit complet, 
fractionnaire, factoriel ou non). En règle générale, il est recommandé de randomiser l'ordre des essais 
pour atténuer les effets des facteurs qui ne sont pas inclus dans l'étude, notamment les effets liés au 
temps. Cependant, dans certains cas, la randomisation ne produit pas un ordre des essais intéressant et 
peut être même dangereux car elle peut masquer certaines sources d'erreurs systématiques qui 
n'avaient pas été identifiées avant l'expérience. Par exemple, dans les applications industrielles, la 
modification des niveaux de facteurs peut s'avérer difficile ou coûteuse. Il est également possible 
qu'une fois la modification effectuée, le retour du système à un état constant prenne beaucoup de 
temps. En pareil cas, il peut être souhaitable de ne pas randomiser le plan afin de limiter au maximum 
les modifications de niveau. 


Page: 4482/4839 


[v3.0 - 2013] 


Les praticiens apprécient de calculer la moyenne des réponses et l'effet moyen d'un facteur donné puisque 
le système est linéaire. Ainsi, au niveau +1 pour le facteur x, , en nous basant toujours sur le système 


linéaire: 


M = do FAX +A52%5 1 + 3M 1 X2 
J2 = do +44 +422%5 1 +242 
3 = 9 + F2, + 2% 1224 


Va = do Fay +24 +224 


nous pouvons alors construire et définir la "moyenne des réponses" donnée par: 


1 
Vrt — 2 72 + ÿa4 | (74.306) 


et il vient de même au niveau -1 toujours pour le même facteur: 


(M + y [ (74.307) 


1 
Pr 2 


Nous avons alors "l'effet global" du facteur x, qui sera donné par : 


= _ 74.308 
EGr+ — Prt+ dx. LP200) 


et "effet moyen" du facteur x qui est alors défini par la demi-différence entre la moyenne des réponses 
au niveau haut du facteur x, et la moyenne des réponses au niveau bas du même facteur: 


+ + 
Ent x+ LA DL ds (74.309) 


| 
= nés Ya = es e 


or après quelques simplification d'algèbre élémentaire, il vient très rapidement que: 
En xy+ = 4 (74.310) 


Il est évident que si l'effet global (et in extenso l'effet moyen) est non nul, nous pouvons nous douter qu'il y 
a une interaction entre les facteurs puisque la variation d'amplitude de la réponse n'est pas identique en 
fonction de la valeur du niveau de l'autre facteur (voir l'étude de l'analyse de la variance à deux facteurs 
dans le chapitre de Statistiques pour plus de détails). Évidemment, dans la pratique, l'étude des interactions 
se fera en tout rigueur comme souvent pour l'ANOVA: avec des graphiques. 


La moyenne de toutes les réponses donne donc la valeur de la réponse au centre du domaine expérimental: 


y= (A +»2 +73 +y4i (74.311) 
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En faisant un peu d'alèbre élémentaire, que le plan soit écrit sous forme normalisée et centrée ou non, cette 
dernière expression se réduit à: 


ÿ =äp (74312) 


Évidemment, nous pouvons résumer ce cas simple sous forme graphiqu si cela peut aider le lecteur: 


Réponse 


Figure: 74.38 - Deux facteurs avec la surface de réponse 


et avec la figure ci-dessus, la variations n'étant pas très parallèles lorsqu'un facteur est fixé, nous pouvons 
supposer qu'il y a interaction entre les facteurs qui nécessiteront l'utilisation d'une ANOVA. 


Lorsque le nombre de facteurs est grand, il n'est pas toujours facile pour tout le monde de poser 
rapidement les facteurs +, - sans l'aide d'un logiciel. Alors, il existe une petite marche à suivre appelée 
"algorithme de Yates" ou "algorithme de Yates et Hunter" qui permet vite d'arriver au résultat voulu pour 
les plans factoriels (dont les facteurs ont deux niveaux) dont le nombre de facteurs est une puissance de 2: 


D'abord, nous commençons toutes les colonnes par -1 et nous alternons les -1 et les +1 toutes les »3-1 


lignes pour la j-ème colonne. 


Remarques: 


R1. Si le type de tableau précédent contient des valeurs codées, nous parlons de "plan d'expérience" 
sinon avec les unités physiques habituelles nous parlons de "tableau d'expérimentation". 


R2. Dans le cas des tableaux codés, il est d'usage d'indiquer sous le tableau un deuxième tableau avec 
les correspondances entre les unités codées et les unités physiques. 
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Insistons sur une chose importante: C'est que si nous avions 3 facteurs à 2 niveaux, alors nous avons 23 


possibilités d'expériences (soit 8). Or, huit correspond exactement au nombre de coefficients que nous 
avons également dans le modèle linéaire avec interactions d'une réponse à trois variables: 


Y= dy +4 + +433 + &2% 2 +434 % +327 +232 %2 7% 


ce qui correspond aussi aux termes seulement linéaires et sous forme condensée du développement en 
série de Maclaurin d'une fonction f de trois variables. 


Et ainsi de suite. pour n facteurs à deux niveaux. C'est la raison pour laquelle les plans factoriels complets 
linéaires »* sont traditionnellement les plus utilisés car ils sont mathématiquement intuitifs et simples à 
démontrer. 


Par ailleurs, il est important de remarquer que tous ces plans linéaires complets approximés au deuxième 
ordre sont sous forme matricielles des matrices carrées f,,, orthogonales et donc bien évidemment 


inversibles ( hap g aire)! 


Cependant les matrices précédentes ne satisfont pas la relation suivante vue dans le chapitre d'Algèbre 
Linéaire (produit scalaires des colonnes-bases avec elles-mêmes et de vecteurs orthogonaux): 


XTX=1 


mais ont pour particularité pour tout plan d'expérience complet de satisfaire la relation: 
XTX=n1 


Donc contrairement aux matrices orthogonales qui par définition ont toutes les colonnes (ou lignes) qui 
forment une base orthonormée (norme unitaire), les matrices des plans d'expérience ont pour différence de 
ne pas avoir les normes de la base orthogonale à l'unité. 


Ainsi, nous définissons la matriceA dont les coefficients sont tous des +1 ou des -1 ET satisfaisant la 
relation précédente comme étant une "matrice de Hadamard". Cette dernière a par ailleurs pour propriété 
d'exister que pour les ordres 1, 2, 4, 8, 12, 16, 20, 24, … C'est-à-dire uniquement pour les ordres multiple 
de 4 (si nous omettons l'ordre 1 et 2). 


Démonstration: 


Sachant que les cas d'ordre 1 et 2 sont triviaux et que les cas impairs sont à éliminer intuitivement 
immédiatement (essayez et vous verrez très vite.), faisons la démonstration pour # > 4 . 


Puisque toutes les colonnes doivent être obligatoirement orthogonales (pour que la matrice soit inversible 
et donc le système résoluble), nous pouvons toujours écrire le problème sous la forme (forme particulière 
pour n valant 4 mais facilement généralisable): 


+x+yY+Z+W=Xx 
+x+y-z-w=0 
+x-y+z-w=0 
+x-y-2+w=0 
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et si nous notons n comme étant l'ordre de la matrice. Alors nous avons par sommation de toutes les lignes: 


4x=}# 


donc n doit être divisible par 4 pour # > 4 pour que toutes les colonnes soient orthogonales et donc que la 
matrice soit de Hadamard sachant que x, y, z, w ont pour valeur 1. 


Pour les lecteurs qui doutent concernant les valeurs paires: 6, 10, 14, 18, etc. Essayez de trouver une 
matrice de Hadamard à la main dont tous les vecteurs sont orthogonaux deux à deux... vous verrez très 
vite que vous allez coincer. 


[] C.Q.FD. 


Il s'ensuit alors trivialement la relation suivante (avec une notation très abusive car on omet la notation de 
la matrice unité): 


A=2Xr=(XTX)XY 


À 


Cependant, nous verrons un tout petit peu plus loin lors de notre étude des plans factoriels fractionnaires 


que les matrices d'Hadamard d'ordre 1, 4, 8, 16, 32, …, 2" ne sont quasiment jamais utilisées sous 
l'expression de "matrices d'Hadamard" car elles se confondent avec les plans factoriels fractionnaires. 


Par contre, il est intéressant de constater que nous avons des plans d'expérience possibles avec 12, 20, 24, 
28, … essais qui ont un intérêt certain lorsque le nombre de facteurs est supérieur ou égal 4 (certains 
logiciels comme JMP ne les proposent pas cependant si le nombre de facteurs est inférieur à cinq). Ces 
plans sont appelés "plans de Plackett-Burman” et parfois "plans irréguliers de Plackett-Burman" ou encore 
plus rarement "plans non-géométriques de Plackett-Burman" (un logiciel comme Minitab propose 
cependant arbitrairement - et l'indique explicitement ainsi dans l'aide du logiciel - un plan de Plackett- 
Burman d'ordre 32 et des plans de Plackett-Burman même pour 2 ou 3 facteurs). 


Plackett et Burman ont cherché avec des algorithmes et par tatonnement l'expression des matrices 
d'expériences correspondant aux plans qui portent leur nom et qui contiennent donc 12, 20, 24, 28, etc. 
essais. Ils ont proposé une astuce fort utile pour que les praticiens puissent faire usage de ces plans sans 
logiciels. Faisons l'exemple pour commencer avec une matrice de Hadamard d'ordre 12 (sans s'occupper 
pour l'instant du nombre de facteurs que nous allons utiliser). Les tables de Plackett-Burman (ou les 
logiciels) donnent uniquement la première ligne: 


++-+++- + 


Ensuite, nous construisont la table d'expérience suivante en suivant l'algorithme proposé par Plackett et 
Burman (les logiciels utilisent le même): 


- Première étape, nous mettons la première ligne sous forme de colonne dans un tableau de 12 par 12: 
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+|+|+ 


Tableau: 74.17 - Première étape de construction du plan de Plackett- Burman 


- Deuxième étape, nous déduisons la deuxième colonne à partir de cette première colonne en décalant les 
signes d'un cran vers la bas, le dernier signe "-" étant, lui, remonté au sommet de la deuxième colonne (il 
s'agit donc d'une permutation circulaire): 


LT 
+ | 
= | 

+ + 

+ + | 

= + 

tt 

= $ | 


Tableau: 74.18 - Deuxième étape de construction du plan de Plackett-Burman 


et ainsi de suite jusqu'à la 11ème colonne: 
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+ + - + | - = = + + + = 
- = | + : - 5 + + 
+ - | = + 5 - - + : 
+ + - | - : + : - - - 
+ + + = | + + = + = L - 
- + — - | = + - : — = - 

- + + | + = + + = + s 
L + | + + - + + - + 
+ = = = | + + = L 
L + = s | 5 + : < _ 

| 
Tableau: 74.19 - 3ème à 11ème étape de construction du plan de Plackett-Burman 
- Dernière étape, nous ajoutons une rangée et une colonne de signes "-": 
+ + 2 + L = = + + + = = 
- + + : + s - : + + + : 
+ - + - + = - L + + = 
+ + - = + - - - + - 
+ + + - - + - L : L 
: + + + L - + - - - 
- - + + + = + = + - - 
L s - + + + - + + = + 3 
+ = = = + + + = + + = = 
L + = + + + L + + L 
Tableau: 74.20 - Dernière étape de construction du plan de Plackett-Burman 


Le lecteur pourra facilement vérifier que chaque ligne ou chaque colonne prises deux à deux sont bien 
orthogonales. 


Maintenant se pose à la question de savoir si nous choisissons d'associer par exemple ce plan d'expérience 
à un plan à 4 facteurs (sous-entendu centrés réduits bien évidemment!): 


= Ag +4 +323 +2 + 4x4 
+222 + 43% 43 +447 X4 +493%2%3 +34 X2X3 + A34X3%4 (74.319) 
+232 2223 +194 À 29 X4 + 134% X3X4 + A334X2X3X4 


+234 À X2 73 X4 


pour réduire le nombre d'essais de 16 à 12 à quelle colonne devons nous associer à quoi? Ou encore en 
allant plus loin: pour combien de facteurs pouvons nous associer ce type de plan à 12 essais pour des 
facteurs à deux niveaux? 


Eh bien il y a deux grandes religions (maisons) suivant les ingénieurs. 
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- La première consiste à dire que les plans de Plackett-Burman d'ordre n ne doivent être utilisés que pour 
l'étude des effets principaux (donc aucune interaction ne sera prise en compte) de n-1 facteurs. Aïnsi, un 
plan de Plackett & Burmann d'ordre 12, sera réservé pour une étude de 11 facteurs et uniquement de leurs 
effets principaux (modèle linéaire purement additif). 


- La deuxième consiste à dire que les plans de Plackett- Burman contiennent un concept que nous verrons 
plus loin et qui s'apelle les "alias" (les plans de Plackett-Burman sont tous des plans de résolution II au 
deuxième ordre). Par conséquent, il faut utiliser ce type de plan que lorsque nous sommes prêts à 
considérer dans un premier temps que les interactions à deux facteurs sont très négligeables. 


La complexité des alias avec les plans de Plackett- Burmann fait que dans la pratique, ils sont finalement 
plutôt utilisé selon la première religion. par les débutants et selon la seconde par les consultants. 


Remarque: Un logiciel comme Minitab 15.1.1 n'affiche pas du tous les alias utilisés lors de l'application 
de plans de Placket et Burmann. 


Pour clore cette partie, résumons un constat simple: 


| Plan | Facteurs Interactions) Somme 
2 1 3 


2 
53 3 7 
24 4 ii 15 
93 5 26 31 
26 6 57 63 
si 7 120 127 


Tableau: 74.21 - Types de plans avec facteurs & interactions 


Donc en utilisant les plans factoriels complets, l'utilisateur est sûr d'avoir la procédure expérimentale 
optimale puisque ces plans sont basés sur des matrices d'Hadamard et qu'il a été démontré que nous ne 
pouvions pas faire mieux. 


3.2. PLANS FACTORIELS FRACTIONNAIRES 


En pratique, les plans complets ne sont utilisables que sur des systèmes avec très peu de facteurs, ou 
lorsque chaque essai prend très peu de temps. Lorsque n est plus grand ou égal 3 alors les coûts des 
expériences peut très vite devenir onéreux. 


Le plus petit cas où il est intéressant d'optimiser le nombre d'essais et celui consistant en 3 facteurs à 2 
niveaux. Nous avons alors l'équation et le tableau d'expérience suivant: 


= 4 + & À + 5 3 + “32 + 2 À X2 + 434 4 + d3X57% + 474122 4 
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| Essain° | Facteur1 | Facteur2 | Facteur3 | Réponse 
1 2 : : À# 
2 Hi - d Y2 
3 ” + : Y3 
4 + + > Ya 
9 É - + Ys 
6 + _ + VE 
: - + + V3 
8 + + + Ye 


Tableau: 74.22 - Plan d'expérience à 3 facteurs complet sous forme de Yates 


Soit sous forme de tableau d'expérience complet: 


| Essain® | Repos | F1 | F2 | F3 | F12 | F13 | F23 | F123 | Réponse 
1 + L = : + + + e ñ 
2 + + L = L L rm ms M 
3 + - + - - + - + Ya 
4 + + + L + L : L Ya 
5 + = = + + = - + Ys 
É + RS PS PS ES RS 
7 + - + + = : + > Ya 
8 + + + + + + + + Ye 


Tableau: 74.23 - Plan d'expérience à 3 facteurs et interactions complet sous forme de Yates 


ou de matrice d'expérience complète: 


(74.320) 


où à nouveau il est facile de contrôler que toutes les colonnes sont orthogonales et balancées (même 
nombre de + ou de - dans chaque colonne ou autrement dit la somme de leurs colonnes est nulle) et que la 
matrice est bien de type Hadamard. Aïnsi, un plan factoriel complet pour 3 facteurs implique 8 essais. 


Nous pouvons également représenter tout cela sous forme graphique: 
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Facteur 3, x; 


Facteur 1, x 


Figure: 74.39 - Représentation traditionnelle d'un plan factoriel fractionnaire complet à 3 facteurs 


Les plans réduits (plans factoriels fractionnaires) ou "plans de screening" (selon la norme 

ISO 3534-3:1999), consistant à sélectionner certaines combinaisons, ont donc été proposés. Ils permettent 
naturellement de réduire les coûts, mais diminuent également l'information disponible sur le comportement 
du système! Il faut donc s'assurer de la pertinence de la sélection par rapport au modèle à identifier. 


Une première méthode élémentaire est par exemple de faire l'hypothèse qu'il n'y a aucune interaction. Dès 
lors, notre fonction se réduit à un modèle purement additif: 


Y= +4 + d% +a@3x (4321 


et pour résoudre ce système, il nous suffit d'avoir 4 essais. Nous passons ainsi de 8 à 4 essais en supposant 
qu'il n'y a pas d'interactions et nous nous retrouvons avec un simple plan de criblage. 


Pour réduire les coûts d'expérimentation tout en gardant les interactions implicitement, nous pouvons jouer 
avec la mathématique. D'abord reprenons le problème actuel avec un plan factoriel de 3 facteurs complet 
sous forme explicite: 


+9 4 — dd + +43 +43 dy =} 
+9 à — 43 — 434 — 43 +43 +43 = 2 
do — à +4 — 43 — à +43 433 +43 = y 
+9 +à +43 — 43 +43 43-43 413 = Ya 
+9 —& — 42 +43 +2 — 43-43 +az = Ys 
Hg F4 4; +44; +433 dn =Ye 
+9 — à +4, +43 — à — 43 +43 43 =} 
+do + à + + + + dia tds + = Ye 
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Pouvons-nous en réduire l'écriture afin de minimiser le nombre d'expériences à faire? La réponse est Oui 
mais en contre partie nous allons perdre la mesure des effets purs (nous parlons alors parfois de 
confusion"). 


L'écriture inférieure la plus proche est une matrice de Hadamard d'ordre 4. Ce qui signifie bien 
évidemment que nous ne devons conserver 4 lignes sur les 8 et que celles-ci doivent rester orthogonales, 
balancées et satisfaire la relation: 


L'idée, appelée "méthode de Box et Hunter" et qui ne marche que pour les plans avec des facteurs ayant 
deux niveaux, est alors dans un premier temps de rassembler les facteurs d'influence (en indices) tel que 
(développements similaires pour tout n): 


+(@0 — &23) + (a +as)+ (<a +as)+(-as +a2)= » 
+0 +&3)+ (hu +423) + Ca - 3) + —-a2)= M 
+0 +43)+(-û -a3)+ (ha +as) + —-@2)= 73 
+(ao — &23) + (hu —-42)+ (Ha — a3)+ (as + @2)= Ya 
+(@o +an)+(- -a8)+ (as — ds) + (Has + m2) = y 
Hg — ds) + Cha — 42) + (a +a3)+ (ta —-@2)= Ye 
+{@g — 23) +(-@ — 423) + (a — a3)+ (Has -@2)= Y3 
+0 +@28)+ (hu +423) + (Ha +3) + (has +a2)= } 


(74.324) 


Le choix du regroupement est aussi fait en sorte que les coefficients des d'interactions supposés 
négligeables de par la normalisation centrée réduite se retrouvent avec un coefficient d'un facteur principal 
supposé comme non négligeable. Dès lors, il est aussi logique que dans chaque regroupement, on ne 
retrouve jamais en indice le numéro du facteur principal. 


Nous disons alors que nous avons une structure d'alias (la norme ISO 3534-3:1999 appelle cela une 
""concomitance" lorsque c'est l'expérimentateur qui force le regroupement et "alias" si la confusion est due 
à la nature de l'expérience) du type: 


0#123;1#23;2#F15;3#+12 


et si nous notons cela comme le font de nombreux logiciels de statistiques, cela donne (c'est exactement les 
alias que donne un logiciel comme Minitab 15.1.1): 


I-ABC;A+BC;B+AC;C+AB 


Écrivons cela de la manière suivante: 
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(ao 4) (4-23) (ae - 3) -(e3-a2)=M 
(ao +23) + (oi +423) — (as +3) — (as +2) = M2 
(ag +@23) — (oi +423) + (@2 +3) - (as +a2)= »3 
(do 423) + (a —-48)+(a2 - &3)- (a -2)= Ya 
(ao +23) — (oi +423) —(a2 +3) + (as +a2)= ys 
Go 4m) +(a an) (a - 3) +(a -@2)= Ye 
(do 42) (a — 43) +(a2 — &3) +(as —-@2)= y7 
(do +@23) + (oi +423) + (a2 + 3) + (as +2) = Ye 


(74.325) 


Changeons de notation: 


h-h-E-B = 
+ Lit pt + 
b +À —À À = ÿ3 
+ pt pt + 
 —à + -& =} 
do +À + -E = ya 
(74.326) 
Dh -E +5 =Ys 
lo +A —b +5 = Ye 
Gb -A +L+E =» 
dit fi =» 
Tout naturellement, si nous considérons cette nouvelle notation comme des variables propres, ce système 
unique se sépare maintenant en deux sous-systèmes (les regroupements étant respectivement appelés des 


"contrastes" dans le domaine mais cela n'est pas conforme à la définition de la norme ISO 3534-3) pour 
être résoluble: 


b-È-E-E=h QG +É-E-5 =» 

D +4 +5 -E = +1 -7t = 

" ù 27h 4 et A . 275% (74.327) 
an +À à + = V£ ü — À = +5 = Ys 

G-A +5+E5 =" G + +5 += 


ce qui permet de diviser le nombre d'essais par deux par rapport à un plan complet. En résolvant un de ces 
deux systèmes, nous disons que les interactions sont "aliasées" avec les effets purs en négatif ou en positif 
(dans le cas présent, certains effets principaux sont confondus avec des interactions à 

deux facteurs). 


Il est ensuite de tradition de garder que le système aliasé positivement: 


G+h-5- = ÿ2 
G-L+5-H=»% 
G-E-D+É=y 


G++È += 
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car si les interactions sont nulles, nous retrouvons à l'identique la matrice d'expérience d'un plan factoriel 
complet 52! La démarche conduit donc à ne sélectionner que les essais 2, 3, 5 et 8, ce qui permet de 
diviser le nombre d'essais par deux par rapport à un plan complet. Ainsi, un plan factoriel fractionnaire 
d'une expérience à 3 facteurs peut être réduit à 4 essais avec cette méthode. Le plan factoriel fractionnaire 
ci-dessus sera représenté naturellement par la matrice d'expérience suivante: 


8 + + + Ye 


Tableau: 74.24 - Plan d'expérience fractionnaire à 3 facteurs complet sous forme de Yates 


Il y a cependant un problème : Même si l'interaction triple est réellement nulle, il peut rester jusqu'à 7 
autres coefficients dans le modèle, alors que l'on ne dispose que de 4 résultats d'essais pour les identifier. 
Autrement dit, à moins que l'on sache a priori qu'au moins 3 de ces coefficients sont nuls (afin de se 
ramener à quatre équations avec 4 inconnues), on n'obtiendra au mieux que des relations entre les 
coefficients et l'identification rigoureuse sera impossible. Ainsi, il n'est pas possible de réduire indéfiniment 
le coût d'une étude expérimentale sans en dégrader la robustesse. 


Il est important d'observer que dans la plan factoriel fractionnaire ci-dessus, le troisième facteur est 
confondu (peut être assimilé) avec l'interaction 12 des facteurs 1 et 2. Nous appelons cela "l'alias initiale" 
ou le "générateur" et nous pouvons remarquer en réitérant les calculs pour des plans factoriels à 4, 5, 6 … 
facteurs que les générateurs permettent d'identifier immédiatement les essais à préserver (par ailleurs vous 
pouvez contrôler que lorsque les logiciels Minitab ou JMP vous imposent les générateurs, ils prennent par 
défaut les théoriques). Par exemple, le générateur du tableau ci-dessus s'écrira selon la tradition: 


C=AB 


Nous venons donc de voir qu'un plan 2671 présente le sérieux inconvénient de confondre un facteur 
q P P 
principal avec une interaction d'ordre 2. Un plan » Lg présente seulement l'inconvénient de confondre un 


facteur principal avec une interaction d'ordre 3 et deux interactions d'ordre 2 entre elles. Un plan 2e 
présente des inconvénients encore moindres. C'est pour cette raison que la théorie des plans factoriels 
utilise la notion de résolution. Plus la résolution est grande, plus le plan 

est précis. 


Définitions: 
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D1. Lorsqu'aucun effet principal ne possède d'alias avec un autre effet principal, mais les effets principaux 
possèdent des alias avec des interactions à 2 facteurs, nous parlons de "plan de résolution III". D'un point 
de vue pratique les plans de résolution III ont surtout pour but de permettre des recherches exploratoires 
car ils permettent d'explorer un grand nombre de facteurs avec une économie certaine. À défaut d'obtenir 
un modèle suffisamment précis ils permettent éventuellement d'éliminer un grand nombre de facteurs dans 
un premier temps. 


D2. Lorsqu'aucun effet principal ne possède d'alias avec un autre effet principal ou une autre interaction à 
2 facteurs, mais certaines des interactions à 2 facteurs possèdent des alias avec d'autres interactions à 2 
facteurs et des effets principaux possèdent des alias avec des interactions à 3 facteurs, nous parlons de 
"plan de résolution IV". 


D3. Lorsqu'aucun effet principal ou aucune interaction à 2 facteurs ne possède d'alias avec un autre effet 
principal ou une autre interaction à 2 facteurs, mais des interactions à 2 facteurs possèdent des alias avec 
des interactions à 3 facteurs et des effets principaux possèdent des alias avec des interactions à 4 facteurs, 
nous parlons de "plan de résolution V". 


et ainsi de suite... 


Ce concept de résolution est important. Nous le retrouvons dans des logiciels comme Minitab 15.1.1 lors 
de sélection de plans factoriels fractionnaires: 


[WInI2|I3|4]1,5] 


Figure: 74.40 - Affichage des choix de résolutions de plans factoriels fractionnaires dans Minitab 15.1.1 


ou encore avec le logiciel Design Experts (partie du tableau mais qui est plus explicite que Minitab 15.1.1): 


Figure: 74.41 - Affichage des choix de résolutions de plans factoriels fractionnaires dans Design Experts 


Ainsi, le lecteur pourra observer qu'un plan completer de 5 facteurs à 32 essais peut être réduit à 16 essais 
en rassemblant les facteurs d'influence par paires ou 2-uplets (d'où la division par deux du nombre 
d'essais), ou encore à 8 essais en rassemblant les facteurs d'influence par 4-uplets. 


Ensuite, c'est à l'expérimentateur de bien connaître son analyse et de savoir si: 


1. Parmi les facteurs aliasés s'il y a des interactions ou non! 
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2. Dans le facteur aliasé l'influence forte sur la réponse vient de l'interaction ou de l'effet pur seul! 


Une fois les coefficients déterminés, sous l'hypothèse que chacun des facteurs ou interactions est 
indépendant (hypothèse limite acceptable.) certains ingénieurs font une analyse de la variance de la 
droite de régression obtenue au final ou déterminent le coefficient de corrélation afin de déterminer si 
l'approximation linéaire du modèle est acceptable dans le domaine d'étude et d'application. 


Concernant les générateurs des plans factoriels fractionnaires voici un petit tableau récapitulatif non 
exhaustif: 


2-1) I+ABC,A+BC, B+AC, C+AB 


4 8 IV 2-1) D=-ABC  I+ABCD, A+BCD, B+ACD, 
C+ABD, D+ABC, AB+CD, 
AC+BD, AD+BC 

5 8 III (6-2) D=AB, [Ü+ABD+ACE+BCDE 
E=AC  lA+BD+CE+ABCDE 
B+AD+CDE+ABCE 
C+AE+BDE+ABCD 
D+AB+BCE+ACDE 
E+AC+BCD+ABDE 
BC+DE+ABE+ACD 
BE+CD+ABC+ADE 
16 V 26-1) | E=ABCD [A+BCDE 

B+ACDE 

C+ABDE 

D+ABCE 

E+ABCD 

AB+CDE 

AC+BDE 

AD+BCE 

AF+BCD 

BC+ADE 

BD+ACE 

BE+ACD 

CD+ABE 

CE+ABD 

DE+ABC 


Tableau: 74.25 - Quelques plans factoriels fractionnaies avec générateurs et alias 


Bien évidemment, utiliser des plas fractionnaires est un pari économique (et temporel). Si les conclusions 
sont claires, nous avons alors gagné du temps et réduit notre effort. Mais il arrive que l'on perde le pari. 
Nous pouvons dès lors utiliser un "plan complémtenaire" qui consiste à ajouter de manière pertinente 
suffisamment de lignes au plan initiale pour désaliaser les coefficients désirés sur la base du choix du 
générateur d'alias. 
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Avant de passer à un autre type de plan, revenons juste sur le plan factoriel fractionnaire à 3 facteurs donc 
avec 4 essais pour des raisons pédagogiques. Considérons que nous avons fait ces 4 essais et que pour 
chacun, nous avons obtenu une mesure donnée dans la figure ci-dessous: 


Facteur 3, x; 


Facteur 2, x 


or —— 5) 


Facteur 1, x 


Figure: 74.42 - Représentation d'un plan factoriel fractionnaire réél à 3 facteurs 


Nous voulons montrer au lecteur non pas comment déterminer le calcul des coefficients (résolution d'un 
simple système linéaire et puis il y aura un exemple à ce propos un peu plus loin) mais comment calculer 
les effets dans le cadre de ce cas particulier. 


Ainsi, l'effet de x est: 


—— 2 ——_—— ———"—. ———— (|) (74.329) 
4 4 4 


et celui de x3 est: 


= =" —=1]5 (74330) 
4 4 4 


et celui de x; est: 


= —————# "0 (74331) 
sl sl ! 
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L'effet des interaction est un peu subtile dans le cas de 3 facteurs en utilisant la figure ci-dessous (nous 
verrons dans l'exemple plus bas qu'avec un tableau c'est beaucoup plus intuitif). Ainsi, nous avons pour 
l'interaction XX : 


12+74+62+61  48+37+48 +36 


=925 (74.332) 
: Ê 
et pour xX3: 
37+72+48+61 48+62+74+36 05 (7433 
4 4 | 
et pour X3%3 : 
48+72+61+36_62+37+48#+74 (74.334) 


4 4 


Pour l'interaction triple xx2x3 avec la figure ci-dessous ce n'est pas non plus trivial (cela l'est un peu plus 


avec un table comme nous le verrons dans l'exemple plus bas). Nous avons: 


12+62+48+36 48+37+74+61 
4 4 


0.5 (74.335) 


3.3. PLANS ET NOMENCLATURE DE TAGUCHI 


Les plans de Taguchi ne sont qu'une technique particulière pour retrouver des plans factoriels ou 
multifactoriels complets ou fractionnaires (à partir d'une matrice, d'une table triangulaire et d'un graphe 
linéaire. Avec les logiciels qui génèrent automatiquement les tables, cette technique est devenue un peu 
désuette mais elle avait l'avantage à l'époque de son utilisation de proposer une liste de plus d'une centaine 
de tables avec des facteurs multiples à 2 ou plusieurs niveaux avec ou sans interactions. Voyons en 
quelques exemples classiques pour la culture générale (car cela fait bien de les connaître et en plus c'est 
joli). 


Taguchi proposa d'organiser les expériences selon des tables et des graphes qu'il appelle Z4, Ze... où L 


signifie "Level" et correspond aux nombres d'essais d'une expérience associés à des graphes permettant 
d'identifier les interactions (les tables de Taguchi incluent certains plans de Plackett-Burman). 


Commençons l'exemple avec une table que nous connaissons bien, la table Z, . Chez Taguchi cette table 
peut être lue comme la table d'un plan factoriel fractionnaire de 7 facteurs (donc sans interactions) où 


comme la table d'un plan factoriel complet pour 3 facteurs. Raison pour laquelle est notée Z; | 27 | tantôt 


ASE 
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ra 
Se 
(s) 
l 
N 
[e) 
= 
= 


[Essais| 1 | 2 | 3 [a fs [6e [7 
MI : 1 | 1 1 1 1 1 
DS : 1 | 1 2 | 2 | 2 | 2 
EE : 2 | 2 1 1 | 2 | 2 
BE : 2 | 2 2 © 1 1 
D 1 | 2 1 | 2 | 1 | 2 
MEN 2 1 | 2 2 1 | 2 1 
BE 2 | 1 1 | 2 | 2 1 
BE 2 | 1 2 1 1 | 2 


Tableau: 74.26 - Table L8 avec notation factorielle d'usage et graphes linéaires correspondants 


3 AO) ? 
5 Or 
6 

(@) 7 


Nous allons voir si vraiment elle diffère de ce que nous connaissons déjà. D'abord, chaque facteur ne prend 
aussi que deux niveaux dans ce tableau, nous pouvons donc remplacer la notation de Taguchi avec notre 
notation d'usage pour les plans factoriels en remplaçant les 1 par des "+" et les "2" par des "-": 


+ + + + + 


+ + 
+ = = = - 
+ = = + + - - 
+ = - - - + + 
- + - + - - 
: - - + - 
—+— - - D DE mers 
- - + - + + a 


Tableau: 74.27 - Table L8 avec notation factorielle d'usage 


Nous voyons déjà beaucoup mieux que toutes les lignes et colonnes sont orthogonales prises deux à deux 
(matrice d'Hadamard). Nous ajoutons une colonne de "+": 


+ + + + + 


+ + — 
+ + + : =: - - + 
+ F : + + = : + 
+ - - : : — — — 
- — =: + : + 

x + : : — 5 + 
- — — =: : + 

: : - 5 + + = + 


Tableau: 74.28 - Table L8 avec notation factorielle d'usage avec colonne supplémentaire manquante 
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et nous remarquons que nous retrouvons le plan factoriel complet de 3 facteurs à deux niveaux si nous 
renotons la ligne de titre descolonnes de la manière suivante: 


+ + : — + 


+ + + 
+ - _- - - + 
+ - : + + - - + 
Es = - - - + + 
- - + - - + 

- - + - + + 
- - + + - - + + 
- - + - + + - + 


Tableau: 74.29 - Tableau précédent avec notation traditionelle pour la ligne de titre 


et que cela correspond aussi au plan factoriel fractionnaire d'un plan d'expérience de 7 facteurs à deux 


niveaux (sans aucune interaction). 


La question que se posera bien évidemment le lecteur, c'est comment aurions nous fait pour identifier quel 
facteur appartenait à quelle colonne dans le cadre d'un plan factoriel complet à 3 facteurs si nous ne 
connaissions pas le tableau établi avec les techniques vues plus haut? Eh bien en utilisant le graphe linéaire 


suivant: 


Figure: 74.43 - Graphe linéaire de Taguchi L8 


qui indique les facteurs principaux dans les sommets du graphe (donc les colonnes 1, 2 et 4 sont des 
facteurs principaux). La colonne 3 est l'interaction entre les colonnes 1 et 2 (d'où le fait qu'elle se trouve 
sur l'arête qui sépare les deux sommets), la colonne 5 est l'interaction entre les colonnes 1 et 4 (d'où le fait 
qu'elle se trouve sur l'arête qui sépare les deux sommets), et la colonne 6 est l'interaction entre les colonnes 
2 et 4 (d'où le fait qu'elle se trouve sur l'arête qui sépare les deux sommets). Le fait que le 7 soit à 
l'extérieur, c'est parce qu'une triple interaction ne peut pas être représentée avec cette technique de graphe 
planaire. On utilise alors les symboles des sommets pour signifier que c'est la superposition du sommet 1, 2 


et 4 (cercle+anneau+disque). 


Le deuxième graphe linéaire associé à cette table permet de mettre en évidence un autre usage possible: 


Figure: 74.44 - Graphe linéaire de Taguchi L8 


10 


3 


(O) 2 
(©) 4 
(©) 7 
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C'est-à-dire d'en faire usage pour une analyse de 4 facteurs (toujours à deux modalités dans le cas présent) 
représentées par les colonnes 1, 2, 4, 7 (le lecteur pourra effectivement vérifier que ces quatre colonnes 
correspondent bien à un plan factoriel fractionnaire avec pour générateur 12 pour 4 facteurs soit à la main, 


soit avec un logiciel) dont 3 interactions (1 et 2; 1 et 4; 1 et 7). 


Remarque: Il faut faire attention car il y a donc par exemple une table de Taguchi notée donc Z; pour 


3 facteurs à 2 niveaux complète et 7 facteurs à 2 niveaux sans interactions comme nous venons de le 
voir (donc avec 7 colonnes), mais il y a aussi des tables Z; pour 5 facteurs décomposés en 4 facteurs à 


3 niveaux et 1 facteur à 4 niveaux (sans interactions) mais seulement avec 5 colonnes. Raison pour 
laquelle les livres listant les tables de Taguchi spécifient normalement explicitement le cadre 


d'application des tables. 


Voyons quelques autres tables (une infime partie de la liste complète) 


- Table Fe È 
Essais | F1 | F2 | F3 
___ NE 
En : | 
Ben 2 1 7 
En 2 | 2 |: 
Tableau: 74.30 - Table LA de Taguchi 

1 3 2 
- Table ACM 


EE : 1 1 1 
BON : : 2 2 
EE : 3 3 3 
DANS 2 1 2 3 
EN 2 3 1 
EE 3 1 2 
D : 1 3 2 
BEN : 2 1 3 
D : 3 2 1 


Tableau: 74.31 - Table L9 de Taguchi 


3,4 
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- Table 7; | 2 


ININIIN IA M ININ I AIN A ININ | 
afaisasslallala sa ss )a 


1 


1 


fe 


il 


l 


1 
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Tableau: 74.33 - Table L16 de Taguchi 


1 3,45 2 


etc. 


Les tables de Taguchi accompagnées de leurs graphes sont donc des plans factoriels fractionnaires ou 
complets avec tous leurs avantages. Le mérite de Taguchi est d'avoir essayé de simplifier l'utilisation des 
plans factoriels pour les rendre accessibles à un grand nombre d'expérimentateurs. 


Enfin résumons ce que nous avons vu jusqu'à maintenant avec les noms respectifs (à vérifier car il n'y pas 
de norme claire à notre connaissance concernant ces définitions) dans l'ordre de généralisation: 


- les plans qui contiennent uniquement des facteurs à deux niveaux, sous le nom de "plans factoriels" qu'ils 
soient avec un modèle linéaire ou non-linéaire, additif ou non. 


- les plans factoriels qui permettent uniquement de déterminer les coefficients des facteurs principaux 
(donc modèle additif: sans interactions) sous le nom de "plans de Koshal" ou "plans de criblage" (appelés 
aussi "plans un à la fois" car comme la technique du "un à la fois" il ne permettent d'analyser aucune 
interaction mais le comparaison s'arrête là!). 


- les plans factoriels où toutes les interactions d'ordre trois et supérieures sont négligées sous le nom de 
"plans de Rechtschaffner". 


- les plans factoriels où les coefficients ont été aliasés tout en gardant les interactions sous le nom de "plans 
factoriels fractionnaires", ou encore de "plans de Box et Hunter" ou encore sous le nom de "plans basés 
sur la matrice d'Hadamard”". Avec les plans factoriels fractionnaires, il convient de préciser aussi la 
résolution. 
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- les plans factoriels dont l'ordre est un multiple de quatre mais pas une puissance de deux (donc 12, 16, 
20, 24, etc.) sont appelés "plans de Plackett-Burman". 


- les plans avec un nombre quelconque de facteurs, d'interactions d'ordre quelconque et à un nombre de 
niveaux quelconque sous le nom de "plans de Fisher" (en hommage au créateur d'origine du concept de 
plan d'expérience). 


- les plans qui contiennent autant d'essais que de coefficients à déterminer sous le nom de "plans saturés". 


- les plans qui contiennent moins d'essais que de coefficients à déterminer sous le nom de "plans 
sursaturés". 


Un aspect mérite encore d'être précisé: c'est la vérification de la validité du modèle mathématique du 
premier degré. Or aucun de ces plans ne prévoit un tel test de validité utilisant des statistiques élaborées. 
C'est pourquoi il est préconisé de toujours ajouter au moins un point expérimental au contre du domaine 
expérimental. La valeur de la réponse en ce point sera comparée à la valeur déduite des autres points 
expérimentaux grâce au modèle mathématique. Si les deux valeurs sont semblables, le modèle 
mathématique sera adopté, si elles ne le sont pas nous devrons rejeter ce modèle et compléter les résultats 
déjà obtenus par des expériences permettant de passer au second degré. 


Enfin, pour terminer, faisons un exemple particulier et relativement complet d'un plan factoriel complet 
général avec des facteurs à 3 niveaux. 


Exemple: 


Dans le cadre de l'étude de pneus, le critère retenu sera la longévité (nombre de kilomètres parcourus 
avant que le pneu soit usé) et les facteurs pourront être l'usage (ville ou route), la vitesse moyenne 
(40 [km/h] ou 50 [km/h]) et la pression de gonflage (1.5 ou 2 ou 2.5 [kg]). 


La deuxième étape est la création du plan d'expérience. Dans un plan factoriel complet, nous croisons les 
différents niveaux de tous les facteurs de façon à tester chaque combinaison. Par exemple pour les pneus, 
nous serons amenés à réaliser 2 x 2x3 =12 expériences au minimum si nous voulons travailler avec un 
plan complet. Par ailleurs, il est plus sain de répéter les expériences (pour analyser la dispersion des 
valeurs), donc d'en faire 24, 36, etc. 


Nous noterons comme à l'habitude y la variable étudiée et dans le cas présent x,,x;,x les variables 


facteurs. Nous recherchons un modèle simple sous la forme: 
= +4% +B% + +. 


Comme chacun des facteurs peut avoir plusieurs niveau, nous aurons par exemple la valeur y au niveau 2 
du facteur 1 et au niveau 1 du facteur 2 et au niveau 3 du facteur 3 qui sera noté: 


J= ag +42 +421 +43%33 


Le plan factoriel complet est l'exposé des types d'expériences suivant les niveaux. Par exemple, pour 
l'étude des pneus nous aurons: 


- Pour le facteur 1 i x, : lieu: ville = 1, route = 2 


Page: 4504/4839 


[v3.0 - 2013] 


- Pour le facteur 2 i x; : vitesse: 40 [km/h] = 1, 50 [km/h] = 2 


- Pour le facteur 3 i x; \ pression de pneus: 1.5 [kg] =1, 2 [kg] = 2, 2.5 [kg] = 3 


La matrice d'expérimentation sera alors (c'est exactement la même que celle que l'on obtient en général 
avec Minitab un plan factoriel complet pour 3 facteurs avec 2 à deux niveaux et 1 un trois niveaux sans 
randomisation): 


Essai N° x x x 
1 1 1 1 
2 1 1 2 
4 1 1 3 
4 1 2 1 
F 1 2 2 
6 1 2 3 
7 2 1 1 
8 2 1 2 
9 2 1 3 

10 2 2 1 
11 2 2 2 
12 2 2 5 


Q 


Tableau: 74.34 - Matrice d'expérimentation (ou tableau factoriel/plan d'expérience) 


À ce tableau, nous pourrons associer les résultats des expériences. Par exemple, pour les pneus, nous 
avons fait trois essais (trois "réplications") pour chacune des conditions de niveaux et nous avons obtenu: 


N° Essai | x% X x Valeurs de y 
1 | 1 1 1 32700 32'750 32960 
2 | 1 1 2 33'430 33'360 32910 
3 | 1 1 3 31710 32'100 32220 
4 | 1 2 1 32'680 32270 33 130 
D | 1 2 2 34070 33100 33610 
6 | 1 2 3 33220 33700 33285 
“ | 2 1 1 33180 32'160 32'640 
8 | 2 1 2 34430 34"280 34'460 
9 | 2 1 $ 33570 33'300 32570 
10 | 2 2 1 33'270 33'080 32'415 
11 | 2 2 2 33440 | 33570 | 341204 
12 | 2 2 3 32840 | 33210 | 32'470 
Tableau: 74.35 - Matrice d'expérimentation avec valeurs expérimentales 


À l'aide de ces valeurs, nous pouvons calculer les effets des différents facteurs. Nous partons du principe 
que leur moyenne est nulle pour un facteur donné. Donc la valeur moyenne arithmétique globale (qui peut 
être calculée comme la moyenne arithmétique si et seulement si les variables sont codées): 


Fe 351193 (6453) 
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est le coefficient constant du modèle: 


%) =331193 (74.339) 


L'effet de x; au niveau 1 est la variation de cette moyenne quand on ne considère que les cas où x, est au 


niveau 1. La moyenne arithmétique devient 32'955.8, donc l'effet est: 
32'955.8-33'119.3=-1634 (74.340) 
Nous noterons cela: 
31 =—163.4 (74.341) 
Au niveau 2 de x, la moyenne devient 33'282.7 donc l'effet de x au niveau 2 vaut: 
%,2 = 33"2827-33119.3-1634 (74342) 


Nous remarquons que la somme des effets de x est nulle, car c'est la somme des écarts à la moyenne de 


sous-populations de même taille (donc la moyenne globale est la moyenne arithmétique des moyennes des 
niveaux). 


Exactement de la même façon, nous trouvons: 


X21 = —78.7 X2,2 = 78.7 


(74.343) 
431 = —-349;7 43 2 = 619.4 43 3 = —-269.7 


et nous retrouvons aussi que la somme des effets sur une variable est nulle. 


Nous modélisons ces résultats sous la forme utilisant la moyenne de réponse: 


_349.7 
= 33119340 70% [TTL] 6194 | casa 
Un Or nr Re É 

_269.7 


qui donne le modèle trouvé. Fonction que nous pouvons récrire sous la forme d'effet moyen (la forme la 
plus intéressante mathématiqument parlant): 


7 =33119.3+163.4x +78.7x2 +619.4x; (74.345) 


Résultat intermédiaire à comparer avec une régression linéaire simple qui est (résultat parfaitement 
identique entre Microsoft Excel 14.0.6117 et Minitab 15.1.1): 


» 2 32313.8+ 326.9x +157.4% +40x (74.346) 


mais qui n'a pas de sens puisque la régression linéaire n'est pas construite pour des facteurs à plus de deux 
niveaux. 
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De ces résultats, nous tirons déjà la meilleure stratégie d'utilisation des pneus: sur route, à 50 [km/h], et 
avec un pneu gonflé à 2 [kg], nous pouvons espérer faire: 


» = 20 +42 +222 +32 = 33"119.3+163.4+787+61942 33981 (74347) 


Remarquons tout de suite que dans certains cas, l'expérimentation a fait mieux, même en ville ou à 

40 [km/h]. Ceci relève de la dispersion évidente des résultats. Mais alors, les effets trouvés ne 
viennent-t-ils pas seulement de cette dispersion? D'autre part nous avons étudié les effets indépendamment 
les uns des autres. Mais il se pourrait qu'ils se renforcent. Nous allons étudier ces questions dans la suite. 


Reprenons nos 36 expériences, en comparant les valeurs obtenues et les prévisions du modèle: 


À 


3% Le Mesuré| Modèle | Écart 
1 |1 | 3216032'854.3/694.3 
1 |2 | 3428033'823.4| 456.6 
1 |3 | 33'300/2'934.3| 365.7 
2 [1 133'08033011.7| 68.3 
2 [2 | 3357083"980.8/410.8 
2 | 3 |[33'210/33091.7| 118.3 
1 [1 |3296032'527.5| 432.5 
1 |2 | 3291033'496.6.586.6 
1 |3 | 3222032'607.5/387.5 
[2 [1 [3313082'684.9] 445.1 
2 [2133610] 33654] -44 
2 [3 | 3328582'764.9| 520.1 
1 |1 | 3264032'854.3/214.3 
1 | 2 | 3446053'823.4| 636.6 
1 |3 | 3257032'934.3/364.3 
2 [1 | 32415/33'011.71596.7 


3% Le Mesuré| Modèle | Écart 
1 |1 | 32'700B2'527.5| 172.5] 
1 |2 | 334308B3'496.6| -66.6! 
1 |3 |31°710/32'607.5/897.5 
2 [1 | 3268082'684.9| -4.9 
2 [2 134070) 33654] 416 
2 [3 | 33'220/2'764.9| 455.1| 
1 |1 |3318082'854.3| 325.7| 
1 |2 | 3443053'823.4| 606.6 
1 [3 [33:570B2'934.3| 635.7| 
[2 [1 [3327063'011.7| 258.3] 
2 |2 | 33440B3980.8L540.8 
2 [3 | 32'840B3'091.7/251.7| 
1 [1 [32750/82'527.5/ 2225 
1 |2 | 33'360/33'496.6.136.6 
1 |3 | 3210082'607.5/507.5| 
2 [1 | 32°270/32'684.9/414.9| 
2 [2 133100) 33654] -554/[2 | 2 | 2 | 3420483980.8| 223.2 
2 [3 | 33'70082'764.9| 935.1| | 2 | 2 [3 | 32'470/33'091.7/621.7 


Tableau: 74.36 - Matrice d'expérience comparant expérience et modèle 


hlnlelhlhle]n]n]ninininlelhlnlklelelLx 
vioin]nininlhlhlhlhlkleln|n]n]nlnln 


Nous constatons que les écarts au modèle sont parfois importants. Cela peut venir d'une dispersion 
aléatoire naturelle des valeurs, ou bien d'un modèle inadapté. Cela fait penser à un modèle inadapté, ou 
bien cela pourrait être dû à ce que des facteurs conjugués ont plus d'effet que séparés. Les effets positifs 
ou négatifs de 2 facteurs peuvent faire plus que s'additionner (modèle purement additif à rejeter peut-être). 


Il y a donc probablement des interactions (les chimistes parlent de "potentialisation"). Pour voir s'il y en a 
des interactions d'ordre deux, un bon moyen c'est d'étudier tous les facteurs par paires (et faire abstraction 
de l'existence des autres). Ainsi, si nous commençons avec les facteurs (lieu) x et (vitesse) x; en faisant 


abstraction de la pression des pneus, nous aurons (l'explication se trouve après la première ligne): 


Page: 4507/4839 


[v3.0 - 2013] 


Niveaux Moyenne expérimentale Effet total Somme des effets Effet de l'interaction 
41421 32'682.2 -437.1 -242.2 -194.9 
1,1 42,2 33'229.4 | 110.2 -84.7 194.9 
419#21 33'398.9 | 279.6 84.7 194.9 
X1,242,2 33'166.6 | 47.3 242.2 -194.9 


Tableau: 74.37 - Tableau d'interaction facteurs 1 et 2 


Donc, 32'682.2 est la moyenne arithmétique des expériences faites au niveau x,1 (Ville) et x1 


(40 [km/h]). En soustrayant la moyenne (toujours 33'119.3), Nous obtenons un effet de -437.1, alors que 
l'effet de x (-163.4) plus l'effet de x; (-78.7) ne donne que -242.2. 


Il y a donc un surplus de -194.9, dû en grande partie à l'interaction x11x31 (notez que c'est la même pour 


31,2%2,2, et l'opposée pour x1x33 et x2x21 ). Notons tout de suite que l'interaction x,1x31 a un effet 


bien supérieur aux effets de x et de x; ! 


Voyons les deux autres interactions possibles: 


Niveaux Moyenne expérimentale Effet total Somme des effets Effet de l'interaction 
A1 32'748.3 | -370.9 -513.1 142.2 
41452 33'413.3 | 294.1 455.9 -161.9 
X1,143,3 32'705.8 | -413.4 -433.1 19.7 
41,233 32'790.8 | -328.4 -186.3 -142.2 
X1,2X3,2 34'064.0 | 944.7 782.8 161.9 
X1,2 83,3 32'993.3 | -125.9 -106.3 -19.7 


Niveaux Moyenne expérimentale Effet total Somme des effets Effet de l'interaction 
22133, 32"731:7 | -387.6 -428.4 40.8 
221 43,2 33'811.7 | 692.4 540.7 151.7 
221833 32'578.3 | -040.9 -348.4 -192.5 
22,243 32'807.5 | -311.8 -271.0 -40.8 
42252 33'665.7 | 046.4 698.1 -151.7 
#25 33'120.8 | 1.6 -191.0 192.5 


Tableau: 74.39 - Tableau d'interaction facteurs 2 et 3 
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Nous pouvons représenter les interactions différemment, en croisant les facteurs: 


22, X2,2 
1 -194.9 194.9 
4,2 194.9 -194.9 
431 43,2 43,3 
x 1 142.2 -161.9 19.7 
X,2 -142.2 161.9 -19.7 
43,1 X3,2 43,3 
X2,2 -40.8 -151.7 192.5 


Nous remarquons alors que chaque ligne ou chaque colonne a un total nul. Nous voyons aussi que, dans ce 


cas, il est difficile de négliger les interactions, et que x; (par exemple) intervient plus par ses interactions 
que par son effet propre! 


Nous pouvons encore essayer de vérifier si l'interaction des trois facteurs a un effet notable. L'expérience 
ayant été répétée 3 fois à chaque niveau (nous parlons alors de "trois blocs"), nous pouvons calculer la 
moyenne de y, et lui soustraire le modèle avec les interactions calculé ci-dessus: 


142.2 
163.4 78.7 ES É . ; E . 
7=331193+x [+2 _[+2| 6194|+%2x  [+4% 
163.4 78.7 194.9 142.2 
_269.7 
194,9 161.9 
_19.7 
(74.348) 

40.8 
151.7 
ue. 11925 
2% | _408 
_1517 
192.5 


qu'il est d'usage d'écrire par souci de simplification évidente: 
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163.4 78.7 se 194.9 eos 
2697 19.7 
(74.349) 
40.8 
+223 151.7 
1925 


Remarque: Il suffit de savoir que pour les coefficients d'interaction les effets manquants (non signalés) 
sont opposés en signe. 


Certains logiciels de statistiques vont plus loin dans la simplification d'écriture (toujours dans la même idée 
que les autres coefficients sont opposés) et écrivent: 


—349.7 142.2 
»7=331193+x% [-163.4]+x; [-78.7]+x 619.4 |+%2x [-194.9]+xx —161.9 
—269.7 19.7 
(74.350) 
40.8 
+%2% | 151.7 
192.5 
et d'autres logiciels (comme Minitab 15.1.1 par exemple) vont encore plus loin en écrivant: 
»=331193+x [-163.4]+ 22 [-78.7] + 2x3 Fe +2 [-194.9] +2 | | 
619.4 —161.9 — 


40.8 
+28 517 


car les valeurs manquantes s'obtiennent par addition et en inversant le signe (encore faut-il le savoir..). 
Nous ne pouvons donc pas à cause de la présence du facteur à 3 niveaux réduire rigoureusement le modèle 
mathématique à une simple fonction. Raison pour laquelle, nous nous retrouvons avec la symbolique 
visible dans la relation précédente. 


Nous pouvons alors résumer ces résultats sous la forme: 
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N° Essai|x x 1x3 Valeurs) de y Moyenne Modèle | Écart 
1 | 111111327700 32"750132'960| 32'803.332"515.6| 287.8 
2 | 111121133430 3336032910| 33233.333"291.5| -58.1 
3 | 111131317710 3210032220] 32'010.02"239.8-229.8 
4 | 1121132680 3227033130] 32'693.3532"981.2-287.8 
5) | 1121213407053310033'610| 33'593.333535.3| 58.1 
6 [1 213 133"22053'70033"285) 33'401.7533172.0]| 229.7 
7 | 2111133180 32'16032'640| 32'660.0132'947.8-287.8 
8 E 112 134430 34'280534'460| 34'390.034331.9) 58.1 
9 | 2111333570 3330032"570) 33'146.7132'917.0| 229.7 
10 | 2121133270 33'08032'415| 32'921.7132"633.8| 287.9 
11 E 212 133440 33'570134"204) 33'738.033'"796.1| -58.1 
12 | 21213 132"840 33'210532'470| 32'840.0133'069.6/-229.6 
Tableau: 74.40 - Matrice d'expérience avec mesures, moyenne, modèle et écart 


Nous nous apercevons alors que les valeurs du modèle s'écartent toujours assez nettement des valeurs 
moyennes, ce qui peut s'interpréter soit par le fait que les effets ne sont pas linéaires, soit par une 
interaction entre les trois facteurs. 


Il conviendrait alors de refaire les calculs effectués plus haut avec l'interaction des trois facteurs. Mais 
comme c'est toujours le même principe, nous le ferons que si un lecteur ne nous le demande explicitement. 


Mais il existe encore une cause d'erreur dans le modèle, c'est de tenir compte d'effets qui n'interviennent 
pas en réalité. Pour être sûr que l'effet calculé sur une variable ou sur une interaction est réel, nous 
utiliserons pour commencer l'analyse de la variance à une voie (ANOVA) que nous avons étudié en détails 
dans le chapitre de Statistiques. Pour cela, il est important d'avoir répété les expériences, de façon à 
pouvoir mettre en évidence la dispersion due aux facteurs non contrôlés. 


Par exemple, le facteur x; a un effet plutôt faible. A-t-il une influence véritable? Pour cela, nous séparons 
les 36 expériences en deux échantillons (niveau x; et niveau x; : ), et nous calculons les sommes de 
carrés et les degrés de liberté. 


contrôlée 223'098.78 1 |223'099 calculé: 0.485 
résiduelle 15'645'288.44 | 34 |460"156| limite (5%): | 4.13 


totale 15'868'387.22 35 test réussi 
Tableau: 74.41 - Tableau d'ANOVA 


Ce qui donne avec Minitab 15.1.1 (nous pouvons y constater que le modèle n'est très probablement pas 
linéaire): 
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ANOYA à un facteur contrôlé : 40 km/h; 50 km'h 


Somme des 
Source DL carrés CH F P 
Facteur 1 223099 223099 0.48 0.491 


Erreur 34 15645288 460156 
Total 35 15668387 


5 = 678.3 R carré = 1.41 * R carré (ajust) = 0.00 *% 


Limites de confiance = 95 % distinctes pour la 
moyenne en fonction de l'écart type regroupé 


Niveau N Moyenne EcTyp —+--------- +--------- +--------- + 
40 km/h 18 33041 797 Ê—----------- Panne } 
50 km/h 18 33198 533 (s=-sessse- sms ] 
+ + + + 
32750 33000 33250 33500 


Ecart type regroupé = 678 


Le test ayant réussi, nous concluons que le facteur x; n'est sans doute pas influent (car le test avait 


comme hypothèse: le facteur contrôlé n'est pas influent). Il en est de même pour le facteur x : 


contrôlée | 961'707.1 961'707 calculé: 2.19 
résiduelle | 14'906680.1 34 438'432 limite (5%): 4.13 
totale | 15'868'387.2 35 test réussi 


Tableau: 74.42 - Tableau d'ANOVA 


Ce qui donne avec Minitab 15.1.1 (nous pouvons aussi y constater que le modèle n'est très probablement 
pas linéaire): 


ANOYA à un facteur contrôlé : Ville; Route 


Somme des 
Source DL carrés CH F P 
Facteur 1 961707 961707 2.19 0.148 


Erreur 34 14906680 435432 
Total 35 15565357 


S = 662.1 R carré = 6.06 %  R carré (ajust) = 3.30 # 


Limites de confiance = 95 + distinctes pour la 
moyenne en fonction de l'écart type regroupé 


Niveau N Moyenne ECTyp ----+--------- +--------- +--------- +----- 

Ville 18 32956 610 (----------- Ps } 

Route 18 33283 711 = Pa —— } 
= — + + +----- 
32750 33000 33250 33500 


Ecart type regroupé = 662 


Par contre, le facteur x; est, lui, bel et bien influent: 
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contrôlée | 6'943'966,7 3'471'983 calculé: 12.84 
résiduelle | 8'924'420,5 33 270437 | limite(5%): | 3.28 
totale | 15'868'387.2 35 test échoué 


Tableau: 74.43 - Tableau d'ANOVA 


Ce qui donne avec Minitab 15.1.1 (nous pouvons y constater que le modèle n'est très probablement pas 
linéaire): 


ANOVA à un facteur contrôlé : 1.5 kg; 2 kg; 2.5 kg 


Somme des 
Source DL carrés CM F P 
Facteur 2 6943967 3471983 12.64 0.000 
Erreur 33 8924421 270437 
Total 35 15868387 


S = 520.0 OR carré = 43.76 %  R carré (ajust) = 40.35 # 


Limites de confiance = 95 % distinctes pour la 
moyenne en fonction de l'écart type regroupé 


Niveau N Moyenne EcTyp -------- +--------- + + +- 
1.5 kg 12 32770 364 (------ D } 
2 kg 12 33739 530 {—----- } 
2.5 kg 12 32850 631 {—----- É—————— } 
= ne annees nnetentntnns ns 
32800 33200 33600 34000 


Ecart type regroupé = 520 


Rappelons en effet que l'échec du test correspond à la mise en évidence d'un facteur influent, celui qui est 
contrôlé. Alors, le modèle de base à considérer (on laisse de côté les interactions) n'est plus : 


349.7 
EL E Poe idea Pa ue FE ET (74.352) 
usé PT 1 ll RS 
269.7 
mais: 
349.7 
»=33119.3+2m| 619.4 |. (74352) 
269.7 


Attention!!! Le fait que x et x; ne soient pas influents n'a pas comme conséquence que les interactions 
entre x et x, Ou x et x;, ou même xx; et x; ne le sont pas. Par exemple, ici, %x; n'est pas influent 


(le test de Fischer-Snedecor réussit), mais au niveau 1 de x;,, xx l'est (au sens x = x; contre x # x ). 


Voyons cela avec Minitab 15.1.1: 
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ANOYA : Response en fonction de Lieu; Vitesse; Pression 


Facteur Type Niveaux Valeurs 


Lieu fixe 2 Route; Ville 
Vitesse fixe Z 40; 50 
Pression fixe 3 1.5: 2: 2.5 


dänalyse de la variance pour Response 


Somme des 
carrés CH F P 
961707 961707 6.78 0.016 
223099 223099 1.57 0.222 
Pression 6943967 3471983 24.49 0.000 
LieutVitesse 1367340 1367340 9.65 0.005 


Source DL 
1 
1 
2 
1 
Vitesse*Pression 2 741020 370510 2.61 0.094 
2 
2 
4 
5 


Lieu 
Vitesse 


Lieu*Pression 561782 280891 1.98 0.160 
Lieu*Vitesse*Pression 1667622 833811 5.88 0.008 
Erreur 3401851 141744 

Total 15868387 


S = 376.489 R carré = 78.56 % KR carré (ajust) = 68.74 * 


Nous voyons qu'en faisant une ANOVA multifactorielle, que finalement le facteur x est statistiquement 


significatif (p-value inférieure à 5%), la vitesse par contre ne l'est pas (p-value supérieure à 5%), la 
pression a une influence très significative (p-value nulle). L'interaction xx; (Lieu*Vitesse) est 


significative (p-value inférieure à 5%). Par contre, les interactions x,x3 (Vitesse*Pression) et xx; 


(Lieu*Pression) ne sont pas significatives (p-value supérieure à 5%). La triple interaction 
(Lieu*Vitesse*Pression) est elle significative! 


4. CONTRÔLE DE RÉCEPTION 


Le "contrôle de réception" ou "contrôle statistique des lots" est un domaine extrêmement important, vaste 
et mathématiquement technique du contrôle statistique de la qualité dans l'industrie (alimentaire, pharma, 
biens de grande consommation) et des sociétés de services (prestations à répétition, contrôles des 
processus, sondages). Son but, selon la norme NF X06-021, est de permettre l'application à un lot contrôle 
(de produits ou prestations) de l'une ou l'autre des décisions suivantes: Acceptation ou Rejet à différentes 
étapes d'une production/développement pour vérifier si un lot est recevable pour les étapes suivantes ou 
pour vérifier le produit fini avant envoi au client. 
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Remarque: Nous allons ici présenter que les bases car les cas particuliers nécessitent un bagage 
mathématique considérable! C'est par ailleurs pour cette raison que de nombreuses entreprises (PME 
ou multinationales) qui utilisent des étudiants stagiaires ou employés non mathématiciens pour définir 
les contrôles qualité afin d'économiser de l'argent se retrouvent par la suite avec des problèmes 
considérables au niveau du respect des lois et des normes! Cependant, ce que nous allons présenter ici 
constitue le minimum-minimorum de la connaissance de tout responsable ou ingénieur qualité ou 
responsable du contrôle de la réception fournisseurs actif dans une organisation quelconque 
(industrielle ou administrative) sous peine d'avoir aucune crédibilité! Par ailleurs méfiez vous des 
entreprises - particulièrement des multinationales - qui recherchent des spécialistes qualité maîtrisant 
Microsoft Excel ou Microsoft Access. Car cela signifiera qu'elles utilisent des outils non professionnels 
pour faire un travail qui lui devrait pourtant l'être avec des outils adaptés (et Microsoft Excel ou 
Microsoft Access ne le sont pas)!!! Donc en termes d'organisation interne, vous pouvez vous assurer 
que ces entreprises organisent et analysent n'importe quoi, n'importe comment, avec un outil non 
adapté et donc que c'est le bordel général en interne. 


Le but du contrôle de réception n'est pas d'estimer la qualité d'un lot mais uniquement de l'accepter ou de 
le rejeter. Le contrôle de réception n'est pas non plus un substitut aux méthodes de contrôle de procédé 
comme les cartes de contrôle ou l'analyse de capabilité. Une utilisation dynamique de ces derniers outils 
durant la fabrication aura pour conséquence de réduire et, dans certains cas, d'éliminer les besoins 
d'effectuer du contrôle de réception 


Il existe principalement trois approches pour évaluer un lot: 


- Soit accepter le lot sans inspection (utile dans des situations où une relation de confiance absolue règne 
entre le client et le fournisseur). 


- Soit prélever un échantillon (échantillonnage) et en tirer des conclusions sur le lot complet (utilité dans la 
majorité des cas car peu coûteux et motive fortement le fournisseur à améliorer sa qualité mais il y a un 
risque à rejeter de bons lots ou d'en accepter des mauvais). Par exemple PSA Mulhouse contrôle 5% des 
véhicules qui sortent des ces usines chaque jour. 


- Soit inspecter la totalité des individus du lot (utile quand le fournisseur ne peut pas prouver qu'il maîtrise 
son procédé et est capable de produire dans les spécifications ou quand la caractéristique suivie est 
critique). 


Pour que le résultat d'un contrôle d'un lot par échantillonnage soit fiable, il est trivialement primordial que, 
lors du prélèvement d'un échantillon d'individus, aucune préférence ne soit accordée à certains individus 
du lot. Idéalement, chaque individu du lot doit avoir la même probabilité d'être pris dans l'échantillon. 


La ou les caractéristiques contrôlées peuvent être: 


- Qualitatives (attributs): l'aspect d'un produit, la présence ou l'absence d'un caractère non-conforme, le 
non respect d'un contrôle de calibre, un résultat atteint ou non. Les individus sont alors directement classés 
en conformes ou non-conformes repérés par le nombre de défauts qu'ils comportement. 


- Quantitatives (variables ou mesures): caractéristique mesurée sur une échelle continue: volume, longueur, 
poids. 
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Signalons enfin qu'il y a deux façons de classifier les plans de réception. La première famille consiste à 
définir les trois catégories suivantes: 


- le "contrôle de la proportion d'individus non-conformes par comptage" ou "contrôle par attribut": Une ou 
plusieurs caractéristiques de type qualitatif ou quantitatif sont contrôlées sur chaque individu dans le but 
de le classer en conforme ou non-conforme suivant certains critères. La décision est prise d'après le 
nombre d'individus non-conformes trouvés dans le (ou les) échantillons prélevés. 


- le "contrôle de la proportion d'individus non-conformes par mesurage" ou "contrôle par variable". Une 
caractéristique est mesurée sur chaque individu d'un échantillon et la décision est prise en fonction de la 
moyenne et de la dispersion de la caractéristique calculée sur l'ensemble des individus prélevés. 


Nous pouvons également classifier les plans de réception selon le nombre d'échantillons prélevés. 


- Un "plan d'échantillonnage simple" consiste à prendre n individus dans le lot et de prendre une décision 
sur la base de ceux-ci. 


- Un "plan d'échantillonnage double" consiste à prélever un premier échantillon dans le lot et d'en tirer une 
des trois conclusions possibles: (1) accepter le lot, (2) rejeter le lot, (3) rééchantillonner. Si un second 
échantillon est prélevé, les informations des deux échantillons sont rassemblées pour décider d'accepter ou 
de rejeter le lot (si nous répétons cette stratégie, nous parlons alors de "plan d'échantillonnage multiple"). 


- Un "plan d'échantillonnage progressif ou séquentiel" est le cas extrême du plan d'échantillonnage 
multiple. Les unités sont prélevées une à une et après chaque prélèvement une décision est prise: (1) 
accepter, (2) rejeter, (3) prélever une nouvelle unité. 


Exemple: 


Un producteur de boissons gazeuses désire contrôler une propriété des bouteilles qui lui sont fourniers. 
Pour cela, il utilise un plan de réception simple avec contrôle de la proportion d'individus non-conformes 
par mesurage quand un lot de bouteilles lui est livré: 


1. Prélever un certain nombre n d'unités (bouteilles) du lot (échantillonnage simple) 
2. Mesurer à quelle pression chacune des n bouteilles éclate (contrôle destructif) 
3. Calculer des indicateurs statistiques des valeurs observées. 


4. Suivre la règle de décision d'acceptation ou de rejet que nous devrons déterminer. 


Remarque: Comme les cartes de contrôle, l'application d'un plan d'échantillonnage est un test 
d'hypothèse. Il peut mener à des décisions correctes ou fausses. Les risques encourus sont ceux 
d'accepter un lot qui n'est pas conforme ou de rejeter un lot qui est conforme. 


Évidemment l'échantillonnage comporte des avantages et désavantages. Voyons la liste des avantages les 
plus communs: 


A1. Cela coûte moins cher car on ne contrôle pas tout. 


A2. Il y a moins de manipulations des produits donc moins de déchets 
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A3. Il y a besoin de mobiliser moins de personnes ou de machines de contrôle 


A4. Cela réduit considérablement les erreurs d'inspection 


A5. Le retour d'un lot complet juste à cause d'un échantillon non accepté à tendance à plus motiver le 
fournisseur à faire de la qualité... 


Mais cela comporte aussi des désavantages comme: 
D1. Le risque d'accepter de mauvais lots et d'en rejeter des bons... 
D2. Requière plus de compétences des employés et des contrats bien écrits. 


4.1. PLAN D'ÉCHANTILLONNAGE PAR MESURE SIMPLE POUR UNE UNIQUE TOLÉRANCE 
AVEC ÉCART-TYPE CONNU 


Pour ce type de plan d'échantillonnage, nous supposerons que l'échantillon n est beaucoup plus petit que le 
lot total (d'un facteur 10 au moins) et que l'écart-type est connu! 


La caractéristique X mesurée pour chaque individu de l'échantillon est supposée suivre une loi Normale 
d'espérance et d'écart-type et de variance identique et le calcul de ces deux derniers paramètres est basé 
sur l'utilisation de la moyenne empirique (estimateur de maximum de vraisemblance de l'espérance) et de 
l'estimateur sans biais de l'écart-type (estimateur de maximum de vraisemblance de l'écart-type). Cette 
hypothèse implique que le produit du fournisseur à une fabrication sous contrôle statistique. 


Exemple: 


Dans le cadre de notre exemple, le producteur de boissons gazeuses, il reçoit des lots de 10'000 bouteilles 
(donc l'échantillon satisfera la condition susmentionnée). 


Nous noterons: 


Nous conviendrons que le client et le fournisseur se sont entendus sur des limites de spécification (limites 
de tolérance). Nous noterons comme à l'habitude ces limites USL et LSL. 


Soit D la proportion (inconnue) de produits non-conformes (défectueux), elle est donnée naturellement 
dans le domaine de la maîtrise statistique des procédés par: 
LSL — USL — 
D=P(X <LSL)+P(X > USL) = r[z SE) +e(2 > _ (74.355) 
T T 


Dans la pratique, afin d'économiser de l'argent dans le cadre des tests de qualité nous essayons de réduire 
(reformuler) tout problème de contrôle à un unique calibre. Au fait le problème peut toujours avec ou sans 
reformulation se réduire à avoir une proportion de non-conforme en dessous de LSL ou au-dessus de USL 
pour rejeter le lot si la fabrication du fournisseur est bien sous contrôle statistique. D'où le fait que dans la 
pratique les développements mathématiques ne sont faits que par rapport à une seule borne que nous 
noterons alors LSL pour "limite de spécification du lot". 
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Ainsi, nous réduisons les problèmes à (ou nous nous arrangeons à avoir les problèmes qui se réduisent à 
cette formulation): 


D=P(X « LSL\) ou D=P(X > LSE) 
Exemple: 


Dans le cadre de notre exemple, le producteur de boissons gazeuses, il s'agit de la résistance à la pression 
d'un lot de 10'000 bouteilles que nous souhaiterions contrôler. Le producteur s'est mis d'accord avec son 
fournisseur sur une limite de spécification inférieure pour cette caractéristique, LSL valant 22.5, limite 
qu'une majorité des bouteilles doit dépasser. Ainsi: 


D=P(X « LSE)= P(225 « LSE) 


Nous supposons que des données passées ont permis d'estimer précisément l'écart-type et que l'on peut 
donc le considérer comme connu et valant 1.5 et qu'il est sous contrôle statistique. 


Car évidemment si la proportion de non-conforme est supérieure (respectivement inférieure) à ce que 
définit le contrat de qualité dans une borne, elle le sera aussi à la borne opposée dans des proportions 
identiques puisque le processus de fabrication du fournisseur est par hypothèse sous contrôle statistique. 


Avant de partir plus loin dans les développements mathématiques, il y a une chose importante qu'il faut se 
rappeler: 


Si nous nous imaginons être un fournisseur, il est évident que nous souhaiterions avoir un niveau de qualité 
tel que la probabilité cumulée que le client rejette à tort un lot soit faible (car en tant que fournisseur nous 
serons contractuellement obligés de reprendre le lot même si un deuxième contrôle ultérieur complet 
s'avère qu'il a tort!). Pour cela, le fournisseur définit une valeur 2; du pourcentage de produit 


non-conforme ("niveau de qualité acceptable": NQA) en dessous de laquelle il juge que le lot ne peut être 
refusé que très rarement. De plus, il définit également & comme étant la probabilité cumulée maximale de 
se voir refuser un lot qui a une proportion de non-conforme plus petite ou égale à D; (il s'agit donc de la 


probabilité cumulée avec laquelle un client rejetterait à tort un lot). Ceci se note: 
P(Refuser un lotD< D, ) £a 


& est appelé bien évidemment... "risque du fournisseur" et est en général de l'ordre de 0.1 à 10%. 


Enfin si nous nous imaginons être le client, il est évident que nous souhaiterions que la probabilité cumulée 
d'accepter à tort un lot qui ne respecte pas le contrat qualité soit faible pour des raisons évidentes de coûts. 
Pour cela, le client de son côté définit une valeur 2, du pourcentage de produit non-conforme ("niveau de 


qualité limite": NQL) au-delà de laquelle il juge que le lot ne peut être accepté que très rarement. Il définit 
également $ comme étant la probabilité cumulée maximale de devoir accepter un lot qui a une proportion 


de non-conforme plus grande ou égale à 2, (il s'agit donc de la probabilité cumulée avec laquelle on 


accepterait à tort un lot du fournisseur). Ceci se note: 
P(Accepter un lotD > D \< 8 


& est appelé bien évidemment... "risque du client" et est en général aussi de l'ordre de 5 à 10%. 
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Pour résumer la situation peut-être illustrée par le tableau suivant (qui est en tout poit similaire au tableau 
des erreurs de Type I et II vu dans le chapitre de Statistiques): 


Risque æ Décision correcte 


Décision correcte Risque & 


BExemple: 


Dans le cadre de notre exemple - le producteur de boissons gazeuses - qui reçoit des lots de 10'000 
bouteilles dont la résistance à la pression (LSL) doit être supérieure à 22.5 avec un écart-type sous 
contrôle statistique et valant 1.5, le fournisseur et le client ont chacun fixé les risques qu'ils sont prêts à 
courir: 


- Le fournisseur désire qu'un lot avec moins de 1% de bouteilles non-conformes soit refusé par erreur par 
le client dans au plus 5% des cas. Soit: 


P(Refuser un lot|D < D;) <a = P(Refuser un lot|D <1%)<5% (74.360) 


- Le client désire qu'un lot avec plus de 5% de bouteilles non-conformes soit accepté à tort dans moins de 
10% des cas. Soit: 


P(Accepter un lot|D D )< 8 P(Accepterunlot(D 25%)<10% (74.361) 
Remarque: La règle de décision d'acceptation ou de rejet du lot pour un contrôle par mesure est en 


générale basée sur la moyenne arithmétique de la caractéristique estimée sur base de l'échantillon 
plutôt que sur base d'une estimation de taux de non-conforme. 


Pour la suite, quand nous écrivons: 
D=P(X <LSL) (74362) 


la particularité c'est que dans la pratique D est imposé «7 est donné. Le reste est soit à calculer, soit à 
éliminer (effectivement le praticien doit normalement uniquement parler en termes de probabilité cumulées 
et proportions et facteurs pour définir sa politique de qualité et LSL n'est ni une probabilité cumulée, ni une 
proportion, ni un facteur indépendant de la chose que l'on analyse!). Dès lors nous écrivons: 


D=P(X <ESE)= r(z (74.363) 


LSE — 
: =) 
T 
avec donc la variable centrée réduite habituelle: 


Ê-= = hat (74.364) 
T 
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Évidemment nous en tirons que la valeur limite est: 


H=ESL-Z£Zpn© (74365) 


où ZA est donc le percentile de niveau D de la distribution centrale normale réduite (comme à l'habitude). 


Malheureusement, nous avons toujours LSL qui est là. Pouvons-nous nous en soustraire? Pour cela, nous 
avons dans l'hypothèse que la mesure est sous contrôle statistique: 


= o 
= a (74.366) 
c 


La probabilité cumulée À; d'accepter (nous aurions pu le faire pour le rejet mais il faut choisir un des deux 


pour l'exemple...) le lot quand le taux de non-conforme est D s'en déduit dans le cadre de l'utilisation de la 
moyenne de la mesure: 


ne P(X2 LSL +ka) (74.367) 


dans le cas particulier où la mesure ne doit pas être inférieure à une certaine valeur donnée (comme c'est le 
cas pour l'exemple des bouteilles susmentionné!). 


Nous avons alors: 


B,= P(E > LSL+k0)= AE lp, LSL+KO- Up æ | - p[72 Rte Le 


c/Vn CA fn 


pee 200) (ROSE À (7 2 (420) 


on oj Va 


Nous avons alors un résultat très intéressant! La probabilité cumulée d'accepter le lot quand le taux de 
non-conforme est D est alors dans le cas particulier où il s'agit d'une mesure en dessous de laquelle il ne 
faut pas aller: 


(74.368) 


P = P(Z > Jn(k +2Zp)) (74.369) 
et de le rejeter dans le cas d'une mesure au-delà de laquelle il ne faut pas aller: 
PB = P(Z <n(k+29)) G4370 


et ce qui est bien c'est que le problème se réduit à un percentile Z; aisé à choisir (norme ou choix 
politique), d'un nombre d'individus n, et d'un facteur k donc que des éléments indépendants de la mesure 
elle-même et alors utilisable dans n'importe quel métier pour n'importe quel type d'objet (et en plus nous 
avons éliminé l'écart-type)!! 
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Évidemment, le fournisseur et le client doivent se mettre d'accord pour un plan d'échantillonnage afin 
d'établir des tests qualité correspondant aux attentes de l'un et de l'autre. Ce que nous savons jusqu'à 
maintenant c'est qu'ils s'imposent respectivement un &, £ ce qui leur permet de calculer respectivement 


immédiatement les Zn 4;Zn.8 - Il faut cependant calculer le nombre d'individus n et le facteur k qui 


satisfont les exigences respectives. 


Pour cela, rappelons que si & est donc le risque du fournisseur (probabilité cumulée que le client rejette à 
tort le lot) et $ le risque du client (probabilité cumulée d'accepter à tort un lot du fournisseur) et: 


PB =P(Z24n(k+2,)) Gas) 


la probabilité cumulée d'accepter un lot avec limite inférieure, alors nous devons résoudre le système 
suivant: 


i-æ=P(Z 2 Vn(k+Zoa) 


8=P(zZ24m(k+2Z28)) 


(74.372) 


ou: 


a=P(z <\n(k+2,,)) 


1- 8=P(Z< h(t+228)) 


pour que le fournisseur et le client aient le plan d'échantillonnage qui correspondent aux exigences de 
chacun! 


Nous allons choisir le premier (car il faut bien en choisir un...). Celui-ci peut d'ailleurs se récrire: 


i-a=P(z2ÿn(k+z,,))=1-P(Z <\n(x+7,,) 


B=P(Z2n(k+208))=1-P(Z<(k+2725)) 


(74.374) 


Il vient alors: 


a=P(z <\n(k+2,,)) 
1- 8=P(Z<4h(k+22.4)) 


ee 
F 
Uo 


Ce qui peut s'écrire: 


Soit: 


Page: 4521/4839 


[v3.0 - 2013] 


(74.378) 


d'où au final: 


(74.379) 


et k: 


_ ZaZpg — ZaZDa -ZDaZi-8g TZDaZa 
Zn Ze 


d'où au final: 


& = —— "| (74381) 


B Exemples: 


(74.380) 


E1. Dans le cadre de notre exemple - le producteur de boissons gazeuses - qui reçoit des lots de 10'000 
bouteilles dont la résistance à la pression (LSL) doit être supérieure à 22,5 avec un écart-type sous 
contrôle statistique et valant 1.5, le fournisseur et le client ont chacun fixé les risques qu'ils sont prêts à 


courir: 


P(Refuser un lot|D < D;) <& = P(Refuser un lot{D <1%) < 5% 
P(Accepter un lot|D 2 D \< 8— P(Accepter un lot{D > 5%) <10% 


(74.382) 


Nous avons alors en utilisant la version anglaise de Microsoft Excel 11.8346 (j'ai préféré faire ce choix car 


le nom des formules y est beaucoup... beaucoup plus court qu'en français): 
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2 
| Za 2-8 | L RE — NORMSINV(1-10%) | 


Zpa = ZD,8 NORMSINV (1%) —- NORMSINV(5%) . 


2 
| = 4,294? =18439= 18 
2.326 - (-1.645) —0.618 


_ | —1.645 - 1.282 | _ (22 
et (calculé avec les mêmes fonctions Microsoft Excel que nous omettrons donc de préciser): 


= ZaZD,8 —ZpaZ-g 
2-8 -Za 


Z 1.943 (74.384) 


Le plan d'échantillonnage consiste alors à prélever et analyser un échantillon de taille 18, calculer la 
moyenne Z et appliquer la règle de décision suivante: 


Acceptation du lot si: Ÿ > LS£+ ko = 22.5+1.943.1.5z 25.4 
Rejet du lot s1: X <LSL+kez 254 


(74.385) 
Supposons qu'un échantillon de taille 18 soit prélevé et donne les résultats suivants: 
25.6, 26.0, 23.0, 27.0, 27.5, 29.0, 28.5, 26.0, 25.6 
25,60,26.5,28.0,2753,25,2,27,1,298,26.5,27,9 
Nous avons alors: 


X=2682>254 (74386) 


et donc le lot est accepté. Il faut savoir que beaucoup de praticiens préfèrent le calcul suivant utilisant un 
"indice de qualité", noté Q, utilisant simplement la relation suivante: 


: TAN _ 26.8 22.5 
T 1.5 


(@) z286>Àx (74.387) 


donc le lot est accepté. 


Remarque: Il est quand même conseillé dans la pratique de calculer l'estimateur non biaisé de 
l'écart-type de l'échantillon pour vérifier qu'il ne s'éloigne pas trop de l'écart-type du contrat (même s'il 
ne peut pas être identique pour de petits échantillons)! 


E2. Un deuxième calcul-type fait par les praticiens (souvent par pure curiosité ou parfois pour faire un 
rapport de la stratégie de la qualité à la direction) qui découle du premier exemple est le suivant: Quelle 
est la probabilité cumulée que l'on rejette avec n et k donnés, un lot dont la proportion de non-conformes D 
serait de 5%? Dès lors, nous utilisons la relation démontrée suivante: 


PB, = P(Z < Jn(x +2Zp)) (74.388) 


Soit avec les valeurs précédentes: 
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BE, = P(Z < 18 (1.943+ NORMSINV(5%))) = 89.70% 


et la probabilité cumulée qu'on l'accepte est alors de 1-89.70% soit 10.29%. 
4.1.1. CALCUL DES PARAMÈTRES PAR UTILISATION DE LA NORME AF-X06-023 


La norme AFNOR X06-023 propose une méthode quelque peu différente pour déterminer k et n, non 
directement basée sur les risques du client et du fournisseur mais sur un paramètre appelé "niveau de 
qualité acceptable" (NQA.). En outre, cette norme tient également compte de la taille du lot à tester 
(considérée plus haut comme infinie) et du niveau de contrôle désiré. 


Remarque: La norme ISO 3951:1981 correspondante donne à ma connaissance des valeurs très 
différentes de celle de l'AFNOR pour des raisons qui m'échappent (j'espère que c'est juste parce que je 
n'ai pas compris quelque chose...). 


Définition: Le NQA., est le pourcentage d'individus non-conformes qui ne doit pas être dépassé pour 
qu'une production, contrôlée sur une série de lots, puisse être considérée comme satisfaisante. 


En d'autres termes, quand une production est stable avec un pourcentage d'individus non-conformes au 
plus égal au NQA, la grande majorité des lots présentés au contrôle doivent être acceptés par le client. 
Donc en général le NQA. est proche - mais pas égal! - de D; (pour rappel: la proportion de non-conforme 


tel qu'il y ait une probabilité cumulée & que le client rejette à tort le lot). 


La méthode proposée est du type "recette de cuisine" mais est imposée par certaines normes européennes 
donc les industriels n'ont pas d'autre choix que de l'appliquer. Mais, finalement, les valeurs numériques 
sont relativement proches de celles obtenues avec les relations démontrées précédemment. Au fait leur 
vraie utilité, c'est qu'elles sont simples à mettre en oeuvre dans des situations beaucoup plus complexes que 
celles que nous venons d'étudier. 


En fonction du contexte, la norme propose d'appliquer différents niveaux de contrôle: 


- Le contrôle normal qui est à adopter quand nous sommes en relation de confiance étroite avec le 
fournisseur et avons un oeil en temps réel sur la qualité de sa production à l'aide d'outils informatiques de 
surveillance à distance. 


- Le contrôle renforcé qui est plus strict que le contrôle normal (n est plus grand) et a pour but de mieux 
protéger le client contre le risque de devoir accepter des lots à tort. Ce type de contrôle doit être effectué 
temporairement quand il y a de sérieuses raisons de penser que la qualité de la production n'est pas (ou 
plus) ce qu'elle doit être jusqu'à un retour à la normale (suspension de livraisons entre temps). 


- Enfin, le contrôle réduit qui est le plus économique et qui peut être appliqué quand sur la base de lots 
précédemment contrôlés et acceptés, nous pouvons croire que le fournisseur maîtrise particulièrement la 
qualité de son procédé. 
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B Exemples: 


E1. Dans le cadre de notre exemple - le producteur de boissons gazeuses - qui reçoit des lots de 10'000 
bouteilles dont la résistance à la pression (LSL) doit être supérieure à 22.5 avec un écart-type sous 
contrôle statistique et valant 1.5, le fournisseur et le client ont chacun fixé les risques qu'ils sont prêts à 
courir: 


P(Refuser un lolD< D, ) <a = P(Refuser un lot|D <1%) < 5% 
(74.390) 


P(Accepter un lot[D 2 D \< 8— P(Accepter un lot{D > 5%) <10% 


Nous devons alors en utilisant cette norme définir le NQA. Comme mentionné dans la définition, en 
général le NQA. est proche de 2; (mais pas égal!). Donc le NQA. sera posé comme valant 1%. 


La norme exige le choix d'un niveau de contrôle. Nous prendrons celui de type II. Une table disponible 
dans la norme nous dit que nous devons utiliser le code L pour la prochaine étape. Enfin, la dernière table 
nous donne donc pour un NQA.de 1% et un code L la cellule suivante: 


1.06% 
n=25 | k=1.97 
4.28% 


ce qui correspond à: 


D; 
n k 


D 


£ 


La norme indique donc qu'un échantillon de taille 25 doit être utilisé et un k de 1.97! Ce plan assure des 
risques un peu moins grands que le plan calculé plus haut mais est plus coûteux, car nécessite plus 
d'échantillons. 


E2. Les praticiens lors de l'utilisation de cette norme souhaitent souvent pouvoir calculer le risque 
fournisseur et client associé au NQA choisi et paramètres correspondants donnés par la norme. Alors en 
utilisant: 


Z 
k=—Æ-2;, (74.391) 
nm 7 


Il vient: 


Soit dans le cadre de notre exemple et en utilisant toujours la version anglaise de Microsoft Excel 11.8346: 
Za = N25(1.97+NORMSINV(1.06%))z-1.67 (74.393) 


Soit: 
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& = NORMSINV(-1.67)= 4.73% (74.394) 


à comparer aux 5%. De même comme: 


Z- 
£=-14 -Zng (74395) 


“A 
alors: 
Zi = fn (x +Zpg ) (74.396) 
Soit dans le cadre de notre exemple et en utilisant toujours la version anglaise de Microsoft Excel 11.8346: 
Z-g = 425 (1.97 + NORMSINV(4.28%))z 1.25 (74.397) 
il vient: 
1- $= NORMSINV(125)=8952% (74.398) 
et au final: 
B=1-89.52% =1048% (74.399) 
à comparer aux 10%. 


4.2. PLAN D'ÉCHANTILLONNAGE SIMPLE PAR ATTRIBUTS 


Les plans par attributs sont plus simples que les plans par échantillonnage, mais ils sont souvent plus 
coûteux (en nombre de prélèvements) que les plans pour mesures et ne sont donc à conseiller que quand 
nous ne pouvons pas résumer l'information sur la qualité d'une unité par des mesures ou que les coûts 
associés aux analyses sont trop élevés par rapport à une simple classification des unités en conforme ou 
non-conforme. 


Le "plan d'échantillonnage simple par attributs" est une procédure de contrôle de réception consistant à 
prélever au hasard un échantillon de taille n donnée dans le lot. Les unités prélevées (de manière 
homogène!) sont ensuite inspectées et classées comme conformes ou non-conformes. Soit X le nombre de 
composants non-conformes trouvés dans l'échantillon. 


Si X < A, la qualité du lot est jugée bonne et le lot est accepté (A). Si X > & avec dans les plans simples 
R=A+1 la qualité du lot est jugée mauvaise et le lot n'est pas accepté. 


BExemple: 


Des bouteilles par lot de taille N=10'000 sont reçues par un client. La procédure de contrôle utilise le plan 
empirique par attributs suivants: on prélève un échantillon de taille n=200. Le critère d'acceptation A est 
X <1 et le critère de rejet Rest X > 2. 


Mentionnons avant de partir dans les détails des calculs de la stratégie d'un plan d'échantillonnage simple 
par attributs les principes des plans d'échantillonnage double et multiple pour la culture générale: 
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Le "plan d'échantillonnage double par attributs" est une procédure de contrôle de réception ayant deux 
stades de décision. Elle consiste à prélever d'abord un premier échantillon de taille inférieure à celui que 
l'on prélèverait pour un plan d'échantillonnage simple. Le premier stade de décision est basé sur les 
informations fournies par ce premier échantillon. Si la qualité du premier échantillon est jugée 
suffisamment bonne, le lot est accepté. Si elle est jugée suffisamment mauvaise, le lot n'est pas accepté. En 
revanche si la qualité du premier échantillon est jugée intermédiaire, un second échantillon est prélevé et 
inspecté dans le but d'accepter ou de refuser le lot. Les critères de décision du second stade sont basés sur 
les informations recueillies sur les deux échantillons. 


Exemple: 


Des bouteilles par lot de taille N=10'000 sont reçues par un client. La procédure de contrôle utilise le plan 
empirique par attributs suivants: on prélève un premier échantillon de taille #, = 125. Le critère 


d'acceptation À au premier stade est 4, = 0 et le critère de rejet Rest X, z 2. Si la qualité est non 
satisfaisante, nous prenons un deuxième échantillon de taille #, =125 avec un critère d'acceptation À au 
deuxième stade de #, <1 et le critère de rejet R est Æ, = 2. 


Nous reviendrons sur un exemple beaucoup plus détaillé de double échantillonage un peu plus loin!! 


Le "plan d'échantillonnage multiple par attributs" est simplement une généralisation du plan 
d'échantillonnage double par attributs en ayant D étapes de décision au lieu de 1 pour le plan simple ou 2 
pour le plan double. 


Revenons à nos développements mathématiques d'un plan d'échantillonnage simple par attributs. Si n est la 
taille du lot, p la taille de l'échantillon et m le nombre total de défectueux dans le lot alors la probabilité 
d'avoir k défectueux parmi p est (toujours avec la notation du coefficient binomal non-conforme à la 
norme ISO 31-11): 


Hd 
P(n,p.m,k) = EE (74400) 
F 


Afin d'être conforme à la tradition du domaine de l'échantillonnage, faisons un premier changement de 
notation. Notons n la taille de l'échantillon et N la taille du lot. Il vient alors: 
m2 Nm 
PIN, n,m,k) = Cr Cnk (74.401) 
CN 
n 


Faisons un deuxième changement de notation. Notons p la proportion de non-conformes dans le lot. Il 
vient alors la notation traditionnelle d'usage: 


CM CN-M 
P(N,n,p,k)= TE (74402) 


Ainsi, la probabilité cumulée d'acceptation d'un lot de qualité p est donnée par: 
4 Po 


& n—k 
i 
Ca 


(74.403) 


Ce] 


À À 
P,=P(X<A)= D P(Nn,p,X ==> 
k=0 k=0 


Page: 4527/4839 


[v3.0 - 2013] 


Exemple: 


Quelle est la probabilité cumulée de tirer 5 éléments non-conformes (critère d'acceptation) d'un lot de 
10'000 bouteilles (N) dont nous avons pris un prélèvement de 200 individus (n), dont la proportion de 
non-conformes est connue comme étant de 5% (p). Alors avec Microsoft Excel 14.0.6123 nous obtenons 
comme probabilité cumulée d'acceptation: 


5 C19"00 10000-10000 
_ < = = 
Pos P(X £ A) 2 10'000 (74.404) 
k—0 Con (/ 4.404) 


= HYPGEOMDIST(5:200,10000*5%; 10000:1)=6.05% 


Remarque: Une erreur (bêtise) classique dans les entreprises consiste à penser que le critère 
d'acceptation est proportionnel à la taille du lot. En d'autres termes que si pour 10'000 bouteilles, le fait 
de tester un échantillon de 200 pièces (2%) donne une probabilité cumulée d'acceptation de -6%, alors 
sur 1'000 bouteilles, un échantillons de 20 pièces (2%) donne la même probabilité cumulée 
d'acceptation. Au fait, avec Microsoft Excel 14.0.6123, nous avons alors non plus 6.05% mais alors 
99.7%... la différence est donc considérable!! 


Si nous rappelons (voir la partie concernant les plans d'échantillonnage par mesure) que & est donc le 
risque du fournisseur (probabilité cumulée que le client rejette à tort le lot de qualité dont la proportion de 
non-conformes est p,, ) et # le risque du client (probabilité cumulée d'accepter à tort un lot du fournisseur 
de qualité dont la proportion de non-conformes est 4) alors pour que le fournisseur et le client aient le 


plan d'échantillonnage qui correspondent aux exigences de chacun nous devons résoudre le système 
suivant: 


l-æ= ._ 
Ab N-Np (/4.405) 
A C°AC £ 
8=Y k Ti 
k=0 Ca 


À ma connaissance, il n'est pas possible de résoudre ce système analytiquement. Les techniques de 
recherche opérationnelle utilisant la méthode du simplexe, la méthode des gradients ou de Newton 
échouent lamentablement à trouver une solution à ce système (ce qui est normal). Par contre, avec les 
algorithmes évolutionnaires (outil disponible dans Microsoft Excel 14.0.6123) on peut trouver des 
solutions acceptables, mais les paramétrages ne sont pas aisés. 


Dès lors, en supposant que la taille des lots soumise à l'inspection est grande par rapport à la taille de 
l'échantillon, et en exploitant l'approximation binomiale de la loi hypergéométrique (approximation 
démontrée dans le chapitre de Statistiques), nous avons: 


À À À 
P,=P(X<A4)= S P(,p,X=k)= D Ctpt(1-pY = 5 CEpha" (74406) 
k=0 &=—0 &=0 


L'avantage de cette approximation est immense! La taille totale N du lot n'intervient plus dans le 
problème! 
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Exemple: 


E1. Quelle est la probabilité cumulée de tirer 5 éléments non-conformes (critère d'acceptation) d'un lot de 
10'000 bouteilles (N) dont nous avons pris un prélèvement de 200 individus (n), dont la proportion de 
non-conformes est connue comme étant de 5% (p). Alors avec la version anglaise de 

Microsoft Excel 14.0.6123 nous obtenons: 


A 5 
P=P(X<A = 9 Cphart = S 0200 05Ë0.95200# 
: ) » KP 4 2 ; (74.407) 


= BINOMDIST(5,200,5%; 16.23% 


E2. Cette dernière relation est aussi utilisée en ingénierie de la fiabilité. Effectivement, supposons que nous 
souhaitons savoir quel est le nombre d'éléments n que nous devons prendre pour faire un plan de 
démonstration de fiabilité montrant avec 90% de probabilité cumulée que le nombre de A défaillances 
(non-conformes) est nul sachant que leur fiabilité est de 80%. Alors cela revient à trouver n tel que nous 
soyons au plus proche de: 


A À û 
P,= P(X<O0)= S'Ctphgt = SCA (1 R)° RÉ 2S CA O.240.8"* 
rer rar 0 (74.408) 


= R* =0.8" =1-90% = 10% 


Donc la valeur la plus proche n pour cela est de prendre 11 éléments (c'est la valeur que retourne le logiciel 
de référence de la fiabilité qu'est Weibull++). On se retrouve alors avec: 


=BINOMDIST(0;11;20%;1)=8.59% 


Dans le cadre du domaine de la fiabilité est il d'usage d'appeler cette approche "plan de démonstration de 
test de la fiabilité binomial non-paramétrique"…. 


E3. Voyons encore un dernier exemple relatif à la fiabilité. Rappelons que nous avons démontré plus haut 
que pour la loi de Weïbull à un paramètre, nous avions: 


:Ÿ 
R0=mo[-(7 | (74.409) 
7 


Et supposons que des tests prédécents nous ont montré que à un temps t égal à 2'000 jours, nous avions 
une fiabilité de 80% et que nous savons que le paramètre de forme comme $ vaut 2. Nous souhaiterions 
savoir quelle taille d'échantillons nous devons prendre pour qu'un plan de test de la fiabilité de 1500 jours 
montre avec au plus 90% de probabilité cumulée au maximum une non-conformité (panne). Pour cela, 
nous allons d'abord déterminer le paramètre d'échelle: 


£ 
’ ’ 2'000 
7 (in (ROIS (-In({R(2'000))) k 
(74.410) 
Re 4 233.87 
(in (R(O.8)) 
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Il vient alors que pour ce même test à 1'500 jours, nous avions une fiabilité de: 


| 2 
Ri1'5001= a () ]e 0.882 (74.411) 


4233.87 


En injectant dans la loi binomiale, nous avons alors: 


A 1 
P=PIX<l= > pig" = 5 C*(1- 0.882)" 0.882"* =1-90% =10% (74.412) 


K=0 0 


Donc la valeur la plus proche n pour cela est de prendre 32éléments (c'est la valeur que retourne le logiciel 
de référence de la fiabilité qu'est Weibull++). On se retrouve alors avec: 


=BINOMDIST(1;32;1-88.2%;1)=10.50% 


Dans le cadre du domaine de la fiabilité est il d'usage d'appeler cette approche "plan de démonstration de 
test de la fiabilité binomial paramétrique"….. 


Remarque: Là aussi. une erreur (bêtise) classique dans les entreprises consiste à penser que le critère 
d'acceptation est proportionnel à la taille du lot. En d'autres termes que si pour 10'000 bouteilles, le fait 
de tester un échantillon de 200 pièces (2%) donne une probabilité cumulée d'acceptation de -6%, alors 
sur 1'000 bouteilles, un échantillon de 20 pièces (2%) donne la même probabilité cumulée 
d'acceptation. Au fait, avec Microsoft Excel 14.0.6123, nous avons non plus pas 6.23% mais alors 
99.7%... la différence est donc considérable!! 


Pour en revenir à la théorie... le système que nous avions alors avec la loi Hyperégométrique peut alors 
s'écrire: 


ei + Sn Ed 
las > Cra(l-px) = >CiPagx 

k=0 &=0 u : 
(74.413) 
—k 


À ñ 
B= > Cirsi-rs) 


A 
& _n-k 
= > CKPeae 
&=0 &=0 


Mais encore une fois, il n'est pas possible (à ma connaissance) de résoudre le système précédent 
analytiquement. En 1967, H. R. Larson a alors créé un abaque de la loi binomiale cumulative fréquemment 
désigné sous le terme de "nomographe binomial de Larson" (je n'en ai jamais trouvé ni vu un pour la loi 
hypergéométrique malheureusement...) qui permet de résoudre approximativement le problème de la 
détermination de la valeur de À et de n pour le plan d'échantillonnage: 
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O1 # S0.1 

02 NE P=PimS = E, ge PQ = pY 

03 : 10 % : P 

04 É 20 200 À, ge 10 

05 £ HAN &. À 
So6+ £ ‘ # 00 1e 005 
Ë 06 5 NU . n= 90 pe Ps 
P 70 £ 100 ( (l An … c=3 «05 5 
ä z dun? L” 10 £ 
8 15 140 {NL AH I LU? 10 2 ÿ 
ë | il RU | 30 À 
«| À) oi D, 
: LE \ | 3 5 
CR | | qu ti \ \ | w à 
E [ut AE Al + 
£ .30 il li [AA AA AL a ni 

35 il LL il it \\ 3 g 8 $ 

u | | Nt qi sé Fe 

46 LL \ \\ NL \x $ 999 

5040 


.50 140 1007 
Figure: 74.45 - Source: Montgomery, D. C. (1996), Introduction to Statistical Quality Control (3e ed.), Ed. Wiley 


Exemple: 


Un lot de bouteilles est livré sous forme de lots de 10'000 unités correspondant à N. Nous cherchons à 
mettre en place un plan de contrôle de la réception par attributs avec la probabilité cumulée (risque) æ de 
1% que le client rejette à tort le lot avec moins de 2.5% ( », ) de non-conformes. De son côté le client 


souhaite une probabilité cumulée (risque) $ de 10% d'accepter à tort un lot avec plus de 5% (4) de 
non-conformes (au fait les exigences sont indépendantes de la taille du N du lot). 


Le but est de déterminer donc la valeur de À et de n à l'aide du nomographe. Pour cela, comme indiqué sur 
le nomographe, il faut tracer deux droites: 


- Points de départs des deux droites: 0.99 (100%-1%) et 0.1 (10%) de l'axe de droite. 
- Points d'arrivée des deux droites: 0.025 (2.5%) et 0.05 (5%) de l'axe de gauche. 
et l'intersection des deux droites donnera les paramètres recherchés. Soit dans le cas présent: 


Az 30 


AR = 


(74.414) 


Nous voyons aussi que si nous injectons ces deux valeurs dans: 
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PT. nk k nr 
las > Cpkl-px) = >Cipaaa 
&=0 &=0 


= k nk k n-k 
BED Cirhli-pe) => Cirkg 
k=0 er 


avec Microsoft Excel, nous sommes en réalité loin du compte! Donc l'erreur du nomographe peut amener à 
donner l'impression de grossières approximations! Mais changez dans Microsoft Excel la valeur 30 par 27 
et la valeur 700 par 695 et vous verrez en réalité ce que vous pouvez en conclure... 


Nous voyons aussi via cet exemple qu'un plan d'échantillonnage par attribut est effectivement aussi 
beaucoup plus coûteux qu'un plan par mesurage (puisque nous avons repris le même exemple avec les 
mêmes paramètres que dans la partie des plans d'échantillonnage avec mesures). 


Le lecteur aura aussi remarqué que N n'influence pas sur la valeur de A et n lorsque nous utilisons le 
nomographe. Donc si nous utilisons des outils informatiques pour chercher la solution, nous avons pour 
contrainte que n sera compris entre 0 et 1'000 et À entre O et 150. 


Remarque: Enfin, indiquons que certains utilisent l'approximation Poissonienne de la loi binomiale 
(lorsque la probabilité de non-conformité est très faible que la taille du lot est très grande et même 
parfois quand ces critères sont loin d'être respectés.….). 


Revenons maintenant sur le double échantillonage en utilisant l'approximation binomiale qui était pour 
rappel: 


À À À 
P,=P(X<A)= S Pp,X=k)= D Ctpt(1-pY = 5 CRpha* (74416) 
k=0 &—0 &=0 


et considérons un plan à double échantillonage avec: 


et où la proportion de non-conformes est connue comme étant de 5%. Alors, dans ce cas la probabilité 
cumulée d'avoir par exemple au moins1 non-conforme au premier échantillonage et correspondant donc à 
la probabilité d'acceptation du lot est de: 


: | 
B=P(XASL=Y EE LOS (1-0.05) 20.279 (74418) 
fo l(50-k il 


Donc jusque là rien de spécial! Maintenant pour obtenir la probabiltié d'acceptation du second lot, nous 
devons lister toutes les manières dont le second échantillonage. Supposons pour l'exemple que le lot est 
accepté qu si et seulement si le nombre cumulé de non-conformes sur les deux échantillonages est compris 
entre 2 et 3 unités (choix arbitraire mais simplifié pour l'exemple). 
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Nous avons alors les combinaisons suivantes possibles de tirage entre les deux échantillonages: 
{0,2}{0,3},{1,1},{1,2},{3,0},{2,1},{2,0}. Mais comme nous acceptons le lot si le premier échantillonage 
donne un nombre de non-conformes inférieur ou égal à 1, il reste alors seulement les combinaisons 
suivantes {3,0},{2,1},{2,0}à considérer en double échantillonage. Donc il nous faut calculer les 
probabilités suivantes: 


P=P+#=0.279+[ PIX, =2,X, <1i+P(X, =3,X, = 0] 
= 0.279+[ PIX =2)PIX, <li+P(X =3)PIX, =0)] 


L 
Es 7 0.0520.95% 5° 0.05% 0.951%-k 
= NM 930 2148 60 k 1100 &, il (74.419) 
| 
40 0530 958 100! 5 5509 9500 
31471 011001! 


= 0.279 +[0.261: 0.037 +0.220. 0.0059] = 0.279+[0.0097 + 0.001] 
= 0.279+0.0107 = 0.2897 


4.2.1. CALCUL DES PARAMÈTRES PAR UTILISATION DE LA NORME ISO 2859-1 


La norme ISO 2859 (qui découle du standard MIL 105E) est consacrée aux règles d'échantillonnage pour 
les contrôles par attributs. Au même titre que la norme AFNOR X06-023 elle est basée le concept de 
NQA. (pourcentage d'individus non-conformes qui ne doit pas être dépassé pour qu'une production, 
contrôlée sur une série de lots, puisse être considérée comme satisfaisante). 


Selon cette norme, il faut que le NQA soit une des 26 valeurs recommandées par la norme. Nous 
choisirons pour niveau d'inspection le numéro II (ils sont décrits dans la norme). Par rapport à l'effectif 
choisi, comme pour la norme AFNOR, ISO 2589 donne un code (lettre) qui va être utilisée ensuite dans 
une table. Enfin, en fonction du type de plan (simple, double ou triple) on trouve les paramètres A et n. 


Exemples: 


E1. Dans le cadre de notre exemple - le producteur de boissons gazeuses - qui reçoit des lots de 10'000 
bouteilles, le niveau de qualité NQA est donc de 1%. Comme pour l'exemple avec la norme AFNOR, nous 
prendrons un contrôle de type Il basé sur un plan simple. 


Une table disponible dans la norme nous dit que nous devons utiliser le code L pour la prochaine étape. 
Ensuite, pour un contrôle simple, la norme nous dit d'utiliser la table ITA. 


Nous y lisons alors que n doit être égal à 200 et que A vaut 5. Nous constatons donc que la valeur obtenue 
est très différente de celle calculée théoriquement. Honnêtement la raison de cette différence m'est 
inconnue. 


E2. Les praticiens lors de l'utilisation de cette norme souhaitent souvent pouvoir calculer le risque 
fournisseur et client associé aux facteurs n et À donnés par la norme relativement au NQA. choisi pour un 
lot d'une qualité donnée. Alors comme dans le cas présent, 200/10'000 est plus petit que 10%, nous 
pouvons utiliser l'approximation binomiale de la loi hypergéométrique. Supposons que nous souhaitons 
donc calculer le risque fournisseur pour le de l'exemple précédent (celui avec l'utilisation du nomographe): 
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A St US 
las > Cra(1-pa) = 5 CE0 0.025% (1- 0.025) 
k=0 &=0 


200-% 
(74.420) 


= BINOMDIST(5,200,2.5%; 1-6 1.59% 
d'où un risque fournisseur de 100%-61.59% soit 38.40% ce qui est considérable. Ainsi, ce plan 


d'échantillonnage obtenu via les normes est adapté à des proportions de non-conformes de beaucoup 
inférieures à 2.5% (au fait inférieur à -1.25%). 


Pour le risque client, nous procédons de la même manière: 


: nk À 200-k 
B= D Cphli-pa) =2C20005%(1-0.05) _—_—. 

k=0 k=0 .421) 
= BINOMDIST(5,200; 5%; 1)=6.23% 


ce qui est par contre plus acceptable. Au fait nous constatons que la norme est plus adaptée aux critères du 
client que du fournisseur. 


Remarque: Le logiciel QuickControl Pro de la société Logystem SA par exemple gère l'échantillonage 
selon les normes ISO 2859 et 3951. 


4.2.2. COURBE D'EFFICACITÉ 


La courbe qui représente les probabilités d'acceptation d'un lot en fonction de la qualité effective 
(proportion de pièces défectueuses) du lot s'appelle "courbe d'efficacité du plan d'échantillonnage". 


Cette courbe s'obtient donc en traçant sur un graphique la probabilité cumulée d'acceptation du lot que 
nous notons sur ce type de graphique, en fonction de la proportion présumée de pièces non-conformes 
(que nous notons p) dans le lot. 


Exemple: Pour un contrôle de qualité par attributs, nous appliquons le plan de contrôle basé sur le 
prélèvement de 200 individus, le lot sera accepté si le nombre d'éléments défectueux est inférieur ou égal à 
5. Nous souhaitons tracer la probabilité d'accepter un lot où le pourcentage de défectueux est p, pour p 
variant de 0 à 7% par pas de 0.1%. 


Nous avons alors avec la version française de Microsoft Excel 14.0.6123 pour les premières lignes: 
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Ce qui donne graphiquement: 


=LOIBINOMIALE.N(5:80:A2:1}) 
=LOIBINOMIALE.N(5:200:4A3:1} 
=LOIBINOMIALE.N(5:200:A4:1} 
=LOIBINOMIALE.N(5:200:A5:1) 
=LOIBINOMIALE.N(5:200:A6:1) 
=LOIBINOMIALE.N(5:200:A7:1}) 
=LOIBINOMIALE.N(5:200:A8:1) 
=LOIBINOMIALE.N(5:200:A9:1) 
=LOIBINOMIALE.N(5:200:A10:1} 
=LOIBINOMIALE.N(5:200:A11:1} 
=LOIBINOMIALE.N(5:200:A12:1}) 
=LOIBINOMIALE.N(5:200:413:1} 
=LOIBINOMIALE.N(5:200:A14:1) 
=LOIBINOMIALE.N(5:200:415:1) 
=LOIBINOMIALE.N(5:200:A16:1}) 
=LOIBINOMIALE.N(5:200:A17:1} 
=LOIBINOMIALE.N(5:200:A18:1}) 
=LOIBINOMIALE.N(5:200:419:1) 
=LOIBINOMIALE.N(5:200:A20:1) 
=LOIBINOMIALE.N(5:200:A21:1} 
=LOIBINOMIALE.N(5:200:A22:1} 
=LOIBINOMIALE.N(5:200:A23:1) 
=LOIBINOMIALE.N(5:200:A24:1) 
=LOIBINOMIALE.N(5:200:425:1} 
=LOIBINOMIALE.N(5:200:A26:1) 
=LOIBINOMIALE.N(5:200:427:1) 
=LOIBINOMIALE.N(5:200:A28:1}) 
=LOIBINOMIALE.N(5:200:A29:1} 
=LOIBINOMIALE.N(5:200:A30:1} 
=LOIBINOMIALE.N(5:200:431:1) 
=LOIBINOMIALE.N(5:200:A32:1) 
=LOIBINOMIALE.N(5:200:433:1) 
=LOIBINOMIALE.N(5:200:A34:1) 
nue avec Microsoft Excel 14.0.6123 


COURBE D'EFFICACITÉ 


25 


EESEE 


à 


0% 


0.00% 100% 2.00% 300% 4.00% 5.00% 6.00% 


7.00% 


Figure: 74.47 - Graphique correspondant aux valeurs calculées dans Microsoft Excel 14.0.6123 


Une manière élégante de représenter une courbe d'efficacité est la suivante: 
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Probabilité d'accepter un lot défectueux 
(en %) 


Risque client 
(B = 10 %) 


3 4 5 6 7 Pourcentage de 
défectueux 


Bon lot Zone d'indifférence Mauvais lot 


Figure: 74.48 - Concept général d'une courbe d'efficacité (source: ISBN 978-2-297-01111-2) 


La courbe d'efficacité montre que la probabilité d'accepter un lot défectueux diminue lorsque le 
pourcentage de produits défectueux dans le lot augmente: lorsque la qualité est bonne, la probabilité 
d'accepter le lot est élevée ; lorsqu'elle est mauvaise, la probabilité d'accepter le lot est faible. La 
courbe se caractérise par différents points: 


- Au point À, le pourcentage de produits défectueux du lot est de 0 %, il y a 100 % de chances que le 
client accepte le lot. Le fournisseur ne court aucun risque 


- Au point B, le pourcentage de défectueux effectif est de 2 %. Ce pourcentage correspond au Niveau de 
qualité acceptable (NQA) défini d'un commun accord entre le client et le fournisseur. Mais, comme le 
contrôle est effectué à l'aide d'échantillons aléatoires, il se peut que le lot soit rejeté par le client. Le risque 
& pour le fournisseur est de 5 %. Réciproquement, il y a une probabilité de 95 % (1-& ) que le client 
accepte le lot. 


- Au point C, le pourcentage de défectueux effectif est de 7 % correspondant au Niveau de qualité limite 
(NQL). La probabilité d'acceptation d'un lot de ce niveau de qualité est égale au risque client &. Il y a 
exactement à ce point 10 % de chance d'accepter un lot mauvais, ce qui signifie que le client va conserver 
un nombre de défectueux supérieur à ce qu'il souhaîite. 


- Au point D, le pourcentage de produits défectueux effectif du lot est de 100 % ; il y a 0 % de chance 
d'accepter un tel lot. 


Ce type de courbe d'efficacité basé sur de gros lots échantillonés (dixit l'utilisation de la loi binomiale) est 
appelée dans le cas de l'utilisation de la loi binomiale: "courbe d'efficacité de type B" (CE-B). Si 
évidemment la taille de l'échantillon est significative par rapport à la taille du lot nous utiliserons la loi 
hypergéométrique et nous parlerons alors de: "courbe d'efficacité de type A" (CE-A). 
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5. CARTES DE CONTRÔLES (CC) DE LA QUALITÉ 


Une carte de contrôle (appelée aussi parfois "carte séquentielle") est une représentation empirique plane 
de la variation d'une mesure précise d'un processus ou d'un procédé où l'axe vertical représente l'indicateur 
quantitatif choisi et l'axe horizontal le temps (c'est donc une sous-famille des "run charts"). 


Cette méthode de contrôle qualité non destructive et dite "on-line" (car l'acquisition peut se faire en temps 
réel) permettant de mettre en évidence des causes spéciales de variations et d'optimiser les fréquences de 
réglages (étalonnage) aurait été créée par l'ingénieur physicien Walter A. Shewhart alors employé chez Bell 
Labs dans les années 1920 et s'est imposée en tant que standard international dès 1991 sous la norme 

ISO 8258. C'est d'ailleurs aussi Shewhart qui inspira le non moins connu W. Edwards Deming (statisticien) 
dans le domaine de la gestion de projets et de la qualité (tous les maîtres dans le domaine de la gestion de 
projets de pointe ont une formation scientifique.…). 


Remarque: Le sujet des cartes de contrôle est immensément vaste et il y a une littérature anglophone 
très abondante sur le sujet. Nous souhaitons ici ne donner que les fondamentaux (donc uniquement les 
cartes de base!) afin de montrer une application pratique des statistiques d'ordre et des statistiques des 
valeurs extrêmes développées en détail dans le chapitre de Statistiques. Pour placer un ordre de 
grandeur, la majorité des logiciels spécialisés proposent entre 20 et 30 cartes de contrôle différentes! 


En début d'utilisation de cartes de contrôle, il est conseillé de mettre des cartes sur toutes les 
caractéristiques mesurables importantes du produit. Les cartes obtenues révèlent en général rapidement 
quelles cartes sont nécessaires ou inutiles. Les cartes inutiles ou inadaptées seront retirées et d'autres cartes 
éventuellement ajoutées. 


| UCL=Upper Control Limit 


ui NL RIRE 


mn in) A LU AELE lait ii eL 


LCL=Lower Control Limit 


Mesures 


Temps 
Figure: 74.49 - Principe d'une carte de contrôle 
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Les limites peuvent être soit imposées/spécifiées par un client et dès lors nous les notons USL et LSL, sinon 
elles sont calculées en interne et dès lors nous les notons UCL (Upper Control Limit) et LCL (Lower 
Control Limit). Pour améliorer l'efficacité d'une carte de contrôle, nous ajoutons parfois sur la carte des 
limites plus étroites appelées "limites de surveillance" (dans la réalité nous représentons quasiment 
systématiquement les limites calculées ET imposées par la politique qualité sur la carte de contrôle). 


Remarque: Dans la pratique je recommande fortement de représenter à la fois CL, UCL, LCL et 
comme dans la réalité il y normalement toujours des limites et objectifs qui sont imposés 
contractuellement par le client, de représenter aussi la cible T'et UCL et LCL sur le même graphique 
quand cela est possible!!! 


La carte de contrôle est donc un outil de mesure permettant de visualiser la variation et donc de 
déterminer le moment où apparaît une cause assignable entraînant une dérive d'un processus ou procédé de 
fabrication/administratif ou encore une variation d'une valeur financière sur les marchés boursiers qui 
nécessite une action de correction rapide pour diminuer les coûts de non-qualité. Ainsi, dans l'idéal le 
processus sera arrêté ou corrigé au bon moment, c'est-à-dire avant qu'il ne produise trop de 
livrables/services non conformes (hors de l'intervalle de tolérance) et le surcontrôle (réajustement inutile 
pour cause de variabilité commune) sera évité. 


Le type de carte de contrôle correspond au type de caractéristique qui fait l'objet d'un contrôle. Toutefois 
l'aspect économique peut être un facteur important dans le choix de la carte de contrôle à mettre en 
oeuvre. Si nous nous intéressons qu'à vérifier si une pièce est conforme ou non à certaines normes, une 
carte par attribut (voir plus loin) sera utilisée, mais nécessitera néanmoins une taille d'échantillon élevée. 
Le contrôle de caractéristiques quantitatives nécessite l'emploi de cartes de contrôle par mesure. Ce type 
de contrôle est plus efficace et plus précis mais également plus dispendieux puisqu'il requiert l'emploi 
d'instruments de mesure qui doivent être vérifiés régulièrement. 


Avant de partir dans les détails mathématiques signalons que les cartes de contrôle parmi les plus utilisées 
sont les cartes de contrôle par mesure de la moyenne Z en association avec celle de l'étendue R ("range" 
en anglais) avec limites de Shewhart (quand nous parlons de "limites de Shewart", nous faisons 
implicitement référence au fait que la limite supérieure de contrôle calculée UCL et la limite inférieure de 
contrôle calculée LCL sont empiriquement à +34 de la moyenne que la distribution soit symétrique ou 
non!). Ces deux cartes sont établies et interprétées la majorité du temps ensemble car les deux paramètres 
sont indépendants et complémentaires et simples à comprendre (la majorité des employés dans les 
entreprises ne sachant pas ce qu'est un écart-type). La valeur moyenne peut varier sans que la dispersion 
ne varie et inversement. 
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Remarques: 


R1. Dans le cas d'une carte de contrôle avec limites de Shewhart, les limites de surveillance sont 
traditionnellement placées à +24 (à l'opposée des limites de contrôle qui sont donc placées à +34). 


R2. Dans le cas d'une distribution Normale, +34 correspond à un intervalle de confiance de 99.73% 
comme nous l'avons vu plus haut dans le présent chapitre et dans celui de Statistiques. Cela 
correspondant donc à un alpha d'environ: 


& = 100% — 99.73 = 0.27% 


La majeure partie de l'industrie prend donc +34 comme limites, mais en toute rigueur les distributions 
de certaines cartes ne sont pas symétriques. Il convient alors de prendre des bornes correspondant à 
une probabilité cumulée de æ/2 ce qui peut se calculer assez aisément avec de nombreuses 
distributions (mais pas toutes!) en ayant juste à disposition un tableur bon marché. Le choix de la 
valeur de & dépend de la politique qualité de l'entreprise et a l'avantage d'être un indicateur beaucoup 
plus précis que les limites de Shewhart (ces dernières étant erronées lorsque les distributions sont 
asymétriques). 


R3. Shewhart aurait proposé qu'il y ait au moins 25 prélèvements (échantillons) de 4 individus pour que 
la validité de certaines cartes de contrôle (que nous verrons plus loin) commence à être acceptable. 


R4. Comme nous le verrons, la quasi-totalité des cartes de contrôle aux mesures supposent une 
distribution Normale et que les observations sont indépendantes (entre sous-groupes et à l'intérieur des 
sous-groupes). 


Par exemple (exemple qui sera donc détaillé mathématiquement un peu plus bas), pour les procédés 
déjà stables car lancés depuis un bout de temps, nous effectuons plusieurs observations individuelles 
sur plusieurs sous-groupes numérotés à une fréquence de temps donnée (toutes les heures, trois fois par 
jour …). Sur chaque sous-groupe k chronologique, nous effectuons n observations. Nous reportons sur 
la carte de moyenne Z la moyenne du sous-groupe en fonction de son numéro chronologique qui sera 
reporté sur l'axe horizontal des cartes de contrôle . En raison du théorème de la limite centrale (TCL) 
démontré dans le chapitre de Statistiques, la moyenne des valeurs sur la carte de contrôle suit une loi 
Normale (donc symétrique!) que les observations des sous-groupes soient normalement distribuées ou 
non!!! Cette hypothèse est valable même pour des échantillons de petite taille et pour un processus de 
fabrication sous-contrôle, ce qui est fréquent en contrôle qualité. Une production sera dite stable, si la 
tendance et la dispersion sont statistiquement constantes dans le temps (variables identiquement 
distribuées et indépendantes). 


5.1. RÈGLES EMPIRIQUES DE LA WECO 


L'interprétation d'une carte de contrôle aussi puissante et élégante qu'elle soit mathématiquement n'est pas 
aisée et requière expérience et savoir faire pour savoir s'il faut procéder à une intervention corrective ou 
non. La Western Electric (WECO) aurait publié, en 1956, un ouvrage avec des règles empiriques simples 
permettent de prendre des décisions plus simplement (le ministère français de la santé a fait de même 50 
ans après. mais avec des règles qui diffèrent un peu). 
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La WECO s'est basée à l'époque sur l'hypothèse que les distributions statistiques sont toujours symétriques 
(même hypothèse que Shewhart) et a donc adopté dans l'énoncé des règles des limites de contrôle qui sont 
des multiples k entiers de l'écart-type. Évidemment, rien n'empêche le spécialiste de la qualité d'adapter 
ces règles avec des limites probabilistes correspondant à un intervalle de confiance (la majorité des 
logiciels spécialisés permettent de choisir les règles de la WECO à appliquer pour la détection 
automatiquement de non-conformités). 


Dans le cas des cartes de contrôle mesurées, parmi ces règles édictées voici celles qui sont applicables afin 
d'identifier si un processus ou procédé est défaillant et qui ont été complétées avec les années par d'autres 
spécialistes (nous avons représenté ci-dessous quelques cas de certaines règles dans une unique carte de 
contrôle pour des raisons pédagogiques évidentes): 


CC SHEWHART-WECO 


Figure: 74.50 - Carte de contrôle générique avec quelques points de la WECO 


W1. Un point de mesure est au-delà des USL, LSL spécifiés par le client ou au-delà des UCL, LCL 
probabilistes ou empiriques correspondant à +34. 


W2. Deux points consécutifs de mesure sont au-delà UCL, LCL probabilistes ou empiriques correspondant 
à +2. 


W3. Quatre points consécutifs de mesure sont au-delà UCL, LCL probabilistes ou empiriques 
correspondant à +14 (souvent appelés "limites d'alerte"). 


W4. Huit points successifs tombent d'un même côté de la moyenne (ce chiffre est empirique et sujet à 
débats...). 


W5. Six points consécutifs sont sur une tendance haussière ou respectivement baïissière. 
W6. Quatorze points consécutifs sont sur une alternance systématique de hausse/baisse. 


W7. Deux points consécutifs au-delà des UCL, LCL probabilistes ou empiriques correspondant à +24. 
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W8. Quatre points consécutifs hors des limites à +1 et du même côté de la ligne centrale. 


W9. Huit points consécutifs dans les limites de +147. 


Remarque: Un logiciel comme Minitab intègre par exemple 8 de ses règles pour mettre en évidence une 
anomalie. Pour plus d'informations, le lecteur pourra se reporter au e-book que j'ai écrit sur ce logiciel. 


Si le processus/procédé est hors de contrôle, des actions correctives sont donc mises en place. Les causes 
de variation peuvent être aléatoires ou déterministes. Si les causes sont seulement dues au hasard, elles 
sont alors appelées "causes aléatoires" (Shewhart) ou "causes communes" (Deming) et sont donc 
assimilées à la dispersion instantanée dont nous avons fait mention plus haut. Pas toutes les variations sont 
dues au hasard évidemment, certaines sont spécifiques et identifiables de manière déterministe et certaine. 
Dans ce dernier cas, les variations sont appelées "variations assignables" (Shewhart) ou "causes spéciales" 
(Deming) et sont assimilées à la dispersion globale (dont nous avons aussi déjà fait mention plus haut). 
Corriger les causes spéciales est évidemment bien plus simple que de corriger les causes aléatoires. 
L'objectif principal des cartes de contrôle est bien évidemment d'identifier les causes spéciales. 


Voilà en ce qui concerne les us et coutumes d'interprétation des points de mesure. Maintenant, ce prélude 
non mathématique effectué, voyons les différents types de cartes de contrôle (CC) courantes avec un 
exemple concret pour chacune. 


5.2. ÉCHANTILLONNAGE 


L'usage des cartes de contrôle pose au début deux difficultés majeures: 
- Le choix de la bonne carte de contrôle 
- Le choix du nombre d'échantillons et de prélèvements (fréquence de l'échantillonnage) 


Nous souhaiterions ici discuter du deuxième point. Il faut d'abord observer que c'est bien évidemment la 
cadence d'exécution et la qualité du fonctionnement qui va nous donner la réponse. Cette qualité est 
appréciée par la moyenne du nombre d'interventions de corrections observées pendant un laps déterminé 
dans le passé. Plus le nombre d'actions correctives a été grand, moins la qualité du fonctionnement du 
procédé/processus est bonne et plus il faudra faire de prélèvements. 


Le choix du nombre d'individus dans un prélèvement (échantillonnage) n'est lui pas un problème, car il 
découlera du calcul statistique de l'intervalle de confiance de l'indicateur statistique que l'on s'impose et 
des propriétés de loi de distribution ainsi que des hypothèses de construction de la carte de contrôle (voir 
plus loin dans le texte qui va suivre). 


La difficulté est donc de quantifier la fréquence de prélèvement. Il existe pour ce point deux méthodes 
empiriques principales: 


- Choisir une fréquence telle que les actions correctives sont au moins quatre fois plus faible que la 
fréquence de prélèvement (ce critère est donc indépendant du nombre d'individus par prélèvements donc 
parfois peu applicable). 
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- Nous considérons T comme étant la durée de vie du procédé/processus entre chaque 
changement/modification. Nous notons comme à l'habitude n le nombre d'individus par prélèvement 
(échantillons) nécessaires pour garantir de l'intervalle de confiance imposé de l'indicateur statistique (pour 
l'analyse de la dispersion instantanée). Nous notons N le nombre d'exécutions du procédé/processus 
pendant la période T. Nous avons donc au maximum N/n prélèvements possibles. Enfin, ce qui décidera du 
nombre de prélèvements, sera la précision de l'exigence de l'inférence statistique sur un indicateur 
statistique pour la dispersion globale. 


Dans la totalité des cartes de contrôle que nous allons présenter ci-dessous, nous avons présenté des 
exemples avec des prélèvements à taille constante (donc les limites des cartes de contrôle sont presque 
toujours constantes à quelques exceptions près). Effectivement, si la taille de ceux-ci vient à changer, c'est 
que le rythme de production (ou la taille des lots de livraison) a changé et donc les paramètres de 
fabrication aussi. Il conviendrait alors de recommencer une nouvelle carte! Il en est de même après une 


réingénierie du procédé/processus ou changements des paramètres du procédé/processus comme le montre 
par exemple l'image ci-dessous: 


Control Chart of Average Waït Time before and after a Redesign 


Average Waiting Time an Minutes [Daily Sample of Five) Redesgn mplemented 
D 
Upper Contral Limit = 78 Minutes + 
70 
60 À — : À 
‘ | f\ A [\ 
: 1 il /\ Average = [À | 
RES + NI | 42Mnues | \ 


12345678 9 101112 13 14 15 16 17 18 19 2021 22 23 24 25 26 27 28 2930 31 32 33 34 35 36 37 38 39 40 


Figure: 74,51 - Exemple de carte de contrôle avant et après mesure corrective 


5.3. CARTES DE CONTRÔLES QUALITATIVES (AUX ATTRIBUTS) 


Pour mesurer des variables qualitatives (% de défectueux, % de pannes, ….), nous nous servons de cartes 
aux attributs p (binomial), np ou c pour contrôler les attributs dans le temps. 


Les cartes de contrôle par attributs sont très simples d'utilisation et d'interprétation, mais ont plusieurs 
inconvénients comme la forte dissymétrie des répartitions, l'absence de limite inférieure pour les faibles 
tailles d'échantillons, la faible efficacité de détection des détériorations. 


5.3.1. CC-P 


La carte de contrôle de type p (proportion) est utilisée lorsqu'il s'agit de travailler avec des ratios, 
proportions ou pourcentages de conformité ou non-conformité d'échantillons d'un prélèvement. 


De bons exemples de carte de contrôle de type p sont: l'inspection des produits d'une ligne de production 
ou de la réception de lots d'un fournisseur ou encore contrôle du dysfonctionnement d'un certain nombre 


d'appareils, le respect de délais de livraison ou des spécifications de produits. 


Avantages: Très simple à construire car ne nécessite aucune connaissance statistique poussée pour être 


calculée. 
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Problèmes: En réalité c'est une carte dont les limites de contrôle peuvent être asymétriques si l'application 
pratique est à la limite de l'acceptable lorsque les hypothèses théoriques de construction ne sont pas 
respectées. Une difficulté parfois rencontrée par les utilisateurs de cette carte est de déterminer la taille du 
lot et du niveau d'acceptation (A) ou rejet (R) équivalant à l'USL en sa basant sur les développements (et 
normes) des plans d'échantillonnages disponibles un peu plus loin dans le présent chapitre. Enfin, une 
dernière difficulté est que certains employés maîtrisent mal le concept de pourcentages. 


La loi probabilité utilisée dans ce contexte est la loi binomiale (cf. chapitre de Statistiques) où p 
représentera la proportion en % de non-conformités et q (qui vaut donc 1-p) représentera la proportion en 
% d'éléments conformes. 


Nous avons vu dans le chapitre de Statistiques qu'il nous était possible d'écrire formellement, sous 
certaines hypothèses, uniquement l'intervalle de confiance suivant: 


a p-(1-$ : F2 1-$ 
D Zas POP E epyr PUR) (74.422) 
# # 


Donc nous pouvons alors calculer des probabilités de lots non-conformes par excès ou par défaut en 
utilisant le fait que p suit une loi Normale de paramètres: 


Nu, o) = xs C2) (74.423) 


> 
re 
a 

I 
> 


Bref, nous n'avons pas d'autres choix que de baser la carte de contrôle là-dessus. Dès lors, la première 
étape dans la création d'une carte de contrôle de type p est de calculer la proportion de non-conformité, du 
moins son estimateur, pour chaque lot i: 


k, 
.=—— (74.424) 
Pi W. 


où &, est le nombre d'éléments non-conformes et À le nombre total d'éléments du lot contrôlé i. 


La proportion moyenne d'éléments non-conformes, qui correspondra à la ligne centrale (CL) de la carte de 
contrôle sera donnée par: 
n 
2k 
= 


B=CL= : (74.425) 


2 


= 


et siles À; sont tous égaux, cela ce simplifie en: 


où n représente donc le nombre de lots contrôlés. Nous avons alors: 
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USL,, = imposé par client/direction 


(74.427) 


(74.428) 


Conformément à l'étude que nous ferons plus tard des plans d'échantillonnages, il ne peut pas y avoir de 
limite inférieure imposée par le client/direction (LSL) ni d'objectif (T) dans ce domaine d'application. 


Ainsi, avec le tableau suivant où la taille des lots (cas particulier!) est identique: 


Soit: 


H 


CL Sigæs LCL UCL USL 


L sû L 0.020 0042 0.028 
2 sû 2 0.040 0042 0.028 
3 50 5 0100 0042 0.028 
4 50 2 0040 0042 0.028 
5 so 2 0040 0042 0.028 
6 so 3 0.060 0042 0.028 
7 so 4 0.080 0042 0.028 
E] EL 3 0.060 0042 0.028 
3 so L 0.020 0042 0.028 

10 sû L 0.020 0042 0.028 
fi so è 0.040 0042 0.028 
12 50 1 0020 0042 0.028 
13 so 2 0.040 0042 0.028 
14 so L 0.020 0042 0.028 
15 so è 0.040 0042 0.028 
16 50 3 0.060 0042 0.028 
Li so 3 0.060 0042 0.028 
16 sû 1 0.020 0042 0.028 
13 so 8 0.040 0042 0.028 
20 50 Ô 0 0042 0.028 
21 so 3 0060 0042 0.028 
22 so è 0.040 0042 0.028 


20000000000000000000000 


0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 
0.127 


0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 
0.050 


Figure: 74.52 - Tableaux Microsoft Excel 14.0.6123 avec lots de taille identique et non-conformités 
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Proportion CL 


Figure: 


=SOMME(+C+2:$C423)SOMME($542:45423) 
=SOMME(+CH2:$C425)SOMME(#E$2:45423) 
=SOMME(+C#2:4C423)SOMME($E42:45423) 
=SOMME(+C42:$C423)SOMME($B42:48423) 
=SOMME(+C42:$C423)SOMME($B42:48423) 
=SOMME(SCH2:4CH23)SOMME($B42:45423) 
=SOMME($C#$2:4C$25) SOMME($6#2:45$23) 
=SOMME(+C+2:$C423)/SOMME($5$2:48423) 
=SOMME(+CH2:$C423)SOMME($B42:48423) 
=SOMME(+CH2:$C425)SOMME(#E$2:45423) 
=SOMME(+CH2:4C425)SOMME(SE$2:45423) 
=SOMME(+C42:$C423)SOMME($E42:48423) 
=SOMME(+C42:$C423)SOMME($B42:48423) 
=SOMME($C#H2:4C423)SOMME(SE42:45423) 
=SOMME($C#$2:4C$25) SOMME($B#2:45$23) 
=SOMME(SC+2:$C+23)SOMME($E42:48423) 
=SOMME(+CH2:$C423)SOMME($B42:48423) 
=SOMME(+CH2:$C423)SOMME(#E$2:45423) 
=SOMME(+CH2:4C423)SOMME(SE$2:45423) 
=SOMME(+CH2:$C423)SOMME($B42:48423) 
=SOMME(+CH2:$C423)SOMME($542:45423) 
=SOMME(+CH2:4C423)SOMME($E42:45423) 


Ce qui donne la carte de contrôle suivante: 


Sigma 
=RACINE(F2"(1-F2)'B2) 
=RACINE(F3"(1-F3)/83) 
=RACINE(F4"(1-F4)/54) 
=RACINE(FS"(1-FSBS) 
=RACINE(F6"(1-F6)/86) 
=RACINE(FT"(1-FT}67) 
=RACINE(FS"(1-F8)/88) 
=RACINE(F3"(1-F3)/B3) 
=RACINE(F10"(1-F10)/610) 
=RACINE(F H"(1-F11)/E11) 
=RACINE(F12"(1-F12)/512) 
=RACINE(F13"(1-F13)/813) 
=RACINE(F14"(1-F14)/814) 
=RACINE(F15"(1-F15)/15) 
=RACINE(F16"(1-F16)/516) 
=RACINE(F1T"(1-FITJEIT) 
2RACINE(F18"(1-F18)/615) 
=RACINE(F19"(1-F19)/819) 
=RACINE(F20"(1-F20)/520) 
=RACINE(F21"(1-F21)/821) 


LCL 
=SI((F2-3"G2)<0:0;F2-3"G2) 
=SI((F3-3"G3)<0:0:F3-3"G3) 
=SI((F4-3"G4)<0;0:;F4-3"G4) 
=SI((FS-3"GS)<0;0:FS-3"G5) 
=SI((F6-3"G6)<0:0;F6-3"G6) 
=SI((FT-3"GT)<0;0:FT-3" GT) 
=SI((FS-3"G8)<0:0:F8-3"G8] 
=SI((FS-3"G8)<0;0;F3-3"G9) 
=SI((F10-3"G10)<0:0:F 10-3610) 
=SI((FH-3"GH)<0:0:F11-3"G11) 
=SI((F12-3"G12)<0;0:;F12-3"G12) 
=SI((F13-3"G18)<0:0:F 13-3018) 
=SI((F14-3"G14)<0:0:F 14-3014) 
=SI((F15-3"G15)<0;0:F15-3"G15) 
=SI((F16-3"G16)<0:0;F16-3"G16) 
=SI((F1T-3"G17)<0:0;FIT-3" GT) 
=SI((F18-3"G18)<0:0:F18-3"G18) 
=SI((F19-3"G18)<0:0;F 19-3019) 
=SI((F20-3"G20)<0:0:F 20-3620) 
=SI((F21-3"G21)<0;0:F 21-3"G21) 


UCL 
=F2+3"G2 
=F3+3"G3 
=F4+3"G4 
=F5+3"G5 
=F6+3"G6 
=FT+3"GT 
=F6+3"GS 
=F3+3"G3 
=F10+3"G10 
=F11+3"G11 
=F12+3"G12 
=F13+3"G15 
=F14+3"G14 
=F15+3"G15 
=F16+3"G16 
=F1T+3"G1T 
=F18+3"G18 
=F13+3"G13 
=F20+5"G20 
=F21+3"G21 


=RACINE(F22"(1-F22)/B22) =SI((F22-3"G22)<0:0;F22-3"G22) =F22+3"G22 
=RACINE(F23"(-F25)/B23) =SI((F23-3"G23)<0:0;F23-3"G25) =F23+3"G23 


74.53 - Formules Microsoft Excel 14.0.6123 correspondantes au tableau précédent 


0.14 


0.10 


0.08 


0.06 


0.04 


0.00 


CARTE AUX ATTRIBUTS P INDIVIDUELLE 


us 


—LCL 


= UCL 


—— Proportion 


Figure: 74.54 - Carte de contrôle aux attributs p individuelle basée sur le tableau Microsoft Excel 14.0.6123 précédent 


où nous avons pris comme exemple les limites imposées par la clientèle/direction: 


USL, = 5.00% (74.429) 


Remarque: Cette carte de contrôle n'est donc pas adaptée aux tirages exhaustifs puisqu'il faudrait alors 
utiliser la loi hypergéométrique. Malheureusement, comme il n'existe pas de relation analytique pour 

l'intervalle de confiance de la proportion d'une loi hypergéométrique, il n'est pas possible (à ce jour... et 
à ma connaissance...) de construire une carte de contrôle de ce type. 
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La carte-p s'interprète comme une autre carte de Shewhart en utilisant les règles de la WECO. 


5.3.2. CC-NP 


La carte-np est similaire à la carte-p précédente, mais représente le nombre d'unités non-conformes plutôt 
que la proportion. Cette carte est plus simple à interpréter que la carte-p puisque pas tous les employés 
arrivent à se représenter le concept de pourcentage, mais par contre il est très difficile de comparer en 
toute objectivité deux points dont la taille des lots à l'origine n'est pas la même. 


Avantages: Très simple à construire car ne nécessite aucune connaissance statistique poussée pour être 
calculée. Pour certains employés dont le concept de pourcentage est mal maîtrisé, elle est plus simple à lire 
qu'une carte-np. 


Problèmes: Encore une fois c'est une carte dont les limites de contrôle peuvent être asymétriques si 
l'application pratique est à la limite de l'acceptable lorsque les hypothèses théoriques de construction ne 
sont pas respectées. Une difficulté parfois rencontrée par les utilisateurs de cette carte et de déterminer la 
taille du lot et du niveau d'acceptation (A) ou rejet (R) équivalant à l'USL en sa basant sur les 
développements (et normes) des plans d'échantillonnages disponibles un peu plus loin dans le présent 
chapitre. Il est aussi difficile avec cette carte de comparer en toute objectivité deux points dont la taille des 
lots à l'origine n'est pas la même. 


Nous avons alors en toute généralité: 


USL,, = imposé par chent/drection 


(74.430) 


Mais puisqu'il est très difficile (contrairement à la carte-p) de comparer en toute objectivité avec cette 
carte deux points lorsque la taille des n'est pas identique, certains spécialistes imposent — ou 
recommandent — que la taille des lots soit la même tel que: 


USL,, = imposé par chent/direction 
UCL,, = AB +3 P5(1-5) 
CL, = MP 


ÎCE, = 5-3, (1-5) 


Conformément à l'étude que nous ferons plus tard des plans d'échantillonnages, il ne peut pas y avoir de 
limite inférieure imposée par le client/direction (LSL) ni d'objectif (1) dans ce domaine d'application. 


Ainsi, avec le tableau suivant où la taille des lots (cas particulier!) est identique: 
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Soit: 


2SOMME(SCH2-40C123VSOMME($S12-48823) 210710 
=SOMME(SCH2-4C 125) SOMME(E12-18823) 28H71 
=SOMME(SCE2-4CI23)SOMMELSB12-18529) =B2 T2 
2ÉOMME(SCS2-SCI2INSOMMENSS 5218423) 2BIS'FES 
=SOMME(SCS2-1C 123) SOMME(S12-18523) :SU'FM 
=SOMME(SCH2-SCI23)SOMMEB42-18523) =BIS'FIS 
sSOMME(SCS2-4C523N SOMMES 5258523) 816" 
2SOMME(SCH24C123)SOMME(SB2-18523) 2BITF IT 
=SOMME(SCH2-HCI23)SOMME(SE12-18523) 2B1STSS 
=SOMME(SCI2-SCI2INSOMMENSBI238523) =BIS TES 


1415 


6.887 ; 


2.500 


1 Ô 
2 2.031 1.415 0 6.537 2500 
5 0.042 2.031 1.415 0 6.337 2500 
2 0.042 2.031 1.415 0 6.337 2500 
2 0.042 2.031 1.415 0 6.337 2.500 
5 0.042 2.031 1.415 0 6.537 2.500 
4 0.042 2.031 1.415 0 6.537 2500 
3 0.042 2051 1.415 0 6.337 2500 
1 0.042 2.031 1.415 0 6.337 2500 
1 0.042 2.031 1.415 0 6.337 2.500 
2 0.042 2.031 1.415 0 6.337 2500 
1 0.042 2.031 1.415 0 6.337 2500 
è 0.042 2.031 1.415 0 6.537 2.500 
L 0.042 2.031 1.415 0 6.537 2.500 
2 0.042 2.031 1.415 0 6.537 2500 
3 0.042 2031 1.415 0 6.537 2500 
3 0.042 2.031 1.415 0 6.337 2500 
1 0.042 2.031 1.415 0 6.337 2.500 
2 0.042 2.031 1.415 0 6.537 2500 
> 0.042 2.031 1.415 0 6.337 2500 
3 0.042 2.031 1.415 0 6.537 2500 
1.415 0 6.537 2.500 


DOTE ER 


À CG 


2RACINE(ESFS (MTS) 
2RACINE(BA"F4"(1-F4)) 
2RACINE(BS'FS"(-FS)) 
RACINES "FE (F6) 
2RACINE(BT"FT'(LFT)) 
=RACINE(BS"FS" (1-78) 
RACINEBS TS (ES) 
2RACINE(E10"F 10"(F 10) 
SRACINE(BM"F AN 11)) 
2RACINE(BIS"F 12" (F2) 
2RACINELETF IUT 13) 
:RACINE(B HF H"(-F14)) 
=RACINE(BIS FIST 15)) 
2RACINE(BIÉ"F IS (IF 16) 
2RACINE(EITF TI. 17) 
=RACINE(BIS"FIS"(1-F18)) 
2RACINE(BIS TES TES) 


SELMENES 


1 C2 VEINES) 


254(G3-3"H3)<0:01G3-3"HI) 
2$4(G4-3"H4)<0:0,G4-3"H4) 
2SK(G5-3"H5)<0.0:G5-3"H5) 

25 (06-3"H6)<0:0:06-3"H6) 
2$K(GT-3"H7)<0-0-GT-3"H7) 

25 (G8-S"H$}0:0:G8-3"H8) 
2$N(GS-3"HS}0:0,GS-3"HS) 
254 (G10-3"H10)0:0:G30-3"H10) 
=SA(GH-SHIIKOQGN-S'HN) 
sN(GR2-3"H12)0.0/G12-S'H12) 
25N(013-3"H19)00/0:/G13-3"H13) 
2SN(GU-3'HU)00,GH-SHH4) 
2$N(G15-3"M15}<00:G15-SH15) 
2SN(GI6-3"H16)<00G I -SHI6) 
2SK(G17-3"H17/00:0:G17-9" HIT) 
=H((GIS-3"H18)<0/0:GH8-3"HI8) 
sÉN(G19-3"M19)<0.0/G19-3"H19) 


663% 
2G17+3"HIT 
2G18+5"H16 
2619-3719 


Figure: 74.56 - Formules Microsoft Excel 14.0.6123 correspondantes au tableau précédent 


Ce qui donne la carte de contrôle suivante: 
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#515"0.05 


2SOMME(SCI2-4C123NSOMME(SE1248523) :520"F20 2RACINE{E20"F20"{1-F20)) 5N(G20-3"H20)60:0:G20-3°H20) 2G20-3"H20 2520"0.05 
2SOMME(SCH2-1C129NSOMME(S642-48423) -BTF21 <RACINE(BOTF2T (F2) 2SN(G21-3'H2100-G21-J'H21) =G2HSH2 =5210.05 
=SOMME(SCS2-SCI23)SOMME(SS12-1823) :822"722 <RACINE(B22F22 01-722) =84(G22-S'H22}0:0:G22-J'H22) =G223H22 =822"0.05 

sSOMMESCS2-SCI23MSOMMENSS1218523) 1829" F29 2RACINE(B23F290.F23)) 260(G29-3"H23)60:0:G29-3"H23) «G23-3"M23 #823"0.05 
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CARTE AUX ATTRIBUTS NP INDIVIDUELLE 


us 


LE] 


—UCL 


Figure: 74.57 - Carte de contrôle aux attributs np individuelle basée sur le tableau Microsoft Excel 14.0.6123 précédent 


où nous avons pris comme exemple les limites imposées par la clientèle/direction: 


USL,, = 3.00%.N=500%.50=25 (74432) 


Les mêmes remarques que pour la carte-p s'appliquent pour la carte-np. 


5.3.3. CC-C 


Dans le chapitre de Statistiques, nous avons démontré que lorsque la probabilité p est très faible et tend 
vers Zéro, mais que toutefois la valeur moyenne # : ? tend vers une valeur fixe si n tend vers l'infini, la loi 
binomiale de moyenne {= #2 avec k épreuves était alors donnée par une loi de Poisson: 


k 
P(X=k)= HA (74433) 
k 


avec: 


H= #4 
(74.434) 
Nr 


En pratique, certains remplacent la loi binomiale par une loi de Poisson dès que »# > 30 et #2 <5 ou 
lorsque # > 50 et » < 0.1... Dans la pratique je recommande personnellement l'usage de l'approximation 


lorsque # > 1000 et p <0.01. 


Soit 
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USZ, =imposé par chent/direction 


UCL, = y +34] | 
(74.435) 

CL, = {4 

LCL, = 4-34 

ce qui se note traditionnellement dans le domaine: 

USZ, =imposé par chent/direction 

UCE, =€+34e 
(74.436) 

CE, =E 

LCL, =E7- 3e 


où & est simplement la moyenne du comptage (c'est de ce mot que provient le "c" du nom de la carte) de 
non-conformités: 


Conformément à l'étude que nous ferons plus tard des plans d'échantillonnages, il ne peut pas y avoir de 
limite inférieure imposée par le client/direction (LSL) ni d'objectif (T) dans ce domaine d'application. 


Avantages: Très simple à construire car ne nécessite aucune connaissance statistique poussée pour être 
calculée. 


Problèmes: Encore une fois c'est une carte dont les limites de contrôle peuvent être asymétriques si 
l'application pratique est à la limite de l'acceptable lorsque les hypothèses théoriques de construction ne 
sont pas respectées. Une difficulté parfois rencontrée par les utilisateurs de cette carte et de déterminer la 
taille du lot et du niveau d'acceptation (A) ou rejet (R) équivalant à l'USL en sa basant sur les 
développements (et normes) des plans d'échantillonnages disponibles un peu plus loin dans le présent 
chapitre. Enfin, une dernière difficulté est que certains employés maîtrisent mal le concept de 
pourcentages. 


Ainsi, avec le tableau suivant où la taille des lots (cas particulier!) est identique (les non-conformes ne 
peuvent pas être exprimés en % de la taille du lot puisque la loi de Poisson est une loi discrète!): 
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Soit: 


Figure: 74.58 - 


Po € © No ns C9 C9 NO = NO se MO ms ma C0 Fe Co NO MO un No ns 


CL Sigsa LCL UCL USL 


1 2031 1446 Ô 
2 2031 1446 Ô 
5 2031 1446 Ô 
2 2031 1446 Ô 
2 2031 1446 û 
3 2031 1446 Ô 
4 2031 1446 Ô 
3 2031 1446 Ô 

1 2031 1446 Ô 

1 2031 1446 Ô 
2 2031 1446 ] 
1 2031 1446 Ô 
2 2031 1446 Ô 
1 2031 1.446 Ô 
2 2031 1446 Ô 
3 2031 1446 û 
3 2031 1446 Ô 
1 2031 1446 Ô 
2 2031 1446 ] 

2.031 1446 Ô 
3 2031 1446 Ô 
2 2031 1446 Ô 


6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 
6.423 


2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 
2.500 


Tableaux Microsoft Excel 14.0.6123 avec lots de taille identique et non-conformités 


+ 4 7 nn 


=MOYENNE(#542:$5423) 
=MOYENNE($E#2:+5425) 
=MOYENNE(#E+2:45425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#$2:$5425) 
=MOYENNE($E#42:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:#5425) 
=MOYENNE(#E#2:45425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE(#E42:$8$25) 
=MOYENNE($E#42:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:#5425) 
=MOYENNE(#E+2:45425) 
=MOYENNE($E$2:$5425) 
=MOYENNE($E#2:$5425) 
=MOYENNE($E#2:#5425) 


Sigma 
=RACINE(E2) 
=RACINE(E3) 
=RACINE(E4) 
=RACINE(ES) 
=RACINE(ES) 
=RACINE(ET) 
=RACINE(ES) 
=RACINE(ES) 
=RACINE(E10) 
=RACINE(E 1) 
=RACINE(E12) 
=RACINE(E13) 
=RACINE(E 14) 
=RACINE(E5) 
=RACINE(E16) 
=RACINE(ENT) 
=RACINE(E18) 
=RACINE(E13) 
=RACINE(E20) 
=RACINE(E21) 
=RACINE(E22) 
=RACINE(E23) 


Figure: 74.59 - Formules Microsoft Excel 14.0.6123 


Ce qui donne la carte de contrôle suivante: 


=SI((E2-3"F2)<0:0:E2-3"F2) 
=SI((E3-3"F3)<0:0:E3-3"F3) 
=SI((E4-3"F4)<0:0:E4-3"F4) 
=SI((ES-3"FSRO:0:ES-3"FS) 

=SI((E6-3"F6)<0:0:E6-3"F6) 
=SI((ET-3"FTI<O:0:ET-3"FT) 

=SI((ES-3"F8)<0:0:E8-3°F8) 
=SI((ES-3"F8)<0:0:E3-3°F 3) 


=SI((E10-3"F10)<0;0;E10-3°F10) 
=SI(EN-S'FAIOOEN-3"F A) 
=SI((E12-3"F12)<0:0;E12-3"F12) 
=SI((E1S-3"F18)<0:0:E 13-3713) 
=SI((E14-3"F14)<0:0:E14-3"F14) 
=SI(E1S-3"F15)<0;0:E15-3"F 15) 
=SI((ES-3"F16)<0;0;E16-3"F16) 
=SI(ENT-S FAT); 0:E1T-3"F AT) 
=SI((E1S-3"F18)<0:0;E18-3"F18) 
=SI((E19-3"F18)<0;0;E19-3"F19) 
=SI((E20-3"F20)<0:0:E20-3"F20) 
=SI((E21-3"F21)<0;0:E21-3"F 21) 
=SI((E22-3"F22)<0:0:E22-3"F22) 
=SI((E23-3"F23)<0:0:E23-3"F23) 


correspondantes au tableau précédent 


UCL 
<E2+3"F2 
2ES+3"FS 
2E4+3"F4 
2E5+3"FS5 
=E6+3"F6 
=ET+3"FT 
2ES+3"FS 
2E3+3"F3 
=E10+3"F10 
2E11+3"F11 
2E12+3"F12 
2E13+3"F15 
zEt4+3"F14 
2E15+3"F15 
2E16+5"F16 
2ENT+3"FIT 
2E18+3"F15 
2E19+3"F13 
=E20+3"F20 
2E21+3"F21 
2E22+3"F22 
2E23+3"F23 
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CARTE AUX ATTRIBUTS C INDIVIDUELLE 


Le 


—[CL ms UCL —— Non-Conformes 


Figure: 74.60 - Carte de contrôle aux attributs C individuelle basée sur le tableau Microsoft Excel 14.0.6123 précédent 
où nous avons pris comme exemple les limites imposées par la clientèle/direction: 
USE, = 2.5 (74.438) 


La carte-c s'interprète donc comme une autre carte de Shewhart en utilisant les règles de la WECO. 


Remarque: Cette carte s'applique très bien lorsque chaque point représente le nombre de 
non-conformités de matériel assemblé de nombreux composants (plus d'une dizaine de milliers 
souvent) dont la probabilité d'être défectueux est très faible. 


5.3.4, CC-U 


La carte-u est similaire à la carte c à la différence qu'elle a pour rôle de normaliser les données à l'unité 
afin d'avoir une carte-c basée sur une loi de Poisson avec des pourcentages. 


Pour cela, nous utilisons les mêmes hypothèses de travail que celles démontrées dans le chapitre de 
Statistiques concernant la loi de Poisson: 


Ce qui fait que la carte-c s'écrit alors: 


US, =imposé par chent/direction 


UC, = NP +3/N3 


: (74.440) 
CL, = Np 
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Si nous divisons la variable aléatoire k par la taille du lot (ou nombre de composants) nous avons alors de 
par la propriété de l'espérance et de la variance: 


USLZ, =imposé par chent/drection 


UCL, = p+3 
CL, =p 
LCL, =p-3 


ce qui se note traditionnellement: 


(74.441) 


USLZ, =imposé par chent/drection 


Avec donc: 


n 


2 


= 


2 


GC 


& 


= CE, 


(74.442) 


(74.443) 


Ainsi, avec le tableau suivant dans le cas particulier (mais courant) où tous les lots ont la même taille ou le 


même nombre de composants: 


z 
F 
= 
$ 
: 
=" 
se 


1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 
1000 


CC CO —s run 4e © 10 = 


Mon-Conformes 

10 0.010 
20 0.020 
so 0.050 
20 0.020 
20 0.020 
50 0.050 
40 0.040 
30 0.050 
10 0.010 
10 0.010 
20 0.020 
10 0.010 
20 0.020 
10 0.010 
20 0.020 
30 0.050 
350 0.050 
10 0.010 
20 0.020 

0 . 

50 0.050 
20 0.020 


CL Sigma LCL 
0.0203 0.0046 0.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 0.0072 
0.0203 0.0046 O0.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 O.0072 
0.0203 O0.0046 0.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 0.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 00072 
0.0203 0.0046 O.0072 
0.0203 O0.0046 O.0072 
0.0203 O0.0046 0.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 O0.0072 
0.0203 0.0046 O.0072 
0.0203 0.0046 O.0072 
0.0203 O.0046 00072 
0.0203 0.0046 O.0072 
0.0203 0.0046 O.0072 


UCL USL 
0.0546 0.010 
0.053546 0.010 
0.0346 0.010 
0.0346 0.010 
0.053546 0.010 
0.0546 0.010 
0.0346 0.010 
0.0346 0.010 
0.0546 0.010 
0.053546 0.010 
003546 0.010 
0.0346 0.010 
0.03546 0.010 
0.0546 0.010 
0.035346 0.010 
0.03546 0.010 
0.0546 0.010 
0.053546 0.010 
0.03546 0.010 
0.0546 0.010 
0.053546 0.010 
0.053546 0.010 


Figure: 74.61 - Tableaux Microsoft Excel 14.0.6123 avec lots de taille identique et non-conformités 


Soit: 
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=SOMME(+CH2:$C423)/SOMME($E42:45423) 
=SOMME(+CH2:$CH23)SOMME(SE$2:45423) 
=SOMME($CH2:$C423NSOMME(#B42:48423) 
=SOMME(+CH2:$C423)SOMME($B42:48423) 
=SOMME(+CH2:$CH23)SOMME($5$2:45423) 
=SOMME(SC#2:$C+23NSOMME($B42:#B423) 
=SOMME(+C#2:$C423)/SOMME($B42:45423) 
=SOMME(+C42:$CH23)SOMME($B$2:48423) 
=SOMME(+CH2:$C423)SOMME($B42:48423) 
=SOMME(+CH2:$C423)SOMME($E42:45423) 
=SOMME(+CH2:#C423)SOMME($E#2:45423) 
=SOMME(+CH2:$C423)/SOMME($E42:48423) 
=SOMME(+C42:$C423)SOMME($542:45423) 
=SOMME(SC#2:$C423)SOMME($B#2:$B423) 
=SOMME(+CH2:$C423)SOMME($E42:45423) 
=SOMME(+C42:$C423)SOMME($B42:48423) 
=SOMME(+CH2:$C423)SOMME($542:48423) 
=SOMME(SCH2:$CH23NSOMME($B42:$8423) 
=SOMME(+CH2:$C423)SOMME($E#2:45423) 
=SOMME(+C42:$C423)/SOMME($B42:48423) 
=SOMME(+C42:$C423)SOMME($B42:45423) 
=SOMME(+CH2:$C423)SOMME($542:45423) 


Ce qui donne la carte de contrôle suivante: 


Sigms 
=RACINE(F 2/82) 
=RACINE(F 3/83) 
=RACINE(F4/E4) 
=RACINE(FS/B5) 
=RACINE(F6/66) 
=RACINE(F 7/87) 
=RACINE(F 8/58) 
=RACINE(F 3/53) 
2RACINE(F10/510) 
=RACINE(F 11611) 
=RACINE(F 12/5412) 
2RACINE(F15/515) 
=RACINE(F 14/5814] 
=RACINE(F15/615) 
=RACINE(F16/816) 
=RACINE(F1T/E17) 
=RACINE(F18/518) 
=RACINE(F 13/6513) 
=RACINE(F20/520) 
=RACINE(F21/821) 
=RACINE(F22/622) 
=RACINE(F23/623) 


LCL 

=SI((F2-3"G2)<0:0;F 2-3"G2) 
=SI((F3-3"G3)<0:0;F 3-3"G3) 
=SI((F4-3"G4)<0:0:F 4-3" G4) 
=SI((FS-3"G5)<0;0;FS-3"G5) 
=SI((F6-3"G6]<0:0:F6-3"G6) 
=SI((F7-3"GT)<0:0:;FT-3"GT) 
=SI((FS-3"G8)<0:0:FS-3"G8) 
=SI((F3-3"G9)<0:0:F 9-3"G9) 
=S1((F10-3"G10)<0:0;F10-3"G10) 
=SI((FH-3"GH)<0:0;F 11-3611) 
=SI((F12-3"G12)<0:0;F12-3"G12) 
=S1((F13-3"G13)<0:0:;F13-3"G15) 
=SI((F14-3"G14)<0:0:F14-3"G14) 
=SI((F15-3"G15)<0:0:F15-3"G15) 
=SI((F16-3"G16)<0:0:F16-3"G16] 
=SI((F17-3"G1T)<0;0;FIT-3" GT) 
=SI((F18-3"G18)<0:0:F18-3"G18) 
=SI((F13-3"G19)<0:0;F19-3"G19) 
=SI((F20-3"G20)<0:0;F 20-3"G20) 
=SI((F21-3"G21)<0:0:F 21-3"G21) 
=SI((F22-3"G22)<0;0:F 22-3622) 
=SI((F23-3"G25)<0;0:F 23-3623) 


UCL 
=F2+5"G2 
=F3+3"G3 
2F4+3"G4 
=F5+3"G5 
=F6+5"G6 
=FT+5"GT 
=F8+3"GS 
=F3+3"G3 
=F10+3"G10 
=F+3"GN 
=F12+3"G12 
=F13+3"G15 
=F14+3"G14 
=F15+3"G15 
=F16+3"G16 
=F1T+3"G17 
=F18+3"G18 
=F19+3"G19 
=F20+5"G20 
=F21+3"G21 
=F22+35"G22 
=F25+3"G23 


Figure: 74.62 - Formules Microsoft Excel 14.0.6123 correspondantes au tableau précédent 


005 


0.04 


Le] 
eo 
Lrr] 


0.02 


CARTE AUX ATTRIBUTS U INDIVIDUELLE 


VA 


ZA 
WAVAVÆRUT 
\ 


15 16 17 18 19 


Figure: 74.63 - Carte de contrôle aux attributs U individuelle basée sur le tableau Microsoft Excel 14.0.6123 précédent 


où nous avons pris comme exemple les limites imposées par la clientèle/direction: 


USL = 2.5 


(74.444) 


La carte-c s'interprète comme une autre carte de Shewhart en utilisant les règles de la WECO. 


Remarque: Cette carte s'applique très bien lorsque chaque point représente le nombre de 
non-conformités de matériel assemblé de nombreux composants (plus d'une dizaine de milliers 
souvent) dont la probabilité d'être défectueux est très faible. 
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5.4, CARTES DE CONTRÔLES QUANTITATIVES (AUX MESURES) 


Les variables quantitatives sont donc des mesures continues de type poids, longueur, épaisseur, 
température, diamètre. 


Contrairement aux cartes de contrôle autocorrélées et aux cartes de contrôle qualitatives (aux attributs), 
les cartes de contrôle quantitatives (aux mesures) sont souvent - pour ne pas dire toujours - présentées par 
paire: 


- Une carte de contrôle représentant l'analyse/évolution de la tendance statistique centrale (souvent 
l'espérance, car il est relativement facile d'en construire un intervalle de confiance). 


- Une carte de contrôle représentant l'analyse/évolution de la dispersion via l'étendue ou l'écart-type. 


Les limites de contrôles sont souvent prises (faute de temps de réflexion dans les entreprises) comme des 
limites de Shewhart et non des limites probabilistes. 


5.4.1. CC A VALEURS INDIVIDUELLES AVEC LIMITES IMPOSÉES 


C'est la carte de contrôle la plus simple et la plus utilisée car ne nécessite aucune connaissance et 
hypothèse statistique particulière. Elle consiste uniquement à reporter les mesures effectuées et à apporter 
des actions correctives quand cela semble nécessaire. 


Avantages: Simple à construire car ne nécessite aucune connaissance ou hypothèse statistique particulière. 
Permet de vérifier de manière ponctuelle si une production satisfait les contraintes spécifiées par les 
clients. 


Problèmes: Elle peut représenter des déviations aléatoires temporaires qui pourront faire penser à tort à un 
problème du procédé/processus et amèneront à des actions correctives inutiles (fausses alarmes). Elle ne 
permet pas non plus d'identifier si le procédé/processus est sous contrôle statistique ou pas. 


Considérons par exemple le tableau suivant: 
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CE 3.3345 
3.3721 
3.3768 
10.0658 
10.0156 
3.3435 
3.3144 
4 3.3748 
140 10.0063 
LL 10.054 
1è 3.3436 
1 10.0074 
14 10.0063 
15 3.3836 
té 10.0317 
7 3.9756 
LE 3.3816 
14 10.0165 
zû 3.3857 
21 .  3.3876 
10.0657 

23 3.3564 
24 10.0611 
ès 3.3054 
26 3.3766 


+ un w 


10.0136 
3.3643 
10.0213 
10.08 
3.3731 
10.0057 
10.0521 
3.3362 
10.0743 
3.361 
10.0658 
3.3817 
10.0282 
10.063 
10.0485 
3.3174 
3.8362 
10.0043 
10.0503 
3.3841 
3.3838 
10.0154 
3.3443 
3.3043 
3.3354 


3.9732 
3.3426 
3.3407 
3.3514 
3.3443 
3.3715 
10.0561 
10.035363 
3.3371 
10.0063 
3.3617 
3.3753 
10.0385 
3.3524 
3.3653 
3.3076 
3.3614 
10.0023 
10.0581 
3.3436 
3.3636 
3.383 
3.3533 
3.387 
3.136 


10.0088 
3.3712 
10.0636 
3.3358 
3.3405 
10.0588 
10.0253 
10.15 
3.378 
10.035364 
10.0158 
10.0541 
3.3747 
3.3303 
10.0675 
3.3303 
3.3612 
3.9543 
3.381 
3.3754 
3.3773 
3.3333 
3.358353 
10.058 
3.3341 


3.3685 
10.0253 
10.0161 
10.0338 
3.3424 
10.0013 
10.0103 
3.3336 
3.3334 
3.3307 
3.3672 
3.3845 
10.035323 
3.3654 
10.0047 
10.015 
3.3634 
10.0133 
3.3605 
3.3552 
10.0423 
10.0146 
3.3347 
3.9156 
3.3162 


3.9544 
10.017 
10.0703 
10.0422 
3.3421 
3.3616 
3.3335 
3.3741 
3.3555 
3.3762 
3.3531 
3.107 
3.386 
10.0575 
10.0277 
3.3373 
3.3343 
3.3691 
3.3123 
10.0576 
10.0547 
10.0145 
10.0033 
3.3752 
10.0721 


101500  10.0000 


101000  3.5000 
101000  3.3000 
101000  3.3000 
101000  3.5000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.5000 
101000  3.5000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000 3.3000 
101000  3.5000 
101000  3.3000 
101000  3.3000 
101000 3.5000 
101000  3.3000 
101000  3.3000 
101000 3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.5000 
101000  3.3000 
101000 3.3000 
101000  3.3000 
101000  3.5000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.5000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.3000 
101000  3.5000 
101000 3.5000 
101000 3.3000 
101000  3.3000 


Figure: 74.64 - Tableaux Microsoft Excel 14.0.6123 avec mesures individuelles 


où nous avons pris en ce qui concerne les limites (nous supposerons qu'elles imposent un écart-type de 


0.10): 


USL =10+3o = 10+3.0.03 =10.10 


T=10 


LS£ =10- 3e =10-3.0.03 = 9.90 


Cela qui nous donne la carte de contrôle suivante: 


(74.445) 
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CC MESURÉE DE SHEWHART AVEC LIMITES IMPOSÉES 


10.15 


10.10 1 


L ml JUL Lallh ul IA 
| NT MR TT 


390 


Figure: 74.65 - Carte de contrôle mesurée de Shewhart avec limites imposées 


Bien que cette carte soit la plus utilisée dans la pratique (car les ingénieurs ont des directives de qualité 
avec des tolérances bien précises à respecter), son problème reste cependant qu'elle ne nous indique pas 
vraiment si le procédé ou processus semble se stabiliser dans le temps (d'ailleurs ce n'est pas son rôle!) et si 
le contrôle statistique est dans les limites du client (elle nous montre seulement les statistiques ponctuelles 
ce qui est peu robuste!). Nous allons partiellement y remédier avec la prochaine carte. 


5.4.2. CC À VALEURS INDIVIDUELLES AVEC MOYENNE ET ÉCART-TYPE COURT TERME 


Lorsque nous commençons les premières observations (mesures) le procédé ou processus est rarement 
stable et il est hors de question de s'amuser à faire des quantités de pièces d'essais juste pour faire une carte 
de contrôle de la moyenne dans ces conditions. 


Avantage: Met en évidence l'évolution dans le temps des indicateurs de statistiques de positions et de 
dispersion et permet d'observer la stabilisation du procédé/processus pendant la phase de prototypage 
(souvent nommée "Phase I" dans la littérature spécialisée). 


Problèmes: Ils sont les mêmes que pour la carte de contrôle précédente. Il faut y rajouter le fait que nous 
supposons les données identiquement distribuées et indépendantes selon une loi de probabilité symétrique, 
ce qui n'était pas le cas précédemment. 


Nous restons donc avec une carte de contrôle mesurée à laquelle nous ajoutons la moyenne arithmétique et 
l'écart-type ponctuels recalculés à chaque nouvel élément. En d'autres termes, comme nous n'avons aussi 
pas assez d'échantillons pour connaître la loi de probabilité et qu'il est hors de question de faire des déchets 
pour cela et de former les gens pendant des semaines aux statistiques, nous rajoutons à la carte de contrôle 
précédente les indicateurs de limite de contrôle de Shewhart fixes suivants: 
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USZL = imposé par client/direction 
UE = X+30y 
CL. = = X 
Les | ae d | (74.446) 
T = objectif imposé par client/drection 
LClyn = À -30y 


LST = imposé par chient/direction 


où CL signifie "Center Line" et avec l'estimateur de l'espérance et l'estimateur non biaisé de l'écart-type 
(définitions générales de la moyenne et de l'écart-type vues dans le chapitre de Statistiques): 


(74.447) 


sans y associer aucun intervalle de confiance (puisque nous n'avons justement pas assez d'échantillons ou 
que nous ne souhaitons pas demander aux employés de passer du temps à déterminer la loi de probabilité 
suivie). D'où le terme de "carte de contrôle avec moyenne et écart-type de la moyenne ponctuelle". Cette 
terminologie permet d'insister sur le fait que les indicateurs seront indiqués, mais sans en connaître l'erreur 
par manque d'échantillons ou simplement parce qu'il est irréaliste de demander aux employés concernés 
d'identifier la loi de probabilité y relative et de faire le calcul d'intervalle de confiance correspondant. 


Remarquons que nous pouvons alors calculer des probabilités de pièces non-conformes par excès ou par 
défaut en utilisant le fait que X suit une loi Normale de paramètres: 


Na, oc?) & N(X,of) (74.448) 


Ainsi, en reprenant le tableau suivant ayant 150 (k) mesures: 
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Soit: 


4 
5 
LM 
7 


10.020 3.373 10.003 
3.964 39343 3.371 
10021 3.341 10.070 

10080 3351 3.336 
3373 3345 3.340 

10.006 3.372 10.033 

10.052 10.036 10.025 
3.336 10037 10.150 
10.075 3357 3.378 
3.362 10.006 10.056 

10.064 3362 10.014 
3.382 3.375 10.054 

10.028 10.033 3.975 

10.065 3382 3.391 

10.043 3366 10.065 

3.317 3308 3.331 
3.636 93361 93.361 

10.004 10.003 3.955 

10.050 10.038 3.381 
3.384 3950 9.375 
3.364 3964 3.378 
10.015 3.383 10.000 
3344 33930 3.383 

3.305 3.387 10.058 
3.335 3920 3.334 


© nn D DR nr 
Doro Nou sin n À À NS w œ nm un men 


M Mess T 


10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 


CL 
3.3343 
10.0070 
3.3357 
3.3330 
9.9329 
3.3865 
3.3644 
3.3513 
3.3775 
3.3763 
3.3514 
3.3644 
3.35840 
3.3566 
3.3536 
3.3863 
3.3305 
3.3350 
3.3387 
10.0028 
10.0003 
10.0001 
10.006 
10.0033 
10.003537 
10.0028 
10.0006 
3.3385 
3.3365 
3.3347 
3.3333 
3.3336 
3.3350 
3.334535 
3.3345 
3.3356 
3.33915 
3.3326 
3.3337 
3.3345 
3.3343 
3.3348 
3.3344 
3.3344 
3.3353 
3.3387 


33343 101000 3.3000 
33630 101000  3.3000 
3.3388 101000 3.3000 
33468 101000  3.3000 
33336 101000 3.3000 
33173 101000  3.3000 
33157 101000 3.3000 
33172 101000 33000 
33062 101000 3.3000 
33030 101000 3.3000 
33040 101000  3.3000 
3.3045 101000 33000 
33070 101000 3.3000 
33071 101000 3.3000 
368334 101000  3.3000 
36862 101000 3.3000 
36831 101000 33000 
368820 101000 3.3000 
3.8153 101000 3.3000 
3.6745 101000 3.3000 
36103 101000 33000 
36137 101000 33000 
3.6162 101000 3.3000 
3.8161 101000 3.3000 
36803 101000 33000 
3.8815 101000 33000 
3.817172 101000 33000 
3.6127 101000 33000 
36632 101000 33000 
36662 101000 33000 
38645 101000 3.3000 
36668 101000  3.3000 
3.6675 101000 3.3000 
36686 101000 3.3000 
3.817106 101000 3.3000 
38103 101000 3.3000 
3.686533 101000 3.3000 
36651 101000 33000 
36662 101000 33000 
366177 101000 3.3000 
36635 101000 3.3000 
3.6103 101000 3.3000 
3.8716 101000 3.3000 
38130 101000 3.3000 
38133 101000 3.3000 
36608 101000 3.3000 


Figure: 74.66 - Tableaux Microsoft Excel 14.0.6123 avec mesures individuelles 
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” Mesures T CL 


[ 
La 
CE 1 3.3345 10 =MOYENNE(+J$2: J2) 
2 10.0136 10 =MOYENNE($J$2:J5) 
CMS 3.317352 10 =MOYENNE($J$2:J4) 
CI 4 10.0058 10 =MOYENNE($J$2:J5) 
CR 5 3.3685 10 =MOYENNE($J$2:J6) 
IG 33544 10 =MOYENNE($J$2:J7) 
& 3.3721 10 =MOYENNE($J$2:J5) 
CIS 33643 10 =MOYENNE($J42:J3) 
LM 3 33426 10 =MOYENNE($J42:110) 
3.3712 10 =MOYENNE($J$2:/11) 
10.053 10 =MOYENNE($J$2:112) 
10.017T 10 =MOYENNE($J$2:13) 
33788 10 =MOYENNE(#J#2:/14) 
10.0213 10 =MOYENNE($J$2:J15) 
3.3407 10 =MOYENNE($J$2:116) 
10.0636 10 =MOYENNE($J$2:117) 
10.0161 10 =MOYENNE($J42:18) 
10.0703 10 =MOYENNE($J42:113) 
10.0658 10 =MOYENNE($J$2:J20) 
10.05 10 =MOYENNE($J$2:J21) 
3.9514 10 =MOYENNE($J$2:J22) 
3.3355 10 =MOYENNE($J$2:J23) 
10.053538 10 =MOYENNE($J$2:J24) 
10.0422 10 =MOYENNE($J$2:J25) 
10.0136 10 =MOYENNE($J/42:J26) 
98781 10 =MOYENNE(HJ2:J27) 
3.3443 10 =MOYENNE($J$2:J25) 
3.3405 10 =MOYENNE($J$2:J23) 
3.3424 10 =MOYENNE($J$2:J50] 
3.3421 10 =MOYENNE($J$2:151) 
3.3435 10 =MOYENNE($J$2:J32) 
10.0057 10 =MOYENNE($J$2:153) 
3.3715 10 =MOYENNE($J42:J34) 
10.0558 10 =MOYENNE($J$2:J55) 
10.0013 10 =MOYENNE($J42:/36) 
3.3616 10 =MOYENNE($J$2:J37) 
3.9144 10 =MOYENNE($J$2:J58] 
10.053521 10 =MOYENNE($J$2:153) 
10.0361 10 =MOYENNE($J$2:J40) 
10.0253 10 =MOYENNE($J$2:J41) 
10.0103 10 =MOYENNE($J$2:J42) 
3.3335 10 =MOYENNE($J$2:J43) 
3.3745 10 =MOYENNE($J$2:J44) 
3.3362 10 =MOYENNE($J$2:J45) 
10.053563 10 =MOYENNE($J$2:)46) 
10.15 10 =-MOYENNE($J$2:J47) 
3.3336 10 =MOYENNE($J$2:J48) 


Diéires 74.67 - Formules Microsoft Excel 14.0.6123 correspondantes au tableau précédent 


Nous avons alors la carte de contrôle suivante: 


=L2+3"ECARTYPEP(+J$2:J2) 
=L3+3"ECARTYPEP(4J$2:/3) 
=L4+3"ECARTYPEP(4J$2:J4) 
=L5+3"ECART YPEP(#/$2:J5) 
=L6+3"ECARTYPEP(4J$2:J6) 
=LT+3"ECART YPEP(#J42:J7] 
=L8+3"ECARTYPEP(4J$2:J8) 
=L3+3"ECARTYPEP(4J$2:J5) 
=L10+3"ECARTYPEP(4J$2:M10) 
=LH+3"ECART YPEP($J#2:11] 
=L12+3"ECARTYPEP(#J42:/12) 
=L13+3"ECARTYPEP(#/$2:/13) 
=L14+3"ECARTYPEP(HJ$2:J14) 
=L1S+3"EC ART YPEP($J#2:J15) 
=L16+3"ECARTYPEP(#J42:/16) 
=LIT+3"EC ART YPEP(#J#2:J17) 
=L18+3"ECARTYPEP(HJ$2:M18) 
=L19+3"ECARTYPEP(#J#2:/18) 
=L20+3"ECARTYPEP(4J$2:J20) 
=L21+3"ECARTYPEP(#/$2:J21) 
=L22+5"ECARTYPEP(4J$2:J22) 
=L23+3"ECART YPEP(#J$2:/25) 
=L24+3"ECARTYPEP(+J$2:J24) 
=L25+3"ECARTYPEP(#J42:-J25) 
=L26+3"ECARTYPEP(4J$2:J26) 
=L27+3"ECARTYPEP(#J42-J27) 
=L28+3"ECARTYPEP(4J$2:J28) 
=L28+3"ECART YPEP(4J$2:J29) 
=L30+3"ECART YPEP(4J$2:J30) 
=L31+3"ECARTYPEP(#/$2:/31) 
=L32+3"ECARTYPEP(#J$2-/32) 
=L33+3"ECARTYPEP(4J$2:133) 
=L34+3"ECARTYPEP(4J$2:J34) 
=L35+3"ECARTYPEP(#J42-J35) 
=L36+3"ECARTYPEP(4J$2:J36) 
=L3T+3"ECARTYPEP(#J$2-/37) 
=L38+3"ECART YPEP(4J$2:J38) 
=L38+3"ECARTYPEP(4J$2:J33) 
=L40+3"ECARTYPEP(4J$2:J40) 
=L41+3"ECARTYPEP(#J$2:J41) 
=L42+3"ECARTYPEP(+J$2:J42) 
=L43+3"ECART YPEP(4J$2:J43) 
=L44+3"ECARTYPEP(4J$2:J44) 
=L45+3"ECART YPEP(#/$2:J45) 
=L46+3"ECART YPEP(4J$2:J46) 
=L47+3"ECARTYPEP(#J42-J47) 
=L48+3"ECARTYPEP(4J$2:J48) 


LCL 
=L2-3"ECARTYPEP(#J#2:J2) 
=L3-3"ECARTYPEP(#J42-J3) 
=L4-3"ECARTYPEP(4J#2:J4) 
=L5-3"ECARTYPEP(4J$2:J5) 
=L6-3"ECART YPEP(#J#2:J6) 
=LT-3"ECARTYPEP(#J$2:J7) 
=L8-3"ECART YPEP(#J#2:J8) 
=L3-3"ECARTYPEP(4J#2:J3) 
=L10-3"ECARTYPEP(+J#2:/10) 
=LH-S"ECARTYPEP($U#2:/11) 
=L12-3"ECARTYPEP(#J$2:12) 
=L15-3"ECARTYPEP($J$2:13) 
=L14-3"ECARTYPEP(#J$2:14) 
=L15-3"ECARTYPEP($U$2:J15) 
=116-3"ECARTYPEP(#J#2:/16) 
=L1T-S'ECARTYPEP(HJ#2:J17) 
=L18-3"ECARTYPEP(4J$2:J18) 
=L19-3"ECARTYPEP(#J$2:13) 
=L20-3"ECARTYPEP(#J$2:/20) 
=L21-3"ECARTYPEP(4J#2:J21) 
=L22-3"ECART YPEP(#J$2:J22) 
=L23-3"ECARTYPEP(4J$2:J25) 
=L24-3"ECARTYPEP(4J$2:J24) 
=L25-3"ECARTYPEP(4J#2:J25) 
=L26-3"ECARTYPEP(#J$2:J26) 
=L27-3"ECARTYPEP($J$2-J27) 
=L28-3"ECARTYPEP(4J$2:/28) 
=L23-3"ECARTYPEP($J$2:/23) 
=L30-3"ECARTYPEP(#J$2:/30) 
=L51-3"ECARTYPEP(4J#2:/31) 
=L32-3"ECARTYPEP(#J$2:J32) 
=L33-3"ECARTYPEP(4J$2:/33) 
=L34-3"ECARTYPEP(4J#2:/54) 
=L35-3"ECARTYPEP(4J#2:/35) 
=L36-3"ECART YPEP(4J42./36) 
=L37-3"ECARTYPEP(4J$2:J37) 
=L38-3"ECARTYPEP(4J$2:/38) 
=L33-3"ECARTYPEP(#J$2:/33) 
=L40-3"ECARTYPEP(#J$2:J40) 
=L41-3"ECARTYPEP(4J#2:J41) 
=L42-3"ECARTYPEP($J$2:J42) 
=L43-3"ECARTYPEP(4J#2:J43) 
=L44-3"ECARTYPEP(4J$2:J44) 
=L45-3"ECARTYPEP(#J$2:J45) 
=L46-3"ECARTYPEP(4J$2:J46) 
=L47-S"ECARTYPEP($J#2:J47) 
=L48-3"ECARTYPEP(4J42:J48) 
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CC MESURÉE DE SHEWHART AVEC MOYENNE ET ECART-TYPE COURT-TERME 


10.15 


10.1 


9.35 


33 


9.85 


Figure: 74.68 - Carte de contrôle mesurée de Shewhart avec moyenne et écart-type court-terme 


où nous avons pris en ce qui concerne les limites imposées (nous supposerons qu'elles imposent un 
écart-type de 0.10): 


USE =10+3o = 10+3.0.03 =10.10 
T=10 (74.449) 
LSE =10- 3e =10-3.0.03 = 9.90 


Nous voyons par exemple avec la carte de contrôle ci-dessus que la mesure CL (donc l'estimateur de la 
moyenne) se stabilise proche de la cible T entre le début et la fin. Il en va de même pour UCL et LCL (car 
l'estimateur de l'écart-type se stabilise) par contre selon l'usage en ingénierie les résultats ne sont pas bons 
puisque l'UCL et LCL sont au-delà des spécifications imposées par le client! À remarquer que cette carte 
de contrôle aurait selon les règles de la WECO un unique point au-delà des +347 (nous indiquons cela pour 
des raisons de comparaison avec les prochaines cartes). 


Remarque: Sur toutes les cartes sans aucune exception, les spécifications du client doivent être 
indiquées en plus des limites calculées! 


À ce niveau, nous imaginerons que nous restons dans l'incapacité de déterminer la loi de probabilité des 
données (problème d'échantillons ou de compétences) et donc in extenso tout aussi incapables de calculer 
des intervalles de confiance pour la moyenne ou l'écart-type! 


La prochaine carte de contrôle est censée y remédier. 
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5.4.3, CC AVEC MOYENNES BASÉES SUR L'ERREUR-STANDARD 


Une fois le processus ou procédé stabilisé, nous considérons que la moyenne et l'écart-type se stabilisent et 
que même si la loi de probabilité que suit un groupe de k échantillons n'est pas identique d'un jour à l'autre, 
de par le théorème central limite, l'ensemble des moyennes suit elle une loi Normale. Dès lors il peut être 
plus intéressant de représenter la variation des moyennes dans le temps et non plus simplement les mesures 
simples. 


Avantages: Masque (lisse) les variations aléatoires non systématiques et permet donc souvent d'éviter des 
actions correctives non nécessaires (fausses alertes). 


Problèmes: Cette carte de contrôle suppose que les prélèvements sont identiquement distribués de par les 
hypothèses de base de sa construction mathématique. De plus, dans le cadre des limites fixes de Shewhart, 
la loi de distribution est supposée symétrique. Le plus gros problème de cette carte est aussi que le nombre 
d'individus par échantillon doit être suffisamment grand pour que l'estimateur sans biais de l'écart-type ne 
soit pas trop éloigné de la réalité, ce qui fait qu'on ne la trouve pas dans les logiciels (problème qui fait que, 
souvent, elle est remplacée par une autre carte que nous verrons un peu plus loin et qu). 


Nous considérons alors le tableau suivant de 25 prélèvements (que nous identifierons dans le cas présent 
par la variable K) de 6 individus chacun (que nous identifierons par la variable n) prises d'une production 
continue (sans arrêt machine!): 


Ech.1 Ech.2 Ech. 3 Ech. 4 Ech.5 Ech.6 

33343 100136 33732 100088 33685  9.3544 
3.9721 39643 33426 33712 100253  10.0177 
33768 100213  3.3407 100636 10.0161  10.0703 
10.0658 10.05 3.3514 393358 100335 10.0422 
10.0136 33791 393443 33403  3.3424 3.3421 
33435  10.0057 3.375 100358  10.0013 3.3616 
3.3144 100321 100361 100253 100103  3.3335 
3.3748 33362 100363 10145  3.3336 3.3741 
10.0063  10.0743 3.3371 3378  3.3334 3.3555 
10.054 33613 100063 100364 33907  3.3762 
33436  10.0658 3.3617 100158 33672 3.3531 
10.0074 3.3817 3.3753 100541 3.3845 3.3107 
10.0063 100252  10.0355 3.3747 10.0523 3.386 
3.3836 10.063 39824 33903 933684 10.057175 
10.0317 100485 39653 100675 100047 10.0277 
3.9756 33174 393076  3.3303 10.015  3.3973 
393815 35962 3.3614 3.3612 39634 33343 
10.0168 100043 100023 393543  10.0133 3.3631 
3.938517 100503  10.0381 3381 33603 3.9123 
3.3878 33541  3.3436 3.9754 39532 100576 
100657 393838  3.9636 3.3773 100423  10.0547 
33564  10.0154 3383 33333 100146  10.0145 
100611 33443 93833 9393833 393347 100033 
33054  3.3043 3.387 10.058 39156  3.3782 
33768  3.9354 3.136 3.3541 33162  10.0721 


Figure: 74.69 - Mesures journalières sans arrêt de la machine 


où chaque jour, nous prenons que 6 individus de l'ensemble des éléments à notre disposition. Sur la carte 
de contrôle, nous représenterons alors chaque point comme étant la moyenne de ces 6 individus. 


Nous avons démontré dans le chapitre de Statistique que l'écart-type de la moyenne (erreur-type) d'une 
série de n variables aléatoires indépendantes et identiquement distribuées était: 


T 
g-=—2 (74.450) 
À 
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Nous avons alors les indicateurs de limite de contrôle de Shewhart suivants (évidemment comme nous 
utilisons les estimateurs de la moyenne et de l'écart-type, plus le nombre de prélèvements et d'individus est 
grand, plus les limites sont asymptotiquement précises): 


LSL = imposé par chent/direction 


Up = À +30, = R+3 
x 
Clips = E(X)= X 


T = objectif imposé par client/drection 


(74.451) 
IC Pme RP SL 


NA 


LST = imposé par chient/direction 


Avec: 


1 # 
—) À; (74.452) 
7 


ñn 1 & n | & el 
2. X..|=— 74.453) 
CHE UE COR 


Remarquons que nous pouvons alors calculer des probabilités de sous-groupes non-conformes par excès 
ou par défaut en utilisant le fait que Z suit une loi Normale de paramètres: 


N(u,o)s= Nx ä (74.454) 


Nous obtenons alors le tableau suivant: 
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Soit: 


j 33333 100476 933330  10.04082483 3353175171 10 
33823 3939333 100476 39330  10.04082483 3.359175171 10 
33333 100476 933330 10.04082483 3353175171 10 

dl 33333 100476 393330  10.04082483 3353175171 10 
33604 3939333 100476 393330  10.04082483 3359175171 10 
33862 3939333 100476 393330  10.04082483 3.353175171 10 
33333 100476 933330 10.04082483 3.353175171 10 

33333 100476 33330 10.04082483 3.353175171 10 

33333 100476 933330  10.04082483 3353175171 10 

e 33333 100476 33330  10.04082483 3359175171 10 
33543 393933 100476 393330  10.04082483 3353175171 10 
33856 33933 100476 393330  10.04052453 3353175171 10 
10.011 33333 100476 9393330 1004082483 3353175171 10 
33333 100476 93330  10.04082483 3353175171 10 

fl 33333 100476 9333930  10.04082483 3353175171 10 
33673 339333 100476 393330  10.04052453 3.353175171 10 
33508 33333 100476 393330  10.04052453 3.353175171 10 
393347 33333 100476 33330 1004082483 3359175171 10 
338650 39933 100476 393330 1004082483 3353175171 10 
33546 393933 100476 39330  10.04082483 3.353175171 10 
10.0147 33333 100476 39330  10.04082483 3359175171 10 
33388 993333 100476 9393330 1004082483 3353175171 10 
33361 933333 100476 933330 1004082483 3359175171 10 
3.3582 33933 100476 39330  10.04052453 3.353175171 10 
33630 33333 100476 3935330  10.04082483 3.353175171 10 


K 
=MOYENNE($E5:$G5) 


1 Moyenne mesures: 
è Ecart-Type: <ECARTYPE($5$5:4G$29) 
CN N° Moyenne Mesurez CL T UCL LCL 
C1 =MOYENNE($B5:$G5)  =MOYENNE($5#$5:$G$23) 10 =K5+3"$K$2/RACINE(NEVAL(B5:G5)) =K5-3"$K$2/RACINE(NEYAL(B5:G5)) 
C2 -MOYENNE($66:$G6) -MOYENNE($5$5:$G$23) 10 =K6+3"#K$2/RACINE(NEYAL(B6:G6))] =K6-3"$K$2/RACINE(NEY AL(B6:G6)) 
LS =MOYENNE($SET:$GT)  =MOYENNE($5$5:$G$29) 10 =KT+5"$K$2/RACINE(NEVAL(BT:GT)] =KT-5"$K$2/RACINE(NEYA4L(B7:G7)) 
4 -MOYENNE(S55:$GS) =MOYENNE($5#5:$G$23) 10 =K5+3"#K$2/RACINE(NEVAL(BS:G8)] =K5-3"#$K$2/RACINE(NEYAL(B5:G5)) 
C5 -MOYENNE($53:$G3) =MOYENNE($5$5:$G$29) 10 =K3+3"$K$2/RACINE(NEVAL(53:G3)) =K3-3"$K$2/RACINE(NEY4L(B3:G3)) 
LI 6 =MOYENNE($510:$G10) =MOYENME($B$5:4G$23) 10 =K10+3"$K$2/RACINE(NBVAL(B10:G10))  =K10-5"$K$2/RACINE(NEV AL(B10:G10)) 
LIT =MOYENNE(SEIT$SGN) =MOYENNE($5$5:$G$29) 10 =K11+S"SKSQ/RACINE(NBVAL(BIEGN))  =KN-S'SKSS/RACINE(NEV AL(BN:G1)) 
LMI 5 =MOYENNE($B12:$G12] =MOYENNE($5$5:$G$23) 10 =K12+3"$K$2/RACINE(NBVAL(B12:G12))  =K12-5"$K$2/RACINE(NEV AL(B12:G12)) 
5 -MOYENNE(SE13:$G15) =MOYENNE($5#5:$G$23) 10 =K13+3"#K$2/RACINE(NEVAL(B13:G13))  =K13-3"$K$2/RACINE(NBY AL(B13:G15)) 
LI 10 -MOYENNE($E14:$G14) =MOYENNE($E$5:$G$29) 10 =K14+3"$K$2/RACINE(NBVAL(B14:G14))  =K14-3"$K$2/RACINE(NEY AL(B14:G14)) 
LAN 11 =MOYENNE(SE15$G15) =MOYENNE($6#45:$G$23) 10 =K15+5"$K$2/RACINE(NEVAL(B15:G15))  =K15-S"$K$2/RACINE(NEV AL(515:G15)) 
Lu 12 =MOYENNE($516:$G16) =MOYENNE($545:$G$29) 10 =K16+5"$K$2/RACINE(NEVAL(B16:G16))  =K16-3"$K$2/RACINE(NEV AL(E16:G16)] 
LUN 15 -MOYENNE(SE1T:$G17) =MOYENNE(S5#5:$G$23) 10 =K17+3"#K$2/RACINE(NEVAL(BI7:G17))  =K17-3"$K$2/RACINE(NBY AL(B1T:G1T)) 
LAN 14 =MOYENNE($518:$G18) =MOYENNE($5#5:$G$23) 10 =K18+3"#K$2/RACINE(NBVAL(B18:G18))  =K18-3"$K$2/RACINE(NEY AL(518:G18)) 
LUN 15 =MOYENNE($513:$G13) =MOYENNE($5$5:$G$23) 10 =K13+3"$K$2/RACINE(NBVAL(B13:G19))  =K13-3"$K$2/RACINE(NEV AL(B13:G19)) 
CN 16 =MOYENNE($620:$G20) =MOYENNE($5#$5:$G$29) 10 =K20+5"$K$2/RACINE(NEVAL(B20:G20)] =K20-3"$K$2/RACINE(NEY 4L(620:G20)) 
GI 17 =MOYENNE(SB21:$G21) =MOYENNE($5#$5:$G$29) 10 =K21+5"$K$2/RACINE(NEVAL(B21:G21))  =K21-S"$KF2/RACINE(NEV AL(B21:G21)) 
CO 15 =MOYENNE($522:$G22) =MOYENNE($5$5:$G$29) 10 =K22+3"$K$2/RACINE(NBVAL(B22:G22)) =K22-3"$K$2/RACINE(NEVAL(522:G22)) 
13 =MOYENNE($625:$G23) =MOYENNE($E45:$G$29) 10 =K23+3"$K$2/RACINE(NEVAL(B25:G23)] =K23-3"$K$2/RACINE(NBYAL(B23:G23)) 
20 =MOYENNE($E24:$G24) =MOYENNE($545:$G$29) 10 =K24+5"$K$2/RACINE(NEYAL(B24:G24)] =K24-5"$K$2/RACINE(NEYAL(B24:G24)) 
21 =MOYENNE($625:$G25) =MOYENNE($545:$G$29) 10 =K25+3"$K$2/RACINE(NBYAL(B25:G25)] =K25-3"$K$2/RACINE(NEY4L(B25:G25)) 
22 =MOYENNE($626:5G26) =MOYENNE(#5$5:$G#29) 10 =K26+5"$K$2/RACINE(NEYAL(B26:G26)) =K26-3"#K$2/RACINE(NEY4L(B26:G26)) 
23 =MOYENNE($B27:4G27) =MOYENNE($6$5:$G$23) 10 =K27+3"$K$2/RACINE(NEBVAL(B27:G27)) =K27-3"$K$2/RACINE(NEYAL(B27:G27)) 
CN 24 =MOYENNE($625:$G25) =MOYENNE($5$5:$G$29) 10 =K25+5"$K$2/RACINE(NEVAL(B28:G28)] =K25-3"$K$2/RACINE(NEV 4L(B28:G28)) 
CM 25 =MOYENNE($623:$G23) =MOYENNE($5$5:$G$29) 10 =K23+5"$K$2/RACINE(NEVAL(B23:G29)] =K29-3"$K$2/RACINE(NEV 4L(B23:G29)) 


Figure: 74.71 - Formules Microsoft Excel 14.0.6123 correspondantes au tableau précédent 


Nous avons alors la carte de contrôle suivante: 
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CC AUX MOYENNES AYEC LIMITES FIXES (SHEYHART) BASÉES SUR L'ERREUR- 
STANDARD 


10.06 


10.04 


10.02 à : 1 


3.34 


3.32 


Figure: 74.72 - Carte de contrôle X barre/barre - ER 


où nous avons pris en ce qui concerne les limites imposées: 


USZ = 10+3. 0.03 40 040 

V6 
T=I10 (74.455) 
LSL = 10-3. 0.03. 9.959 


5 


À remarquer que cette carte de contrôle aurait selon les règles de la WECO six points au-delà des +3 
(nous indiquons cela pour des raisons de comparaison avec la carte précédente et les prochaines cartes). Il 
s'agit donc d'une carte plus sensible aux variations que la précédente. Il faut remarquer aussi que les limites 
UCL et LCL sont plus larges que les USL et LSL imposées. 


Avec des limites de +3a- et selon l'hypothèse de données normalement distribuées, nous avons en 


utilisant la symétrie de la loi Normale et en notant comme à l'habitude & la fonction de probabilité 
cumulée de la loi Normale centrée réduite: 


1- P(LCL, < R<UCL)=2P(LCLy < À =2{1- P(XZ< UCLy )] 
l (74.456) 
= 2D(-3)=2(1- 29) = 2:0.01350 = 000272 — 


Donc nous aurons statistiquement 1 point (pièce/action) sur le graphique sur 370 en dehors des +34; par 


unité de temps de mesure (donc si chaque point sur la carte est fait par fréquence de 1 heure nous avons 
alors une ARL de 0.0027/heure) uniquement pour des raisons statistiques et qui seront donc de fausses 
alarmes. 
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Nous appelons ce dernier chiffre l'ARL pour "Average Run Length" (certains utilisent l'appellation 
française P.O.M. pour "Période Opérationnelle Moyenne"). Lorsqu'il est rapporté à une unité de temps 
particulière, nous parlons alors de ATS pour "Average Time to Signal", Évidemment, par extension, l'ajout 
des règles empiriques de la WECO ajoutent des fausses alarmes et cela a pour effet négatif immédiat de 
diminuer l'ARL. 


L'ARL est aussi importante dans la pratique, car elle donne la taille d'intervalle de pièces au-delà de 
laquelle il ne faut pas aller pour échantillonner une production! On fera en sorte dans la pratique (quand 
cela est possible) de prendre une valeur inférieure proche de l'ARL. pour de grandes productions mais si 
possible pas au-delà! 


Dans la pratique, la valuer de 0.0027 que nous avosn obtenu ci-dessus, est appelée "l'erreur de type [" de 
la carte de contrôle (fausse alarme). Évidemment il y aussi les erreurs de type II (absence d'alarme alors 
qu'il devrait y en avoir une). Mais comme je n'ai jamais vu qui que ce soit utiliser cela dans la pratique. 


Remarque: Comme nous l'avons déjà mentionné, parfois plusieurs niveaux de contrôles sont ajoutés sur 
les cartes, ainsi nous pouvons observer du +34. et en même temps du +24. Aux US. le facteur 2 ou 
3 serait majoritairement utilisé que la distribution soit symétrique ou non... alors que dans les pays 
européens, nous utilisons des limites probabilistes qui ont une bien meilleure fiabilité lorsque les 
données ne sont pas distribuées selon des fonctions symétriques (comme c'est le cas pour les cartes 
bien connues utilisant l'étendue R que nous verrons plus tard). 


Rappelons que le problème de cette carte est que «7 est asymptotiquement correcte que si x, est grand. 


Alors que dans la réalité ce n'est de loin pas le cas puisque souvent cette valeur est inférieure à 10. Dès lors 
nous verrons plus loin une carte de la moyenne dont les limites fixes sont calculées sur la base de l'étendue 
R et non pas de «ÿ. Cependant, dans le chapitre de Statistiques, nous avons démontré que lorsque 
l'écart-type est estimé, nous avons alors: 

= + =. 
rs -DSUS A += TT) (74457) 
ñ# 


HF 


Nous pouvons donc utiliser la carte de Shewhart aux limites probabilistes suivante: 


USZL = imposé par client/direction 


= D 5 
Up, = À +38 = À +20 Le 
Clim = ED = À . 


T = objectif imposé par client/direction 
= = Sy 

LCL, = À-38 = À-Tpofin -D— 
Xp &i2 Je 


LSL = imposé par chient/direction 


Enfin, remarquons que rien ne nous empêche de faire de l'inférence statistique sur la moyenne en utilisant 
la relation démontrée dans le chapitre de Statistiques: 
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= = g 
Fr TR SHSÈLT (74.459) 
À 


en sachant que dans le domaine du contrôle qualité il est fortement souhaitable que pour un & donné 
(généralement de l'ordre de 5%), la valeur zéro soit comprise dans l'intervalle: 


. de = œ 
LE-Zon SR +2, % | (74.460) 
A 


he 


ce qui est assimilé alors à un test d'hypothèse avec À, : 4 = 0. 


5.4.4, CC AVEC ÉCARTS-TYPES (S BARRE -S) 


Toujours dans le cadre d'un processus ou procédé sous contrôle, il peut être intéressant en plus de 
communiquer la carte de contrôle des moyennes (avec limites fixes) précédemment présentée une carte 
représentant les volatilités dans le temps en considérant à nouveau une distribution Normale des variables 
aléatoires. Effectivement, rappelons que la loi Normale est totalement définie par ses paramètres #{, €. 
D'où la raison d'avoir un oeil sur ses deux là! 


Avantages: Complète très bien la carte de contrôle précédente et permet de visualiser si la volatilité du 
procédé se stabilise. Représente bien la variation à l'intérieur même des données de chaque prélèvement 
(dispersion instantanée) que nous pourrons détecter. 


Problèmes: Cette carte de contrôle est utilisée seulement lorsque la phase de prototypage est terminée 
(souvent nommée "Phase Il" dans la littérature spécialisée) car elle est basée sur une hypothèse forte 
incontournable qui est que les données sont normalement distribuées. De plus, les limites de contrôles de 
Shewhart sont peu adaptées dans le cas présent, car comme nous allons le démontrer en détails, la loi de 
distribution de la variance n'est pas une loi symétrique alors que Shewhart suppose que c'est le cas. 


L'idée est de représenter: 


UCL = 5 + 3T; 
CL = ÆS)=S (74461) 
LCL = S -30; 


toujours avec l'estimateur de l'espérance (k étant le nombre de prélèvements pour rappel...): 
> .1* 

S = — 
2 


et toujours avec l'estimateur de maximum de vraisemblance non biaisé de l'écart-type noté S dans le 
domaine de la qualité (à l'opposée de & dans le domaine des Statistiques pures): 


où n correspond donc bien évidemment au nombre d'individus par prélèvement (échantillon). 
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Pour calculer l'espérance et la variance «r, il faut considérer S comme une variable aléatoire distribuée 


normalement (c'est l'hypothèse forte en incontournable de cette carte de contrôle dont nous avions fait 
mention dans les problèmes!). Nous avons alors démontré dans le chapitre de Statistiques que nous avions: 


(n-1)5? 


rin-D= (74.464) 


que nous noterons par la suite t comme étant la variable aléatoire correspondante. Pour la suite, nous 
allons considérer {#—1) et & comme de simples coefficients constants de S. Donc la variable aléatoire t 


sera en réalité fonction implicite de S tel que: 
—1 
CD ge (465) 


Nous nous intéressons maintenant au calcul de l'espérance de S. Il est alors plus convenable de prendre la 
racine carrée de t tel que: 


= vale (74.466) 
œ 
Il vient alors: 


E(S) = 45 = at) = ZE) = To (74.467) 


#1 


Rappelons que nous avons vu dans le chapitre de Statistiques que la loi du Khi-deux était définie par la 
fonction de densité de probabilité suivante: 


B(x = ES KI2-1 -x/2, lei (74.468) 
Il vient alors: 
+o 2 +12 
E(S)= = [ JE à (74.469) 
#=15 — _ 


Posons pour la suite: 
n—-1l=Xx (74470) 


Nous avons alors: 
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ke 5) 2 +e 
Ole went LS 
3 Br(à) 2r(à) K © 
2 2 
… +<o 1 # +o &-l 
= — [2 2e2qt = — [:2e7%4 
ee 
&+1 & +1 
21 | — T'| — 
___# dé | 2 ]. V2 | 2 | 
7 E E k p ps (74.471) 
a Li 
Arf) Ge) 2 () JE r(à) 
&+1 # 
LT — I — 
_È | = ] V2 0) 
FE A) 
2 2 
r(;) 
VE 2 
: n—] 


Nous avons donc: 


r(?) 
E(S)=S = 04 = 0. - : 


ns (74.472) 
TE) 
2 


Pour terminer sur ce point, il faut savoir qu'il est de tradition de noter &, de la manière suivante: 


ca(%)= 


et que nous en trouvons des valeurs dans les tables alors que c'est inutile si nous possédons un tableur 
comme la version anglophone de Microsoft Excel 14.0.6123 en écrivant la formule suivante (#, serait écrit 
dans la cellule Al): 


=SQRT(2/(A1-1))*EXP(GAMMALN(A1/2)/EXP(GAMMALN((A1-1}/2)) 
ou dans Calc de OpenOffice (la formule y étant plus simple): 


=RACINE(2/(A1-1))}*“GAMMA(A1/2/GAMMA((A1-1)/2) 
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Calculons maintenant la variance de S en utilisant la relation de Huyghens démontrée dans le chapitre de 
Statistiques: 


v(s)= E(S?)-E(S) =E(S°)-c@)e? (74474) 


et nous avons: 


| 
Ho ,35 112 + — 
s(s)- fr x CE [ #2 et/24 
k& à La £ La k£ a 
ar) 22r(À )e 
2 2 
: (74.475) 
Le À 
+ [#24 = Cu 22 2 
& & 0 LS k 1 & 
227 2e 22 r(2)e Lt 
2 2 2 


Il vient alors: 
PS) = E(s?) E(S) = «2 -cl(x)e? = 0° (1- «4 6x) (74.476) 


et: 


Ts =0. h 2 (4) (74477 


Nous avons alors: 
USZ = imposé par client/direction 
UCLs = 5 +305 = 5+30f1-c2(x%) 
CL = E(S) = 5 = TC 
T = objectif imposé par client/direction 


LCLs=F5-30 =S- 3 fi — c£ (x) 


LSL = imposé par chent/direction 


(74.478) 


soit au final: 


USZ = imposé par client/direction 


ù vidé (a) = F5 


Ca V& 


UCLs = 5+3 


CLs=S 


T = objectif imposé par chent/drection 


(74.479) 


LCL, = CR 1-c(n) = 5-  — 
10) A) 


LSL = imposé par chent/direction 
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ce qui est plus traditionnellement condensé sous la forme: 


USZ = imposé par client/direction 


UCL, = S[1+2 
À 


CL, =5 


T = objectif imposé par client/direction 


LCLs = &| 1- 


3 


= F.B,(n) 


= K£ B3 (%;) 


LST = imposé par chient/direction 


(74.480) 


Les coefficients £,,8:,24 (tous fonctions de #,) sont tabulés dans des tables en fonction du nombre x, 


d'individus par prélèvement (échantillon), mais encore une fois ils sont très simples à calculer dans un 
tableur comme Microsoft Excel avec la relation explicite donnée plus haut. Et nous avons donc: 


où k est le nombre de prélèvements. 


(74.481) 


Ainsi, si nous considérons toujours le tableau suivant de 25 prélèvements (k) de 6 individus (x,) : 


 Ech.1 Ech.2 Ech.3 Ech.4 Ech.5 Ech. 6 


Jour 4 10.066 
Jour 5 10.014 
Joué 9.350 


AlouT 9914 


Jours, 9.975 
Jour © 10.006 
Jour A 10.084 
Jour1l 9.944 
Jour 15 10.007 


EM Tour 1: 10.007 


Jourle 9.984 
Joue li 10.032 
Jowdt 9.976 


Aou 9982 


Jour 21 10.066 
Jour2i 9.956 
Jour 2: 10.061 
Jour22 9.905 
Jow2: 9.977 


10.020 
9.964 
10.021 
10.080 
9.979 
10.006 
10.032 
9.996 
10.075 
9.962 
10.064 
9.982 
10.028 
10.063 
10.049 
9.917 
9.896 
10.004 
10.050 
9.984 
9.984 
10.018 
9.944 
9.905 
9.995 


9.973 
9.943 
9.941 
9.951 
9.545 
9.972 
10.036 
10.037 
9.997 
10.006 
9.962 
9.975 
10.039 
9.982 
9.966 
9.908 
9.961 
10.003 
10.038 
9.950 
9.964 
9.989 
9.590 
9.987 
9.920 


10.009 
9.971 
10.070 
9.996 
9.540 
10.039 
10.025 
10.150 
9.978 
10.036 
10.014 
10.054 
9.975 
9.991 
10.068 
9.991 
9.961 
9.955 
9.981 
9.975 
9.978 
10.000 
9.983 
10.058 
9.934 


9.969 
10.026 
10.016 
10.034 

9.942 
10.002 
10.011 
10.000 

9.993 

9.991 

9.967 

9.985 
10.032 

9.968 
10.005 
10.018 

9.969 
10.020 

9.960 

9.953 
10.042 
10.015 

9.995 

9.916 

9.916 


3.954 
10.018 
10.071 
10.042 

9.542 

9.962 

9.994 

9.574 

9.956 

9.976 

9.959 

9.911 

9.986 
10.058 
10.028 

9.998 

9.935 

9.969 

9.912 
10.058 
10.055 
10.015 
10.003 

9.978 
10.072 


Figure: 74.73 - Mesures journalières avec 6 individus sans arrêt de la machine 


Nous pouvons calculer, ou trouver dans les tables que: 


ca(a)= c4(6) = 0.915,28, ()= 2,(6) = 0.030, 84%) = B4(6) = 1.970 


(74.482) 
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Ce qui donne: 


Soit: 


Pr 


RSS RE 
5 S IE u 
VRRRT PRIME SP UETIR Le 18 


1.970 


0.0252 0.0413 
0.0325 0.0413 
0.0509 00413 
0.047535 0.0413 
0.0299 0.0413 
0.0333 0.0413 
0.0457 0.0413 
0.0668 0.0413 
0.0404 00413 
0.0447 0.0413 
00454 00413 
0.0467 0.0413 
0.0263 0.0413 
00414 0.0413 
0.035535 0.0413 
0.0451 0.0413 
0.0308 0.0413 
0.0265 0.0413 
0.0509 00413 
0.0391 0.0413 
0.044535 0.0413 
0.0236 0.0413 
0.0379 0.0413 
0.0610 0.0413 
0.0597 0.0413 


0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 
0.0813 


0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 
0.0010 0.0333 


Figure: 74.74 - Calculs des indicateurs correspondants 
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b3 =1-3/J'RACINE(-J1"2) 
b# -1-3/JRACINE(I-J12) 


K L 


M 


H 


C« =RACINE(2(NBVAL(BE:G6)-1)'EXPILIGAMMA(NBY AL(BE-G6)2)MEXP(LUGAMMA((NBY AL(B6:G6)-1)42)) 


s CL UCL LCL USL LSL T 

=ECARTYPE(BE:G6)  =MOYENNE(HJ#6:#J830) =#K6'#U#3 =#KB'SUS2 =013"$U83 =013#J$2 =0.13 
=ECARTYPE(B7:G7)  =MOYENNE(#J#6:#J430) =#K7'$U#3 =#K7'SU82 =0N3"$U#3 =012"#J$2 =043 
=ECARTYPE(B8:G9)  =MOYENNE(#J#6:#/#30) =#K9"$U#3 =#KS8"SU82 -013"$U83 =013"#J$2 =013 
=ECARTYPE(E9:G9)  =MOYENNE(#J#6:#J#30) =$K9"$U#3 =#K9"#U82 =013"$U#3 =013$J$2 2012 
=ECARTYPE(E10:G10) =MOYENNE(SJ#6:#J#30) =#K10"#J#3 =#K10"#J$2 =-0.13"$/#3 =013"$J$2 =013 
-ECARTYPE(BIEGN)  =MOYENNE(SJ#6:#J#30) =#KISUHS =#KISUS2 -01W3'SU83 =01N2#J$2 =013 
=ECARTYPE(BI2G2) =MOYENNE(SJ#6:#/#30) =#K12#J#3 =#K12"#J$2 =-013"$U83 =013"#J$2 2013 
=ECARTYPE(BI GS) =MOYENNE(HJ#6:#0830) =#K13"#J83 =#K12"#J82 -013"$U83 =013"#J$2 =01 
=ECARTYPE(BI4:G14) =MOYENNE(SJ#6:#J830) =#K14'#U#3 =#K14"#J$2 =013"$U83 =013$J$2 2013 
=ECARTYPE(BIS-G5) =MOYENNE(SJ$6:#0830) =#K15'#U#3 =#K15'#J$2 -013"$U83 =013"$J$2 =013 
=ECARTYPE(BEG6) =MOYENNE(#J#6:#0#30) =#K16"#U#3 =#K16 "4/82 =0.13"$U83 =013#J#$2 20.12 
=ECARTYPE(BIF:G17) =MOYENNE(HU#6-#U#20) =#K17" #83 =#KI7"$/$2 =012#J$3 =0N7SU$2 =0.13 
=ECARTYPE(BISG8) =MOYENNE(SJ#6:#J#30) =#K19"#U#3 =#K18"#J$2 =013"$U83 =013"$J#$2 2013 
=ECARTYPE(BI9-G19) =MOYENNE(SJ#6:#J#30) =#K19"#U#3 =#K19"#J$2 -013"$U83 =013"$J$2 =013 
=ECARTYPE(E20:G20) =MOYENNE(#J#6:#/#30) =$K20°$U$3 =#K20"$U82 =0.13"$U$3 =013"$J$2 2013 
=ECARTYPE(B21G21) =MOYENNE(#J$6:#/#30) =#K21#J$3 =#K21#J$2 -013"$083 =013"#J$2 =0.13 
-ECARTYPE(B22:G22) =MOYENNE(HJ#6:#$/830) =#K22"$U#3 =#K22"$U82 =0W3'SUSS =01N3#J$2 =0.12 
=ECARTYPE(B23:G23) =MOYENNE($J#6:#/830) =$K23"#U83 =#K23"$U82 =01W3"$U#3 =013$J#$2 2013 
=ECARTYPE(B24:G24) =MOYENNE(SJ$6:#J830) =#K24"#U83 =#K24"SU82 =01W3"SUS3 =013"#J$2 20.13 
=ECARTYPE(B25:G25) =MOYENNE($J$6:#0#30) =$K25"$U#3 =#K25"$U82 =01W3"$U#3 =013"$J$2 2012 
=ECARTYPE(B26:G26) =MOYENNE(SJ$6:#/#30) =#K26"$U#3 =#K26"$U82 =0.1W3"$U$3 =013"$J$2 =0.13 
=ECARTYPE(B27:G27) =MOYENNE($J#6:#J#30) =$K27"$U$3 =#K27"$U82 =01W3"$U$3 =013"$J$2 2013 
=ECARTYPE(B28:G28) =MOYENNE(SJ$6:#J830) =$K28"$U$3 =#K28"$U82 =01W3"$U$S =013"$J$2 =013 
=ECARTYPE(29:G29) =MOYENNE(#J$6:#/#30) =$K29"$U83 =#K29"$U82 =0.13"$U$3 =013$J$2 20.13 
=ECARTYPE(830:G30) =MOYENNE($J$6:#$/#30) =#$K30"$U$3 =#K30"$U#2 =0.13"$U83 =013"#J$2 2013 


Figure: 74.75 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Nous avons alors la carte de contrôle suivante: 


CC MESURRÉE DE SHEWHART AVEC ECARTS- TYPES 


(S BARRE - 3) 


2 | Le 1 À J\ À 


V 


\ / 


Figure: 74.76 - Carte de contrôle S Barre - S 
où nous avons pris pour le client (qui avait imposé un USL et LSL de 10 +01 ): 
USL = 0.03. B,(%,)= 0.03. B,(6) = 0.0657 


T = 0.03 
LSL = 0.03. 8,(%,)= 0.07. 8, (6) = 0.001 


(74.483) 
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À remarquer que cette carte de contrôle aurait selon les règles de la WECO zéro points au-delà des +347 

(nous indiquons cela pour des raisons de comparaison avec les cartes précédentes et les prochaines). Elle 
est donc moins sensible que les autres cartes. Il faut remarquer aussi que les limites UCL et LCL sont plus 
larges que les USL et LSL imposées. 


Pour rappel, le problème majeur de cette carte de contrôle est qu'elle n'est juste que si et seulement si les 
données sont normalement distribuées et que Shewart suppose la loi de S symétrique alors que ce n'est pas 
le cas. Dès lors, les responsables qualités associent alors avec la carte de la moyenne une autre carte que 
nous allons présenter de suite. 


5.4.5. CC AVEC MOYENNES BASÉES SUR L'ÉCART-TYPE (X BARRE -S) 


Lors de notre étude de la carte de contrôle aux moyennes avec les limites fixes basées sur l'écart-type de la 
moyenne, nous avons bien mis en évidence que cette dernière souffrait de l'handicap que &% est trop 


approximatif dans la pratique (car n est souvent trop petit). 


Dès lors, un moyen de contourner cela est d'utiliser les résultats obtenus lors de l'étude de la carte de 
contrôle précédente. 


Avantages: Corriger le problème de la carte de contrôle aux moyennes lorsque le nombre d'individus par 
prélèvements (échantillons) est trop petit. Représente bien la variation du niveau moyen des données 
(tendance centrale). 


Problèmes: La démonstration mathématique de l'origine des limites de contrôles est ardue (voir chapitre de 
Statistiques pour le détail des démonstrations). Un autre problème c'est que cette carte ne fonctionne que si 
et seulement si les données sont identiquement distribuées et le sont selon une loi Normale! Par ailleurs 
puisque les limites sont basées sur l'estimateur de l'écart-type, il faudrait un n qui dans l'idée ne soit pas en 
dessous de la dizaine. 


Rappelons d'abord que nous avions: 
USZL = imposé par client/direction 


UCLps= +30, = R+3X 
ne 
Clps = E(X)= X 
T = objectif imposé par client/direction 


(74.484) 


A RES EE ne 
#, 
LSL = imposé par chent/direction 
et nous avons démontré plus haut que: 


S = Oyca(n;) (74.485) 


Nous avons donc: 
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USZ = imposé par client/direction 


T — S 
UCL= = +34 - +3 ——— 
A 
js ca Cr)afrs 
CLgen = À 
T = objectif imposé par client/direction 


LCLyrs = P-3%2 = R-3 


S 
” "4 ACONLA 


LST = imposé par client/direction 
et que nous retrouvons parfois dans la littérature sous la forme: 


USZ = imposé par client/direction 


UE yes = F+ rs TS = ?+4(4%)5 
CLgen = À 


T = objectif imposé par client/direction 


5 _ _ 
LCL = R-3 = L-4(n)5 
A ï 
ii ca Ca) af 


LSL = imposé par client/direction 


(74.486) 


(74.487) 


Remarquons que nous pouvons alors calculer des probabilités de sous-groupes non-conformes par excès 


ou par défaut en utilisant le fait que Z suit une loi Normale de paramètres: 


2 


(ao) a(2 _ | (74.488) 


Ca (2)# 


dont il découle immédiatement que X suit une loi Normale de paramètres: 


v2 


Na. o)= nr 


| (74.489) 
ca (x) 


Ainsi, si nous considérons toujours le tableau suivant de 25 prélèvements (k) de 6 individus (x,) : 
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E 


DO 


Ech.1 Ech.2 Ech.3 
3.9943 100196 99732 
39721 939643 939426 
39788 100213 93.3407 
100658 100800  3.9514 
100136 99731 93449 
33495 100057  3.9715 
3.9144 100321 100361 
39748 99962 10.0369 
100063 1007493  9.9971 
100840  9.9613  10.0063 
39436 100638 99617 
100074 99817 9.9753 
100063 100282 10.0385 
39836 100630  9.9824 
100317 100485  3.9659 
39756 39174 99076 
39818 938962 39614 
10.0168 100043 10.0029 
39857 100503  10.0381 
39878 99841 93496 
100657 99838  9.9636 
39564 100184 33890 
100611 93443  9.9899 
33054 39049  9.9870 
39768 99954  9.9196 


E 
Ech.4 

10.0088 
3.9712 
10.0696 
3.9958 
3.9403 
10.0388 
10.0253 
101500 
3.9780 
10.0364 
10.0138 
10.0541 
3.9747 
3.9303 
10.0675 
3.9303 
3.3612 
3.9549 
3.381 
3.9754 
3.9773 
3.9393 
3.9833 
10.0580 
3.3341 


F 


G 


Ech.5 Ech.6 
9.9685  9.9544 
100253  10.0177 
10.0161  10.0709 
100338  10.0422 
9.9424  9.9421 
100019  9.3616 
100103  3.9935 
3.993936  3.9741 
39934 99555 
393907  9.3762 
39672  9.9591 
39845  9.9107 
100323  3.3860 
3.9684  10.0575 
100047 100277 
100180  9.9973 
39694 99349 
10.0133  3.9691 
39603  9.9123 
39532 100576 
100423 100547 
10.0146  10.0145 
3.9347  10.0033 
39156  9.9782 
39162  10.0721 


Figure: 74.77 - Mesures journalières avec 6 individus sans arrêt de la machine 


Nous pouvons calculer, ou trouver dans les tables que: 


cata) = ca (6) = 0.9515,4 (2) = 4(6) = 0.630 


Nous avons alors le tableau suivant: 


Soit: 


é N° Mogennes 


5 1 9.3865 
ë 2 9.3823 
7 3 10.0162 
8 4 10.0282 
3 5 3.3604 
10 6 9.3882 
Li 7 10.0021 
12 8 10.0219 
15 3 10.000 
14 10 10.0093 
15 LL 9.3849 
16 12 9.9856 
17 13 10.011 
18 14 10.0076 
13 15 10.0243 
20 16 9.3679 
at 17 3.3508 
22 18 3.9947 

19 3.3880 

20 9.9846 
25 21 10.0147 
26 22 3.9988 

23 3.3961 

24 9.9582 

25 3.936930 


CL  UCL LCL S$ 


3.99333 
3.9933 
3.9933 
3.9933 
3.9333 
3.99333 
3.9933 
3.9933 
3.9933 
3.3933 
3.9933 
3.99333 
3.9933 
3.9933 
3.99333 
3.9933 
3.99333 
3.9933 
3.3333 
3.99333 
3.9333 
3.99333 
3.9933 
3.39333 
3.9933 


10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 
10.0464 


3.3402 
3.3402 
3.3402 
3.3402 
3.3402 
3.3402 
3.9402 
3.3402 
3.9402 
3.3402 
3.3402 
3.3402 
3.3402 
3.9402 
3.3402 
3.3402 
3.3402 
3.3402 
3.3402 
3.3402 
3.3402 
3.3402 
3.9402 
3.3402 
3.93402 


0.0252 
0.0325 
0.0509 
0.0475 
0.0293 
0.0333 
0.0457 
0.0668 
0.0404 
0.0447 
0.0454 
0.0467 
0.0263 
0.04#14 
0.0355 
0.0451 
0.0303 
0.0265 
0.0509 
0.0391 
0.0445 
0.0236 
0.0373 
0.0610 
0.0597 


(74.490) 


USL LSL T 


10.0423 
10.0429 
10.0429 
10.0429 
10.0429 
10.0429 
10.0429 
10.0429 
10.0429 
10.0423 
10.0429 
10.0423 
10.0429 
10.0429 
10.0429 
10.0423 
10.0429 
10.0429 
10.0423 
10.0429 
10.0423 
10.0429 
10.0429 
10.0423 
10.0429 


3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 
3.9571 


10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 
10.0000 


Figure: 74.78 - Indicateurs correspondants aux mesures obtenues 
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=RACINE(2/(NEV AL(ES:G5)-1)"EXP(LAGAMMA(NE V AL(ES:G5)/2)VEXP(LNGAMMA((NE V AL(ES:G5)-1)/2)) 


Lis 


= (N'RACINE(NEYAL(65:G5))) 


Moyennes 
=MOYENNE(E5:G5) 
=MOYENNE(56:G6) 
=MOYENNE(ET:GT) 
=MOYENNE(B8:G8) 
=MOYENNE(83:G3) 
=MOYENNE(E10:G10) 
=MOYENNE(E11:G11) 
=MOYENNE(512:G12) 
=MOYENNE(B13:G13) 
=MOYENNE(E14:G14) 
=MOYENNE(515:G15) 
=MOYENNE(516:G16) 
=MOYENNE(EAT:G1T) 
=MOYENNE(518:G15) 
=MOYENNE(513:G13) 


=MOYENNE(B21:G21) 


=MOYENNE(620:G20) 


CL s 
=MOYENNE(#J45:4/423) =ECARTYPE(B5:G5) 
=MOYENNE(#J45:4/529) =ECARTYPE(B6:G6) 
=MOYENNE(#J45:4/523) =ECARTYPE(B7:G7) 
=MOYENNE(#J45:4/$23) =ECARTYPE(B8:G8) 
=MOYENNE(#/45:4/423) =ECARTYPE(B3:G3) 
=MOYENNE(#J45:4/425) =ECARTYPE(E10:G10) 
=MOYENNE(#J45:4/425) =ECARTYPE(B11:G11) 
=MOYENNE(#J45:4/423) =ECARTYPE(B12:G12) 
=MOYENNE(#J45:4/423) =ECARTYPE(B13:G13) 
=MOYENNE(#J45:4/429) =ECARTYPE(B14:G14) 
=MOYENNE(#J45:4/423) =ECARTYPE(B15:G15) 
=MOYENNE(#J45:4/429) =ECARTYPE(E16:G16) 
=MOYENNE(#J45:4/423) =ECARTYPE(BIT:G17) 
=MOYENNE(#J45:4/423) =ECARTYPE(B18:G18) 
=MOYENNE(#J45:4/423) =ECARTYPE(B19:G19) 
=MOYENNE(#J$5:4/425) =ECARTYPE(B20:G20) 
=MOYENNE(#J45:4/429) =ECARTYPE(B21:G21) 


=MOYENNE(#J#5:4/423) =ECARTYPE(B26:626) 


=MOYENNE(4J45:$1423) =ECARTYPE(B27:G27) 
=MOYENNE(B25:G28) =MOYENNE($J$5:4/429) =ECARTYPE(B28:G25) =$K25+MOYENNE($L#5:$L423)" 4042 
=MOYENNE(B23:G23) =MOYENNE($)45:4/429) =ECARTYPE(B23:G23) =$K23+-MOYENNE($L#5:$L423) 4042 


M 


UCL 
=$KS+MOYENNE(SL#S:HL429)" 4042 
=$K6+MOYEMNE(SLES:HL429)"4J52 
=$KT-MOYENNE(SL4S:$L529)"40$2 
=$KS+MOYENME(SLÉS-$L423)"4J52 
=$KS+MOYENNE(SL4S:$L429)"4J$2 
=HK10+MOYENNE(SLSS:$L#29)"4U$2 
=HKILMOYENME(SLES-HLH23) 452 
=HK12+MOYENNE(SLES:$L#29)"4J$2 
=HK1SMOYENNE(SLSS:$L$29)"$U$S 
=HKISMOYENNE(SLES:$L#29)"SUS2 
=HKISMOYENNE(SLES:$L#29)"4US2 
=HKIG-MOYENNE(SLES:$L#29)"4U$2 
=$KITMOYENNE(SLES:$L423)"4J$2 
=HK IS MOYENNE(SLES:$L#29)"$U$2 
=$K1S-MOYENNE(SLES:$L#29) 4042 
=$K20-MOYENNE(SLSS:#L523) 4042 
=$K2HMOYENNE(SLSS:$L429) 4042 


=MOYENNE(E22:G22) =MOYENNE($J$5:4/429) =ECARTYPE(B22:G22) =$K22+MOYENNE($L#5:$L423)"4142 
=MOYENNE(B25:G23) =MOYENNE($/$5:4/$29) =ECARTYPE(B23:G25) =$K23+MOYENNE($L#5:$L$29)" 4042 
=MOYENNE(B24:G24) =MOYENNE($J$5:4/429) =ECARTYPE(B24:G24) =$K24+MOYENNE($L#5:$L523)"4J$2 
=MOYENNE(B25:G25) =MOYENNE($/45:4/$29) =ECARTYPE(B25:G25) =$K25+MOYENNE($L#5:$L$23)" 4042 
=MOYENNE(B26:626) 
=MOYENNE(B27:627) 


2$K26+-MOYENNE($L$5:$L423)" 4042 


=$K27+-MOYENNE(SL#S:$L423)"4/$2 


LCL 
=$KS-MOYENNE(SL4S:HL429)"4J$2 
=$K6-MOYENNE(SL4S:$L#29)"4052 
=$KT-MOYEMNE(SLES:$L429)"40$2 
=$K8-MOYENNE(SL45:$L#29)"40$2 
=$K3-MOYENNE(SL45:$L$29)"4052 
=$K10-MOYENME(SL4S:HL423) 4042 
=$KIt-MOYENNE(SL45:$L428)"4)52 
=$K12-MOYENNE(SL45:$L423) 4042 
=$K13-MOYENNE(SLES:$L423) 8042 
=$K14-MOYENME(SL4S:HL429) 4042 
=$KIS-MOYENNE(SL45:5L429) 4082 
=$K16-MOYENNE(SLS5:HL423) 4042 
=$KIT-MOYENNE(SL45:4L429) 4042 
=$K18-MOYENME(SL4S:HL423) 4042 
=$K13-MOYENME(SLSS:HL423) 4042 
=$K20-MOYENNE(#L#5:$L423)"4)42 
=$K21-MOYENNE(SLS5:4L423) 4042 
=$K22-MOYENNE(SL45:$L429)"4)$2 
=$K23-MOYENNE(L#5:$L429)"4)42 
=$K24-MOYENNE(L#5:$L429)"4042 
=$K25-MOYENNE(SLS5:$L429) 4042 
=$K26-MOYENNE(SL45:$L423)"40$2 
=$K2T-MOYENNE(SLSS:$L#29) 4042 
=$K28-MOYENNE(#L#5:$L423)"4)42 
=$K23-MOYENNE(#L#5:$L429)"4042 


Figure: 74.79 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Nous avons alors la carte de contrôle suivante: 


CC MESURRÉE DE SHEWHART AVEC MOYENNES BASÉES SUR L'ÉCART-TYPE 
BARRE - 


1005 
1004 
10.02 - 1 
L A /\A /\ 
DRE RS Re CR RS | OR Re 


à 


3.9 
33 
Î 2 3 i 5 5 7 & 3 40 1 12 13 14 15 16 17 18 19 2 21 2 233 24 25 
Figure: 74.80 - Carte de contrôle X barre - S 
où nous avons pris pour le client (qui avait imposé un USL et LSL de 10 +01 ): 
USL =10+0.03.4, (»,) = 10+ 0.034, (6) = 10.021 
T=10 (74.491) 


LSL = 10 —0.034, (x,) = 10 — 0.034, (6) = 9.979 
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À remarquer que cette carte de contrôle aurait selon les règles de la WECO six points au-delà des +3 
(nous indiquons cela pour des raisons de comparaison avec les cartes précédentes et les prochaines). Elle 
est donc plus sensible que la carte précédente et tout aussi sensible que la carte aux moyennes basée sur 
l'erreur-standard. À remarquer aussi que les limites UCL et LCL sont plus larges que les limites USL et LSL 
imposées. 


5.4.6. CC AVEC ÉTENDUES (R BARRE - R) 


La carte de contrôle aux étendues est donc souvent associée à la carte de contrôle de la moyenne. Elle a 
pour objectif de remplacer avantageusement la carte de contrôle de l'écart-type S lorsque les données ne 
sont pas normalement distribuées, car sa construction mathématique permet si on le désire de choisir la loi 
de probabilité sous-jacente. Ainsi, nous utilisons cette nouvelle carte lorsque x, <10 (le nombre 


d'individus par prélèvement), alors que pour la carte de l'écart-type il faut plutôt que #, z10. 


Avantages: Complète très bien la carte de contrôle de la moyenne et remplace avantageusement la carte de 
l'écart-type lorsque le nombre de prélèvements est peu élevé. Représente bien la variation à l'intérieur 
même des données de chaque prélèvement (dispersion instantanée) que nous pourrons détecter. 


Problèmes: La démonstration mathématique de l'origine des limites de contrôles est ardue (voir chapitre de 
Statistiques pour le détail des démonstrations) et la détermination des coefficients nécessite l'utilisation de 
calculs par la méthode de Monte-Carlo (cf. chapitre de Méthodes numériques). Un autre problème, c'est 
que bien que la loi de probabilité de l'étendue puisse être choisie, elle est souvent donnée dans les livres 
spécialisés que pour la loi Normale... 


L'idée est de représenter (il est impossible que le client fixe une limite USL, LSL ou une cible T'en ce qui 
concerne l'étendue d'où le fait que ces paramètres ne soient cette fois-ci pas mentionnés): 


UCLp = R+30p 
CLR = E(R)=R (74492) 
LCLR = AR LL 3%? 


et cette fois-ci nous n'allons pas utiliser les estimateurs de l'espérance et de l'écart-type car pour # < 10 ils 
ne convergent pas assez vite. Dès lors, nous allons utiliser les résultats démontrés dans le chapitre de 
Statistiques lors de notre étude des statistiques d'ordre. Nous avions obtenu comme estimateur de 
l'écart-type: 


= d3 CDR = d3R (74.493) 
d;(4)  d; 
avec: 
RE 
2 74.494) 
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Dès lors: 


UCLR = R+30p = R +3 


Cle = E(R)= À 


LCLR = R-30; =ÀR- 


ce qui se note traditionnellement: 


CL, = R+30,=R+38 CR ED (x) 


CLe = E(R)=R 


da C)R _& da (3) 
d;(%) d;(%) 
(74.496) 
ds (2,)À gli 4 (2) 
d;(%) d; (x) 
d (2) 
(74.497) 


LCR =R-30=-R-3 CR ED) 


d2 (x) 


Les coefficients 2,,2, sont disponibles dans la littérature (ou sur le web) sous forme de tables en 


fonction du nombre #, d'individus par prélèvements et souvent (malheureusement) que pour une 


distribution normale (voir l'exemple dans le chapitre de Statistiques). 


Ainsi, si nous considérons toujours le tableau suivant de 25 prélèvements (k) de 6 individus (n): 


E 
Ech.1 
3.3343 
3.9721 
3.3788 
10.0658 
10.0136 
3.3435 
3.5144 
3.3745 
10.0063 
10.0540 
3.3436 
10.0074 
10.0063 
3.3836 
10.0317 
3.3756 
3.3615 
10.0165 
3.3857 
3.3875 
10.0657 
3.3564 
10.061 
3.3054 
3.3765 


Ech.2 
10.0136 
3.3643 
10.0213 

10.0500 
3.3731 
10.0057 
10.053521 
3.3362 
10.0743 
3.3613 
10.063538 
3.3817 
10.0282 
10.0630 
10.0455 
3.3174 
3.6362 
10.0043 
10.0503 
3.3541 
3.3835 
10.0164 
3.3445 
3.3043 
3.3354 


Ech.$ 
3.3732 
3.3426 
3.3407 

3.9514 
3.3443 
3.375 
10.0361 
10.03563 
3.337 
10.0063 
3.3617 
3.9753 
10.0385 
3.3824 
3.3653 
3.3076 
3.3614 
10.0023 
10.0381 
3.3436 
3.3636 
3.3830 
3.3833 
3.3870 
3.136 


Ech. 4 
10.0088 
3.3712 
10.0636 
3.9358 
3.3403 
10.0388 
10.0253 
10.1500 
3.3750 
10.0564 
10.0138 
10.0541 
3.3747 
3.3303 
10.0675 
3.3303 
3.3612 
3.3543 
3.381 
3.9754 
3.3773 
3.3333 
3.3833 
10.0580 
3.3541 


Ech.5 
3.9685 
10.0253 
10.0161 
10.0335 
3.3424 
10.0013 
10.0103 
3.3336 
3.3334 
3.3307 
3.3672 
3.3545 
10.0523 
3.3654 
10.0047 
10.0150 
3.3634 
10.0133 
3.3603 
3.9532 
10.0423 
10.0146 
3.3347 
3.3156 
3.162 


Ech.6 
3.3544 
10.017 

10.0703 
10.0422 
3.3421 
3.3616 
3.3335 
3.3741 
3.3555 
3.3762 
3.3531 
3.3107 
3.3560 
10.0575 
10.0277 
3.3373 
3.3543 
3.3631 
3.3123 
10.0576 
10.0547 
10.0145 

10.0033 
3.3782 
10.0721 


Figure: 74.81 - Mesures journalières avec 6 individus sans arrêt de la machine 


Puisque » = 6 nous trouvons dans les tables: 


Da = 0,D4 = 2.004 


Nous avons alors le tableau suivant: 


(74.498) 
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Soit: 


={MAX(B5:G5)-MIN(B5:65)) 
={MAX(B6:G6)-MIN(B6:G6)) 
={MAX(BT:GT)-MIN(BT:G7)) 
={MAX(B8:G8)-MIN(B8:G8)) 
={MAX(B3:G3)-MIN(B3:G3)) 
={MAX(10:G10)-MIN(B10:G10)) 
=(MAX(BILGH)-MIN(E1:G11)) 
=(MAX(B12:G12)-MIN(E12:G12)) 
=(MAX(B13:G13)-MIN(E13:G13)) 
=2(MAX(B14:G14)-MIN(B14:G14)) 
=(MAX(B15:G15)-MIN(B15:G15)) 
=(MAX(B16:G16)-MIN(E16:G16)) 
=2(MAX(BAT:GIT)-MIN(BAT:G1T)) 
=(MAX(B18:G18)-MIN(B18:G18)) 
=(MAX(B18:G18)-MIN(E13:G13)) 
=(M4X(820:G20)-MIN(B20:G20)) 
=(MAX(B21:G21)-MIN(B21:G21)) 
={MAX(B22:G22)-MIN(B22:G22)) 
=(MAX(B23:G23)-MIN(B23:G23)) 
=(MAX(B24:G24)-MIN(B24:G24)) 
={MAX(B25:G25)-MIN(B25:G25)) 
=(MAX(B26:G26)-MIN(B26:G26)) 
=(MAX(B2T:G27)-MIN(B27:G27)) 
=(MAX(B28:G28)-MIN(B28:G28)) 
=(MAX(B29:G29)-MIN(B28:G28)) 


CL 

=MOYENNE($J45:5/429) 
=MOYENNE($J45:5/423) 
=MOYENNE(#J45:4/423) 
=MOYENNE($J45:4/429) 
=MOYENNE(4J45:5/429) 
=MOYENNE($J45:4/429) 
=MOYENNE($J$5:4/423) 
=MOYENNE($J45:$/429) 
=MOYENNE($J45:5/423) 
=MOYENNE($J45:5/423) 
=MOYENNE(#J45:4/423) 
=MOYENNE($J45:4/429) 
=MOYENNE(#J45:5/429) 
=MOYENNE(#J45:5/423) 
=MOYENNE($J45:4/429) 
=MOYENNE($J45:4/429) 
=MOYENNE($J45:5/429) 
=MOYENNE($J45:50423) 
=MOYENNE($J45:4/429) 
=MOYENNE($J45:4/429) 
=MOYENNE(#J45:5/429) 
=MOYENNE($J$5:40423) 
=MOYENNE($J45:$/429) 
=MOYENNE($J45:4/429) 
=MOYENNE($J45:5/429) 


UCL 
=$K5"$J$2 
=$K6"$J$2 
=$KT'$J$2 
=$K5"$J$2 
=$K3"$J$2 
=$K10"4/$2 
=$KisJ$2 
=$K12"$J$2 
=$K15"4J$2 
=$K14"4J$2 
=$K15"4J$2 
=$K16"$/$2 
=$KiT"sJ$2 
=$K18"4/$2 
=$K13"4/$2 
=$K20"$/$2 
=$KkatsJ$2 
=$K22"4/$2 
=$Kk23"4/$2 
=$K24"4/$2 
=$K25"$J$2 
=$K26"4/$2 
=$Kk2T"$J$2 
=$K28"4/$2 
=$K23"4/$2 


LCL 
=$K5"4J$1 
=$K6"$J$1 
=$KT'$J$1 
=$KS"sUf1 
=$K3"4J$1 
=$K10"4/$1 
=$K11"51$1 
=$K12"4/$1 
=$K13"4J$1 
=$K14"4J$1 
=$K15"4J$1 
=$K16"4/$1 
=$K1T"40$1 
=$K18"4J$1 
=$K13"4/$1 
=$K20"4/$1 
=$Kat"sJ$t 
=$K22"4J$1 
=$K23"$J$1 
=$K24"4J$1 
=$K25"4/$1 
=$K26"4J$1 
=$kar"sJft 
=$Kk28"4/$1 
=$K23"$J$1 


Figure: 74.83 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Nous avons alors la carte de contrôle suivante: 
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CC MESURRÉE DE SHEWHART AVEC ETENDUES 
(R BARRE - K)} 


0.15 


Figure: 74.84 - Carte de contrôle R barre - R 


qui (est-il nécessaire de le rappeler?) sous-estime donc le nombre de détections d'erreurs puisque la loi de 
probabilité de l'étendue n'est en réalité pas symétrique (donc l'application des limites fixes de Shewhart 
n'est pas vraiment adaptée.) et parce que la quasi-totalité des tables supposent quand même les données 
distribuées normalement aussi. 


À remarquer que cette carte de contrôle aurait selon les règles de la WECO zéro points au-delà des +3 
(nous indiquons cela pour des raisons de comparaison avec les cartes précédentes et les prochaines). 


5.4.7. CC AVEC MOYENNES BASÉES SUR L'ÉTENDUE (X BARRE-R) 


Lors de notre étude de la carte de contrôle aux moyennes avec les limites fixes basées sur l'écart-type de la 
moyenne, nous avons bien mis en évidence que cette dernière souffrait de l'handicap que &4 est trop 


approximatif dans la pratique (car n est trop petit). 


Dès lors, un moyen de contourner cela est d'utiliser les résultats obtenus lors de l'étude de la carte de 
contrôle précédente. 


Avantages: Corriger le problème de la carte de contrôle aux moyennes avec l'écart-type lorsque le nombre 
d'individus par prélèvements (échantillons) est trop petit. Représente bien la variation du niveau moyen 
des données (tendance centrale). 


Problèmes: La démonstration mathématique de l'origine des limites de contrôles est ardue (voir chapitre de 
Statistiques pour le détail des démonstrations) et la détermination des coefficients nécessite l'utilisation de 
calculs par la méthode de Monte-Carlo (cf. chapitre de Méthodes numériques). Un autre problème, c'est 
que bien que la loi de probabilité de l'étendue puisse être choisie, elle est souvent donnée dans les livres 
spécialisés que pour la loi Normale 
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Remarque: Cette carte de contrôle est très utilisée dans le cadre de l'étude de la reproductibilité et de la 
répétabilité (Étude R&R). Raisonp pour laquelle on la retrouve dans les logiciels de maîtrise statistique 
des processus automatiquement lorsque l'on lance une analyse R&R (typiquement ce que fait le 
logiciel Minitab). 


Rappelons d'abord que nous avions: 


USZ = imposé par client/direction 


UCEp = À +30, = ir 
ñ; 
Clp=EX)=Z 


T = objectif mposé par client/direction 


(74.499) 


LCEr = À-30, = X- Fe 
À, 


LST = imposé par client/direction 


et nous avons démontré dans le chapitre de Statistique dans le cadre de notre étude des statistiques d'ordre 
que: 


R = Tyd> (74.500) 


Il vient alors (il est impossible que le client fixe une limite USL, LSL ou une cible T en ce qui concerne 
l'étendue d'où le fait que ces paramètres ne soient cette fois-ci pas mentionnés): 


= TT = k 
UE pop = À +32 = L 43 ——— 
je Va ACONES 
Cle = EX)= ZX (74.501) 
= T = À 
LCL = X-3-X 2 X-3 
x g EXESNE 
toujours avec: 
“ l+ 
R=—5"R, (74502) 
k 2=l 
et l'ensemble se note traditionnellement dans le domaine: 
UCL ris X+4(n9R 
_ CACINCA 
CLyer = ECX)= X (74.503) 
D XZ-Ain)R 
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Remarquons que nous pouvons alors calculer des probabilités de sous-groupes non-conformes par excès 


ou par défaut en utilisant le fait que Z suit une loi Normale de paramètres: 
52 


N(u,o)s= N ee 


: (74.504) 
ds (x}# 


dont il découle immédiatement que X suit une loi Normale de paramètres: 


D2 


N(a.o)z N Ne. 


dÿ 


(2) 


(74.505) 


Ainsi, si nous considérons toujours le tableau suivant de 25 prélèvements (k) de 6 individus (n): 


E 
Ech.1 
3.3943 
3.9721 
3.9788 
10.0658 
10.0136 
3.9495 
3.3144 
3.9748 
10.0063 
10.0840 
3.9436 
10.0074 
10.0063 
3.9836 
10.0317 
3.9756 
3.9818 
10.0168 
3.9857 
3.9878 
10.0657 
3.9564 
10.061 
3.9054 
3.9768 


Ech.2 


10.0196 
3.9643 
10.0213 
10.0800 
9.9791 
10.0057 
10.0321 
3.99362 
10.0749 
3.9613 
10.0638 
3.3817 
10.0282 
10.0630 
10.0485 
3.3174 
3.8962 
10.0043 
10.0503 
3.3841 
3.9838 
10.0184 
3.9443 
3.3043 
3.9954 


D 


Ech.3 


3.9732 
3.9426 
3.9407 
3.9514 
3.3449 
3.715 
10.0361 
10.0369 
3.3971 
10.0063 
3.9617 
3.9753 
10.0385 
3.9824 
3.9659 
3.9076 
3.9614 
10.0023 
10.0381 
3.9496 
3.9636 
3.3830 
3.9893 
3.3870 
3.9196 


E 


Ech.4# 


10.0088 
3.9712 
10.0696 
3.9958 
3.3403 
10.0388 
10.0253 
101500 
3.9780 
10.0364 
10.0138 
10.0541 
3.9747 
3.3303 
10.0675 
3.9303 
3.9612 
3.9543 
3.981 
3.9754 
3.9773 
3.9393 
3.9833 
10.0580 
3.3341 


F 


Ech.5 


3.9685 
10.0259 
10.0161 
10.0338 
3.9424 
10.0013 
10.0103 
3.9996 
3.9934 
3.3307 
3.9672 
3.9845 
10.0323 
3.9684 
10.0047 
10.0180 
3.9694 
10.0193 
3.9603 
3.9532 
10.0423 
10.0146 
3.9947 
3.9156 
3.162 


G 


Ech.6 


3.9544 
10.0177 
10.0703 
10.0422 
3.9421 
3.9616 
3.9935 
3.93741 
3.9555 
3.9762 
3.9591 
3.9107 
3.9860 
10.0575 
10.0277 
3.9373 
3.9349 
3.9691 
3.9123 
10.0576 
10.0547 
10.0145 
10.0033 
3.9782 
10.0721 


Figure: 74.85 - Mesures journalières avec 6 individus sans arrêt de la machine 


Puisque # = 6 nous trouvons dans les tables: 


A(%)= 4(6) =0483 (74.506) 


Nous avons alors le tableau suivant: 
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0.483 


N A2 
CN  Mogennes CL UCL LCL R 
4 Î 3.9865 99933 100460 99406 00652 
5 e 3.9823 99933 100460 93406 00833 
6 3 100162 99933 100460 99406 01302 
ï L 100282 99933 100460 99406 01286 
8 5 33604 99933 100460 99406 00733 
3 6 33882 99933 100460 93406 00893 
10 7 100021 99933 100460 99406 01217 
fi 8 100219 939933 100460 99406 01753 
12 3 100003 939933 100460 99406 0.194 
15 10 100093 99933 100460 99406  0.1221 
14 fi 3.938493 99933 100460 99406 01202 
15 12 3.9856 99933 100460 99406 01434 
16 13 10011 33933 100460 99406 00638 
17 14 100076 99933 100460 993406 00946 
L 15 100243 99933 100460 99406 01016 
13 16 39673 99933 100460 99406  O.104 
20 17 39508 99933 100460 99406 0.0856 

18 39947 99933 100460 93406 00650 

13 33880 99933 100460 939406 01380 

20 3.9846 99933 100460 99406 01080 

21 10.0147 99933 100460 99406 01021 
25 22 3.3988 99933 100460 93406 00620 

23 33961 99933 100460 99406 0168 

24 39582 99933 100460 99406 01531 

25 3.9630 99933 100460 99406 01559 


Figure: 74.86 - Indicateurs correspondants aux mesures obtenues 


Soit: 


cL R 


LCL 


1 =MOYENNE(E4:G4) 
=MOYENNE(E5:G5) 
=MOYENNE(66:G6) 


=MOYENNE($E#$4:$G428) 
=MOYENNE($E#$4:$G428) 
=MOYENNE($E#4:$G428) 
=MOYENNE(B7:G7) =MOYENNE(#544:4G428) 


=MOYENNE(63:G3) =MOYENNE($5$4:5G425) 


={MAX(B4:G4)-MIN(B4:G4)) 
=(MAX(BS:G5)-MIN(B5:65)) 
=(MAX(B6:G6)-MIN(B6:G6)) 
={MAX(BT:GT)-MIN(B7:G7)) 
=(MAX(B8:G8)-MIN(B8:G8)) 
={MAX(B3:G3)-MIN(B3:G3)) 


=K4+$JSTMOYENNE(SL$4:$L428) 
=KS+$JHTMOYENNE(SLÉ4:$L428) 
=K6+$JHMOYENNE(SLE4:$L#28) 
=KTsHJSTMOYENNE(SLÉ 441428) 
=K8+$J$TMOYENNE(SLS4:$L#28) 
=KS+4JHMOYENNE(SLS4:$L#28) 


=K4-$/H"MOYENNE(SL$4:$L428) 
=K5-HJHTMOYENNE(SLE4:L428) 
=K6-$JHMOYENNE(SLÉ4:$L428) 
=KT-HJSTMOYENNE(SLÉ4:$L428) 
=K8-$JH"MOYENNE(#L$4:$L428) 
=K3-$JHTMOYENNE(SLÉ4:$L428) 


=MOYENNE(510:G10 =MOYENNE(#B#4:$G428) 
=MOYENNE(B11:G11) =MOYENNE($B#4:$G428) 
=MOYENNE(B12:G12 =MOYENNE($B44:$G428) 
=MOYENNE(513:613 =MOYENNE(#544:4G428) 
=MOYENNE(B14:614 =MOYENNE(#B#4:4G428) 
=MOYENNE(515:G15: =MOYENNE(#544:$G428) 
=MOYENNE(516:G16 =MOYENNE($5#4:5G428) 
=MOYENNE(B1T:GIT =MOYENNE($B#4:5G428) 
=MOYENNE(B18:618 =MOYENNE(4544:4G428) 
=MOYENNE(518:618 =MOYENNE($B#4:$G428) 
=MOYENNE(B20:G2 =MOYENNE(#5#4:4G428) 
=MOYENNE(B21:G21 =MOYENNE($B#4:$G428) 
=MOYENNE(B22:G2 =MOYENNE($544:4G428) 
20 =MOYENNE(B23:G2 =MOYENNE(+544:4G428) 

=MOYENNE(B24:G2 =MOYENNE($5#4:5G428) 
A 22 -MOYENNE(B25:G2! =MOYENNE($B#4:4G428) 
PA 23 -MOYENNE(B26:G2 =MOYENNE(#B#4:4G428) 


=(MAX(E10:G10)-MIN(B10:G10: =K10+$/H"MOYENNE(#L$4:$L428) =K10-SJHMOYENNE(SLS4:$L$28) 
=(MAX(BIEGHI-MIN(BIEGIT)) =KitH/H'MOYENNE(SLS4:HL428) =KH-HJH"MOYENNE(SLS4:$L528) 
=(MAX(B12:G12)-MIN(B12:G12: =K12+$/H"MOYENNE(SLS4:$L528) =K12-H/HMOYENNE(SLS4:$L$28) 
=(MAX(E1S:G19)-MIN(EAS:GIS 2K13-$/H'MOYENNE(SLS4:$L528) =K1S-H/HMOYENNE(SLSS:$L$28) 
=(MAX(B14:G14)-MIN(B14:G 14 2K14+H/H"MOYENNE(SLS4:$L428) =K14-HJHMOYENNE(SLÉ4:$LS28) 
=(MAX(B1S:G15)-MIN(E15:G15)) =K15+4/H"MOYENNE(SLS4:$L428) =K15-HJH"MOYENNE(SLS4:$L428) 
=(MAX(E16:G16)-MIN(B16:G16: =K16+$/H"MOYENNE(#LS4:$L528) =K16-SJHMOYENNE(SLH4:$L$28) 
=(MAX(BT:GIT)-MIN(E17:G17)) =K1Te$ JS MOYENNE(SLS4:$L#28) =K1T-HJHTMOYENNE(SLÉ4:$L428) 
=2(MAX(B18:G18)-MIN(B18:G18 =K18+4/H'MOYENNE(SLSA4:$LS28) =2K18-HJH1MOYENNE(SLE4:$L428) 
=(MAX(B13:G13)-MIN(B19:G19° =K13+4/H"MOYENNE(#LS4:$L528) =K13-HJHMOYENNE(SLH4:$L$28) 
=(MAX(B20:G20)-MIN(B20:G£ =K20+4JH1'MOYENNE(SL#4:$L428 =K20-HJH'MOYENNE(#L$4:$L$28: 
=(MAX(B21G21)-MIN(B21G21 2K21+$/H"MOYENNE(SLS4:$L528) =K21-HJHMOYENNE(SLS4:$L$28) 
=(MAX(B22:622)-MIN(B22:GE =K22+4J$l'MOYENNE(SLS4:$L428 =K22-HUH'MOYENNE(SLSS:$L$28 
=(MAX(B23:G23)-MIN(B23:G2 =K23+4JH1'MOYENNE(SL#4:$L428 =K23-H/H'MOYENNE(SL$4:$L428" 
=(MAX(B24:G24)-MIN(B24:G2 =K2444JH1'MOYENNE(SLS4:$L$28 =K24-H/H"MOYENNE(SL$4:$L528: 
=(MAX(B25:G25)-MIN(B25:G2! 2K25+4J$"MOYENNE(SLS4:$L528) =K25-$JHMOYENNE(SLÉ4:$L425) 
=(MAX(B26:G26)-MIN(B26:G£ =K264/H"MOYENNE($LS4:$L528" =K26-H/H"MOYENNE(SLS4:$L428: 
24 =MOYENNE(B2T:G2 =MOYENNE(SB#4:40428) =(MAX(B2T:G2T)-MIN(B27:G2" =K27+$/H"MOYENNE(SL$4:$L528) =KT-HJHTIMOYENNE(SLE4:$L428) 

=MOYENNE(B28:G2 =MOYENNE($B#4:50528) -(MAX(B28:G28)-MIN(B28:G2 =K28+$J$TMOYEMNE(SLS4:$L428" =K28-H/H"MOYENNE(SLS4:$L28" 


Figure: 74.87 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


2 
3 
4 
5 =MOYENNE(B8:G6) =MOYENNE(B#4:4G428) 
6 
ï 
8 


Nous avons alors la carte de contrôle suivante: 
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CC MESURRÉE DE SHEWHART AUX MOYVENNES BASÉES SUR L'ÉTENDUE 
(KR BARRE- K) 


1004 


8 
$ 
ñ à 
10.02 
Ÿ + 
s 
à o 
10 d Ÿ 
» 
: 
à 
Ÿ 4 \ 4 —… 
Ÿ Y © 
d 


3% 


3.34 


3.32 


Figure: 74.88 - Carte de contrôle X barre - R 


À remarquer que cette carte de contrôle aurait selon les règles de la WECO zéro points au-delà des +3 
(nous indiquons cela pour des raisons de comparaison avec les cartes précédentes et les prochaines). 


La question est alors de savoir laquelle est le plus juste. Et c'est très délicat, car les limites de Shewhart 
comme nous l'avons déjà dit de nombreuses fois sont peu réalistes et supposent une distribution 
symétrique. Or, les calculs mathématiques détaillés du coefficient 4,(#) montrent que les limites ne 


devraient pas être symétriques. De plus, ce dernier coefficient est basé majoritairement sur une hypothèse 
de normalité de la distribution des mesures, ce qui lui ajoute une faiblesse supplémentaire. Cependant, si 
nous comparons à la toute première carte de contrôle avec l'écart-type court terme qui n'avait qu'une seule 
alarme, la carte de contrôle ci-dessus est plus réaliste que celle avec l'erreur standard qui affiche trop de 
fausses alertes. 


Ces difficultés que nous retrouvons à toutes les cartes de contrôle vues jusqu'à maintenant montrent qu'en 
fin de compte il faut mieux faire une analyse fréquentielle des mesures, déterminer la loi de probabilité et 
avec des outils spécialisés basés sur la méthode de Monte-Carlo, calculer les limites supérieures et 
inférieures pour un æ/2 donné. 


5.5. CARTES DE CONTRÔLES QUANTITATIVES AUTOCORRÉLÉES (AUX MESURES) 


La famille des cartes de contrôle autocorrélées est définie par le fait que soit les points sur la carte, soit les 
limites de contrôles sont calculées sur la base d'un certain nombre de points qui précèdent. 


Ces cartes ont pour avantage de nécessiter moins de données que les autres et d'amplifier le phénomène de 
déviation et donc de détecter les anomalies plus rapidement. 


Les règles de la WECO ne s'appliquent pas aux cartes autocorrélées. Si un point est à l'extérieur des limites 
calculées, il faut une action de correction. 
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5.5.1. CC A VALEURS INDIVIDUELLES BASÉES SUR L'ÉTENDUE MOBILE (I-EM X BARRE) 


En phase de prototypage, nous ne pouvons pas nous permettre de mettre en place le concept de 
prélèvement. De plus, la carte de contrôle mesurée avec moyenne et écart-type court terme ne permet pas 
de faire de l'inférence statistique, car la loi de distribution est supposée inconnue car le procédé non stable. 


Une solution intermédiaire consiste à considérer alors que le procédé est stable (hypothèse de normalité 
des données) et de calculer les limites à partir d'un nombre minimal d'individus qu'il est possible d'avoir 
pour faire une statistique, c'est-à-dire: deux! 


Cette situation est donc bien adaptée aux phases de prototypage ou dans le cas de procédés/processus à 
cadence lente ou dont les mesures (pièces) sont très onéreuses. 


Avantages: Complète les premières cartes à valeur individuelle que nous avons vues tout au début pour des 
situations où il est difficile d'avoir un grand nombre d'individus pour des raisons de coûts. Cette carte de 
contrôle est parfois considérée comme le couteau suisse du contrôle qualité. et elle est de plus en plus 
utilisée puisqu'elle correspond à la politique de la production "Just in Time" (JIT) de petites séries (pour la 
diminution des coûts). 


Problèmes: La démonstration mathématique de l'origine des limites de contrôles est ardue (voir chapitre de 
Statistiques pour le détail des et la détermination des coefficients nécessite l'utilisation de 
calculs par la méthode de Monte-Carlo (cf. chapitre de Méthodes numériques). Un autre problème, c'est 
que bien que la loi de probabilité de l'étendue puisse être choisie, elle est souvent donnée dans les livres 
spécialisés que pour la loi Normale. 


Afin de détourner le problème d'une estimation acceptable de l'écart-type, l'idée consiste à considérer deux 
mesures successives x,_1,x; Comme les variables aléatoires d'une statistique d'ordre dont nous calculons 


l'étendue en valeur absolue: 


74.507) 


MR=R=|x-%i=max(x,x)-min(xs,x) ( 


où MR signifie "Moving Range” (cette carte de contrôle est appelée parfois "carte-MR(2)"). Et nous avons 
alors: 


puisque nous avons forcément n-1 étendues mobiles. 


Nous reprenons alors les définitions de la carte de contrôle mesurée avec moyenne et écart-type court 
terme: 


USZ = imposé par client/direction 
UCLe = X+30y 

Clp=EÆ(X)=X 

T = objectif mposé par client/direction 
LCL = X-30; 

LSL = imposé par chent/direction 


(74.509) 
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et nous pouvons nous débarrasser du problème de l'estimation de &, en utilisant la relation démontrée 


dans le chapitre de Statistique dans le cadre de l'étude des statistiques d'ordre: 


R=Oyd}(x#) (74510) 


Ce qui nous amène alors à (il est impossible que le client fixe une limite USL, LSL ou une cible T en ce qui 
concerne l'étendue d'où le fait que ces paramètres ne soient cette fois-ci pas mentionnés): 


MR 
DCLrap ©2430 
CLyoem = À (74.511) 
MR 
LOLraee = À 35 
? 


ce qui est parfois noté: 
CLpocm = À (74.512) 
LCLpem = À - E MR 
Nous devons prendre dans le cas présent la valeur 4, pour x, = 2. Les tables nous donnent: 


d2(%)=d,(2)=1.128 (74.513) 


ce qui nous donne: 
DCLpoyr = X+2.66. MR 
CLyucr = À (74.514) 
LCLyoe = À — 2.66. MR 


Remarquons que nous pouvons alors calculer des probabilités de sous-groupes non-conformes par excès 
ou par défaut en utilisant le fait que X suit une loi Normale de paramètres: 


Na, o) = (x (74.515) 


dont il découle immédiatement que X suit une loi Normale de paramètres: 


52 
(ao) (x z | (74.516) 


c4 (2) 


Reprenons les données suivantes: 
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CN) L 3.3343 10.0196 3.9732 10.0088 3.9685 9.9544 
5 3.9721 3.9643 3.9426 3.9712 10.0259 10.0177 
6 9.9788 10.0213 3.9407 10.0696 10.0161 10.0709 
ï 10.0658 10.08 3.9514 9.9958 10.0338 10.0422 
8 10.0136 3.3791 3.9449 3.3403 3.9424 3.3421 
3 3.9495 10.0057 3.9715 10.0388 10.0013 3.9616 


10 3.9144 10.0321 10.0361 10.0253 10.0103 3.9935 
11 3.3748 3.9962 10.0363 10.15 3.9936 3.9741 
12 10.0063 10.0749 3.939371 3.978 3.9334 3.9555 
13 10.084 3.9619 10.0063 10.0364 3.3307 3.9762 
14 3.9436 10.0638 3.9617 10.0138 3.9672 3.9591 
15 10.0074 3.9817 9.9753 10.0541 3.9845 3.9107 
16 10.0063 10.0282 10.0385 9.3747 10.0323 3.986 
17 3.9836 10.063 3.9824 3.9909 3.9684 10.0575 
18 10.0317 10.0485 3.9653 10.0675 10.0047 10.0277 
15 3.3756 9.3174 3.9076 3.99309 10.018 3.9973 


20 3.3818 3.8962 3.3614 9.9612 3.9634 9.9349 
e1 10.0168 10.0043 10.0029 3.9549 10.0133 3.9691 

3.9857 10.0503 10.0381 3.381 3.9603 3.9123 
23 9.3878 3.9841 3.9496 3.9754 3.9532 10.0576 


24 10.0657 3.9838 3.9636 9.9779 10.0423 10.0547 
25 3.3564 10.0184 3.383 3.3333 10.0146 10.0145 
26 10.061 3.93443 3.9893 3.9833 3.9947 10.0033 


3.3054 3.3043 3.987 10.058 9.9156 3.9782 
3.9768 3.9954 3.9196 3.93341 9.9162 10.0721 


Figure: 74.89 - Mesures journalières sans arrêt de la machine 


Nous avons alors: 


EN d2 1128 


4 1 33343 33333 0.0447 04635 3.687 101 

s 2 100136 3.3333 0.0253 0.0447 ° 01635 3.87 101 

6 3 331732 33333 0.0464 0.0447 . 01635 3.87 101 

7 4 100085 3.333353 0.0556 0.0447 . 014635 387 101 

: 5 33685 3.3333 0.0403 0.0447 . 014635 387 101 

8 6 33544  3.3333 0.0141 0.0447 ° 01635 3.87 10.11 

10 J 3.9721 3.3333 0.017? 0.0447 ° 01635 387 101 
LL 5 336435 3.3333 0.0078 0.0447 - 01635 3.87 101 
12 3 33426 3.3333 0.0217 0.0447 . 014635 3.87 101 
1 10 3.3712 3.3333 0.0266 0.0447 . 01635 3.87 10.1 
14 11 100253 33333 0.0547 0.0447 s 01635 3.87 101 
15 12 100177 3.393353 0.0082 0.0447 - 01635 387 101 
LL 15 393788 3.933353 0.0583 0.0447 . 01635 9387 101 
17 14 100215 3.3333 0.0425 0.0447 . 014635 3.87 101 
1 15 33407 3.3333 0.0806 0.0447 ° 01635 3.67 10.11 
13 16 100636 3.3333 01253 0.0447 - 01635 387 101 
20 17 100161 3.3333 0.0535 0.0447 . 01635 3.87 101 
21 15 100703 3.3333 0.0545 0.0447 . 01635 3.87 101 
CON 13 100655 3.3933 0.0051 0.0447 . 014635 3.87 101 
CM 20 100800 3.393353 0.0142 0.0447 Q 01635 387 101 
ÆR 21 33514  3.3333 01256 0.0447 - 01635 387 101 
CN 22  3.3358 9.3933 0.0444 0.0447 . 014635 387 101 
EN 23 100538 33933 0.0380 0.0447 . 01635 93.87 10.11 
EN 24 100422 33933 0.0084 0.0447 : 01635 3.87 10.11 
CN 25 100156 3.39333 0.0286 0.0447 . 01635 9387 101 
ER 26 3.9731 3.3333 0.0345 0.0447 . 01635 387 101 
EU 27 3.934493 9.3933 0.0542 0.0447 . 014635 3.87 101 
3 28 393403 33333 0.0046 0.0447 . 01635 3.87 10.11 
23 39424 3.3333 0.0021 0.0447 ° 01635 9387 101 

30 33421 33333 0.0003 0.0447 . 01635 387 101 

31 33435 3.933353 0.0074 0.0447 . 01655 9387 101 

32 100057 3.3333 0.0562 0.0447 : 01635 3.87 10.11 

33 33715  3.3333 0.0342 0.0447 . 01635 387 101 

34 1003558 3.393353 0.0673 0.0447 : 01635 387 101 

35 100013 3.3333 0.0563 0.0447 . 014655 3.87 101 

EM 56 3.3616  3.3333 0.04053 0.0447 . 01635 3.87 101 
<< Eu 3.3144  3.3333 0.0472 0.0447 ° 01635 3.87 101 
CINN 35 100521 3.3933 OA177 0.0447 Q 01635 387 101 
CEN 53 100561 3.3933 0.0040 0.0447 . 014635 387 101 
CE 40 100253 3.3933 0.0108 0.0447 - 01635 93.87 101 
COR 41 100103 3.3333 0.0144 0.0447 . 01635 3.87 10.11 
CE 42 393335 9.3333 0.0174 0.0447 ° 01635 3.87 101 
UN 45 33748 3.393353 0.0187 0.0447 . 014635 387 101 
CON 44 39362 3.3333 0.0214 0.0447 . 014635 3.87 101 
CE, 45 100563 33333 0.0407 0.0447 . 014635 387 101 


Figure: 74.90 - Indicateurs correspondants aux mesures obtenues 
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Soit (nous avons coupé la capture d'écran en deux parties faute de place): 


1128 


[ 
A) d2 
IN Mesures CL Etendue Mobile 
CE 1 3.3343  =MOYENNE(#J$4:4)4153) 
5 E 10.0196  =MOYENNE($J44:4/$153) =4BS{J4-J5) 
(Al: 33132  -MOYENNE(#H/44:4/4153) =ABS(J5-J6) 
(4 100088 =MOYENNE(HJ#4:4/153) =ABS(J6-J7) 
ls 33685 =MOYENNE(HIH4:4/153) =ABS(UT-J8) 
ls 33544  -MOYENNE(HJ#4:4)4153) =ABS(J8-J3) 
Ur 39721  =MOYENNE(HJ$4:4/5153) =ABS(J3-J0) 
“ E 33643  =MOYENNE($J$4:494153) =4BS(NMO-JN) 
PS 33426  =MOYENNE(HJ4:4/153) =ABS(JN-J12) 
3 33712  =MOYENNE(HJ4:#/5153) =ABS{J12-J13) 
10.0253  =MOYENNE(4J44:4)4153) =4BS(NS-JN4) 
10.017  =MOYENNE(HJH4:HUH153) =ABS(J14-J15) 
3.8788  =MOYENNE(HJ$4:#/153) =4BS(J15-M6) 
10.0213  =MOYENNE($J44:4)4153) =ABSCN6-JT) 
33407 =MOYENNE(HI$4:#)#153) =ABS(JT-J8) 
100636  =MOYENNE(#J$4:#/5153) =ABS(J18-J18) 
10.0161 =MOYENNE($J44:4/4155) =4BS(M3-J20) 
10.0703  =MOYENNE($J$4:4/4153) =4BS(J20-J21) 
10.0658  =MOYENNE($J44:414153) =4BS(J21-J22) 
10.05 =MOYENNE($J44:494153) =4BS(J22-J25) 
9.3514  =MOYENNE($J$4:$/$153) =4BS(J23-J24) 


et: 


=M4+5/$J$1"M4 
ESS $J TMS 
EM6+5/$JH ME 
MTS SJHTMAT 
EMS+5/ 4/1 MS 
EMS+5/ 4/1" MS 


UCL étendue mobile 


Moyenne étendue mobile 

=SOMME(SL#4:$L4153)/ (NE (#144:#1$153)-1) 
=SOMME(#LS4:#L4153)(NB(#14:#15153)-1) 
=SOMME(SLE4:$LH153)/(NB(#I44:818153)-1) 
=SOMME(SLS4:$LH153)/ (NB (#I44:418153)-1) 
=SOMME(#L44:$L4153)/(NB(#144:818153)-1) 
=SOMME(SLH4:$LH153)NB(#I#4:41153)-1) 
=SOMME(#L$4:4L4153)(NB(#14:#15153)-1) 
=SOMME(SLE:$L#153)/(NE(#I44:418153)-1) 
=SOMME(#L$4:4L4153)/(NE(#I$4:418153)-1) 
=SOMME(SLS4:4L4153)(NB(#I$4:#15153)-1) 
=SOMME(SLE:$LH153)/(MB(#I44:818153)-1) 
=SOMME(SLS4:$LH153)/(MB(#I44:#15153)-1) 
=SOMME(#LS4:4L4153)/(NB(#$4:$18153)-1) 
=SOMME(SLS4:$L4153)/(NE(#I$4:#15153)-1] 
=SOMME(#L44:$L4153)/(NB(#14:415153)-1) 
=SOMME(#LH4:$L4153)(NB(#14:#15153)-1) 
=SOMME(SLS4:4L4153)/(NB(#44:#18153)-1) 
=SOMME(SL#4:4L#153)/(NE(#144:414153)-1) 
=SOMME(SLE4:HL4 153) NB(#I$4:#18153)-1) 
=SOMME(SLE4:$LH153)/(NB(HI44:415153)-1) 
=SOMME(SLS4:4L4153)/(NB(#44:815153)-1) 


=AMO+5 14/41 MO 
25 SJ MN 
=MMS+5 4/41 
ENS SJ NS 
2Md+5 SJ TS 
2hMS+S/$J$ I AS 
CULLRESTE 1 LL 
= SI SJ STMAIT 
2MMS+ 54/41 MS 
2AMS+3/4J41" NS 
=M20+5/$J$1"M20 
=Mat+5 4/2 
2M22+5/$J41 122 
EM25+5/4Jf MES 
=M24+5/$Jf1"M24 


LCL CR 
=KA-GISISTMS  =K4+S/SUHT MS 
=K5-S1$JH1MS =KS+SISIHIMS 
=K6-SHUSTME  =K6+S/HUHTME 
=KT-SISJHTAAT EKT+ SI SJHRAT 
=KS-SHISTMS  =K8+S/HJHT MS 
=KS-SISISTMS  =2K3+S/JHTMS 
=K10-S/HJHMNO  =K10e5/$JH "MO 
=K11-3/4J81 011 =Ktte3/$J#1" m1 
=Kt2-S/4JHMtS  =Kt2+5/4J4tMtS 
=KAS-SHHMNS  =K1SeS/HJHMTS 
=K14-SISJHMMNS  =K14e5/$UHtIIA 
=K15-3/$J$1" ANS =K15+3/$JH1" 15 
=K16-SIHJHANE  =2K16+3/4JH"ME 
=KAT-SIJETANT  =KATeS/STIMIT 
=KB-SHUHANS  =K18eS/HJHME 
=KA19-S/$JHRMS  =2K1SeS/HUHMAS 
=K20-5/HJ$1M20  =K20+3/$J$1M20 
=Kat-S4JH"MET  =K2teS/4JH"MEt 
=K22-S/HSTM2S  =K22+5/4J$T M2 
=K23-SIHISTMES  =2K23+5/8JHT MS 
=KB4-HIHISTMSS  =K24+5 ST M2S 


Figure: 74.92 - Suite des 


Nous avons alors le graphique: 


LCL étendue mobile 
=SI(M4-S/4JHTMA<O:O:M4-3/4JH1"M4) 
=SIMS-3/4JHTMS<0;0MS-SISUHMAS) 
=SI(ME-SI4JHT ME <O0ME-3/HJH1"ME) 
=SIMT-SIH ST MT O;OAT-SIS UT MAT) 
=SI(MS-SIHJSTMS<0;0:MS-SHJH ME) 
=SI(MS-S/HJHTMS<0;0:MS-314JH"MS) 
=SI(MO-S/ 041 MOD 00-54 IH PA10) 
=SIAN-SIS TAN O OASIS UE INAN] 
=SI(MAtS-3/4JH1"M2<0;0:M12-5/4 JMS) 
=SIMMS-34JH MS O;ONMS-SIHUT MS) 
=SIMIS-S USA OMIS- SSII PAIS) 
=SIMIS-S HU MMS<O:0:MAS-S/S JT AIS] 
=SIME-3/8 081 ME <O0ME-S/S JAMIE) 
=SIMMT-SS HAT OOMAIT-31 USA PAIT] 
=SI(MS-S IH ME OOMS-S/HUH NAS) 
=SI(MIS-S USINE OMMI-S HIHI NAIS) 
=SI(M20-3/4J$1M20<0:0:M20-3/4J$1"M20) 
=SI(MEt-SUH I M2<O0M2t-5/8 4121) 
=SI(M22-3/4JHTM22<0:0M22-3/$J$1"N22) 
=SI(M2S-SI4JSTMES<OCM23-3/HJH1"M2S) 
=SI(M24-SIHJSTME4<O:0MI24-3/$J$1"A24) 


Figure: 74.91 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


formules Microsoft Excel 14.0.6123 explicites du tableau antéprécédent 
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CC MESURÉE DE SHEWHART DELA MOYENNE A VALEURS INDIVIDUELLES BASÉES SUR L'ÉTENDUE MOBILE 
(L-EM X BARRE) 


0.15 


005 


® & 


3% 


33 


0 5 10 15 2 25 2 35 4 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 


Figure: 74.93 - Carte de contrôle I-EM X barre 


À remarquer que cette carte de contrôle aurait selon les règles de la WECO zéro points au-delà des +3 
(nous indiquons cela pour des raisons de comparaison avec les cartes précédentes et les prochaines). 


5.5.2. CC A VALEURS INDIVIDUELLES AVEC ÉTENDUE MOBILE (I-EM EM BARRE) 


La carte précédente utilisant la tendance centrale doit être complétée (au même titre que toutes les autres 
cartes précédentes à tendance centrale) avec une carte affichant la tendance de la dispersion (les 
avantages et problèmes de cette carte de contrôle sont les mêmes que la précédente). 


Nous reprenons alors les définitions d'une carte de contrôle mesurée pour obtenir: 
DC'Lygr = MR + Tr 
Clyge = MR (74.517) 
LCLyge = MR = 3e 


Encore une fois, l'écart-type de l'étendue mobile (EM) se construit de la même manière que l'écart-type de 
l'étendue. Nous avons alors: 


_ CL)MR 
d; (4) 


(74.518) 


Dès lors il vient (il est impossible que le client fixe une limite USL, LSL ou une cible T'en ce qui concerne 
l'étendue d'où le fait que ces paramètres ne soient cette fois-ci pas mentionnés): 
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— —  dRIMR — 
UC'Lye = R+30 ge = MR +32 COUR _ R|1+3 


Clg = MR (74.519) 


LCL = MR 30e = MR-3 UMR 57); 343 Cu) 
d, (x) d; (2) 


ce qui se note au même titre que la carte de contrôle à l'étendue: 


V 39943 100196 99732 100088 99685 9.954 
39721 99643 99426 99712 100253 100177 
39788 100213 99407 1006936 100161 10.0709 
10.0658 1008 99514 99958 100338 10.0422 
100136 99791 99449 99403 99424  9.9421 
33495 100057 99715 100388 100019 3.966 
3.9144 100321 100361 100253 100109 9.9935 
3.9748 99962 100369 1015 99996 9.9741 
100063 100749 99971 9978 99934  9.9555 
10.084 99619 100063 100364 99907 99762 
3.3436 100638 99617 100138 99672 9.959 
100074 99817 99753 100541 99845  9.9107 
100063 100282 100385 99747 100323 9.986 
39836 10063 99824 99909 99684 100575 
100317 100485 99653 100675 100047 10.0277 
39756 99174 99076 9.99309 10018  9.93973 
39818 98962 99614 99612 99694 9.93349 
10.0168 100043 100029 99549 100193 9.9691 
39857 100503 100381 9.981 99603  9.9123 
39878 99841 99496 99754 99532 100576 
100657 99838 99636 99773 100423 100547 
39564 100184 93989 999933 100146  10.0145 
10061 93443 99899 99833 99947 10.0033 
33054 99049 9.987 10058 99156 9.9782 
23 39768 99954 99196 99341 99162 100721 


Figure: 74.94 - Mesures journalières sans arrêt de la machine 


Puisque la carte est avec des valeurs individuelles, avec l'étendue mobile nous avons »# = 2. Nous trouvons 
dans les tables: 


Datn)= D3(2)=0,D4(n,)= D4(2)= 3.267 (74.521) 


Ce qui nous donne: 
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Soit: 


10.0196 


Î 

2 

3, 9.9732 

+ 100088 

5 99685 

6 3.9544 

7  9.9721 

8 939643 

3 33426 
10 33712 

1 10.0253 
12 100177 
13 39788 
14 10.0213 
15 33407 
16 100636 
17 10.0161 
18 10.0703 
13 100658 
20 10.0800 
21 33514 
22 3.9958 
23 10.0338 
24  10.0422 
25 10.016 
26  3.9791 
27 9.9449 
28 9.3403 
29  9.9424 
30  3.3421 
31 33495 
32 100057 
33 3.9715 
34  10.0388 


Figure: 74.95 - Indicateurs correspondants aux mesures obtenues 


3.3333 
3.3933 
3.9933 
3.9933 
3.9333 
3.3933 
3.9333 
3.9933 
3.3333 
3.9933 
3.3933 
3.9933 
3.9933 
3.3933 
3.9333 
3.3333 
3.9933 
3.3333 
3.9933 
3.3933 
3.9933 
3.9933 
3.9333 
3.3333 
9.3933 
3.9933 
3.3933 
3.9933 
3.3333 
3.9933 
3.9933 
3.3333 
3.3333 


0.0253 
0.0464 
0.0356 
0.0403 

0.0141 
0.0177 
0.0078 
0.0217 
0.0286 
0.0547 
0.0082 
0.0383 
0.0425 
0.0806 
01283 
0.0535 
0.0548 
0.0051 
0.0142 
01286 
0.0444 
0.0380 
0.0084 
0.0286 
0.0345 
0.0342 
0.0046 
0.0021 
0.0003 
0.0074 
0.0562 
0.0342 
0.0673 


0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
0.0447 
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l 
D3 
à D4 

IN Mesure Moyenne 
Pl 99943 -MOYENNE(HJ#5:$J#154) 
6 10.196  =MOYENNE(#$J#5:#$J#154) 
3 99732 -MOYENNE(#J$54J$154) 
CR 4 10.0088 =MOYENNE(#$J#5:#J#154) 
3 E 3.9685  =MOYENNE(#$J#5:#$J#154] 
LR 6 9.939544  =MOYENNE(#$J#5:#J#$154) 
1 99721 =MOYENNE(#$J#5:#$J$154) 
re E 939643 -=MOYENNE(#J#5:#$J$154] 
5 El 9.3426  =MOYENNE(#$J#5:#J/#154)] 
CIO 99712 =MOYENNE(#J#5:$J$154] 
5 10.0253 =MOYENNE(#$J#5:#J#154)] 
LAN 12 100177 =MOYENNE(#$J#5:$J$154) 
LU 13 939788 =MOYENNE(#$J#5:#J#154) 
CN 14 100213 =MOYENNE($J#5:#J#154] 
EMI 15 99407 -=MOYENNE(#J#5:#$J$154] 
CM 16 100696 =MOYENNE(#J#5:#$J$154) 
17 100161 =MOYENNE(#J#5:$J#154] 
18 100709 =MOYENNE(#$J#$5:$J#154) 
513 100658 =MOYENNE(#J#5:#$J$154] 
20 20 10.08 = MOYENNE($J#5:$J4$154) 
CI 21 99514  -=MOYENNE(#$J#5:#$J#154) 
CL 22 99958 -=MOYENNE(#J#5:#$J$154] 
EN 23 100338 =MOYENNE(#J#5:#J#154) 
24 100422 =MOYENNE(#J#5:$J#154] 
CN 25 10016 -=MOYENNE(#J#5:#J#154) 
UN 26 99791 =MOYENNE(#J#5:#$J$154] 
127 99449 -MOYENNE(#J#5:#J$154] 
28 99403 =MOYENNE(#J#5:$J#154] 
293 99424 -=MOYENNE(#J#5:$J#154] 
E30 99421 =MOYENNE($J#5:#J$154) 
3 99495 -MOYENNE(#J$54J$154) 
32 100057 =MOYENNE($J#$5:$J$154)] 
33 939715 =MOYENNE($J#5:#J#154) 


Etendue Mol Moyenne étendue mobile (CL) 

= SOMME(SL#5:$L#H154)(NB($I#5:#14154)-1) 
=SOMME(SLS5-$L$154)(NB(#IS5:#18154)-1) 
= SOMME(SL#5:$L#154)(NB(#I$5:$18154)-1) 
=SOMME(S$L#5:$L#154){NB(#I85:#1#154)-1) 
=SOMME(SL#5-$L$154)(NB(#I85:#18154)-1) 
=SOMME(S$L#5:$L#154){NB(#I85:#1#154)-1) 
=SOMME(SL#5-$L$154)(NB(#I85:-#18154)-1) 
=SOMME(SL#5:$L#154)(NB(#I5:#1#154)-1) 
=SOMME(SL#5:$L#154)(NB(#I85:#1#154)-1) 
= SOMME($L#5:$L#154)/{NB(#I#5:#18154)-1] 
=SOMME(SL#5-$L$154){NB(#I$5:#18154)-1) 
=SOMME(SLÉ5-$L$154)(NB($I85:#18154)-1) 
=SOMME(S$L#5:$L#154){NB(#I85:#1#154)-1) 
=SOMME(SL#5:$L#154){NB(#I#5:#1#154)-1) 
= ABS(J8-J19] =SOMME(SLÉ5-$L#154)(NB(#I#5:#1#154)-1] 
= ABS(J19-J20) = SOMME($L#5:$L$154){NB(#I#5:#1#154)-1] 
= ABS(J20-J21) =SOMME($L#5:$L#154)/{NB(#185:#1#154)-1] 
= ABS(J21-J22) = SOMME($L$5:$L#154)(NB(#I#5:#1$154)-1) 
= ABS(J22-J23) = SOMME($L#5:$L$154){NB(#I$5:#1#154)-1] 
= ABS(J23-J24) = SOMME($L$5:$L$154){NB(#I$5:$1$154)-1) 
= ABS(J24-J25) = SOMME($L#5:$L$154){NB(#I$5:#1#154)-1) 
= ABS(J25-J26] = SOMME($L45:$L#154){NB(#1$5:#1$154)-1) 
= ABS(J26-J27) = SOMME($L$5:$L#154){NB(#I$5:#1#154)-1) 
= ABS(J27-J28) :SOMME($L#5:$L$154){NB($I$5:#1#154)-1] 
= ABS(J28-J29] = SOMME($L$5:$L#154){NB(#1$5:#1$154)-1) 
= ABS(J29-J30) = SOMME($L#5:$L$154){NB($I#5:#1#154)-1) 
= ABS(J30-J91) = SOMME($L$5:$L#154){NB(#IS5:#1$154)-1) 
= ABS(JH-J32) = SOMME($L$5:$L#154){NB(#I$5:$1#154)-1) 
= ABS(J32-J33)] = SOMME($L#5:#$L#154)(NB(#I$5:#1#154)-1) 
= ABS(J33-J34] = SOMME($L$5:$L#154){NB(#I$5:$1#154)-1) 
= ABS(J34-J35] : SOMME($L$5:$L#154){NB(#I$5:#1$154)-1] 
= ABS (J35-J96] = SOMME($L$5:$L#154) {NB (#I$5:$1$154)-1) 
= ABS(J36-J37) = SOMME($L#5:$L$154){NB($1$5:#1#154)-1] 


= ABS(J5-J6) 
= ABS{J6-U7) 
= ABS{(J7-J8) 
= ABS(J8-J9) 
= ABS(J3-J10) 
= 4BS(J10-J11) 
= ABS{J11-J12) 
= ABS(J12-J13] 
= ABS(J13-J14) 
= ABS(J14-J15) 
= ABS(J15-J16) 
= ABS(J16-J17) 
= ABS{(J17-J18) 


LCL 

= MS" #$J#1 
=M6"$J$1 
=M7"#J$1 
=M8"$J$1 
=MS9"$J$1 
210 $J$1 
= $J$1 
=M12"#J#1 
= M3" $J#1 
=M#"$J$1 
= MMS" $J$1 
=MME"$J$1 
=" #$J#1 
28" $J#1 
=M9"#$J$1 
=M20"#$J#1 
=M2T$J$1 
=M22"#J#1 
=M23"#$J#1 
=M24"#$J$1 
=M25"#$J$1 
=M26"$J#1 
=M27"#J$1 
=M28"#$J$1 
=M29"#$J$1 
=M30"#$J#1 
= M3" #J#1 
=M32"#J#1 
=M33"$J#1 
=M34"#$J#1 
=MS35"#$J#1 
=M36"#J$1 
=M37"#$J#1 


Figure: 74.96 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Nous avons alors la carte de contrôle suivante: 


UCL 

= MS" $J$2 
=M6"$J$2 
=MT"$J$2 
=MS8"$J$2 
=MS9"$J$2 
=MM0"$J$2 
=M$J$2 
=M2"$J$2 
=M"$J$2 
=Mi#"$J$2 
=MMS"$J$2 
=ME"$J$2 
=MNT$J$2 
=MMS"$J$2 
=M9"$J$2 
=M20"$J$2 
=M2T$J$2 
=M22"$J$2 
=M23"$J$2 
=M24"$J$2 
=M25"$J$2 
=M26"$J$2 
=M27"$J$2 
=M28"$J$2 
=M23"$J$2 
=M30"$J$2 
=MIT$J$2 
=M32"$J$2 
=M33"#$J$2 
=M3#$J$2 
=MS35"$J$2 
= ME" $J$2 
=M37'$J$2 


0 
0 5 1 


CC MESURRÉE DE SHEWHART À VALEURS INDIVIDUELLES DE L'ÉTENDUE MOBILE 


15 À 23 20 3% à & © S © & À 


(L-EM BARRE - EM) 


——Etendse Mobile —Moyerne 
==" VCt 


mms CE. 


75 80 35 9% % 100 105 110 115 120 125 130 135 


140 145 150 


Figure: 74.97 - Carte de contrôle I-EM barre - EM 
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Nous voyons que la carte de contrôle avec étendue mobile semble beaucoup plus sensible que n'importe 
quelle carte. Mais le problème subsiste quant à savoir si l'observation que nous faisons de cette carte est 
correcte dans le sens où l'étendue mobile ne suit pas une loi de distribution symétrique contrairement à ce 
que présuppose les limites fixes de Shewhart. 


Il faut aussi savoir que certaines règles de la WECO (les règles concernant les séquences) ne s'appliquent 
pas sur ce type de carte puisque les données y sont autocorrélées. 


5.5.3. CC MOYENNES MOBILES (MA) 


Nous supposons toujours que la caractéristique suit une loi Normale et que l'on prélève des échantillons de 
taille constante n. La moyenne mobile de durée h à l'instant t, montée Àf, est définie par la moyenne 


mobile (moving average) vue dans le chapitre de Statistiques: 


_A+kit.+P 


M, : 


Le paramètre h est appelé aussi horizon. Plus grande sera la valeur de h meilleure est l'efficacité de la carte 
pour la détection des petits déréglages. 


Lorsque ; > }, en supposant l'indépendance entre les échantillons, nous obtenons : 


| 
il — 
ne: 
I 

+ 
PI 

1 

+ 

: 
L 
nn 


(74.523) 


lé es lLÈ € 1e + 
F(M,)=— > 4 | = D, —=—h—=— (74524) 
h° je ha khan % NO n  hn 
Soit: 
Ge (4 25) 
Re «229 
Et: 
X,+X,,+.+X. eo : 
E(4,) 2 Eat Bt Leg rie Eu) 
(74.526) 
7 2 
k 
Donc: 
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œ 
UCLyga = M, +3 — 

MA t Vin 
Clyya = À (74.527) 
D M — 


Avantages: Le fait que l'on lisse les données avec une moyenne mobile ayant pour objectif d'adoucir les 
fortes variations rend cette carte très bien adaptée aussi aux petites productions raison pour laquelle on 
l'utilise principalement pour des mesures individuelles dont le nombre se situe au moins aux alentours de 

10 (ceci dit elle est utilisable aussi pour des mesures groupées). Par ailleurs dans l'exemple qui suivra, nous 
nous limiterons à cas de figure particulier! Nous voyons aussi que les limites de la carte seront d'autant plus 
petites que h est grand. Donc la carte peut être très sensible aux petites variations. 


Problèmes: L'écart-type est supposé connu ou du moins calculé suffisamment précis pour que l'estimateur 
converge vers la valeur théorique. Tous les échantillons doivent avoir une taille identique n si nous utilisons 
l'écriture développée ci-dessus (sinon les logiciels implémentent le cas où cette condition n'est pas 
satisfaite). 


Prenons le tableau de données suivant: 


4 
5 
6 
T 
8 
5 


M NN 
Figure: 74.98 - Mesures individuelles sans arrêt de la machine 


Puisque la carte est avec des valeurs individuelles, nous avons # = 1. Et le système, en utilisant l'étendue 
mobile pour l'estimation de l'écart-type, se réduit donc à: 


Li ns up 

"a ACIN 
DZ (74.528) 
ICE er ar so 


donc outre les dénominateurs avec la racine de h, les paramètres CL, UCL et LCL sont les mêmes que la 
carte de contrôle I-EM X barre. 
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Nous devons prendre dans le cas présent la valeur 4, pour #, = 2. Les tables nous donnent: 


Ce qui nous donne: 


di(%)=d2(2)=1.128 (74.529) 


3.998975 
3.992525 
3.976225 
3.397595 
3.964825 
3.395835 
9.96255 
3.976 
3.38935 
3.9984 
10.010925 
3.989625 
10.0026 
10.011925 
10.024325 
10.0556 


ñn 
| _ 
D PR + S wo co -4 0 M + 6 Po 


r D © 2 à 
2.6 à 

D PS PE PO 

DS OMJNON + 


CL Etendue Mobile Moyenne étendue mobile LCL  UCL 

9.3987 00392 99467 100508 
9.3987 0.0253 0.0392 99467 10.0508 
9.9987 0.0464 00392 99467 100508 
9.3987 0.0356 00392 99467 10.0508 
9.9987 0.0403 00332 99467 100508 
9.9987 0.0141 00392 99467 10.0508 
9.9987 0.0177 003932 99467 100508 
3.3987 0.0078 00392 99467 10.0508 
9.3987 0.0217 003932 99467 100508 
9.3987 0.0286 00392 99467 10.0508 
9.9987 0.0547 003932 99467 100508 
9.3987 0.0082 00392 99467 10.0508 
9.9987 0.0333 00332 99467 100508 
9.9987 0.0425 00392 99467 10.0508 
9.9987 0.0806 00332 99467 100508 
9.9987 01289 00392 99467 10.0508 
9.9987 0.0535 003932 99467 100508 
9.9987 0.0548 00392 99467 10.0508 
9.9987 0.0051 003932 99467 100508 


Figure: 74.99 - Indicateurs correspondants aux mesures obtenues 


Soit (nous avons coupé la capture d'écran en deux parties faute de place): 


et: 


=SOMME(AS:A8)44 
=SOMME(A6:A9)44 

=SOMME(A7:410)44 

=SOMME(AS:A1144 

=SOMME(AS-A12)44 

=SOMME(410:418)44 
=SOMME(A ITA 14)44 
=SOMME(A2:415)44 
= SOMME(A3:A16)44 
=SOMME(ANS:417)44 
=SOMME(A15:418)44 
=SOMME(A16:419)44 
=SOMME(A17:420)44 
=SOMME(A 8: 42144 
=SOMME(A19:422)44 


CL Etendue Mob Moyenne étendue mobile 


=MOYENNE($A$5:$ 4423) 
=MOYENNE($A$5:$A$23) = ABS(A5-A6) 
=MOYENNE($A#5:$4923) = ABS(A6-A7) 
=MOYENNE($A$5:$A$23) = ABS(A7-A8) 
=MOYENNE(#$A$5:$4923) = ABS(A8-A9) 
=MOYENNE($A$5:$4$23) = 4BS(43-A10) 
=MOYENNE($A4$5:$4$23) = 4BS(410-A11] 
=MOYENNE($A$5:$4$23) = ABS(A-A12] 
=MOYENNE($A$5:$4423) = ABS(412-A13) 
=MOYENNE($A$5:$4423) = ABS(A13-A14) 
=MOYENNE($A#5:$4923) = ABS(A4-A15) 
=MOYENNE($A$5:$4923) = 4BS(415-416) 
=MOYENNE($A$5:$4423] = ABS(A16-A17) 
=MOYENNE($A$5:$4$23] = ABS(A17-A18) 
=MOYENNE($A$5:$4923) = ABS(A18-A19) 
=MOYENNE($A$5:$4423) = ABS(419-220) 
=MOYENNE($A$5:$A$23) = ABS(420-A21] 
=MOYENNE($A$5:$4423) = ABS(A21-222) 


=SOMME($F#5:$F #22 (NB(#C#5-$C#23)-1] 
=SOMME($F#5:$F #22) (NB(#C#5:$C#23)-1) 
=SOMME(SF#5:$F#23)NB($C#5-$C$23)-1] 
=SOMME($F#5:$F #22) (NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F #23) {NB($CS#5-$C#23)-1) 
=SOMME($F#5:$F #22) (NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F #22) (NB($C#5:$C#23)-1) 
=SOMME($F#5:$F #23 (NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F#22MNB(#C#5:$C#23)-1) 
=SOMME($F#5:$F #22) (NB($CS5-$C#23)-1) 
=SOMME($F#5:$F #22) (NB(#C#5:$C#23)-1) 
=SOMME($F#5:$F #22) {NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F#22M(NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F #22 (NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F #22) (NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F #23) (NB(#C#5-$C#23)-1) 
=SOMME($F#5:$F #22 (NB(#C#5-$C#23)-1] 
=SOMME(SF#5:$F#23)NB($C#5-#C#23)-1] 


=SOMME(420:423)4 =MOYENNE($A#5:#4422) -4BS(422-423) -SOMME($F#5:$F#23)M{NB(#C#5:$C#23)-1) 


Figure: 74.100 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent (première partie) 
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LCL UCL 
=E5-3"G5($D$TRACINE($D$2)) 253" G5/($D$TRACINE($D#2)) 
=E6-3"G6/($D$TRACINE(#D#2))  =E6+3" G6/($D$TRACINE($D$2)) 
=E7-3"G7($D$TRACINE($D$#2))  =E7+3"G7{$D$TRACINE(#$D#2)) 
=E8-3"G8($D$TRACINE(#D#2))  =E8-3"G8/($D$RACINE($D42)) 
=E9-3"GS($D#YRACINE($D#2))  =E9+3"GS/($D#'RACINE($D#2)) 
=E10-7"Gt0($O$TRACINE(#O#2)) =E10+3" Gi0($D$TRACINE($D#2)) 
=Ett-2"GN{$D$T RACINE($D$2))  =Ett3"GN{$D$TRACINE($D#2)) 
=E12-3"GI2/($0$RACINE(#$O$2)) =E12+3"G12/(#D$1 RACINE(#D$2)) 
=E13-3"GIH($O$TRACINE(#O#2)) =E13+3" Gt#($D$TRACINE($D$2)) 
=Et#-3'GIW(HOSRACINE(#D#2)) =Et4+3 Gi#{#O$lRACINE(#D#2)) 
=E15-3"GI5#O$TRACINE(#D$2)) =E15+3" G15/$D$1RACINE($D#2)) 
=Et6-3"GI6/(HOST"RACINE(#D#2)) =E16-3" Gi6/(#O$"RACINE(#D$2)) 
=E17-2"GI7(#O$TRACINE(#D$2)) <E17+3" G17/$D$1RACINE($D$2)) 
=Et8-3"Gi8/(#O$"RACINE(#D#2)) =Et8-3" G8/(#0#"RACINE(#D#2)) 
=E19-3"GiS/{$O$TRACINE(#D#2)) =E19-3 Gi9/{$D$1 RACINE($D$2)) 
=E20-3"G20/($D$T RACINE(#$D$2)) =E20+3"G20/$D$1RACINE($D#2)) 
=E213"G2($0$TRACINE(#O$2)) =E213"G2M($D$TRACINE($D#2)) 
PA -E 22.7 G22($0$RACINE(#$O#2)) -E22+3"G224($0$TRACINE(#D#2)) 
A -E23-3 G2H(#$0$'RACINE(#O#2)) -E23+3"G23/($0$'RACINE(#D$2)) 


Figure: 74.101 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent (deuxième partie) 


Nous avons alors la carte de contrôle suivante: 


CCMEUFFIF DE “HF WHAFT À VALEURS INDIVIDUELLE* DE LA MOYENNE MOBILE 
X BAFFF-IMA) 
10 08 
10 96 
1004 
1002 
10 
9. 
9. 
9.94 
[r) 5 10 15 2 


Figure: 74.102 - Carte de contrôle à valeurs individuelles de la moyenne mobile (X barre - I-MA) 
5.5.4. CC CUSUM AVEC V-MASQUE EMPIRIQUE 


Un des principaux inconvénients des cartes de type Shewhart est de ne baser l'analyse que sur les dernières 
informations recueillies (hypothèse d'indépendance des mesures). Elles ignorent les informations relatives 
aux tendances du procédé contenues dans les dernières estimations. Il faut savoir que de nombreux 
instituts de normalisation qualité dans le monde (AFNOR ou ASQ) considèrent les cartes de Shewhart 
comme complètement obsolètes (à tort ou à raison?) et préconisent les cartes de type CUSUM car utilisent 
l'autocorrélation et l'amplification des variations. 
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Dans les années 1950 des cartes de contrôle appelées donc CUSUM (CÜUmulated Sum: somme cumulée) ou 
"cartes de Page-Hinkley" (en honneur à leurs inventeurs) ont été introduites par des statisticiens pour 
détecter de petites variations. Même si elles sont mathématiquement plus optimales, elles sont difficiles à 
configurer correctement et très sensibles aux paramètres initiaux. 


Le principe des cartes CUSUM (car il en existe plusieurs pour une loi de distribution donnée) est de 
sommer les écarts entre les estimations de la position du procédé/processus et la cible. Lorsque le cumul 
des écarts positifs ou le cumul des écarts négatifs dépasse une certaine valeur, nous concluons à un 
décentrage du procédé. 


Nous posons: 


de (a 
4h = > (X, — ji) et S, =—? (74.530) 
= T 


où souvent la première égalité est aussi notée: 


7 nl 
Cy= DA -4)=(X,-4)+ (4 -4)= (4, -4)+C4 (4531) 
= = 


Dès lors il vient une écriture très connue dans la littérature: 


En général, la carte de CUSUM se comporte comme suit: 
- Si le procédé est sous-contrôle, la somme cumulée fluctue aléatoirement autour de zéro. 


- Si la moyenne subit une dérive positive de la moyenne, la statistique €, ou &,, croît rapidement par 
accumulation d'un biais systématique. 


Remarques: 


R1. Dans de nombreux ouvrages et de très nombreux cas applicatifs, nous n'utilisons pas &#,, (variable 
centrée et réduite) car la variance est inconnue et nous nous restreignons qu'à l'usage de C!,. Les 
développements mathématiques qui suivent alors s'adaptent très facilement. 


R2. La même approche peut être faite avec des moyennes de prélèvements selon: 


R3. Il existe de nombreuses versions différentes de carte CUSUM et même pour la carte CUSUM avec 
V-Masque il en existe de multiples sous-familles. Pour être honnête c'est selon mon opinion un sacré 
foutoir.. 
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Pour l'exemple, reprenons le tableau de données suivant: 


6 
Ech.1 
3.9943 
3.9721 
3.9788 
10.0658 
10.0136 
3.9495 
3.9144 
3.9748 
10.0063 
10.084 
3.3436 
10.0074 
10.0063 
3.9836 
10.0317 
3.9756 
9.9818 
10.0168 
3.9857 
3.9878 
10.0657 
3.9564 
10.061 
3.3054 
3.3768 


Ech.2 


10.0196 
3.9643 
10.0213 
10.08 
3.9791 
10.0057 
10.0321 
3.9362 
10.0749 
3.9619 
10.0638 
3.9817 
10.0282 
10.063 
10.0485 
3.9174 
3.8962 
10.0043 
10.0503 
3.9841 
3.9838 
10.014 
3.9443 
3.3049 
3.9954 


D 


Ech.3 


3.9732 
3.9426 
3.3407 
3.9514 
3.9443 
3.9715 
10.0361 
10.0363 
3.3971 
10.0063 
3.9617 
3.9753 
10.0385 
3.9824 
3.9659 
3.9076 
3.9614 
10.0029 
10.0381 
3.9496 
3.9636 
3.389 
3.9893 
3.987 
3.9196 


E 


Ech.4 


10.0088 
3.3712 
10.0696 
3.9958 
3.9403 
10.0388 
10.0253 
10.15 
3.978 
10.0364 
10.0138 
10.0541 
3.9747 
3.9309 
10.0675 
3.3309 
3.9612 
3.9549 
3.381 
3.9754 
3.3779 
3.9999 
3.9833 
10.058 
3.3341 


F 


Ech.5 


3.9685 
10.0259 
10.0161 
10.0338 
3.9424 
10.0019 
10.0103 
ÉREE 
3.9934 
3.939307 
3.9672 
3.9845 
10.0323 
3.9684 
10.0047 
10.018 
3.9694 
10.0133 
3.93603 
3.532 
10.0423 
10.0146 
3.9947 
3.9156 
3.162 


G 


Ech.6 


3.9544 
10.0177 
10.0703 
10.0422 
3.3421 
3.9616 
3.9935 
3.9741 
3.9555 
3.9762 
3.3591 
3.9107 
9.386 
10.0575 
10.0277 
3.9973 
3.9349 
3.3691 
3.9123 
10.0576 
10.0547 
10.0145 
10.0033 
3.9782 
10.0721 


Figure: 74.103 - Mesures journalières avec 6 individus sans arrêt de la machine 


et nous calculons la somme cumulée en considérant toujours une cible de #=T = 10: 


Soit: 


Mi Points Mogenne-Cible Ci. 


Î 
2 
3 
4 
5 
6 
7 
8 
3 


Figure: 74.104 - Indicateurs correspondants aux mesures obtenues 


-0.0135  -0.0135 
-0.0177  -0.0312 
00162 -0.0150 
00282 00132 
-0.0396 -0.0264 
-0.018 -0.0383 
0.0020 -0.0362 
0.0213  -0.0143 
0.0003  -0.0134 
0.000932 -0.0042 
-0.0151  -0.0193 
-0.0144  -0.0337 
0.011 -0.0226 
00076  -0.0150 
00243 00094 
-0.0321 -0.0227 
-0.0432  -0.0719 
-0.0053 -00773 
-0.0120  -0.0893 
-0.0154  -01047 
0.0147 -0.0900 
-0.0012  -0.0912 
-0.0033  -0.0951 
-0.0418  -01369 
-0.0310  -01679 
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Points Mogenne-Cible C: 
L = MOYENNE(B2:G2)-$M$2 =J2 10 
2 = MOYENNE(B3:G3)-$M$2 =K2+J3 h 
3 =MOYENNE(E4-G4)-#M#2  =K3eJ4 1 
4 =MOYENNE(BS:G5)-#$M1$2  =K4eJ5 d 
5 = MOYENNE(BE:G6)-$M1$2 =K5+J6 0.05 
6 =MOYENNE(B?:G7]-$M1$2 =K6+J7 K 
7 = MOYENNE(B8:G8)-$M$2 =K7+J8 =M6/2 
8 = MOYENNE(B3:G9)-$11$2 =K8+J3 
=MOYENNE(B10:G10)-$M#2  =K9+J10 
=MOYENNE(BGN)-$MS#Z  =K10+J11 
=MOYENNE(B12:G12)-$M#2  =K1t+J12 
=MOYENNE(B13:G13)-#M#2  =K12+/13 
=MOYENNE(B1#G14)-$M#2  =K13+/J14 
=MOYENNE(B15-G15)-$M#2  =Ki4e15 
=MOYENNE(BI6.G16)-$M#2  =K15+J16 
=MOYENNE(BI7-G17)-$M#2  =K16+J17 
=MOYENNE(B18:Gt8)-$M#2  =2K17+J18 
= MOYENNE(B13:G19)-$M$2  =K18+/J19 
=MOYENNE(B20:G20)-$M#2 =K19+J20 
20 =MOYENNE(B21G21)-$M#$2  =K20+J21 
=MOYENNE(B22:G22)-$M#2 =K21+J22 
23 FA =MOYENNE(B23:G23)-$M#2 =K22+/23 
23 =MOYENNE(B24:G24)-#M1$2 =K23+J24 
SU 24 =MOYENNE(B25:G25)-$M$2 =K24+/25 
2 25 =MOYENNE(B26:G26)-$M1$2 =K25+/26 


Figure: 74.105 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Nous obtenons alors: 


CC CUSUM AVEC V-MASQUE EMPIRIQUE 


Figure: 74.106 - Carte de contrôle CUSUM pour l'instant sans le V-Masque empirique 
Nous voyons alors très vite avec cette carte que la somme cumulée semble décroître. Ceci indique que la 
vraie qualité moyenne est inférieure à la cible (vous pouvez essayer avec 9.994 comme cible afin de voir la 
sensibilité). 


Il faut maintenant considérer deux cas: 


H1. Il vient sous l'hypothèse de normalité (processus sous contrôle) et par la propriété de stabilité de la loi 
Normale que pour une variable aléatoire centrée réduite: 
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ou sinon: 
C,=N(z4,0)= N(0,cf) (74.534) 


Dès lors, sous cette hypothèse, nous avons les sommes cumulées (S;) qui sont réparties autour d'une 


i=1l..n 
droite de régression de pente 0 (puisque la moyenne des sommes de variables aléatoires dont la moyenne 
est nulle est. nulle) et les distributions ont leur écart-type qui est proportionnel à la racine de i 
(respectivement la variance qui est proportionnelle à i) 


H2. Si le processus est hors contrôle (dispersion globale), il existe un instant £ <# tel que X, =W f 4,S) 
pouri<r-1et X =N ( 4 +6, ©) pour i>r avec £ > 0 (cette dernière valeur étant souvent imposée 


par les contraintes de qualité et nommée "translation moyenne importante"). Dès lors, nous avons: 
S; = M0.) (74.535) 
ou: 


C, = m0, af) (74.536) 


pour i=1,..,r-1et: 
Se 5a = M2) = ET) 
LE TE) 


pour & >r. Ceci étant précisé, il va de soi que les sommes cumulées: 
ô 
Se = n( FE) (74.538) 
T 


sont réparties autour d'une droite de régression de pente $j à partir de l'instant r. Respectivement, nous 
avons: 


CL = N(6,cVk) (74.539) 
Pour continuer, l'idée est de discriminer l'hypothèse H1 d'une droite de régression de pente nulle et 
l'hypothèse H2 d'une droite de régression de pente 5j pour #; en fixant pour frontière empirique la 
pente moitié (le juste milieu quoi...): 


ô 
Kç=—— (74540) 


respectivement: 
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Ke = (74.541) 


et un décalage lui aussi empirique x > 0 avec # e N. À l'étape n nous rejetons H1, si pour un entier #7 < 


nous avons: 


Sn 2 r-m)Es +8 +AKS (74542) 


Il bien évidemment aussi possible de faire le rejet avec une représentation géométrique (cela a l'avantage 
d'aller beaucoup plus vite et de faire le contrôle d'un seul coup pour n'importe quel m plus petit ou égal à 
n). L'idée est alors de tracer une droite de pente K partant du point d'abscisse »# + #. S'il existe un point 


(r,5,,) avec >* <x en dessous de la droite, nous tirons alors l'alarme. 


Le lecteur aura remarqué que dans le cas présent, nous considérons & strictement positif et donc in 
extenso la pente K aussi. Évidemment ce n'est pas réaliste et dès lors il faut utiliser une droite de pente K 
positive et une autre droite de pente -K négative. La zone comprise entre les deux droites avec une 
abscisse »»# < »# est appelée un "V-masque" et le contrôle est assimilé logiquement alors à un test bilatéral. 
Ainsi, s'il existe un point (2,5) avec ## <x en dehors du V-masque nous tirons l'alarme. 


Faisons un exemple avec le graphique précédent. Considérons les valeurs empiriques suivantes des 


paramètres: 
à = 0.05 avec # =1 (74543) 
Soit: 
Kp=0.025 (74.544) 


Il vient alors: 


1 

2 Î -0.793 
3 2 -0.768 
4 3 -0.743 
5 4 -0.718 
6 5 -0.693 
ni 6 -0.668 
8 7 -0.643 
3 8 -0.618 
10 3 -0.593 
1 10 -0.568 
12 ul -0.543 
15 12 -0.518 
14 13 -0.493 
15 14 -0.468 
16 15 -0.443 
17 16 -0.418 
18 17 -0.393 
13 18 -0.368 
20 13 -0.343 
at 20 -0.318 
22 21 -0.293 
23 22 -0.268 
24 23 -0.243 
25 24 -0.218 
26 25 -0.193 


Figure: 74.107 - Indicateurs correspondants aux mesures obtenues 


N° Masque Vinf25 Masque Ÿ sup 25 


0.457 
0.432 
0.407 
0.382 
0.357 
0.332 
0.307 
0.282 
0.257 
0.232 
0.207 

0.182 
0.157 
0.132 
0.107 
0.082 
0.057 
0.032 
0.007 
-0.018 


-0.043 
-0.068 
-0.093 


-0.118 
-0.143 
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Soit: 


EN N° Masque Y inf 25 

1  =-($0#26-02)'FM#S+#K#26-FMI$4"SMISS 
2 =-($0$26-03) FMSS+$K#26-FMIS# EMISS 
3 =-(#0426-04)'ÉMSSPKE2E-FMIPA SMISS 
4  =-($0#$26-05)'FMISS+$K#26-FMISSEMIES 
5 =-($0+#26-06)'FMSS+$K#26-FMIS# SMAISS 
5 =-($0$26-07)J FMSS+$K#26-FMIS#EMIES 
7  =-($0#26-08)'FMISS+$K#26-FMISS MISES 
8 =-($0#$26-09) FM#S+$K#26-FMIS4" MIS 
=-($0$26-010) FMSS+$K#26-FMSA ENMISS 
=-($0426-O1J'FMSS-ÉKE26-FMISS HMS 
=-($0#26-012) MS $K$26-FMIS 4 EMISS 
=-($0426-O13) #MSS+HKELE-FMISS MES 
=-($0426-014) $m1$8+$K$26-FM1$4"$M1$S 
=-($0426-015) #MSS+HKE2E-HMISS MISES 
=-($0426-016) HMS FKH2E-FMES MES 
=-($0426-O17) MISE HKELE-HMISS MISE 
=-($0$26-018) MES FKH26-FMIAEMES 
=-($0426-019) #MSS+HK26-FMISS MES 
=-($0$26-020)"FM1SS+$KH26-FMIS4 MISE 
=-($0426-021) #MSS+$KÉ2E-HMISS MISE 
=-($0$26-022) FMSS+$KH26-FMIAEMISS 
=-($0426-023) #M#S+$K#26-#FM1$4"#MISS 
=-($0426-024) #M1$3+$KH26-FMIS HITS 
=-($0426-025) #M1$3+$K#26-FMIS4 MISE 
=-($0426-026) FM1$S+$KH26-FMISSEMISS 


[7] 


Masque Y sup 25 
=($0$26-02) FMISS+FK 264 EMEA EMISS 
=($0$26-03) FMISS+EKEIE+PMIESENMISS 
=($0$26-04) ÉMÉS:PKE2E- MISES EMIES 
=($0$26-05) ÉMISS+$KF26+FMESEMES 
=($0$26-06) MES EKEIE EMEA EMIES 
=($0$26-07) FMISS+-$KF26-FMESEMISS 
=($0$26-08) MSS+PKE2E+ MIS EMIES 
=($0$26-09) FMES+FK#26-FME4EMES 
=($0$26-010) MSS+$K#26+HMIS 4 EMISS 
=($0$26-ON) EMISS+FKH26-FMISS ENMIES 
=($0426-012) #M1#S+$K#26-HM1$4 MISE 
2($0426-013) MS $K#26+FMIS 4 EMISS 
=($0426-014) #M1#S+$K#26-$M1$4"#01$S 
2($0#26-015) MS $K#26+FMISS EMISS 
=($0$26-016) FMISS+FKE26-FMIESEMES 
2($0#26-017) MS $K#26FMIS4 MISE 
=($0$26-018) FMSS+FKH26-FMIESEMIES 
=($0$26-O19) FMISS+ KE HMS EMES 
=($0$26-020) FM#S+#$K#26-#M1$4 #MISS 
=(+0$26-021 FM#S-FK#26+-FMISS EMISS 
=($0426-022) FM#S+#KS26-FMIS4 FMISE 
=($0$26-023) FMSS+$K#26-$MI$4"SISS 
=($0$26-024) #MSS+#K#26- 184 #MISS 
=($0$26-025) FMSS+$K#26-$MI$4" MISES 
=($0#26-026) FM#S-FK$26-#M1$4 MISE 


Pigier 74.108 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Nous avons alors par exemple au point 26 correspondant à 25+h: 


CC CUSUM AVEC V-MASQUE EMPIRIQUE 


eV e#2S 


—— Mesque V\ sup 25 


Figure: 74.109 - Carte de contrôle CUSUM avec le V-Masque empirique 


Le lecteur observera facilement qu'avec le choix effectué, nous n'aurions aucune alarme avec les 
paramètres empiriques choisis. Il conviendrait alors dans la pratique de diminuer la valeur de 4. 


Pour résumer, les avantages de la carte de CUSUM par rapport aux cartes de Shewhart sont les suivantes: 


- Elles sont plus efficaces pour détecter de petites dérives 
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- La dérive du procédé apparaît visuellement sur ces cartes 


- Il est en général facile de détecter en quel point le procédé a commencé à dériver 
Les désavantages de ces cartes sont les suivantes: 
- Elles peuvent être lentes pour détecter de grandes dérives 


- Elles ne sont pas très intéressantes pour analyser des données passées et rechercher des cycles ou allures 
caractéristiques dans la distribution étudiée. 


- Elles sont moins facilement acceptées par des opérateurs car moins intuitives et ne représentent pas 
directement la caractéristique étudiée. 


Pour les raisons discutées ci-dessus, il est conseillé de représenter en parallèle la carte de Shewhart et la 
carte CUSUM. 


Remarque: Il existe encore d'autres cartes de CUSUM de type V-masque. Donc attention avec les 
logiciels à savoir ce que l'on fait!!! 


5.5.5. CC EWMA (PONDÉRATION EXPONENTIELLE AVEC MOYENNE MOBILE) AVEC LIMITES 
FIXES 


Une alternative intéressante aux cartes CUSUM dans le cadre de l'autocorrélation et la détection de faibles 
déréglages sont les cartes de contrôle EWMA (Exponentially Weigthed Moving Average) qui ont leur 
origine dans l'analyse des séries temporelles (cf. chapitre d'Économie),. 


Remarque: Certains utilisent aussi des cartes de contrôle avec les techniques empiriques de la moyenne 
mobile simple ou double comme étudiées dans le chapitre d'Economie lorsque les données sont 
autocorrélées. 


Une carte EWMA est facile à mettre en place et n'est pas trop sensible aux changements de paramètres et 
la non-normalité des données, elle reste toutefois tout aussi performante que les cartes CUSUM pour 
détecter les petites variations. 


Par définition, la statistique reportée sur la carte de contrôle EWMA se calcule par la relation suivante 
(remarquez que les indices des différents termes ne sont pas les mêmes que le lissage exponentiel d'une 
série temporelle comme vu dans le chapitre d'Économie puisque l'objectif n'est pas de faire de la 
prévision! !): 


F=AX,+(1-4)Æ4 VAel06.08[ (74545) 
avec la particularité que pour cette carte de contrôle certains logiciels (comme Minitab) prennent: 
FH =ZXouÆ=X (74546) 


La constante 4 (constante de lissage) détermine le poids que nous souhaitons affecter aux dernières 
mesures. Plus cette valeur est petite, plus la carte est sensible aux dérives subites. 
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Démontrons que cette dernière relation peut s'écrire sous la forme: 


+1 = 
F = D A(- D'8.]ra-2'8 (74.547) 
0 


Effectivement: 
F, = AZ, +(1-2)8 = AZ, +(1- 2) (42, + (1-2) 2) 


= AR, +0-D(4R3 +002 2+0- DES) un 


t—l 
L b A - 4} &. + (1-4) Æ 


:=0 
Supposons pour la suite que: 


À, = N(4,0°) (74.549) 
Nous avons alors: 


+1 
F(Æ)= 4 A(l- DE.) +(1- 4) ñ) (74.550) 
i=0 


et en se rappelant d'une des propriétés de la variance: 
Via. X)=aV(X) (74551) 
Il vient: 


V(Æ)= b d'00 (3) +(1- 277 (A) 


t-l 
= b aa- 27 (X,. ) +(1-2)*.0 


: (74.552) 
+- | _ t— | 
=> 40-22 7(2,.,)= #5 (1-2) 0° 

i=0 0 


t—l 
= 407 (1-2) 
i=0 
Faisons un changement de variable: 
x=(1- A) (74.553) 


Il vient alors en utilisant le résultat démontré dans le cadre de l'étude des suites arithmétiques du chapitre 
sur les Suites et Séries: 
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JD L 2 2 id ü= 207 


1 [= 
VE )= OS x = A0 — = j 
(Æ) 25 1—x 1-1 4ÿ 


LL 3gv2t 2 ee 
= 3292 1-(1- À) = À -(1-a-2?) (74.554) 
1-1+24+4 24 + À 


À : 
= —(i-0-2) ) 


quand t est suffisamment grand, la variance se réduit alors à (approximation que la majorité des logiciels - 
comme Minitab - ne font pas et donc les limites ne sont pas constantes en fonction de t!): 


L 


F(A)= on = a (74.555) 


Les limites de contrôle de la carte EWMA se construisent alors aussi à +347 avec: 


| À 
Truma = T. CN (74.556) 


Nous avons donc lorsqu'un objectif est fixé ainsi qu'un écart-type (il est impossible que le client fixe une 
limite USL, LSL ou une cible T en ce qui concerne la pondération exponentielle d'où le fait que ces 
paramètres ne soient cette fois-ci pas mentionnés): 


| À 
UCZ =T+30, | — 


C'Lpynca = T (74.557) 


que nous retrouvons sous la forme suivante lorsqu'il s'agit de travailler avec des prélèvements 


d'échantillons: 
= T À = À 
DCE pynra = +3, = À +30 | ———— 
fa V2+4 ES 


C'Lpynta = 7 (74.558) 


T 
LC = a 
ne fr V2+4 »,(2+4) 


Certains logiciels utilisent pour le calcul de l'écart-type la relation suivante que nous avons démontrée plus 
haut: 


(74.559) 


et certains autres (comme Minitab): 
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g= (74.560) 


cette dernière option ayant l'avantage de fonctionner si la taille des échantillons est unitaire (nous parlons 
alors bien évidemment de "carte EWMA aux valeurs individuelles"). Rappelons effectivement que nous 
avons déjà mentionné que la carte EWMA est mal adaptée aux grandes séries. 


Il convient de remarquer que quelle que soit l'option choisie, comme nous avons: 


LE <1 (74561) 
2+4 


les limites de contrôles seront donc toujours nettement inférieures à ceux d'une carte à l'étendue ou à 
étendue mobile. C'est aussi une raison pour laquelle nous lissons les données! 


Faisons un exemple pour chaque variante de calcul de l'écart-type puisque chacune est d'égale importance 
dans la pratique. Pour cela, commençons par la carte EWMA avec: 


À | À 
d02,) Ÿn,(2+4) 


CLeyaa = x (74.562) 


à E J E F 

4 Ech.1 Ech.2 Ech.3 Ech.4 Ech.5 Ech.6 

ce Jour 1 3.9943 10.0196 9.9732 10.0088 9.9685 3.9544 
CN) Jour 2 33721 3.9643 3.3426 3.3712 10.0259 10.0177 
LE Jour 3 3.9788 10.0213 3.3407 10.0696 10.0161 10.0709 
CN) Jour 4 10.0658 10.08 3.9514 3.9958 10.0338 10.0422 
EAN Jour 5 10.0136 3.93791 9.9449 3.3403 9.9424 3.3421 
LM Jour 6 9.3495 10.0057 3.3715 10.0388 10.001 3.9616 
LE) Jour 7 3.9144 10.0321 10.0361 10.0253 10.010 3.9935 
EM Jour & 3.9748 3.9962 10.0363 10.15 3.9996 3.3741 
EN Jour 3 10.0063 10.0749 3.9971 9.978 3.9934 3.9555 
LL Jour 10 10.084 3.9619 10.0063 10.0364 9.99307 3.9762 


EN Jour 11 3.9436 10.0638 3.9617 10.0138 3.9672 9.9591 

EM Jour 12 10.0074 3.3817 3.9753 10.0541 9.9845 3.3107 

LL) Jour 13 10.0063 10.0282 10.0385 3.93747 10.0323 9.986 

LL Jour 14 3.9836 10.063 3.9824 3.3909 3.9684 10.0575 
Figure: 74.110 - Mesures journalières avec 6 individus sans arrêt de la machine 


Nous obtenons: 
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0.6000 


À 
d2 2.534 

"SN Mesures Range EYMA CL LCL UCL 
5 û 9.3865 0.0652 9.38647 93.3989  9.9735 10.0243 
6 1 9.3823 0.0833 9.938397 9.3989  9.9735 10.0243 

2 10.0162 0.1302 10.00333 9.93989  9.9735 10.0243 
ë 3 10.0282 0.1286 10.01823 99989  9.9735 10.0243 
3 4 9.3604 0.0733 9.938353 99989  9.9735 10.0243 
10 5 9.9882 0.0893 9.938631 9.93989  9.9735 10.0243 
fi 6 10.0021 01217 3.939576 939989  9.9735 10.0243 
12 7 10.0219 0.1759 10.01146 9.93989  9.9735 10.0243 
13 8 10.0003 0.194 10.00510 33989 99735 10.0243 
14 3 10.0093 01221 10.007593 9.3989  9.9735 10.0243 
15 10 9.9849 0.1202 9.393396 9.93989  9.9735 10.0243 
16 il 9.9856 0.1434 9.938895 9.939389  9.9735 10.0243 
7 12 10.011 0.0638 1000224 999893 9.735 10.0243 
18 13 10.0076 0.0346 10.00548 9.9989  9.9735 10.0243 


Figure: 74.111 - Indicateurs correspondants aux mesures obtenues 


Soit (nous avons coupé la capture d'écran en deux parties faute de place): 


IA 06 

de 2554 

C.| N° Mesures Range EYMA CL 

EI 0 =MOYENNE(BS5:GS)  =MAX(B5:G5)-MIN(B5:G5) =J5 =MOYENNE($J45:4)418) 
1 -MOYENNE(B6:G6)  =MAX(B6:G6)-MIN(B6:G6) 24/41" J6+(1-HJHULS  =MOYEMNE(#J$5:4/518) 
WI -MOYENME(BT:GT)  =MAX(BT:GT)-MIN(BT:GT) =$JHTJTe(t-HUH)LE  =MOYENNE($J$5:4)$18) 
135 “-MOYENNE(ES:GS) =MAX(BS:G8)-MIN(BS:G8) 24/81" J8+(1-$J$1)"LT =MOYENNE($J45:4)$15) 
C4 -MOYENNE(B3:G3) =MAX(B9:G3)-MIN(B3:G3) 2$JH1"JS+(1-HJH)LS  =MOYENNE($J45:4)$15) 
LS -MOYENNE(E10:G10) =MA4X(510:G10)-MIN(B10:G10) =$J$1"M0+(1-4/$1)"L3  =MOYENNE($J45:4)$15) 
UNS =MOYENNE(BIGN) =MAX(B1:GN)-MIN(B11:G11] =tJ$i"Jtte(t-HJH) 10  =MOYENNE($J$5:4/518) 
LT -MOYENNE(B12:G12) =-MAX(BI2:G12)-MIN(B12:G12) =$/$1"J12+(1-#J40 L1  =MOYENNE($J45:4/418) 
IS -MOYENNE(B15:G15) =MAX(B13:G15)-MIN(B13:G15) =$Jf115+(1-4/41)" 12 =MOYENNE($J45:4)$18) 
LMIS -MOYENNE(B14:G14) =MAX(B14:Gi4)-MIN(B14:G14) =$J$1"J14+(1-4/81)" 15 =MOYENNE($J45:4)$15) 
EN 10 =MOYENNE(E15:G15) =MAX(B15:G15)-MIN(B15:G15)  =$J$1"15+(1-4/41)"L14 =MOYENNE($J45:4/$18) 
Le 11 =-MOYENNE(B16:G16) =MAX(B16:G16)-MIN(B16:G16) 24/41 16+(1-$J$1)"L15  =MOYENNE($J45:4)418) 
LN12 =MOYENNE(BIT:G17) =MAX(BITGIT)-MIN(BAT-GAT)  =$JH1NT+(1-H/81)" 16 =MOYENNE($J45:4)$18) 
1 LE HOVERRE EE °1 =MAX(516:G15)- ee G15] RTE SILIT SPEEEE He 


et: 


LCL UCL 
=MS-S'(MOYENNE(SK#S:$K #18) 482) RACINE(SS(NB(ES:G5)" (24041) =M5+3"(MOYENNE(SK#5-#K418)/ #82)" RACINE(SJHANB(ES:G5)"(2+4)$1))) 

=M6-3"(MOYENNE(SKSS:4KH18)/$J$2) RACINE(SIHT(NB(B6:G6)"(24041)))  =M6+3"IMOYENNE(SK4S:HK #18) 4Jt2) RACINE(SIH(NB(B6:G6)"(2+4)51))) 
=MT-S"(MOYENNE(SKSS:#K#18)/4J$2) RACINE(SIHANB(BT:GT) (24041) =MT+S"(MOYENNE(SK#5:#K418)/ 442) RACINE(SJHA(NB(BT:GT) (24/41) 

=M8-S"(MOYENNE(SKSS SK HS) SIS2) RACINE(SIH(NB(B8:G8) (24440) =M8+3"(MOYENNE(SKSS:#K#18)4J$2) RACINE(SISNB(B8:G8)"(2+40#1))) 
=MS-3"(MOYENNE(#K45:$K418)/4J$2) RACINE(SIHANE(B3:G9)"(2+4/41))) =M9+3"MOYENNE(SKSS:$KH18)JS2) RACINE(S/H/(NB(B3:G3)"(2+4)41))) 
=MMO-S"(MOYENNE(SKSS:$K# 18) JS2) RACINE(SJHNB(B10:G10)"(2+4)41)) =MM10+S'(MOYENNE(SK#S:4KH18) 4/2) RACINE(SH(NE(E10:G10) (244441) 
=M-S"(MOYENNE(SKSS:SKHS NES) RACINE(IS(NB(BG HN (2+5/41)) 23 (MOYENNE(SKSS- SK HS) 4 IS2) RACINE(SISNB(B Gt) (24081) 
=M12-5"(MOYENNE(#K45:HK 418) 4J$2) RACINE(SIHANB(B12:G12)" (24041) 2MM2+3"(MOYENNE(SKSS:#KH18)SJS2) RACINE(SIH/ (NE (512-612) (244041) 
2-3" (MOYENNE(SKSS:$K #18) JS2) RACINE(S IH NB(B13:G18) (244)41)) =M1S+3"(MOYENNE(SK#S-4KH18)4J$2) RACINE(SJH(NB(B13:Gt8) (24441) 
=MM4-3"(MOYENNE(SK#5:#K418 1482) RACINE(SIHA(NB(E14:G14)"(2+40$1)) =Mt4+5"(MOYENNE(SK45:HKH8 NUS) RACINE(SIH(NE(B14:G14)" (264041) 
=MMS-3"MOYENNE(#K45:HKH 18) 442) RACINE(SJH(NE(ES:G15)"(2+4041))) =MM15+S"(MOYENNE(SKSS:$KH18) SJ) RACINES (NBC 15:15)" (2+4051)] 
=MM6-S"(MOYENNE(SKSS SK HSM SIS2) RACINE(SIINNB(B16-G16)"(2+4051)] =MMG+S(MOYENNE(SKSS SK) SIA) RACINE(SISNE(E16:G16) (24441) 
=MT-S'(MOYENNE(SK#S-#K418) 42) RACINE(SISNB(EtT:G1T) (2e 5041))) =M17+S"(MOYENNE(SK45:HKH18)4JS2) RACINE(SUSUNE(EIT:-GIT)" (24041) 
=1M8-S"(MOYENNE(SK#5-$K418)$2) RACINE(SIHANB(Et8:G18)"(2+4041)] =MA18+5"MOYENNE(SK45:HKH8)SJS2) RACINE(SJH(NE(Bt8:G16)" (24/41) 


Figure: 74.113 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent (deuxième partie) 


Nous avons alors la carte de contrôle suivante: 
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CCEWMAAVEC ECART-TYPE BASE SUR L'ETENDUE ET LIMITES FIXES 


Figure: 74.114 - Carte de contrôle EWMA avec écart-type basé sur l'étendue et limites fixées 


Pour le dernier exemple, nous prenons le cas fameux de la carte EWMA avec valeurs individuelles et: 


= , MR Â 
UCL pme = X +3 LE 
Fr d, 0) Ÿr,(2+2) 


Clymea= À (74.563) 


avec les données suivantes: 


9.9943 
10.0196 
99732 
10.0088 
9.9685 
9.9544 
9.909721 
9.0643 


Figure: 74.115 - Mesures individuelles sans arrêt de la machine 


en prenant donc (attention le n dans la relation qui suit n'est pas le même que celui qui est dans la racine 
contenant la constante de lissage!): 


| _ 


mur > [xx] (74.564) 


et: 
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d:(2)=1.128 (74.565) 
ainsi que: 
FH =X (74.566) 


Nous avons alors avec une constante de lissage de 0.6: 


g- 

1 ES 0.60 

CA] 42 1.128 

MIN Etendue Mobile EWMA Œ LCL: LC 

D 0 09803 90819 099477 100161 
6 1 0.0253 10.0075 99819 99477 100161 
7 0.0464 00869 90819 90477 100161 
s ME 0.0356 10.0000 99819 99477 100161 
o M 0.0403 99811 99819 90477 100161 
10 SE 0.0141 09651 99819 99477 100161 
ED 6 0.0177 00693 90819 90477 100161 
PA 7 0.0078 00663 99819 90477 100161 


Figure: 74.116 - Indicateurs correspondants aux mesures obtenues 


Soit (nous avons coupé la capture d'écran en deux parties faute de place): 


NZ O6 


El d2 1128 

(IN: Etendue Mob EVMA CL 

s 0 =$0$145.{1-#0$)'MOYENNE(SA#5:$4$12)  =MOYENNE(HAS5-$4#12) 
C1 -2BS(A6-A45) =#0$1A6e(t-#O$1)'ES =MOYENNE($A$5:$4$12) 
2 -ABS(AT-A6) =$0$#1A74(1-$D$1'E6 =MOYENNE($445:$4$12) 
C3 -ABS(A8-A7) =#0$1A8e(t-#O$1'E7 =MOYENNE($A$5:$4$12) 
C4 -2B5(49-49) =$0$1A9(1-#D$'ES =MOYENNE($445:$44$12) 
DNS -ABS(M0-49) =$0#1A10+{-$D$1)ES =MOYENNE($4$5:$4$12) 
PNG -2BS(A1-410) =$0$1A1t[{1-$0$0"E10 =MOYENNE(#$A4$5:#4412) 
PAT -ABS(A2-Ai) =#0$1A124(1t-$D81'EN =MOYENNE($445:$4$12) 


et: 


LCL UCL. 


=F5-3"MOYENNE($D$5:$0$12$0$2"RACINE($D$(2+$0$1)) =F53"MOYENNE(#D$5:$04$12)$0$2"RACINE(# DS 142+$0$1)) 
=F8-3"MOYENNE($D$5:#0$12$0$2"RACINE($D$42+$0$1)) =F63"MOYENNE($D$5:$0$12)$D$2"RACINE($ DS 142+$0$1)) 
=F7-3"MOYENNE($0$5:#0$12#$0$2"RACINE($D$12+$0$1)) =F7+3" MOYENNE($D$5:$04$12)$0$2"RACINE(S DS 142+$0$1)) 
=F8-3'MOYENNE($D$5:#0$12#$0$2"RACINE(SD42+$0$1)) =F83"MOYENNE($D$5:$0$12)#$0$2"RACINE(S DS 1412+$0$1)) 
=F9-3 MOYENNE($D$5:$0$12l$0$2"RACINE($D$1(2+$D$1)) =F9+3" MOYENNE($D$5:$0412)$D$2"RACINE($D$14(2+$0$1)) 
=F10-3"MOYENNE($D$5:$0$12#$0$2"RACINE(#D$412+$0$1)) =F10+ MOYENNE(#D$5:$0$12)$0$2"RACINE(S DS 1#(2+$0$1)) 
=Fit-3"MOYENNE($D$5:$0412#$D$2"RACINE($O#/(2+$0$1) =F1t3" MOYENNE($D$5-$D$12)$0$2"RACINE(#O$142+$041)) 


=F12-3'MOYENNE($D$5:$0$12)#$0$2"RACINE(#D$t#42+$0$1)) =F12+3 MOYENNE(#D$5:$0$12$0$2"RACINE(#DS1#(2+$0$1)) 


Figure: 74.118 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent (deuxième partie) 


Nous avons alors la carte de contrôle suivante: 


Page: 4609/4839 


[v3.0 - 2013] 


CC EWMA AVEC ECART-TYPE BASÉ SUR L'ÉTENDUE MOBILE ET LIMITES FIXES 


o 
_ 


2 


on 


Figure: 74.119 - Carte de contrôle EWMA avec écart-type basé sur l'étendue et limites fixées 


Comme pour les autres cartes de contrôle, la carte EWMA doit être accompagnée d'une carte de contrôle 
pour le suivi de la variabilité, donc soit une carte avec étendues aux limites fixes ou une carte aux 


écarts-types avec limites fixes. 


5.6. CARTE DE CONTRÔLE DES FRÉQUENCES AVEC LIMITES PROBABILISTES 


Le suivi des fréquences d'apparition de défauts/accidents/anomalies/pannes est une technique très simple à 
mettre en pratique et très parlante pour des personnes ayant peu voire pas de connaissances en statistiques. 
De plus c'est une technique adaptée aux cas où les événements contrôlés sont très rares. 


L'idée est alors de ne plus suivre le nombre d'événements spéciaux, mais le temps T entre deux apparitions 
des événements surveillés. Le temps T se mesure alors soit en nombre de pièces produites, soit en nombre 


d'accidents, anomalies, en jours, 


Par exemple: 


etc. 
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2 L 


mn un 


BB RIS NI EN La | on | nd L'an | ent À mul | œnd:| ou | end | om | ài 


2 M M) 9 Mi 9 fs 


5 =] 


27 
28 1683 
Figure: 74.120 - Mesures 


Ce qui donne sous forme graphique: 


CARTE DES FREQUENCES D'APP ARITION 
20000 
18"000 
16"000 
14000 
12'000 
10" 000 
8000 
6'000 


+000 x 


2'000 $ a À 
û . ve h_ Ÿ à © Ÿ 


12 3 4 5 6 7 8 9 10 1 142 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 
Figure: 74.121 - Carte de contrôle des fréquences 
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Bon c'est bien joli, mais nous il nous faut une UCL et LCL pour que cela soit utile! Afin d'y arriver nous 
allons utiliser la théorie des files d'attente avec les mêmes hypothèses et les mêmes contrôles préalables 
(cf. chapitre Techniques de Gestion). Rappelons d'abord que nous y avions démontré que la probabilité 
d'observer k événements dans un intervalle de durée t (ou un intervalle de nombre de pièces t), sous 
certaines hypothèses bien précises (!!!), suivait une distribution de Poisson: 


k 
(#) ge À (74.567) 


FR 


où le paramètre 4 est le taux moyen d'arrivée (taux moyen d'apparition) d'événements par unité de temps 
(ou en anglais "Poisson Arrivals See Time Average": PASTA...) supposé constant sur toute la durée: 


À = (74.568) 


il — 


et où nous avons pour espérance et variance (cf. chapitre de Statistiques) du nombre d'événements: 


Ek]l=44t Var()= 4.4 (4569) 


Il s'agit d'une loi de probabilité à support discret, ce qui correspond bien à notre cas d'études donc la loi de 
Poisson peut être un bon candidat (mais il y en a d'autres, comme la loi Géométrique par exemple). 


Mais nous avions aussi démontré que la variable aléatoire T représentant le temps (ou le nombre de 


pièces) séparant deux arrivées d'événements non désirés (ou désirés...) était donnée par la fonction de 
répartition basé sur la loi exponentielle: 


A(T<t)=1-e"*# (74.570) 


toujours avec: 


ii (74.571) 
T 
où: 
u=0=1=7 (74.572) 
= 572 


Donc, nous pourrions prendre les limites de Shewhart suivantes: 


USZ = imposé par client/direction 
UCL = T+3T=AT 

CEST 

LCL=T-3T=0 


(74.573) 


Mais il est plus rigoureux (comme pour toutes les autres cartes) de prendre des limites probabilistes. Ainsi, 
si nous voulons fixer les limites avec un risque bilatéral habituel dans le domaine de æ; 2 de 0.5% nous 


calculons alors pour la limite inférieure: 
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ifr-£) 
(1) 
sie x 2e nf) eo (74.574) 


et pour la limite supérieure: 


a 
i() 
0, 
Ty 32 2 =-n(0 PE )r «43827 (74.575) 


Nous avons alors: 


1500 1221498 33.45 
166 12214.98 33.45 
2501 12214.98 33.45 
238 1221498 33.45 
1392 1221498 33.45 
4686 1221498 33.45 
128 12214.98 33.45 
31 1221498 33.45 
2566 1221498 33.45 
591 12214.98 33.45 
470 1221498 33.45 
502 1221498 33.45 
4147 1221498 33.45 
1131 1221498 33.45 
884 1221498 33.45 
1864 1221498 33.45 
665 12214.98 33.45 
3364 1221498 33.45 
881 12214.98 33.45 
4726 1221498 33.45 
517 1221498 33.45 
5787 1221498 33.45 
1250 1221498 33.45 
2869 1221498 33.45 
7087 1221498 33.45 
18653 1221498 33.45 
27 7772 12214.98 33.45 
28 1683 1221498 33.45 

Figure: 74.122 - Indicateurs correspondants aux mesures obtenues 


hi ho 9 NN sn et et | ed | | | __E. 
BRPRONSS oo nes ons wc oem nl ni ÿ 


Soit: 
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un fm 69 M3 


œo  m 


Te. 


=4.382*MOYENNE(SBS2:5BS29) 
=4.382*MOYENNE(SBS2:5B529} 
=4.382*MOYENNE(SB52:5B529) 
=4.382"MOYENNE(SBS2:5B529) 
=4,382*MOYENNE(SBS2:5B529} 
=4.382*"MOYENNE(SBS2:SB529) 
=4.382*MOYENNE(SBS2:5B529) 
=4.382*MOYENNE(SBS2:5B529) 


1 =4.382*MOYENNE(SBS2:5BS29) 


=4.382*"MOYENNE(SB52:SB529) 


2 =-4.382"MOYENNE(SB52:5B529) 
A =4.382"MOYENNE(SBS2:5B529) 
ni =4.382*MOYENNE(SBS2:5B529) 


4.382*MOYENNE(SBS2:SB529) 
4.382"MOYENNE(SBS2:5B529) 


A =4 382"MOYENNE(SBS2-SBS29) 
D 4 382"MOYENNE(SBS2:SBS29) 
À =: 282"MOYENNE(SBS2:SBS29) 


=4,382*MOYENNE(SBS2:5B529) 
=4,382*MOYENNE(SBS2:5B529) 
4.382*MOYENNE(SBS2:SB529) 
=4.382*"MOYENNE(SBS2:SB529)} 
=4.382*MOYENNE(SBS2:5B529) 
=4,382*MOYENNE(SBS2:5B529) 
4.382*MOYENNE(SBS2:5B529) 
=4.382*"MOYENNE(SBS2:5B529) 
4.382*MOYENNE(SBS2:5B529) 


ED -4.382*MOYENNE(SBS2:5B529) 
Figure: 74.123 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


=0.012*MOYENNE(SBS2:5B5S28) 
=0.012*MOYENNE(SB52:SB529) 
=0.012*"MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B528) 
=0.012*MOYENNE(SB52:5B529) 
=0.012*"MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5BS28) 
=0.012*MOYENNE(SB52:5B529) 
=0.012*"MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SB52:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SB52:5B529) 
=0.012*"MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*"MOYENNE(SBS2:5B528) 
=0.012*MOYENNE(SBS2:SB529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SB52:5B529) 
=0.012"MOYENNE(SBS2:5B529) 
=0.012*MOYENNE(SBS2:5B529) 


Nous avons alors la carte de contrôle suivante (nous n'y avons exceptionnellement pas représenté USL): 


20000 


18000 


16000 


14000 


12000 


CARTE DES FREQUENCES D'APPARITION 


6 7 8 © 10 11 12 13 14 15 16 17 18 19 20 21 2 23 


—— Nombre de pisces produites —UCL 
jusqu'au déaut 


——LCL 


24 25 26 27 28 


Figure: 74.124 - Carte de contrôle des fréquences limites 


Il ne faut régulièrement (et donc aussi au tout début) vérifier que la distribution des événements suit bien 
une distribution de Poisson avant d'appliquer cette carte de contrôle! 
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5.7. CARTE DE CONTRÔLE DES ÉVÉNEMENTS RARES (CARTE-G) 


Nous avons démontré dans le chapitre de Statistique que l'espérance d'avoir R réussites avant le E-ème 
échec sachant que la probabilité d'avoir un échec est p était donnée par l'espérance de la loi binomiale 
négative: 


E 
E(R)=— (74576) 
P 
et nous avions obtenu pour la variance: 


FR) = + (74.577) 
4 


Bien évidemment, si nous posons E comme étant le premier échec, l'espérance se réduit à celle de la loi 


géométrique: 


E(R) = z et PR)= = —— (74578) 
ra 


Nous avons démontré dans le chapitre de Statistiques que l'estimateur du paramètre de la loi géométrique 
était donné par: 


5 = La (74.579) 
P Fr . 
Il vient alors: 
E(R) = La =£g (74.580) 
& 
et: 
k 
rw l.(x) Homer. 
.: ps N E rar g(£ (74.581) 
(%) 
et donc: 


ŸR = gi g —11 (74582) 
Dès lors, nous avons: 


USZ = Imposé par la direction 


UCL = g+3,/8i8-1: 


CL=g 


LCL=g-3/8i2-11=0 


(74.583) 
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où si LCL est négatif, nous le posons comme étant égal à zéro. 


Voyons un exemple en considérant la table suivante dans Microsoft Excel 14.0.6123: 


() Date Jours entre événements g EC UGE 


22 05.02.2009 39.24 0 155.43 
en 03.04.2009 57 39.24 0 155.43 
5 25.04.2009 22 39.24 ( 155.43 
en 06.05.2009 11 39.24 0 155.43 
EN 15.09.2009 132 39.24 0 155.43 
En 21.09.2009 6 39.24 ( 155.43 
Eh 07.10.2009 16 39.24 0 155.43 
ER 22.11.2009 46 39.24 0 155.43 
Len 01.12.2009 3 39.24 (el 155.43 
1 05.01.2010 35 39.24 0 155.43 
122 30.01.2010 25 39.24 0 155.43 
1EN 07.04.2010 67 39.24 ( 155.43 
18 06.04.2010 58 39.24 0 155.43 
LIEN 24.06.2010 20 39.24 0 155.43 
LEN 05.07.2010 11 39.24 (el 155.43 

03.08.2010 49 39.24 0 155.43 
1EN 03.10.2010 46 39.24 0 155.43 
1ER 04.12.2010 57 39.24 ( 155.43 


Figure: 74.125 - Indicateurs correspondants aux mesures obtenues 


Avec les formules suivantes: 


Le D E 

g LCL UCL 
=SOMME(B#2:45419)NB(tA43:44919)  =SI(C2-3"RACINE(C2"(C2-1))<0:0:C2-3"RACINE(C2"(C2-1))) =C2+3"RACINE(C2"(C2-1)] 
=SOMME(SB42:4BH19)NB(tA#S#A#13)  =SI(C3-3'RACINE(C3"(C3-1))<0:0:C3-3"RACINE(C3"(C3-1))) =C3+3"RACINE(C3"(C3-1)] 
=SOMME(SB42:4B419)NB(t443:44919)  =SI(C4-3"RACINE(C4"(C4-1))<0;0:C4-3"RACINE(C4"(C4-1))) =C4+3"RACINE(C4"(C4-1)] 
=SOMME(SB42:45419)NB(tA43:44819)  =SI(CS-S"RACINE(CS"(CS-1)}<0:0:C5-3"RACINE(CS"(CS-1))) =C5+3"RACINE(CS"(C5-1)) 
=SOMME(B#2:45419)NB(tA4344419)  =SI(C6-S"RACINE(C6"(C6-1))<0:0:C6-3"RACINE(C6"(C6-1))) =C6+3"RACINE(C6"(C6-1)] 
=SOMME(SB42:4B#19)NB(t443:$4919)  =SI(CT-S"RACINE(CT"(CT-1)}<0:0:C7-3"RACINE(CT"(CT-1))) =CT+3"RACINE(CT"(CT-1)) 
=SOMME(#B42:45419)NB(tA43:44919)  =SI(C8-3"RACINE(CS"(C8-1))<0:0:C8-3"RACINE(CS"(C8-1))) =C8+3"RACINE(CS"(C8-1)] 
=SOMME(HB#2:45419)NB(tA4344919)  =SI(C3-3"RACINE(CS"(C9-1))<0:0:C3-3"RACINE(C3"(C3-1))) =C3+3"RACINE(C3"(C3-1)] 
=SOMME(HB42:#B#19)NB(t44344#19)  =SI(C10-3"RACINE(C10"(C10-1)}<0:0;C10-3"RACINE(C10"(C10-1)))  =C10+3"RACINE(C10"(C10-1)) 
=SOMME(HB42:45419)NB(tA43:44919)  =SI(CH-3"RACINE(CA(CN-1)0:0:CM-3"RACINE(CH"(C11-1))) =Cte3"RACINE(CH"(C1H-1)) 


=SOMME(SE#ZHEHSNNB(SA#SSA#S)  =SI(CI2-F'RACINE(CH2"(C12-1)}<0:0:C12-F"RACINE(CH2"(C12-1)))  =C12+3"RACINE(C12"(C12-1)) 
=SOMME(SB42:$BH19)NB(tASS-SA#S)  =SI(CI-3"RACINE(CHS"(C13-1)}<0:0:C18-3"RACINE(CHS"(C13-1)))  2C13+3"RACINE(C13"(C13-1)) 
=SOMME(SE#2 HE HS NNB(SA#SSA#S)  =SI(CI4-S'RACINE(CH4"(C14-1)}<0:0;C14-S'RACINE(CH4"(C14-1)))  =C14+3"RACINE(C14"(C14-1)) 


=SOMME(HB#2:4B419)NB(tA43$A419)  =SI(C15-3"RACINE(C15"(C15-1)]<0:0:C15-3"RACINE(C15"(C15-1))) =C15+3"RACINE(CH5"(C15-1)) 
=SOMME(B#246419)NB(tA4344419)  =SI(C16-3"RACINE(C16"(C16-1))<0:0:C16-3"RACINE(C16"(C16-1))  =C16+3"RACINE(C16"(C16-1)) 
=SOMME(SB42:4BH19)NB(tA#$A#13)  =S1(C17-S"RACINE(CHT(C17-1)]<0:0:C17-3"RACINE(C17"(C17-1))) =C1T+3"RACINE(C1T"(C17-1)) 


=SOMME(SE#2HEHSNNB(SASSSA#S)  =SI(CIS-F'RACINE(CH8"(C18-1)}<0:0:C18-F'RACINE(CH8"(C18-1)))  =C18+3"RACINE(C18"(C18-1)) 
=SOMME(SB#2ZHBHSNNB(SA#SSA#S)  =SI(CI3-F'RACINE(CH9"(C18-1)}<0:0:C19-3"RACINE(C19"(C18-1)))  =C19+3"RACINE(C19"(C19-1)) 


Figure: 74.126 - Formules Microsoft Excel 14.0.6123 explicites du tableau précédent 


Ce qui donne sous forme graphique: 
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130 
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120 
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# 
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Jour enteevenements …p mmmlOl mx LCL 


Figure: 74.127 - Carte de contrôle G 


Cependant, il convient de se rappeler que la loi Géométrique (ou la loi Binomiale négative) n'est pas 
nécessairement symétrique. Raison pour laquelle, dans la pratique, il vaut mieux utiliser la médiane pour la 
CL (médiane que l'on déterminera en faisant une simple simulation de la loi et en prenant la valeur la plus 
proche de 50%) et pour les limites de contrôle inférieure LCL et supérieure UCL utiliser des limites 
probabilistes avec les même simulations. 


Remarque: Pour un logiciel comme Minitab, la limite de contrôle inférieure de la carte des événements 
rare est définie au percentile 0.0013499 de la distribution géométrique (en prenant la valeur décimale 
la plus proche par interpolation linéaire). La limite de contrôle supérieure est définie au percentile 
0.99865 (en prenant aussi la valeur décimale la plus proche par interpolation linéaire). La ligne centrale 
est définie au percentile 0.5 (en prenant la valeur décimale la plus proche par interpolation linéaire). 
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Notes personnelles: 
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75. GÉNIE LOGICIEL 


L. Génie Logiciel sera défini dans ce chapitre comme l'ensemble des techniques ou approches de 


résolution de problèmes utilisant fortement des mathématiques de niveau universitaire et que nous 
retrouvons (ou trouvions.) fréquemment implémentés dans de nombreuses solutions informatiques. 


Le lecteur retrouvera dans les textes qui vont suivre des outils mathématiques dont les détails ont tous 
été démontrés dans d'autres chapitres, mais dont les mises en applications informatiques n'avaient pas 
leur place dans la partie purement théorique. 


Remarque: Si le lecteur cherche les méthodes mathématiques pour simuler des objets 3D sur un 
écran, il devra se reporter au chapitre de Géométrie Projective. 


1. ALGORITHME PAGERANK DE GOOGLE 


Lors de sa création en 1998 Google (moteur de recherche actuellement très connu des internautes) a 
dominé et domine encore en 2011 le marché des moteurs de recherche sur Internet. Son point fort 
initial est basé sur l'idée très simple de trier les résultats par ordre de pertinence, ce que ne faisaient pas 
les autres grands moteurs de recherche avant lui. 


L'idée principale du principe de fonctionnement initial de Google est intéressante à présenter sur ce 
site, car elle est un exemple pratique de concepts purement mathématiques que nous avons présentés 
jusqu'ici (théorie des graphes et chaînes de Markov dans les chapitre respectifs de Théorie des Graphes 
et de Probabilités) et qui ont créé l'une des plus grandes entreprises internationales dans les nouvelles 
technologies dans les années 2000 (Google gagne des milliards avec l'algèbre linéaire...)! Comme c'est 
souvent le cas dans l'économie de marché, ce sont d'abord des recherches théoriques (mathématiques 
ou physiques) qui ont permis de développer de nouveaux outils! 


Remarques: 


R1. Évidemment l'algorithme de base a changé depuis 1998 car on peut y rajouter beaucoup de 
paramètres mathématiques (pondération par une distance par exemple) ou empiriques (visites, clics, 
publicités ….). 


R2. Cet algorithme n'est pas utilisé que dans le domaine du web. Effectivement, il peut être utilisé 
pour mettre en évidence n'importe quel objet en relation multiple avec d'autres objets (par exemple 
des variables dans un projet qui s'influencent les unes des autres en ayant des relations directes ou 
indirectes: une analyse structurelle). 


Pour trouver une information dans le tas amorphe et non vraiment structuré qu'est le web (vu le peu de 
gens qui respectent correctement les standards émis par le W3C...), l'utilisateur lancera une recherche 
par mots-clés. Ceci nécessite bien évidemment une certaine préparation pour être efficace: le moteur de 
recherche copie préalablement les pages web en mémoire locale et trie les mots (ou composition de 
mots) par ordre alphabétique en utilisant les algorithmes d'index empiriques traditionnels du domaine de 


Page: 4622/4839 


[v3.0 - 2013] 


l'informatique (arbres-b, arbres-b+ ou autres encore...). Le résultat est un annuaire de mots-clés avec 
leurs pages web associées. 


Afin d'analyser comment Google identifie les pages web les plus pertinentes, nous allons négliger le 
contenu des pages et ne compter que les liens entre elles. Ce que nous obtenons alors est la structure 
d'un graphe (non nécessairement connexe!). 


L'image suivante montre un exemple miniature (il y aurait 25.10? sites web d'après Google début 
2007): 


Figure: 75.1 - Principe schématique du graphe à étudier 


Pour la suite, nous noterons les pages web par: 


B,B,B.. P 


2 (750) 


et nous écrirons: 
Ji (752) 


si la page 7; cite directement la page Æ (citation directement connexe). Ainsi, dans l'image 


précédente, nous avons un lien 1 — 5, par exemple, mais pas de lien 5 —1. 


Bien évidemment, un lien j —3 est une recommandation de la page À; d'aller lire la page Æ. C'est 


ainsi un vote de F: en faveur de l'autorité de la page Æ (nous comprenons alors aisément pourquoi 


l'échange de liens entre sites n'ayant aucun rapport contextuel ait été en quelque sorte bannie par 
Google). 


Analysons l'image précédente sous un aspect plus conforme à la théorie des graphes, dont la hiérarchie 
devra être justifiée par la suite: 
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Figure: 75.2 - Graphe précédent réarrangé 
o Le) 


Pour des raisons purement pédagogiques, nous allons introduire trois modèles théoriques de ranking de 
pages web. Le dernier modèle étant le plus proche de celui implémenté par Google en 1998 et les deux 
premiers modèles permettant de préparer le terrain. 


1.1. COMPTAGE PONDÉRÉ 


Il est fortement plausible que si une page est importante, elle reçoit beaucoup de liens. Avec un peu de 
naïveté, on peut penser que la réciproque est vraie (une page qui reçoit beaucoup de liens est 
importante). Ainsi, nous pourrions définir l'importance 4 d'une page À comme étant le nombre de 


liens j —3 directement connexes. Sous forme mathématique, nous écrirons cela ainsi: 


Autrement dit, { est égal au nombre de votes pour la page À, où chaque vote contribue par la même 


valeur 1. Cela est, certes, facile à calculer, mais ne correspond souvent pas à l'importance ressentie par 
l'utilisateur. 


Dans notre exemple, nous avons ainsi: 

A4 = /A9=4 (754) 
devant: 

&=th=3 (755) 


ce qui est pire, c'est que ce comptage naïf est trop facile à manipuler en ajoutant des pages (d'un autre 
nom de domaine internet) sans intérêt recommandant une page quelconque. 


Remarque: Donc le poids maximum est égal in extenso à n-1 
Certaines pages émettent beaucoup de liens. Ceux-ci semblent donc moins spécifiques (spécialisés) et 


leurs poids sera dès lors plus faible. Nous partageons donc le vote de la page F: en /; parts égales, où 


l; dénote le nombre de liens émis. Ainsi, nous pouvons définir une mesure plus fine: 
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1 
K=2 (56 


FLE 


Autrement dit, { compte le nombre de votes pondérés pour la page À. C'est facile à calculer, mais 


nous restons toujours avec le problème susmentionné. 


Dans notre exemple, nous avons ainsi: 


1 1 1 
A = = —+—+— += +++ 2 
514; Es, EE & 2 2 à à 
(75.7) 
1 1 1 1 1 RE ue | 
= = + + — = — +++ = 2 
ob D 4 di di à 2 2 2 
et: 
. 1 PRE. 1,1,1 15 
Le j'=mtmt=totes (75.8) 
5351) h à à 4 1 4 
et: 
Pa l LL 1,1,1 4 
== tie =sietes— (5) 
Shi bi & 3 2 2 3 


Remarque: Si toutes les pages étaient directement connexes, nous aurions alors {4 = 1 pour tout i. 


1.2. COMPTAGE RÉCURSIF 


Heuristiquement, une page À paraît importante si beaucoup de pages importantes la citent. Ceci nous 


mène à définir l'importance {4 de manière récursive comme suit: 
0 
= > 145 (75.10) 
rt? 


Il s'agit donc d'un système d'équations linéaires homogène à n inconnues, où dans l'exemple choisi 
#x = 12. Plus traditionnellement, le système pourra être noté: 


Eu }-4 =Û0 (7511 


ji tj 


ou plus explicitement (cf. chapitre d'Algèbre Linéaire): 
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LR BONE & FE & ko à & 


A 0 
D 18 4 EE EE & & & à &lw | lo 
DO 14 8 & EE & ko à à |l# 0 
DO EH 16 & 4 & & 40 4 42/4 | |0 
Eu 1 : [4 0 
_] 
#6 = : (75.12) 
=] pre 0 
=1 l& 0 
DO EE & HE 1 äo à & | # 0 
RS SPORE CS A OS RE EE nr IL 
DRE EE & EE & & ho -1 & | | 
Ce qui donne avec les valeurs de notre exemple: 
1 2 SE SE @ 2% À 6 0 9 À 0 
41 1 0 21 0 0 0 0 0 o0o o o|* x 
_] _] #2 0 
4 2 1 D O0 0 © O © 0 0 0 le : 
47 0 27 -1 0 0 0 0 0 0 0 04! 0 
47 0 0 0 -1 0 1 0 4° 0 0 0x | lo 
0 0 O0 0 3 -1 0 0 0 0 0 o# | 0 _—. 
0 0 0 o 31 21 1 21 0 0 o0o olw#| |0| 
0 0 0 0 31 0 0 -1 o o o ol# | 0 
0 © © 0 © o o 21 -1 21 21 21) # , 
0 0 0 0 0 0 0 0 4 1 0 21|#| | 
0 0 0 0 0 0 0 0 421 y o | 
à F A2 
DO G- © wo 0 oo oo © 4 à Ft 4 


Outre la solution triviale (vecteur nul), ce système à une infinité de solutions car son déterminant est 
nul (cf. chapitre d'Algèbre Linéaire), ce que l'on peut facilement vérifier avec la fonction MDETERM( 
) de la version anglaise de Microsoft Excel 11.8346. 


Notons maintenant le système précédent sous la forme: 
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a 
41 0 0 2? 0 0 0 0 0 0 o ol * 
AE SE 0ûe 00 0 © 0 0 Où OÙ © 7 . 
r à #3 4 
47 0 27 0 0 0 0 0 0 0 0 ol, Lu 
-] -] —] 
4700 0 0 0 0 1! 0 41 0 0 0x Hs 
0 0 O0 0 31 0 0 0 0 0 o ol#% | 
= 75.14) 
0 0 0 0 31 21 0 21 0 0 oo ol# pe 
0 0 0 0 317 0 0 0 0 o o  o||# Hg 
0 O0 0 0 0 0 0 21 9 21 21 21] #9 #9 
0 0 0 0 0 0o o o 42 0 o 21|#0| |Ao 
4 A 
0 O0 0 0 0 0 0 0 41 21 0 0°” ! 
ci : #12 #42 
0 O0 O0 0 0 0 0 o 41 0 2 


Nous remarquons deux choses avant de continuer: 


1. Dans la matrice ci-dessus, chaque colonne est telle que la somme de ses valeurs égale l'unité. Il s'agit 
donc de la transposée d'une matrice stochastique d'une chaîne de Markov (cf. chapitre de Probabilités). 


2. L'importance {4 est positive ou nulle. Donc le vecteur est strictement positif et il s'agit du vecteur 


stochastique de la chaîne de Markov (cf. chapitre de Probabilités) dont la somme des composantes doit 
être égale à l'unité. 


Nous écrirons alors ce système sous forme condensée: 
pT _ 7EC 10 
= {4 (75.15) 
Ainsi, 1 est la valeur propre et Æ le vecteur propre de l'application P. Nous savons de par notre étude 


des chaînes de Markov que cette relation n'est vérifiée que pour la mesure invariante notée 
traditionnellement Æ dans le domaine d'étude des chaînes de Markov: 


Pr (75.16) 


Pour déterminer la mesure, il faut d'abord réécrire le réseau sous le format d'application matricielle 
d'une chaîne de Markov (cf. chapitre de Probabilités): 


pta+1) = Plpr) (517) 


Avec Microsoft Excel 11.8346, la modélisation est assez simple à reproduire pour déterminer la mesure 
invariante avec un point de départ quelconque (distribution quelconque) dans le graphe: 
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15 PO) PQ) PQ PO P@) PO) PO PM PE PC) PA?) 
16, | 100 000 038) 023 023 023 021 020 0.20 019 018 018 
1%] 000 025 013 016 014 013 012 011 011 010 010 010 
48! | 000 025 013 016 014 013 012 011 0.11 010 010 0.10. 
9] 000 025 013 0.16 0.14) 0.13) 0.12! 0.11/ 0.11) 0.10 010 0.10 
20] 000 025 0.00 0.18) 015 0.12 0.18 015 016 0.17 016 017. 
000 000 008 000 0.06 0.05. 0.04 0.06 0.05 0.05 006 005 
000 0.00 0.08 0.08 0.06 0.11! 0.09 0.10! 0.11 0.10 011 011. 

0.00 000 008 000 006 005 004 0.06 | 005) 005 006 005 
000 0.00 0.00 0.04 0.00 0.05 | 0.03! 0.04 | 0.05 | 0.05 0.06 0.06. 
000 000 000 000 0.01 0.01! 001! 002) 002 002 002 003. 
000 0.00 0.00 000 0.01 0.01) 0.01 0.02! 0.02 | 0.02 0.02 | 0.03. 

0.00 000 000 000 001 001 001 002) 002) 002 002 003 


Figure: 75.3 - Détermination de la mesure invariante avec Microsoft Excel 11.8346 


avec les formules suivantes: 
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PC) F0) FT) 

=MMULT(SBS2$MS13B16B27) =MMULT(SES2 $MS13,C16.C27) 
=MMULT(SES2$MS13.B16B27) =MMULT(SBS2$MS13,C16.C27) 
=MMULT(SBS2$MS13B16B27) =MMULT(SBS2$MS13;C16.C27) 
=MMULT(SBS2$MS13B16B27) =MMULT(SBS2$MS13,C16C27) 
=MMULT(SBS2$MS13B16B27) =MMULT(SBS2$MS13:C16-C27) 
=MMULT(SBS2$MS13.B16B27) =MMULT(SBS2$MS13;C16C27) 
=MMULT(SBS2$MS13.B16B27) =MMULT(SBS2$MS13,C16.C27) 
=MMULT(SBS2$MS13.B16B27) =MMULT(SBS2$MS13;C16C27) 
=MMULT(SBS2$MS13.B16B27) =MMULT(SBS2MS13,C16.C27) 
=MMULT(SBS2$MS13B16827) =MMULT(SBS2$MS13,C16C27) 
=MMULT(SBS2$MS13B16827) =MMULT(SBS2$MS13;C16.C27) 
=MMULT(SBS2$MS13.B16B27) =MMULTISBS2$MS13,C16C27) 


Figure: 75.4 - Formules Microsoft Excel 11.8346 (version anglaise) correspondantes au tableau précédent 


EN -N-N-N-N-N--N- 


eo 


Le système converge assez vite, après la 30ème étape, nous avons déjà une convergence à la deuxième 
décimale: 


012 012 
0.06 006 0.06. 
0.06 006 0.06. 
0.06, 006, 0.06) 
0.18, 018 0.18 
0.06 006 0.06. 
012 012 012. 
0.06, 006 0.06 
0.11 O1 0.11 
0.05, 005 0.06 
0.05 005 0.06. 
0.05 005 0.06 


Figure: 75.5 - Convergence à la 35ème itération 


Donc finalement la mesure invariante est: 
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0.12 
0.06 
0.06 
0.06 
0.18 
0.06 
OLIS 
0.06 
0.11 
0.06 
0.06 
0.06 


(75.18) 


quelle que soit la distribution du vecteur de départ. Propriété que l'on appelle "ergodique" dans le 


domaine des chaînes de Markov. 


Étant donné que, nous avons pour tout 4 e IR * le système suivant qui est toujours vérifié: 


P'(A-)=(A4.4) (75.19) 


Alors, il est d'usage dans l'étude de l'algorithme de Google d'écrire le vecteur stochastique avec des 
valeurs entières (chaque valeur du vecteur stochastique a été divisée par la plus petite probabilité qui 
était 0.06) correspondant au fameux "PageRank Value" (au début de l'existence de Google car 


actuellement ce calcul est beaucoup plus subtil) tel que: 


mm NN mm NN mm QD nm = = N 


(75.20) 


Cela nous donne donc la répartition convergente par page d'une cohorte de 17 internautes (sommes des 


valeurs du vecteur stochastique). 


Les pages où ;, est grand sont les plus fréquentées (les plus populaires) en termes de probabilités à 


l'équilibre. Dans la quête de classer les pages web, c'est encore un argument pour utiliser la mesure #{ 


comme indicateur empirique. 
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1.3. ÉTATS ABSORBANTS 


Cependant, si notre graphe (chaîne) contient une page (ou un groupe de pages) sans issue alors celle-ci 
absorbe toute la probabilité, car notre cohorte tombera tôt ou tard sur cette page et ne pourra plus en 
sortir (état absorbant). Nous représentons cela sous la forme graphique suivante si, par exemple, nous 


ajoutons une page Æ; qui est absorbante: 


4 
É + 
L" 


f S SF 
>. 


Figure: 75.6 - Graphe avec un état absorbant 


avec la matrice de transition associée: 


( 
41 


9 9 9 9 0 © © © 


271 


S 9 0 0 0 Sd © © © 


271 


9 oo 0 2 0 S © © 


271 


6 © » » & © 6 6 à» & & M" 


0 
() 
0 
() 
0 


9 S 9 2 2 S © © 


( 
0 
0 
0 


0 O0 0 
0 O0 0 
0 O0 0 
0 O0 0 
0 O0 0 
0 O0 0 
0 O0 0 
0 O0 0 

RE D 
0 0 3! 

21 0 0 
0 21 0 
0 0 31 


M 0 9 09 0 0 2 0 9 D SO © © 


(75.21) 


Notre modèle n'est donc pas encore satisfaisant. Nous pourrions construire alors une matrice qui permet 
d'échapper aux états absorbants en posant que toute colonne qui ne contient qu'un seul 1 avec que des 
zéros se voit téléporter le visiteur sur toutes les pages avec un poids égal. Ce qui donnerait puisque nous 


avons 13 pages: 
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(0 


9 9 9 9 9 © © © 


271 


S 9 0 0 0 0 Sd SO © © 


271 


9 o S 0 S 0 S © © 


2e ‘Q 2 
RE 
0 O0 O0 
0 0 O0 
0 0 0 
ü + 
Qu 27 
0 31 0 
0 0 0 
0 0 O0 
0 0 0 
0 0 O0 
0 0 0 


So 9 © © 


ni 
Û 
— 


9 So Oo 0 0 © © © 


0 0 0 0 
0 O0 0 0 
0 O0 0 0 
0 O0 0 0 
D.#4+ 0. © 
0 O0 0 0 

21 0 0 0 
0 0 0 0 

RE DR 3 


0 
0 
D 4 D 
0 


13 
13 
15” 
15 
13" 
15 
132 | (75.22) 
15 
137 
12 
131 
137 
Eh 


Mais ceci n'est pas très optimal, car cela charge la matrice donc c'est très gourmand en termes de 
mémoires et calculs. 


Pour échapper aux états absorbants, Google utilise un modèle empirique plus raffiné. 


Nous prenons l'application initiale qui est une application linéaire: 


J:R" KR 


g—PTu (75.23) 


où pour rappel la somme des composantes de Æ vaut toujours 1. Nous réécrivons cela sous la forme: 


f:R"—R" 


a=1 Puy (75.24) 


où le 1 représente le fait qu'il y a 100% de probabilité d'avoir l'état PT 4 . Maintenant, l'astuce consiste 


à écrire: 


avec: 


J:R" KR 


LE. e+(1-c). P'u (75.25) 


(75.26) 
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ce qui signifie que l'internaute a à tout moment une probabilité (1 -c) d'être dans l'état PT 4 etune 


probabilité c d'être dans l'état £&, c'est-à-dire de se trouver avec une probabilité équiprobable en 
n'importe quel point du graphe. Enfin, nous sommons les deux pour obtenir à nouveau un vecteur 
stochastique (dont la somme des composantes vaut 1). 


Effectivement, si nous prenons par exemple 10% pour la valeur de c, nous avons la somme des 
composantes du vecteur: 


(1-c) Plu (75:27) 


qui vaudra 0.9 et respectivement la somme des composantes du vecteur £-c qui vaudra 0.1 (puisque la 
somme des composantes de £& vaut aussi 1 par construction). 


Donc pour résumer, avec une probabilité fixée c le moteur d'indexation (ou l'internaute) abandonne la 
page actuelle À; et recommence sur une des n pages du web, celle-ci étant choisie, afin de ne 


privilégier personne. Sinon, avec une probabilité 1—-< le moteur suit un des liens de la page À; , choisi 


de manière équiprobable. Le seul point délicat reste à calibrer la valeur de c qui vaut donc entre 0 et 1. 
S'il vaut 0 nous retombons sur le modèle initial avec le problème des états absorbants, s'il vaut 1 nous 
avons un modèle qui donne une note égale à chaque page. Il faut donc plutôt choisir c avec des valeurs 
faibles proches de 0. 


Cette astuce de téléportation évite de se faire piéger par une page absorbante et garantit d'arriver 
n'importe où dans le graphe, indépendamment des questions de connexité. 


Il convient de remettre le tout sous forme de composantes, nous avons donc l'écriture (dont le 
deuxième terme converge): 


ji dj 


qui a l'avantage énorme de pouvoir calculer la valeur de n'importe quelle composante {4 du vecteur 
stochastique de n'importe quelle étape d'une promenade aléatoire sur le graphe et ce sans faire appel à 
aucun moment à la manipulation d'une immense matrice qui serait trop gourmande en termes de 
capacités de mémoire!! 
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Notes personnelles: 
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BIOGRAPHIES 


Cette chapitre présente une poignée d'hommes qui postulent une étrange renommée. Selon les règles de 
l'histoire que l'on enseigne à l'école primaire, ils n'existent pas, ils n'ont commandé aucune armée, ils 
n'ont envoyé personne à la mort, ils n'ont dirigé aucun empire et ils n'ont eu qu'une part minime dans les 
grandes décisions historiques. Certains ont acquis quelque célébrité, mais aucun ne fut jamais un héros 
national. Pourtant, leur oeuvre a davantage influencé le cours de l'histoire que bien des actes accomplis 
par des hommes d'État auréolés d'une gloire très supérieure. Elle a produit plus de bouleversements que 
le va-et-vient des armées en bataille par-dessus les frontières, elle a fait plus pour le bonheur ou le 
malheur que les édits des rois et des assemblées. Car leur oeuvre, c'est d'avoir façonné l'esprit de 
l'homme. 


Qui propage ses idées, manie un pouvoir bien supérieur à celui de l'épée ou du sceptre: aussi ont-ils 
façonné et dirigé le monde. Pour la plupart, ils n'ont pas levé le moindre petit doigt pour agir 
physiquement; ils ont travaillé essentiellement en intellectuels, dans le silence et l'oubli, sans se soucier 
outre mesure du monde environnant. Mais, dans leur sillage, des empires se sont écroulés et des 
continents disloqués, des régimes politiques se sont soit renforcés, soit érodés, les classes se sont 
dressées les unes contre les autres, ainsi que les nations. Non pas sous l'effet d'un noir complot, mais de 
par la puissance extraordinaire de leurs idées. Qui sont ces hommes (femmes) ?: des savants, 
économistes, chimistes, biologistes, mathématiciens, physiciens, informaticiens, ingénieurs. 


Les biographies ci-dessous des scientifiques les plus connus à travers le monde et cités dans les 
différents chapitre du site sont triées par ordre alphabétique et presque tous les textes sont de simples 
copier/coller simplifiés de Wikipédia. Si vous souhaitez que nous rajoutions une entrée, il vous suffit de 
nous envoyer par courriel le nom et prénom de la personne concernée et la raison pour laquelle vous 
aimeriez la voir figurer dans la liste ci-dessous. Nous étudierons ensuite la proposition et prendrons la 
décision qui s'impose. 


Nous rendons aussi hommage aux centaines de milliers de scientifiques (savants), ingénieurs, 
philosophes, artisans, mécènes, artistes, amateurs éclairés connus ou anonymes dont la 
collaboration a permis à travers les millénaires l'évolution de la science et de la condition 
humaine! 


Les tailles des biographies ne sont pas proportionnelles au nombre d'articles publiés ou découvertes 
effectuées, mais à la quantité d'informations trouvées sur ces personnages sur l'Internet ou dans la 
littérature. La liste n'est aussi pas exhaustive, mais son objectif est de rendre hommage et de se 
remémorer les grands hommes qui ont fait des sciences pures et exactes ce qu'elles sont aujourd'hui et 
qui ont consacré une partie ou l'entier de leur vie à la science: l'art le plus contraint. 


Attention! En physique (aussi bien qu'en mathématique) une théorie, une équation, une constante ou 
autre porte rarement le nom de son vrai inventeur. Ce fait est largement connu chez les scientifiques et 
est souvent source de moqueries de la communauté. 
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Al-Biruni, Muhammad Ibn Ahmad Abul-Rayhan (973-1048) est un 
mathématicien, un astronome, un physicien, un érudit, un encyclopédiste, un 
philosophe, un astrologue, un voyageur, un historien, un pharmacologue et un 
précepteur, originaire de la Perse, qui contribua grandement aux domaines des 
mathématiques, philosophie, médecine et des sciences. Il est connu pour sa 
théorie sur la rotation de la Terre autour de son axe et autour du Soleil, et ceci 
bien avant Copernic. Il s'attacha notamment à calculer la marche du Soleil 
(apogée), corrigea certaines données de Ptolémée. Excellent mathématicien, 
Al-Biruni développa de nouvelles équations inconnues de ses prédécesseurs. Il 
calcula également le méridien local et les coordonnées des localités. Mais le 
tableau ne serait pas complet si l'on oubliait de mentionner que six siècles avant 
Galilée, Al Biruni mettait déjà en avant une Terre qui tournait autour de son axe. 
Avec l'aide d'un astrolabe, de la mer et d'une montagne avoisinante, il calcula la 
circonférence de la Terre en résolvant une équation complexe pour son époque. 
Le principal d'apport d'Al-Biruni aux mathématiques résiderait dans ses travaux 
en trigonométrie (calculs des valeurs des fonctions trigonométriques qui n'étaient 
pas encore définies en tant que tel à l'époque). 


Alembert, Jean le Rond (1717-1783), enfant naturel d'un commissaire 
d'artillerie, abandonné sur les marches de la chapelle parisienne de Saint- 
Jean-Le-Rond, le futur grand philosophe, mathématicien et physicien est recueilli 
par un vitrier qui recevra secrètement une pension pour subvenir à l'éducation du 
jeune garçon qui étudiera brillamment le droit, la médecine et la mathématique. 
Suite à la publication de divers mémoires (sur le calcul intégral, sur la réfraction 
des corps solides), d'Alembert entre à l'Académie des sciences (1741). On lui doit 
le célèbre principe de la quantité de mouvement, dit "principe de d'Alembert" 
dans son Traité de dynamique (1743). En astronomie, il est l'auteur (1749) d'un 
traité sur la précession des équinoxes qu'il explique au moyen de la théorie de la 
gravitation universelle de Newton et d'une solution partielle au problème des trois 
corps. D'Alembert établit aussi une théorie mathématique des cordes vibrantes en 
étudiant la nature composite du son (harmoniques). 


Ampère, André-Marie (1775-1836) à 18 ans, il connaît la majeure partie des 
oeuvres mathématiques de son temps. Mathématicien de premier ordre, il montre 
comment l'on doit utiliser cette science, qu'il considérait comme une branche de la 
philosophie, à l'étude des découvertes des faits physiques pour en donner une 
relation définitive. En quelques semaines, Ampère établit les bases de toute une 
science à laquelle il donne le nom d'électromagnétisme. Il cherche à comprendre 
le magnétisme des aimants et en tire une hypothèse de "courants particulaires" 
(orbites électroniques et orientation du spin aujourd'hui). Il établit également 
l'égalité du nombre de molécules dans des volumes égaux de Gaz de natures 
différentes, mais mesurés dans des conditions identiques de température et de 
pression (observation expérimentale de Gay-Lussac). 
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Archimède, De Syracuse (287-212 av. J.-C.), mathématicien et ingénieur grec 
célèbre à la fois comme mécanicien théoricien et comme constructeur de 
machines. Archimède de Syracuse eut une production mathématique 
exceptionnelle, dont une partie nous est parvenue dans des traités comme Sur la 
sphère et le cylindre; la Mesure du cercle; la Quadrature de la parabole; Des 
spirales; Des conoïdes et sphéroïdes; la Méthode, Des corps flottants. C'est à 
partir de ses travaux mécaniques que les principales anecdotes le mettant en 
scène, comme celle du levier ou du baïn, vont se constituer. La célèbre maxime: 
«Donnez-moi une place où me tenir et je mettrai la terre en mouvement» est un 
écho populaire de la contribution archimédienne à la statique, exposée dans le 
traité des Équilibres. Archimède démontre la loi du levier, introduit la notion 
fondamentale de centre de gravité, et détermine ces barycentres pour les 
principales figures géométriques planes. Il en est de même pour l'anecdote 
d'Archimède, jaillissant nu de son bain, en criant «Eurêka», parce qu'il venait, 
dit-on, de trouver le moyen de résoudre le problème que lui avait posé le roi 
Hiéron. En fait, le récit est une mise en scène spectaculaire de la découverte du 
principe fondamental de l'hydrostatique (communément appelé depuis "principe 
d'Archimède"). En géométrie, l'oeuvre d'Archimède développe celle d'Eudoxe de 
Cnide telle que nous la connaissons par le livre XII des Éléments d'Euclide: il 
s'agit de comparer les mesures des figures planes et solides, en particulier des 
figures curvilignes. Ainsi, Archimède démontre que le volume du cylindre 
circonscrit à une sphère est égal à une fois et demi le volume de celle-ci et que la 
surface latérale du cylindre est égale à celle de la sphère ou quatre fois la surface 
d'un grand cercle. Donc, si l'on sait calculer la surface du cercle, on connaîtra 
celle de la sphère, du cylindre, son volume et celui de la sphère, etc. Son résultat 
le plus célèbre et le plus simple concerne le cercle. Archimède ramène sa 
quadrature à un autre problème: la rectification de sa circonférence, c'est-à-dire 
«trouver une ligne droite égale qui lui soit égale», problème qu'il résout à l'aide 
d'une courbe géométrique que l'on appelle désormais "spirale d'Archimède". En 
outre, il calcule des valeurs approchées du rapport circonférence/diamètre (ce que 
nous appelons le nombre "Pi"). 


Avogadro, Amedeo (1776-1856), Fils d'un magistrat de Turin, Amadeo Avogadro 
commence par suivre la voie paternelle. Il passe une licence de droit en 1795 et 
s'inscrit au barreau de sa ville natale. Mais son goût pour la physique et la 
mathématique, auxquelles il n'a cessé de s'intéresser en solitaire, le pousse à 
entamer sur le tard des études scientifiques. En 1809, il fait une communication à 
l'Académie royale de Turin ; le succès qu'il remporte grâce à elle lui permet 
d'obtenir un poste de professeur au Collège royal de Verceil. En 1820, l'Université 
de Turin crée pour lui une chaire de physique qu'il gardera jusqu'à la fin de sa vie. 
C'est en étudiant les lois régissant la compression et la dilatation des gaz 
qu'Avogadro énonce, en 1811 l'hypothèse restée célèbre sous le nom de “loi 
d'Avogadro". Reposant sur la théorie atomique de Dalton et la loi de Gay-Lussac 
sur les rapports volumiques, la théorie d'Avogadro indique que deux volumes 
égaux de gaz différents, dans les mêmes conditions de température et de pression, 
contiennent le même nombre de molécules. Sous son apparente simplicité, cette 
loi comporte des implications importantes ; grâce à elle, il devient possible de 
déterminer la masse molaire d'un gaz à partir de celle d'un autre. Mais les 
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chimistes de l'époque, plus intéressés par les expériences, boudent quelque peu les 
études théoriques d'Avogadro qui ne seront d'ailleurs reconnues que 50 ans plus 
tard. Le nom d'Avogadro reste également lié à celui du "nombre d'Avogadro" 
indiquant le nombre de molécules contenues dans une seule mole. 


Bachelier, Louis (1870-1946) est né au Havre dans une famille de négociants. Il 
apparaît à sa majorité sur les listes électorales du Havre en 1892 comme 
représentant de commerce à la même adresse professionnelle que son père. Après 
avoir effectué son service militaire, à l'âge de 22 ans, il reprend ses études à la 
faculté des sciences de Paris. Elles sont couronnées par une licence ès sciences en 
1895 (mention passable) et par la soutenance en 1900 de sa non moins fameuse et 
méconnue thèse de doctorat en mathématiques. Bien que cette thèse soit 
considérée aujourd'hui comme un travail précurseur en théorie des probabilités et 
en théorie financière, elle ne vaut à l'époque à son auteur qu'une mention 
honorable. De 1913 à 1914 Bachelier dispensa un cours libre de théorie des 
probabilités appliquées à la mécanique, la balistique et la biométrie. Il fut 
également chargé de conférences supplémentaires sur la mathématique générale 
de 1913 à 1914. Ce n'est qu'après la guerre de 1914-1918 qu'il obtient un premier 
poste de chargé de cours à la faculté des sciences de Besançon. Après divers 
remplacements à Dijon puis à Rennes, il revient à Besançon en 1927 comme 
professeur titulaire de la chaire de calcul différentiel et intégral, poste qu'il occupe 
jusqu'à sa retraite en 1937. Louis Bachelier a, parmi ses nombreux travaux, été le 
premier a avoir introduit la continuité dans les problèmes de probabilité en 
prenant le temps comme variable. En particulier, il a élaboré une théorie 
mathématique du mouvement brownien 5 ans avant Albert Einstein. Il est 
également bien avant Norbert Wiener, le premier à avoir défini la fonction du 
mouvement brownien et donné un grand nombre de ses propriétés. 


Banach, Stefan (1892-1945) mathématicien polonais qui a posé les bases de 
l'analyse fonctionnelle. Né à Cracovie en 1892, en Autriche-Hongrie 
(actuellement ville polonaise). Banach fit ses études secondaires à Cracovie; il se 
révéla particulièrement brillant en mathématiques et en sciences naturelles, mais 
son désintérêt pour les autres matières l'empêcha d'obtenir les meilleures 
mentions. La vie (au moins mathématique) de Banach va basculer au printemps 
1916, quand il rencontre Steinhaus à Cracovie. Avec Otto Nikodym, ils décident 
de fonder une société mathématique. La recherche mathématique de Banach 
commence là. Son premier article est cosigné avec Steinhaus. Steinhaus lui avait 
parlé d'une propriété qu'il ne parvenait pas à démontrer, et après quelques jours de 
réflexion, Banach exhiba un contre-exemple. Il est difficile de dire ce qu'il serait 
advenu de l'activité mathématique de Banach sans la rencontre avec Steinhaus, 
mais toujours est-il qu'il entama à compter de celle-ci une recherche intense et 
fructueuse. Banach retourne à Lvov en 1920 où un poste d'assistant lui est 
proposé. Il soutient sa thèse en 1922, et c'est dans cette thèse qu'apparaît pour la 
première fois la notion d'espace de Banach, qu'y sont démontrés les théorèmes 
fondamentaux sur ces objets, où on y évoque la topologie faible. Bref, cette 
thèse marque la naissance de l'analyse fonctionnelle. En 1929, il fonde avec 
Steinhaus la revue mathématique Studia Math, consacrée au développement de 
l'analyse fonctionnelle, et en 1939 il est élu président de la société mathématique 
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de Pologne. En 1945, peu avant la fin de la Seconde Guerre Mondiale, il décède 
d'un long cancer. De nombreux théorèmes sont associés au nom de Banach, qu'il 
les ait démontrés lui-même, ou qu'ils fassent référence à ces idées. Citons entre 
autres: le théorème de Hahn-Banach de prolongement des formes linéaires 
continues, le théorème de Banach-Steinhaus, de Banach-Alaoglu, le théorème du 
point fixe de Banach, ainsi que le paradoxe de Banach-Tarski. 


Bell, John (1928-1990) fut dès la plus petite enfance attiré par les livres traitant 
des sciences. À cause de problèmes financiers familiaux, il ne put poursuivre 
immédiatement des études académiques. Il travailla donc pendant une année en 
tant que technicien au département de physique de l'université de Queen's à 
Belfast avant de devenir étudiant en 1945 dans ce même département. Il sortit 
premier de sa promotion en mathématiques-physique. Bell trouva dans les années 
1960 une nouvelle inspiration dans les bases de la théorie quantique, une matière 
supposée épuisée par les résultats de la discussion de Bohr-Einstein 30 ans plus 
tôt, et ignorée par pratiquement tous ceux qui ont employé la théorie quantique 
entre-temps. Effectivement, Bell était intrigué par les incertitudes quantiques de 
Heisenberg et voulait creuser le sujet en montrant que la discussion de tels 
concepts comme le "réalisme", le "déterminisme" et la "localité" pouvaient être 
affiliés dans un rapport mathématique rigoureux: "les inégalités de Bell" 
vérifiables expérimentalement. Bell poussa très loin les doutes qu'il avait sur les 
principes d'incertitudes au point qu'il en irrita même son professeur (Sloane) qui 
lui fit remarquer que maintenant il allait un peu trop loin! Bell attendit son travail 
de thèse pour développer ses idées. Malheureusement, à nouveau à cause de 
problèmes financiers, il dut repousser ses recherches à plus tard et joindre le 
centre anglais de recherche atomique à Harwell. Pendant sa carrière, il épousa 
une femme (Mary Bell) qui l'aida dans le développement de ses travaux sur les 
principes fondamentaux de la théorique quantique. C'est, en 1951, avec Rudolf 
Peierls que Bell développa sa célèbre théorie C.P.T. (Charge, Parity, Time). 
Malheureusement, pour Bell, Gerhard Lüders et Wolfgang Pauli arrivèrent au 
même résultat dans la même période et c'est à eux que furent attribué les crédits 
de la découverte. Les développements théoriques de Bell sont à l'origine de la 
cryptographie et de la théorique de l'information quantique. L'attention à la 
théorie quantique de l'information a énormément augmenté au cours des dernières 
années, et le sujet semble sûr d'être l'un des secteurs scientifiques dont la 
croissance sera la plus importante au 21ème siècle. Un autre travail de première 
importance de Bell en 1969 fut la participation au développement de "l'anomalie 
A.B.J." (Adler-Bell-Jackiw) dans la théorie quantique des champs. Ces trois 
physiciens montrèrent que le modèle algébrique standard contentait une erreur. 
Effectivement, la quantification du modèle des champs brise une symétrie. Bell 
fut nommé pour le prix Nobel, qu'il aurait certainement obtenu s'il n'était pas 
décédé d'une attaque cérébrale en 1990. 
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Bernoulli, Daniel (1700-1782), est un savant suisse qui découvrit les principes de 
base du comportement d'un fluide (c'est le fils de Jean Bernoulli et le neveu de 
Jacques Bernoulli.). Il cultiva à la fois les sciences mathématiques et les sciences 
naturelles, enseigna les mathématiques, l'anatomie, la botanique et la physique. 
Ami de Leonhard Euler, il travaille avec lui dans plusieurs domaines des 
mathématiques et de la physique (il partagea avec lui dix fois le prix annuel de 
l'Académie des sciences de Paris), qu'il s'en fit une sorte de revenu. Les différents 
problèmes qu'il tente de résoudre (théorie de l'élasticité, mécanisme des marées) 
le conduisent à s'intéresser et développer des outils mathématiques tels que les 
équations différentielles ou les séries. Il collabore également avec Jean le Rond 
d'Alembert dans l'étude des cordes vibrantes. Il étudia l'écoulement des fluides 
(1738) et formula le principe (le fameux théorème de Bernoulli) selon lequel la 
pression exercée par un fluide est inversement proportionnelle à sa vitesse 
d'écoulement. Il utilisa des concepts atomistes pour ébaucher la première théorie 
cinétique des gaz, en exprimant leur comportement en termes de probabilités sous 
des conditions particulières de pression et de température. On peut le considérer 
comme l'un des fondateurs de l'hydrodynamique. 


Bernoulli, Jacques (1654-1705), est un mathématicien et physicien suisse, frère 
de Jean Bernoulli et oncle de Daniel Bernoulli et Nicolas Bernoulli. Né à Bâle en 
1654, il rencontre Robert Boyle et Robert Hooke lors d'un voyage en Angleterre 
en 1676. Après cela, il se consacre à la physique et aux mathématiques. Il 
enseigne à l'université de Bâle à partir de 1682, devenant professeur de 
mathématiques en 1687. Il mérita par ses travaux et ses découvertes d'être nommé 
associé de l'Académie des sciences de Paris (1699) et de celle de Berlin (1701). 
Sa correspondance avec Gottfried Wilhelm Leibniz le conduit à étudier le calcul 
infinitésimal en collaboration avec son frère Jean. Il fut un des premiers à 
comprendre et à appliquer le calcul différentiel et intégral, proposé par Leibniz, 
découvrit les propriétés des nombres dits depuis "nombres de Bernoulli" et donna 
la solution de problèmes regardés jusque-là comme insolubles. Il pose les 
principes du calcul des probabilités et introduit les nombres de Bernoulli dans un 
ouvrage publié après sa mort en 1713. 


Bernoulli, Jean (1667-1748), est un mathématicien et physicien suisse. Frère de 
Jacques Bernoulli et père de Daniel et Nicolas Bernoulli, il professa les 
mathématiques à Groningue (1695), puis à Bâle, après la mort de Jacques 
Bernoulli (1705), et devint associé des Académies de Paris, de Londres, de Berlin 
et de Saint-Pétersbourg. Formé par son frère Jacques Bernoulli, il avait longtemps 
travaillé de concert avec lui à développer les conséquences du nouveau calcul 
infinitésimal inventé par Gottfried Leibniz ; mais il s'établit ensuite entre eux, à 
l'occasion de la résolution de quelques problèmes, une rivalité qui dégénéra en 
inimitié. Il a aussi contribué dans beaucoup de secteurs aux mathématiques y 
compris le problème d'une particule se déplaçant dans un champ de gravité. Il 
trouva l'équation de la chaînette en 1690 et développa le calcul exponentiel en 
1691. Il eut aussi la gloire de former Leonhard Euler. Il vint à Paris en 1690, et se 
lia avec les savants les plus distingués, particulièrement avec de L'Hôpital. Jean 
Bernoulli est devenu membre de la Royal Society en 1712. 
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Bessel, Friedrich (1784-1846) Né à Minden en Westphalie, Bessel commença à 
travailler très jeune comme commis. Attiré par la navigation maritime, il 
s'intéressa aux observations nautiques, construisant lui-même son sextant et 
étudiant l'astronomie à ses heures de liberté. Il calcula la trajectoire de la comète 
de Halley, résultat qui fut immédiatement publié et lui permit d'obtenir, en 1806, 
un emploi d'assistant à l'observatoire de Lilienthal. En 1810, il devint directeur du 
nouvel observatoire de Kônigsberg, tout en poursuivant des études 
mathématiques. Il dut enseigner la mathématique à ses étudiants en astronomie 
jusqu'en 1825 (date à laquelle Jacobi vint enseigner cette matière à Kôünigsberg). 
Toute sa vie fut consacrée à l'astronomie (il écrivit plus de 350 articles) et, peu 
avant sa mort, il commença l'étude du mouvement d'Uranus, problème qui devait 
aboutir à la découverte de Neptune. En mathématiques, Bessel est connu pour 
avoir introduit les fonctions qui portent son nom, les utilisant pour la première 
fois, en 1817, lors de l'étude d'un problème de Kepler, et les employant plus 
complètement 7 ans plus tard pour étudier les perturbations planétaires. 


Bohr, Niels Henrik David (1885-1962), physicien danois, prix Nobel en 1922, 
pour sa contribution à la physique nucléaire et à la compréhension de la structure 
atomique. La théorie de Bohr sur la structure atomique, pour laquelle il reçut le 
prix Nobel de physique en 1922, fut publiée entre 1913 et 1915. Son travail 
s'inspira du modèle nucléaire de l'atome de Rutherford, dans lequel l'atome est 
considéré comme un noyau compact entouré d'un essaim d'électrons. Le modèle 
pose en principe que l'atome n'émet de rayonnement électromagnétique que 
lorsqu'un électron se déplace d'un niveau quantique à un autre. Ce modèle 
contribua énormément aux développements ultérieurs de la physique atomique 
théorique. 


Boltzmann, Ludwig (1844-1906), physicien autrichien qui contribua à établir les 
bases de la mécanique statistique. Ayant fait ses études à Vienne et à Oxford, il 
enseigna la physique dans différentes universités allemandes et autrichiennes 
pendant plus de 40 ans. Développant la théorie cinétique des gaz, notamment à 
partir des travaux de Maxwell, il établit que la seconde loi de la thermodynamique 
pouvait être obtenue sur la base de l'analyse statistique. Calculant le nombre de 
particules dotées d'une énergie donnée, il établit la statistique dite de Maxwell- 
Boltzmann. Il exprima l'entropie S d'un système en fonction de la probabilité W de 
son état (par l'intermédiaire de sa fameuse équation de transport à partir de 
laquelle démontra que l'entropie ne pouvait qu'augmenter au cours du temps... 
résultat qui était jusque là admis expérimentalement mais sans preuve théorique). 
Il put aussi établir de manière théorique la loi de Stefan relative au rayonnement 
d'un corps noir. Mais il lui fallut expliquer comment les principes mécaniques, où 
les phénomènes sont réversibles, pouvaient engendrer des lois thermodynamiques 
décrivant des phénomènes marqués par l'irréversibilité. Il avança l'idée que les 
évolutions irréversibles, quoiqu'elles ne soient que des possibilités parmi d'autres, 
sont si probables que ce sont pratiquement toujours elles qui se produisent. 
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Boole, Georges (1815-1864) Mathématicien et logicien anglais, Boole est le 
créateur de la logique symbolique. Né à Lincoln et fils d'un petit commerçant, il 
reçut ses premières leçons de mathématiques de son père, qui lui apprit aussi à 
fabriquer des instruments d'optique. En dehors des conseils de son père et de 
quelques années passées dans les écoles locales, Boole est un autodidacte. Quand 
les affaires de son père déclinèrent, il fut obligé de travailler pour aider sa famille 
et, dès 16 ans, il enseigna dans des écoles de village ; à 20 ans, il ouvrit sa propre 
école à Lincoln. Pendant ses loisirs, il étudiait la mathématique à l'Institut de 
mécanique, créé vers cette époque ; c'est là qu'il se familiarisa avec les Principia 
de Newton, la Mécanique céleste de Laplace et la Mécanique analytique de 
Lagrange et qu'il commença à résoudre des problèmes d'algèbre supérieure. Boole 
soumit au nouveau Cambridge Mathematical Journal une série d'articles 
originaux dont le premier est Recherches sur la théorie des transformations 
analytiques ; ces articles portaient sur les équations différentielles et sur les 
invariants par transformation linéaire. En 1844, il étudie les liens entre l'algèbre et 
le calcul infinitésimal dans un important mémoire publié dans les Transactions de 
la Royal Society, qui lui décerne une médaille cette même année pour sa 
contribution à l'analyse (c'est-à-dire l'utilisation de l'algèbre dans l'étude des 
infiniment petits et grands). Développant de nouvelles idées sur la méthode en 
logique et confiant dans le symbolisme qu'il avait élaboré à partir de ses 
recherches mathématiques, il publie, en 1847, un opuscule, Mathematical 
Analysis of Logic, dans lequel il soutient que la logique doit être rattachée aux 
mathématiques et non à la philosophie. Bien qu'il n'eût aucun titre universitaire, 
Boole fut, sur la base de ses publications, nommé en 1849 professeur au Queen's 
College à Cork, en Irlande. Avec Boole, en 1847 et en 1854, commence l'algèbre 
de la logique, c'est-à-dire ce que l'on appelle de nos jours l'algèbre de Boole. Dans 
son ouvrage de 1854, Boole énonce complètement sa nouvelle méthode 
symbolique d'inférence logique, qui permet, étant donnés des propositions 
contenant un certain nombre de termes, d'en tirer, par traitement symbolique des 
prémisses, des conclusions qui étaient logiquement contenues dans les prémisses. 
Il rechercha aussi une méthode générale en calcul des probabilités, qui aurait 
permis, à partir des probabilités connues d'un système d'événements donnés, de 
déterminer la probabilité de tout autre événement relié logiquement aux 
événements donnés. 


Borel, Émile (1871-1956), reçu major à l'X et à ULM, il choisit cette dernière et 
se consacre aux mathématiques. Il fonda l'institut Henri Poincaré et fut élu député 
de l'Aveyron et maire de Saint-Afrique. Il étudie les mesures d'ensembles et 
notamment, définit les ensembles de mesure nulle et l'ensemble des boréliens, sur 
lequel on peut définir une mesure. Il se tourne ensuite vers les probabilités et la 
physique-mathématique. Borel est également considéré comme un mathématicien 
constructiviste. Il fut à l'origine de la théorie des jeux stratégiques et de la 
cybernétique que développeront von Neumann et Morgenstern. Son élève Henri 
Lebesgue utilisera ses résultats en topologie et théorie de la mesure pour sa 
théorie de l'intégration. 
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Born, Max (1882-1970) né à Breslau est décédé à Gôttingen est un physicien 
allemand, puis britannique. Initialement il suit ses études au collège de Kônig- 
Wilhelm, et poursuit à l'Université de Breslau suivie par celle d'Heidelberg et de 
Zürich. Pendant les études pour son doctorat il entra en contact avec des 
mathématiciens comme Klein, Hilbert, Minkowski, Runge, Schwarzschild. En 
1921, il est nommé professeur de physique théorique à Gôttingen. Il émigre en 
Écosse en 1933 et devient citoyen britannique en 1939. Physicien théoricien 
remarquable, il est principalement connu pour son importante contribution à la 
physique quantique: développement (1925) de la mécanique quantique matricielle 
introduite par Werner Heïisenberg et, surtout, il sera le premier à donner au carré 
du module de la fonction d'onde la signification d'une densité de probabilité de 
présence. Il fut également un pionnier dans la théorie quantique des solides 
(conditions de Born-Von Karmann) et dans l'électrodynamique non linéaire de 
Born-Infeld. Il est lauréat de la moitié du prix Nobel de physique de 1954 (l'autre 
moitié a été remise à Walther Bothe) pour ses recherches fondamentales en 
mécanique quantique, particulièrement pour son interprétation statistique de la 
fonction d'onde. La Royal Society lui décerne la Médaille Hughes en 1950. 


Bose, Satyendranath (1894-1974) Mathématicien et physicien indien, connu 
pour ses contributions à la théorie quantique. Né à Calcutta, Bose a fait ses études 
au Presidency College de Calcutta. En 1924, il propose une description statistique 
des systèmes quantiques, reprise par Albert Einstein, et qui n'impose aucune 
restriction sur la distribution en énergie des particules du système. Cette 
description est connue sous le nom de "statistique de Bose-Einstein", par 
opposition à la "statistique de Fermi-Dirac". Appliquée à la théorie du 
rayonnement du corps noir, cette nouvelle statistique conduit à la distribution de 
Planck et permet de traiter ce rayonnement comme un gaz de photons. Dans le 
domaine de la physique des particules élémentaires, la statistique de 
Bose-Einstein impose à la fonction d'onde des particules (dans l'équation de 
Schrôüdinger) d'être parfaitement symétrique pour l'ensemble des variables 
d'espace et de spin. Les particules obéissant à cette statistique (photons, mésons 
p, etc.) sont appelées des bosons. Professeur de physique aux universités de 
Calcutta et de Dacca, Satyendranath Bose a été nommé, en 1958, professeur 
national des Indes. 


de Broglie, Louis Victor (1892-1987), physicien français et lauréat du prix 
Nobel, qui apporta une contribution essentielle à la théorie quantique avec ses 
études de la radiation électromagnétique. Né à Dieppe, Louis de Broglie fit ses 
études à Paris. Il essaya de cerner la nature dualiste de la matière et de l'énergie et 
proposa l'association d'une onde à toute particule. Il proposa ainsi directement 
comment il était possible d'obtenir les règles de quantification du modèle d'atome 
de Bohr et Sommerfeld en exigeant qu'un nombre entier d'ondes soit logé sur une 
orbite stationnaire. Sa découverte de la nature ondulatoire des électrons (1924) lui 
valut le prix Nobel de physique en 1929 sans qu'il proposa toutefois une équation 
d'onde décrivant les phénomènes quantiques (ce que fera Schrôdinger). Il fut élu à 
l'Académie des sciences en 1933 et à l'Académie française en 1943. Il fut nommé 
professeur de physique théorique à l'université de Paris (1928), secrétaire 
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perpétuel de l'Académie des sciences (1942), et conseiller au Commissariat à 
l'énergie atomique (1945). 


Brouwer, Luitzen Egbertus Jan (1881-1966) fut un grand mathématicien 


néerlandais du début du 20° siècle. Né d'un père proviseur, il réalisa des études 
secondaires très brillantes, et très rapides. À l'université d'Amsterdam, il fut formé 
par Korteweg, qui est connu pour des contributions en mathématiques appliquées. 
Il soutient son doctorat en 1904. De 1909 à 1913, Brouwer s'intéresse à la 
topologie, et découvre la majeure partie des théorèmes auxquels son nom est resté 
attaché, dont son fameux théorème du point fixe. Pour beaucoup, Brouwer est le 
père de la topologie moderne. En 1912, il obtient grâce aux recommandations de 
Hilbert, une chaire à l'Université d'Amsterdam. Il y enseigne la théorie des 
ensembles, celle des fonctions, et l'axiomatique. Plus tard, il refusera de rejoindre 
Hilbert à Güttingen. Pendant la première Guerre mondiale sa santé se fragilisa et il 
s'éloigna quelques temps des champs de la recherche scientifique. Quand il y 
revint, ce fut pour se consacrer à ses premières amours (sa thèse portait déjà sur 
ce sujet): les fondements des mathématiques. Brouwer est le fer de lance avec 
Poincaré des mathématiques intuitionnistes, par opposition au logicisme de Russel 
et Frege, et au formalisme de Hilbert. En particulier, pour Brouwer, un théorème 
d'existence ne peut être vrai que si on peut exhiber un processus, même formel, 
de construction. Cela le conduit notamment à rejeter la loi du tiers-exclu, qui dit 
qu'une propriété est ou vraie, ou fausse! Les preuves ainsi obtenues sont souvent 
plus longues, mais Brouwer fut capable de réécrire des traités de théorie des 
ensembles, de théorie de la mesure, et de théorie des fonctions en se conformant 
aux règles de l'intuitionnisme. Bizarrement, Brouwer n'enseigna jamais la 
topologie. C'est probablement dû au fait que les théorèmes que lui-même avait 
prouvés ne rentraient plus dans le cadre qu'il s'était fixé. Selon les témoignages de 
quelques-uns de ses étudiants, il était un personnage vraiment étrange, fou 
amoureux de sa philosophie, et un professeur auquel il ne fallait surtout pas poser 
de questions! 


Cantor, Georg (1845-1918) se révèle être un étudiant brillant, notamment dans 
les matières manuelles. Malgré les injonctions de son père, qui rêve d'en faire un 
ingénieur, il part en 1862 à Berlin étudier la mathématique, où ses maîtres sont 
Weierstrass et Kronecker. Il soutient son doctorat en 1867 (sur la théorie des 
nombres). Les premières recherches postdoctorales de Cantor sont consacrées à 
la décomposition des fonctions en sommes de séries trigonométriques (les 
célèbres séries de Fourier) et particulièrement à l'unicité de cette décomposition. 
Afin de résoudre complètement ce difficile problème, il est amené à introduire et 
à étudier des ensembles dits "ensembles exceptionnels". Cela le conduit à définir 
en 1872 très précisément ce qu'est un nombre réel, comme limite d'une suite de 
nombres rationnels; parallèlement, son ami Dedekind donne la même année une 
autre définition de la droite des réels, à partir des coupures. Cantor et Dedekind 
constatent à cette occasion qu'il y a beaucoup plus de réels que de rationnels, 
mais il n'y a pas jusque-là de définition mathématique à ce "beaucoup plus”. En 
1874, dans le prestigieux Journal de Crelle, Cantor donne une définition du 
nombre d'éléments d'un ensemble infini qui prolonge naturellement celle du 
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cardinal d'un ensemble infini, qui prolonge celle du cardinal d'un ensemble fini. Il 
en découle, jusqu'en 1897, une succession de découvertes étranges: il y autant 
d'entiers pairs que d'entiers tout court, autant de points sur un segment que dans 
un carré, beaucoup plus de nombres transcendants que de nombres rationnels. 
Cette hiérarchie dans les ensembles infinis conduit progressivement Cantor à 
définir des nouveaux nombres, les ordinaux transfinis, et à définir une 
arithmétique sur ces nombres. Les travaux de Cantor ont eu beaucoup d'influence 
au 20ème siècle. On citera d'abord, en 1903, un paradoxe soulevé par Russell 
dans la théorie naïve des ensembles: si À est l'ensemble de tous les ensembles qui 
ne sont pas éléments d'eux-mêmes, À est-il contenu dans A? Les logiciens 
surmonteront cette difficulté conceptuelle, sans rien changer des conclusions de 
Cantor. Citons aussi le problème de l'hypothèse du continu. Un des derniers axes 
de recherche de Cantor était d'estimer le nombre d'éléments de la droite réelle. 
Plus précisément, Cantor souhaitait prouver l'absence de tout ensemble dont le 
cardinal soit strictement compris entre le cardinal des entiers et celui des réels. 
C'est ce que l'on appelle "l'hypothèse du continu". Tous les travaux de Cantor et 
de ses successeurs pour confirmer ou infirmer l'hypothèse du continu furent vains, 
et pour cause: en 1963, le logicien américain Cohen prouva que, dans une théorie 
standard des ensembles, l'hypothèse du continu est indécidable. On peut très bien 
supposer qu'elle est vraie ou qu'elle est fausse sans obtenir de contradiction dans 
la théorie. 


Carnot, Nicolas Léonard Sadi (1796-1832), physicien et ingénieur militaire 
français, considéré comme le créateur de la science thermodynamique. Fils aîné 
de Lazare Carnot, surnommé "le Grand Carnot", Sadi fit ses études à l'École 
polytechnique. En 1824, il décrivit sa conception du moteur à chaleur idéal, 
appelé "moteur Carnot", dans lequel toute l'énergie disponible est utilisée. Il 
découvrit que la chaleur ne pouvait passer d'un corps froid à un corps plus chaud, 
et que le rendement d'un moteur dépendait de la quantité de chaleur qu'il était 
capable d'utiliser. Cette découverte, ou cycle de Carnot, est à la base de la 
seconde loi de la thermodynamique. 


Cartan, Élie (1869-1951) fit ses études primaires à l'École de Dolomieu, puis au 
collège de Vienne et au lycée de Grenoble. Il suivit au lycée Jeanson-de-Sailly la 
préparation à l'École Normale Supérieure, où il entra en 1888. Il y suivit 
notamment les enseignements de Poincaré, Picard et de Hermite. Les premiers 
travaux d'Élie Cartan qui devaient déboucher sur sa thèse soutenue en 1894, 
portent sur les groupes de Lie simples complexes, où il reprend, corrige et 
développe les résultats de structure et de classification obtenus par W. Killing. 
Élie Cartan obtient un poste de lecteur à l'Université de Montpellier de 1894 à 
1896, puis à la Faculté des sciences de Lyon de 1896 à 1903. La même année, il 
est nommé professeur à la Faculté des sciences de Nancy, où il restera jusqu'en 
1909. Il donne en même temps des cours à l'École d'Électrotechnique et de 
Mécanique Appliquée. Il rédige deux grands articles sur une généralisation en 
dimension infinie des groupes de Lie simples. Il élabore la méthode du "repère 
mobile", et la théorie des formes extérieures qui devaient influencer le 
développement ultérieur de la géométrie différentielle. En 1909, il quitte Nancy 
pour venir enseigner à la Sorbonne, où il est nommé professeur en 1912. Il assure 
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par ailleurs un enseignement à l'École de Physique et Chimie de Paris. En 1914, il 
résout le problème de la classification des groupes de Lie simples réels, et 
détermine les représentations de dimension finie de ces groupes. Pendant la 
guerre, il sert comme sergent dans l'hôpital aménagé dans les locaux de l'École 
Normale Supérieure, tout en continuant ses travaux mathématiques. Son oeuvre 
mathématique ultérieure est considérable, avec près de 200 publications et de 
nombreux ouvrages. Parmi les thèmes abordés, mentionnons l'étude des systèmes 
de Pfaff, la théorie de la déformation, l'étude des variétés à courbure constante 
négative, la théorie de la gravitation d'Einstein, la théorie des connexions affines, 
les groupes d'holonomie, les espaces riemanniens symétriques, les spineurs. Il est 
aussi l'auteur de plusieurs articles sur l'histoire de la géométrie. Il prit sa retraite en 
1940. 


Cauchy, Augustin-Louis (1789-1857). C'est à Cherbourg que Cauchy commence 
ses recherches mathématiques sur les polyèdres, et ses premiers résultats sont 
prometteurs. Mais, fatigué par le cumul de la charge d'ingénieur et des longues 
veillées de recherche, Cauchy connaît un état dépressif qui s'éternise et le pousse 
à retourner vivre chez ses parents. À Paris, il cherche une situation en adéquation 
avec sa volonté de faire de la recherche en mathématique pure. En 1815, il 
achève un brillant mémoire où il démontre un célèbre théorème de Fermat sur les 
nombres polygonaux. Ceci fera beaucoup pour sa notoriété, et en 1816, il accède 
à l'Académie des Sciences, en remplacement de Carnot et Monge touchés par 
l'épuration. Le cours d'analyse que Cauchy professe à l'École Polytechnique est 
décrié tant par ses élèves que par ses collègues des autres matières. Pourtant, c'est 
ce cours publié en 1821 et 1823, qui devait devenir la référence de l'analyse au 
19ème siècle. en mettant en avant la rigueur, et plus seulement l'intuition. C'est la 
première fois que de vraies définitions de limites, de continuité, de convergence 
de suites, de séries, sont énoncées. Cette rigueur reste toutefois encore relative, 
puisque Cauchy "prouve" que la limite d'une série de fonctions continues est 
continue, ce qui est faux. Il est vrai que Cauchy ne dispose pas encore d'une 
définition claire et précise des nombres réels. C'est l'époque aussi où Cauchy 
réalise des travaux profonds sur les fonctions d'une variable complexe (établissant 
par exemple l'expression des résidus), ainsi que des avancées dans la théorie des 
groupes finis. Cauchy ne fut jamais le chef d'une école de mathématiciens, et il se 
comporta parfois maladroitement avec de jeunes chercheurs comme Abel ou 
Galois, dont il sous-estime, ou même perd, des mémoires de première importance. 
Ses relations avec ses collègues ne sont en général pas très faciles. 


Cayley, Arthur (1821-1895), né à Richmond (Surrey), manifesta très tôt de vives 
dispositions pour la mathématique. Cependant, malgré le grand intérêt de ses 
premières publications, il ne put s'imposer comme mathématicien ; il décida de 
faire des études de droit et devint avocat en 1849. Pendant 14 ans, il exerça ce 
métier tout en s'adonnant à des recherches scientifiques. En 1863, Cayley est 
nommé professeur à Cambridge et peut enfin se consacrer entièrement aux 
mathématiques. Dans l'ensemble de l'oeuvre de Cayley, notamment dans ses 
travaux de jeunesse, est sensible l'influence des fondateurs de l'école algébrique 
anglaise qui avaient formulé le programme de l'algèbre moderne en accordant une 
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priorité marquée à l'approche formelle des problèmes. Mathématicien lettré et 
créateur, Cayley, dans le sillage de l'école anglaise, sut élaborer de nouvelles et 
fructueuses théories. La richesse de l'approche de Cayley apparaît dès ses 
premiers travaux sur la théorie des groupes (1854). Cayley, abordant les travaux 
de Galois, Gauss et Cauchy avec les méthodes des algébristes anglais, donne une 
définition des groupes abstraits ce qui le conduisit à la notion d'isomorphisme. 
L'étude des systèmes d'équations linéaires conduisit Cayley à celle des 
déterminants. Dans ses premiers travaux, il établit de nombreuses règles de calcul 
sur les déterminants, y compris la relation de multiplication des déterminants qui 
figurait déjà dans les travaux de Cauchy, Binet et Jacobi. À côté d'études 
originales sur les déterminants, on y rencontre la notion de tableau rectangulaire 
représentant les coefficients d'un système d'équations linéaires ou les coefficients 
d'une transformation linéaire. Cayley étudie les matrices rectangulaires à 
coefficients réels ou complexes ; il introduit les opérations sur les matrices et 
décrit leurs propriétés, y compris le caractère non commutatif de la multiplication. 
Il s'agit là sans doute de la première apparition de l'algèbre linéaire. Quelques 
années plus tard, Cayley étudiera aussi les systèmes non associatifs et publiera des 
résultats d'algèbre multilinéaire. Cayley a consacré un grand nombre de ses 
publications aux problèmes de la géométrie et à l'étude des courbes et des 
surfaces algébriques. À 22 ans, il émettait l'idée de la géométrie à n dimensions, 
idée qui fut formulée aussi, presque simultanément, mais sous une forme un peu 
différente, par Grassman. Cayley ne revint que beaucoup plus tard (en 1870) sur 
l'espace à n dimensions, mais sa méthode algébrique contribua aux importantes 
découvertes qui eurent lieu dans les autres domaines de la géométrie. C'est ainsi 
que, dans le Sixth Memoir on Quantics de 1859, il introduit la métrique 
projective, subordonnant ainsi la géométrie métrique à la géométrie projective ; il 
démontre alors que les notions fondamentales de la géométrie métrique (angles et 
distances) sont les invariants et les covariants de certaines transformations 
linéaires de la quadrique absolue. 


Chandrasekhar, Subrahmanyan (1910-1995) obtint à l'âge de 23 son doctorat 
au Trinity College de l'université de Cambridge. Spécialiste en astrophysique 
Chandrasekhar fit progresser de façon décisive la connaissance de l'évolution 
hydrodynamique et hydromagnétique des transferts d'énergie par rayonnement 
sans oublier les effets quantiques et relativistes dans les évolutions des étoiles. Sa 
contribution majeure dans ce domaine est la transformation des étoiles en naines 
blanches et au-delà d'un astre d'une masse supérieur à la limite de Chandrasekhar 
(1.44 celle du soleil), l'effondrement de l'astre en une étoile à neutrons. Les objets 
plus massifs donnant eux des trous noirs. 


Clairaut, Alexis-Claude (1713-1765) était un membre de l'Académie française 
des sciences et fut l'un des mathématiciens et physiciens les plus renommés du 
18ème siècle. À l'âge de 10 ans, il connaissait le calcul infinitésimal, à 12 ans, il 
soumettait sa première étude à l'académie des sciences et à 18 ans, il publia un 
livre contenant des extensions importantes à la géométrie qui lui ont valu 
l'admission à l'académie en 1731. Clairaut fut l'un des scientifiques qui 
accompagnaient Maupertuis en Laponie pour acquérir les dates nécessaires pour 
la détermination de la forme de la Terre. En 1743, il publia sa Théorie de la figure 
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de la Terre, qui calculait plus précisément que l'avait fait Newton, la forme 
qu'adopte un corps en rotation due à la gravitation naturelle de ses parties. En 
1760, il publia sa Théorie du mouvement des comètes, qui prédit avec précision la 
date à laquelle la comète de Halley sera arrivée au point le plus proche du soleil. 


Cohen, Paul Joseph (1934-2007) est un mathématicien et logicien américain. En 
1963, Cohen a découvert une nouvelle construction de modèles, appelée 
"forcing”", qui joue désormais un rôle fondamental dans la théorie des ensembles 
et dans la théorie des modèles. Il a aussi construit des modèles de la théorie des 
ensembles (supposée consistante) dans lesquels l'axiome du choix et l'hypothèse 
du continu ne sont pas vérifiés, ce qui, compte tenu de l'oeuvre antérieure de Kurt 
Güdel, établit que l'axiome du choïx et l'hypothèse du continu sont indépendants 
des systèmes usuels de la théorie des ensembles. Ce travail a valu à Cohen, en 
1966, la médaille Fields de l'Union Mathématique Internationale. Il est également 
l'auteur de travaux intéressants en analyse classique. 


Connes, Alain (1947- } est né en 1947 à Draguignan. Ancien élève à l'École 
normale supérieure, il a reçu, en 1980, le prix Ampère, l'un des plus importants 
décernés par l'Académie des sciences. Il a été élu membre de cette académie, 
dont il a été le benjamin, en 1981. Les premiers travaux d'Alain Connes 
s'inscrivent directement dans la tradition de John von Neumann et de ses 
continuateurs immédiats. Le développement de la physique quantique vers les 
années vingt avait mis à l'ordre du jour l'étude d'espaces non plus à trois 
dimensions, comme celui où nous croyons vivre, ni à quatre, comme en relativité 
einsteinienne, mais à une infinité de dimensions (les espaces de Hilbert). L'un des 
outils essentiels de la physique quantique est la notion d'opérateur dans un tel 
espace, notion généralisant celle de rotation d'un espace euclidien. La théorie des 
algèbres d'opérateurs a débuté vers 1930 par les travaux de von Neumann, qui a 
montré l'importance d'un certain type d'algèbres d'opérateurs, appelées 
aujourd'hui "algèbres de von Neumann”, et qui a établi pour ces algèbres un 
théorème de décomposition en facteurs premiers assez analogue au théorème de 
décomposition bien connu pour les nombres entiers usuels. Dès l'origine, les 
facteurs avaient été classés en trois types: facteurs de type I, Il, IIL. On a eu assez 
tôt une bonne compréhension des facteurs de type I et pas mal d'informations sur 
ceux de type Il, mais les facteurs de type III sont restés pendant longtemps 
beaucoup plus mystérieux. Même les exemples étaient rares et von Neumann 
disait, à propos de ce cas: "C'est le plus réfractaire de tous, et les outils pour 
l'étudier nous font défaut, au moins pour l'instant". La première réussite de 
Connes, qui lui a d'emblée valu la renommée internationale, a été une percée 
spectaculaire vers l'élucidation de la structure des facteurs de type III ; on peut 
dire qu'il est le premier à avoir acquis une connaissance concrète de ces objets, 
jusque-là assez énigmatiques, pris dans leur ensemble. Très grosso modo, les 
résultats de Connes ramènent l'étude des facteurs de type III à celle des facteurs 
de type II et de leurs automorphismes. L'oeuvre d'Alain Connes est celle d'un 
mathématicien très complet, capable de résoudre des problèmes difficiles, légués 
par le passé, mais aussi de transformer entièrement une discipline par 
l'introduction d'idées nouvelles, d'une grande originalité. 
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Copernic, Nicolas (1473-1543), Étudiant à l'université de Cracovie à partir de 
1491, il se rend ensuite en Italie pour y suivre des cours de droit canon à 
l'université de Bologne. Il suit également les cours d'astronomie de Domenico 
Maria Novara, un des premiers scientifiques à remettre en cause les 
enseignements de Ptolémée. En 1500, il enseigne la mathématique à Rome, avant 
de retourner pour un an à Frauenburg où son oncle l'a nommé chanoine en 1497. 
Ayant obtenu l'autorisation de poursuivre ses études en Italie, il s'inscrit aux 
facultés de droit et de médecine de Padoue et obtient son doctorat en droit canon 
à Ferrare en 1503. Enfin, il retourne à Frauenburg où il fait construire un 
observatoire et entame ses recherches en astronomie. Il y demeurera jusqu'à sa 
mort. La cosmologie de l'époque est alors basée sur le système géocentrique de 
Ptolémée. La Terre se trouve immobile au centre de plusieurs sphères 
concentriques qui portent la Lune, Mercure, Vénus, le Soleil, Mars, Jupiter, 
Saturne et enfin les étoiles. Mais ce système ne convient pas à Copernic, qu'il 
trouve compliqué et bancal. Il consulte alors les auteurs de l'Antiquité (Cicéron, 
Aristarque de Samos, etc.) et constate que certains d'entre eux envisagent la 
rotation des planètes, dont la Terre, autour du Soleil, considéré comme fixe. 
Copernic démontre alors que la combinaison des mouvements de la Terre et des 
planètes explique parfaitement le mouvement apparent des planètes (dans le sens 
direct et rétrograde). De plus, il établit que leurs changements de diamètre 
apparent apparaissent comme une conséquence de leur révolution autour du 
Soleil. Ses recherches se poursuivront pendant 36 ans et il démontrera que la 
Lune est un satellite de la Terre et que l'axe de la Terre n'est pas fixe. Son oeuvre 
maîtresse De Revolutionibus orbium coelestium est publiée en 1543 à Nuremberg 
et Copernic n'en reçoit les premiers exemplaires que quelques heures avant sa 
mort. Dans la dédicace qu'il fait au Pape Paul IIT, il présente son système comme 
une pure hypothèse, évitant ainsi la vindicte de l'Église. Adopté un siècle après sa 
mort après avoir été violemment rejeté, le système copernicien apporta une 
profonde révolution dans la conception du monde et plus généralement dans la 
pensée scientifique. 


Coriolis, Gaspard (1792-1843), ingénieur et mathématicien français qui mit en 
évidence les forces centrifuges composées, dites "forces de Coriolis". Cet 
ingénieur des Ponts et Chaussées est l'auteur d'importants travaux en mécanique. 
En 1835, il démontra que l'accélération d'un mobile dans un référentiel en rotation 
est soumis à une complémentaire (force de Coriolis) perpendiculaire au sens de 
déplacement du mobile dans ce référentiel. Bien que de faible intensité à la 
surface de la Terre, cette force, produite par la rotation de la planête, influence la 
direction des courants marins et aériens. Elle produit une déviation vers l'est et 
explique, par exemple, le mouvement circulaire des ouragans. 
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Coulomb, Charles Augustin de (1736-1806), physicien français, pionnier de la 
théorie de l'électricité. Né à Angoulême, il servit comme ingénieur militaire pour 
la France aux Antilles, mais se retira à Blois à la révolution française, pour 
continuer ses recherches sur le magnétisme, le frottement et l'électricité. En 1777, 
il inventa la balance de torsion qui permet de mesurer la force de l'attraction 
magnétique et électrique. Grâce à cette invention, Coulomb fut capable de 
formuler le principe, maintenant connu sous le nom de loi de Coulomb, qui 
gouverne l'interaction entre les charges électriques. En 1779, Coulomb publia le 
traité Théorie des machines simples, une analyse du frottement dans les 
machines. Après la révolution, Coulomb quitta sa retraite et aida le nouveau 
gouvernement à concevoir un système métrique pour les poids et mesures. L'unité 
utilisée pour exprimer la quantité de charge électrique, le "Coulomb", tient son 
nom du physicien 


Cournot, Antoine Augustin (1801-1877) étudia au collège de Gray de 1809 à 
1816. Il obtient des prix d'excellence de mathématiques. Il entre en 1820 au 
collège Royal de Besançon et obtient le prix d'honneur de mathématiques 
spéciales. Avec deux mémoires et deux traductions de traités divers de 
mathématiques, il se fait remarquer par Poisson, qui le fait nommer en 1834 
professeur d'analyse et de mécanique à la faculté des sciences de Lyon. Augustin 
Cournot est un savant, c'est-à-dire un homme de savoir étendu à tous les 
domaines de la science, un savant philosophe mais, qui par sa modestie, n'a pas 
connu la célébrité. Cournot fut d'abord un professeur et un vulgarisateur d'une 
grande clarté. Trois ouvrages mathématiques le distingue: Traité élémentaire de la 
théorie des fonctions et du calcul infinitésimal (1841); Exposition de la théorie 
des chances et des probabilités (1843) ; De l'origine et des limites de la 
correspondance entre l'algèbre et la géométrie (1847). Mais le génie de Cournot 
se situe dans l'introduction des probabilités en économie. Il est le précurseur des 
théories modernes en économie, reprises ensuite par Léon Walras qui dans sa 
notice autobiographique achevée en 1904, ainsi que dans plusieurs lettres, a 
rappelé le rôle primordial qu'ont joué dans le développement de sa pensée, d'une 
part, l'oeuvre d'Antoine Augustin Cournot et d'autre part, celle de son père, 
l'économiste et philosophe Auguste Walras qui fut le condisciple d'Augustin 
Cournot à l'École Normale. 


Clausius, Rudolf (1822-1888) est l'un des plus grands physiciens du 

19ème siècle. Il est connu principalement pour sa contribution à l'étude de la 
thermodynamique. Le premier, ce savant allemand formula ce que l'on a coutume 
d'appeler le "deuxième principe" et proposa une définition claire de l'entropie. Il 
est aussi l'un des principaux créateurs de la théorie cinétique des gaz. Né à Kôslin, 
en Poméranie, Clausius fréquenta les universités de Berlin, puis de Halle dont il 
sortit diplômé en 1848. Professeur jusqu'à sa mort, il fut titulaire de la chaire de 
physique de l'École royale d'artillerie et du génie à Berlin (1850-1855), puis, 
simultanément, à l'université et à l'École polytechnique de Zürich (1855-1867), 
ensuite à l'université de Würzburg (1867-1869), enfin à celle de Bonn, de 1869 à 
sa mort. Sa première publication, en 1850 dans les Annalen der Physik de 
Poggendorff, attira largement l'attention. Il cherchait à y concilier l'idée de 
l'équivalence entre le travail et la chaleur. Clausius fit remarquer que l'hypothèse 
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de la conservation de la chaleur dans le processus de transfert n'était pas une 
partie essentielle de la théorie de Carnot. Il établit en fait que, dans une machine 
idéale, la quantité de chaleur prise à la chaudière doit toujours être supérieure à 
celle qui est cédée au condenseur, et ce d'une quantité exactement équivalente au 
travail fourni. Cette importante synthèse effectuée, Clausius, dans la même 
publication, énonça ce que nous appelons aujourd'hui le deuxième principe de la 
thermodynamique. C'était la généralisation de la nécessité, déjà établie par 
Carnot, de la présence, non seulement d'un corps chaud (la chaudière), mais aussi 
d'un corps froid (le condenseur) pour qu'un travail soit fourni par une machine à 
vapeur. En 1854, Clausius, poussant plus avant les vues exprimées dès 1850, 
proposa le premier énoncé clair du concept de l'entropie. Il cherchait à mesurer 
l'aptitude de l'énergie calorifique de n'importe quel système réel non idéal à 
fournir du travail. Dans le cas de la conduction thermique le long d'un barreau 
solide, par exemple, la chaleur passe de l'extrémité chaude à l'extrémité froide 
sans fournir aucun travail, bien que ce transfert s'accompagne d'une diminution de 
l'aptitude de l'extrémité chaude à servir par la suite de source potentielle de 
travail. Cette diminution survient parce qu'à la fin du processus l'énergie 
calorifique est détenue par un corps situé à une température inférieure à celle de 
l'état initial. Elle n'a donc pas été perdue, mais seulement dégradée puisque, 
d'après le deuxième principe de la thermodynamique, on ne peut retrouver la 
température initiale qu'avec l'aide d'un travail extérieur. Les dernières 
contributions majeures de Clausius à la science datent de 1857 et 1858 et sont 
relatives à la théorie cinétique des gaz. Bien qu'il ne soit pas le premier à avoir 
conçu cette dernière, déjà proposée et discutée par Joule et Krünig notamment, il 
prend rang avec Maxwell parmi ses fondateurs. Il introduisit le concept du libre 
parcours moyen et établit l'importante distinction entre l'énergie de translation et 
l'énergie interne d'une particule de gaz. De plus, on lui reconnaît généralement le 
mérite d'avoir, par ses travaux théoriques, jeté un pont entre la théorie atomique 
et la thermodynamique. 


Curie, Pierre (1859-1906) est considéré comme un des pionniers de la 
chimie/physique sur la radioactivité. C'est même lors d'une thèse publiée en 1898 
que le terme radioactivité fut employé pour la première fois par sa femme Marie 
et lui. L'éducation de Pierre commença à un très jeune âge par son père, qui était 
médecin général. Les Curie avaient l'habitude de fréquenter la campagne et les 
environs de Paris les dimanches ; Pierre, lors de ses promenades, apprit 
rapidement tous les noms de plantes et d'animaux. Étant donné que l'école n'était 
pas obligatoire à cette époque (pas avant 1881 où la loi Ferry l'a rendue 
obligatoire), Pierre reçut son éducation à la maison, en compagnie de sa mère, 
ensuite avec son frère et par après, avec des précepteurs et finalement, seul. À 
l'âge de 14 ans, l'éducation de Pierre fut confiée à M. Bazille qui lui enseigna la 
mathématique élémentaire et spéciale, ceci développa énormément les capacités 
mentales de Pierre qui avait clairement un intérêt pour la mathématique. À l'âge 
de 16 ans, il fut reçu bachelier en sciences. En 1877, il obtint la licence en 
sciences physiques de l'école de pharmacie. Dans les années qui suivront, il 
étudiera les cristaux et le magnétisme, ce qui le mènera éventuellement à la 
découverte de la piézo-électricité. En 1877, il prit un poste comme préparateur où 
il fut payé la somme de 1200 francs par année. Il devint par après démonstrateur 
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d'expériences de physique pour les laboratoires jusqu'en 1882 où il devint 
directeur de tous les travaux pratiques aux écoles de physique et de chimie 
industrielle. Pierre épousa sa femme Marie Sklodowska en 1895 et ils eurent 
ensemble deux enfants, Irène et Êve. Pierre Curie gagna en 1903, avec sa femme, 
le prix Nobel de physique pour leurs travaux sur les substances radioactives et 
leurs découvertes de deux nouveaux éléments: le radium et le polonium. 


Dalton, John (1766-1844), chimiste et physicien britannique, qui développa la 
théorie atomique sur laquelle fut fondée la science physique moderne. Dalton 
commença en 1787 une série d'observations météorologiques qu'il poursuivit 
pendant 57 ans, accumulant quelque deux cent mille observations et mesures du 
temps dans la région de Manchester. L'intérêt de Dalton pour la météorologie le 
conduisit à étudier différents phénomènes ainsi que les instruments utilisés pour 
les mesurer. Il fut le premier à prouver la validité de l'idée selon laquelle la pluie 
est précipitée par une baisse de température, non par un changement de la 
pression atmosphérique. Dalton arriva à sa théorie atomique par une étude des 
propriétés physiques de l'air atmosphérique et des autres gaz. Au cours de ses 
recherches, il découvrit la loi des pressions partielles des gaz mélangés, souvent 
connue comme la "loi de Dalton", selon laquelle la pression totale exercée par un 
mélange de gaz est égale à la somme des pressions individuelles qu'exercerait 
chacun des gaz s'il occupait seul le volume entier. 


Da Vinci, Leonardo (1452-1519), est un peintre, sculpteur, architecte et homme 
de sciences italien. Homme d'esprit universel, à la fois artiste, scientifique, 
inventeur et philosophe, Léonard incarna l'esprit universaliste de la Renaissance 
et demeure l'un des grands hommes de cette époque. À 5 ans, son père ayant noté 
ses dons pour le dessin, le place comme apprenti dans l'atelier de Verrocchio, à 
Florence. Il entre à 20 ans à la Guilde des peintres, et débute sa carrière de peintre 
par des oeuvres immédiatement remarquables comme La vierge à l'oeillet, ou 
L'Annonciation (1473). Il améliore la technique du sfumato (impression de 
brume) à un point de raffinement jamais atteint avant lui. En 1481, le monastère 
de San Donato lui commande L'Adoration des Mages, mais Léonard, vexé de pas 
être choisi pour la décoration de la chapelle Sixtine à Rome, ne terminera jamais 
ce tableau et quitte Florence pour Milan. Après la réalisation de La Vierge aux 
rochers, pour la chapelle San Francesco Grande, et celle de la statue équestre de 
Francesco Sforza, il trouve la gloire dans toute l'Italie. En 1495, les Dominicains 
de Sainte-Marie-des-Grâces lui commandent La Cène. En 1498, il réalise le 
plafond du palais Sforza. De cette époque, datent aussi La Joconde et La Bataille 
d'Anghiari. Léonard réalise aussi une grande quantité d'études sur la zoologie, la 
botanique, l'anatomie, la géologie. Il imagine de multiples appareils et machines, 
dont la première machine volante, qui resteront au stade de dessins. Plus qu'en 
tant que scientifique proprement dit, Léonard de Vinci a impressionné ses 
contemporains et les générations suivantes par son approche méthodique du 
savoir, du savoir apprendre, du savoir observer, du savoir analyser. La démarche 
qu'il déploya dans l'ensemble des activités qu'il abordaïit, aussi bien en art qu'en 
technique (les deux ne se distinguant d'ailleurs pas dans son esprit), procédait 
d'une accumulation préalable d'observations détaillées, de savoirs disséminés ça et 
là, qui tendait vers un surpassement de ce qui existait déjà, avec la perfection 
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pour objectif. Bon nombre des croquis, notes et traités de Léonard de Vinci ne 
sont pas à proprement parler des trouvailles originales, mais sont le résultat de 
recherches effectuées dans un souci encyclopédique, avant l'heure. En 1516, il 
rejoint la cour de François ler, où il participe à des projets d'urbanisme.De 
Léonard de Vinci, subsistent aujourd'hui 7'000 notes et dessins, et quarante 
oeuvres attestées, dont huit ont disparu. 


Dantzig, George Bernard (1914-2005), était un mathématicien américain, 
inventeur du fameux algorithme du simplexe en optimisation linéaire. Son père, 
Tobias, est un mathématicien russe qui avait étudié avec Poincaré à Paris. Il a 
épousé une collègue de la Sorbonne, Anja Ourisson, et le couple a émigré aux 
États-Unis. Il est l'acteur principal d'une histoire fameuse en mathématique. Dans 
l'un de ses cours de doctorat à l'Université de Berkeley, le professeur Jerzy 
Neyman a proposé deux problèmes dits ouverts en statistiques. Un problème 
ouvert est un problème qui bien qu'ayant été formulé, n'a pas encore été résolu. 
De tels problèmes sont d'une difficulté importante et demandent des recherches 
pouvant s'étaler sur plusieurs années. Dantzig était en retard et croyait qu'il 
s'agissait de devoirs. Sans prendre plusieurs années mais bien quelques jours, il les 
a résolus. Il a reçu son doctorat de Berkeley en 1946. Six ans plus tard, il était 
engagé pour faire de la recherche mathématique à la RAND Corporation, où il 
implante l'algorithme du simplexe dans les ordinateurs. En 1960, l'Université de 
Berkeley l'engage pour enseigner en informatique, pour éventuellement devenir le 
responsable du centre de recherche opérationnelle. Six ans plus tard, il occupe un 
poste similaire à l'université Stanford, poste qu'il occupe jusqu'à sa retraite 
pendant les années 1990. En plus de ses travaux sur l'algorithme du simplexe et 
l'optimisation linéaire, il a aussi travaillé sur les méthodes de décomposition des 
problèmes de grande taille, l'analyse de sensibilité, les méthodes de résolution 
matricielles avec pivot, l'optimisation non linéaire et l'optimisation stochastique. 


Descartes, René (1596-1650), philosophe, scientifique et mathématicien français, 
fondateur du rationalisme moderne. Né à La Haye, d'un père conseiller au 
parlement de Rennes, Descartes reçut, de 1607 à 1614, l'enseignement, décisif 
pour lui, des pères jésuites du Collège royal de La Flèche. Cette expérience le 
conduisit à proposer une refondation des sciences, critiquant l'absence de 
fondement de l'enseignement professé. Il reçut une formation de juriste en 1616 
puis entra dans la carrière militaire en 1618, entreprit des voyages, mêla vie 
scientifique et vie mondaine, avant de se consacrer pleinement à la philosophie. Il 
passa sa vie entre la France et les Pays-Bas, fuyant les villes, fréquentant les 
bibliothèques et rencontrant les esprits les plus illustres de son temps, notamment 
Bérulle, Fermat, Gassendi, Hobbes et Pascal. Il mourut d'une pneumonie à 
Stockholm, léguant à la postérité une oeuvre entourée de légendes et imprégnée 
d'un esprit nouveau. 
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Dirac, Paul Adrien Maurice (1902-1984). Né à Bristol, Dirac fait ses études aux 
universités de Bristol et de Cambridge. En 1926, pour son doctorat (la première 
thèse au monde ayant pour sujet la "mécanique quantique"), il introduit un 
formalisme général pour la physique quantique peu après Heisenberg mais 
indépendamment (il y retrouve la non-commutativité des opérateurs position et 
quantité de mouvement). En 1928, il élabore une théorie relativiste pour décrire 
les propriétés de l'électron. Celle-ci le conduit à postuler l'existence d'une 
particule identique à l'électron dans tous ses aspects mais de charge opposée, 
c'est-à-dire positive et devant s'annihiler en même temps que l'électron négatif lors 
d'une collision avec celui-ci. La théorie de Dirac est confirmée en 1932 quand le 
physicien américain Carl Anderson découvre le positron. Dirac contribue aussi, 
avec Fermi, au développement de la statistique dite de Fermi-Dirac, décrivant le 
comportement collectif des particules de spin demi-entier. En 1933, Dirac partage 
le prix Nobel de physique avec le physicien autrichien Erwin Schrôdinger. En 
1939, il devient membre de la Société royale. Il est professeur de mathématiques à 
Cambridge de 1932 à 1968, professeur de physique à l'université d'État de Floride 
de 1971 jusqu'à sa mort, et membre de l'Institute of Advanced Studies 
périodiquement entre 1934 et 1959. 


Dirichlet(-Lejeune), Peter-Gustav (1805-1859) est né à Düren (Allemagne). 
Dirichlet est un élève brillant, qui achève ses études secondaires à 16 ans. Devant 
la faible qualité des formations universitaires allemandes à cette époque, Dirichlet 
décide de partir étudier à Paris, emportant avec lui les Disquisitiones 
Arithmeticae de Gauss comme une bible. Dans la capitale française, sa situation 
personnelle est facilitée par le général Foy, un ancien grand général des 
campagnes napoléoniennes, dont il devient le précepteur des enfants, et qui se 
montrera bienveillant avec lui. Dirichlet rencontre alors quelques-uns des plus 
grands mathématiciens, dont Legendre, Poisson, Laplace et Fourier. Ce dernier 
surtout impressionnera beaucoup Dirichlet, et sera à l'origine de l'intérêt qu'il 
portera aux séries trigonométriques et à la physique-mathématique. C'est à Paris 
que Dirichlet rédige sa première contribution d'importance aux mathématiques, 
étant à l'initiative en 1825 de la preuve du cas n=5 dans le grand théorème de 
Fermat, preuve achevée par Legendre dans la foulée. Fin 1825, le général Foy 
décède, et Dirichlet décide de retourner en Allemagne. Il enseigne d'abord à 
l'université de Breslau, au lycée militaire de Berlin, puis à l'université de Berlin à 
partir de 1829, où il restera 27 ans durant. Parmi ses élèves, on retiendra les noms 
de Kronecker et Riemann. Dirichlet est décrit comme un bon professeur, mais non 
exempt de défauts. Il donne l'apparence de quelqu'un de sale, toujours affublé 
d'un cigare et d'un café, visiblement peu préoccupé de l'image qu'il donne. On dit 
aussi de lui qu'il était très souvent en retard. En 1848, son maître et ami Karl 
Jacobi est diagnostiqué comme étant malade du diabète. Dirichlet l'accompagne 
dans un voyage de 18 mois en Italie. De retour en Allemagne, Dirichlet 
commence à être lassé des lourdes charges d'enseignement qu'il doit assumer. À la 
mort de Gauss, il prend sa succession à Güttingen. C'est malheureusement pour 
peu de temps, car lui-même s'éteint en 1859 des suites d'un malaise 

cardiaque. L'éventail des travaux de Dirichlet illustre la profondeur de la culture 
mathématique allemande au début de son âge d'or. On lui doit le premier énoncé 
d'une condition suffisante de convergence d'une série de Fourier (dans le cas des 
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fonctions continues par morceaux), le théorème de la progression arithmétique, le 
prolongement des fonctions harmoniques définies sur la frontière d'un ouvert et 
toute une classe d'équations aux dérivées partielles porte le nom de "problème de 
Dirichlet". Nous lui devons aussi de très nombreuses contributions en 
arithmétique, où il existe le théorème des unités de Dirichlet, les séries de 
Dirichlet, etc. 


Doppler, Christian (1803-1853), est un mathématicien et physicien autrichien, 
célèbre pour sa découverte de l'effet Doppler. Après avoir étudié à l'Université de 
Vienne, Doppler devient assistant-professeur dans cet établissement en 1829. Ce 
poste n'étant pas renouvelé, il envisage un temps une émigration vers les 
États-Unis. Il renonce à quitter son pays après avoir été nommé à Prague en 1837, 
puis à l'École polytechnique de Vienne en 1849. En 1850, il fonde l'Institut de 
Physique de l'Université de Vienne dont il est seul professeur et le premier 
directeur. Atteint d'une affection pulmonaire, la tuberculose, il quitte ses fonctions 
en 1852. Son travail scientifique est varié : optique, astronomie, électricité...Sa 
publication la plus célèbre a été présentée en 1842 à l'Académie royale des 
sciences de Bohème et a pour titre Sur la lumière colorée des étoiles doubles et 
d'autres étoiles du ciel, utilisant l'effet Doppler. Ses calculs étaient erronés, le 
décalage réel de la fréquence lumineuse étant trop faible pour pouvoir être 
détecté à l'époque. En 1846, Doppler publie une correction de son travail initial 
où il tient compte des vitesses relatives de la source de lumière et de l'observateur. 


Einstein, Albert (1879-1955), né à Ulm et mort à Princeton, est un physicien 
théoricien qui fut successivement allemand, puis apatride (1896), suisse (1901), et 
enfin sous la double nationalité helvético-américaine (1940). Il publie sa théorie 
de la relativité restreinte en 1905, et une théorie de la gravitation dite relativité 
générale en 1915. Il contribue largement au développement de la mécanique 
quantique et de la cosmologie, et reçoit le prix Nobel de physique de 1921 pour 
son explication de l'effet photoélectrique. Son travail est notamment connu pour 
l'équation d'équivalence qui établit une équivalence entre la matière et l'énergie 
d'un système. Il est aussi connu pour son hypothèse audacieuse sur la nature 
corpusculaire de la lumière. Mais il a également contribué au développement de 
nombre d'autres théories (physique quantique y comprise). En 1905, Einstein 
obtint son doctorat de l'université de Zurich pour une thèse théorique sur les 
dimensions des molécules. Il publia également trois articles théoriques d'une 
importance capitale pour le développement de la physique du XXe siècle. Dans le 
premier de ces articles, sur le mouvement brownien, il fit des prédictions 
importantes sur le mouvement des particules distribuées aléatoirement dans un 
fluide. Pendant le reste de sa vie, Einstein consacra énormément de temps à 
généraliser encore plus sa théorie de la relativité générale. Il visait une théorie de 
champ unifié, qui ne fut pas complètement couronnée de succès, et fit de 
nombreuses tentatives pour décrire l'interaction électromagnétique et l'interaction 
gravitationnelle dans un modèle commun. 
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Erdôs, Paul (1913-1996) est le plus prolifique des mathématiciens du 20ème 
siècle, avec environ 1500 articles publiés (il faut remonter à Euler pour obtenir un 
tel volume). Plus que quelqu'un qui bâtissait des théories, il résolvait des 
problèmes, le plus souvent avec élégance et simplicité. Erdôs est néà Budapest. 
Ses deux parents étaient professeurs de mathématiques dans le secondaire. Alors 
que Erdôs était âgé d'à peine un an, son père fut fait prisonnier par les Russes et 
déporté en Sibérie. Ces événements ont contribué au développement d'une 
relation très forte mère/fils, qui influera beaucoup sur le cours de la vie de Paul 
Erdôs. C'est à l'âge de 19 ans, alors qu'il commence ses études à l'université et 
qu'il se fait connaître des milieux mathématiques. Il publie en effet une nouvelle 
démonstration du postulat de Bertrand, qui affirme qu'il existe un nombre premier 
entre net 2n, pour tout n. Deux ans plus tard, il obtient son doctorat (à 21 ans), 
puis s'en va faire un post-doc à Manchester. Comme Erdôs est d'origine juive, il 
ne peut retourner en Hongrie à la fin des années 30, et il émigre aux États-Unis. 
Après quelques visites en Europe aux rescapés de sa famille après l'Holocauste, il 
a des problèmes aux États-Unis avec le MacCarthysme, et il se voit interdit de 
séjour sur le territoire américain. Erdôs est donc contraint de poser ses valises en 
Israël. Avec ses 1500 articles, les contributions de Erdôs aux mathématiques sont 
nombreuses: en théorie des nombres, en combinatoire, en mathématiques 
discrètes, il fut un maître. Erdôs avait une exceptionnelle aptitude à s'entourer des 
mathématiciens les plus compétents pour résoudre ses conjectures. Il en résulte 
que Erdôs a eu beaucoup de collaborateurs: 500 mathématiciens environ ont écrit 
un article en commun avec lui. Les mathématiciens se sont amusés à définir un 
nombre de Erdôs: tout mathématicien qui a publié un papier en commun avec 
Erdôs a un nombre de Erdôs égal à 1. Toute personne qui a publié un article en 
commun avec une personne qui a un nombre de Erdôs égal à 1 a un nombre de 
Erdôs égal à 2. Et ainsi de suite. Albert Einstein est l'un d'entre eux: son nombre 
de Erdôs est 2. Pourtant, parmi toutes ces collaborations, une au moins a mal 
tourné, et c'est d'autant plus regrettable qu'elle concerne le plus grand succès 
d'Erdôs. À la fin du 19ème siècle, Hadamard et de La Vallée Poussin avaient 
démontré le théorème des nombres premiers, à savoir que le nombre de nombres 
premiers inférieurs ou égaux à n est équivalent, quand n est grand, à n/In(n). Leur 
démonstration est particulièrement rude! En 1949, Atle Selberg trouve une 
inégalité qu'il pense pouvoir être une étape importante vers une démonstration 
élémentaire du théorème des nombres premiers. Elle est présentée à Erdôs, qui 
trouve la clef manquante pour boucler la preuve. Un article coécrit de plus aurait 
sans doute été la solution la plus appropriée pour mesurer les apports de chacun. 
Mais, à la suite d'un malentendu lié à l'envoi de cartes postales triomphales 
d'Erdôs, Selberg craint qu'Erdôs ne tire la couverture à lui. Il publie seul une 
preuve complète. Il recevra la médaille Fields en 1950, alors qu'Erdôs devra se 
contenter du prix Wolf en 1984. La vie d'Erdôs fut vraiment étrange. Il n'avait pas 
de maison, pas d'épouse, les contingences matérielles étaient pénibles pour lui. Il 
voyageait en solitaire, accompagné de deux valises qui portaient toutes ses 
affaires, allant d'université en université, habitant à l'hôtel ou chez un ami 
mathématicien. Il est par ailleurs l'auteur de nombreux "erdosismes", comme 
cette phrase célèbre: “un mathématicien est une machine à transformer le café en 
théorème". Lui-même dopé à toutes sortes d'amphétamines! Jusqu'à la fin de sa 
vie, Erdôs ne ralentira pas son activité mathématique. Mourir signifiait pour lui 
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arrêter de faire des mathématiques. Il décède à Varsovie, en plein congrès. 


Erlang, Agner Krarup (1878-1979), était un mathématicien danois ayant 
beaucoup travaillé sur la théorie des files d'attente, et la gestion des réseaux 
téléphoniques. Erlang s'est attelé, sur la base notamment des travaux de Poisson 
dont la loi des événements rares a trouvé toute sa dimension appliquée aux 
réseaux de télécommunications, à l'élaboration d'un modèle mathématique pour le 
dimensionnement des réseaux télécoms sur une approche statistique afin de 
parvenir à des coûts d'exploitation de nature à permettre un marché de masse. 


Euclide (3° siècle av. J.-C.) On ne sait que très peu de choses sur la vie d'Euclide. 
Il semble qu'il ait enseigné la mathématique à Alexandrie à la demande de 
Ptolémée Ier. Il apparaîtrait donc comme le fondateur de la célèbre École 
d'Alexandrie qui influença les travaux d'Archimède. En revanche, les théories 
d'Euclide sont connues et constituent une référence dans l'histoire des 
mathématiques. L'oeuvre maîtresse d'Euclide est incontestablement les Éléments. 
Cet ouvrage représente une synthèse remarquable de résultats mathématiques et a 
marqué de son empreinte la discipline tout entière. Il est composé de treize livres. 
Les quatre premiers traitent de géométrie dans le plan avec les définitions du 
point, de la droite et de la surface. Ils exposent également le calcul d'aires de 
différents polygones. Le livre V contient les premières notions d'analyse. Le 
sixième aborde la similitude des figures et donne la résolution des équations du 
second degré à l'aide de constructions géométriques. Les livres VII, VIIL, et IX 
portent sur l'arithmétique. Le dixième étudie les nombres irrationnels et enfin les 
trois derniers abordent la géométrie dans l'espace. Euclide a, en outre, rédigé des 
ouvrages sur l'analyse géométrique, l'optique et l'astronomie. Représentation 
parfaite de l'exposé scientifique, les Éléments sont composés de différentes 
propositions classées en deux groupes: les hypothèses et les axiomes. Parmi les 5 
axiomes, on trouve le célèbre postulat d'Euclide: "par tout point du plan passe une 
et une seule droite parallèle à une autre droite." Cet axiome constitue le 
fondement de la géométrie euclidienne, en opposition aux géométries 
non-euclidiennes apparues quelque 2000 ans plus tard. 


Euler, Leonhard (1707-1783), mathématicien suisse, physicien, ingénieur et 
philosophe, est l'un des fondateurs des méthodes de calcul différentiel et intégral. 
Leonhard Euler naquit à Bâle1, de Paul Euler, pasteur des Églises réformées et de 
Marguerite Brucker, fille de pasteur. Il eut deux jeunes sœurs du nom d'Anna 
Maria et de Maria Magdalena6. Peu de temps après la naissance de Leonhard, la 
famille Euler déménagea de Bâle pour rejoindre la ville de Riehen, où Euler passa 
la plupart de son enfance. Paul Euler était un ami de la famille Bernoulli. Jean 
Bernoulli, alors considéré comme le principal mathématicien européen, pourrait 
être celui ayant eu la plus grande influence sur le jeune Leonhard. L'éducation 
officielle d'Euler commença tôt à Bâle, où il fut envoyé vivre avec sa grand-mère 
maternelle. À l'âge de 13 ans, il s'inscrivit à l'université de Bâle, et en 1723, obtint 
son Master of Philosophy grâce à une dissertation qui comparait la philosophie de 
Descartes à celle de Newton. À cette époque, il recevait tous les samedis 
après-midi des leçons de Jean Bernoulli, qui découvrit rapidement chez son 
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nouvel élève un incroyable talent pour les mathématiques. Euler commença alors 
à étudier la théologie, le grec et l'hébreu à la demande de son père, afin de devenir 
un pasteur, mais Jean Bernoulli convainquit Paul Euler que Leonhard était destiné 
à devenir un grand mathématicien. Euler fut le premier à traiter de manière 
analytique et complète l'algèbre, la théorie des équations, la trigonométrie et la 
géométrie analytique. Dans ce travail, il traita le sujet du développement des 
séries de fonctions et formula la règle selon laquelle seules les séries infinies 
convergentes pouvaient être correctement évaluées. Il discuta aussi des surfaces à 
trois dimensions et prouva que les sections coniques sont représentées par 
l'équation générale du second degré à deux dimensions. D'autres travaux traitent 
du calcul, dont le calcul des variations, la théorie des nombres, les nombres 
imaginaires et transcendants, l'algèbre déterminée et indéterminée, la théorie des 
graphes. Euler apporta ses contributions dans les domaines de l'astronomie, de la 
mécanique analytique (calcul variationnel), l'hydrodynamique, l'optique et 
l'acoustique. Euler est considéré comme un éminent mathématicien du 18ème 
siècle et l'un des plus grands et des plus prolifiques de tous les temps et a introduit 
une grande partie des notations encore utilisées en ce début de 21ème siècle 
(symboles pour la somme, fonction, logarithme, exponentiel, etc.). 


Faraday, Michael (1791-1867) était un scientifique anglais qui a contribué aux 
domaines de l'électromagnétisme et l'électrochimie. Le jeune Faraday, qui était le 
troisième des 4 enfants, n'ayant que l'éducation scolaire la plus élémentaire, a dû 
se former en autodidacte. À 14 ans, il devient apprenti chez un relieur local. Au 
cours de ses 7 années d'apprentissage il a pu lire beaucoup de livres. A cette 
époque, il a également développé un intérêt pour la science, en particulier pour 
l'électricité. Faraday a été particulièrement inspiré par les livre Conversations on 
Chemistry de Jane Marcet. Ses principales découvertes comprennent l'induction 
électromagnétique, le diamagnétisme et l'électrolyse. C'est par ses recherches sur 
le champ magnétique autour d'un conducteur parcouru par un courant continu que 
Faraday a établi la base pour le concept de champ électromagnétique en 
physique. Faraday a également établi que le magnétisme pourrait affecter rayons 
de lumière et qu'il y avait une relation sous-jacente entre les deux phénomènes. Il 
a découvert le principe même de l'induction électromagnétique, en même temps 
que Joseph Henry, diamagnétisme, et les lois de l'électrolyse. Ses inventions de 
dispositifs électromagnétiques rotatifs ont formé la base de la technologie des 
moteurs électriques, et c'est en grande partie grâce à ses efforts que l'électricité 
est devenue pratique pour une utilisation dans la technologie. 


Fermat, Pierre de (1601-1665), mathématicien français, auteur d'un célèbre 
théorème sans démonstration en arithmétique et surnommé le "prince des 
amateurs". Il fut à l'origine du principe de Fermat (optique) et avec son ami Blaise 
Pascal de celui du calcul des probabilités. Il créa également la théorie des 
nombres et fit dans ce domaine différentes découvertes. Ainsi, certains le 
considèrent comme le père de la théorie moderne. Il devança le calcul différentiel 
par ses travaux sur le calcul infinitésimal. II laissa à la postérité le soin de 
démontrer un théorème (le fameux "grand théorème de Fermat") sur lequel les 
mathématiciens s'acharnent depuis plus de trois siècles. Ce n'est qu'en 1993 que le 


Page: 4661/4839 


[v3.0 - 2013] 


chercheur britannique Andrew Wiles en proposa une démonstration. 


Fermi, Enrico (1901-1954), physicien italien, connu pour la réalisation de la 
première réaction nucléaire contrôlée. Très jeune, Enrico Fermi fait preuve d'une 
mémoire exceptionnelle et d'une grande intelligence, qui lui permettent d'exceller 
dans les études. Enrico, profondément marqué par le décès d'un de ses très jeune 
frère, se jette alors dans l'étude de la physique pour surmonter sa douleur. Bon 
élève, il se passionne très vite pour la physique et les mathématiques et 
commence à étudier divers ouvrages qu'il achète et qui traitent de mécanique, 
d'optique, d'astronomie et d'acoustique. Un ami de son père, l'ingénieur Adolfo 
Amidei, qui prend conscience des qualités hors du commun du jeune Fermi, lui 
prête divers ouvrages traitant de mathématiques. Ainsi, à 17 ans, Enrico Fermi 
maîtrise la géométrie analytique, la géométrie projective, le calcul infinitésimal, le 
calcul intégral et la mécanique rationnelle. À partir de 1918, Fermi étudie à 
l'Université de Pise au sein de l'École normale supérieure de Pise. Comme à son 
habitude, il étudie seul divers problèmes de physique mathématique et consulte 
des ouvrages de Poincaré, de Poisson ou d'Appell. À partir de 1919, il s'intéresse 
aux nouvelles théories comme la relativité ou la physique atomique, ainsi il 
acquiert une grande connaissance de théories telles que la relativité restreinte, la 
théorie du corps noir ou encore le modèle de l'hydrogène de Bohr. Aïnsi Enrico 
Fermi, le seul à l'université au fait de ces théories, en arrive, sur l'insistance de ses 
professeurs, à donner des conférences où il expose aux professeurs et aux 
assistants les dernières découvertes de physique atomique. En 1922, après 4 ans 
passés à l'université, Enrico Fermi publie son premier article qui traite de la 
relativité générale. Dans une communauté scientifique italienne hostile aux 
travaux d'Einstein, il est l'un des rares avec Levi-Civita à défendre la théorie de la 
relativité. En 1922, Fermi obtient son diplôme de fin d'études après avoir présenté 
un mémoire sur la diffraction des rayons X. Il fréquente ensuite divers physiciens 
de haut rang dans l'Italie de l'époque, avant de devenir, pendant 2 ans, 
conférencier à l'université de Florence. En 1926, il devient professeur de physique 
théorique à l'université La Sapienza de Rome. C'est durant cette période qu'il 
développe la théorie statistique quantique que l'on appellera plus tard la statistique 
de Fermi-Dirac. À partir de 1932, il se tourne plus précisément vers la physique 
nucléaire, et c'est cette même année qu'il rédige un article sur la radioactivité 
bêta. En 1934, il développe sa théorie sur l'émission de rayonnement bêta en y 
incluant le neutron postulé en 1930 par Wolfgang Pauli, qu'il rebaptise neutrino 
(le nom neutron étant déjà utilisé pour une autre particule), et s'oriente vers la 
création d'isotopes radioactifs artificiels par bombardement de neutrons lents 
(raison pour laquelle il reçut le prix Nobel en 1938). 


Feynman, Richard Phillips (1918-1988), est né à Far Rockaway dans le Queens, 
quartier de New York (États-Unis) de parents d'origine polonaise et russe. Son 
père, qui l'encourageait à poser des questions et à remettre en cause les choses 
communément admises, l'a durablement influencé. De sa mère, il tient un solide 
sens de l'humour qui ne l'a jamais quitté. Feynman est l'un des physiciens les plus 
influents de la seconde moitié du 20pme siècle, en raison notamment de ses 
travaux sur l'électrodynamique quantique relativiste, les quarks et l'hélium 
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superfluide. Durant sa dernière année à l'école secondaire de Far Rockaway, 
Feynman remporta le championnat de mathématiques de l'université de New 
York. Il reçut donc une bourse pour étudier au Massachusetts Institute of 
Technology (MIT) où il reçut son baccalauréat en 1939 après s'être orienté 
d'abord en électronique, puis en mathématiques, et enfin avoir assisté à tous les 
cours de physique offerts y compris pendant sa seconde année un cours de 
physique théorique réservé aux étudiants de maîtrise. Feynman obtient un score 
remarquable aux examens d'entrée de l'Université de Princeton en mathématiques 
et en physique, mais il eut une note très faible dans la partie littéraire de l'examen. 
Durant ses études à l'Institute for Advanced Study de Princeton (1AS) (créé 
depuis peu et dirigé par Albert Einstein), Feynman travailla sous la direction de 
John Wheeler sur le principe de moindre action appliqué à la mécanique 
quantique. Il établit ici les bases des diagrammes de Feynman et de l'approche de 
la mécanique quantique par les intégrales de chemin. Il obtint son doctorat en 
1942. Il reformula entièrement la mécanique quantique à l'aide de son intégrale de 
chemin qui généralise le principe de moindre action de la mécanique classique et 
inventa les diagrammes qui portent son nom et qui sont désormais largement 
utilisés en théorie quantique des champs (dont l'électrodynamique quantique fait 
partie). Musicien, pédagogue remarquable, rédacteur de nombreux ouvrages de 
vulgarisation, il a aussi été impliqué dans le développement de la bombe atomique 
américaine. Après la Seconde Guerre mondiale, il enseigna à l'université Cornell 
puis au Caltech où il effectua des travaux fondamentaux notamment dans la 
théorie de la superfluidité et des quarks. Sin-Itiro Tomonaga, Julian Schwinger et 
lui sont colauréats du prix Nobel de physique de 1965 pour leurs travaux en 
électrodynamique quantique. 


Fisher, Ronald Aymler (1890-1962) né à Londres était un biologiste et 
statisticien britannique, qui a énormément contribué à fonder les statistiques 
modernes. Ses travaux sur les statistiques lui valurent la médaille Darwin en 1948, 
la médaille Copley en 1955 et la médaille d'argent Darwin-Wallace en 1958. Dans 
le domaine des statistiques, il a introduit de nombreux concepts clés tels que le 
maximum de vraisemblance, l'information de Fisher et l'analyse de la variance 
(ANOVA). Il est considéré comme un grand précurseur de Shannon. Il est 
également un des fondateurs de la génétique moderne et un grand continuateur de 
Darwin, en particulier grâce à son utilisation des méthodes statistiques, 
incontournables dans la génétique des populations. Il a ainsi contribué à la 
formalisation mathématique du principe de sélection naturelle. Il est d'abord attiré 
par la physique et obtient en 1912 une licence d'astronomie à l'université de 
Cambridge. De 1915 à 1919, il enseigne les mathématiques à Londres dans des 
écoles privées. En 1919, il est engagé à la station expérimentale de Rothamsted 
pour analyser l'effet des précipitations sur le rendement du blé où il 
travaillejusqu'en 1933. Dans son article de 1922 On the mathematical foundations 
of theoritical statistics, il définit une quinzaine de notions fondamentales en 
statistiques dont la notion de convergence, d'efficacité, de vraisemblance et de 
statistique suffisante. Il propose l'estimateur du maximum de vraisemblance en 
1922 après avoir présenté une première version en 1912. Il introduit aussi en 1924 
l'analyse de la variance. En 1925 il publie des innovations en séries temporelles et 
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Foucault, Léon (1819-1868), physicien français célèbre pour sa démonstration 
du mouvement de la Terre par la rotation du plan d'oscillation du pendule. Né à 
Paris, il travailla avec le physicien français Armand Fizeau sur la détermination de 
la vitesse de la lumière. Foucault prouva, de façon indépendante, que la vitesse de 
la lumière dans l'air était plus élevée que dans l'eau. En 1851, il fit une 
démonstration spectaculaire de la rotation de la Terre en suspendant un pendule à 
un long câble attaché à la coupole du Panthéon à Paris. Le mouvement du 
pendule démontra la rotation de la Terre sur son axe. En 1855 il découvre que la 
force nécessaire à la rotation d'un disque de cuivre augmente quand il doit tourner 
avec sa jante entre les pôles d'un aimant, le disque chauffant dans le même temps 
du fait des "courants de Foucault" induits dans le métal. Il conçut également une 
méthode de mesure de la courbure des miroirs de télescopes. Il développa d'autres 
instruments dont un prisme polarisateur et une forme de gyroscope qui est à la 
base du gyrocompas moderne. 


Fourier, Joseph (1768-1830), physicien et mathématicien français connu pour la 
découverte des séries trigonométriques et des transformées qui portent son nom. 
Fourier est orphelin de père et de mère à 10 ans. L'organiste d'Auxerre, Joseph 
Pallais, le fait entrer dans le pensionnat qu'il dirige. Recommandé par l'évêque 
d'Auxerre, il fait ses études à l'École militaire d'Auxerre tenue alors par les 
Bénédictins de la Congrégation de Saint-Maur. Destiné à l'état monastique, il 
préfère s'adonner aux sciences pour lesquelles il remporte la plupart des premiers 
prix. Élève brillant, il y est promu professeur dès l'âge de 16 ans et peut dès lors 
commencer ses recherches personnelles. Il intègre l'École normale supérieure à 26 
ans, où il a entre autres comme professeurs Joseph-Louis Lagrange, Gaspard 
Monge et Pierre-Simon de Laplace, auquel il succède à la chaire à Polytechnique 
en 1797. Fourier a contribué à la résolution numérique des équations et à la 
diffusion de la chaleur dont une des lois porte son nom. Ses travaux ont une 
implication directe dans la convergence des séries et leur somme infinie. Il 
participa, avec Monge, à la campagne d'Égypte en tant qu'observateur 
scientifique. Anobli sous Napoléon, il fut professeur à l'École Polytechnique, 
secrétaire de l'institut d'Égypte et préfet de l'Isère. Il fut aussi élu à l'Académie des 
sciences et à l'Académie française. On le considère comme l'un des fondateurs, 
avec le français Poisson et le suisse Daniel Bernoulli, de ce que l'on appelle 
aujourd'hui la physique-mathématique. 


Fraunhofer, Joseph von (1787-1826), opticien et physicien allemand, né à 
Straubing. Fraunhofer apporta de nombreuses améliorations à la fabrication du 
verre optique, au meulage et au polissage des lentilles et à la construction des 
télescopes et d'autres instruments d'optique. Joseph Fraunhofer était le onzième 
enfant d'un souffleur de verre. Il avait 11 ans à la mort de ses parents: aussi son 
tuteur l'envoya-t-il à Munich en apprentissage pour 6 ans afin qu'il apprenne la 
miroiterie. C'est là, qu'en 1801, il faillit trouver la mort dans l'effondrement de 
l'atelier. À la fin de son apprentissage en 1806, il eut la possibilité de poursuivre 
une formation d'opticien dans l'Institut de Mécanique Reichenbach. Les ateliers 
furent transférés en 1807 à Benediktbeuern, et Fraunhofer y fut nommé 
contremaître. Là, il mit au point de nouvelles machines à polir les miroirs et de 
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nouveaux types de verres optiques (le verre flint achromatique), qui apportèrent 
une amélioration décisive à la qualité des lentilles. Fraunhofer inventa aussi de 
nombreux instruments scientifiques. Son nom est associé à des lignes fixes et 
noires dans le spectre solaire, appelées les "lignes Fraunhofer", qu'il fut le premier 
à décrire en détail. Ses recherches dans le domaine de la réfraction et de la 
dispersion de la lumière aboutirent à l'invention du spectroscope et au 
développement de la spectroscopie. 


Fresnel, Augustin Jean (1788-1827), physicien français, fondateur de l'optique 
moderne, il proposa une explication de tous les phénomènes optiques dans le 
cadre de la théorie ondulatoire de la lumière. Il commença par réaliser de 
nombreuses expériences sur les interférences lumineuses, pour lesquelles il forgea 
la notion de longueur d'onde, et calcula les intégrales dites de Fresnel. Il fut le 
premier à prouver que deux faisceaux de lumière polarisés dans des plans 
différents n'ont aucun effet d'interférence. Il déduisit très justement de cette 
expérience que le mouvement ondulatoire de la lumière polarisée est transversal 
et non longitudinal (comme celui du son) ainsi qu'on le croyait avant lui. En outre, 
il fut le premier à produire une lumière polarisée circulaire. Pour expliquer la 
propagation des ondes lumineuses, Fresnel eut recours à la notion d'éther, 
malheureusement contradictoire avec d'autres expériences. Cette théorie sera 
abandonnée avec la relativité, mais les relations dites de Fresnel sur la réfraction 
sont toujours utilisées. Dans le domaine de l'optique appliquée, Fresnel conçut la 
lentille à échelons utilisée pour accroître le pouvoir éclairant des phares. De son 
vivant, les travaux scientifiques de Fresnel n'étaient connus que d'un petit groupe 
de scientifiques et certains de ses articles ne furent publiés qu'après sa mort. 


Galileo, Galilée (1564-1642), physicien et astronome italien né à Pise à l'origine 
de la révolution scientifique du 17ème siècle. Ses théories ainsi que celles de 
l'astronome allemand Johannes Kepler servirent de fondement aux travaux du 
physicien britannique sir Isaac Newton sur la loi de l'attraction universelle. Sa 
principale contribution à l'astronomie fut l'amélioration considérable (quand la 
technique marchait...) de la lunette astronomique (ce qui lui a permis de procéder 
à des observations qui ont bouleversé la discipline) et la découverte des taches 
solaires, des montagnes et des vallées lunaires, des quatre plus grands satellites de 
Jupiter et des phases de Vénus. En physique, il découvrit la loi de la chute des 
corps et les mouvements paraboliques des projectiles. Ses études sur les 
oscillations du pendule pesant l'ont amené à inventer le pulsomètre. Cet appareil 
permettait d'aider à la mesure du pouls et fournissait un étalon de temps, qui 
n'existait pas à l'époque. Il débute aussi ses études sur la chute des corps. Dans 
l'histoire de la culture, Galilée est le symbole de la bataille livrée contre les 
autorités religieuses pour la liberté de la recherche (il avait cependant très bonne 
réputation et de très bonnes relations auprès des instances religieuses ce qui a 
aidé.). Dans le domaine des mathématiques et de la physique, il a contribué à 
faire avancer les connaissances relatives à la cinématique et la dynamique, jetant 
ainsi les fondements des sciences mécaniques. Il est de ce fait considéré comme le 
fondateur de la physique moderne. 
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Galois, Évariste (1811-1832) est un mathématicien français, qui a donné son 
nom à une branche des mathématiques: la théorie de Galois. Sa vie est tellement 
mythique qu'il est parfois difficile de démêler le mythe et la réalité. Dès 
1827-1828, la fureur des mathématiques domine. Galois lit Legendre, Lagrange, 
Euler, Gauss, Jacobi. Le professeur, Louis-Paul-Émile Richard, admire le génie 
mathématique de son élève et garde les copies qu'il confiera à un autre de ses 
élèves: Charles Hermite. C'est l'époque où il publie son premier article dans les 
Annales mathématiques de Joseph Gergonne (il démontre un théorème sur les 
fractions continues périodiques). Il rédige aussi un premier mémoire sur la théorie 
des équations, envoyé à l'Académie des Sciences, perdu par Cauchy. Il échoue au 
concours d'entrée à Polytechnique. On raconte qu'il a jeté le chiffon à effacer la 
craie à la tête de son examinateur devant la stupidité des questions posées. Sur les 
conseils de son professeur, Galois entre à l'École Préparatoire (future École 
Normale). Il rédige le résultat de ses recherches dans un mémoire - Conditions 
pour qu'une équation soit résoluble par radicaux - afin de concourir au grand 
prix de mathématiques de l'Académie des Sciences. Fourier emporte le manuscrit 
chez lui et meurt peu après: le manuscrit est perdu, et le grand prix est décerné à 
Abel (mort l'année précédente), et à Jacobi. Pour des raisons politiques, Galois se 
retrouve en prison, où il y continue ses travaux. Libéré en 1832, il s'éprend en 
1832 d'une femme, avec qui il rompt la même année. On ne sait trop pourquoi, 
mais un duel semble en résulter quelques jours plus tard. La nuit précédente, le 29 
mai, Galois rassemble ses dernières découvertes dans une splendide lettre 
adressée à son ami Auguste Chevalier. De cette lettre naquit la légende selon 
laquelle Galois fit ses découvertes majeures en une seule nuit, pris par la fièvre de 
la mort. La matinée du 30 mai, Galois, abandonné, grièvement blessé, est relevé 
par un paysan et conduit à l'Hôpital Cochin. Il meurt le 31 mai 1832 dans les bras 
de son jeune frère est est enterré dans la fosse commune du cimetière de 
Montparnasse. Les travaux de Galois sont redécouverts une dizaine d'années plus 
tard par Liouville, qui en 1843 annonce à l'Académie des Sciences qu'il vient de 
trouver dans les papiers de Galois une solution aussi exacte que profonde au 
problème de la résolubilité par radicaux. Ce n'est qu'en 1846 qu'il publie les textes 
sans y joindre de commentaires. À partir de 1850, les écrits de Galois sont enfin 
accessibles par les meilleurs mathématiciens. 


Gamow, George (1904-1968) est un physicien théorique, astronome, 
cosmologiste et auteur/vulgarisateur scientifique américano-russe né à Odessa en 
Ukraine. Gamow vient en 1928 à Gôttingen, où il utilise la physique quantique 
pour faire une théorie quantique de la radioactivité alpha. Deux mois plus tard, il 
rejoint Niels Bohr à Copenhague. Il émet l'idée d'un noyau atomique se 
comportant comme un fluide nucléaire, modèle repris presque une décennie plus 
tard par Bohr. En 1929, il obtient une nouvelle bourse et il rejoint Ernest 
Rutherford à l'université de Cambridge. Il développe l'idée de l'effet tunnel afin de 
faire interagir des protons pour obtenir des noyaux de numéro atomique plus 
élevé. Il y rencontre John Cockcroft, qui construit peu après le premier 
accélérateur de particules, parvenant ainsi à valider le modèle de Gamow en 
réussissant une transmutation du lithium. Professeur à Washington en 1934, 
Gamow collabore avec Edward Teller pour formuler la théorie de l'émission bêta 
(1936). S'intéressant ensuite à l'astrophysique, Gamow et Teller donnent un 
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modèle de la structure interne des étoiles géantes rouges (1942). En 1954, c'est 
vers la biochimie qu'il se tourne, proposant le concept de code génétique 
déterminé par l'ordre des composants de l'ADN. En 1956, il est nommé professeur 
de physique à Boulder (Colorado). 


Gauss, Carl Friedrich (1777-1855), mathématicien allemand, qui a apporté des 
contributions essentielles à la plupart des branches des sciences exactes et 
appliquées. À l'âge de 17 ans, il essaya de trouver une solution au problème 
classique de construction d'un polygone à sept côtés, à la règle et au compas. Il 
réussit à prouver l'impossibilité de cette construction et poursuivit sa démarche en 
donnant des méthodes de construction de polygones à 17, 257, et 65537 côtés. 
Plus généralement, il prouva que la construction, à la règle et au compas, d'un 
polygone régulier à nombre impair de côtés n'était possible que si le nombre de 
côtés est un des nombres premiers 3, 5, 17, 257, et 65'537, ou un produit de ces 
nombres. Pour sa thèse de doctorat, il démontra que toute équation algébrique a 
au moins une racine. Ce théorème, dont la démonstration avait résisté aux 
mathématiciens les plus célèbres, est encore appelé le théorème fondamental de 
l'algèbre ou théorème de d'Alembert-Gauss. Gauss tourna ensuite son attention 
vers le domaine de l'astronomie pour laquel il élabora également une nouvelle 
méthode de calcul des orbites des corps célestes, en développant une théorie des 
erreurs d'observation connue sous le nom de méthode des moindres carrés. En 
probabilités, son nom est attaché à la loi normale (dite aussi loi de Laplace- 
Gauss), dont la répartition est décrite par la fameuse courbe en cloche ou courbe 
de Gauss. On lui doit aussi des travaux en géodésie. Avec le physicien allemand 
Wilhelm Eduard Weber, Gauss fit, à partir de 1831, des recherches approfondies 
dans le domaine du magnétisme et de l'électricité. Il fit aussi des recherches en 
optique, en particulier sur les systèmes de lentilles. Pour revenir aux 
mathématiques, il fut le premier, en étudiant la série hypergéométrique, à donner 
des conditions rigoureuses de convergence d'une série. Il étudia des 
généralisations fructueuses de la loi de réciprocité quadratique et dégagea leurs 
liens avec la théorie des fonctions elliptiques. Son mémoire de 1828 sur la théorie 
intrinsèque des surfaces fut le point de départ d'une théorie générale des espaces 
courbes (travaux de Riemann et de ses successeurs). Signalons aussi l'étude 
arithmétique des entiers de Gauss (de la forme a+ib) qui repose sur une 
présentation géométrique des nombres complexes comme points du plan. 


Gibbs, Josiah Willard (1839-1903), physicien et mathématicien américain né et 
décédé à New Haven dans le Connecticut (après y avoir passé presque toute son 
existence en célibataire). Issu d'une famille de lettrés, il poursuit des études de 
latin et de physique, puis il entreprend une carrière de professeur de physique- 
mathématique au Yale College. Il séjourne successivement à Paris, à Berlin où il 
suit les leçons de Heinrich Gustav Magnus et à Heidelberg où il rencontre Gustav 
Kirchhoff et Herman Ludwig Helmholtz. Il laisse le souvenir d'un savant d'une 
modestie proverbiale et d'une extraordinaire puissance d'investigation scientifique. 
Son oeuvre remarquablement compacte fut d'abord peu connue. Aujourd'hui, elle 
est considérée comme un monument au sein des contributions scientifiques du 
19ème siècle. Les deux principales publications datent de 1877 et de 1902. La 
première s'intitule On the Equilibrium of Heterogeneous Substances et est 
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comparée, en importance, à la chimie pondérale créée par Antoine Laurent 
Lavoisier. La seconde, jugée plus originale encore, est intitulée Elementary 
Principles in Statistical Mechanics, et est comparée, pour son génie, à la 
mécanique analytique de Joseph Louis Lagrange. Bien que les exposés de Gibbs 
se distinguent par une exceptionnelle clarté, et la façon dont l'idée essentielle y est 
toujours soigneusement dégagée, le premier des deux mémoires n'a guère retenu 
tout d'abord l'attention des chimistes de son époque, peu accoutumés au langage 
rigoureux des sciences exactes. La richesse des méthodes thermodynamiques sur 
lesquelles il s'appuie en a fait cependant une base unifiée de la théorie physico- 
chimique des états d'équilibre et de leur stabilité. La plupart des lois qui se 
rapportent à cette discipline, et qui portèrent d'abord d'autres noms, furent 
redécouvertes ultérieurement au sein de ce premier mémoire. Il en est ainsi, par 
exemple, de la loi des phases donnant la variance des systèmes en équilibre, 
longtemps attribuée à Bakkuis Roozeboom (également des lois dites "loi de Van't 
Hoff” et aussi "loi de Le Chatelier"), relatives aux déplacements d'équilibre à 
température constante et à pression constante. Il en est encore de même, des 
critères de stabilité de l'équilibre, dont le théorème de modération dit "théorème 
de Braun et Le Chatelier". En bref, la plupart des propriétés qui relèvent à présent 
de la thermodynamique chimique des états d'équilibre, telles que la pression 
osmotique, l'influence de la tension superficielle, celle des déformations 
élastiques, la loi relative à l'entropie des mélanges gazeux et le paradoxe de Gibbs 
associé, ont ce même mémoire pour origine. Gibbs conduit à développer, dans 
deux communications antérieures à la précédente, un exposé complet des 
diagrammes et des surfaces thermodynamiques qui contribua largement à la 
diffusion de leur emploi auprès des praticiens. La théorie de Gibbs utilise pour la 
première fois la notion d'ensemble ainsi que la distinction entre un ensemble 
canonique et un ensemble microcanonique de même qu'entre un grand et un petit 
ensemble. Elle introduit aussi le concept d'espace des phases, caractérisé par les 
coordonnées et les quantités de mouvement de chaque élément. Elle établit, à 
partir de l'équation de Liouville, la loi de conservation de l'élément d'extension en 
phase, ainsi que celle de densité et de probabilité de l'état statistique . Il réalise 
finalement un accord formel mais remarquable avec les lois macroscopiques de la 
thermodynamique, régissant le comportement des milieux matériels en équilibre. 
Les développements actuels de la mécanique statistique constituent encore, sur 
plus d'un point, des prolongements de la méthode de Gibbs. Il définit pour les 
réactions chimiques deux quantités très utiles, à savoir l'enthalpie qui représente 
la chaleur d'une réaction à pression constante, et l'enthalpie libre qui détermine si 
oui ou non une réaction peut procéder de façon spontanée à température et 
pression constante. Cette dernière quantité est maintenant nommée énergie de 
Gibbs en son honneur (ou comme anglicisme énergie libre de Gibbs). L'emploi du 
point pour désigner un produit scalaire, celui de la croix de Saint-André pour un 
produit vectoriel et l'adoption des opérateurs vectoriels différentiels del et nabla 
proviendraient de Gibbs. 
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Gôüdel, Kurt (1906-1978) est le mathématicien et logicien austro-américain, qui 
de tout le 20ème siècle, a le plus révolutionné les fondements logiques des 
mathématiques. Il était un homme tellement obsédé par la logique qu'on raconte 
que, alors qu'il cherchait à obtenir sa naturalisation américaine, il osa démontrer 
devant le juge la contradiction de certains articles de la constitution des 
États-Unis. Sa thèse, et surtout un article publié en 1931 sous le titre Über formal 
unentscheidbare Sätze der Principia Mathematica und verwandter Systeme (sur 
l'indécidabilité formelle des Principia Mathematica et de systèmes équivalents), 
donneront à Güdel une réputation internationale. Gôdel met fin aux espoirs de 
Hilbert d'axiomatiser totalement la mathématique, et de n'en faire qu'une suite de 
déductions mécaniques ne laissant aucune place à l'intuition. Ainsi, Gôdel montre 
qu'il existe des propositions vraies sur les nombres entiers, mais que l'on ne sait 
pas démontrer. Il montre même que, si on ajoute d'autres axiomes, on trouvera 
toujours des propositions vraies indécidables (qu'on ne sait pas démontrer). Il 
prouve notamment que l'hypothèse du continu et l'axiome du choix ne sont pas en 
contradiction avec les autres axiomes de la théorie des ensembles. Puis il s'oriente 
vers la relativité, étant en relation directe à Princeton avec son ami Einstein. Il est 
notamment connu des physiciens pour avoir démontré que le voyage vers le passé 
est possible dans le cadre des équations de la relativité générale. 


Gôpper-Meyer, Maria (1906-1972) est une physicienne américaine d'origine 
allemande, prix Nobel en 1963, pour son étude de la structure nucléaire. Elle était 
mariée à un physicien, le spécialiste de la physique du solide Joseph Mayer 
(1904-1983). Mais, dans ce couple, chacun travaillait de son côté et dans sa 
spécialité. Goeppert-Mayer obtint son doctorat à l'université de Gôttingen, en 
Allemagne. Elle enseigna dans de nombreuses institutions avant de rentrer à 
l'université de Californie à San Diego, en 1960. En 1963, elle partagea avec 
H.D.Jensen et E.Wigner le prix Nobel de physique, et fut citée par le comité 
Nobel pour son oeuvre indépendante à la fin des années 1940. Elle démontra que 
le noyau atomique possède un nombre de neutrons et de protons bien définis: elle 
introduisit un modèle structural du noyau atomique en couches. Ce modèle 
développé en détail à partir de 1948 supposait que la forte interaction entre le 
mouvement de rotation intrinsèque (quantifié par le spin) des nucléons et leur 
mouvement orbital était responsable de la structure des niveaux d'énergie des 
noyaux. De nombreuses conséquences déduites de cette hypothèse se révélèrent 
vérifiées par les mesures expérimentales. Quelques années plus tard, James 
Rainwater, Aage Bohr et Ben R. Mottelson (tous trois Prix Nobel de physique 
1975) complétaient la théorie en tenant compte du couplage entre les 
mouvements des nucléons de la couche externe et le mouvement collectif du 
coeur nucléaire. 


Gosset, William Sealy (1876-1937) connu sous le pseudonyme de "Student" c'est 
un statisticien anglais. Employé de la brasserie Guinness pour stabiliser le goût de 
la bière, il a ainsi inventé le test de Student utilisé de manière standard dans de 
très nombreux domaines de l'industrie ou de l'économie. Il a aussi déterminé en 
1908 l'origine de la distribution expérimentale qu'il obtenaïit dans le cadre de son 
travail et après avoir suivi un cours de statistique avec Karl Pearson, il obtint son 
fameux résultat qu'il publia sous le pseudonyme de Student avec la loi qui porte 
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son nom et son test. 


Gottlob, Frege Friedrich Ludwig (1848-1925) Mathématicien et philosophe 
allemand, initiateur de la logique moderne. Frege est né à Wismar en 1848, et fit 
ses études aux universités de léna et de Gôttingen, où il obtint son doctorat de 
philosophie en 1873. De 1879 à 1917, il fut professeur à la faculté de philosophie 
d'Iéna. Ses travaux concernent notamment la logique mathématique et ses 
applications. Confronté à l'ambiguïté du langage ordinaire et à l'imperfection des 
systèmes logiques disponibles, il inventa de nombreuses notations symboliques, 
comme les quantificateurs et les variables, posant alors les bases de la logique 
mathématique moderne. Il est ainsi le premier à avoir présenté une théorie 
cohérente du calcul des prédicats et du calcul des propositions. Il fut aussi le 
premier à faire dériver l'arithmétique de la logique. Il définit ainsi notamment la 
suite des nombres entiers à partir de l'ensemble vide, en appliquant quelques 
règles simples. 


Grothendieck, Alexander (1928-) est né à Berlin d'un père anarchiste russe, tué 
par les nazis, et d'une mère femme de lettres, réfugiée en France. Il passe sa 
licence à la faculté des sciences de Montpellier, puis passe une année en 
1948-1949 à l'École Normale Supérieure à Paris, avant de migrer en 1949 à 
l'université de Nancy. Il y devient l'élève, en analyse fonctionnelle, de Schwartz et 
Dieudonné. Ce dernier le trouve un peu prétentieux, et lui propose de travailler 
sur des questions que ni Schwartz, ni lui n'ont su résoudre. Voilà ce qu'en dit 
Schwartz dans son autobiographie: "Dieudonné, avec l'agressivité (toujours 
passagère), dont il était capable, lui passa un savon mémorable, arguant qu'on ne 
devait pas travailler de cette manière, en généralisant pour le plaisir de 
généraliser. [..] L'article s'achevait sur 14 questions, des problèmes que nous 
n'avions pas su résoudre, Dieudonné et moi. Dieudonné lui [Grothendieck] 
proposa de réfléchir à certains d'entre eux qu'il choisirait. Nous ne le revîmes plus 
pendant quelques semaines. Lorsqu'il avait réapparu, il avait trouvé la solution de 
la moitié d'entre eux!". Rapidement, Grothendieck rédige sa thèse intitulée 
Produits tensoriels topologiques et espaces nucléaires, et devient le spécialiste 
mondial de la théorie des espaces vectoriels topologiques. Il devient aussi membre 
du célèbre groupe Bourbaki auprès de ses aînés. Au début des années 1960, il 
obtient une charge au tout récent Institut des Hautes Études Scientifiques (IHES), 
et son centre d'intérêt s'oriente vers la géométrie algébrique. Il y réalise des 
travaux gigantesques, qui lui valent la médaille Fields en 1966. Toutefois, 
Grothendieck refuse de se rendre en URSS pour la recevoir, afin de protester 
contre la répression de l'insurrection hongroise en 1956. On la lui remet plus tard, 
mais il l'offre au Viêt-nam, afin qu'il utilise son or. Il y enseigne d'ailleurs plusieurs 
semaines sous les bombardements américains. Vers la fin des années 60, 
Grothendieck, qui a perdu l'habitude de rédiger (Dieudonné a rédigé des années 
durant son séminaire), devient de moins en moins clair. Il ne pardonnera jamais 
aux autres mathématiciens de ne pas le comprendre et de dénaturer ainsi ses 
idées. Si ses relations avec la communauté mathématique n'avaient jamais été 
faciles (il travaillait énormément en solitaire, ses journées faisaient 27 ou 28 
heures, de sorte que parfois il lui arrivait de se décaler - Il méprisait légèrement 
Dieudonné, séquelle du premier coup de gueule de ce dernier - ses prises de becs 
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avec Weil causèrent son départ de Bourbaki...), elles sont plus tendues que 
jamais. Il abandonne peu à peu la mathématique et quitte l'IHES après une 
dispute interne sur des financements militaires, pour se retirer dans sa maison de 
l'Hérault, où il se consacre à la méditation et à l'écologie. Il écrit vers 1985 une 
sorte d'autobiographie, Récoltes et semailles, qui ne trouve pas d'éditeur. Ceux 
qui ont pu la lire sont unanimes pour dire qu'elle contenait de nombreuses 
attaques contre la communauté des mathématiciens. 


Hamilton, William Rowan (1805-1865) est un mathématicien, physicien et 
astronome irlandais (né et mort à Dublin) qui fut l'objet de son vivant des plus 
grands honneurs, on l'appelait le "Lagrange irlandais", et même le "Newton 
irlandais", et pourtant son oeuvre était peu connue et rarement étudiée. Il est 
connu pour sa découverte des quaternions, maïs il contribua aussi au 
développement de l'optique, de la dynamique et de l'algèbre. Ses recherches se 
révélèrent importantes pour le développement de la mécanique quantique. 

Les travaux mathématiques de Hamilton incluent l'étude de l'optique géométrique, 
l'adaptation des méthodes dynamiques aux systèmes optiques, l'application des 
quaternions et des vecteurs aux problèmes de mécanique et géométriques, les 
possibilités de résolution des équations polynomiales, notamment l'équation 
générale du 5 degré, les opérateurs linéaires, dont il prouve un résultat concernant 
ces opérateurs dans l'espace des quaternions et qui est un cas spécial du théorème 
de Cayley-Hamilton. Sa carrière scientifique fut prédestinée par des études à 
Trinity College, à Dublin, où, à l'âge de 19 ans, il terminait un travail remarquable 
sur l'optique. À 23 ans, il devint professeur d'astronomie à Dublin et astronome 
royal à l'observatoire de Dunsink. Il restera toute sa vie fidèle à Dublin et à son 
observatoire. Hamilton s'efforce de donner aux principes fondamentaux de la 
mécanique une forme simple permettant d'édifier toute une théorie déductive. 
Pour cela, il modifie les principes de variations antérieurs, notamment le principe 
de moindre action , et introduit ce qu'on appelle de nos jours le "principe de 
Hamilton". Indiquons enfin qu'on lui doit la forme dite "canonique" des équations 
de la dynamique qui n'apporte rien de nouveau à la physique mais fournit une 
méthode plus puissante pour résoudre les équations du mouvement. Dans ses 
travaux des années 1832 à 1835 Hamilton attache une grande importance à 
l'interprétation géométrique des nombres complexes, et c'est à partir de là qu'il 
cherche un calcul algébrique qui s'interpréterait dans l'espace à trois dimensions. 
Il n'arrive à ce but qu'en 1843, en construisant les quaternions. Dans les années 
qui suivent cette découverte, il se consacre à son développement et à sa diffusion, 
en lui trouvant des applications à divers domaines des mathématiques et de la 
physique. Les quaternions de Hamilton constituent un des premiers systèmes de 
vecteurs et ont, par leurs conséquences théoriques, beaucoup contribué à 
l'élaboration de l'algèbre et de la physique quantique du 20ème siècle. 
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Hawking, Stephen (1942-) né à Oxford, est un physicien théoricien et 
cosmologiste britannique. Au même titre qu'Albert Einstein, Hawking n'aurait pas 
été particulièrement brillant à la petite école, mais son goût pour les sciences 
physiques le mène à l'université d'Oxford, un lieu d'après lui d'ennui relatif d'où il 
sort avec les honneurs. Après avoir obtenu son diplôme B.A. à Oxford en 1962, il 
est resté pour étudier l'astronomie. Il a décidé d'arrêter quand il trouva que l'étude 
des taches solaires ne l'attirait pas et qu'il était plus intéressé par la théorie que par 
l'observation. Il a quitté Oxford, avec les honneurs, pour Trinity Hall où il a 
participé à l'étude de l'astronomie théorique et la cosmologie théorique. 
L'université de Cambridge est un tout autre monde: d'un côté, Hawking y débute 
son passionnant doctorat sur la relativité générale, de l'autre, sa maladie se 
déclare. Malgré cette difficulté, l'étude des singularités, concept physique et 
astronomique récent, permet au chercheur de développer différentes théories, qui 
le mèneront du Big Bang aux trous noirs. En premier lieu, Roger Penrose et lui 
construisent la structure mathématique répondant à la question d'une singularité 
comme origine de l'Univers. Ensuite, à partir des années 1970, Hawking 
approfondit ses recherches sur les densités infinies locales, et ses études sur les 
trous noirs ont fait progresser bien d'autres domaines. Enfin, la théorie du tout, 
visant à unifier les quatre forces physiques, est au centre des recherches actuelles 
de Hawking. Le but est de démontrer que l'Univers peut être décrit par un modèle 
mathématique stable, déterminé par les lois physiques connues, en vertu du 
principe de croissance finie mais non bornée, modèle auquel Hawking a donné 
beaucoup de crédit. Son handicap lourd ne saurait expliquer à lui seul le grand 
succès de ses recherches ; Hawking a cherché à vulgariser son travail, et son livre 
Une brève histoire du temps est l'un des plus grands succès de littérature 
scientifique. En 2001, paraît son deuxième ouvrage, L'univers dans une coquille 
de noix qui vulgarise le dernier état de ses réflexions, en abordant la supergravité 
et la supersymétrie, la théorie quantique et théorie-M, l'holographie et la dualité, 
la théorie des supercordes et des p-branes... Il s'interroge également sur la 
possibilité de voyager dans le temps et sur l'existence d'univers multiples. 


Hausdorff, Felix (1868-1942) La renommée du mathématicien allemand Felix 
Hausdorff repose surtout sur son ouvrage Grundzüge der Mengenlehre (1914), 
qui en fit le fondateur de la topologie et de la théorie des espaces métriques. Né à 
Breslau dans une famille de marchands aisés, Hausdorff fit ses études secondaires 
à Leipzig, puis étudia la mathématique et l'astronomie à Leipzig, Fribourg- 
en-Brisgau et Berlin. En 1891, il obtint son doctorat à Leipzig et y enseigna de 
1896 à 1902. Durant toute cette époque, Hausdorff, tout en publiant plusieurs 
mémoires d'astronomie, d'optique et de mathématiques, s'intéressa surtout à la 
philosophie, la littérature et l'art. De 1910 à 1935, il était professeur de 
mathématiques à l'université de Bonn, à l'exception des années 1913-1921, où il 
enseignait à Greifswald. Depuis sa retraite forcée, en 1935, les travaux de 
Hausdorff ne furent plus publiés en Allemagne. Juif, Hausdorff risqua le camp de 
concentration et, lorsqu'en 1942 l'internement devint imminent, il se suicida à 
Bonn, avec sa femme et sa belle-soeur. Les contributions de Hausdorff au 
développement des mathématiques se situent dans plusieurs domaines. Son étude 
approfondie des séries déboucha sur la démonstration de théorèmes sur les 
méthodes de sommation et les coefficients de Fourier (1921). Considérant les 
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propriétés d'ensembles numériques, il introduisit une classe importante de 
mesures. Il a étudié, en théorie générale des ensembles, les ensembles 
partiellement ordonnés et a obtenu plusieurs théorèmes sur les ensembles 
ordonnés (1906-1909). En théorie descriptive des ensembles, il a démontré le 
théorème sur la cardinalité des ensembles boréliens (1916). Outre des résultats 
isolés mais profonds en topologie et en théorie des ensembles, Hausdorff a 
surtout, par ses Grundzüge der Mengenlehre, posé les fondements d'une 
discipline. Hausdorff développe une théorie des espaces topologiques et 
métriques englobant parfaitement les résultats antérieurs. Il choisit de construire 
sa théorie des espaces abstraits sur la notion de voisinage. Il ajouta bon nombre de 
résultats nouveaux à la théorie des espaces métriques, dont le plus profond est le 
théorème affirmant que chaque espace métrique peut être étendu d'une manière 
unique à un espace métrique complet. Hausdorff était un professeur méthodique, 
mais ses cours, au contenu riche et rigoureusement structuré, passèrent au-dessus 
du niveau de ses auditeurs. 


Heaviside, Oliver (1850-1925) est né la ville de Camden à Londres en 
Angleterre et mort à Torquay dans le Devon en Angleterre. C'est là qu'il a vécu les 
25 dernières années de sa vie. Il est issu d'une famille assez pauvre. Il a attrapé la 
scarlatine quand il était un enfant en bas âge, ce qui a affecté son audition, il est 
resté partiellement sourd. Ce qui a eu un impact sur sa vie rendant son enfance 
difficile surtout au niveau des relations avec les autres enfants. Il a compensé par 
la timidité et le sarcasme. Cependant, malgré tout, son rendement académique 
était plutôt élevé. On peut même dire qu'à 16 ans, c'était un étudiant supérieur, 
mais il a échoué dans la géométrie d'Euclide. Il a détesté devoir déduire un fait 
d'autres. Le primat de la preuve rigoureuse en arithmétique, idée fortement 
détestée par Heaviside en fit le sujet où il était le plus faible. Bien qu'ayant 
interrompu ces études à 16 ans, il a continué à s'instruire par lui-même. Il a appris 
le code Morse, étudié l'électricité et d'autres langues en particulier le Danois et 
l'Allemand. Il était autodidacte. En 1868, après avoir quitté ses études, Heaviside 
est allé au Danemark et il est devenu opérateur de télégraphe. Il a progressé 
rapidement dans sa profession et il est revenu en Angleterre en 1871. C'est son 
travail qui l'a incité à étudier l'électricité. Il a donc lu le nouveau traité de 
Maxwell sur l'électricité et le magnétisme. Après avoir lu ce traité, il a apporté des 
changements à sa vie. Il a arrêté de travailler et il s'est enfermé dans une chambre 
de la maison familiale pour travailler sur la théorie de Maxwell. Heaviside a réduit 
la théorie de Maxwell et c'est à partir de ce moment que la théorie électrique a 
pris sa forme moderne. Maxwell avait écrit vingt équations à vingt variables. 
Heaviside réduit ces vingt équations en les remplaçant par quatre équations à 
deux variables. Aujourd'hui, nous appelons ces équations: "Les quatre équations 
de Maxwell", oubliant qu'elles sont en fait les équations de Heaviside. Cependant, 
c'est Hertz qui a obtenu le crédit pour cela, mais il admet que ses idées lui sont 
venues de Heaviside. 
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Heisenberg, Werner Karl (1901-1976), né à Wurtzbourg et décédé à Munich 
était un physicien allemand. Il fut le fondateur des concepts théoriques rigoureux 
de la mécanique quantique. Il est lauréat du prix Nobel de physique de 1932. Il 
fréquente le prestigieux Maximiliangymnasieum où Max Planck avait étudié 40 
ans plus tôt. A l'âge de 12 ans, il se mit à apprendre le calcul intégral et plus tard, 
passionné par les mathématiques, il suivit en auditeur libre plusieurs cours de 
l'Université de Munich, notamment sur les méthodes mathématiques de la 
physique moderne. Il accomplit ses études de physique dans le délai record de 3 
ans, et soutint sa thèse (qu'il faillit louper à cause de lacunes en physique 
expérimentale élémentaire) sous la direction d'Arnold Sommerfeld avec lequel il 
élabora une théorie expliquant l'effet Zeeman anormal à l'âge de 20 ans qui attira 
l'attention des grands physiciens européens (il était considéré aussi brillant que 
Pauli qui lui-même était déjà considéré comme plus génial qu'Einstein). Dès 1924 
il devenait l'assistant de Max Born à Gôttingen puis il travailla avec Niels Bohr à 
Copenhague. C'est au cours des années suivantes qu'avec Max Born et Pascual 
Jordan, il jeta les bases théoriques de la mécanique quantique. Heisenberg fut 
recruté en 1927 comme professeur à l'Université de Leipzig âgé seulement de 26 
ans. Il fit de cet établissement l'un des hauts-lieux de la physique théorique (et en 
particulier de la physique nucléaire) en Europe. Il développa la première 
formalisation de la mécanique quantique, en 1925, en même temps qu'Erwin 
Schrôdinger. Toutefois le formalisme mathématique était différent. Heisenberg 
adopta une formalisation matricielle complexe (alors qu'il ne savait pas ce qu'était 
une matrice comme la majorité des physiciens de son temps...) qui faisait 
naturellement émerger la non commutativité alors que Schrôüdinger utilisa une 
approche par les équations différentielles (simple équation d'ondre). Pour cette 
raison, on crut d'abord que les deux théories étaient distinctes, mais l'année 
suivante, Schrôdinger établit l'équivalence mathématique des deux formulations. 
Son principe d'incertitude, découvert en 1927, affirme que la détermination de 
certains couples de valeurs, par exemple la position et la quantité de mouvement, 
ne peut se faire avec une précision infinie. À partir de 1929, il travailla avec 
Wolfgang Pauli à l'élaboration de la théorie quantique des champs. Après la 
découverte du neutron par James Chadwick en 1932, Heisenberg proposa le 
modèle proton-neutron du noyau atomique, et s'en servit pour expliquer le spin 
nucléaire des isotopes. 


Helmholtz, Hermann Ludwig Ferdinand von (1821-1894) né à Potsdam et 
mort à Berlin. Il n'est guère de domaines des sciences de la nature auxquels 
Helmholtz n'ait consacré quelque recherche. On pourrait répéter à son endroit, ce 
qu'il disait lui-même de Friedrich von Humboldt dans sa célèbre conférence 
inaugurale du colloque scientifique d'Innsbruck (sur le but et les progrès de la 
science de la Nature, 1869): "Il avait réussi à dominer toutes les sciences de la 
nature à son époque et à pénétrer jusqu'en chacune de leurs spécialités." Même si 
Helmholtz ajoute que dans la seconde moitié du 19ème siècle ce savoir 
encyclopédique est désormais impossible, et qu'il faut se résigner à besogner dans 
un secteur étroitement délimité, il suffit de jeter un regard sur l'ensemble de ses 
travaux pour constater qu'il s'est préoccupé de matières aussi différentes que la 
thermodynamique, l'hydrodynamique, l'électrodynamique et la théorie de 
l'électricité, la physique météorologique, la physiologie, et plus particulièrement la 
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théorie de l'acoustique et l'optique physiologique. Pourvu de dons remarquables 
pour la vulgarisation des résultats scientifiques les plus récents, il écrivit de 
nombreux articles et prononça maintes conférences où les exposés scientifiques 
populaires voisinent avec des préoccupations esthétiques ou philosophiques. Son 
nom reste surtout attaché à la formulation du principe de la conservation de 
l'énergie, qui fait de lui l'un des pères de l'énergétique, même si certaines de ses 
assertions peuvent sembler d'un mécanisme intransigeant et ont pu le faire 
considérer par certains comme le dernier tenant de la physique galiléenne. Son 
nom est lié également à quelques inventions notoires comme celle de 
l'ophtalmoscope ou des résonateurs sphériques. Sur la fin de sa vie, Helmholtz 
reconnaîtra l'importance et l'universalité d'un autre principe physique, le principe 
de moindre action, qu'il appliquera, en particulier, à l'électrodynamique. 


Henry, Joseph (1797-1878) était un scientifique américain né à New-York et 
décédé à Washington. Ses parents étaient pauvres, et le père d'Henry est mort 
alors qu'il était encore jeune. Pour le reste de son enfance, Henry a vécu avec sa 
grand-mère à New York. Il a fréquenté une école qui allait plus tard être nommée 
Joseph Henry Elementary School, à son honneur. Après l'école, il a travaillé dans 
un magasin général, et à l'âge de 13 ans, il est devenu apprenti horloger et orfèvre. 
Son intérêt pour la science s'est éveillé à l'âge de 16 ans par un livre de 
conférences sur des sujets scientifiques intitulé Popular Lectures on 
Experimental Philosophy. En 1819, il entra à l'Académie Albany, où il a suivi des 
cours gratuits. Il était si pauvre qu'il devait subvenir à ses besoins avec des postes 
d'enseignement et de tutorat privé. Il avait l'intention d'étudier la médecine, mais 
en 1824 il a été nommé assistant ingénieur de l'inspection nationale des routes en 
cours de construction entre la rivière Hudson et le lac Érié. Dès lors, il a été 
inspiré d'une carrière soit dans le génie civil ou mécanique. Henry a tellement 
excellé dans ses études (à tel point, qu'il aidait souvent ses professeurs à enseigner 
la science) que, en 1826, il est nommé professeur de mathématiques et de 
philosophie naturelle à l'Académie Albany. Certains de ses travaux de recherche 
les plus importants ont été réalisé dans pendant qu'il était à ce poste. Sa curiosité 
sur le magnétisme terrestre l'a amené à faire des expériences avec le magnétisme 
en général. Il a été le premier à enrouler un fil isolé étroitement autour d'un noyau 
de fer dans le but de faire un électro-aimant puissant. Pendant la construction des 
électro-aimants, Henry a découvert le phénomène électromagnétique d'auto- 
induction. Il a également découvert linductance mutuelle indépendamment de 
Michael Faraday, mais puisque Faraday a publié ses résultats en premier, il est 
devenu le découvreur officiellement reconnu du phénomène. En utilisant son 
principe électromagnétique nouvellement développé, Henry en 1831 a créé l'une 
des premières machines à utiliser l'électromagnétisme pour le mouvement. Ce fut 
le premier ancêtre du moteur à courant continu. L'unité SI de l'inductance, la 
Henry, est nommé en son honneur. 
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Hermite, Charles (1822-1901), né à Dieuze, il publia ses premiers travaux alors 
qu'il était encore élève à l'École polytechnique, et à 30 ans, il était déjà considéré 
comme un des meilleurs mathématiciens de son temps. Il fut successivement 
professeur à l'École polytechnique, au Collège de France et enfin à la Sorbonne à 
partir de 1869 où son enseignement et sa volumineuse correspondance eurent une 
influence considérable. Il vécut à Paris jusqu'à sa mort. Il avait été élu membre de 
l'Académie des sciences à 34 ans. En algèbre, Hermite prit une part active aux 
premiers développements de la théorie des invariants, inaugurée par Arthur 
Cayley et James Joseph Sylvester, il acheva, entre autres, la détermination des 
invariants des formes binaires du 5 degré, commencée par Sylvester, et découvrit 
la loi de réciprocité entre covariants de formes binaires de degrés différents. On 
lui doit aussi un procédé d'interpolation améliorant la méthode de Lagrange en 
tenant compte des valeurs des dérivées premières, et la découverte de la famille 
de polynômes orthogonaux qui portent son nom. Les travaux d'analyse d'Hermite 
portent la marque de son tempérament d'algébriste. Son sujet de prédilection 
pendant toute sa vie a été la théorie des fonctions elliptiques et des fonctions 
abéliennes, dont il aimait particulièrement explorer les liens cachés avec l'algèbre 
et la théorie des nombres. Un de ses résultats qui frappa le plus ses contemporains 
est la résolution de l'équation du 5 degré à l'aide des fonctions elliptiques. Sa 
virtuosité dans les calculs des fonctions lui permit d'obtenir directement les 
remarquables relations sur les nombres de classes d'idéaux des corps 
quadratiques, que Kronecker avait déduites de la multiplication complexe. Il fut 
un des pionniers dans l'étude des fonctions abéliennes, où il développa la théorie 
de la transformation et rencontra à cette occasion pour la première fois le groupe 
symplectique. Enfin, le plus célèbre des mémoires d'Hermite est celui où, en 1872, 
il démontra la transcendance du nombre e ; il y avait été conduit par ses 
recherches sur les fractions continuées algébriques, et sa méthode est restée 
presque la seule dont on dispose encore aujourd'hui pour aborder les problèmes de 
transcendance. 


Hertz, Heinrich Rudolf (1857-1894), physicien allemand né à Hambourg et 
décédé à Bonn. Il fit ses études à l'Université de Berlin. En 1879, il est l'élève de 
Gustav Kirchhoff et Hermann von Helmholtz à l'Institut de physique de Berlin. Il 
devient maître de conférence à l'université de Kiel en 1883 où il effectue des 
recherches sur l'électromagnétisme. De 1885 à 1889, à l'origine de la télégraphie 
sans fil, il fut professeur de physique à l'École technique de Karlsruhe, et, à partir 
de 1889, enseigna la physique à l'Université de Bonn. Hertz clarifia et étendit la 
théorie électromagnétique de la lumière proposée par le physicien anglais James 
Maxwell, en 1884. Il prouva que l'électricité pouvait être transmise par des ondes 
électromagnétiques qui se déplacent à la vitesse de la lumière et possèdent de 
nombreuses autres propriétés de la lumière. Ses expérimentations avec ces ondes 
aboutirent au développement du télégraphe sans fil et de la radio. L'unité de 
fréquence, une période par seconde, fut dénommée le "Hertz" 
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Hilbert, David (1862-1943), né à Kônigsberg et décédé à Gôttingen fut un 
étudiant de Lindemann sous la supervision duquel il obtint sa thèse en 1885 et eut 
pour camarade Herman Minkowski, avec qui il resta lié par une profonde amitié. 
Bien que les intérêts mathématiques de Hilbert furent vastes, il préféra travailler à 
un sujet à la fois. Ses principaux domaines d'intérêts furent: jusqu'en 1892, la 
théorie algébrique des invariants; de 1892 à 1899 la théorie algébrique des 
nombres; de 1899 à 1905, le calcul des variations; de 1901 à 1912, les équations 
intégrales; de 1912 à 1917, les fondements mathématiques de la physique. Vers 
1910, Hilbert soutient les efforts d'Emmy Noether, mathématicienne de premier 
ordre, qui souhaite enseigner à l'université de Gôttingen. Pour déjouer le système 
établi contre les femmes, Hilbert prête son nom à Noether qui peut ainsi annoncer 
l'horaire de ses cours sans entacher la réputation de l'université. De 1917 jusqu'à 
la fin de sa vie, il s'occupa de la logique mathématique. Il donna une impulsion 
décisive à l'essor des recherches sur les fondements des mathématiques. Au 
congrès international des mathématiques de 1900, Hilbert présenta une liste de 
vingt-trois problèmes dont plusieurs ne sont pas encore résolus aujourd'hui. Il a 
adopté et défendu avec vigueur les idées de Georg Cantor en théorie des 
ensembles et sur les nombres transfinis. Il est aussi connu comme l'un des 
fondateurs de la théorie de la démonstration, de la logique mathématique et a 
clairement distingué les mathématiques des métamathématiques. Il est considéré 
par plusieurs comme le plus grand mathématicien du 20ème siècle. 


Hoyle, Fred (1915-2001) Né à Bingley, dans le Yorkshire et décédé à 
Bournemouth, Hoyle étudie la mathématique et la physique théorique à 
Cambridge de 1933 à 1939. Lorsque les hostilités éclatent, il s'engage dans la 
Royal Navy pour travailler au développement du radar au centre de recherche de 
Witley. Il y rencontre lesdeux physiciens Hermann Bondi et Thomas Gold. Tous 
trois passionnés de cosmologie, ils considèrent avec scepticisme le modèle 
standard de l'Univers de l'époque (d'un point de vue philosophique il leur est 
inacceptable). À l'époque, le modèle standard achoppait de plus à une difficulté 
sérieuse: d'après les estimations de Hubble, l'âge de l'Univers devait être d'environ 
2 milliards d'années ; or, les données géologiques conduisaient à un âge de la 
Terre d'au moins 4 milliards d'années. Pendant la guerre, et dans les quelques 
années qui suivent la fin des hostilités, Hoyle publie plusieurs études sur la théorie 
de l'accrétion et sur la théorie de la structure stellaire, en particulier pour les 
étoiles géantes et les naines blanches. La guerre terminée, les trois hommes 
retournent à Cambridge, où Hoyle obtient une chaire de mathématiques. En 1948, 
ils exposent leur théorie dans deux articles, l'un de Bondi et Gold, l'autre de 
Hoyle. En 1963, le premier quasar est découvert. Sa luminosité intrinsèque est 
très supérieure à celle de tout autre objet céleste connu: il est cent fois plus 
lumineux que n'importe quelle galaxie! En 1962, Hoyle et William A. Fowler 
avaient proposé une théorie qui pouvait rendre compte de la luminosité énorme 
des quasars ; il s'agissait de la théorie des étoiles supermassives. Des 
considérations théoriques permettent de démontrer que des étoiles normales de 
masses supérieures à environ 60 masses solaires seraient le siège d'instabilités 
violentes dues à la pression de radiation et à la génération de l'énergie nucléaire. 
Cette hypothèse est corroborée par le fait que l'on n'observe pas d'étoiles 
normales au-delà de la limite d'instabilité. En dépit de cet argument, Hoyle et 
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Fowler proposaient le concept d'étoile supermassive, étoile qui serait supportée 
presque entièrement par la pression de radiation. Ainsi, pour atteindre la 
luminosité caractéristique d'un quasar, l'étoile supermassive doit avoir une masse 
de l'ordre de 100 millions de masses solaires. Lorsque la densité devient 
suffisamment élevée, une étoile supermassive de moins de 1 million de masses 
solaires explose, tandis qu'une étoile plus massive subit un effondrement 
cataclysmique et forme des trous noirs supermassifs. Ces deux possibilités sont 
très importantes pour comprendre les quasars, et elles ont été étudiées par de 
nombreux chercheurs. Une autre explication du phénomène quasar, suggérée pour 
la première fois par Donald Lynden-Bell, suppose l'accrétion de matière dans un 
trou noir supermassif situé au centre d'une galaxie (hypothèse actuellement 
adoptée par consenus de la communauté scientifique). 


Huygens, Christian (1629-1695), astronome, mathématicien et physicien 
néerlandais. Ses découvertes scientifiques nombreuses et originales lui valurent 
une large reconnaissance et les honneurs parmi les personnalités scientifiques du 
17ème siècle. Avec son Traité de la lumière (1690), il est à l'origine de la théorie 
ondulatoire de la lumière (qui plus tard prit son nom): chaque point d'ondes en 
mouvement est lui-même source de nouvelles ondes. Il se penche très vite, dès 
1652 sur les règles exposées par Descartes dans les Principes de la philosophie. 
Prenant appui sur la conservation cartésienne de la quantité de mouvement mv, il 
a l'idée de résoudre algébriquement le problème du choc en comparant les 


quantités mv° qui ne sont introduites que pour le bien du calcul, sans signification 
physique particulière. Découvrant alors que ces quantités se conservent avant et 
après le choc, il peut écrire les règles dans le cas général, ce que Descartes n'avait 
pu faire incluant donc conservation de la quantité de mouvement et de l'énergie 
cinétique. En 1655, il inventa une méthode de meulage et de polissage des 
lentilles d'optique. La définition plus fine ainsi obtenue lui permit de découvrir un 
satellite de Saturne et de fournir la première description précise des anneaux de 
Saturne. La nécessité de disposer d'une mesure exacte du temps pour 
l'observation du ciel l'amena à appliquer les lois du pendule composé pour régler 
les mouvements des horloges et montres. En 1656, il conçut une lunette de 
télescope qui porte son nom. Entre 1658 et 1659, Huygens travaille à la théorie du 
pendule oscillant. Il a en effet l'idée de réguler des horloges au moyen d'un 
pendule, afin de rendre la mesure du temps plus précise. Il découvre la formule de 
l'isochronisme rigoureux en 1659: lorsque l'extrémité du pendule parcourt un arc 
de cycloïde, la période d'oscillation est constante quelle que soit l'amplitude. Dans 
Horologium oscillatorium (1673), il détermina la véritable relation existant entre 
la longueur d'un pendule et la durée d'oscillation, et présenta ses théories sur la 
force centrifuge des mouvements circulaires, qui aidèrent le physicien anglais 
Isaac Newton à formuler les lois de la gravité. En 1673, Huygens et son jeune 
assistant Denis Papin, mettent en évidence le principe des moteurs à combustion 
interne, qui conduiront au xixe siècle à l'invention de l'automobile. En 1678, il 
découvrit la polarisation de la lumière par double réfraction sur la calcite. 
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Ibn, AI Haytham (965-1039) est un mathématicien, un philosophe et un 
physicien Arabe. Il est l'un des pères de la physique quantitative et de l'optique 
moderne, le pionnier de la méthode scientifique moderne et le fondateur de la 
physique expérimentale et certains, pour ces raisons, l'ont décrit comme le 
premier scientifique. Al Haytham commença sa carrière de scientifique dans sa 
ville natale de Bassorah. Il fut cependant convoqué par le calife Hakim qui voulait 
maîtriser les inondations du Nil qui frappaient l'Égypte année après année. Après 
avoir mené une expédition en plein désert pour remonter jusqu'à la source du 
fameux fleuve, Alhazen se rendit compte que ce projet était pratiquement 
impossible. De retour au Caire, il craignaïit que le calife qui était furieux de son 
échec ne se vengeât et décida donc de feindre la folie. Le calife se borna à 
l'assigner à résidence. Alhazen profita de ce loisir forcé pour écrire plusieurs livres 
sur des sujets variés comme l'astronomie, la médecine, la mathématique, la 
méthode scientifique et l'optique. Le nombre exact de ses écrits n'est pas connu 
avec certitude mais on parle d'un nombre entre 80 et 200. Peu de ces ouvrages, en 
effet, ont survécu jusqu'à nos jours. Quelques-uns d'entre eux, ceux sur la 
cosmologie et ses traités sur l'optique notamment, n'ont survécu que grâce à leur 
traduction latine. La plupart de ses recherches concernaient l'optique géométrique 
et physiologique. Contrairement à une croyance populaire, il a été le premier à 
expliquer pourquoi le soleil et la lune semblent plus gros (on a cru longtemps que 
c'était Ptolémée), il établit aussi que la lumière de la lune vient du soleil. C'est 
aussi lui qui a contredit Ptolémée sur le fait que l'oeil émettrait de la lumière. 
Selon lui, si l'oeil était conçu de cette façon on pourrait voir la nuit. Il a compris 
que la lumière du soleil était diffusée par les objets et ensuite entrait dans l'oeil. 
En astronomie il a tenté de mesurer la hauteur de l'atmosphère et a trouvé que le 
phénomène du crépuscule est dû à un phénomène de réfraction. Il parla 
également de l'attraction des masses et on croit qu'il connaissait l'accélération 
gravitationnelle. Alhazen a devancé de quelques siècles plusieurs découvertes 
faites par des scientifiques occidentaux pendant la Renaissance. Il fut un des 
premiers à se servir d'une méthode d'analyse scientifique et influença grandement 
des scientifiques comme Roger Bacon et Kepler. 


Jacobi, Carl (1804-1851) né à Potsdam et décédé à Berlin fut, avec N. H. Abel, 
le fondateur de la théorie des fonctions elliptiques dont il donna de nombreuses 
applications aux branches les plus diverses des mathématiques. On lui doit 
également des exposés de mécanique théorique où il reprend les résultats de W. 
R. Hamilton, et des applications de la théorie des équations différentielles à la 
dynamique. À son entrée au gymnase, en 1816, Jacobi avait déjà achevé le cycle 
des études secondaires et, assez réfractaire à l'enseignement traditionnel, il étudia 
directement les oeuvres des grands mathématiciens, particulièrement celles 
d'Euler et de Lagrange. Inscrit en 1821 à l'université de Berlin, il y apprit la 
philologie et la mathématique, à laquelle il se consacra bientôt uniquement. En 
1825 il était docteur en philosophie avec une thèse où il démontrait ou généralisait 
certaines formules de Lagrange. Il enseigna à Berlin pendant une année environ, 
puis à Koenigsberg où il fut transféré par décision ministérielle. Fin 1827, il fut 
nommé professeur extraordinaire à l'université de cette ville où il entra en contact 
avec l'astronome Friedrich Wilhelm Bessel. Pensionné par le gouvernement de 
Prusse, il fut, après un voyage en Italie, en 1843, nommé académicien à Berlin, 
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dispensé de tout enseignement mais autorisé à traiter, à l'Université, tout sujet qui 
lui conviendrait. Présenté comme candidat aux élections de mai 1848, il fut 
persécuté un temps pour ses opinions libérales. Jacobi consacra de nombreux 
travaux à la transformation des intégrales et apporta une contribution essentielle à 
la théorie des équations différentielles et des équations aux dérivées partielles. 
C'est à cela que se rattachent ses apports au calcul des variations, à la dynamique 
des solides et à la mécanique céleste -problème des trois corps, perturbations des 
mouvements planétaires. L'algèbre lui doit d'importantes recherches sur les 
formes quadratiques et une exposition devenue classique de la théorie des 
déterminants, prélude au mémoire sur les déterminants fonctionnels appelés de 
nos jours "jacobiens". Il perfectionne la théorie de l'élimination et enseigne à 
représenter les racines d'une équation algébrique par des intégrales définies ou par 
des séries. Il étudie les points communs aux courbes et aux surfaces algébriques, 
et trouve directement le nombre des tangentes doubles d'une courbe plane, établi 
déjà par J. Plücker en utilisant la dualité. 


Jordan, Camille (1838-1921) né à Lyon et décédé à Paris fut le spécialiste 
indiscuté de la théorie des groupes pendant toute la fin du 19ème siècle et on lui 
doit de très nombreux résultats, tant sur les groupes finis que sur les groupes dits 
classiques, dont il fut le premier à mesurer toute l'importance. Ses cours d'analyse 
contribuèrent au développement de la théorie des fonctions de variable réelle. En 
1855, à 17 ans, il est reçu premier à l'École polytechnique et sort de l'École des 
Mines en 1861. Il sera, du moins en titre, ingénieur chargé de la surveillance des 
carrières de Paris jusqu'en 1885, ce qui n'empêchera pas une intense activité de 
recherche mathématique. Nommé examinateur à l'École polytechnique en 1873, 
puis professeur en 1876, il entre à l'Académie des sciences en 1881 puis succède à 
Joseph Liouville au Collège de France deux années plus tard. De 1885 à 1921, il 
assume la direction du Journal de mathématiques pures et appliquées fondé par 
Liouville. Malgré les efforts de Liouville, l'oeuvre d'Évariste Galois était restée à 
peu près totalement inconnue du monde des mathématiques (seul Leopold 
Kronecker avait utilisé certains de ses résultats), et c'est à Jordan, avec son Traité 
des substitutions et des équations algébriques, publié à Paris en 1870, que l'on 
doit le premier exposé systématique de théorie des groupes, enrichi de dix années 
de recherches personnelles. Il s'y limite aux groupes finis, plus précisément aux 
groupes de permutations, et introduit de nombreux concepts nouveaux. Dans des 
mémoires ultérieurs, Jordan étudie en détail, essentiellement du point de vue des 
facteurs de composition, le groupe linéaire et les groupes orthogonaux et 
symplectiques sur un corps premier. Les études de Jordan sur le groupe linéaire 
font intervenir des considérations sur la réduction des matrices, et, en particulier, 
la forme dite "forme de Jordan”. Indiquons enfin les efforts de Jordan pour 
déterminer tous les groupes résolubles finis en réponse au problème, posé par 
Niels Henrik Abel, de rechercher toutes les équations de degré donné résolubles 
par radicaux. En plus des résultats donnés ci-dessus relatifs au groupe linéaire, on 
doit à Jordan un exposé complet de la géométrie euclidienne réelle à n dimensions 
par des méthodes entièrement analytiques. L'enseignement de Jordan à l'École 
polytechnique, puis au Collège de France, l'amène à préciser de nombreuses 
notions de la théorie des fonctions de variable réelle et son Cours d'analyse de 
l'École polytechnique, dont la première édition date de 1880, contribuera à 
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former des générations de mathématiciens. On lui doit aussi la notion de fonction 
à variation bornée, qui lui permet de donner une définition correcte de la longueur 
d'une courbe et d'obtenir sous sa forme générale le théorème de convergence des 
séries de Fourier ; mais le résultat le plus célèbre est celui qui affirme qu'une 
courbe fermée simple (dite, de nos jours, "courbe de Jordan") sépare le plan en 
deux régions. Signalons enfin, pour terminer, que Jordan, précurseur de Poincaré, 
a écrit plusieurs mémoires d'Analysis situs, c'est-à-dire sur la topologie 
combinatoire. On lui doit une démonstration, devenue classique, du théorème 
d'Euler sur les polyèdres et le fait que deux surfaces de même genre sont 
applicables l'une sur l'autre (ce qui, comme l'a montré Poincaré, n'est pas vrai en 
général pour les hypersurfaces). 


Jordan, Pascual (1902 - 1980) né à Hanovre et décédé à Hamburg est un 
physicien théoricien allemand, professeur à l'université de Gôttingen. Jordan passa 
dès 1921 une partie de ses études à l'université technique de Hanovre où il étudia 
un mélange de zoologie, de mathématique et physique. En 1923 il se spécialisa 
lors de son entreée à l'université de Gôttingen, qui était alors à son zénith tant du 
point de vue de la mathématique que de la physique. À Gôttingen, Jordan devint 
assistant de Richard Courant et surtout de Max Born qui l'influenca grandement. 
Il contribua ainsi de façon décisive à la fondation de la mécanique quantique et de 
la théorie quantique des champs. En raison de son affiliation au parti nazi, il fut 
cependant isolé de la communauté physicienne. En 1925, avec Max Born, Jordan 
écrit la relation de commutation canonique entre la quantité de mouvement et la 
position. Dans ce même article, il propose également l'idée qu'il faut aussi 
quantifier le champ électromagnétique, ouvrant la voie à la théorie quantique des 
champs. En 1925 également, avec Max Born et Werner Heisenberg, Jordan 
développe la formulation matricielle de Heisenberg de la mécanique quantique. Ils 
introduisent les transformations canoniques, la théorie des perturbations, le 
traitement des systèmes dégénérés, et enfin la fameuse relation de commutation 
canonique des composantes du moment cinétique. 


à Joule, James Prescott (1818-1889), physicien britannique, né à Salford, dans le 
Lancashire et décédé à Sale. Il fut l'un des plus grands physiciens de son époque. 
e Joule est célèbre pour ses travaux de recherche en électricité et en 
- thermodynamique. Au cours de ses recherches sur la chaleur émise dans un 
L circuit électrique, il formula la loi, connue sous le nom de loi de Joule, sur la 
chaleur électrique, qui indique que la quantité de chaleur produite chaque 
seconde dans un conducteur par le passage du courant électrique est 
proportionnelle à la résistance électrique du conducteur et au carré du courant 
électrique. Joule a vérifié expérimentalement la loi de la conservation de l'énergie 
dans son étude sur la transformation de l'énergie mécanique en énergie thermique 
(relation entre joules et calories: il faut 1 calorie, soit 4.18 joules pour augmenter 
1 gramme d'eau de 1 degré). 
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Kepler, Johannes (1571-1630), astronome et physicien allemand, célèbre pour sa 
formulation et sa vérification des trois lois du mouvement planétaire. Ces lois sont 
maintenant connues sous le nom de "lois de Kepler". Son principal traité contient 
les formulations de deux des lois du mouvement planétaire. La première stipule 
que les planètes se déplacent selon des orbites elliptiques avec le Soleil comme 
foyer et la seconde, ou "loi des aires", énonce que la ligne imaginaire que l'on 
tracerait entre le Soleil et une planète balaie des aires identiques d'une ellipse 
pendant des intervalles de temps égaux; en d'autres termes, plus la planète se 
rapproche du Soleil, plus elle se déplace rapidement. Un autre traité contient une 
autre découverte sur le mouvement planétaire: le cube de la distance entre une 
planète et le Soleil divisé par la période orbitale de cette planète au carré est une 
constante et est la même pour toutes les planètes. Le mathématicien et physicien 
anglais Isaac Newton se reposa fortement sur les théories et les observations de 
Kepler pour formuler sa théorie de la force gravitationnelle. Kepler apporta 
également sa contribution dans le domaine de l'optique et développa en 
mathématiques un système infinitésimal qui fut le précurseur du calcul 
infinitésimal. 


Keynes, John Maynard (1883-1946) était un économiste britannique. Il est le 
fondateur du "keynésianisme", doctrine économique qui encourage l'intervention 
de l'État au sein de l'économie, pour assurer le plein-emploi. Keynes est né dans 
une famille d'universitaires. À 7 ans, il entra à Perse School. Deux ans plus tard, il 
entrait en classe préparatoire à St Faith's. Avec les années, il se montra très 
prometteur et en 1894, il termina premier de sa classe et reçut un prix pour la 
première fois en mathématiques. Un an plus tard, il intègre l'Eton College où il 
brille et gagne, en 1899 et en 1900, le prix de mathématiques. En 1901, il finit 
premier en mathématiques, histoire et anglais. En 1902, il gagne sa place pour le 
King's college de Cambridge. Keynes est sans aucun doute une importante figure 
de l'histoire de la science économique qu'il révolutionna avec son oeuvre 
principale, la Théorie générale de l'emploi, de l'intérêt et de la monnaie parue en 
1936. L'ouvrage est considéré comme le traité de science sociale le plus influent 
du 20ème siècle dans la mesure où il a rapidement et continuellement modifié la 
façon dont le monde a considéré l'économie et le rôle du pouvoir politique dans la 
société. Certains estiment qu'aucun autre ouvrage n'a eu une telle importance 
depuis en Europe, bien que l'ouvrage de Friedrich Hayek qui lui valut son Prix 
Nobel, The Road to Serfdom, fasse la démonstration fulgurante des limites de la 
théorie keynésienne. Avec la Théorie générale, Keynes a développé une théorie 
qui pouvait expliquer le niveau de la production et par conséquent de l'emploi ; le 
facteur déterminant étant la demande. Parmi les concepts révolutionnaires 
apportés par Keynes, on retiendra surtout: ceux de l'équilibre de sous-emploi où le 
chômage est possible pour un niveau donné de la demande effective, l'absence de 
mécanisme de régulation par les prix afin de résorber le chômage, une théorie de 
la monnaie fondée sur la préférence pour la liquidité, l'introduction de l'incertain 
et des prévisions, la notion d'efficacité marginale de l'investissement brisant la loi 
de Say (et renversant donc le lien de causalité épargne-investissement). Ces 
concepts accréditent la possibilité de politiques interventionnistes pour éliminer 
les récessions et freiner les surchauffes économiques. L'ensemble de ces concepts 


constitue ce qu'on appelle aujourd'hui la macroéconomie. 
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Kirchhoff, Gustav Robert (1824-1887) né à Kônisberg (aujourd'hui Kaliningrad 
en Russie) et décédé à Berlin, Kirchhoff étudie la physique-mathématique auprès 
de Franz Neumann. Après un doctorat en 1847, il devient conférencier à 
l'université de Berlin avant d'obtenir, en 1850, le poste de professeur de physique 
extraordinaire à l'université de Breslau. C'est là qu'il fait la connaissance du 
chimiste Robert Wilhelm Bunsen, avec qui il sera amené à travailler de 
nombreuses années. Leur collaboration se poursuivra en effet au-delà de 1854, 
date à laquelle Kirchhoff est nommé à professeur de physique à l'université de 
Heidelberg. Élu vice-recteur de cette même université en 1865, il finit par 
accepter une chaire de physique théorique à Berlin en 1875. Kirchhoff est encore 
étudiant lorsqu'il commence à s'intéresser aux problèmes liés à l'électricité. En 
1845, il établit la notion de potentiel électrique et énonce les lois de réseaux qui 
portent son nom (loi des noeuds, loi des mailles). Il généralise la loi d'Ohm sur le 
courant électrique à des conducteurs à trois dimensions et, plus tard, montre que 
le passage du courant à travers un conducteur se fait à la vitesse de la lumière. Sa 
rencontre avec Bunsen aboutit à la naissance de la spectroscopie. Ensemble, les 
deux chercheurs découvrent le caractère spécifique du spectre de la lumière 
émise par chaque corps chimique. Grâce à ce nouvel outil d'analyse, ils dépistent 
deux éléments encore inconnus: le césium (1860) et le rubidium (1861). La mise 
au point du spectroscope à prisme, pour analyser la lumière de substances en 
combustion, permet également à Kirchhoff d'établir la loi du rayonnement: le 
rapport des pouvoirs d'émission et d'absorption d'un corps, indépendant des 
propriétés de ce corps, est fonction de la température et de la longueur d'onde. Le 
pouvoir d'émission est ainsi proportionnel à celui du "corps noir", défini par 
Kirchhoff (1862) comme le corps parfaitement absorbant. Cette loi, qui explique 
notamment la présence des raies sombres d'absorption (dites "raies de 
Fraunhofer") dans le spectre de rayonnement solaire, marque le début d'une 
nouvelle ère en astrophysique et annonce l'avènement de la théorie des quanta de 
Planck. 


Klein, Félix (1849-1925) fit ses études à Bonn, à Gôttingen et à Berlin. En 1872, 
il devint professeur de mathématiques à l'université d'Erlangen, où son cours 
inaugural fut l'énoncé des grandes lignes de son fameux programme d'Erlangen. Il 
enseigna ensuite à Munich (1875-1880), puis à l'université de Leipzig 
(1880-1886) et enfin à Gôttingen (1886-1913). À partir de 1872, il édita les 
Mathematische Annalen de Gôttingen et fonda, en 1895, la grande Encyclopédie 
mathématique, dont il supervisa la rédaction jusqu'à sa mort, à Gôttingen. Il fut le 
chef incontesté de l'école mathématique allemande, et son influence fut très 
grande (il donna de nombreuses conférences à l'étranger, dont les États-Unis), 
notamment sur le développement de la géométrie, grâce à son programme 
d'Erlangen. Avec le texte, publié dans son ouvrage Gesammelte mathematische 
Abhandlungen (1921-1923), Klein donne une définition de la géométrie englobant 
aussi bien la géométrie classique (c'est-à-dire euclidienne) que la géométrie 
projective, les géométries non euclidiennes, etc., mettant fin aux controverses 
stériles entre partisans de la géométrie synthétique et ceux de la géométrie 
analytique. Pour lui, une géométrie est l'étude des propriétés invariantes par un 
groupe donné de transformations: ainsi les théorèmes de géométrie classique sont 
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l'expression de relations entre invariants du groupe des similitudes ; ceux de la 
géométrie projective entre covariants du groupe projectif. On doit aussi à Klein 
d'importants travaux sur l'équation différentielle hypergéométrique, sur les 
fonctions abéliennes, sur le groupe de l'icosaèdre régulier (Lectures on the 
Icosahedron, 1914), sur les fonctions elliptiques, à partir desquelles il dégage la 
notion de fonction modulaire (Vorlesungen über die Theorie der automorphen 
Funktionen, 1897-1902). 


Kolmogorov, Andreï (1903-1987) est un mathématicien russe dont les apports en 
mathématiques sont considérables. Kolmogorov est né à Tambov. Sa mère 
célibataire mourut à sa naissance et il fut élevé par sa tante avec les économies de 
son grand-père. On pense que son père fut tué lors de la Guerre civile russe. 
Kolmogorov fut scolarisé à l'école du village de sa tante, et ses premiers efforts 
littéraires et articles mathématiques furent imprimés dans le journal de l'école. 
Adolescent, il conçut des machines à mouvement perpétuel, cachant tellement 
bien leurs défauts intrinsèques que ses professeurs d'enseignement secondaire 
n'arrivaient pas à les découvrir. En 1910, sa tante l'adopta et ils déménagèrent à 
Moscou, où il intégra un Gymnasium et y obtint son diplôme en 1920. Après avoir 
terminé ses études secondaires, il suit les cours à l'Université de Moscou et à 
l'institut Mendeleïev. Il étudie non seulement les mathématiques, mais aussi 
l'histoire russe et la métallurgie. En 1922, Kolmogorov publie ses premiers 
résultats concernant la théorie des ensembles et, en 1923 il publie ses travaux sur 
la théorie de l'intégration, sur l'analyse de Fourier et pour la première fois sur la 
théorie des probabilités et commence à devenir connu à l'étranger. Après la fin de 
ses études supérieures en 1925, il commence son doctorat auprès de Nikolaï 
Louzine, qu'il termine en 1929. En 1931, il reçoit une chaire de professeur à 
l'Université de Moscou. En 1933, paraît en allemand son manuel des Fondements 
de la théorie des probabilités dans lequel il présente son axiomatisation du calcul 
des probabilités ainsi qu'une manière adaptée à traiter les processus stochastiques. 
La même année, il devient directeur de l'Institut de mathématiques de l'Université 
de Moscou. En 1934, il publie son travail sur la cohomologie et obtient, grâce à 
cette thèse, le titre de docteur en mathématique et en physique. Il obtient des 
récompenses des autorités soviétiques, comme l'Ordre de la science socialiste 
(1940), le prix Staline (1941) et plusieurs fois le prix Lénine. En 1941, il élabore 
une théorie fameuse de la turbulence des fluides. En 1953 et 1954, il décrit la 
théorie KAM (Kolmogorov-Arnold-Moser) de stabilité des systèmes dynamiques 
(un système mécanique complexe exactement soluble est stable si on le perturbe 
seulement un tout petit peu). Il introduit également la notion d'entropie métrique 
pour les systèmes dynamiques mesurés. En 1955, il devient docteur honoris causa 
de la Sorbonne. En 1962, il reçoit le Prix Balzan pour les mathématiques. 


Kronecker, Leopold (1823-1891) était un mathématicien allemand qui nous 
apparaît comme l'un des plus grands arithméticiens du 19ème siècle et l'un des 
fondateurs de la grande théorie des nombres algébriques. Ses travaux sur le corps 
de classes dans un cas particulier ont préparé ceux de Hilbert. Né à Liegnitz, dans 
une famille de riches commerçants, Kronecker suivit au gymnase les cours d'Ernst 
Kummer, qu'il devait retrouver plus tard comme professeur à l'université de 
Breslau, puis comme collègue à Berlin, et qui, avec Peter Gustav Lejeune- 
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Dirichlet, devait avoir l'influence la plus profonde sur le développement de sa 
pensée. Après avoir soutenu, en 1845, une thèse très originale sur les unités des 
corps cyclotomiques, il s'occupa pendant plusieurs années des affaires familiales, 
et ne put se livrer entièrement de nouveau aux recherches mathématiques qu'à 
partir de 1853. Élu, en 1860, membre de l'Académie des sciences de Berlin, il 
donna, à partir de cette époque, des cours libres à cette université, où il fut 
nommé professeur titulaire en 1883 et où il acheva sa vie. Bien que maniant avec 
virtuosité toutes les ressources de l'analyse (comme le montrent ses travaux sur 
les fonctions elliptiques, les séries de Dirichlet ou encore sa formule intégrale 
donnant le nombre des racines d'un système d'équations dans un espace à n 
dimensions), Kronecker est avant tout un algébriste et un arithméticien. Vers la fin 
de sa vie, il professait une doctrine tendant à rejeter l'infini actuel des 
mathématiques en ne gardant comme valable que ce qui pouvait être uniquement 
fondé sur les nombres entiers (ses polémiques avec Cantor sont restées célèbres). 
En algèbre, Kronecker fut l'un des animateurs les plus actifs du groupe de 
mathématiciens qui, dans les années 1860-1890, achevèrent de mettre sur pied 
l'algèbre linéaire et multilinéaire inaugurée par Arthur Cayley et Hermann 
Grassmann aux alentours de 1845. C'est ainsi qu'il reprit et compléta les travaux 
de Karl Weierstrass et fut l'un des premiers à comprendre et à utiliser les travaux 
d'Évariste Galois (publiés en 1846). 


Lagrange, Joseph Louis de (1736-1813), né à Turin et décédé à Paris, était 
comme l'un des plus grands mathématicien et astronome du 18ème siècle. Élève 
brillant issu d'un milieu aisé, il étudie au collège de Turin. Il prend goût pour les 
mathématiques par hasard à l'âge de 17 ans après la lecture d'un mémoire de 
Edmund Halley portant sur les applications de l'algèbre en optique. Le sujet 
l'intéresse au plus haut point. Dès lors, il se passionne pour les mathématiques 
qu'il étudie seul et assidûment. Il devient rapidement un mathématicien confirmé 
et ses premiers résultats ne se font pas attendre. Dans une lettre adressée à 
Leonhard Euler il jette les bases du calcul variationnel. Cet échange est le début 
d'une longue correspondance entre les deux hommes. Lagrange a alors 19 ans et 
enseigne à l'école d'artillerie de Turin où il fut nommé en 1755. Il fonde en 1758 
l'Académie des Sciences de Turin qui publiera ses premiers résultats sur 
l'application du calcul variationnel à des problèmes de mécanique (propagation du 
son, corde vibrante...). En 1764, ses travaux sur les librations de la Lune (petites 
variations de son orbite) sont récompensés par le Grand Prix de l'Académie des 
Sciences de Paris. Il introduisit de nouvelles méthodes pour le calcul des 
variations et pour l'étude des équations différentielles, qui lui permirent de donner 
un exposé systématique de la mécanique dans son célèbre ouvrage Mécanique 
analytique (1788). Il travailla sur la théorie additive des nombres. On lui doit le 
théorème sur la décomposition d'un entier en quatre carrés. Dans l'étude des 
équations algébriques, il introduisit des concepts qui conduiront à la théorie des 
groupes développée plus tard par Abel et Galois. En physique, en précisant le 
principe de moindre action, avec le calcul des variations, vers 1756, il invente la 
fonction de Lagrange, qui vérifie les équations de Lagrange, puis développe la 
mécanique analytique, vers 1788, pour laquelle il introduit les multiplicateurs de 
Lagrange. Il entreprend aussi des recherches importantes sur le problème des trois 
corps en astronomie, un de ses résultats étant la mise en évidence des points de 
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libration (dits points de Lagrange) (1772). 


Langevin, Paul (1872-1946) Physicien français né et décédé à Paris. Très jeune, 
Langevin manifeste des dons exceptionnels. Encouragé par ses instituteurs, il 
parcourt rapidement les divers échelons de l'enseignement obligatoire avant 
d'entrer à 16 ans à l'École supérieure de physique et de chimie industrielle de la 
Ville de Paris. Langevin y suit les cours et l'enseignement de laboratoire de Pierre 
Curie, avec lequel il se lie d'amitié. À sa sortie de l'École, il renonce à la carrière 
d'ingénieur et décide, sur les conseils de Pierre Curie, de se consacrer à la 
recherche et à l'enseignement. Aussi, se présente-t-il à l'École Normale Supérieure 
où il est reçu premier en 1894. En 1897, il bénéficie d'une bourse pour aller 
travailler un an au Cavendish Laboratory de Cambridge, haut lieu de la science 
européenne où se trouvent alors E. Rutherford et J. J. Thomson. De retour en 
France, il soutient sa thèse en 1902, est nommé professeur suppléant, puis 
professeur au Collège de France. En 1904, il succède à Pierre Curie à l'École de 
physique et de chimie, dont il devient directeur en 1925. L'oeuvre de Langevin se 
situe dans cette longue période de transition qui, de 1900 à 1930, mène de la 
physique classique à la physique moderne, dominée par la théorie de la relativité 
et la théorie quantique. Ses premiers travaux (sur l'ionisation des gaz) l'amènent à 
élaborer en 1905 son modèle théorique majeur, qui devrait par la suite servir de 
base à de nombreuses autres explications des propriétés macroscopiques de la 
matière, dans lequel les électrons à l'intérieur des atomes décrivent des orbites 
fermées, conférant ainsi aux atomes des propriétés analogues à celles de petits 
aimants. En 1906 il aboutit au résultat étonnant selon lequel l'inertie serait une 
propriété de l'énergie, du moins dans le cas de l'électron. Ce n'est que quelques 
mois plus tard qu'il lira le mémoire d'Einstein sur la théorie de la relativité 
restreinte à laquelle il va consacrer son enseignement dans ses cours au Collège 
de France. Langevin est aussi à l'origine des fameux congrès Solvay qui, dès 1911, 
réunirent périodiquement tous les grands noms de la physique, et où furent 
largement discutés les concepts de la théorie quantique. C'est d'ailleurs grâce à 
Langevin que les travaux de son élève Louis de Broglie sur la mécanique 
ondulatoire connurent la diffusion qu'ils méritaient: d'abord étonné, Langevin fut 
très vite convaincu de la justesse des idées de De Broglie et inscrivit 
immédiatement la nouvelle mécanique ondulatoire au programme de son cours au 
Collège de France. Fidèle à l'idéal de clarté pédagogique qui fut toujours le sien, 
Langevin a par ailleurs effectué, sur les concepts encore en gestation de la théorie 
quantique, un travail d'analyse et de refonte épistémologiques dont on mesure 
aujourd'hui l'importance. 


Laplace, Pierre Simon (1749-1827) Né à Beaumont-en-Auge et décédé à Paris, 
fils de cultivateur, Laplace s'initia aux mathématiques à l'École militaire de cette 
petite ville. Il y commença son enseignement. Il doit cette éducation à ses voisins 
aisés qui avaient détecté son intelligence exceptionnelle. À 18 ans, il arrive à Paris 
avec une lettre de recommandation pour rencontrer le mathématicien d'Alembert, 
mais ce dernier refuse de rencontrer l'inconnu. Mais Laplace insiste: il envoie à 
d'Alembert un article qu'il a écrit sur la mécanique classique. D'Alembert en est si 
impressionné qu'il est tout heureux de patronner Laplace. Il lui obtient un poste 
d'enseignement en mathématiques. L'oeuvre la plus importante de Laplace 
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concerne le calcul des probabilités, les équations différentielles (laplacien) et la 
mécanique céleste. Il établit aussi, grâce à ses travaux avec Lavoisier entre 1782 
et 1784 la relation des transformations adiabatiques d'un gaz, ainsi que deux lois 
fondamentales de l'électromagnétisme. En mécanique, c'est avec le mathématicien 
Joseph-Louis de Lagrange, que Laplace résume ses travaux et réunit ceux de 
Newton, Halley, Clairaut, d'Alembert et Euler, concernant la gravitation 
universelle (particulièrement le problème de stabilité du système solaire), dans les 
5 volumes de sa Mécanique céleste (1798-1825). On rapporte (mais c'est très 
probablement une légende) que, feuilletant la Mécanique céleste, Napoléon fit 
remarquer à Laplace qu'il n'y était nulle part fait mention de Dieu. "Je n'ai pas eu 
besoin de cette hypothèse", rétorqua le savant qui n'était par ailleurs pas modeste 
(se considérant - probablement à juste titre - comme le meilleur mathématicien de 
sa génération). Il aussi un des premiers scientifiques à concevoir l'existence des 
trous noirs et la notion de collapsus gravitationnel. 


Laurent, Pierre Alphonse (1813-1854) est un mathématicien français né à Paris 
et qui s'est rendu célèbre pour la découverte de la Série de Laurent dans le 
domaine de l'analyse complexe et qui a un grand impact dans le calcul de 
certaines intégrales en physique. Il est entré à l'École Polytechnique de Paris en 
1830. Laurent a été diplômé en 1832 comme un des meilleurs élèves de l'année et 
entra dans le corps d'ingénierie comme lieutenant. Pendant la gestion de ses 
projets de développement du port du Havre, Laurent écrivait sa première 
publication mathématique sur les séries de Laurent. Cette recherche était 
contenue dans un mémoire soumis au Grand prix de l'Académie des sciences en 
1843, mais sa candidature étant trop tardive, l'article n'a jamais été inscrit au prix. 
Cependant, Cauchy fit une référence dans ses travaux au papier de Laurent 3 
mois plus tard. Le même problème se réitéra pour une autre publication 
importante de Laurent quelques mois plus tard. Après ces événements, Laurent, 
déçu changea de domaine de recherche pour se concentrer sur la physique 
(mathématique appliquée). Cauchy lui propose un poste vacant à l'Académie des 
Sciences en 1846, mais sa candidature ne fut pas retenue. Laurent est décédé à 
Paris, à l'âge de 41 ans. Ses écrits n'ont été publiés qu'après son décès. 


Lavoisier, Antoine Laurent de (1743-1794), chimiste français, considéré comme 
le fondateur de la chimie moderne. Lavoisier naquit à Paris et fit ses études au 
collège Mazarin. Il fut élu membre de l'Académie des sciences en 1768. Il occupa 
de nombreux postes, y compris celui de directeur des Poudreries nationales en 
1776, de membre de la Commission pour l'établissement du nouveau système de 
poids et mesures en 1790 et de secrétaire de la Trésorerie en 1791. Il tenta 
d'introduire des réformes dans le système monétaire et fiscal français, ainsi que 
dans le système agricole. Lavoisier fut l'un des premiers à réaliser des expériences 
chimiques réellement quantitatives. Il montra qu'en dépit du changement d'état de 
la matière au cours d'une réaction chimique, la quantité de matière restait 
constante entre le début et la fin de chaque réaction. Ces expérimentations ont 
fourni des preuves en faveur de la loi de la conservation de la matière. Lavoisier 
fit également des recherches sur la composition de l'eau, dont il appela les 
composants oxygène et hydrogène. L'une des plus importantes expériences de 
Lavoisier concerna la nature de la combustion (ou brûlage). Il démontra ainsi que 
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le processus de combustion implique la présence d'oxygène. Il démontra 
également le rôle de l'oxygène dans la respiration chez les animaux et chez les 
végétaux. Les explications de Lavoisier sur la combustion remplacèrent la 
doctrine du phlogistique. Celle-ci postulait en effet qu'une substance se dégageait, 
le "phlogiston", lorsque la matière se consumait. Étant l'un des vingt-huit fermiers 
généraux, Lavoisier est bêtement stigmatisé comme traître par les révolutionnaires 
en 1794 et guillotiné lors de la Terreur à Paris le 8 mai 1794, à l'âge de 50 ans, en 
même temps que l'ensemble de ses collègues. 


Lebesgue, Henri Léon (1875-1941) né à Beauvais est décédé à Paris est un 
ancien élève de l'E.N.S., il eut Émile Borel comme professeur (à qui l'on doit les 
premiers travaux importants en théorie de la mesure). Après quelques années au 
lycée de Nancy, Lebesgue enseignera à Rennes. C'est pendant cette période qu'il 
se fera connaître par son élégante théorie de la mesure. Professeur à la Sorbonne 
puis au collège de France, il sera élu à l'Académie des sciences en 1922. Par sa 
théorie des fonctions mesurables (1901) s'appuyant sur les tribus boréliennes (du 
nom du mathématicien Émile Borel), Lebesgue a profondément remanié et 
généralisé le calcul intégral. Sa théorie de l'intégration (1902-1904) répond aux 
besoins des physiciens en permettant la recherche et l'existence de primitives pour 
des fonctions "irrégulières". On lui doit aussi la transformée de Fourier établie 
dans la fin des années 30. Il est nommé professeur à la Sorbonne en 1910, puis au 
Collège de France en 1921. Il donne également des cours à l'École supérieure de 
physique et de chimie industrielles de la ville de Paris de 1927 à 1937 et à l'École 
normale supérieure de Sèvres. 


Lee, Tsung-Dao (1926- ) Né à Shanghai (Chine), Lee Tsung-Dao est le fils d'un 
homme d'affaires. La guerre sino-japonaise de 1937-1945 lui fit quitter l'université 
Kweichow dans la province du Zhejiang, pour rejoindre celle de Kunming, dans le 
Yunnan, où il rencontra Yang Chen-Ning, dont il sera longtemps l'ami et le 
collaborateur. Une bourse du gouvernement chinois lui permit de terminer ses 
études à l'université de Chicago (États-Unis), où il soutint sa thèse sur le contenu 
en hydrogène des naines blanches, en 1950. Membre de l'Institute for Advanced 
Study de Princeton (New Jersey) de 1951 à 1953, il devint bientôt, à 29 ans, le 
plus jeune professeur de l'université Columbia, à New York. En 1956, les 
physiciens étaient en butte à une énigme surgie du dépouillement des données 
fournies par l'accélérateur de particules du laboratoire national de Brookhaven, 
près de New York: deux particules, appelées "tau" et "thêta”", semblaient avoir 
même masse et mêmes interactions nucléaires, mais différaient par leurs produits 
de désintégration. Lee et Yang proposèrent qu'elles n'étaient qu'une seule 
particule, maintenant notée "KO", et que l'interaction faible responsable de leur 
désintégration ne respectait pas la symétrie de parité. Ils en conclurent qu'il était 
indispensable de soumettre à vérification expérimentale le fait que l'interaction 
faible distingue la droite de la gauche. Six mois suffirent à l'équipe du National 
Bureau of Standards de Washington, mobilisée par la physicienne chinoise Wu 
Chien-Shiung, pour montrer que des noyaux radioactifs de cobalt 60 polarisés 
émettaient plus d'électrons dans une direction que dans la direction opposée. 
Confirmée rapidement par plusieurs autres groupes expérimentaux, cette violation 
de la symétrie miroir valut à Lee Tsung-Dao et à Yang Chen-Ning de se partager 
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le prix Nobel de physique 1957. 


Legendre, Adrien Marie (1752-1833) mathématicien français né à Paris et 
décédé à Auteil. Il occupe la chaire de Mathématiques de l'école militaire de Paris 
de 1775 à 1780. En 1783, il devient membre de l'académie des sciences. En 1787, 
il est nommé commissaire chargé des opérations géodésiques. Les centres 
d'intérêts de Legendre étaient variés: analyse, théorie des nombres, géométrie, 
statistiques (méthodes des moindres carrés) et mécanique (transformation de 
Legendre en mécanique analytique et thermodynamique). Environ un siècle avant 
que l'on en obtienne les preuves, il conjectura le théorème des nombres premiers 
ainsi que la loi de réciprocité quadratique. Toute sa vie, il s'intéressa aux 
intégrales elliptiques, dont les travaux allaient finalement donner naissance aux 
courbes elliptiques, sujet très étudié par les mathématiciens contemporains. Il 
laisse en héritage à la communauté mathématique du 19ème siècle un traité de 
géométrie élémentaire, qui s'avère très précieux dans le monde de l'enseignement. 


Leibniz, Gottfried Wilhelm (1646-1716) né à Leipzig et décédé à Hanovre était 
philosophe, juriste et mathématicien considéré comme un des plus brillants esprits 
du 17ème siècle. Fils d'un jurisconsulte il obtient son baccalauréat en philosophie 
ancienne en 1663 et écrira un peu plus tard une théorie des probabilités en droit. 
Il entre ensuite à l'université de Leipzig et en 1666 obtient son doctorat en droit. 
En 1669, il devient conseiller à la Chancellerie de l'électorat de Mayence. Il est 
envoyé en 1672 à Paris, en mission diplomatique dit-on, pour convaincre Louis 
XIV de porter ses conquêtes vers l'Égypte plutôt que l'Allemagne. Il y reste 
jusqu'en 1676 et y rencontre les grands savants de l'époque. C'est pendant cette 
période que Leibniz travail sur ses travaux scientifiques. En 1676 il est nommé 
bibliothécaire du Brunswick-Lunebourg et s'y occupe aussi de mathématique, de 
physique, de religion et de diplomatie. Leibniz contribua aux mathématiques en 
découvrant, en 1675, les principes fondamentaux du calcul infinitésimal. Cette 
découverte fut réalisée indépendamment des découvertes de Newton, qui inventa 
son système de calcul en 1666. Le système de Leibniz fut publié en 1684, celui de 
Newton en 1687, date à laquelle la méthode de notation imaginée par Leibniz fut 
adoptée et on le considère aussi comme un pionnier du développement de la 
logique mathématique. 


Landau, Lev Davidovich (1908-1968) est né en Azerbaïdjan et est le fils d'un 
ingénieur et médecin. Il est décédé à Moscou. Après avoir achevé ses études au 
Département de Physique de l'Université de Léningrad à l'âge 19 ans, il 
commence sa carrière scientifique à l'Institut Physico-technique de Léningrad. De 
1932 à 1937 il est le chef du Département Théorique de l'Institut Physico- 
technique Ukrainien à Kharkov et dès 1937 il est nommé chef du Département 
Théorique de l'Institut pour les Problèmes Physiques de l'Académie des Sciences 
de l'URSS à Moscou. Le travail de Landau couvre toutes les branches de physique 
théorique, aux limites de la mécanique liquide à la théorie des champs quantiques. 
Une grande partie de ses papiers se réfère à la théorie de l'état condensé. Ils ont 
commencé en 1936 par une formulation d'une théorie générale des transitions de 
phase du deuxième ordre. Après la découverte de Kapitsa, en 1938, de la 
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superfluidité de l'hélium liquide, Landau a engagé la vaste recherche qui l'a mené 
à la construction de la théorie complète des liquides quantiques aux températures 
très basses. Parmi ses écrits, couvrant une vaste gamme de thèmes liés aux 
phénomènes physiques, on relève plus de cent articles et de nombreux livres, dont 
le célèbre Cours de physique théorique, publié en 1943 avec E.M.Lifchitz. 
Landau a dominé toute la physique théorique de 1930 à 1965. Il avait créé un 
ensemble d'examens de physique théorique, appelé le “Minimum théorique”que 
les étudiants ou chercheurs confirmés devaient passer pour entrer dans son 
groupe de recherche, examen qui incluait des problèmes dans toutes les branches 
des mathématiques. 


Levi-Civita, Tullio (1873-1941) Né à Padoue et décédé à Rome. Il fut diplômé 
en 1892 de la faculté de mathématiques de l'Université de Padoue. En 1894, il 
obtint un diplôme d'enseignement au Collège d'enseignement de la faculté des 
sciences de Pavie. En 1898, il fut nommé à la tête de la chaire de mécanique 
analystique et céleste de Padoue et il y rencontra Libera Trevisani, une de ses 
élèves, avec qui il se maria en 1914. Il resta à Padoue jusqu'en 1918, puis fut 
nommé à la chaire d'analyse supérieure à l'université de Rome, où il prit 2 ans plus 
tard la chaire de mécanique. Avant tout physicien,ses travaux s'orientent 
principalement vers l'électromagnétisme et les théories de Lorentz et de Maxwell. 
En 1900, Ricci et lui publièrent La Théorie des tenseurs dans les méthodes de 
calcul différentiel et leurs applications qu'Einstein utilisa afin de mieux maîtriser 
le calcul tensoriel, un outil-clef pour Einstein dans le développement de sa théorie 
de la relativité générale. Levi-Civita discuta aussi d'une série de problèmes à 
propos du champ gravitationnel statique dans sa correspondance avec Einstein 
entre les années 1915-1917. Leur correspondance tournait autour de la 
formulation variationnelle des équations de champs gravitationnelles et leurs 
propriétés covariantes, et la définition de l'énergie gravitationnelle et de 
l'existence d'ondes gravitationnelles. En 1933 Levi-Civita contribua aussi aux 
équations de la mécanique quantique de Dirac. 


Lie, Sophus (1842-1899), mathématicien norvégien Lie fit ses études à 
l'université de Christiana. Il donna des leçons particulières pour gagner sa vie, et 
passa avec Klein l'hiver 1869-1870 à Berlin, l'été 1870 à Paris. En 1872, une 
chaire de mathématiques fut créée pour lui à Christiana, et en 1886, il succéda à 
Klein à Leipzig. Outre des travaux en géométrie projective de l'espace, on retient 
surtout de Lie l'étude de structures algébriques nouvelles qu'il applique à la 
géométrie, jusqu'à la création de toutes pièces de la théorie des groupes et 
algèbres qui portent son nom. Dans la notion de groupe et d'algèbre de Lie, 
interviennent des propriétés de continuité (groupe topologique), annonçant la 
nouvelle branche importante des mathématiques que sera la topologie. Les 
travaux de Lie, dans ce domaine, seront principalement poursuivis par Élie 
Cartan. 
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Lindemann von, Ferdinand (1852-1939) né à Hanovre et décédé à Münich a été 
le premier mathématicien à démontrer la transcendance de Pi. Quand Ferdinand 
était âgé de 2 ans se déplaça à Schwerin où il passa ses années d'enfance et sa 
scolarité primaire. Comme il était de pratique à cette époque en Allemagne 
pendant la seconde moitié du 19ème, Lindemann se déplaça fréquemment d'une 
université à l'autre. Il commença ses études à Güttingen en 1870 et y fut 
grandement influence par Clebsch. Plus tard, Lindemann qui avait établi des très 
bonnes relations avec Clebsch rédigea à nouveau les notes de géométrie de ce 
dernier après son décès pour leur publication en 1876. Ensuite, Lindemann étudia 
à Erlangen à Münich où il effectua son travail de doctorat sous la direction de 
Klein sur les géométries non-euclidiennes et ses applications à la physique. Après 
avoir obtenu son doctorat, Lindemann fit des visites importantes à des centres de 
mathématiques anglais et français. En Angleterre, il visita Oxford, Cambridge et 
Londre, alors qu'en France, il passa la majeure partie de son temps à Paris où il fut 
grandement influencé par Chasles, Bertrand, Jordan et Hermite. Lorsqu'il retourna 
en Allemagne, Lindemann travailla sur des publications permettant sa 
réintégration et sa reconnaissance dans le domaine scientifique Allemand. Ce fut 
enfin en 1877 qu'il fut nominé professeur extraordinaire à l'université de 
Würzburg et professeur ordinaire à l'université de Freiburg en 1879. Le principal 
travail de Lindemann porta sur la géométrie et l'analyse et il est particulièrement 
connu pour la fameuse preuve de transcendance. En 1873, alors que Lindemann 
venait d'avoir obtenu son doctorat, Hermite démontra la transcendance du 
nombre d'Euler. Peu de temps après, Lindemann rencontra Hermite à Paris et 
discuta des méthodes utilisées pour la démonstration. Ainsi, utilisant un 
raisonnement similaire, Lindemann démontra en 1882 la transcendance de Pi (sur 
la base que le nombre d'Euler est lui-même transcendant). 


Liouville, Joseph (1809-1882) né à St-Omer et décédé à Paris fut un artisan des 
mathématiques déployant une activité considérable dans l'enseignement et la 
diffusion des idées mathématiques de son temps. Il est le fondateur du Journal de 
mathématiques pures et appliquées appelé traditionnellement "Journal de 
Liouville". Ses principaux travaux portent sur l'analyse et on lui doit un important 
théorème sur l'approximation des irrationnels algébriques. L'élection de Joseph 
Liouville à l'Assemblée constituante de 1848 est seule à rompre l'unité d'une 
carrière toute scientifique: sorti de l'École polytechnique en 1827, il y revenait en 
1833 comme répétiteur puis professeur d'analyse. Dès sa 31ème année, il était élu 
à l'Académie des sciences, dans la section d'astronomie. Il fut un des meilleurs 
professeurs de son temps, et ses cours, à Polytechnique et au Collège de France, 
prirent une grande part de son activité. Liouville fonda le Journal de 
mathématiques pures et appliquées en 1836 et le géra pendant 39 ans. Ses tâches 
d'académicien et d'éditeur lui ôtèrent la liberté d'esprit nécessaire à une recherche 
approfondie ce pour quoi il se plaint. Mais il mit à profit l'une et l'autre tâche pour 
aider plusieurs jeunes mathématiciens de grand avenir, par exemple C. Hermite et 
C. Jordan, par des rapports élogieux devant l'Académie, ou par la publication de 
leurs travaux dans son journal. Quant à lui, il y publia surtout de courtes notes sur 
un grand nombre de questions: analyse, arithmétique, géométrie, mécanique, 
astronomie. Il partage avec A. Cauchy le mérite d'avoir soumis l'analyse à une 
règle de rigueur souvent transgressée au 18ème siècle, et ce mérite est d'autant 
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plus grand que le langage mathématique de son temps n'aidait guère à la rigueur. 


Lobatchevski, Nikolaï Ivanovitch (1792-1856) Mathématicien russe né à Nijni- 
Novgorod et décédé à Kazan. Lobatchevski étudia à l'université de Kazan, où il 
enseigna à partir de 1812 et occupa la chaire de mathématiques pures de 1822 à 
1846. Sous l'influence de Gauss et de Laplace, ses premiers travaux sont: Théorie 
du mouvement elliptique des corps célestes et De la solution de l'équation 
algébrique complexe simple. Mais ses principales recherches concernent la 
géométrie. Son premier ouvrage, Géométrie (1823), jugé trop révolutionnaire (il 
utilisait le système métrique), ne pourra être publié de son vivant. En 1826, 
Lobatchevski expose devant ses collègues de l'université un mémoire qui montre 
qu'il fut l'un des premiers mathématiciens à être convaincu de la possibilité d'une 
géométrie différente de celle d'Euclide. Malgré le scepticisme de ses collègues, il 
continue l'étude de cette nouvelle géométrie (où le postulat d'Euclide est remplacé 
par le postulat suivant, dit "postulat de Lobatchevski": par tout point extérieur à 
une droite, il passe une infinité de parallèles à cette droite) et consacre sa vie de 
mathématicien à essayer de convaincre le monde scientifique. Il publie 
successivement Éléments de géométrie (1829), Nouveaux Éléments de géométrie 
avec la théorie complète des parallèles (1838) et Pangéométrie (1855). Mais la 
pleine reconnaissance de la valeur de ses travaux ne viendra qu'après sa mort 
(lorsque Eugenio Beltrami, en 1868, construira un modèle de la géométrie de 
Lobatchevski: la pseudo-sphère). En plus de ses recherches mathématiques, 
Lobatchevski fut l'animateur de l'université de Kazan: recteur de 1827 à 1846, il 
eut la charge de la bibliothèque de l'université, mit en place son observatoire, 
organisa son muséum et dirigea la construction de nouveaux locaux universitaires. 


LPRELE l'ŒTCLA 


Lorentz, Hendrik (1853-1928) né à Arnhem et décédé à Haarlem (Pays-Bas) a 
amélioré la théorie électromagnétique de Maxwell dans sa thèse doctorale sur la 
théorie de la réflexion et la réfraction de la lumière qu'il présenta en 1875. Il a été 
nommé professeur de physique-mathématique à l'université de Leyde en 1878. Il 
est resté dans cet établissement jusqu'en 1912 où Ehrenfest a été nommé à sa 
place. Lorentz est ensuite nommé directeur de recherche à l'institut de Teyler, 
Haarlem. Il a maintenu une position honorifique à Leyde, où il a continué à 
donner quelques cours. Avant que l'existence des électrons ait été prouvée, 
Lorentz a proposé que les vagues de lumière étaient dues aux oscillations d'une 
charge électrique dans l'atome. Lorentz a développé sa théorie mathématique de 
l'électron pour lequel il a reçu le prix Nobel en 1902. Le prix Nobel a été attribué 
conjointement à Lorentz et à Pieter Zeeman, un étudiant de Lorentz. Zeeman 
avait vérifié expérimentalement le travail théorique de Lorentz sur la structure 
atomique, démontrant l'effet d'un champ magnétique fort sur les oscillations en 
mesurant le changement de la longueur d'onde de la lumière produite. Lorentz est 
également célèbre pour son travail sur la contraction de Fitzgerald-Lorentz, qui 
est une contraction dans la longueur d'un objet aux vitesses relativistes. Les 
transformations de Lorentz, qu'il a présentées en 1904, forment la base de la 
théorie de relativité restreinte d'Einstein qui a l'époque était appelée "théorie de la 
relativité d'Einstein-Lorentz". Elles décrivent l'augmentation de la masse, du 
rapetissement de la longueur, et de la dilatation de temps d'un corps se déplaçant 
aux vitesses proches de celle de la lumière. Lorentz était président de la première 
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conférence de Solvay tenue à Bruxelles en automne de 1911. Cette conférence 
avait pour sujet les deux approches de la théorie atomique, à savoir la théorie 
classique et la physique quantique. Cependant, Lorentz n'a jamais entièrement 
accepté la théorie quantique et a toujours espéré qu'il serait possible de 
l'incorporer de nouveau dans l'approche classique. 


Lucas, Édouard (1842-1891) est un arithméticien français né à Amiens et décédé 
à Paris. Enfant issu d'une famille très modeste, il reçoit une bourse et réussit le 
concours d'entrée à l'École Normale Supérieure, en 1861. À la sortie de l'École, il 
devient astronome adjoint à l'Observatoire de Paris, puis après la guerre franco- 
prussienne, il obtient une chaire de Mathématiques Spéciales à Moulins, de 1872 
à 1876. Puis il occupe une chaire à Paris, d'abord au lycée Charlemagne à Paris, 
puis au déjà très prestigieux lycée Saint-Louis. Ses travaux mathématiques 
concernent la géométrie euclidienne non élémentaire (celle des transformations, 
en particulier la géométrie projective vue à travers ses homographies), et surtout 
la théorie des nombres. Sa principale contribution est celle faite aux tests de 
primalité. Tombée dans un oubli relatif en France (où la théorie algébrique des 
nombres est reléguée au second plan, en attendant Weil), l'oeuvre de Lucas est 
reprise et enrichie par les anglo-saxons, et notamment par Lehmer, qui améliorera 
son test de primalité et prouvera totalement certains résultats de Lucas, pour 
obtenir le test de Lucas-Lehmer, qui est encore celui qui est utilisé à la fin du 
20ème siècle pour battre des records de grands nombres premiers. Ces travaux 
prennent une importance particulière depuis que l'avènement de l'informatique 
rend la cryptographie avide de très grands nombres premiers. Lucas est aussi 
connu pour être l'inventeur de nombreuses récréations mathématiques. La plus 
répandue d'entre elles est le problème des tours de Hanoi, qu'il publia sous le nom 
de Claus de Siam, professeur au collège de Li-Sou-Tsiam, anagramme de Lucas 
d'Amiens, professeur à Saint-Louis. 


Malthus, Thomas Robert (1766-1834) né à Guildford et décédé à Bath est un 
pasteur anglican, qui s'inquiéta de la croissance trop importante de la population 
en Angleterre, au début de la révolution industrielle (de 1750 à 1900). Sa crainte 
tournait autour de l'idée que la progression démographique est plus rapide que 
l'augmentation des ressources, d'où une paupérisation de la population. Les 
anciens régulateurs démographiques (les guerres et les épidémies) ne jouant plus 
leurs rôles, il imagine de nouveaux obstacles, comme la limitation de la taille des 
familles et le recul de l'âge du mariage. Ces propositions ne sont appliquées à ce 
jour, toutes les deux, qu'en Chine, qui est en effet obligée de limiter sévèrement sa 
démographie. Les prévisions sinistres de Malthus sont dans la réalité mises à mal, 
car il n'imaginaïit pas une si grande augmentation des ressources et des rendements 
agricoles (révolution verte: chimie appliqué à l'agronomie ce qui n'est pas pour 
autant bénéfique...); les nouveaux moyens d'échanges internationaux de biens de 
subsistance (contribuant à la pollution des océans au passage….); le fait que le trop 
plein d'individus émigrerait vers les États-Unis ou les colonies. En revanche, si les 
prévisions de Malthus ne sont pas au rendez-vous, sa théorie garde tous ses droits. 
Il est exact que la population est en croissance dans certains pays (Arabie 
Saoudite: 6 enfants par femme) il est aussi exact (et heureux) que les progrès de 
l'hygiène et de la médecine augmentent la taille de la population, il est exact que 
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les ressources renouvelables sur Terre sont limitées, in fine par l'énergie solaire 
que reçoit celle-ci, qui elle-même détermine la biomasse, sauf découverte 
scientifique majeure. et dans ces conditions, la mathématique est formelle: il ne 
sera pas possible à la population Terrestre d'augmenter indéfiniment, et la 
régulation devra intervenir à un moment ou à un autre, et d'une manière ou d'une 
autre! 


Marconi, Guglielmo (1874-1937) né à Rome et décédé à Rome est un physicien, 
inventeur et homme d'affaires italien. Il est, avec Karl Ferdinand Braun, colauréat 
du prix Nobel de physique de 1909 en reconnaissance de leurs contributions au 
développement de la télégraphie sans fil (on peut considérer qu'il est l'origine des 
appareils de transmission/réception d'ondes électromagnétiques et donc de la 
radio et télévision hertzienne). Marconi dans une famille aisée, second fils de 
Giuseppe Marconi, un propriétaire italien, et d'une mère irlandaise, Annie 
Jameson, petite-fille du fondateur de la Distillerie Jameson Whiskey. Il a fait ses 
études à Bologne dans le laboratoire d'Augusto Righi, à Florence, à l'Institut 
Cavallero et, plus tard, à Livourne. Il fait en 1985 des expériences sur les ondes 
découvertes par Heinrich Rudolf Hertz 7 ans auparavant. Il reproduit le matériel 
utilisé par Hertz en l'améliorant avec un cohéreur de Branly pour augmenter la 
sensibilité et l'antenne de Alexandre Popov. Après ses toutes premières 
expériences en Italie, il réalise dans les Alpes suisses à Salvan une liaison de 1.5 
km durant l'été 1895. L'année d'après, faute d'être suivi par ses compatriotes, il 
part pour l'Angleterre, poursuit ses expériences et dépose un brevet. En 1897 il 
effectue la première communication en morse à plus de 13 km entre Lavernock 
(Pays de Galles) et Brean (Angleterre) par-dessus le Canal de Bristol. L'année 
d'après, il ouvre la première usine de radios au monde, à Chelmsford, Angleterre. 
Au début du 20ème siècle le nom Marconi est (malheureusement) plutôt connu 
comme étant le propriétaire du groupe de cinéma Pathé (qui s'appelle en réalité 
Pathé-Marconi). 


Mandelbrot, Benoît (1924-2010) né à Varsovie et décédé à Cambridge. Sa 
famille a quitté la Pologne pour Paris afin de fuir la menace hitlérienne. C'est à 
Paris qu'il fut initié aux mathématiques par deux oncles dont un était professeur 
au Collège de France. L'invasion allemande force la famille à se réfugier ensuite à 
Brive-la-Gaillarde. Après avoir fréquenté le lycée Edmond-Perrier de Tulle, il 
poursuit ses études au lycée du Parc, à Lyon. Après avoir quitté l'École 
polytechnique (promotion 1944), où il a suivi les cours d'un spécialiste du calcul 
des probabilités (Paul Lévy), il s'intéresse aux phénomènes d'information, les 
idées de Claude Shannon étant alors en plein essor. Mandelbrot fit ses études en 
France et aux États-Unis et obtint son doctorat de mathématiques à l'université de 
Paris en 1952. Il enseigna l'économie à l'université Harvard, l'ingénierie à Yale, la 
physiologie à la faculté de médecine et la mathématique à Paris et à Genève. À 
partir de 1958, il travailla pour IBM au centre de recherche Thomas B. Watson à 
New York sur la transmission optimale dans les milieux bruités, tout en 
poursuivant son travail sur des objets étranges jusque-là assez négligés par les 
mathématiciens : les objets à complexité récursivement définie, comme la courbe 
de Von Koch, auxquels il pressent une unité: la géométrie fractale. La géométrie 
fractale se distingue par son approche plus abstraite de la dimension qu'elle ne 
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l'est dans la géométrie traditionnelle. Elle trouve de plus en plus d'applications 
dans différents domaines de la science et de la technologie. 


Markov, Andreï Andreïevitch (1856-1922) Mathématicien russe spécialiste de 
la théorie des nombres, de la théorie des probabilités et de l'analyse mathématique 
né à Riazan et décédé à Petrograd. Issu d'une la famille d'un petit fonctionnaire du 
gouvernement, il fait ses études à l'université de Saint-Pétersbourg et reçoit une 
médaille d'or pour son mémoire De l'intégration des équations différentielles par 
la méthode des fractions continues (1878). Professeur à l'université de Saint- 
Pétersbourg en 1886, il devient membre de l'Académie des sciences en 1896. Les 
recherches de Markov continuent l'oeuvre de ses devanciers de l'école 
mathématique pétersbourgeoise: P. L. Tchebychev, E. I. Zolotarev et A. 

N. Korkin. Sa thèse Des formes quadratiques bilinéaires de déterminant positif 
(1880) inaugure ses travaux dans le domaine de la théorie des nombres. En 
analyse, ses recherches concernent les fractions continues, les limites d'intégrales, 
la convergence des séries et la théorie de l'approximation. On lui doit une solution 
simple de la détermination de la limite supérieure de la dérivée d'un polynôme 
(inégalité de Markov). Après 1910, se tournant vers la théorie des probabilités, il 
démontre de façon rigoureuse, sous des conditions assez générales, le théorème 
central limite relatif à une somme de variables aléatoires indépendantes. 
Cherchant à généraliser ce théorème aux variables aléatoires dépendantes, il est 
amené à considérer la notion importante d'événements en chaînes, appelés depuis 
chaînes de Markov, et il établit une série de lois, fondement de la théorie des 
processus de Markov. Il étend plusieurs résultats classiques concernant des 
événements indépendants à certains types de chaînes. Ses travaux sont à l'origine 
de la théorie moderne des processus stochastiques. Markov s'intéressait aussi aux 
applications de la théorie des probabilités, et il a justifié de façon probabiliste la 
méthode des moindres carrés. 


Markowitz, Harry Maurice (1927- ) né à Chicago, professeur à la City 
University de New York est connu pour avoir développé la théorie dite du "choix 
des portefeuilles pour le placement des fortunes". Markowitz ne se doutait pas 
que son article de jeunesse publié en 1952 dans le Journal of Finance, puis 
développé dans un livre paru en 1959, Portofolio Selection: Efficient 
diversification, jetterait les bases de la théorie moderne du portefeuille et de son 
utilisation par un grand nombre de praticiens. Plus précisément, Markowitz a 
montré que l'investisseur cherche à optimiser ses choix en tenant compte non 
seulement de la rentabilité attendue de ses placements, mais aussi du risque de 
son portefeuille qu'il définit mathématiquement par la variance de sa rentabilité. 
Appliquant des théorèmes classiques du calcul statistique et des techniques 
probabilistes, il a ainsi démontré qu'un portefeuille composé de plusieurs titres est 
toujours moins risqué qu'un portefeuille composé d'un seul titre, quand bien même 
il s'agirait du moins risqué d'entre eux. La mise en oeuvre du modèle de 
Markowitz a très vite posé des problèmes d'ordre pratique. Alors que le volume 
des statistiques nécessaires au calcul augmentait rapidement avec le nombre de 
titres retenus (avec 100 titres, le nombre de statistiques nécessaires était de 3'150, 
mais il passait à 20"300 pour 200 titres et à 125750 pour 300 titres !), la collecte 
des informations et leur traitement devenaient presque impossibles avec les 
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ordinateurs disponibles dans les années 1960, entraînant de surcroît des coûts de 
traitement prohibitifs. C'est la raison pour laquelle William F. Sharpe cherchera 
une méthode de sélection des portefeuilles efficient plus simple. Markowitz et 
Sharpe seront alors reconnus comme les pères fondateurs de la gestion de 
portefeuilles et du corps doctrinal sur lequel elle se fonde. Le prix Nobel de 
sciences économiques leur sera décerné ainsi qu'à Merton Miller en 1990. 


Marx, Karl (1818-1883) né à Trèves et décédé à Londres entra à l'Université de 
Bonn puis à celle de Berlin, après avoir terminé le Lycée de Trèves. Il étudia à 
Berlin le droit, mais surtout l'histoire et la philosophie. Marx a ensuite contribué à 
parachever les trois principaux courants d'idées du 19ème siècle: la philosophie 
classique allemande, l'économie politique classique anglaise et le socialisme 
français. La théorie sociale de Marx a pour objectif de dévoiler la loi économique 
de la société capitaliste où ce qui domine est la production des marchandises en 
recherchant l'origine de la forme monétaire de la valeur. Ainsi pour Marx, l'argent 
(en tant que produit suprême du développement de l'échange et de la production 
marchande) estompe et dissimule le caractère et le lien social du travail 
individuel. À un certain degré du développement de la production des 
marchandises, l'argent se transforme aussi en capital. Ainsi, la séquence de la 
circulation des marchandises était: M (marchandise) - A (argent) - M 
(marchandise), c'est-à-dire vente d'une marchandise pour l'achat d'une autre. La 
séquence générale du capital est par contre A-M-A, c'est-à-dire l'achat pour la 
vente (avec un profit). C'est cet accroissement de la valeur primitive de l'argent, 
donc sa transformation en capital, que Marx appelle "plus-value" et qui ne peut 
provenir de la circulation des marchandises, car celle-ci ne connaît que l'échange 
d'équivalants; elle ne peut provenir non plus d'une majoration des prix, étant 
donné que les pertes et les profits réciproques des acheteurs et des vendeurs 
s'équilibrent à grande échelle. Pour obtenir de la plus-value il faut selon Marx une 
marchandise dont le processus de consommation fût en même temps un processus 
de création de valeur. Or, cette marchandise est la force de travail humaine. Le 
possesseur d'argent achète la force de travail à sa valeur, déterminée, comme celle 
de toute autre marchandise, par le temps de travail socialement nécessaire à sa 
production. Ayant acheté la force de travail, le possesseur d'argent est en droit de 
la consommer, c'est-à-dire de l'obliger à travailler toute la journée, disons, 8 
heures. Or, en 5 heures (temps de travail nécessaire), l'ouvrier crée un produit qui 
couvre les frais de son entretien, et, pendant les 3 autres heures (temps de travail 
supplémentaire), il crée un produit supplémentaire, non rétribué par le capitaliste, 
et qui est la plus-value. Aussi, pour exprimer le degré d'exploitation de la force de 
travail par le capital, faut-il comparer la plus-value non pas au côut total de 
production, mais uniquement au coût variable de la main d'oeuvre humaine. 


Maxwell, James Clerk (1831-1879) né à Edimbourg et décédé à Glenlair. 
Brillant élève au collège, James Clerk Maxwell poursuit des études de 
mathématiques à l'université de Cambridge. Il obtient une chaire de philosophie 
naturelle à Aberdeen à l'âge de 25 ans. Puis, de 1860 à 1865, il occupe le poste de 
professeur au King's College de Londres. À la suite de ces 5 années 
d'enseignement, il décide de se retirer dans sa propriété de Glenair, en Écosse. Il y 
restera 5 autres années qu'il emploiera à étudier. En 1871, Maxwell est nommé 
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directeur du laboratoire Cavendish que vient de fonder le duc du Devonshire. Il 
n'aura alors de cesse de le développer afin qu'il devienne le centre de formation 
scientifique le plus illustre. Dès le début de sa carrière, Maxwell s'intéresse à la 
dynamique des gaz. Après avoir prouvé mathématiquement que les anneaux de 
Saturne sont constitués de particules distinctes, il étudie la répartition des vitesses 
des molécules gazeuses (conforme à loi de Gauss). En 1860, il montre que 
l'énergie cinétique de ces molécules ne dépend que de leur nature. Mais ce sont 
ses recherches en électromagnétisme qui font de Maxwell un des savants les plus 
célèbres du 19ème siècle. En se basant sur les travaux de Faraday, il introduit dès 
1862 la notion de champ. Puis, il montre qu'un champ magnétique peut être créé 
par la variation d'un champ électrique (Faraday avait alors découvert l'induction, 
phénomène par lequel la variation d'un champ électrique crée un champ 
magnétique). Son enseignement purement mathématique va alors lui permettre 
d'élaborer les célèbres équations différentielles décrivant la nature des champs 
électromagnétiques dans l'espace et le temps. Il les expose dans son Traité 
d'électricité et de magnétisme publié en 1873. Maxwell, en élaborant les théories 
de l'électromagnétisme, a également défini la lumière en tant qu'onde 
électromagnétique, ouvrant ainsi la voie aux recherches d'autres physiciens 
comme Heinrich Rudolph Hertz. 


McFadden, Daniel (1937-) né à Raleigh est un économétricien ayant reçu en 
2000, avec James Heckman, le prix Nobel d'économie pour son apport aux 
théories et méthodes de l'analyse des choix discrets. Il obtient un Bachelor de 
Science en physique à l'âge de 19 ans à l'Université du Minnesota puis un doctorat 
de philosophie en sciences du comportement (économie) 5 ans plus tard en 1962. 
En 1964, il intègre l'Université de Berkeley et focalise ses recherches sur les 
comportements de choix, et sur les liens entre la théorie économique et les 
mesures économiques. En 1975, il est récompensé par la médaille John Bates 
Clark. En 1977, il se rend au Massachusetts Institute of Technology, mais retourne 
à Berkeley en 1991, car le MIT n'avait pas de département de statistiques. Après 
son retour, il fonde le laboratoire d'économétrie, qui est dévoué à l'informatique 
statistique appliquée à l'économie. McFadden a développé en microéconométrie 
des théories et des méthodes d'analyse des comportements par choix discrets (par 
exemple, les données sur les métiers et les lieux de résidence des individus) et est 
connu pour être à l'origine du coefficient pseudo-R de la régression logistique 
probit. À partir de sa théorie économique sur les choix discrets, McFadden a 
développé de nouvelles méthodes statistiques qui ont eu une influence décisive 
sur la recherche théorique, mais qui sont aussi largement utilisées par le 
marketing. 


Mendel, Johann Gregor (1822-1884) né à Heinzendorf et décédé à Brno, a été 
moine dans le monastère de Brno (en Moravie). Mendel est communément 
reconnu comme un botaniste père fondateur de la génétique. Il est à l'origine de 
ce qui est aujourd'hui appelé les lois de Mendel, qui définissent la manière dont 
les gènes se transmettent de génération en génération. Mendel naît dans une 
famille de paysans. Doué pour les études, mais de tendance dépressive qui lui 
vaudra de multiples indispositions dans la suite de sa carrière, le jeune garçon est 
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très vite remarqué par le curé du village qui décide de l'envoyer poursuivre ses 
études loin de chez lui. Mendel part en 1851 pour suivre les cours, en tant 
qu'auditeur libre, de l'Institut de physique de Christian Doppler. Il y étudie, en 
plus des matières obligatoires: la botanique, la physiologie végétale, l'entomologie 
et la paléontologie. Durant 2 années, il acquiert les bases méthodologiques qui lui 
permettront de réaliser plus tard ses expériences. Au cours de son séjour à Vienne, 
Mendel est amené à s'intéresser aux théories de Franz Unger, professeur de 
physiologie végétale. Celui-ci préconise l'étude expérimentale pour comprendre 
l'apparition des caractères nouveaux chez les végétaux au cours de générations 
successives. Il espère ainsi résoudre le problème que pose l'hybridation chez les 
végétaux. De retour au monastère, Mendel installe un jardin expérimental dans la 
cour et dans la serre, en accord avec son abbé, et met sur pied un plan 
d'expériences visant à comprendre les lois de l'origine et de la formation des 
hybrides. Il choisit pour cela le pois qui a l'avantage d'être facilement cultivé avec 
de nombreuses variétés décrites. En 1865, il expose à la Société des sciences 
naturelles de Brünn et publie en 1866 les résultats de ses études Après dix années 
de travaux minutieux, Mendel a ainsi posé les bases théoriques de la génétique et 
de l'hérédité moderne. Son travail ne va pas susciter d'enthousiasme auprès de ses 
contemporains qui ont du mal à comprendre la formalisation mathématique de ses 
expériences. Très peu de scientifiques de son temps vont citer son travail et 
Mendel ne reçoit guère de réponses auprès des différents correspondants à qui il 
envoie un tiré-à-part. Parmi ces derniers, seul Karl Wilhelm von Nägeli, 
professeur de botanique à Munich, lui écrit, doutant d'ailleurs de certaines de ses 
conclusions. En 1868, Mendel est élu supérieur de son couvent à la mort de 
l'abbé. 


Mendeleïev, Dmitri Ivanovitch (1834-1907), né à Tobolsk et décédé à Saint- 
Pétersbourg fut chimiste russe surtout connu pour sa classification périodique des 
éléments publiée en 1869. Il montra en effet que les propriétés chimiques des 
éléments dépendaient directement de leur poids atomique et qu'elles étaient des 
fonctions périodiques de ce poids. Il entre à l'âge de 14 ans au lycée de Tobolsk, 
après la mort de son père. En 1849, la famille devenue pauvre s'installe à Saint- 
Pétersbourg et Mendeleïev entre à l'université en 1850. Après avoir reçu son 
diplôme, il contracte la tuberculose ce qui l'oblige à se déplacer dans la péninsule 
criméenne près de la Mer Noire en 1855, où il devient responsable des sciences 
du lycée local. Il revient complètement guéri à Saint-Pétersbourg en 1856 où il 
étudie la chimie et fut diplômé en 1856. À 25 ans, il vient travailler à Heidelberg 
avec des savants comme Robert Bunsen et Gustav Kirchhoff. À Heidelberg, il 
rencontra le chimiste italien Stanislao Cannizzaro, dont les idées sur le poids 
atomique influencèrent sa réflexion. Mendeleïev retourna à Saint-Pétersbourg et 
enseigna la chimie à l'Institut technique en 1863. En 1867, il est nommé 
professeur de chimie minérale à l'Université de Saint-Pétersbourg. Il fut nommé 
professeur de chimie générale à l'université de Saint-Pétersbourg en 1866. 
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Merton, Robert Cox (1944- ) a reçu le prix Nobel d'économie en 1997, en 
même temps que son compatriote Myron Scholes, pour avoir élaboré la méthode 
d'évaluation des instruments financiers dérivés. Cette méthode d'évaluation a 
certainement accéléré la croissance rapide des marchés des instruments financiers 
dérivés depuis les années 1980 et permis l'amélioration de la gestion des risques 
attachés à ces nouveaux produits financiers. Merton a sans conteste contribué à 
ouvrir une voie nouvelle dans le champ des sciences économiques et fortement 
influencé les deux autres lauréats. Né en 1944 à New York, il quitte le California 
Institute of Technology avec un mastère en mathématiques appliquées. Il obtient 
par la suite un doctorat en sciences économiques au Massachusetts Institute of 
Technology (M.I.T.) de Cambridge, sous la direction de Paul Samuelson (Prix 
Nobel d'économie 1970) et se spécialise dans les problèmes d'application des 
méthodes probabilistes à l'évolution aléatoire des cours des actifs financiers. En 
1988, il occupe la chaire George Fischer Backer de professeur en Business 
Administration à la Harvard Business School de Cambridge. Le travail novateur 
de Merton date du début des années 1970, période pendant laquelle il élabore une 
méthode originale de calcul de la valeur des instruments dérivés. L'échec de sa 
méthode appliquée à la gestion d'un fonds de placement à risques américain 
(Long-Term Capital Management) en 1998, a quelque peu terni sa réputation de 
spécialiste de la finance internationale. Mais Merton avait lui-même déclaré à une 
chaîne de télévision américaine, au lendemain de l'attribution de sa récompense 
que c'est une mauvaise interprétation de penser que l'on peut éliminer les risques 
simplement parce qu'on les comprend et qu'on les mesure. 


Minkowski, Hermann (1864-1909) né à Alexotas et décédé à Gôttingen, est un 
physicien-mathématicien qui a étudié aux universités de Berlin et de Kônigsberg. 
Il fait des études secondaires au lycée de Kôünigsberg où il se fait remarquer par 
ses résultats en mathématiques et reçoit son doctorat en 1885 dans la même ville. 
Il a ensuite enseigné dans plusieurs universités, à Bonn, Kônigsberg et à Zurich. À 
Zurich, Einstein était un des étudiants dans plusieurs des cours qu'il a donnés. 
Minkowski a accepté une chaire en 1902 à l'université de Gôttingen, où il est resté 
pour le reste de sa vie. À Gôttingen, il apprit la physique-mathématique de 
Hilbert, il a participé à une conférence sur la théorie de l'électron en 1905 et 
appris les derniers résultats dans la théorie dans l'électrodynamique. En 1907, 
Minkowski s'est rendu compte que le travail de Lorentz et d'Einstein pourrait 
mieux être compris dans un espace non-euclidien. Il a considéré l'espace et le 
temps, qui a été autrefois pensé pour être indépendant, d'être couplé ensemble 
dans un continuum d'espace-temps quadridimensionnel. Minkowski a établi un 
traitement quadridimensionnel de l'électrodynamique. Ce continuum 
d'espace-temps a fourni un cadre pour tout le travail mathématique postérieur 
dans la relativité. Ces idées ont été employées par Albert Einstein en développant 
la théorie générale de relativité. Minkowski était principalement intéressé par la 
mathématique pure et a passé beaucoup de son temps en étudiant les formes 
quadratiques et les fractions continues. Son travail le plus original était cependant 
sa Géométrie des nombres. Cette étude a mené à des travaux sur les corps 
convexes et aux questions au sujet des problèmes d'emballage (les manières dans 
lesquelles des figures d'une forme donnée peuvent être placées dans une autre 
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Môbius, August Ferdinand (1790-1868) mathématicien et astronome allemand 
né à Schulpforta et mort à Leipzig. Môbius fit ses études à Leipzig, à Gôttingen 
(sous la direction de Gauss) et à Halle. En 1815, il devint professeur d'astronomie 
à Leipzig, puis directeur de l'observatoire de cette ville, après en avoir dirigé la 
construction. On lui doit plusieurs ouvrages d'astronomie théorique, notamment 
De computandis occultationibus fixarum per planetas (1815). Ses travaux 
mathématiques concernent principalement la géométrie et furent, pour la plupart, 
publiés dans le Journal des mathématiques pures et appliquées de Crelle, de 1828 
à 1858, comme compléments à son ouvrage fondamental Der barycentrische 
Calcul (1827). En introduisant un nouveau système de coordonnées, Môbius y 
étudie les transformations géométriques, principalement la transformation 
projective. Son ouvrage eut une très grande importance dans le développement de 
la géométrie projective. Étudiant la statique sous l'angle de la géométrie, Môbius 
développa également la théorie des complexes linéaires de droites (Lehrbuch der 
Statik, 1837). On peut considérer Môbius comme un des pionniers de la topologie, 
avec la découverte, publiée dans un mémoire à l'Académie des sciences française, 
du fameux "ruban de Môbius", surface n'ayant qu'un seul côté. 


Monge, Gaspard (1746-1818) né à Beaune et décédé à Paris Monge est fils d'un 
marchand forain. Il suit d'abord le collège de Beaune, puis va ensuite collège de 
Lyon, où il enseigne dès l'âge de 16 ans les sciences physiques. Un officier du 
génie, qui avait vu un plan de la ville de Beaune fait par Monge à l'aide de 
nouvelles méthodes d'observation et de construction graphique, le recommande 
au commandant de l'École militaire de Mézières. Mais il ne peut y être admis à 
cause de son origine roturière et n'est accepté que dans une annexe technique de 
l'école. Ses talents scientifiques sont reconnus lorsqu'un jour il dresse le plan de 
fortifications à l'aide d'une méthode bien plus rapide que les méthodes connues 
jusque-là. Il est alors admis à l'École militaire comme professeur de 
mathématiques et continue ses recherches, arrivant à la méthode générale de 
représentation géométrique connue depuis lors sous le nom de géométrie 
descriptive. Mais ses découvertes, considérées comme secret militaire de grande 
valeur, ne peuvent être publiées. En 1780, il vient à Paris enseigner 
l'hydrodynamique. Il entre aussitôt à l'Académie des sciences, où il fait une 
communication sur les lignes de courbure tracées sur une surface (problème déjà 
étudié par Euler en 1760). En 1786, il publie son célèbre Traité élémentaire de la 
statique et fonde peu après l'École polytechnique, où il aura l'occasion de donner 
des leçons de géométrie descriptive et de publier ses travaux jusque-là inconnus. 
Chargé de mission en Italie, Monge rencontre Bonaparte et se charge du 
recrutement des savants pour l'expédition d'Égypte. Revenu en France, il reprend 
son enseignement à l'École polytechnique, devient sénateur et est anobli . Mais la 
Restauration le privera de tous ses titres, le rayera de la liste des membres de 
l'Institut et lui enlèvera son poste d'enseignant. En 1989, ses cendres ont été 
transférées au Panthéon. Toutes ses recherches mêlent étroitement la géométrie 
pure, l'analyse infinitésimale et la géométrie analytique, lui permettant, par 
exemple, de lier chaque famille de surfaces à une équation aux dérivées partielles 
et, par là, de trouver les solutions d'équations différentielles à l'aide de sa théorie 
des surfaces. L'influence de Monge s'exerça par son enseignement oral, et la 
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plupart des mathématiciens français du 19ème siècle ont été ses élèves. 


Napier, John (1550-1617) né et décédé à Merchiston est un théologien, 
physicien, astronome et mathématicien. Comme c'était la pratique courante pour 
les membres de la noblesse à l'époque, John Napier n'est pas entré à l'école avant 
l'âge de 13 ans. Il n'est pas resté à l'école très longtemps, cependant. On croit qu'il 
a quitté l'école en Ecosse et a peut-être voyagé en Europe continentale afin de 
mieux poursuivre ses études. En 1571, Napier, âgé de 21 ans, est retourné en 
Écosse, et a acheté un château à Gartness en 1574. A la mort de son père en 
1608, Napier et sa famille ont emménagé dans Merchiston Castle à Edimbourg, où 
il résida le reste de sa vie. La mathématique n'était pas son activité principale mais 
il ne manquait pas d'idées pour simplifier les calculs. Il établit quelques formules 
de trigonométrie sphérique, popularisa l'usage du point pour la notation anglo- 
saxonne des nombres décimaux mais surtout inventa les logarithmes. Son objectif 
était de simplifier les calculs trigonométriques nécessaires en astronomie. Il 
s'attacha à définir le logarithme d'un sinus en s'appuyant sur des considérations 
mécaniques de points mobiles et sur le lien entre les progressions arithmétique et 
géométrique. 


Navier, Henri (1785-1836) né à Dijon et décédé à Paris était un ingénieur, 
mathématicien et économiste surtout connu pour ses travaux sur 
l'hydrodynamique. Henri devient orphelin à 9 ans, après la mort de son père, 
avocat réputé et ancien député durant la Révolution. Son oncle, ingénieur du 
Corps des Ponts et Chaussées s'occupe de son éducation à Paris, le considère 
comme son fils avant de l'adopter avec sa femme, également proche parente du 
jeune Henri. L'ingénieur cantonnier le pousse à se présenter à l'École 
Polytechnique. Bien qu'étant parmi les derniers reçus en 1802, il y réussit sa 
scolarité et son classement lui permet d'intégrer le corps des ponts et chaussées. Il 
est nommé ingénieur ordinaire des Ponts et Chaussées en 1808. Plus tard, il 
deviendra inspecteur divisionnaire de ce corps et, semble-t-il quelque temps, 
inspecteur général à l'instar de son oncle. De 1819 à 1835, il assure le cours de 
mécanique appliquée de l'École nationale des ponts et chaussées (il y est titularisé 
en 1830 à la suite de la retraite d'Eisenmann). Au début des années 1820, il 
explore avec Augustin-Louis Cauchy les facettes de la théorie mathématique de 
l'élasticité, ce qui lui permet de proposer des équations sur le mouvement des 
fluides newtoniens. 


Nash, John (1928- ) né en Virigine Occidentale, fils de John Nash Sr., ingénieur, 
et Virginia Martin, enseignante. Jeune, il passait beaucoup de temps à lire et à 
faire des expériences dans sa chambre qu'il avait convertie en laboratoire. De 
1945 à 1948, Nash a étudié au Carnegie Institute of Technology à Pittsburgh, dans 
l'intention de devenir ingénieur comme son père. À la place, il y a développé une 
passion durable pour les mathématiques, et en particulier pour la théorie des 
nombres, les équations diophantiennes, la mécanique quantique et la théorie de la 
relativité. Il fut admis en troisième cycle, à 20 ans, dans toutes les universités qu'il 
avait sollicitées: Harvard, Princeton... Il choisit d'aller à Princeton. Ayant un 
intérêt pour l'économie, Nash se mit à étudier la théorie des jeux, domaine 
qu'avait défriché John von Neumann, un des grands noms de Princeton, un peu 
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plus d'une décennie auparavant. C'est sur ce sujet qu'il décida de faire sa thèse et 
qu'il obtint le prix Nobel d'économie en 1994. Durant l'été 1950, Nash fut 
employé comme consultant à la RAND), institut top-secret qui employait de la 
matière grise pour mettre au point diverses stratégies de statu quo soit de victoire, 
en cas de conflit faisant appel à l'arme nucléaire. À la suite, Nash se mit à étudier 
les variétés lisses compactes, ce qui fit l'objet d'un papier. Il devint ensuite 
assistant au M.LT à la rentrée 1951-52, âgé de 23 ans seulement. Il avait vraiment 
un tempérament de problem-solver et releva ainsi le pari de résoudre une question 
de Waren Ambros: est-il possible de plonger une variété riemannienne quelconque 
dans un espace euclidien? Nash trouve une méthode fondamentale originale pour 
y arriver. Nash devint malade après quelques problèmes privés et professionnels, 
mais il attribua sa maladie à sa tentative de résoudre les contradictions de la 
physique quantique. D'autant plus que peu de temps auparavant, il avait réalisé 
des travaux sur les EDP elliptiques non linéaires qui lui valurent beaucoup 
d'admiration autour de lui, mais dont il dut finalement partager la paternité avec 
un jeune italien qui avait énoncé, indépendamment et quelques semaines avant 
lui, des résultats similaires: ceci leur valu de ne pas obtenir la médaille Fields en 
1900: 


Newton, Isaac (1642-1727), mathématicien et physicien anglais, considéré 
comme l'un des plus grands scientifiques de l'histoire. Newton naït dans le 
Lincolnshire (Angleterre), de parents paysans et décédera à Londres. À 5 ans, il 
fréquente l'école primaire de Skillington, puis à 12 ans celle de Grantham. Il y 
reste quatre années jusqu'à ce que sa mère le rappelle à Woolsthorpe pour qu'il 
devienne fermier et qu'il apprenne à administrer son domaine. Pourtant, sa mère, 
s'apercevant que son fils était plus doué pour la mécanique que pour le bétail, 
l'autorisa à retourner à l'école pour peut-être pouvoir entrer un jour à l'université. 
À 17 ans, Newton tombe amoureux d'une camarade de classe, mademoiselle 
Storey. On l'autorise à la fréquenter et même à se fiancer avec elle, mais il doit 
terminer ses études avant de se marier. Finalement, le mariage ne se fit pas et 
Newton restera alors célibataire toute sa vie. À 18 ans, il entre alors au Trinity 
College de Cambridge (il y restera 7 ans), où il se fait remarquer par son maître, 
Isaac Barrow. Il a également comme professeur Henry More qui l'influencera 
dans sa conception de l'espace absolu. À Cambridge, il étudie l'arithmétique, la 
géométrie dans les Éléments d'Euclide et la trigonométrie, mais s'intéresse 
particulièrement à l'astronomie, à l'alchimie et à la théologie. Il devient à 25 ans 
bachelier des arts, mais est contraint de suspendre ses études pendant deux 
années suite à l'apparition de la peste qui s'est abattue sur la ville en 1665 ; il 
retourne alors dans sa région natale. C'est à cette période que Newton progresse 
fortement en mathématiques, physique et surtout en optique. Il laissa 
d'importantes contributions à de nombreuses branches de la science. Ses 
découvertes et théories furent à la base d'une grande partie des progrès 
scientifiques réalisés après lui. Newton fut l'un des inventeurs de la branche des 
mathématiques appelée calcul infinitésimal (l'autre inventeur fut le mathématicien 
allemand Gottfried Wilhelm Leibniz). Il éclaircit également les mystères de la 
lumière et de l'optique, formula trois lois sur le mouvement et en déduisit la loi de 
la gravitation universelle en sa basant sur les lois de Kepler. Il parvint au 
raisonnement selon lequel la lumière est un mélange de différents rayons de 
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couleurs différentes, et qu'en raison des phénomènes de réflexion et de réfraction, 
ses couleurs apparaissent en composants séparés. Newton démontra sa théorie des 
couleurs en faisant passer de la lumière au travers d'un prisme, qui scinde le 
faisceau lumineux en couleurs séparées. En 1696, il quitte Cambridge pour 
devenir d'abord gardien de la Royal Mint puis maître de la monnaie dès l'année 
suivante. En 1699, il est nommé membre du conseil de la Royal Society et y est 
élu président en 1703. Il garde cette place jusqu'à sa mort. 


Neumann Von, John (1903-1957), mathématicien né à Budapest et décédé à 
Washington. Neumann est un enfant prodige: à 6 ans, il converse avec son père en 
grec ancien et peut mentalement faire la division d'un nombre à huit chiffres. Une 
anecdote rapporte qu'à 8 ans, il a déjà lu les 44 volumes de l'histoire universelle de 
la bibliothèque familiale et qu'il les a entièrement mémorisés : doté d'une mémoire 
absolue, il sera capable de citer de mémoire des pages entières de livres lus des 
années auparavant. Il entre au lycée à Budapest en 1911. C'est âgé d'à peine 23 
ans qu'il reçoit son doctorat en mathématiques (avec des mineures en physique 
expérimentale et en chimie) de l'université de Budapest. En parallèle, il obtient un 
diplôme en génie chimique de l'École polytechnique fédérale de Zurich (à la 
demande de son pêre, désireux que son fils s'investisse dans un secteur plus 
rémunérateur que les mathématiques). Il est intéressant de noter que von 
Neumann n'a mis les pieds dans ces deux universités que pour les examens. Entre 
1926 et 1930, il est privatdozent à Berlin et à Hambourg. Il travaille également à 
Gôttingen avec Robert Oppenheiïmer sous la direction de David Hilbert. Durant 
cette période, l'une des plus fécondes de sa vie, il côtoie également Werner 
Heisenberg et Kurt Güdel. En 1930, von Neumann est professeur-invité à 
l'université de Princeton. Puis, de 1933 à sa mort en 1957, il est professeur de 
mathématiques à la faculté de l'Institute for Advanced Study qui vient d'être 
créée. Il y rejoint donc Albert Einstein et Kurt Gôdel. Neumann émigra aux 
États-Unis en 1933 pour joindre l'Institut de Recherche Avancée à Princeton. Il 
rédigea un important ouvrage sur la mathématique appliquée et effectua un travail 
majeur dans l'axiomatisation de la physique quantique (c'est lui qui réalisa 
système quantique peut être considéré comme un point dans un espace de Hilbert 
et qui introduisit les opérateurs linéaires). Il participa durant la deuxième guerre 
mondiale au développement théorique de la bombe atomique et à l'étude des 
ondes de choc. Ces travaux mathématiques sur les calculs ultra-rapides pour les 
simulations de la bombe H, contribua de façon non négligeable au développement 
de l'informatique (il est aussi à l'origine des méthodes de Monte-Carlo). Il 
contribua également à la théorie des jeux où certains de ces résultats eurent une 
grande influence sur l'économie. 


Niels, Abel (1802-1829) était mathématicien norvégien né à Frindoë et décédé à 
Froland. Son père était un éminent homme politique norvégien, mais à la fin de sa 
vie, il tomba en disgrâce, et quand il mourut en 1820, c'est Abel qui dut supporter 
toute la charge de la famille. Son père, éduqua lui-même Abel jusqu'en 1815, puis 
l'envoya au collège paroissial d'Oslo. Dans ce lycée, le latin, le grec et la religion 
étaient enseignés à l'ancienne, avec punitions et châtiments corporels. La situation 
évolua en 1817 à la suite du renvoi d'un professeur consécutif au décès d'un 
élève: le lycée recruta un jeune enseignant ouvert aux idées nouvelles et instruit 
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de mathématiques qui en découvrant l'intérêt de Niels pour les mathématiques, lui 
trouva une brouse pour l'université. Grâce à l'aide financière de ses professeurs, il 
parvient donc toutefois à poursuivre ses études et à faire ses premières 
découvertes. Mais ses mémoires sont perdus par Cauchy et mésestimés par Gauss. 
Après son doctorat, Abel ne parvint pas à trouver un poste et ses conditions de vie 
devinrent de plus en plus précaires et sa santé se fragilisa: il fut ainsi atteint de la 
tuberculose. Malgré des déplacements à Paris et à Berlin, ses travaux ne sont 
toujours pas perçus à leur juste valeur. Dans ses dernières semaines, il n'a plus 
assez de force pour quitter son lit. Il décède à même pas 27 ans, alors qu'un ami 
venait juste de lui trouver un poste à Berlin. C'est Jacobi qui comprendra tout le 
génie de ce jeune mathématicien. Abel avait notamment démontré, à l'âge de19 
ans, l'impossibilité de résoudre par radicaux les équations algébriques de degré 5, 
ce que son contemporain Galois généralisera à tout degré. À titre posthume, Abel 
recevra en 1830 le grand prix de Mathématiques de l'Institut de France. 


Nôther, Emmy (1882 -1935) née à Erlangen et décédée à Princeton. Emmy 
envisage d'abord d'enseigner le français et l'anglais après avoir passé les examens 
requis, mais étudie finalement les mathématiques à l'université d'Erlangen où son 
père donne des conférences. Durant le semestre d'hiver 1903-1904, elle étudie à 
l'université de Gôttingen et assiste aux cours de l'astronome Karl Schwarzschild et 
des mathématiciens Hermann Minkowski, Felix Klein et David Hilbert. Après 
avoir achevé sa thèse en 1907 elle travaille bénévolement à l'Institut de 
Mathématiques d'Erlangen pendant 7 ans. En 1915, elle est invitée par David 
Hilbert et Felix Klein à rejoindre le très renommé département de mathématiques 
de l'université de Gôttingen jusqu'en 1933. En 1935, elle est opérée en raison d'un 
kyste ovarien et, malgré des signes de rétablissement, meurt 4 jours plus tard à 
l'âge de 53 ans. Elle reste dans l'histoire des mathématiques comme la fondatrice 
principale de l'Algèbre abstraite, ou algèbre moderne, qui est une des branches 
essentielles des mathématiques contemporaines. Cette algèbre abstraite prend de 
la hauteur par rapport aux calculs menés dans divers ensembles, munis de 
diverses opérations, et montre ce que ces calculs ont en commun. En physique, le 
théorème de Noether explique le lien fondamental entre la symétrie et les lois de 
conservation. Ses idées dans ont contribué aussi au progrès de la physique, en 
particulier dans la théorie de la Relativité. Malgré toutes ses qualités, elle eut des 
difficultés à mener une carrière normale de professeur d'université, car elle était 
une femme, dans un milieu exclusivement masculin. Elle bénéficia cependant de 
l'estime et de l'appui de David Hilbert, d'Albert Einstein et de Felix Klein. 


Oppenheimer, J. Robert (1904-1967), physicien américain né à New-York et 
décédé à Princeton. Il a été le directeur scientifique du projet Manhattan et y 
dirigea donc la mise au point des premières bombes atomiques. Entré à Harvard 
avec une année de retard à cause d'une attaque de colite ulcéreuse, il profite de 
cette période pour se rendre, avec son ancien professeur d'anglais, au Nouveau- 
Mexique. Il y devint amateur de promenades à cheval ainsi que des montagnes et 
plateaux de cette région. À son retour, il obtient son diplôme de chimie en 3 ans. 
Percy Bridgman lui fait découvrir la physique expérimentale. C'est durant ses 
études au laboratoire Cavendish d'Ernest Rutherford à Cambridge, qu'il réalise 
qu'il maîtrise mieux la théorie que la pratique en raison de sa maladresse. En 
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1926, il poursuit ses études sous la direction de Max Born à l'Université de 
Gôttingen, et obtient son doctorat à l'âge de 22 ans. À Gôüttingen, il publie des 
articles sur la théorie quantique. En 1927, il retourne à Harvard puis l'année 
suivante à l'Institut de technologie de Californie. Il est aussi connu pour sa 
contribution à la théorie quantique et à la théorie de la relativité, et pour ses 
études sur les rayons cosmiques, les positrons et les étoiles à neutrons. Il fait des 
recherches importantes en astrophysique, en physique nucléaire, et en 
spectroscopie. Il découvre alors l'approximation de Born-Oppenheimer. 


Ostrogradsky, Mikhaïl Vassilievitch (1801-1862) était un physicien et 
mathématicien ukrainien. Il commença ses études de mathématiques à l'université 
de Kharkov, et les continua ensuite à Paris où il fut en contact étroit avec les 
célèbres mathématiciens français Cauchy, Binet, Fourier et Poisson. De retour 
dans sa patrie, il enseigna à l'école des cadets de la Marine, à l'Académie du génie 
Nicolas et à l'école d'Artillerie de Saint-Pétersbourg. Il est célèbre en particulier 
pour avoir établi le théorème de flux-divergence, qui permet d'exprimer l'intégrale 
sur un volume (ou intégrale triple) de la divergence d'un champ vectoriel comme 
l'intégrale de surface (intégrale double étendue à la superficie qui entoure ce 
volume) du flux défini par ce champ. Il fut élu à l'Académie américaine des arts et 
des sciences en 1834, à l'Académie des sciences de Turin en 1841, et à 
l'Académie des sciences de Rome en 1853. Enfin il fut élu membre correspondant 
de l'Académie des sciences de Paris en 1856. Les travaux scientifiques 
d'Ostrogradski sont dans le droit fil des principes professés à cette époque à 
l'École polytechnique dans les domaines de l'analyse, et des mathématiques 
appliquées. En physique mathématique, il imagina une synthèse grandiose qui 
embrasserait l'hydromécanique, la théorie de l'élasticité, la théorie de la chaleur, et 
la théorie de l'électricité dans le cadre d'une seule méthode homogène. 


Pareto, Vilfredo (1848-1923), économiste et sociologue italien, dont la 
contribution la plus célèbre à la théorie économique est la définition du concept 
d'optimum économique. Né à Paris d'un père italien en exil et d'une mère 
française, il retourna en Italie à l'âge de 10 ans. Il fit ses études à l'université de 
Turin et devint ingénieur. En 1893, il fut nommé à la chaire d'économie politique 
de l'université de Lausanne (il décédera à Céligny en Suisse), où il succédait à 
Léon Walras. Parmi ses travaux figure l'analyse des anticipations des agents 
économiques. Celles-ci, n'étant pas indépendantes les unes des autres, peuvent 
susciter des mouvements d'opinion pessimistes qui génèrent des crises. Pareto est 
également le père de la notion d'optimum. L'économie est à un optimum lorsqu'on 
ne peut améliorer la situation d'un agent sans détériorer celle d'au moins un autre 
agent. Ce concept est très utilisé en économie, car il permet de prendre en compte 
la non-additivité des utilités des différents agents. La concurrence permet 
d'atteindre l'optimum au sens de Pareto. Pareto a également intégré les courbes 
d'indifférence (formalisées par Francis Edgeworth) à la logique walrassienne 
d'équilibre général. Le travail sociologique de Pareto fut plus discuté. Dans le 
Traité de sociologie générale, paru en 1916, il présenta sa théorie des élites, 
selon laquelle le pouvoir d'État est dans toutes les sociétés l'objet d'un combat 
entre les seules élites. Cette thèse discréditait les démocraties, et contribua 
implicitement au développement du fascisme alors montant en Italie. 
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Pascal, Blaise (1623-1662), mathématicien, physicien, théologien, mystique, 
philosophe, moraliste et polémiste né à Clermont et décédé à Paris. Enfant 
précoce (à 11 ans, il compose un court Traité des sons des corps vibrants et aurait 
démontré la 32e proposition du Ier livre d’Euclide, à 16 ans il écrit un traité sur 
les Coniques), il est éduqué par son père qui était mathématicien. Les tout 
premiers travaux de Pascal concernent les sciences naturelles et appliquées. Il 
contribua de manière importante à l’étude des fluides. Il a clarifié les concepts de 
pression et de vide, en étendant le travail de Torricelli. L'étendue des domaines 
d'intérêt et du génie de Pascal est impressionnante: inventeur de la machine à 
calculer, concepteur des premiers transports en commun en France, artisan de 
l'assèchement des marais poitevins il fut également l'un des plus brillants 
prosateurs de la langue française et l'une des plus grandes figures du 17ème siècle 
français. 


Pauli, Wolfgang (1900-1958) était un physicien autrichien, né à Vienne et décédé 
à Zürich, connu pour sa définition du principe d'exclusion en mécanique 
quantique, ce qui lui valut le prix Nobel de physique de 1945. Pauli est né d'un 
père professeur des universités et d'une mère journaliste et juriste. Au lycée à 
Vienne, Pauli était considéré comme un enfant prodige en mathématiques. À 
partir de 1919, il commence ses études de physique à l'université de Munich avec 
pour professeur Arnold Sommerfeld. Depuis 1898, Sommerfeld était en charge 
d'écrire le cinquième volume de la Enzyklopädie der mathematischen 
Wissenschaften (20'000 pages), consacré à la physique. Il requiert dans un 
premier temps la collaboration d'Albert Einstein pour rédiger l'article sur la 
relativité, mais ce dernier refuse. Sommerfeld fait alors appel à Pauli, dont la 
relativité était la spécialité lors de son inscription aux cours de Sommerfeld. C'est 
ainsi qu'à 21 ans, Pauli publie son article de synthèse des théories de la relativité 
restreinte et de la relativité générale. En 1921, il obtient son doctorat avec pour 
sujet l'atome d'hydrogène qui montra clairement la limite du modèle de l'atome de 
Bohr, auquel il travaillera en tant qu'assistant de Max Born à Gôttingen entre 
1921 et 1922. Pendant les années 1922 et 1923, il travailla aux côtés de Niels 
Bohr à Copenhague. Entre 1923 et 1928, il enseigna à Hambourg avant de partir à 
l'ETH de Zurich, où il obtint un poste de professeur de physique théorique. À 
partir de 1935, il est parti pour les États-Unis, où il occupe des postes de 
professeur invité, notamment à l'Institute for Advanced Study à Princeton durant 
les années 1935-1936, mais aussi à l'Université du Michigan, en 1931 et 1941, et 
l'Université Purdue, en 1942. En 1946, il obtient la citoyenneté américaine, mais 
revient la même année à l'ETH de Zurich, où une place de professeur lui avait été 
gardée. En 1949, il devient citoyen suisse. Dans les années 1950, il retourne 
régulièrement à Princeton afin de donner des cours en tant que professeur invité. 
Dans les dernières années de sa vie, il participa à la fondation du CERN. Il meurt 
d'un ulcère gastro-duodénal. 


Page: 4706/4839 


[v3.0 - 2013] 


Pearson, Karl (1857-1936) est un mathématicien britannique né à Londres et 
décédé à Surrey fondateur des statistiques modernes. L'analyse statistique connaît 
un grand développement à la fin du 19ème siècle au Royaume-Uni et Karl 
Pearson domine ses contemporains par l'étendue et la variété de ses contributions 
bien que s'étant intéressés aux statistiques seulement à partir de l'âge de 33 ans. Il 
développe des méthodes d'analyse pour l'étude de la sélection naturelle et de 
l'eugénisme dont il est un ardent promoteur. Ses principales contributions sont la 
création du test du d'indépendance du Khi-deux destiné à estimer si les écarts 
observés dans un ensemble de variables par rapport aux valeurs théoriques 
peuvent être attribués ou non à un échantillonnage au hasard et la définition du 
coefficient de corrélation. Il reçoit la médaille Darwin (biologie) en 1898. Pearson 
était aussi consultant dans les entreprises. Il a entre autres donné des cours à 
William S. Gosset qui introduisit la loi de Student en 1910. Il est l'un des 
fondateurs de la revue Biometrika dont il a été l'éditeur pendant 36 ans et qu'il a 
hissé au rang de meilleure revue de statistiques mathématiques. 


Penrose, Roger (1931-) physicien et mathématicien né à Colchester. Penrose 
obtient son diplôme en mathématiques de l'Université du Collège de Londres et 
son doctorat à l'université de Cambridge avec une thèse sur les méthodes 
tensorielles en géométrie algébrique. Entre 1964 et 1973, il enseigne la 
mathématique au Birkbeck College de Londres et rencontre le célèbre physicien 
Stephen W. Hawking avec lequel il travailla sur une théorie de l'origine de 
l'Univers en apportant sa contribution mathématique à la théorie de la relativité 
générale appliquée à la cosmologie et à l'étude des trous noirs. En 1965, à 
Cambridge, il prouve que des singularités gravitationnelles peuvent être formées à 
partir de l'effondrement gravitationnel d'étoiles massives en fin de vie. En 1971, 
Prenrose découvre les réseaux de spin qui devaient plus tard former la géométrie 
de l'espace-temps dans la théorie quantique à boucles. Professeur à Oxford, il 
reçut, avec Hawking, le prix Wolf 1988 pour la physique. 


Picard, Charles-Émile (1856-1941) né et décédé à Paris fait ses études 
classiques au lycée de Vanves dès 1864, puis au lycée Napoléon (futur lycée 
Henry IV) de 1868 à 1874 où il se révèle excellent élève, mais peu attiré par la 
mathématique. Il obtient cette année-là le baccalauréat ès lettres puis l'année 
suivante le baccalauréat ès sciences. Il est reçu second à l'École Polytechnique, et 
premier à l'École Normale Supérieure. Finalement, passionné par les sciences, il 
opte pour cette dernière, où il prépare l'Agrégation qu'il réussit en 1877. Après 
divers postes d'assistant à Paris et Toulouse, il devient en 1881 Maître de 
Conférences à l'École Normale Supérieure. Son nom est déjà célèbre dans le 
cercle des mathématiciens, car il a démontré un théorème important sur les 
singularités des fonctions holomorphe qui lui vaudra une nomination pour devenir 
membre de l'Académie des Sciences. Il est cependant trop jeune, et son élection 
est reportée en 1889. En 1885, Picard devient professeur à la Sorbonne, où il 
occupe la chaire de calcul différentiel. Là encore, son jeune âge est une gêne (il 
faut avoir au minimum 30 ans pour occuper un tel poste) et il faut utiliser une 
procédure astucieuse pour contourner la législation. Plus tard, Picard occupera la 
chaire d'analyse et d'algèbre, et il exercera aussi à l'École Centrale des Arts et 
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Manufacture (1894-1937): il y forme à la mécanique plus de 10'000 ingénieurs, et 
est, selon Hadamard, un excellent professeur. Les travaux de Picard sont ardus, et 
ouvrent la voie à de nouvelles recherches. Il est le premier à utiliser le théorème 
du point fixe dans une méthode d'approximations successives qui permet de 
résoudre des équations aux dérivées partielles. On lui doit également des travaux 
en géométrie algébrique, comme des recherches plus appliquées sur l'élasticité ou 
la chaleur. Il est aussi l'un des premiers défenseurs des théories d'Einstein. Son 
Traité d'Analyse constitua longtemps une référence, et Picard fut aussi philosophe 
et historien des sciences. Parmi les distinctions que Picard a reçues, citons qu'il 
présida le congrès International des mathématiciens, qu'il fut élu membre de 
l'Académie Française en 1924, et qu'il reçut la médaille d'or Mittag-Leffler en 
1597. 


Planck, Max (1858-1947) était un physicien allemand né à Kiel et décédé à 
Gôttingen considéré comme le fondateur de la physique quantique. Après avoir 
obtenu son baccalauréat à 17 ans à Münich où son père enseigne, Max Planck 
poursuit ses études de physique à Berlin. Passionné par la thermodynamique, il 
soutient une thèse de doctorat sur le second principe de la thermodynamique et la 
notion d'entropie 1879, notion qui restera le moteur explicatif de la majorité de 
ses recherches. L'année suivante, il devient maître de conférence à l'université de 
Munich puis obtient la chaire de physique de l'université de Kiel en 1885. Quatre 
ans plus tard, il est professeur de physique à l'université de Berlin, poste qu'il 
occupera pendant près de 40 ans. En 1930 il prend la direction de l'Institut Kaiser 
Wilhem pour la recherche scientifique qui portera bientôt son nom. Amorcées par 
sa thèse de doctorat, les recherches de Planck en thermodynamique se portent 
rapidement sur le corps noir. Entité purement théorique, le corps noir absorbe 
toutes les radiations qu'il reçoit (le noir de carbone, en absorbant 97% du 
rayonnement, se rapproche de cet idéal). Pour tenter d'expliquer ce phénomène, 
Planck élabore une nouvelle théorie. Il émet l'hypothèse que l'énergie d'un 
rayonnement ne peut être émise ou absorbée par la matière que par quantités 
finies, les quanta. Il montre alors que ces "paquets d'énergie" ont pour valeur hv, 
où v est la fréquence du rayonnement et h une constante universelle (la 
"constante de Planck"). En exposant sa théorie à la Société allemande de 
physique en 1900, à Berlin, Planck ne sait pas encore qu'il vient d'inventer une 
nouvelle branche de la physique: la physique quantique. Sa découverte entraînera 
alors la création du modèle de l'atome par Niels Bobhr, l'élaboration de la 
mécanique ondulatoire par Louis de Broglie , l'explication du phénomène 
photoélectrique par Albert Einstein ou encore la découverte du principe 
d'incertitude par Werner Heisenberg . Considéré comme l'un des plus célèbres 
physiciens, Planck recevra le prix Nobel en 1918. 
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Poincaré, Henri (1854-1912), mathématicien et physicien français né à Nancy et 
décédé à Paris dont on a dit qu'il était le dernier savant susceptible de connaître la 
totalité des mathématiques de son temps. Élève d'exception au Lycée Impérial de 
Nancy, il obtient en 1871, le baccalauréat ès lettres, mention Bien, et la même 
année son baccalauréat ès sciences. Il se classe premier au concours d'entrée à 
l'École polytechnique en 1873, puis à l'École des Mines de Paris, comme 
ingénieur du Corps des Mines, en 1875. Il est licencié ès sciences en 1876. 
Nommé ingénieur des mines de troisième classe en 1879 à Vesoul, il obtient, la 
même année le doctorat ès sciences mathématiques à la Faculté des sciences de 
Paris, et devient chargé de cours d'analyse à la faculté des sciences de Caen. Les 
premiers travaux de Poincaré portent sur les fonctions automorphes ou 
fuchsiennes, la théorie qualitative des équations différentielles et la théorie des 
fonctions. Dans une série de 6 articles publiés à partir de 1894, il est le créateur 
de la topologie algébrique, science en pleine expansion au 20ème siècle et dans 
laquelle plusieurs conjectures dues à Poincaré restent ouvertes. Il s'est vivement 
intéressé à la mécanique céleste: Les Méthodes nouvelles de la mécanique 
céleste, trois volumes parus entre 1892 et 1899, annoncent les recherches 
modernes sur les systèmes dynamiques et le chaos. En physique-mathématique, il 
dégagea les propriétés du groupe de Poincaré-Lorenz, qui allaient quelques mois 
plus tard conduire à l'article fondamental d'Einstein sur la relativité restreinte. 


Poisson, Siméon Denis (1781-1840) était un mathématicien français dont les 
travaux ont porté sur les intégrales définies, la théorie électromagnétique et le 
calcul des probabilités. Sa famille le força à faire des études de médecine qu'il 
abandonna, en 1798, pour aller étudier la mathématique à l'École polytechnique, 
où il fut l'élève de Laplace et Lagrange, qui devinrent l'un et l'autre ses amis. Il 
enseigna à l'École polytechnique à partir de 1802 et en 1808, il fut nommé 
astronome du Bureau des longitudes et, à sa création, en 1809, professeur à la 
Faculté des sciences. Les travaux les plus importants de Poisson portent sur les 
applications des mathématiques à la physique et à la mécanique. Son Traité de 
mécanique a été l'ouvrage de référence en mécanique pendant de nombreuses 
années. Un mémoire, publié en 1812, contient les lois les plus usuelles de 
l'électrostatique et la théorie selon laquelle l'électricité est constituée de deux 
fluides dont les éléments semblables se repoussent, tandis que les éléments 
différents s'attirent. En mathématiques pures, il a publié une série d'articles sur les 
intégrales définies, et ses recherches sur les séries de Fourier ont annoncé celles 
de Dirichlet et de Riemann sur ce sujet. C'est dans l'ouvrage Recherches sur la 
probabilité des jugements. (1837), qui est un livre important sur le calcul des 
probabilités, qu'apparaît pour la première fois la distribution de Poisson (ou "loi de 
Poisson"). Obtenue initialement comme une approximation de la loi binomiale de 
Bernoulli, elle est devenue fondamentale dans de très nombreux problèmes. Les 
autres publications de Poisson comprennent Théorie nouvelle de l'action (1831) 
et Théorie mathématique de la chaleur (1835). Le nom de Poisson est attaché à 
de nombreuses notions mathématiques et physiques (intégrale et équation de 
Poisson en théorie du potentiel, crochets de Poisson dans la théorie des équations 
différentielles, rapport de Poisson en élasticité et constante de Poisson en 
électricité). 
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Ramanujan, Srivanasa (1887-1920) est né à Erode, un petit village situé 400 km 
au sud de Madras, dans une famille pauvre de la caste des Brahmanes. Il passe 
son enfance dans la ville de Kumbakonam, où son père exerce le métier de 
comptable chez un drapier. À partir de l'âge de 5 ans, il fréquente différentes 
écoles primaires avant de pouvoir intégrer la Town High School en 1898. En 

1900, il commence à développer ses propres mathématiques en se basant sur son 
premier livre de mathématiques, La Trigonométrie plane. Il définit seul une 


méthode pour résoudre les équations du 3° degré, puis du 4°, puis il tente aussi de 


résoudre celles du 5° degré, ignorant qu'elles ne peuvent être résolues par les 
radicaux. On est alors en 1902 et c'est à cette époque que Ramanujan se procure 
le second (et dernier!) livre dans lequel il puisera ses connaissances 
mathématiques de bases, Synopsis of elementary results in pure mathematics, 
compilation d'environ 6000 théorèmes et autres formules par G.S. Carr. Ce livre 
étant essentiellement un livre de résultats, la plupart sans démonstrations, 
influencera le style futur de Ramanujan, qui n'a laissé que très peu de preuves de 
ses propres résultats. À 17 ans, sa démarche est déjà celle d'un chercheur en 
mathématiques. Comme ses résultats scolaires sont bons, il reçoit une bourse lui 
permettant d'entrer au Government College de Kumbakonam en 1904. 
Cependant, il consacre trop de temps à ses recherches en mathématiques et 
néglige les autres matières, ce qui lui vaut la suppression de cette bourse l'année 
suivante. Sans argent, il part, à l'insu de ses parents, pour la ville de Vizagapatnam 
où il poursuit ses travaux sur les séries hypergéométriques et les relations entre 
intégrales et séries. En 1906, il retourne à nouveau au lycée, à Madras cette 
fois-ci, avec l'idée de passer un examen lui permettant d'entrer à l'université. Il 
assiste quelques mois aux cours puis tombe malade. Au cours de l'examen, il 
réussit seulement en mathématiques et échoue partout ailleurs, ce qui lui interdit 
l'entrée à l'université de Madras. Dans les années qui suivent, il continue alors de 
développer seul ses idées, sans aucune aide extérieure et sans connaissance des 
thèmes de recherche possibles, en dehors de ceux découlant des notions abordées 
dans le livre de Carr. Ramanujan étudie ainsi les fractions continues et les séries 
divergentes en 1908. Il tombe alors de nouveau très malade et doit subir, en 1909, 
une opération dont il aura du mal à se remettre. Il commence alors de poser et de 
résoudre des problèmes mathématiques dans le journal de la Société Indienne de 
Mathématiques (SIM). En 1910, il développe des relations sur les équations 
modulaires elliptiques. Un an plus tard, la publication d'un article brillant sur les 
nombres de Bernoulli dans ce même journal lui vaut la reconnaissance de son 
travail par ses pairs. Bien qu'il ne possède aucun diplôme universitaire, il acquiert 
la réputation de génie des mathématiques dans la région de Madras. La même 
année, il rencontre le fondateur de la SIM, qui lui permet d'obtenir un emploi 
temporaire chez un comptable de Madras et lui conseille de contacter 
Ramachandra Rao, un mécène membre de la SIM. Grâce à cette lettre, 
Ramanujan obtient le poste et commence son travail en 1912. Il a alors la chance 
d'être entouré de personnes ayant une formation en mathématiques et qui 
s'intéressent à son travail. Le chef comptable du port de Madras est un 
mathématicien qui publie un article sur le travail de Ramanujan en 1913, On the 
distribution of primes. D'autre part, un professeur du Madras Engineering College 
est intéressé par les capacités de Ramanujan. Ayant lui-même fait ses études à 
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Londres, il écrit à un de ses professeurs de mathématiques, à qui il envoie de 
quelques résultats de Ramanujan. L'Université de Madras allouera plus tard une 
bourse à Ramanujan en 1913 et en 1914, Hardy le fait venir au Trinity College, à 
Cambridge. C'est le début d'une extraordinaire collaboration entre les deux 
hommes. En 1916, il obtient le titre de docteur de l'université de Cambridge, 
malgré qu'il ne possède pas les diplômes requis pour préparer une thèse. En 1918, 
Ramanujan est élu membre de la Cambridge Philosophical Society. Trois jours 
plus tard, probablement le plus grand honneur de toute sa carrière, son nom 
apparaît sur la liste des élections des membres de la "Royal Society of London”. Il 
a été proposé par une liste impressionnante d'éminents mathématiciens. Son 
élection a effectivement lieu en 1918 et il est également élu membre du Trinity 
College pour 6 ans. Ramanujan repart pour l'Inde en 1919. Cependant, son état de 
santé déjà très mauvais ne cesse de se dégrader. Il meurt l'année suivante 
probablement à cause de graves carences alimentaires. Ramanujan a laissé 
derrière lui un grand nombre de cahiers non-publiés (les fameux Carnets de 
Ramanujan), remplis de théorèmes que les mathématiciens continuent d'étudier. 
Aujourd'hui, ses travaux ont bien sûr des applications en physique théorique. 


Ricci-Curbastro, Gregorio (1853-1925) né à Lugo et décédé à Boulogne était 
un mathématicien spécialiste de la géométrie différentielle et l'un des pères du 
calcul tensoriel. Après des études de philosophie et de mathématiques, Ricci 
soutient sa thèse de doctorat à l'université de Pise. En 1880, il sera nommé 
professeur de physique-mathématique à l'université de Padoue. Levi-Civita fut 
son élève et contribua avec Ricci à l'élaboration de son calcul différentiel absolu 
(1900) visant à expliciter en mécanique, dans des espaces abstraits (variétés 
différentiables), des relations indépendantes du système de coordonnées utilisé, 
inhérentes au phénomène étudié (invariants différentiels). Associée à la géométrie 
différentielle de Gauss et de Riemann, le célèbre physicien Albert Einstein trouva, 
dans cette nouvelle approche de la mécanique qu'il nomma "calcul tensoriel" 
(1916), les outils mathématiques nécessaires à sa théorie de la relativité générale. 


Riemann, Georg Friedrich Bernhard (1826-1866) était un mathématicien 
allemand. Au lycée, Riemann étudie la Bible intensivement, mais il est distrait par 
les mathématiques. Il essaie même de prouver, mathématiquement, l'exactitude de 
la Genèse. Ses professeurs sont surpris par ses capacités à résoudre des problèmes 
complexes en mathématique. En 1846, grâce à l'argent de sa famille, il commence 
à étudier la philosophie et la théologie pour devenir prêtre afin de financer sa 
famille. En 1847, son père l'autorise à étudier les mathématiques. Il étudie d'abord 
à l'université de Gôttingen où il rencontre Carl Friedrich Gauss, puis à l'université 
de Berlin, où il a entre autres comme professeurs Jacobi, Steiner et Dirichlet. 
Dans sa thèse, présentée en 1851 sous la direction de Gauss, Riemann met au 
point la théorie des fonctions d'une variable complexe. En 1854 il donne un 
exposé qui jette les bases de la géométrie différentielle. Il y introduit la bonne 
façon d'étendre à n dimensions les résultats de Gauss lui-même sur les surfaces. 
Cette présentation a profondément changé la conception de la notion de 
géométrie, notamment en ouvrant la voie aux géométries non euclidiennes et à la 
théorie de la relativité générale. On lui doit également d'importants travaux sur les 
intégrales, poursuivant ceux de Cauchy, qui ont donné entre autres ce qu'on 


Page: 4711/4839 


[v3.0 - 2013] 


appelle aujourd'hui les intégrales de Riemann. Intéressé par la dynamique des gaz, 
il jette les bases de l'analyse des équations aux dérivées partielles de type 
hyperbolique. Il succédera à Dirichlet sur la chaire de Gauss en 1859. À 39 ans, il 
fut emporté par la tuberculose. 


Salam, Abdus (1926- 1996), physicien pakistanais, a reçu le prix Nobel de 
physique en 1979 pour ses travaux sur l'interaction électrofaible, synthèse de 
l'électromagnétisme et de l'interaction faible. Né à Jhang Sadar, il étudie au 
Government College à Lahore. À l'âge de 14 ans, Salam obtint les meilleurs notes 
jamais enregistrées pour l'examen d'entrée à l'Université du Punjab. Persécuté par 
la majorité musulmane de son pays pour son appartenance religieuse (ahmadiste), 
il doit fuir son pays. Réfugié en Grande-Bretagne, il obtient en 1952, un doctorat 
en mathématiques et en physique de l'université de Cambridge. Sa thèse doctorale 
fut une étude fondamentale en électrodynamique quantique. Ses travaux le 
rendirent célèbre internationalement. Il retourna au Government College de 
Lahore en tant que professeur de mathématiques, garda cette fonction de 1951 à 
1954, puis retourna ensuite à Cambridge en tant conférencier en Mathématiques. 
Il enseigne dans ces établissements, puis en 1957, est nommé professeur de 
physique théorique à l'Imperial College de Londres. Il y demeura jusqu'à sa 
retraite. En 1959, il devient le plus jeune membre de la Royal Society à l'âge de 
33 ans. Durant les années 1960, Salam joua un rôle important dans l'établissement 
de l'agence de recherche nucléaire du Pakistan, et de l'agence de recherche 
spatiale du Pakistan, de laquelle il fut le Directeur fondateur. En 1964, il devient 
directeur du Centre international de physique théorique de Trieste, nouvellement 
créé. Cette même année, il est lauréat de la Médaille Hughes. En 1967, avec le 
physicien Steven Weïinberg, Salam propose une théorie permettant d'unifier les 
interactions électromagnétiques et faibles entre particules élémentaires, théorie 
qui sera confirmée par l'expérience. Salam sera ainsi le premier musulman à 
obtenir le prix Nobel de physique en 1979, conjointement aux physiciens Sheldon 
Lee Glashow et Weinberg. 


Say, Jean-Baptiste (1767- 1832) était un économiste, journaliste et industriel 
français né à Lyon et décédé à Paris. Il est issu d'une famille de négociants nîmois 
ayant émigré à Amsterdam puis à Genève. C'est au cours d'un voyage en Grande- 
Bretagne, où la révolution industrielle est en cours, qu'il adoptera les idées 
libérales et en particulier les théories d'Adam Smith dont il sera un ardent 
défenseur de retour en France. En 1789, il publie la brochure: la Liberté de la 
presse. En 1792, il participe aux campagnes militaires de la Révolution française 
en Champagne. D'abord employé dans une banque, il dirigea ensuite une filature 
de coton à Auchy-lès-Hesdin, dans le Pas-de-Calais. Ses nombreux ouvrages 
d'économie politique firent qu'il fut nommé professeur au Conservatoire national 
des arts et métiers en 1821, puis au Collège de France en 1830. La "loi de Say", 
ou "loi des débouchés", stipule que plus les producteurs sont nombreux et les 
productions multiples, plus les débouchés sont faciles, variés et vastes. Dans une 
économie où la concurrence est libre et parfaite, les crises de surproduction sont 
impossibles. Il ne peut y avoir de déséquilibre global dans les économies de 
marché et de libre entreprise, il y a un équilibrage spontané des flux économiques 
(production, consommation, épargne, investissement). Cette loi est parfois réduite 
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à tort à la formule: toute offre crée sa propre demande. Un meilleur résumé de 
cette approche serait: on dépense que l'argent qu'on a gagné. L'économie de 
l'offre, dans la tradition de Say, s'oppose à l'économie de la demande, qui est celle 
de Malthus et plus tard de Keynes. 


Schaefer, Milner Baïily (1912-1970) né au Wyoming et décédé à San Diego a 
étudié à l'Université de Washington où il avait obtenu un baccalauréat en science 
en 1935. Dès l'obtention du baccalauréat, il a travaillé au département des pêches 
de l'état de Washington à Seattle. De 1937 à 1942, il a travaillé à la Comission des 
pêches du saumon du Pacifique à Westminster, Colombie-Britannique. Il a servi 
dans la marine durant la guerre et par la suite, il a occupé divers postes en tant 
que biologiste spécialiste des pêches. Après avoir terminé son doctorat à 
l'Université de Washington, en 1950, Schaefer est devenu directeur des enquêtes 
de l'TATTC (Inter-American Tropical Tuna Commission), une commission 
internationale des pêches. Pendant les dix années qui ont suivi, il a travaillé sur la 
théorique de la dynamique de la pêche et mis au point un modèle de population 
des espèces marines qui est connu sous le nom de "modèle de Schaefer". Au 
courant des années 1950, Schaefer est devenu de plus en plus impliqué dans 
plusieurs comités, groupes et organisations concernés par les ressources marines, 
en particulier la pêche et tous les aspects de l'océanographie. Durant cette 
période, il a donné des cours sur la dynamique et l'exploitation des populations de 
poissons. En 1962, il démissionna de son poste de directeur des enquêtes à la 
IATTC pour occuper le poste de directeur de l'Institut des Ressources marines de 
l'Université de Californie tout en agissant comme conseiller scientifique pour 
l'TATTC. 


Scholes, Myron (1941- ) né à Ontaria, il présente son doctorat en 1969 à 
l'université de Chicago. Il occupe en 1988 la chaire Frank E. Buck de professeur 
de finance au Graduate School of Business de l'université Stanford (Californie) où 
il dirige également des recherches pour l'Institution Hoover. Il a reçu le prix Nobel 
d'économie en 1997 pour avoir élaboré, avec Fischer Black, une méthode 
d'évaluation des instruments financiers dérivés (résultat mathématique novateur 
pour estimer les risques liés aux options sur actions) ayant ouvert de nouveaux 
horizons au champ des évaluations économiques. Le colauréat de Myron Scholes, 
Robert Merton, a joué un rôle très important dans l'élaboration de cette méthode 
d'évaluation ainsi que dans les applications qu'elle a permises pour améliorer la 
gestion des risques attachés aux nouveaux produits financiers. Déjà en 1900, 
Louis Bachelier, présentait à la Sorbonne une thèse de doctorat au titre 
visionnaire: Théorie de la spéculation. Dans les années 1960, des auteurs tels 
James Boness et Paul Samuelson (Prix Nobel d'économie en 1970) proposaient 
des modèles pour déterminer les prix d'équilibre des options. Leurs hypothèses ne 
se sont pas révélées suffisamment réalistes pour entraîner des applications, mais 
des améliorations apportées à ces modèles au début des années 1970 ont permis 
d'obtenir des résultats plus satisfaisants. C'est en 1973 que Scholes et Black 
mettent leurs compétences en commun et proposent la première version de la 
formule de calcul du prix des options qui leur vaudra le prix Nobel. Si Myron 
Scholes et Fischer Black ont eu l'intuition fondamentale de la démonstration, ils 
ont pris pour base de recherche le modèle d'équilibre des actifs financiers (ou 
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Capital Asset Pricing Model, dit C.A.P.M.) de leur compatriote William Sharpe 
récompensé à ce titre par le jury du Nobel en 1990 (les deux autres lauréats 
étaient Harry Markowitz et Merton Miller). 


Schrôdinger, Erwin (1887-1961) Né et décédé à Vienne il entre au Gymnase de 
cette même ville en 1898. Presque depuis son premier jour de classe jusqu'à son 
départ du lycée 8 ans plus tard, Schrôdinger fut un excellent élève. Il était 
toujours premier de sa classe en travaillant dur chez lui entre les quatre murs de 
son bureau personnel. Il poursuit ses études à l'université d'Téna. En 1920, il est 
nommé professeur à la Haute École technique de Stuttgart puis à l'université de 
Breslau l'année suivante. En 1927, il succède à Max Planck à l'université de 
Berlin. Israélite, il quitte le pays à l'avènement du national-socialisme pour se 
rendre à Oxford où il obtient une chaire en 1933. Sept ans plus tard, il devient 
professeur de physique théorique à Dublin à l'Institut des hautes études de l'État 
libre d'Irlande. Il ne rentrera en Autriche qu'en 1956. Schrôdinger comme son 
contemporain Albert Einstein avait horreur d'apprendre par coeur et d'être forcé 
de retenir des faits inutiles. Les premiers travaux de Schrüdinger portent sur 
l'étude des couleurs et la théorie des quanta. Mais il est avant tout reconnu pour 
ses recherches en mécanique ondulatoire, discipline développée par le Français 
Louis de Broglie. L'équation de Schrüdinger, élaborée en 1926, permet de calculer 
la fonction d'onde d'une particule se déplaçant dans un champ. En établissant 
cette équation de propagation, il donne à la mécanique quantique un outil intuitif 
aujourd'hui indispensable (au contraire de l'approche matricielle et abstraite de 
Heisenberg) qu'Einstein qualifia d'idée de Génie. Avec celle de Werner 
Heisenberg, la théorie de Schrüdinger constitue ainsi la base de la mécanique 
quantique. En 1933, Schrôdinger partage le prix Nobel de physique avec Paul 
Dirac pour leur contribution au développement de cette nouvelle discipline. 
Schrôdinger essaiera également d'appliquer sa théorie à la biologie et à la 
génétique dans ses ouvrages What is life (1944) et Science and Humanism 
(1951). 


Schwartz, Laurent (1915-2002) Mathématicien français né et décédé à Paris. 
Ses travaux sont principalement relatifs à l'analyse. Ancien élève de l'École 
normale supérieure, Laurent Schwartz a enseigné de 1959 à 1960 et de 1963 à 
1983 à l'École polytechnique. En 1975, il est élu membre de l'Académie des 
sciences. Sa thèse (1943) porte sur l'approximation et l'étude des sommes 
d'exponentielles. La théorie des distributions, dont l'idée initiale remonte à 1945, 
lui a valu la médaille Fields en 1950. Le langage et les notations de Schwartz pour 
les distributions ont été adoptées par les mathématiciens et constituent le cadre 
naturel de la théorie des équations aux dérivées partielles. De 1959 à 1962, 
Schwartz se consacre à la physique théorique: l'emploi des distributions lui permet 
une formulation mathématique correcte de la théorie des particules élémentaires. 
Il a aussi effectué des recherches sur les mesures de Radon et sur les espaces 
topologiques quelconques ; il a écrit diverses publications sur les probabilités 
cylindriques et les désintégrations de mesures. 
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Schwarzschild, Karl (1873-1916) était un astronome mathématicien et physicien 
né à Francfort et décédé à Postdam qui prédit l'existence des trous noirs. Sa 
curiosité pour les étoiles se manifesta dès ses premières années scolaires, lorsqu'il 
construisit un petit télescope. Témoin de cet intérêt, son père le présenta à un ami 
mathématicien qui avait un observatoire privé. Schwarszchild apprit à utiliser un 
télescope et étudia des mathématiques plus avancées qu'à l'école. Il devint célèbre 
avec ses deux premiers articles sur la théorie des orbites publiés à l'âge de 16 ans 
alors qu'il était encore au collège. Il étudia à l'université de Strasbourg, puis de 
Munich, et obtint son doctorat à l'âge de 23 ans pour des travaux sur les théories 
de Henri Poincaré. Il fut alors engagé en tant qu'assistant à l'Observatoire Kuffner 
à Ottakring. Il se consacra principalement à la photométrie: il accomplit un travail 
de pionnier pour améliorer les plaques photographiques et implanter leur 
utilisation en astronomie, ainsi que dans l'étude spectrale des étoiles. De 1901 à 
1909, il officia comme professeur au prestigieux institut de Gôttingen, où il eut 
l'occasion de travailler avec des personnalités telles que David Hilbert et Hermann 
Minkowski. Il occupa ensuite un poste à l'Observatoire d'astrophysique de 
Potsdam en 1909. Schwarzschild est surtout connu pour ses contributions 
théoriques, tant en physique du Soleil qu'en relativité générale, ou en cinématique 
stellaire, ainsi que dans divers domaines de l'astrophysique. En 1916, il détermina 
une grandeur, dite "rayon de Schwarzschild", dans le cadre de la théorie de la 
relativité, énoncée peu de temps avant par Albert Einstein. Lorsqu'une étoile 
suffisamment massive explose en supernova, la contraction gravitationnelle 
produit ce que l'on appelle un "trou noir": rien, pas même la lumière, ne peut sortir 
de ce champ de gravitation intense. Lorsque le rayon d'une masse gazeuse devient 
inférieur au "rayon de Schwarzschild" pour cette masse, elle s'effondre en trou 
noir. 


Shannon, Claude Flwood (1916-2001) né au Migichan et décédé au 
Massachusetts était un mathématicien spécialiste en mathématiques appliquées et 
ingénieur électricien , qui développa la théorie de la communication, aujourd'hui 
connue sous le nom de la "théorie de l'information". Shannon suivit les cours de 
l'université du Michigan et obtint en 1940 son doctorat de l'institut de technologie 
du Massachusetts, de la faculté duquel il devint un membre, en 1956, après avoir 
travaillé aux laboratoires de téléphone Bell. En 1949, Shannon publia la Théorie 
mathématique de la communication, un article dans lequel il présenta son concept 
initial pour une théorie unificatrice de la transmission et du traitement des 
informations. Les informations, selon cette théorie, incluent toutes formes de 
messages transmis, y compris ceux envoyés le long des canaux nerveux des 
organismes vivants. La théorie de l'information est aujourd'hui importante dans de 
nombreux domaines. 
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Sharpe, William Forsyth (1934- ) est un économiste né à Boston. L'Académie 
royale des sciences de Suède a décerné en 1990 le prix Nobel de sciences 
économiques à 3 professeurs américains: Harry Markowitz, Merton Miller et 
William Sharpe. Même si les travaux récompensés étaient déjà anciens et se 
situent pour l'essentiel entre 1950 et 1970, l'Académie a jugé que les lauréats 
étaient des novateurs dans le domaine de la théorie de l'économie financière et du 
financement des entreprises. Ils ont en effet tous contribué à faire sortir de 
l'ombre de quelques universités américaines, une nouvelle discipline: la finance. 
C'était la première fois que l'Académie royale de Suède récompensait des travaux 
traitant des marchés boursiers et de la gestion de portefeuilles plutôt que des 
grands équilibres économiques. William Sharpe, de l'université Stanford, fut 
récompensé pour son modèle d'équilibre des actifs financiers et pour ses travaux 
sur la théorie de la formation des prix des avoirs financiers. Il s'est aussi engagé 
dans ses recherches dans la voie ouverte par Harry Markowitz. Ce dernier avait 
en effet élaboré une procédure complexe de sélection des titres boursiers afin 
d'optimiser un portefeuille de placements. Mais la mise en oeuvre de ce modèle a 
très vite posé des problèmes d'ordre pratique, au point que la collecte des 
informations nécessaires et leur traitement devenaient presque impossibles avec 
les ordinateurs disponibles dans les années 1960. C'est la raison pour laquelle 
William Sharpe se mit à chercher une méthode de sélection des portefeuilles 
efficients plus simple. Il découvre que les variations de la rentabilité de chaque 
titre sont liées, linéairement, à la variation du marché dans son ensemble, mesurée 
par l'indice du marché concerné (par exemple l'indice Standard & Poor 500 aux 
États-Unis, ou le C.A.C. 40 en France). Le nombre de statistiques nécessaires s'en 
est trouvé fortement réduit: 302 statistiques au lieu de 3150 dans le modèle 
Markowitz pour 100 titres, 602 au lieu de 20'300 pour 200 titres et 10'002 au lieu 
de 125750 pour 300 titres, le calcul fut aussitôt facilité. C'est à partir de ce 
concept, simple en apparence, que Sharpe découvre ensuite le fameux coefficient 
Bêta reliant la rentabilité d'un titre à celle de l'indice du marché et constituant une 
mesure du risque associé à la volatilité du marché. Au-delà de leur apport 
pratique, les travaux de Sharpe ont contribué de façon décisive à la formulation 
d'une théorie de la formation des cours des actifs financiers plus connue sous le 
nom de "modèle C.A.P." (Capital Asset Pricing) ou, en français, de "Modèle 
d'équilibre des actifs financiers (MEDAF)". 


Smith, Adam (1723-1790), économiste et philosophe écossais, est né à Kirkcaldy 
et décédé à Edimbourg, en Écosse. Il étudia aux universités de Glasgow et 
Oxford. De 1748 à 1751, il enseigna la rhétorique et les belles-lettres à 
Édimbourg. Durant cette période, il se lia avec le philosophe David Hume, dont la 
pensée exerça une grande influence sur les conceptions de Smith en matière 
d'éthique et d'économie. Smith fut nommé professeur de logique en 1751 puis 
professeur de philosophie morale en 1752 à l'université de Glasgow. Plus tard, il 
rassembla les cours d'éthique qu'il dispensait et les publia dans sa première oeuvre 
maîtresse intitulée Theory of Moral Sentiments, en 1759. En 1763, il démissionna 
de son poste de professeur pour accompagner le duc de Buccleuch dans un 
voyage de 18 mois en France et en Suisse, en qualité de précepteur. De 1766 à 
1776, il vécut à Kirkcaldy où il travailla à son ouvrage fondamental, la The 
Wealth of Nations. Smith fut ensuite nommé commissaire des douanes à 
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Édimbourg en 1778, poste qu'il occupa jusqu'à sa mort. En 1787, il fut également 
nommé recteur de l'université de Glasgow. Son célèbre traité An Inquiry into the 
Nature and Causes of the Wealth of Nations (1776), première étude tentant de 
décrire la nature du capital et le développement historique de l'industrie et des 
échanges entre les pays européens, lui valut d'être considéré comme le père de la 
science économique moderne. La The Wealth of Nations constitue le premier 
essai traitant de l'histoire de la science économique qui considère l'économie 
politique comme une discipline autonome, distincte de la science politique, de 
l'éthique et de la jurisprudence. Smith y propose une analyse du processus de 
production et de répartition de la richesse, et démontre que les sources principales 
de tout revenu, c'est-à-dire les formes fondamentales dans lesquelles la richesse 
est distribuée, sont les rentes, les salaires et les profits. The Wealth of Nations 
affirme contre les physiocrates le principe selon lequel le travail est la source de 
toute richesse, et présente le développement de l'industrie comme une source 
d'accroissement de la production. Pour Smith, théoricien du capitalisme libéral, le 
progrès économique et moral procède de la concurrence, la production et les 
échanges de biens ne pouvant être stimulés, et en conséquence le niveau de vie 
général amélioré, que lorsque les gouvernements régulent et contrôlent au 
minimum les activités industrielles et commerciales individuelles. Pour décrire 
cette situation, il parle d'un ordre naturel réglé par la "main invisible", qui fait 
naturellement converger la somme des intérêts individuels vers l'intérêt général. 
En conséquence, trop d'intervention de l'État dans ce contexte de libre 
concurrence ne pourrait être que néfaste. 


Sommerfeld, Arnold (1868-1951) était un physicien allemand né à Kônigsberg et 
décédé à Münch. Il étudia les mathématiques et les sciences naturelles à 
l'université de Kônigsberg où il reçut son doctorat en 1891. Il occupa 
successivement les chaires de mathématiques à Clausthal (1897), de 
mathématiques appliquées à Aïx-la-Chapelle (1900) et de physique théorique à 
Munich (1906-1931). En 1897, il commença, avec C. F. Klein, un traité en 4 
volumes sur le gyroscope, qu'il mit 13 ans à terminer et, à la même époque, fit 
également des recherches dans d'autres domaines de physique appliquée et 
d'ingénierie, comme la friction, la lubrification et la radio. On lui doit une 
amélioration du modèle de Bohr (1916) introduisant des orbites elliptiques et des 
corrections relativistes. Ce nouveau modèle, qui implique une dépendance de 
l'énergie vis-à-vis du deuxième nombre quantique, permet d'expliquer la structure 
fine des raies spectrales émises par les atomes. Sommerfeld introduisit d'ailleurs la 
fameuse "constante de structure fine". Il s'intéressa également après Drude et 
Lorenz au modèle des électrons libres qui explique certaines propriétés des 
métaux, en particulier la conduction, en considérant un comportement quantique 
des électrons. Il participa ainsi aux développements de la théorie des bandes en 
physique du solide, formulant en 1928 l'idée selon laquelle les électrons occupent 
des états quantifiés dans la matière. 
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Stokes, George Gabriel (1819-1903) était un mathématicien et physicien né en 
Irlande et décédé à Cambridge. En 1841, il reçoit son diplôme avec mention 
d'honneur de l'université de Cambridge et entame une carrière de chercheur. 
Influencé par son ancien professeur, il se consacre à l'étude des fluides visqueux. 
Il publie en 1845 le résultat de ses travaux sur les mouvements des fluides dans sa 
thèse On the theories of the internal friction of fluids in motion. Son approche 
mathématique décrivant l'écoulement d'un fluide newtonien imcompressible dans 
un espace tridimensionelle, en ajoutant une force de viscosité à partir des 
équations d'Euler (Principes généraux du mouvement des fluides, 1755), est à 
l'origine des équations de Navier-Stokes. L'ensemble de ses recherches est 
synthétisé par son traité Report on recent research in Hydrodynamics, paru en 
1846, texte fondateur de l'hydrodynamique. Il devient dès 1849 professeur à la 
chaire de mathématique de cette même université. Élu en 1851 à la Royal Society, 
il en sera le président de 1885 à 1890. Les trois derniers postes cités avaient été 
occupés par Isaac Newton. Il est lauréat du prix Smith en 1841, de la médaille 
Rumford en 1852 et de la médaille Copley en 1893. 


Stefan, Josef (1835-1893) était un physicien autrichien né à Sankt Peter près de 
Klagenfurt et décédé à Vienne. Les travaux originaux de Stefan comprennent la 
théorie cinétique des gaz, l'hydrodynamique et surtout la théorie du rayonnement. 
Après des études à l'université de Vienne où il obtient son doctorat en 1858, 
nommé Privatdozent de physique-mathématique, il devient professeur de 
physique en 1863, puis directeur de l'Institut de physique (1866). Membre de 
l'Académie des sciences de Vienne, il en est le secrétaire à partir de 1875. Avant 
les travaux de Stefan, G. R. Kirchhoff avait déjà décrit les propriétés du "corps 
parfaitement noir ", susceptible d'absorber la totalité du rayonnement incident et 
d'émettre un spectre étendu de longueurs d'ondes. Stefan démontre 
empiriquement en 1879 que l'intensité du rayonnement du corps noir est 
proportionnelle à la quatrième puissance de sa température absolue, relation 
connue depuis sous le nom de "loi de Stefan-Boltzmann", Boltzmann l'ayant 
déduite en 1884 de considérations thermodynamiques. Cette loi constitue l'une 
des premières étapes importantes qui ont conduit à l'interprétation du 
rayonnement du corps noir et à la théorie quantique du rayonnement. 


Sturm, Charles François (1803-1855) Après avoir été étudiant à l'université de 
Genève (sa ville natale), Sturm se rend, pour être précepteur dans la famille De 
Broglie, à Paris, où il fréquente les plus grands savants de l'époque et où il se fixe 
définitivement à partir de 1825. Il détermine en 1826 la vitesse de propagation du 
son dans l'eau, ce qui lui vaut, l'année suivante, le grand prix de mathématiques 
proposé pour le meilleur mémoire sur la compressibilité des liquides. En 1829, il 
énonce le célèbre théorème qui porte son nom, essentiel pour l'étude des 
propriétés des racines d'une équation algébrique et qui précise le nombre de 
racines réelles d'une équation numérique comprises entre deux limites données. Il 
publie la démonstration de ce théorème en 1835. À partir de 1830, en liaison avec 
son ami Liouville, il aborde le problème de la théorie générale des oscillations et 
étudie des équations différentielles du second ordre (problème de Sturm- 
Liouville) dans plusieurs articles, dont Sur les équations différentielles linéaires 
du second ordre (1836) et Sur une classe d'équations à différences partielles 
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(1836). Les méthodes employées seront à l'origine de nombreux travaux et 
découvertes mathématiques. Il est élu en 1836 à l'Académie des sciences et 
travaille à l'École polytechnique. Succédant à Poisson, il enseigne, à partir de 
1840, à la faculté des sciences de Paris (chaire de mécanique). Ses Cours 
d'analyse de l'École polytechnique (1857-1863) et ses Cours de mécanique de 
l'École polytechnique (1861) seront publiés après son décès à Paris. 


Taylor, Brook (1685-1731), mathématicien anglais né à Edmonton et décédé à 
Londres, célèbre pour ses contributions au développement du calcul infinitésimal. 
Taylor fit ses études au collège Saint John, à Cambridge. Il obtint, en 1708, une 
remarquable solution du problème du centre d'oscillation, qui pourtant demeura 
inédite jusqu'en 1714 lorsque son droit de priorité lui fut contesté par Jean 
Bernoulli. L'ouvrage de Taylor, Methodus incrementorum directa et inversa 
(1715), ajoute aux mathématiques supérieures un nouveau chapitre, que l'on 
appelle de nos jours le "calcul des différences finies". Entre autres applications 
ingénieuses, il s'en sert pour déterminer la forme du mouvement d'une corde 
vibrante en le réduisant avec succès aux principes de la mécanique. Le même 
ouvrage contient la célèbre formule connue sous le nom de "théorème de Taylor", 
dont l'importance n'apparut qu'en 1772, quand Louis de Lagrange réalisa sa 
puissance et en fit le principe fondamental du calcul différentiel. Dans son essai 
Linear Perspective, Taylor pose les principes de l'art sous une forme originale et 
plus générale qu'aucun de ses prédécesseurs. Mais l'ouvrage souffrit de la 
confusion et du manque de clarté qui affectaient la plupart de ses écrits. Taylor fut 
élu membre de la Royal Society en 1712. Il siégea la même année au comité 
chargé de régler les querelles de priorité entre Newton et Leibniz et fut secrétaire 
de la société de 1714 à 1718. À partir de 1715, ses recherches prirent une 
orientation philosophique et religieuse. 


Teller, Edward (1908-2003) est un physicien nucléaire né à Budapest et décédé à 
Stanford. Il quitte Budapest en 1926 pour aller à Karlsruhe (Allemagne), afin 
d'étudier la chimie, mais très vite une affinité se créera avec la nouvelle théorie de 
la physique quantique ce qui l'amènera à étudier à l'université de Leipzig où il 
obtiendra son doctorat à l'âge de 22 ans. Teller obtint ce titre sous la direction de 
Werner Heisenberg qui participa plus tard activement dans le camp des 
nationalistes allemands lors de la seconde guerre mondiale. En 1935, Teller 
s'expatria aux États-Unis et ses compétences dans la physique de pointe 
l'amenèrent à se faire beaucoup de relations et une très bonne réputation dans la 
communauté scientifique. Il fut ainsi nommé professeur dans de nombreuses 
universités américaines et travailla en 1942 au projet Manhattan où il mena des 
travaux très importants qui permirent de créer la première bombe nucléaire à 
fission. Le travail effectué, Teller soutint la continuité du travail pour la recherche 
d'une bombe thermonucléaire par peur de l'avancée des Russes dans ce domaine 
(Teller était anticommuniste et très bon ami de Landau qui se fit arrêter par la 
police communiste). Teller réussit à convaincre l'administration américaine à 
financer les recherches pour une bombe à hydrogène et mena les travaux avec 
succès qui fait qu'on le considère aujourd'hui comme le père de la bombe H. 
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Tesla, Nikola (1856-1943) était un inventeur et ingénieur serbe de génie dans le 
domaine de l'électricité décédé à New York. Il est souvent considéré comme l'un 
des plus grands scientifiques dans l'Histoire de la technologie, pour avoir déposé 
plus de 900 brevets (qui sont pour la plupart repris au compte de Thomas Edison) 
traitant de nouvelles méthodes pour aborder la conversion de l'énergie. En 1875, il 
entre à l'École polytechnique de Graz, en Autriche, où il étudie la mathématique, 
la physique et la mécanique. Une bourse lui est attribuée par l'administration des 
Confins militaires (Vojna Krajina), le mettant à l'abri des problèmes d'argent. Ceci 
ne l'empêche cependant pas de travailler avec acharnement pour assimiler le 
programme des deux premières années d'études en un an. L'année suivante, la 
suppression des Confins militaires retire toute aide financière à Tesla, hormis 
celle, très maigre, que peut lui apporter son père, ce qui ne lui permet pas 
d'achever sa seconde année d'études. On lui doit le moteur électrique asynchrone, 
l'alternateur polyphasé, le montage triphasé en étoile, la commutatrice. Tesla 
découvre le principe de la réflexion des ondes sur les objets en 1900), il étudie et 
publie, malgré des problèmes financiers, les bases de ce qui deviendra presque 
trois décennies plus tard le radar. 


Thom, René (1923-2002) Mathématicien français auteur d'importants travaux en 
topologie différentielle. Né à Montbéliard et décédé à Bures-sur-Yvette, Thom fut 
élève de l'École normale supérieure. En 1958, il a reçu la médaille Fields pour sa 
théorie du cobordisme (relation d'équivalence entre variétés différentielles 
compactes). Dans une communication au colloque de Strasbourg (1951), Thom 
établit que, si les zéros d'un idéal polynomial forment une variété, c'est une variété 
bordante, et sa thèse, Espaces fibrés en sphères et carrés de Steenrod (1951), 
contient déjà en germe les principales méthodes cobordistes. C'est dans le dernier 
chapitre d'un mémoire de 1954 (Quelques Propriétés globales des variétés 
différentiables) que la théorie du cobordisme est exposée pour la première fois. 
Après 1955, Thom a surtout étudié les espaces feuilletés et les ensembles et 
morphismes stratifiés. On lui doit des résultats sur les approximations des 
transformations différentiables et leurs singularités, les comparaisons de structures 
différentiables sur une variété triangulée et une théorie de Morse pour les variétés 
feuilletées. Il est également l'un des premiers à avoir utilisé les techniques de 
"chirurgie" des variétés. Depuis 1969, Thom s'est consacré aux applications de la 
topologie aux phénomènes de la vie. Pour décrire la naissance et l'évolution des 
formes, il a élaboré une mathématique spécifique: sa théorie des catastrophes est 
une théorie des singularités de certaines équations différentielles. Concrètement, 
elle permet, à partir de phénomènes observés, de remonter à leurs causes 
inconnues, au moins partiellement. Thom a donné un exposé de ses travaux dans 
l'ouvrage Stabilité structurelle et morphogenèse (1973). 


Thalès de Milet (-624 av. J.-C.- -524 av. J.-C.) est le premier mathématicien 
dont l'histoire ait retenu le nom. Il est né à Milet, en Asie mineure, sur les côtes 
méditerranéennes de l'actuelle Turquie. Plus qu'un simple mathématicien, Thalès 
était un savant universel, curieux de tout, astronome et philosophe, très 
observateur. On ne démontrait pas ce qu'on avançait à l'époque de Thalès, on ne 
faisait que remarquer certaines propriétés. Mais la façon qu'avait Thalès de 
réfléchir, d'analyser des situations, d'en rechercher les causes font de lui le 
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précurseur des scientifiques (il s'en tenait à l'observation et à l'expérimentation). 
Une de ses grandes interrogations était l'eau, et les causes de la pluie. Il avait 
remarqué que l'air se transformait en pluie, et il en cherchait désespérément les 
réponses. Thalès a formulé plusieurs propriétés géométriques qu'il tenait peut-être 
des Égyptiens et dont les premières traces de démonstration connues sont bien 
ultérieures mais, ce faisant, il pose les premiers jalons du raisonnement sur des 
figures idéales grâce auquel il obtint plusieurs résultats connus sous le nom de 
"théorèmes de Thalès". Mais le fait d'armes de Thalès est sans conteste la 
prévision d'une éclipse du soleil, probablement celle du 8 mai 585 avant notre ère. 
On lui doit notamment la première connaissance de l'électricité, grâce à deux 
expériences. Il remarqua d'abord que l'ambre avait la propriété d'attirer les 
matériaux légers. Une autre expérience réalisée en Magnésie..., vers -600, lui 
permet de mettre en évidence les propriétés d'aimantation de l'oxyde de fer. 


Turing, Alan (1912-1954) Par ses travaux théoriques dans les domaines de la 
logique et des probabilités, Turing est considéré, sinon comme le fondateur des 
ordinateurs, en tout cas, comme l'un des pères spirituels de l'intelligence 
artificielle. Né à Paddington (Londres) Turing connaît une scolarité sans éclat 
malgré un esprit brillant et de nettes dispositions pour les sciences. En 1928, à la 
Sherborne School où il est entré 2 ans plus tôt, il fait une rencontre qui provoque 
en lui un déclic et l'amène à s'intéresser réellement à la science et plus exactement 
aux mathématiques. De 1931 à 1934, Alan Turing est étudiant en mathématiques 
au King's College de l'Université de Cambridge. Au cours de cette période, il 
prend connaissance des travaux de John von Neumann sur la mécanique 
quantique. Stimulé par ces recherches, il se lance dans l'étude de problèmes de 
probabilités et de logique. C'est aussi au King's College qu'il rencontre des 
théoriciens de l'économie comme John Keynes. Diplôme en poche, il apprend à 
l'été 1936 les avancées de Max Newman concernant l'élaboration d'une théorie 
mathématique sur l'incomplétude de Güdel et la question de la décidabilité de 
Hilbert. Si pour beaucoup de propositions, il est facile de trouver un algorithme, 
qu'en est-il de celles pour lesquelles l'algorithme, pas assez rigoureux, est 
insuffisant à valider la proposition? Doit-on en déduire qu'elles ne peuvent être 
validée? C'est désormais dans ce sens que vont s'orienter les recherches de Turing. 
En 1936 il reçoit le prix Smith pour ses travaux sur les probabilités et le concept 
de la "Machine de Turing”". Ce concept constitue la base de toutes les théories sur 
les automates et plus généralement celle de la théorie de la calculabilité. Il s'agit 
en fait de formaliser le principe d'algorithme, représenté par une succession 
d'instructions —agissant en séquence sur des données d'entrée -susceptible de 
fournir un résultat. Cette formalisation oblige Turing à développer la notion de 
calculabilité et à déterminer des classes de problèmes "décidables". Cela le 
conduit à introduire une nouvelle classe de fonctions: les "fonctions calculables au 
sens de Turing”". Au cours de son doctorat à l'Université de Princeton, de 1936 à 
1938, Turing conçoit l'idée de la construction d'un ordinateur. De retour à 
Cambridge, il poursuit ses études mathématiques et s'intéresse à la fonction zêta 
de Riemann. La seconde Guerre Mondiale lui offre bientôt l'opportunité de mettre 
en pratique ses théories. C'est au département des communications du Ministère 
des affaires étrangères britannique qu'il se retrouve confronté au secret d'Enigma, 
nom de code de la machine utilisée par la marine allemande pour communiquer 
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avec leurs sous-marins. Le cryptage utilisé par les Nazis échappait toujours aux 
modes d'investigation classiques. Mais avec la collaboration de W. G. Welchman, 
Turing réussit à percer le code en appliquant sa nouvelle méthode et, de façon 
indirecte, contribue ainsi à la victoire de la bataille de l'Atlantique. La guerre 
achevée, Turing intègre le National Physical Laboratory de Grande-Bretagne où il 
entreprend, en concurrence avec les projets américains, de créer le premier 
ordinateur. Les avancées technologiques lui laissent entrevoir la réalisation de cet 
objectif dans un avenir proche. En 1948, grâce à Newman, il obtient un poste de 
chargé de cours en mathématiques à l'Université de Manchester qu'il occupera 
jusqu'à la fin de sa vie. Deux ans plus tard, il participe avec Frederic Williams et 
Tom Kilburn à la réalisation d'un calculateur électronique, le Mark I, et conçoit à 
cette occasion un manuel de programmation. Dans la foulée, il publie Can a 
machine think ? dans lequel il fait la synthèse des bases mathématiques et 
conceptuelles de l'ordinateur électronique programmable et résume sa philosophie 
de la "machine intelligente". Il énonce également le célèbre "Test de Turing" qui 
se résume à une expérience dans laquelle un homme tient une conversation avec 
une machine. Comment dans ce cas, un observateur, par l'unique analyse des 
messages échangés, pourra-t-il distinguer l'homme de la machine? Turing était 
convaincu que tout n'était qu'un problème d'information et que le développement 
des technologies permettrait d'ici 50 ans aux machines de tenir en échec l'être 
humain au moins cinq minutes. Turing se suicida par empoisonnement au cyanure 
à cause des pressions homophobes qu'il subissait au Royaume-Uni. 


Van Der Waals, Johannes Diderik (1837-1923) Physicien néerlandais né à 
Leyde et décédé à Amsterdam. Van Der Waals fut tout d'abord instituteur dès 
l'âge de 20 ans avant de devenir, à la suite d'efforts solitaires, professeur dans 
l'enseignement moyen (1863). Il fréquenta les cours de l'université de Leyde de 
1862 à 1865 et enseigna la physique à Deventer et à La Haye (1866). En 1873, il 
fut reçu docteur par l'université de Leyde, après la défense d'une dissertation 
intitulée: Over de continuiteit van den gas en vloeistoftoestand qui contient la 
présentation de l'équation d'état qui porte son nom et conduit à des résultats 
beaucoup plus satisfaisants que l'équation classique des gaz parfaits au voisinage 
de la zone de liquéfaction. Cette étude contribua d'une façon décisive à accréditer 
l'idée de l'existence de forces intermoléculaires d'attraction et à déterminer le rôle 
du volume d'encombrement moléculaire dans le comportement des gaz à haute 
pression, deux concepts encore mal assurés à l'époque. Le succès rapide de la 
nouvelle théorie est illustré par les multiples traductions de la dissertation 
originale qui suivirent sa présentation. On sait à présent que l'équation de Van der 
Waals est encore imparfaite et qu'il serait téméraire de vouloir lui conserver le 
nom "d'équation des gaz réels" qui lui fut naguère attribué. En effet, des équations 
d'état encore mieux appropriées permettent d'atteindre aujourd'hui une 
approximation plus complète qui sont en général déduites de considérations de 
cinétique moléculaire fondées sur le théorème du viriel des forces. De 1877 à 
1907, date de sa retraite, Van der Waals occupa la chaire de physique à 
l'université d'Amsterdam. C'est pendant cette période qu'il fit connaître sa loi dite 
"loi des états correspondants" (1880). Cette équation d'état unique pour tous les 
corps purs contribua largement, elle aussi, à sa renommée, car elle servit par la 
suite de guide aux essais préalables à la liquéfaction de l'hydrogène et de l'hélium. 
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D'un autre point de vue, cette contribution de Van der Waals est également 
considérée comme l'une des premières tentatives pour exprimer des lois de la 
physique en fonction de variables réduites. Parmi les autres travaux de Van der 
Waals, citons une contribution à la théorie moléculaire des mélanges binaires et 
l'étude de la capillarité. Le prix Nobel de physique lui a été décerné en 1910 pour 
ses travaux concernant l'équation de l'état d'agrégation des gaz et des liquides. 


Viète, François (1540-1603) né à Fontenay-le-Comte et décédé à Paris. Viète est 
célèbre aujourd'hui en tant qu'inventeur de l'algèbre moderne. Or, à son époque, il 
était plus connu comme maître des requêtes et conseiller privé d'Henri IV que 
comme mathématicien. Toute sa vie est en effet marquée par cette dualité d'une 
carrière politique brillante et d'un ardent travail de cabinet sur les plus hauts 
problèmes posés par la mathématique de son siècle. Son oeuvre scientifique a 
beaucoup souffert de ses nombreuses occupations politiques et du peu de temps 
qu'elles lui laissaient. Il reste néanmoins que la contribution de Viète au 
développement des mathématiques à la fin du 16ème siècle est fort importante. 
Elle se caractérise par l'introduction systématique de la représentation littérale 
dans les problèmes algébriques, tant pour les inconnues que pour les quantités 
connues, ce qui présente le principal avantage de traiter le cas général et non les 
cas particuliers et de s'intéresser à la structure des problèmes plutôt qu'à leur 
expression. Dans sa jeunesse Viète est l'élève des franciscains, au collège des 
Cordeliers. Il poursuit ses études de droit à la faculté de Poitiers et entra dans la 
vie active comme avocat. Il est nommé conseiller au parlement de Bretagne en 
1573, il y séjourne en fait assez peu, occupé qu'il est par ses travaux 
mathématiques et les missions confidentielles que lui confie le roi. On retrouve 
ensuite sa trace à Paris en 1579 où il publie le Canon mathematicus, accompagné 
du Liber singularis. Nommé maître des requêtes de l'hôtel du roi en 1580, il est 
démis de sa fonction en 1585, à la suite de conflits de personnes. En 1589, il est à 
Tours et prépare la publication de son oeuvre scientifique. Il s'occupe également 
de cryptographie statistique pour le compte du roi. Il regagne Paris avec ce 
dernier et est nommé conseiller privé. Viète décédera après une assez longue 
période de déclin du à la maladie. 


Walras, Léon (1834-1910) était un économiste français né à Évreux et décédé à 
Clarens. Il est le fils d'Auguste Walras, un économiste français dont la pensée 
influencera beaucoup celle de son fils, dans le domaine de la réforme sociale en 
général et foncière en particulier. Il étudie au collège de Caen en 1844, puis au 
lycée de Douai en 1850. Il est diplômé bachelier-ès-lettres en 1851 et bachelier- 
ès-sciences en 1853. La même année, il n'est pas déclaré admissible à l'École 
polytechnique et ce aussi lors d'un second essai. En 1854, il est reçu élève externe 
à l'École des Mines de Paris, mais il n'a pas d’intérêt pour la formation d'ingénieur 
et il abandonne cette école. Nommé professeur à l'université de Lausanne, Walras 
dénonça à partir des années 1870, les théories économiques libérales alors 
enseignées dans les universités, qu'il jugeait incapables de rendre compte des 
problèmes économiques de son temps. Dans ses Éléments d'économie politique 
pure (1874), sa critique vise en particulier les théories de la valeur travail et de la 
rente foncière mais à travers lui c'est tout l'héritage classique qu'il remet en cause 
(notamment celui d'Adam Smith). Influencé par le mathématicien Antoine 
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Cournot, il est l'un des premiers à introduire de manière systématique le calcul 
mathématique en économie. Walras place l'entreprise au coeur de l'économie et 
s'intéresse à son action dans le cadre d'une concurrence entre agents, ainsi que 
dans celui d'une interdépendance de tous les marchés économiques: les marchés 
des produits (biens et services) et ceux des facteurs de production (notamment la 
terre, le travail et les capitaux). Il se demande comment se fixent les prix et les 
quantités de façon simultanée, et pose le problème de l'équilibre général, c'est- 
à-dire de la stabilité des équilibres sur tous les marchés. L'attention portée à cette 
question caractérise les membres de l'École de Lausanne, en particulier le 
successeur de Walras, Vilfredo Pareto. Avec l'Autrichien Carl Menger et le 
Britannique Stanley Jevons, qu'il ne connaissait pas au moment où il s'engageait 
sur cette voie, il est considéré comme l'un des fondateurs du courant néoclassique 
et du marginalisme. 


Weber, Wilhelm (1804-1891), physicien allemand né à Wittenber et décédé à 
Gôttingen qui se spécialisa en électrodynamique. Weber écrivit, en 1824, un traité 
sur le mouvement ondulatoire avec son frère aîné, Ernst Heinrich Weber, 
anatomiste réputé, et étudia, avec son frère cadet Eduard Friedrich Weber le 
mécanisme de la marche (1836). À Güttingen, il collabora avec Carl Friedrich 
Gauss pour l'étude du géomagnétisme, et il relia leurs laboratoires par un 
télégraphe électrique: ce fut l'une des premières transmissions par télégraphe que 
l'on connaisse. Sa réalisation majeure fut celle qu'il mena à Leipzig, avec 

EW.G. Kohlrausch: il détermina le rapport des unités de charge électrostatiques et 
électrodynamiques (la constante de Weber) qui se révéla être l'équivalent d'une 
vitesse, et fut utilisé plus tard par James Clerk Maxwell pour renforcer sa théorie 
sur l'électromagnétisme. 


Weierstrass, Karl Theodor Wilhelm (1815-1897) était un mathématicien 
allemand, qui donna à la théorie des fonctions sa forme moderne en précisant en 
particulier le formalisme des limites et est considéré à ce titre comme le père de 
l'analyse moderne. Né à Ostenfelde, il fit ses études à Bonn et à Münster où il fut 
instituteur. C'est là qu'il s'intéressa aux mathématiques, et plus particulièrement à 
l'étude des fonctions elliptiques. Pendant de nombreuses années, Weierstrass 
travailla dans l'ombre pour établir sa théorie des fonctions de variable complexe, 
qui repose sur les développements en série entière. En 1854, il publia un mémoire 
sur les intégrales abéliennes et sur l'inversion des intégrales hyperelliptiques, qui 
établit sa réputation comme mathématicien et lui valut un doctorat honoraire de 
l'université de Kônigsberg. Nommé professeur à l'université de Berlin, il enseigna 
de 1864 à sa mort. Il a peu publié de son vivant et sa réputation est venue 
principalement de l'influence de ses cours à Berlin. Ceux-ci furent suivis par de 
nombreux mathématiciens et établirent la théorie des fonctions sur des bases de 
rigueur auxquelles son nom reste attaché, la "rigueur weierstrassienne". Il est 
aussi connu pour avoir rendu public un exemple de fonction continue nulle part 
dérivable (fonction de Weierstrass). 
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Weyl, Hermann (1885-1955) est un des mathématiciens les plus influents du 
20ème siècle, l'un des premiers à combiner la relativité générale avec les lois de 
l'électromagnétisme. Ses recherches en mathématiques portèrent essentiellement 
sur la topologie et la géométrie. Il effectua des recherches en mécanique 
quantique et en théorie des nombres. Né à Elmshorn à proximité de Hambourg en 
Allemagne, Weyl étudia de 1904 à 1908 à Gôttingen et à Munich, principalement 
intéressé par la mathématique et la physique. Son doctorat fut soutenu à 
Gôttingen sous la direction de Hilbert et Minkowski. En 1910, il obtint un poste 
d'enseignant comme lecteur privé à Gôüttingen. Il enseigna la mathématique à 
l'École polytechnique fédérale de Zürich en Suisse en 1913. C'est à Princeton qu'il 
travailla avec Einstein. Weyl rechercha une unification de la gravitation et de 
l'électromagnétisme. Cette recherche donna des explications de la violation de la 
non-conservation de la parité, une caractéristique des interactions faibles. Weyl 
continua à travailler à l'IAS jusqu'à sa retraite en 1952 ; il mourut à Zurich. En 
1918, il introduit la notion de jauge, première étape de ce qui deviendra la théorie 
de jauge. En réalité, sa vision était une tentative non réussie de modéliser les 
champs électromagnétiques et gravitationnels comme des propriétés géométriques 
de l'espace-temps. Ces travaux se révélèrent fondamentaux pour comprendre la 
symétrie des lois de la mécanique quantique. Il en posa les bases, donnant 
naissance aux spineurs, devenus familiers autour des années 1930. 


Weinberg, Steven (1933- ) Né à New York il débuta ses études à New York 
même puis à l'université Cornell (dans l'État de New York) et soutint, en 1957 à 
Princeton, sa thèse sur les effets de l'interaction forte dans les processus dominés 
par l'interaction faible. Chercheur à l'université de Californie à Berkeley de 1959 
à 19686, il s'intéressa à de multiples problèmes en théorie quantique des champs, 
en physique des particules et en astrophysique. Professeur à Harvard à partir de 
1973, il contribua de façon décisive à la compréhension moderne des interactions 
fondamentales. Il rejoignit l'université du Texas à Austin en 1982. L'unification 
des forces fondamentales a sous-tendu les efforts des physiciens modernes depuis 
Newton, Maxwell et Einstein qui, après avoir uni l'espace et le temps, tenta, mais 
en vain, d'englober en une seule théorie gravitation et électromagnétisme. La 
découverte, au début du 20ème siècle, des deux forces nucléaires, les interactions 
faible et forte, donna un nouvel élan à ces tentatives. En 1967, Weïinberg et le 
physicien pakistanais Abdus Salam proposèrent, indépendamment, que 
l'électromagnétisme et l'interaction nucléaire faible soient issus d'une même 
interaction électrofaible, dont la symétrie de jauge est spontanément brisée et 
dont le vecteur est un triplet de bosons massifs et le photon. Quelques années plus 
tard des expériences au CERN de Genève apportaient les premières confirmations 
du modèle de Weinberg-Salam. Le prix Nobel de physique 1979 (partagé avec 
l'Américain Sheldon Lee Glashow, pour l'importance de ses travaux de 
précurseur) récompensa les deux auteurs de ce qu'on appelle maintenant le 
"modèle standard" des interactions électrofaibles. Pédagogue, Weinberg est 
l'auteur de plusieurs cours de physique de haut niveau, tant sur la gravitation que 
sur la théorie des champs. Vulgarisateur de talent, son livre Les Trois Premières 
Minutes de l'Univers fut un succès mondial. 
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Wilcoxon, Frank (1892-1965) était un chimiste et statisticien connu pour le 
développement de tests statistiques très répandus! Frank Wilcoxon est né de 
parents américains à County Cork en Irelande. Il a grandi a Catskill, New York 
mais a suivi une partie de sa scolarité en Angleterre. En 1917, il est diplôme du 
collège militaire de Pennsilvanie avec une licence. Après la première guerre 
mondiale, il début des cours de maîtrise à l'université de Rugters où il obtint sa 
maîtrise en chimie en 192 en ensuite à l'université de Cornell où il obtint son 
doctorat en chimie physique en 1924. Wilcoxon commença sa carrière de 
chercheur à l'institut Boyce Thompson en 1925 et y resta jusqu'en 1941. Ensuite, 
il prit un poste dans la compagnie Atlas Powder où mis en place et dirigea le 
laboratoire de contrôle avant de joindre la compagnique chimique American 
Cyanimid en 1943. Pendant cette période il développa un intérêt pour la 
statistique inférentielle à travers les lectures des textes de R.A. Fisher de 1925. Il 
prit sa retraite en 1957. Pendant sa carrière, Wilcoxon publia 70 articles, le plus 
connu étant celui contenant les deux tests statistiques qui portenent ce nom: le 
test de la somme des rangs de Wilcoxon et le test de la somme des rangs signés de 
Wilcoxon. Il s'agit d'alternatives non paramétriques aux tests-t de Student. Over 
his career Wilcoxon published over 70 papers. His most well-known paper 
contained the two new statistical tests that still bear his name, the Wilcoxon 
rank-sum test and the Wilcoxon signed-rank test. Wilcoxon mourut après une 
brève maladie 


Witten, Edward (1951- ) Mathématicien et physicien américain, lauréat de la 
médaille Fields en 1990. Né à Baltimore (Maryland), Edward Witten fait ses 
études supérieures à l'université Brandeis à Waltham (Massachusetts), puis à 
l'université de Princeton (New Jersey), où il soutient sa thèse de doctorat en 
physique en 1974. Chercheur à l'université Harvard de 1976 à 1980, il enseigne 
ensuite à l'université de Princeton, puis devient membre de l'Institute for 
Advanced Study de Princeton en 1987. Après des travaux en physique théorique 
des particules élémentaires, Witten axe ses recherches sur la physique- 
mathématique et contribue en particulier de façon déterminante au 
développement des théories des supercordes dans l'espoir que celles-ci pourraient 
émerger vers une compréhension de l'interaction gravitationnelle au niveau 
quantique. En mathématiques, il a contribué à l'étude de la théorie de Morse, 
démontrant les inégalités classiques de Morse en reliant les points critiques à 
l'homologie. En 1987, il démontre une suite infinie de théorèmes de rigidité sur 
l'espace des solutions d'équations différentielles, telles que l'équation de Rarita- 
Schwinger, rencontrées en physique. En théorie des noeuds, il a montré en 1989 
qu'on peut interpréter les invariants de noeuds de Vaughan Jones comme des 
intégrales de Feynman pour une théorie de jauge tridimensionnelle. Il a, de plus, 
exploré les relations entre la théorie quantique des champs et la topologie 
différentielle des variétés bi- ou tridimensionnelles. Les progrès récents dans la 
compréhension des modèles bidimensionnels de la gravitation sont largement dus 
à l'influence des idées originales de Witten. 
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Yang, Chen-Ning (1922- ) Professeur à l'université chinoise de Hong Kong et à 
l'Université de Tsinghua à Pékin, professeur émérite de l'Université de New York à 
Stony Brook, Yang est l'un des plus grands physiciens théoriciens de la seconde 
moitié du 20ème siècle. Il obtient son Master of Science à l'Université de Tsinghua 
en 1944. Il s'inscrit en 1946 à l'Université de Chicago que Fermi venait de 
rejoindre. Plus tard, il décide de se consacrer à la physique théorique et, en 1949, 
il soutient sa thèse avec un travail sur la phénoménologie des réactions nucléaires. 
Sa carrière débute à l'Institute for Advanced Studies à Princeton en 1949. En 
1965, il refuse de succéder à Oppenheimer comme directeur, mais il décide en 
1966 de sortir de sa tour d'ivoire et finit par accepter la chaire Einstein et le poste 
de directeur de l'Institut de physique théorique de la toute nouvelle Université de 
New York à Stony Brook. À partir de 1971 il s'engage très activement dans le 
rétablissement des relations scientifiques entre la Chine et les États-Unis et 
s'implique dans la création de nouveaux instituts de recherche, en particulier à 
Nankin. Les contributions de Yang se caractérisent par leur profondeur, par 
l'ampleur et la variété de leur spectre, de la phénoménologie des particules à la 
théorie quantique des champs, en passant par la mécanique statistique ainsi que 
par différentes incursions en physique de la matière condensée. Ses travaux sur la 
brisure de la symétrie par réflexion d'espace (ou violation de la parité) dans les 
interactions faibles constituent un exemple parfait d'analyse phénoménologique 
d'une expérience en contradiction avec les idées reçues, à savoir l'absence d'une 
orientation privilégiée de l'espace dans les lois de la physique. Son grand mérite 
porte sur deux points: d'une part, il met en évidence le fait que l'hypothèse en 
question n'avait pas été testée pour les interactions faibles et, d'autre part, il a 
imaginé tout un ensemble de tests nouveaux pour l'invariance par réflexion 
d'espace. Ce bond en avant de la théorie des interactions faibles a permis 
d'aboutir, avec l'introduction des champs de Yang-Mills, au modèle standard 
électrofaible. L'idée de Yang fut de généraliser l'invariance de jauge aux groupes 
des rotations dans un espace abstrait à 3 dimensions censé décrire les degrés de 
liberté interne des champs de matière. Les champs de Yang-Mills s'imposèrent 
comme outil fondamental pour la construction d'une théorie prédictive de 
l'ensemble des interactions faibles, fortes et électromagnétiques, événement 
décisif qui engagea la révolution de la physique des années 1970. L'ensemble de 
ses travaux ont eu un impact considérable en physique théorique. Près de 20 ans 
après la publication de son article avec Mills, Yang a donné une reformulation 
précise de la théorie des champs de Yang-Mills dans le cadre rigoureux des 
espaces fibrés. L'analogie avec la théorie de la gravitation devient ainsi apparente 
et les notions de courbure et de transport parallèle s'introduisent naturellement. 
Des solutions particulières des équations de Yang-Mills, comme celle découverte 
par Gerard't Hooft, sont utilisées par les mathématiciens pour explorer les 
propriétés des variétés différentielles à quatre dimensions. Yang a reçu de 
nombreux prix scientifiques, dont le prix Nobel de physique en 1957 qu'il a 
partagé avec Tsung-Dao Lee. Ce prix prestigieux leur a été accordé pour leurs 
travaux sur les lois de la parité dans le domaine des particules élémentaires. Ces 
travaux fondamentaux sont particulièrement importants parce qu'ils ont montré 
que la symétrie droite-gauche des particules élémentaires, universellement admise 
à l'époque, était tout simplement incorrecte, ce qui fut ensuite prouvé 


expérimentalement. 
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Yukawa Hideki (1907-1981), physicien japonais, né et décédé à Tokyo, il était le 
cinquième de sept enfants qui devinrent tous des universitaires renommés. Il fut 
très vite porté vers la mathématique et la philosophie. Admis au département de 
physique de l'université de Kyoto en 1926, grand lecteur, Yukawa se passionna 
vite pour les nouvelles conceptions philosophiques accompagnant la relativité et 
la théorie des quanta, conceptions qu'il avait découvertes en particulier dans les 
ouvrages de Max Planck. En marge de ses études, il eut connaissance des 
développements contemporains de la physique quantique qui aboutirent à sa 
formulation bien établie vers la fin des années 1920. Il obtint son diplôme à 
l'université de Kyoto en 1929 et commença, dès lors, des recherches personnelles 
dans la double direction de la physique quantique relativiste et de la physique 
nucléaire qui se dessinait alors. Il s'attacha tout d'abord au problème de la liaison 
nucléaire électron-proton, le neutron étant une particule encore inconnue, puis à 
la théorie quantique des champs. Tout en enseignant la physique quantique, 
Yukawa poursuivait ses recherches sur les problèmes de la physique des noyaux. 
En 1934, il s'attaqua au problème de la force nucléaire, que la théorie de Fermi 
était impuissante à résoudre. Il reprit une idée qu'il avait déjà considérée lors de 
ses premiers travaux, celle d'une force d'échange, transmise entre le neutron et le 
proton par une particule nouvelle associée à un champ nouveau, dont il se 
proposait de déduire les propriétés à partir de la force nucléaire. C'est en octobre 
1934 qu'il découvrit la solution, en obtenant une relation entre la masse de cette 
particule d'échange hypothétique et la portée de l'action des forces nucléaires. La 
particule de Yukawa, le méson, devait avoir une masse valant 200 fois celle de 
l'électron. Il fallait supposer que ces mésons étaient de spin entier ou nul, qu'ils 
obéissaient à la statistique de Bose-Einstein et qu'ils étaient pourvus de charges 
positive et négative. Ce travail n'attira pas l'attention jusqu'au jour où d'autres 
chercheurs annoncèrent la découverte d'une particule nouvelle dans le 
rayonnement cosmique, ayant la masse prévue par Yukawa. Il apparut toutefois 
que l'interaction de ce méson avec la matière était trop peu intense pour qu'il 
puisse être la particule d'échange des forces nucléaires. La théorie des deux 
mésons pallia la difficulté. Il avait découvert entre-temps le mécanisme de 
désintégration du noyau par capture d'un électron orbital, en appliquant la théorie 
de Fermi. Il fut le premier Japonais à recevoir le prix Nobel de Physique, en 1949, 
pour sa théorie mésique des forces nucléaires. Yukawa fonda l'institut de 
recherches de physique fondamentale de l'université de Kyoto et le dirigea jusqu'à 
sa retraite, en 1970. Il ne se cantonna pas dans une activité de physicien: il écrivit 
des essais sur la créativité scientifique et milita en faveur de la paix, signant 
l'appel d'Albert Einstein et de Bertrand Russell contre l'utilisation des armes 
atomiques. 


Young, Thomas (1773-1829), physicien, médecin et égyptologue britannique né à 
Milverton et décédé à Londres, surtout connu pour ses découvertes en optique 
(phénomènes d'interférence), en élasticité des matériaux et en médecine 
(explication de la vision colorée).À l'âge de 14 ans il se débrouille déjà dans plus 
d'une dizaine de langues étrangères. Young commence à étudier la médecine en 
1792 à Londres, part en 1794 pour Édimbourg, puis un an plus tard pour 
Gôttingen, où il obtient le titre de docteur en physique en 1796. En 1799, il 
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commença à pratiquer la médecine à Londres. À partir de 1802, et jusqu'à sa 
mort, il occupa le poste de secrétaire de la Royal Society. En 1811, Young fut 
nommé à l'hôpital Saint-George de Londres. Il fit partie de plusieurs commissions 
scientifiques officielles et, à partir de 1818, il fut nommé secrétaire du Bureau des 
longitudes et éditeur de l'Almanach nautique. En optique, Young découvrit le 
phénomène des interférences, et contribua ainsi à établir le caractère ondulatoire 
de la lumière. Il fut le premier à décrire et à mesurer l'astigmatisme et à trouver 
une explication physiologique à la sensation de couleur. Young est également 
connu pour ses travaux sur les théories de la capillarité et de l'élasticité. Il 
contribua également au déchiffrage des hiéroglyphes inscrits sur la pierre de 
Rosette. Ses écrits comportent d'importants travaux en médecine, en égyptologie 
et en physique. 


Zeeman, Pieter (1865-1943) était un physicien né Zonnemaire et décédé à 
Amsterdam. Il commença à s'intéresser très jeune à la science. En 1883 lors 
d'aurores boréales visibles aux Pays-Bas, Zeeman, alors étudiant au collège, fit 
une description et un dessin détaillé du phénomène qui fut publié dans la revue 
Nature. Après avoir passé ses examens d'entrée en 1885, il étudia la physique à 
l'université de Leiden sous la direction de Hendrik Lorentz. En 1890, avant même 
de terminer sa thèse, il devint l'assistant de Lorentz. Celà lui permit de participer à 
un programme de recherche sur l'effet Kerr. En 1893 il soumit sa thèse sur l'effet 
Kerr, la réflexion de la lumière polarisée sur une surface magnétisée. Après avoir 
obtenu son doctorat il partit pour un semestre à l'institut F. Kohlrausch à 
Strasbourg. En 1895, après son retour de Strasbourg, Zeeman devint Privatdozent 
en mathématiques et physique à Leiden. En 1896, trois ans après avoir soumis sa 
thèse sur l'effet Kerr, il désobéit aux ordres directs de ses supérieurs et utilisa 
l'équipement du laboratoire pour mesure la séparation des lignes du spectres sous 
un champ magnétique intense. Il a été licencié pour ses efforts. mais il fut 
récompensé plus tard: il obtint le prix Nobel de Physique en 1902 pour sa 
découvert ce qui est connu aujourd'hui sous le nom d'effet Zeeman. En plus de 
son travail de thèse, dans l'étude de l'effet d'un champ magnétique sur une source 
de lumière. Grâce à sa découverte, Zeeman si vit offrir un poste d'assistant 
professeur à Amsterdam en 1897. En 1900 s'ensuivit la place de professeur à 
l'université d'Amsterdam. En 1902 avec son mentor Lorentz il se vit attribuer le 
Prix Nobel de physique pour l'effet Zeeman. Cinq années plus tard, en 1908, il 
succéda à Van der Waals comme professeur à temps plein et directeur à l'Institut 
de Physique à Asterdam. Il se retira encore en tant que professeur en 1935. 
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CHRONOLOGIE 


En arrivant à la 3'000ème page A4 de rédaction du site et à l'occasion de la 3ème édition du PDF associé, 
il nous a semblé pertinent de tenter de donner un premier jet de la chronologie de la majorité des sujets 
traités ou mentionnés sur l'ensemble du site Internet. Cela permet d'avoir un meilleur recul sur les outils 
utilisés et aussi de rendre hommage à nos illustres prédécesseurs auxquels nous sommes redevables de 
notre confort de vie, notre longévité, notre maîtrise de l'environnement (pas forcement son respect...) et de 
sa compréhension (même si pour certaines dates il n'est pas possible de vérifier s'il s'agit de légendes ou 
de faits réels.….). 


S'il manque des dates importantes (mais uniquement sur des sujets traités de près ou de loin dans les 
différents chapitres du site!) ou que vous identifiez des coquilles, n'hésitez pas à nous le faire savoir, il 
s'agit d'un premier jet et donc la chronologie ne peut qu'être améliorée (de plus l'histoire n'est pas une 
science exacte!). 


Pour plus d'informations le lecteur pourra se référer à Wikipédia qui a atteint des sommets au niveau de la 
quantité de biographies disponibles et de leurs détails (avec vérification des sources!). 


Ceci est l'histoire de comment l'histoire a fait la science et comment la science est entrée dans l'histoire, et 
comment les idées qui en ont émergé on façonné notre monde contemporain. 


+1994 
Les travaux du mathématicien Andrew Wiles (plus de 10 ans de recherche!) font tomber le dernier 
théorème de Fermat. 


+1983 
Les physiciens Carlo Rubbia, Simon van der Meer, et l'équipe UA-1 du CERN découvrent les bosons 
Wet Z qui concrétisent l'unification de l'interaction nucléaire faible et de la force électromagnétique. 


+1978 

Les mathématiciens cryptologues Ronald Rivest, Adi Shamir et Leonard Adelman proposent une 
procédure de cryptage à clé publique nommée "R.S.A." basée sur la difficulté de factorisation en nombres 
premiers. 


+1973 
Le mathématicien Fischer Black et l'économiste Myron S. Scholes publient le modèle d'évaluation du 
prix des actifs financiers. 


+1965 
Détection par les astrophysiciens Arno Penzias et Robert Wilson des micro-ondes cosmiques dues au 
rayonnement de fond de ciel prévu par la théorie du physicien Robert Dicke. 


+1964 

L'astrphysicien Irwin Shapiro prédit un décalage temporel pour la propogation d'une onde 
électromagnétique comme test pour la relativité générale. La même année, le physicien John Stewart Bell 
montre que toute théorie à variables locales cachées doit satisfaire l'inégalité de Bell. 


+1963 
Le mathématicien et météorologiste Edward Lorenz trouve ce qui est probablement le premier attracteur 
étrange et qui ouvre la voie à la théorie du chaos. 
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+1962 

Le mathématicien Benoît Mandelbrot découvre les fractales par hasard dans le cadre de l'analyse de 
signaux aux laboratoires Bell situés aux États-Unis où il se servira des ordinateurs pour répéter les motifs 
graphiques à l'infini et dont le principe est à la base de la théorie des fractales. La même année, 
l'économiste William Forsyth Sharpe publie le modèle CAPM (Capital Asset Pricing Model). 


+1960 

Le physicien Abdus Salam postule l'existence des bosons W et Z pour expliquer la désintégration bêta et 
l'apparition d'un nouveau boson Z qui n'avait jamais été observé auparavant. La même année, les 
physiciens Ali Javan et Theodore Maiman inventent chacun un type de LASER particulier. Les 
mathématiciens et ingénieurs Irving Reed et Gustave Solomon présent le code correcteur d'erreur de 
Reed-Solomon. 


+1959 
Les physiciens Yakir Aharonov et David Bohm prédisent l'effet Aharonov-Bohm et l'année suivante le 
physicien Robert G. Chambers confirme expérimentalement l'effet. 


+1956 
Les physiciens Clyde Cowan et Fred Reines observent le neutrino hypothétisé 25 ans plus tôt par le 
physicien Wolfgang Pauli. 


+1955 
Les physiciens Owen Chamberlain, Emilio Gino Segrè, Clyde Wiegand et Thomas Ypsilantis 
découvrent l'antiproton. 


+1954 

L'économiste Harry Markowitz publie sa thèse consacrée au modèle de diversification efficiente des 
portefeuilles d'actifs financiers. La même année, les physiciens John Bell et le duo Wolfgang Pauli et 
Gerhart Lüders développent la théorie C.P.T. qui analyse la symétrie des lois physiques pour les 
transformations impliquant de manière simultanée la charge, la parité et le temps. Le physicien 
Charles Hard Townes développe le MASER. Le biologiste Milner Baïly Schaefer publie son modèle 
d'équilibre des populations. 


+1952 
Le mathématicien George Bernard Dantzig développe l'algorithme du Simplexe en recherche 
opérationnelle. 


+1951 
Le théorème CPT apparaît pour la première fois de manière implicite dans le travail du physicien 
Julian Schwinger afin de prouver la corrélation entre spin et statistique. 


+1950 

Les physiciens Johannes Hans Daniel Jensen et Maria Goeppert-Mayer développent le modèle en 
couches du noyau nucléaire. Le même année, le mathématicien et économiste John Forbes Nash 
développe le concept de jeux non coopératifs et généralise la notion de minimax pour les jeux à somme 
nulle ; l'ingénieur David Huffman trouve l'algorithme permettant de compresser n'importe quel type de 
séries de symboles. 
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+1949 

Le mathématicien et ingénieur électricien Claude Shannon publie l'article contenant sa théorie de 
l'information qui deviendra le socle de base d'un certain nombre de théories physiques, statistiques et de 
méthodes numériques. 


+1948 
La physicienne Maria Güpper-Meyer développe un modèle théorique pour la structure du noyau 
atomique avec succès. 


+1947 

Les physiciens Cecil Powell, Cesare Mansueto Giulio Latte, et Giuseppe Occhialini découvrent le 
méson pi par l'étude des rayons cosmiques. La même année les physiciens John Bardeen, 

Walter H. Brattain et William Schockley inventent les transistors à semi-conducteur dans les 
laboratoires de la compagnie téléphonique Bell aux États-Unis qui sera à l'origine de la révolution 
informatique. 


+ 1946 
Le physicien et chimiste Willard Frank Libby développe et découvre la possibilité de datation au 
Carbone 14. 


+1945 
Le test de Trinity, le premier essai concluant de détonation d'une bombe nucléaire par le physicien 
Robert Oppenheimer et son équipe au Nouveau Mexique. 


+1944 
Le mathématicien John von Neumann développe les premières bases de la théorie mathématique des 
jeux. 


+1943 
Le physicien Sin-Itiro Tomonaga publie l'article qui pose les bases physiques de l'électrodynamique 
quantique. 


+1942 
Le physicien Enrico Fermi conduit la première réaction en chaîne contrôlée. 


+1941 
Le physicien Ernst Stueckelberg interprète les positrons comme des électrons d'énergie positive qui 
remontent le temps. 


+1940 

Le physicien Edward Teller entrevoit la possibilité d'utiliser l'énorme quantité de chaleur dégagée par 
l'explosion d'une bombe à fission pour déclencher le processus de fusion nucléaire. Il s'agit de la démarche 
considérée comme la découverte de la fusion nucléaire. La même année, le physicien 

Donald William Kerst met au point le premier bêtatron. 


+1939 

Les chimistes Otto Hahn et Fritz Strassmann bombardent des sels d'uranium par des neutrons et 
découvrent que du baryum est produit par l'expérience (découverte de la fission nucléaire). La même 
année, la physicienne Lise Meitner et le physicien Otto Robert Frisch déterminent qu'une fission 
nucléaire est intervenue lors de l'expérience de Hahn-Strassman. 
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+1938 

Le chimiste et physicien Isidor Isaac Rabi et ses collègues étudient l'effet de champs magnétiques 
puissants sur des molécules amenant au développepment la résononance magnétique nucléaire (RMN). La 
même année, les physiciens Hans Bethe et Carl von Weizsäcker proposent une théorie nucléaire des 
étoiles. 


+1937 

Les physiciens Seth Neddermeyer, Carl Anderson, Jabez Curry Street et E.C. Stevenson découvrent 
les muons dans les traces laissées par des rayons cosmiques dans une chambre à bulles. La même année le 
mathématicien John Von Neumann développe la méthode de Monte-Carlo pour des méthodes 
numériques diverses et le physicien Niels Bohr développe de la goutte liquide du noyau nucléaire. 


+1936 
Les physiciens Georges Gamow et Edward Teller collaborent pour formuler la théorie de l'émission 
radioactive béta. 


+1935 

Le physicien Hideki Yukawa présente la théorie de l'interaction forte et prédit l'existence des mésons. La 
même année, l'astrophysicien et mathématicien Chandrasekhar Subrahmanyan communique ses 
résultats sur l'effondrement d'étoiles en naines blanches et au-delà de 1.44 masses solaires en étoile à 
neutrons. L'article d'Albert Einstein, Boris Podolsky et Nathan Rosen sur le paradoxe EPR est publié 
dans Physical Review et remet en question la non localité de l'interprétation de Copenhague. 


+1934 

Le physicien Pavel Alekseyevich Cherenkov étudie l'émission de lumière quand des particules 
relativistes traversent un milieu amorphe. La même année le physicien Enrico Fermi suggère de 
bombarder des atomes d'uranium par des neutrons pour obtenir un élément à 93 protons, formule la théorie 
de la désintégration bêta et le physicien Leé Szilärd réalise qu'une réaction nucléaire en chaîne est 
possible. Les physiciens Irène Joliot-Curie et Frédéric Joliot bombardent des atomes d'aluminium avec 
des particules alpha et créent artificiellement du phosphore-30 radioactif. 


+1933 
Le mathématicien Andreï Nikolaievitch Kolmogorov publie un ouvrage contenant une base solide 
d'axiomes des probabilités. 


+1932 

Le physicien Carl David Anderson découvre le positron. La même année le physicien 

Werner Heisenberg présente le modèle proton-neutron du noyau et l'utilise pour expliquer les isotopes. 
Le physicien James Chadwick découvre le neutron et les physiciens John Cockcroft et Ernest Walton 
cassent le noyau du lithium et du bore par bombardement de protons. 


+1931 

Le physicien Wolfgang Pauli met en avant l'hypothèse du neutrino pour expliquer l'apparente violation 
du principe de conservation de l'énergie au cours de la désintégration bêta. La même année le 
mathématicien et logicien Kurt Gôüdel démontre qu'un système peut être à la fois cohérent et complet 
(théorème d'incomplétude) et que si le système est cohérent, alors la cohérence des axiomes ne peut pas 
être prouvée au sein même du système. Le physicien Ernest Lawrence invente le premier cyclotron. 
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+1930 

Le physicien Fritz London explique que les forces de van der Waals sont dues à l'interaction des 
moments dipolaires des molécules. La même année le physicien Paul Dirac présente la théorie électron- 
trou et l'économiste John Maynard Keynes publie son Traité sur la monnaie. 


+1929 

L'astronome Edwin Hubble en étudiant le décalage vers le rouge émet l'hypothèse que l'Univers n'est pas 
statique. La même année, le physicien Robert Van de Graaff invente le premier accélérateur de 
particules connu aujourd'hui sous le nom "d'accélérateur de Van de Graaf”. 


+1928 

Le physicien Paul Dirac établit son équation d'onde relativiste pour l'électron qui généralise et améliore 
l'équation relativiste sans spin de Klein-Gordon. La même année, les physiciens Friedrich Hund et 
Robert S. Mulliken présentent le concept d'orbitale moléculaire et le physicien et cosmologiste 

Georges Gamow développe le modèle théorique quantique de la désintégration radioactive alpha par effet 
tunnel. 


+1927 

Le physicien Werner Heisenberg établit le principe d'incertitude, d'après lequel la position et la quantité 
de mouvement d'une particule ne peuvent être connues simultanément avec précision indirectement, en 
développant une base théorique nouvelle pour la mécanique quantique. La même année les physiciens 
Walter Heitler et Fritz London présentent la théorie quantique de la liaison chimique établie à partir de 
la molécule d'hydrogène et le physicien Max Born interprète de manière probabiliste la fonction d'onde 
de Schrôüdinger et avec l'aide du physicien Robert Oppenheimer présente l'approximation de Born- 
Oppenheimer. Les physiciens Clinton Joseph Davisson, Lester Germer et George Paget Thomson 
confirment la nature ondulatoire des électrons en les diffractant. Le physicien Paul Ehrenfest démontre le 
théorème fameux en physique quantique qui porte aujourd'hui son nom. 


+1926 

Le physicien Erwin Schrôdinger établit son équation d'onde qui définit la mécanique quantique sous 
forme analytique en développant les idées de De Broglie dans une théorie de la mécanique ondulatoire et 
prouve que la formation matricielle et ondulatoire de la mécanique quantique sont identiques. La même 
année les physiciens Oskar Klein et Walter Gordon établissent l'équation de la mécanique quantique 
relativiste pour les particules sans spin et Paul Dirac définit la statistique de Fermi-Dirac. Dans le 
domaine de la dynamique des populations le mathématicien et physicien Vito Volterra publie l'équation 
différentielle non linéaire modélisant l'équilibre proie/prédateur. 


+1925 

Le physicien Pierre Auger découvre l'effet Auger (2 ans après Lise Meitner) et la même année les 
physiciens George Uhlenbeck et Samuel Goudsmit postulent et mettent en évidence l'existence du spin 
de l'électron. La même année, le physicien Wolfgang Pauli établit par nécessité le principe d'exclusion 
quantique. Les physiciens Werner Heïisenberg, Max Born et Pascual Jordan développement une 
version matricielle de la mécanique quantique. 


+1924 

Le physicien John Lennard-Jones propose une description semi empirique des forces d'interaction inter- 
atomiques et la même année les physiciens Satyendranath Bose et Albert Einstein définissent la 
statistique de Bose-Einstein. Dans le domaine des statistiques, le statisticien Ronald Fisher définit des 
notions modernes majeures en statistiques 
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+1923 

L'astronome Edwin Hubble estime la distance entre la Terre et les galaxies spirales, prouvant qu'elles 
sont très éloignées de la Voie lactée et la même année le physicien Louis de Broglie suggère la dualité 
onde-particule à partir de la théorie des quanta et de l'équivalence masse-énergie d'Einstein et la 
physicienne Lise Meitner découvre l'effet Auger. 


+1922 
Le physicien Arthur Compton étudie la dispersion de photons X par des électrons et l'astrophysicien 
Alexandre Friedmann développe les modèles d'Univers non statiques. 


+1921 

Le physicien Alfred Landé définit le rapport gyromagnétique et la même année les physiciens 

Otto Stern et Walter Gerlach démontrent expérimentalement que le moment intrinsèque de l'électron est 
quantifié. Le mathématicien et physicien Theodor Franz Eduard Kaluza démontre qu'une version à 5 
dimenions des équations des champs d'Einstein permet d'unifier la gravitation et l'électromagnétisme. 


+1920 

L'astronome Vesto Melvin Slipher met en évidence le phénomène de décalage vers le rouge du spectre 
des galaxies. La même année, le physicien Arnold Sommerfeld introduit un quatrième nombre quantique 
au modèle original de l'atome de Bohr. 


+1919 

Le physicien Ernest Rutherford réalise la première désintégration artificielle d'un atome en bombardant 
de l'azote avec des particules alpha. La même année, la physicienne et mathématicienne 

Amali Emmy Noether développe son théorème sur les invariants différentiels dans le calcul des 
variations, l'un des plus importants théorèmes mathématiques jamais prouvé dans l'orientation du 
développement de la physique moderne. 


+1918 

L'astronome Harlow Shapley fait la première estimation précise de la taille de notre galaxie et de la 
position du Soleil dans celle-ci. La même année, le physicien Hermann Weyl introduit la notion de 
jauge, première étape de ce qui deviendra la théorie de jauge. 


+1917 

Le physicien Albert Einstein présente l'idée d'émission stimulée de radiation qui servira à la base de la 
fabrication des LASER. La même année, le physicien Arnold Sommerfeld introduit un troisième nombre 
quantique au modèle original de l'atome de Bohr. 


+1916 

Le physicien Albert Einstein développe sa théorie de la relativité générale et montre comment la matière 
joue sur l'espace-temps pour produire des effets gravitationnels. Il s'agit de la première théorie dite 
"indépendante de fond". La même année les physiciens Gilbert Lewis et Irving Langmuir présentent le 
modèle en couches électroniques pour expliquer les liaisons chimiques et le physicien 

Arnold Sommerfeld introduit la relativité dans son modèle de 1915 et cette correction relativiste permet 
d'expliquer les valeurs observées par des spectrographes de très haute résolution et donc de la scission des 
raies spectrales qu'on appelle "structure fine" et introduit par la même occasion un deuxième nombre 
quantique décrivant les orbites elliptiques. Le physicien Karl Schwarzschild trouve une solution 
mathématique des équations d'Einstein, il l'applique aux étoiles à neutrons, et aux trous noirs. 
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+1915 

Le physicien Arnold Sommerfeld affine le modèle atomique du physicien Niels Bohr en introduisant des 
orbites elliptiques pour expliquer la structure fine des raies de l'atome d'hydrogène. Ce nouveau modèle 
n'expliquait cependant pas l'étendue des spectres observés de l'atome d'hydrogène. La même année le 
physicien Albert Einstein calcule avec une grande précision la trajectoire de Mercure à l'aide de la 
relativité générale et la courbure des rayons lumineux dans le champ de gravitation du Soleil. La fin de 
cette même année il soumet l'article qui décrit les équations de champ de la gravitation, qui vont être la 
base de la théorie de la relativité générale. 


+1914 

Le physicien Ernest Rutherford montre que les noyaux atomiques chargés positivement contiennent des 
protons. La même année le physicien Albert Einstein et le mathématicien Marcel Grossmann publient 
un article sur le calcul tensoriel, et plus particulièrement sur les tenseurs de Riemann-Christoffel et de 
Ricci (plus généralement sur l'analyse tensorielle et la géométrie différentielle) et le physicien 

Peter Debye développe un modèle du comportement de la capacité thermique des solides en fonction de 
la température. Le mathématicien Felix Hausdorff introduit les concepts de distance de Hausdorff et de 
dimension de Hausdorff. 


+1913 

Le physicien Niels Bohr présente le modèle quantique en couches circulaires de l'atome et la même année 
le physicien Robert Millikan mesure la charge électrique fondamentale. La même année, les physiciens 
William Henry Bragg et William Lawrence Bragg trouvent la condition de Bragg pour la réflexion des 
rayons X forts et le physicien Henry Moseley montre que le numéro atomique est le vrai critère de 
discrimination des éléments. Dans le domaine des mathématiques, le mathématicien Élie Cartan annonce 
sa découverte des spineurs. Le physicien Johannes Stark démontre qu'un champ électrique va dédoubler 
les raies de Balmer du spectre de l'hydrogène. 


+1912 

Le physicien Max von Laue propose l'utilisation de réseaux cristallins pour diffracter les rayons X et la 
même année les physiciens Walter Friedrich et Paul Knipping diffractent les rayons X par du sulfure de 
zinc. La même année, le physicien Ernest Rutherford propose l'utilisation de la radioactivité comme 
moyen de datation. 


+1911 

Le physicien Ernest Rutherford découvre le noyau atomique en bombardant une fine feuille d'or de 
particules alpha. Certaines particules rebondissent sur le noyau des atomes d'or. La même année, le 
physicien et chimiste Jean Perrin prouve l'existence des atomes et des molécules et le 
physicienHeike Kammerlingh Onnes découvre la supraconductivité. 


+1909 

Les physiciens Hans Geiger et Ernest Marsden découvrent que des particules alpha peuvent être 
fortement déviées par des feuilles métalliques minces La même année, les physiciens Ernest Rutherford 
et Thomas Royds démontrent que les particules alpha sont des atomes d'hélium ionisés deux fois. Dans le 
domaine des mathématiques appliquées, le mathématicien Agner Krarup Erlang publie le premier 
article sur la théorie des files d'attentes. 


+1908 

Le statisticien William Sealy Gosset publie un article proposant une nouvelle distribution statistique et un 
nouveau test statistique appelés respectivement loi de Student et test-t de Student. La même année, le 
mathématicien Ernst Friedrich Ferdinand Zermelo propose une amélioration des axiomes de la théorie 
des ensembles. 
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+1907 

Le physicien Albert Einstein déduit l'expression de la fameuse équivalence entre la masse et l'énergie et 
la même année il établit l'expression de la capacité calorifique de solides cristallins et calcule le décalage 
vers le rouge gravitationnel. Le mathématicien et physicien Hermann Minkowski réunit l'espace-temps 
dans une structure mathématique unifiée. 


+1906 

Le physicien Walther Nernst présente une formulation du troisième principe de la thermodynamique. La 
même année, le mathématicien Andreï Markov publie les premiers travaux sur les chaînes d'événements 
qui porteront plus tard son nom et qui ont occupé une place importante dans la physique quantique de 
l'époque. 


+1905 

Le physicien Albert Einstein explique l'effet photoélectrique par l'existence de quantum et la même année 
il explique mathématiquement le mouvement Brownien comme un résultat du mouvement aléatoire des 
molécules et il publie ses recherches sur sa théorie de la relativité restreinte qui démontre l'équivalence de 
la masse et de l'énergie. Le physicien Paul Langevin publie sa théorie sur la susceptibilité des matériaux 
paramagnétiques. 


+1904 

Le physicien Antoon Lorentz découvre la contraction du temps dans le sens du déplacement des corps 
relativement à la constante de la vitesse de la lumière et propose les transformations des équations des 
forces électromagnétiques. La même année, le physicien Hantaro Nagaoka propose le modèle théorique 
saturnien de l'atome où les électrons tournent autour d'un noyau positif massif comme pour les anneaux de 
Saturne. 


+1903 
La radioactivité est expliquée en termes de fission des atomes par le physicien Ernest Rutherford et par 
le radiochimiste Frederick Soddy. 


+1902 

Le physicien Philipp Lenard observe que l'effet photoélectrique ne dépend pas de la puissance du 
faisceau lumineux mais de sa fréquence. La même année le chimiste Theodor Svedberg propose que les 
fluctuations du bombardement moléculaire créent le mouvement brownien et le logicien 

Bertrand Russell énonce le paradoxe "ultime" mettant à mal la théorie naïve des ensembles. 


+1901 
Les mathématiciens Gregorio Ricci-Curbastro et son assistant Tullio Levi-Civita développent le calcul 
tensoriel. 


+1900 

Le physicien Max Planck suggère que la lumière peut être émise en fréquence discrètes en généralisant la 
loi de rayonnement du corps noir. La même année, le physicien Johannes Rydberg affine l'expression 
mathématique concernant les longueurs d'ondes des raies de l'hydrogène de Balmer et le physicien 

Paul Villard découvre les rayons gamma en étudiant la désintégration de l'uranium. Dans le domaine des 
mathématiques appliquées, le mathématicien Louis Bachelier développe le modèle de mouvement 
brownien appliqué à la théorie des jeux et de la spéculation qui sera le pilier des outils financiers 
quantitatifs du 20ème siècle. La même année, le mathématicien Karl Pearson définit la distribution 
statistique du Khi-2 et en étudie des propriétés importantes pour l'inférence statistique. Le physicien 

Paul Drude adaptate la théorie cinétique des gaz aux électrons des métaux et obtient un modèle qui porte 
encore aujourd'hui son nom. 
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+1899 

Le physicien Ernest Rutherford découvre que les rayonnements émis par l'uranium sont composés de 
particules alpha chargées positivement et de particules bêta chargées négativement. La même année, le 
mathématicien David Hilbert remplace les cinq axiomes usuels de la géométrie euclidienne par 21 
axiomes pour éliminer les faiblesses de la géométrie d'Euclide. 


+1898 

Le mathématicien David Hilbert donne une première approche du corps de classes. La même année, les 
physiciens Marie et Pierre Curie isolent et étudient le radium et le polonium et le physicien 

Wilhelm Carl Werner Wien identifie une nouvelle particule de charge positive approximativement égale 
à la masse de l'hydrogène qu'il va appeler le "proton". L'ingénieur Alfred-Marie Liénard calcule, le 
champ électromagnétique produit par une charge ponctuelle, animée d'un mouvement absolument 
quelconque. Les expressions mathématiques qui ont été établies de façon indépendante, mais 2 ans plus 
tard, par le physicien Emil Wiechert. 


+1897 

Le physicien Joseph John Thomson mesure le rapport charge/masse de certaines particules négatives 
créées par des rayons cathodiques. Il mesure leur charge, et il en conclut que leur masse est environ 2'000 
fois inférieure à celle de l'hydrogène. Ces particules sont plus tard appelées "électrons", expression 
suggérée par le physicien George Johnstone Stoney. Les téléviseurs et autres écrans cathodiques sont des 
versions améliorées du dispositif de Thomson. 


+1896 

Le physicien Henri Becquerel découvre la radioactivité de l'uranium et la même année le physicien 
Pieter Zeeman étudie la décomposition des raies D du sodium quand il est chauffé dans un champ 
magnétique intense et découvre que les raies spectrales d'une source de lumière soumise à un champ 
magnétique possèdent plusieurs composantes, chacune d'elles présentant une certaine polarisation. Pour 
expliquer le phénomène, il faut alors ajouter un nombre quantique supplémentaire appelé "nombre 
quantique magnétique". La même année, le physicien Wilhelm Carl Werner Wien établit la loi qui porte 
son nom pour l'énergie émise par le corps noir. 


+1895 

Le physicien Wihelm Rôntgen découvre les rayons X et la même année le physicien et inventeur 
Guglielmo Marconi réalise dans les Alpes suisses à Salvan la première transmission sans fil "longue 
distance" de 1.5 kilomètre. 


+1893 

Le mathématicien, physicien, philosophe et ingénieur Henri Poincaré publie ses études sur le problème 
des trois corps et initie l'étude qualitative des systèmes d'équations différentielles et de la théorie du 
chaos. La même année le mathématicien Georg Cantor développe la théorie des ensembles transfinis et 
la proposition de l'ingénieur Nikola Tesla d'utiliser le courant alternatif au lieu de continu est adoptée par 
le premier État américain. 


+1892 
Le physicien autodidacte Oliver Heaviside réduit les 8 équations de l'électrodynamique de Maxwell à 4 
équations différentielles. 


+1891 

Le mathématicien Giuseppe Peano introduit le symbole d'appartenance ainsi qu'une première version de 
l'écriture des quantificateurs. Leur forme définitive sera donnée par le mathématicien David Hilbert. Il 
donne plus de 40'000 définitions dans une langue qu'il veut universelle. 
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+1890 
L'étude systématique des groupes s'amplifie avec les mathématiciens Sophus Lie, Issai Schur et 
Elie Cartan. Ce dernier introduit la notion de groupe algébrique. 


+1889 
Le mathématicien Giuseppe Peano postule 5 propriétés des nombres entiers comme axiomes dans l'idée 
de faire avec les entiers ce que Euclide à fait pour la géométrie. 


+1888 

L'anthropologue, explorateur, géographe, inventeur, météorologue, proto-généticien, psychométricien et 
statisticien… Francis Galton définit statistiquement le concept de coefficient de corrélation. La même 
année, le mathématicien Richard Dedekind propose la définition d'un ensemble fini. 


+1887 

Les physiciens Albert Michelson et Edward Morley mesurent la vitesse de la lumière pour vérifier 
l'hypothèse de l'éther que leurs résultats expérimentaux rejettent et la même année le physicien 
Heïnrich Hertz découvre l'effet photoélectrique et fait des expériences sur les ondes électromagnétiques 
(production et réception). 


+1886 
Le mathématicien et physicien Olivier Heaviside introduit la manipulation d'opération différentiels 
comme des entités algébriques ce qui aménera aux transformées de Laplace plus tard. 


+1885 
Le chimiste Johan Balmer trouve l'expression mathématique qui donne la longueur d'onde des différentes 
raies du spectre de l'hydrogène. 


+1884 

Le physicien et chimiste Willard Gibbs pose la notation encore d'usage au début du 21ème siècle pour le 
produit scalaire et vectoriel ainsi que pour les opérateurs vectoriels différentiels dans ses ouvrages de 
cours pour le calcul vectoriel. La même année, le physicien Ludwig Boltzmann développe la loi de 
Stefan-Boltzmann du flux de rayonnement du corps noir à partir de considérations thermodynamiques et 
le physicien John Henry Poynting introduit le vecteur qui porte encore aujourd'hui son nom. 


+1882 
Le mathématicien Ferdinand von Lindemann prouve la transcendance de 7. La même année, 


l'astronome, mathématicien, économiste et statisticien Simon Newcomb observe un excès de 43" par 
siècle dans précession de l'orbite de Mercure. Là où la mécanique de Newton explique correctement la 
période de précession des autres planètes, elle échoue à expliquer celle de Mercure. 


+1886 
Le mathématicien et physicien Olivier Heaviside réduit les équations de Maxwell de 8 à 4 équations et 
définit la fonction escalier qui porte encore son nom aujourd'hui (fonction d'Heaviside). 


+1879 

Le physicien et mathématicien Joseph Stefan publie la loi de Stefan qui indique que la puissance émise 
dans l'ensemble du domaine spectral est proportionnelle à la puissance quatrième de la température 
absolue d'une étoile et à la surface de celle-ci. Pour une même température superficielle, une étoile est 
d'ailleurs plus lumineuse plus elle est grosse. La même année, le physicien Edwin Herbert Hall découvre 
qu'un courant électrique traversant un matériau baignant dans un champ magnétique engendre une tension 
perpendiculaire au déplacement initial courant électrique. 
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+1878 
Le mathématicien et philosophe William Kingdon Clifford introduit l'opérateur divergence. 


+1877 

Le physicien et chimiste Willard Gibbs définit pour les réactions chimiques deux quantités très utiles, à 
savoir l'enthalpie qui représente la chaleur d'une réaction à pression constante, et l'enthalpie libre qui 
détermine si oui ou non une réaction peut procéder de façon spontanée à température et pression 
constante. 


+1876 
Le mathématicien et philosophe William Kingdon Clifford suggère que le mouvement de la matière peut 
être dû à des changements dans la géométrie de l'espace. 


+1874 
Le physicien Lord Kelvin formalise le seconde principe de la thermodynamique. La même année, 
l'économiste mathématicien Léon Walras publie son Éléments d'économie politique pure. 


+1873 

Le mathématicien Georg Cantor jette les bases de la théorie des ensembles et des cardinaux et montre 
que les nombres algébriques sont en fait dénombrables. La même année le physicien 

James Clerk Maxwell démontre que la lumière est un phénomène électromagnétique et réduit les 
équations de l'électrodynamique à 8 au lieu de 20 (au passage il introduit l'opérateur rotationnel) et le 
physicien Johannes van der Waals introduit l'idée qu'il existe des forces faibles attractives entre les 
molécules. Le mathématicien Charles Hermite prouve la transcendance de e. 


+1872 
Le mathématicien Karl Weïerstrass expose à l'Académie royale des sciences de Berlin l'exemple d'une 
fonction continue partout et dérivable nulle part. 


+1871 

Le chimiste Dmitri Mendeleïev examine son tableau périodique et prédit l'existence du gallium, du 
scandium et du germanium. La même année le physicien James Clerk Maxwell établit les relations 
thermodynamiques de Maxwell. 


+1870 
Le physicien Rudolph Clausius prouve le théorème (scalaire) du Viriel. 


+1869 
Le chimiste Dmitri Mendeleïev propose le tableau périodique des éléments qui porte encore aujourd'hui 
son nom. 


+1867 
L'historien, journaliste, philosophe, économiste, sociologue Karl Marx publie Le Capital. 


+1866 

Le physicien James Clerk Maxwell formule, indépendamment du physicien Ludwig Boltzmann, la 
théorie cinétique des gaz dite de Maxwell-Boltzmann. La même année, le moine et botaniste 

Johann Gregor Mendel formule les lois statistiques de l'hybridation et le mathématicien and the 
Leopold Kronecker utilise pour la première fois le symbole qui porte encore aujourd'hui son nom. 
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+1865 
Le physicien James Clerk Maxwell publie pour la première fois les équations de l'électrodynamique sous 
la forme des 20 équations à 20 inconnues à l'aide de quaternions. 


+1862 

Le physicien Gustav Kirchhoff élabore le concept de Corps Noir capable d'absorber et d'émettre des 
rayonnements à toutes les fréquences et établit que l'énergie émise dépend seulement de la fréquence de la 
radiation émise et de la température du corps noir. 


+1859 

Le physicien James Clerk Maxwell découvre la loi de distribution des vitesses moléculaires. La même 
année l'astronome Urbain Le Verrier signale une anomalie dans le mouvement de Mercure que la théorie 
de Newton ne prévoit pas et le physicien Gustav Kirchhoff avec le chimiste Robert Wilhelm Bunsen 
développent la spectroscopie par prisme. 


+1858 

Le mathématicien et avocat Arthur Cayley dégage la notion d'espace vectoriel, la notion de matrice et en 
expose l'usage en faisant emploi de la multiplication des matrices ainsi que des déterminants ; il réécrit les 
systèmes d'équations linéaires sous forme de matrices. Ces travaux sont souvent considérés comme 
l'émergence de l'algèbre linéaire. 


+1855 

Le physicien et astronome Léon Foucault découvre que la force nécessaire à la rotation d'un disque de 
cuivre augmente quand il doit tourner avec sa jante entre les pôles d'un aimant, le disque chauffant dans le 
même temps du fait des "courants de Foucault" induits dans le métal. 


+1854 

Le mathématicien George Boole publie son système de logique symbolique, aujourd'hui connu sous le 
nom d'algèbre de Boole. La même année, le mathématicien Arthur Cayley montre que les quaternions 
peuvent être utilisés pour représenter les rotations dans l'espace et Georg Friedrich Bernhard Riemann 
donne une nouvelle définition de l'intégrale et jette les bases de la géométrie différentielle. 


+1852 
Les physiciens James Joule et William Thomson Kelvin démontrent qu'un gaz en extension se refroidit 
rapidement. 


+1851 

Le physicien et astronome Léon Foucault fait une démonstration spectaculaire de la rotation de la Terre 
en suspendant un pendule à un long câble attaché à la coupole du Panthéon à Paris. La même année, le 
mathématicien Georg Friedrich Bernhard Riemann publie des travaux sur les premières fonctions d'une 
variable complexe. 


+1850 

Les mathématiciens Arthur Cayley et James Joseph Sylvester introduisent le terme de matrices et la 
même année, le mathématicien Richard Dedekind introduit le terme de corps. Le physicien 

Rudolf Clausius développe la théorie mécanique de la chaleur et formule le second principe de la 
thermodynamique. Le phyisicien George Stokes prouve le théorème de Stokes. 
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+1849 

Le mathématicien et astronome Edouard Roche trouve le rayon limite de destruction de création par 
forces de marées et d'un corps qui tient par sa seule gravité utilise ce résultat pour expliquer pourquoi les 
anneaux de Saturne ne se condensent en un satellite. 


+1848 

Le physicien William Thomson Kelvin découvre le point absolu 0 de température et définit sa propre 
unité de mesure. La même année le physicien et astronome Hyppolite Fizeau transpose les résultats de 
Christian Doppler à la lumière qui, comme le son, possède un caractère ondulatoire (effet Doppler- 
Fizeau) et met en évidence le décalage vers le rouge et vers le bleu. 


+1847 

Le physicien James Joule trouve expérimentalement l'équivalent mécanique de la chaleur et la même 
année, le physiologiste et physicien Hermann Helmholtz formalise le concept de conservation de 
l'énergie. 


+1845 

Le physicien Gustav Kirchoff définit le concept de potentiel électrique et énonce les lois de réseaux qui 
portent son nom (loi des noeuds, loi des mailles). La même année, le physicien George Stokes publie ce 
qui sera les fondements des équations de Navier-Stokes en mécanique des fluides et le physicien 
Michael Faraday découvre que la propagation de la lumière dans un matériau peut être influencé par des 
champs magnétiques externes. 


+1844 
Le mathématicien Joseph Liouville montre l'existence d'une infinité de nombres transcendants. 


+1843 

Le physicien, mathématicien et astronome William Rowan Hamilton définit des espaces de vecteurs 
complexes (quaternions). La notion d'espace vectoriel sera clairement définie par le mathématicien et 
astronome August Ferdinand Môbius et par le mathématicien et linguiste Giuseppe Peano 40 ans plus 
tard. La même année, le mathématicien Laurent Pierre Alphonse publie son mémoire sur ce qui 
deviendra plus tard les séries qui portent son nom en analyse complexe. 


+1842 

Le principe de la conservation de l'énergie est formulé par le physicien Julius Von Mayer qui a calculé la 
quantité de travail pouvant être obtenue par transformation de la chaleur en énergie, soit l'équivalent 
mécanique de la calorie. La même année, le physicien Christian Doppler découvre l'effet acoustique qui 
porte son nom (variation de la fréquence avec le mouvement relatif). 


+1841 

Le mathématicien Karl Weierstrass découvre mais ne publie pas ce que nous appelons aujourd'hui les 
séries de Laurent. La même année, le matématicien Carl Gustav Jacob Jacobi introduit les matrices 
jacobiennes et réintroduit la notation de la dérivée partielle proposée initialement par le mathématicien 
André-Marie Legendre. 


+1838 
L'astronome et mathématicien Friedrich Bessel mesure que la distance qui nous sépare de l'étoile 61 
Cygni est de 96 billions de kilomètres. 
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+1835 

Le mathématicien Carl Friedrich Gauss donne une construction rigoureuse des nombres complexes et le 
mathématicien Augustin Louis Cauchy établit une première théorie des déterminants. La même année, le 
mathématicien et ingénieur Gaspard Coriolis démontre que l'accélération d'un mobile dans un référentiel 
en rotation est soumise à une force complémentaire perpendiculaire au sens de déplacement du mobile 
dans ce référentiel. 


+1834 

L'ingénieur et physicien Émile Clapeyron présente une formulation de la seconde loi de la 
thermodynamique. La même année, le physicien Heinrich Lenz établit la loi d'induction 
électromagnétique. 


+1832 
Le physicien Michael Faraday établit la théorie fondamentale de l'électrolyse. 


+1831 

Le physicien Michael Faraday découvre l'induction électromagnétique, à savoir l'obtention d'un courant 
électrique à partir de la variation d'un champ magnétique (principe de la dynamo: le contraire de 
l'expérience d'Orsted). La même année le mathématicien, astronome et physicien Carl Friedrich Gauss 
énonce deux des quatre équations de Maxwell. 


+1829 

Le mathématicien Évariste Galois présente la première ébauche de son travail sur les équations 
résolubles qui sera à l'origine de l'approche ensembliste de la résolution d'équation algébrique par 
radicaux. 


+1828 
Le physicien George Green prouve le théorème de Green 


+1827 

Le botaniste Robert Brown découvre le mouvement brownien des particules de pollen et de colorant dans 
l'eau ; la même année le physicien Georg Ohm établit la loi de la résistance électrique et le physicien et 
mathématicien André Ampère découvre les lois qui lient les forces magnétiques au courant électrique. Le 
physicien, mathématicien et astronome William Rowan Hamilton présente la théorie d'une unique 
fonction qui unifie la mécanique, optique et mathématiques et qui aida à établir la théorie ondulatoire de 
la lumière. 


+1825 

Le mathématicien Augustin-Louis Cauchy présente le théorème de Cauchy et l'intégration curviligne 
générale et introduit le théorème des résidus. Le scientifique et inventeur William Sturgeon invente le 
premier électroaimant. 


+1824 
Le physicien et ingénieur Sadi Carnot analyse scientifiquement l'efficacité des moteurs à vapeur (cycle 
de Carnot) en montrant que leur rendement est limité et pose le second principe de la thermodynamique. 


+1823 
Le physicien et chimiste Michael Faraday présente une série de papiers sur la liquéfaction des gaz. 
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+1822 

Le mathématicien Jean-Victor Poncelet fonde la géométrie projective. La même année, le physicien et 
mathématicien Joseph Fourier présente formellement l'utilisation des dimensions (unités) pour des 
quantités physiques. 


+1821 

Le principe de la dynamo est décrit pour la première fois par le physicien et chimiste Michael Faraday. 
La même année le physicien John Herapath propose que la chaleur n'est en réalité que l'effet d'agitation 
et donc de mouvement de corps élémentaires. 


+1820 

Le physicien Hans Christian Orsted découvre et prouve les effets magnétiques du courant électrique. La 
même année, les physiciens Jean-Baptiste Biot et Félix Savart déterminent dans le domaine du 
magnétisme la fameuse loi qui porte leur nom. 


+1818 
Le mathématicien, géomètre et physicien Siméon Poisson calcule la tache lumineuse au centre de l'ombre 
d'un obstacle circulaire opaque. 


+1817 

En étudiant la polarisation de la lumière, le physicien Augustin Fresnel montre que cette dernière est un 
mouvement ondulatoire transversal et non longitudinal et montre aussi que la diffraction et l'interférence 
peuvent être expliquées si l'on considère la lumière comme une onde. La même année, l'astronome 
Friedrich Bessel publie des travaux faisant usage des fameuses fonctions qui portent son nom. 


+1816 
Le mathématicien Joseph Diaz Gergonne introduit le symbole marquant l'inclusion dans la théorie des 
ensembles. 


+1814 
Le physicien et opticien Joseph Von Fraunhofer étudie pour la première fois les raies d'absorption du 
spectre solaire et ce au moyen du spectroscope dont il fût l'inventeur. 


+1812 

Le mathématicien, astronome et physicien Pierre-Simon de Laplace publie un ouvrage majeur sur la 
théorie des probabilités (incluant aussi la méthode des moindres carrés) dont il est considéré comme l'un 
des fondateurs. 


+1811 
Le chimiste Amaedo Avogadro avance l'hypothèse selon laquelle des volumes égaux de gaz différents 
contiennent le même nombre de molécules, dans des conditions identiques de température et de pression. 


+1810 

Le mathématicien, astronome et physicien Carl Friedrich Gauss découvre les concepts de base de la 
géométrie non-euclidienne mais ne publiera jamais ses travaux à ce sujet. La même année, le physicien et 
mathématicien Joseph Fourier modélise l'évolution de la température au travers de séries 
trigonométriques. 
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+1809 

Le mathématicien, astronome et physicien Carl Friedrich Gauss développe la méthode des moindres 
carrés indépendamment du mathématicien André-Marie Legendre . La même année, le mathématicien, 
astronome et physicien Pierre-Simon de Laplace démontre la forme générale du théorème central limite. 
L'ingénieur, physicien et mathématicien Etienne Malus publie la loi de Malus. 


+1808 
Le physicien et chimiste John Dalton propose ce qui est considéré comme la première théorie de l'atome. 


+1806 
Le mathématicien Jean Robert Argand publie la première représentation plane des nombres complexes 
et utilise des mesures algébriques. 


+1805 
Le mathématicien André-Marie Legendre développe la méthode des moindres carrés. 


+1803 

Le physicien et chimiste John Dalton a l'idée originale de considérer que chaque élément chimique est 
constitué d'atomes différents. Une combinaison chimique s'explique alors par l'union de ces atomes en 
proportions fixes et les masses atomiques relatives devenaient calculables à partir de faits expérimentaux. 
La même année, l'économiste, journaliste et industriel Jean-Baptiste Say publie son Traité d'économie 
politique. 


+1802 

Le physicien Thomas Young prouve la nature ondulatoire de la lumière par une expérience importante 
qui montre l'interférence des ondes. La même année, le chimiste et physicien Louis Joseph Gay-Lussac 
découvre la fameuse loi sur les gaz qui relie volume et température d'un gaz réel, loi qui porte son nom 
(loi de Gay-Lussac). 


+1801 
Le chimiste et physicien John Dalton, découvre la loi de la somme des pressions partielles des gaz qui 
porte encore aujourd'hui son nom. 


+1800 

Le chimiste William Nicholson et le chirurgien Anthony Carlisle utilisent l'électrolyse pour séparer l'eau 
en hydrogène et oxygène. La même année, l'astronome Willian Herschel découvre le rayonnement 
infrarouge et le physicien Allessandro Volta invente la première pile électrique. 


+1799 
Le mathématicien Gaspard Monge publie son ouvrage de géométrie descriptive. Il en est considéré 
comme l'inventeur. 


+1798 

Le mathématicien Carl Friedrich Gauss donne une démonstration rigoureuse du théorème de d'Alembert 
(théorème fondamental de l'algèbre). La même année, le physicien Benjamin Thompson a l'idée que la 
chaleur est une forme d'énergie et le physicien et chimiste Henry Cavendish mesure la valeur de la 
constante gravitationnelle. L'économiste Thomas Malthus énonçe sa loi de population. 


+1797 
Le mathématicien Caspar Wessel associe des vecteurs aux nombres complexes et étudie l'interprétation 
géométrique des opérations sur les nombres complexes. 
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+1793 
L'assemblée nationale de la République Française instaure le système métrique. 


+1789 
Le physicien et chimiste Antoine Lavoisier énoncé le principe de conservation de la masse. 


+1787 
Le physicien, chimiste et inventeur Jacques Alexandre César Charles détermine expérimentalement que 
le volume d'une masse fixe d'un gaz à pression constante est proportionnel à la température. 


+1786 
L'astronome William Herschel fait une description précise de notre galaxie. 


+1785 
Le physicien Charles-Augustin Coulomb prouve que les forces entre charges électriques et entre aimants 
s'exercent en raison inverse du carré de la distance. 


+1781 
Le chimiste et physicien Joseph Priestley crée de l'eau par combustion d'hydrogène et d'oxygène ce qui 
démontre que l'eau n'est pas un élément fondamental comme on le pensait depuis Aristote. 


+1778 
Les physiciens et chimistes Carl Scheele et Antoine Lavoisier découvrent que l'air est composé 
essentiellement d'azote et d'oxygène. 


+1777 
Le physicien et mathématicien Leonhard Euler introduit la lettre i pour la partie imaginaire des nombres 
complexes. 


+1776 
Le philosophe moraliste et pionnier de l'économie politique Adam Smith publie son Une enquête sur la 
nature et les causes de la richesse des nations. 


+1774 

Le mathématicien, astronome et physicien Pierre-Simon de Laplace explicite l'intégrale d'Euler. La 
même année, le théologien, pasteur dissident, philosophe naturel, pédagogue et théoricien de la politique 
Joseph Priestley fit sa principale découverte, celle de l'oxygène. 


+1772 
Le mathématicien, mécanicien et astronome Joseph-Louis Lagrange étudie le problème des trois corps et 
découvre les points de libration appelés aujourd'hui "points de Lagrange”. 


+1766 
Le physicien et chimiste Henry Cavendish découvre et étudie l'hydrogène. 


+1764 

Les chaleurs latente et spécifique sont décrites pour la première fois par le physicien et chimiste 

Joseph Black. Il est également le premier à distinguer nettement température et quantité de mouvement. 
La même année, le physicien et mathématicien Leonhard Euler examine l'équation aux dérivées 
partielles pour la vibration d'un tambour circulaire et trouve l'une des fonctions de Bessel en tant que 
solution. 
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+1763 
Un article posthume de mathématicien et pasteur Thomas Bayes met en évidence qu'il a découvert ce qui 
est appelée encore aujourd'hui le "théorème de Bayes". 


+1756 
Le mathématicien, mécanicien et astronome Joseph-Louis Lagrange développe la mécanique analytique 
en se basant sur son invention du calcul variationnel. 


+1755 
Le physicien et mathématicien Leonhard Euler introduit la lettre grecque sigma majuscule (S) pour le 
symbole de la somme. 


+1750 
Le mathématicien Gabriel Cramer établit la règle de Cramer pour la résolution de systèmes linéaires. 


+1749 

L'astronome et physicien Jean le Rond D'Alembert développe le premier modèle de précession des 
équinoxes basé sur la théorie de la gravitation de Newton et donne une piste de solution pour le problème 
des trois corps. 


+1746 

L'encyclopédiste Jean le Rond D'Alembert donne la première preuve (acceptable mais qui sera corrigée 
plus tard) du théorème fondamental de l'algèbre. L'année d'après (1747) il publie l'équation des cordes 
vibrantes qui a été le premier exemple de l'équation des ondes. Cela fait de D'Alembert, l'un des 
fondateurs de la physique mathématique. 


+1744 

Le philosophe, mathématicien, physicien, astronome et naturaliste Pierre Louis Moreau de Maupertuis 
énonce le principe de moindre action qui sera formalisé mathématiquement 22 ans plus tard par le 
mathématicien, mécanicien et astronome Joseph-Louis Lagrange. La même année, le physicien et 
mathématicien Leonhard Euler montre l'existence des nombres transcendants. 


+1742 
L'astronome Anders Celsius définit sa propre unité de mesure de la température. 


+1739 
Le physicien et mathématicien Leonhard Euler résout les équations différentielles linéaires homogènes à 
coefficients constants. 


+1738 
Le médecin, physicien et mathématicien Daniel Bernoulli publie un ouvrage sur l'hydrodynamique 
introduisant la théorie cinétique des gaz et le fameux théorème de Bernoulli (équilibre des pressions). 


+1737 

Le physicien et mathématicien Leonhard Euler résout le problème de théorie des graphes relatif aux 
ponts de Kônigsberg. La résolution de ce problème est considérée comme le premier théorème de la 
théorie des graphes. Il établit par la même occasion la "formule d'Euler" liant le nombre de sommets, 
d'arêtes et de faces d'un polyèdre convexe, et donc d'un graphe planaire. 


+1736 
L'inventeur Jonathan Hulls dépose le premier brevet d'un bateau propulsé par une machine à vapeur. 
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+1734 
Le physicien et mathématicien Leonhard Euler introduit la notation f(x) pour une fonction appliquée à 
l'argument x. 


+1733 
Le mathématicien Geralamo Saccheri étuide ce que serait la géométrie si les 5ème postulat d'Euclide 
était faux. 


+1729 
Le teinturier et amateur de physique et d'astronomie Stephen Gray est le premier à découvrir la 
transmission de l'électricité dans des matériaux qu'il appellera des "conducteurs". 


+1727 

Le physicien et mathématicien Leonhard Euler introduit la notation moderne des fonctions 
trigonométriques et la lettre e pour la base du logarithme naturel (également connue occasionnellement 
sous le nom de "nombre d'Euler"). 


+1724 
Le mathématicienAbraham De Moivre étudie les statistiques de mortalité et fonde la théorie des annuités 
sur la vie. 


+1715 
Le mathématicien Brook Taylor publie les outils permettant de faire des intégrations par parties ainsi que 
des développements en série de fonctions (les fameuses séries de Taylor). 


+1714 
Le mathématicien Brook Taylor dérive la fréquence fondamentale de vibration d'une corde tendue en 
fonction de sa tension et de sa densité linéique en résolvant une équation différentielle ordinaire. 


+1713 
Le mathématicien et physicien Jacques Bernoulli publie les principes rigoureux de base du calcul des 
probabilités et statistique. 


+1705 
L'astronome Edmund (ou Edmond) Halley prédit avec une erreur quasi négligeable à l'aide du calcul 
que la comète qui est passée près de la Terre en 1682 repassera en 1758. 


+1704 
Le physicien et mathématicien Isaac Newton constate expérimentalement que la lumière blanche se 
compose de multiples couleurs. Il suppose également qu'un rayon lumineux est formé de corpuscules. 


+1696 

Le mathématicien et physicien Jacques Bernoulli pose clairement le problème de la courbe 
brachistochrone (qui appartient à la famille des courbes cycloïdes) et en propose une solution. La même 
année, le mathématicien Guillaume de L'Hopital présente sa règle pour l'examen des formes 
indéterminées. 


+1693 

L'astronome et ingénieur Edmund Halley découvre la relation qui lie la focale d'une lentille avec la 
distance de l'image à son axe et de l'objet réel à son axe. La même année, il construit la première table 
statistique de mortailté liant le taux de décès à l'âge. 
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+1691 
Le philosophe et mathématicien Gottfried Leibniz découvre une technique de séparatoin de variables 
pour les équations différentielles ordinaires. 


+1690 

La théorie ondulatoire de la lumière est avancée par le physicien et astronome Christian Huygens ; la 
même année le physicien et mathématicien Jean Bernoulli développe le calcul exponentiel et trouve 
l'équation de la chaînette. La même année, le mathématicien et physicien Jacques Bernoulli (frère de 
Jean Bernoulli) développe le calcul intégral. 


+1687 

Le physicien et mathématicien Isaac Newton publie un ouvrage où il explique la force de gravité et les 
orbites des planètes. Il énonce également les trois lois de la dynamique. Il s'agit de la première révolution 
scientifique (avant la relativité restreinte/générale et la physique quantique). 


+1685 
Le philosophe et mathématicien Gottfried Leïbniz résout les systèmes linéaires en usant sans justification 
théorique de matrices et de déterminants. 


+1682 
Le physicien et mathématicien Isaac Newton établit la loi de la gravitation qui porte aujourd'hui son nom. 


+1679 

Le philosophe et mathématicien Gottfried Leïbniz introduit l'arithmétique binaire et met au point une 
machine à calculer qui effectue les 4 opérations. La même année, le physicien, mathématicien et inventeur 
Denis Papin montre expérimentalement l'influence de la pression atmosphérique sur le point d'ébullition 
de l'eau. 


+1678 
Le mathématicien, astronome et physicien Christian Huygens postule le son principe du front d'onde. 


+1676 
Le physicien Robert Hooke énonce que l'étirement d'un ressort est proportionnel à la tension. 


+1675 
L'astronome Olaüs Rôemer réalise des mesures précises de la vitesse de la lumière. La même année, le 
physicien et astronome Isaac Newton invente un algorithme pour calculer les racines de fonctions. 


+1673 
Le philosophe et mathématicien Gottfried Leibniz invente son calcul différentiel. 


+1669 

Le mathématicien, astronome et physicien Christian Huygens publie des résultats concernant 
l'observation de la conservation d'énergie cinétique devenant ainsi in extenso le découvreur du concept 
d'énergie cinétique. 


+1668 
Le physicien et astronome Isaac Newton réalise le premier télescope à réflexion et la même année le 
mathématicien John Wallis suggère la loi de conservation de la quantité de mouvement. 
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+1665 

Le physicien Isaac Newton formule les trois lois de la mécanique. Il jette les bases du calcul différentiel, 
ces techniques lui permettant à partir de l'expression d'une force inverse au carré de la distance, de 
retrouver la forme générale des lois de Kepler. 


+1661 

Le fondateur de la démographie statistique John Graunt publie la première table de mortalité ; la même 
année le physicien et chimiste Robert Boyle détermine les lois de compressibilité des gaz portant 
aujourd'hui son nom attaché parfois à celui du physicien Edme Mariotte qui redécouvrit quelques années 
après les mêmes lois. 


+1659 

Le mathématicien, astronome et physicien Christian Huygens découvre la formule de l'isochronisme 
rigoureux (lorsque l'extrémité du pendule parcourt un arc de cycloïde, la période d'oscillation est constante 
quelle que soit l'amplitude). 


+1658 

Le mathématicien, astronome et physicien Christian Huygens découvre expérimentalement que les 
balles placées n'importe où sur une cycloïde renversée atteignent le point le plus bas de la cycloïde dans le 
même temps et ainsi montre expérimentalement que l'isochronisme de la cycloïde. 


+1657 

Le juriste et mathématicien Pierre de Fermat énonce son "principe de Fermat" en optique comme quoi la 
lumière se propage d'un point à un autre sur des trajectoires telles que la durée du parcours soit localement 
minimale. 


+1655 
Le mathématicien, astronome et physicien Christian Huygens est le premier à utiliser le concept 
d'espérance en probabilités. 


+1654 
Le mathématicien, physicien, inventeur, philosophe, moraliste et théologien Blaise Pascal et le juriste et 
mathématicien Pierre de Fermat créent la théorie des probabilités. 


+1644 

Le physicien et mathématicien Evangelista Torricelli a l'idée de substituer du mercure à de l'eau dans 
l'expérience dite de Torricelli de mise en évidence du "grosso-vido"; suivront plus tard les travaux du 
mathématicien, physicien, inventeur, philosophe, moraliste et théologien Pascal Blaise (expérience du 
Puy de Dôme). 


+1638 
Le mathématicien, géomètre, physicien et astronome Galileo Galilée publie la relation mathématique 
définissant la période du pendule simple. 


+1637 

Le philosophe et mathématicien René Descartes renomme les inconnues x, y, z et les paramètres a, b, cet 
étend l'usage de l'algèbre aux longueurs et au plan, créant avec le juriste et mathématicien Pierre de 
Fermat la géométrie analytique. La même année, toujours René Descartes, détermine quantitativement 
les angles primaires et secondaires des arc-en-ciels respectivement à l'inclinaison du Soleil. 
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+1631 

Le mathématicien Thomas Harriot introduit, dans une publication posthume, les symboles > et <. La 
même année le mathématicien et théologien William Oughtred donne pour la première fois le symbole 
multiplié. 


+1629 
L'avocat et mathématicien Pierre de Fermat développe un calcul différentiel rudimentaire. 


+1624 
Invention du premier thermomètre (dont les graduations ne sont bien évidemment pas normalisées..) par 
le médecin Santorio Santorio. 


+1621 
L'astronome et physicien Willebrord Snell découvre que l'angle de réfraction de la lumière est déterminé 
par le sinus de l'angle formé par la lumière incidente avec la normale au dioptre. 


+1620 
L'ingénieur Francis Thomas Bacon défend la méthode expérimentale et mène de nombreuses 
observations sur la chaleur. Il suggère que la chaleur est reliée au mouvement. 


+1619 
L'astronome et mathématicien Johannes Kepler a fini de publier les trois lois relatives au mouvement des 
planètes. 


+1611 
L'astronome et mathématicien Johannes Kepler découvre la réflexion interne totale, la loi de réfraction 
aux petits angles de réfraction et l'optique des lentilles minces. 


+1614 
Le mathématicien John Napier (en français John Neper) invente les logarithmes, qui ramènent les 
opérations de multiplication et de division à de simples additions ou soustractions. 


+1608 

L'opticien Hans Lippershey invente le télescope qui sera utilisé et amélioré (avec une qualité aléatoire) 
l'année suivante par le mathématicien, géomètre, physicien et astronome Galileo Galilée pour confirmer 
les théories de Copernic. 


+1603 
Le mathématicien et astronome Thomas Harriot détermine la façon de calculer qualitativement la 
surface d'un triangle sphérique. 


+1591 

Le mathématicien François Viète ouvre une nouvelle période de l'algèbre en faisant opérer les calculs sur 
des lettres, utilisant les voyelles pour désigner les inconnues et les consonnes pour les paramètres. Par 
ailleurs, il donne le développement du binôme de Newton. 


+1590 

L'astronome Galileo Galilei démontre expérimentalement que tous les corps en chute libre ont une 
accélération identique. La même année, les opticiens Hans et Zacheraius Janssen créent le premier 
microscope en associant plusieurs lentilles ce qui définira les débuts de la biologie et la médecine 
scientifique. 
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+1586 

L'ingénieur et physicien Simon Stevin démontra la méthode du parallélogramme des forces et découvre 
que la pression d'un liquide sur le fond d'un récipient est indépendante de sa forme, et aussi de la surface 
du fond; elle dépend seulement de la hauteur d'eau dans le récipient. Il donna aussi la mesure de la 
pression sur n'importe quelle portion du côté d’un récipient. 


+1576 
L'astronome Tycho Brahé observe une nouvelle étoile dans la constellation de Cassiopée et construit un 
observatoire dans l'île de Hveen. 


+1572 

Le mathématicien Rafaelle Bombelli donne une formulation des nombres complexes et les règles de 
calculs effectifs. Il introduisit les termes più di meno (pdm) et meno di meno (mdm) pour représenter + i 
et-i. 


+1548 
Le mathématicien et physicien Simon Stevin écrit les puissances du dixième cernées d'un exposant. Il 
donne la première écriture des vecteurs. 


+1545 
Le mathématicien Ludovico Ferrari donne la solution des équations de degré 4. 


+1543 
L'ouvrage de l'astronome Nicolas Copernic résumant 26 ans de recherches et d'observations est publié et 
met clairement en avant que le système héliocentrique de Ptolémée n'est pas valide. 


+1536 
Le mathématicien Niccold Fontana développe la science de la balistique. 


+1530 
Le mathématicien et physicien Robert Recorde introduit le signe = et le mathématicien Michael Stifel 
développe une première forme de notation algébrique. 


+1525 
Le mathématicien Christoff Rudolff introduit la notation des racines carrées. 


+1510 
Le peintre, graveur et mathématicien Albert Dürer développe les bases de la géométrie descriptive et de 
la perspective. 


+1500 
Le mathématicien italien Scipione del Ferro parvient pour la première fois à une résolution algébrique 
d'un grand type d'équations du troisième degré. 


+1490 
Le peintre, sculpteur, architecte, musicien, mathématicien, inventeur, anatomiste, géologiste, cartographe, 
botaniste et écrivain. Leonardo da Vinci décrit le phénomène de capillarité. 


+1420 

Le mathématicien et astronome Jamshid Al- Käshï calcule et observe les éclipses solaires de 1406, 1407 
et 1408. Il serait également le premier à utiliser la notation décimale en arithmétique et dans les chiffres 
arabes. 
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+1400 
Le mathématicien et astronome Jamshid Al-Käshi développe une première forme de la méthode de 
Newton Regula falsi. 


+1269 
Le savant Pierre de Maricourt invente les expressions de la magnétique "pôle nord" et "pôle sud" et il a 
été le premier qui a écrit que les pôles opposés d'un aimant s'attirent 


+1268 

Le philosophe, savant et alchimiste Roger Bacon publie des propositions pour réformer l'école, 
argumentant que pour étudier la nature, l'utilisation des observations des mesures est la seule base 
rigoureuse de l'expérimentation et de la vérification tout en affirmant ainsi la nécessité des 
mathématiques. 


+1200 
Le mathématicien Jordan de Nemore introduit la notation des inconnues par des symboles. 


+1121 

L'astronome, physicien, biologiste, chimiste, mathématicien et philosophe Abu al-Fath Khäzini publie un 
livre dans lequel il propose que la gravité et l'énergie potentielle gravitationnelle varient selon la distance 
du centre de la Terre. Il fait aussi une distinction entre la force, la masse et le poids. Il invente aussi 
plusieurs instruments scientifiques, y compris une balance romaine et une balance hydrostatique. Il 
introduit aussi des méthodes scientifiques expérimentales à la statique et la dynamique, les unifie dans la 
science de la mécanique et combine l'hydrostatique avec la dynamique pour créer l'hydrodynamique. 


+1114 

Le mathématicien Bhaskara offre un résumé complet de la mathématique hindoue, telle qu'elle s'est 
développée du 5ème au 7ème siècle de notre ère. Ainsi il reconnaît les racines carrées négatives, résout 
des équations quadratiques à plusieurs inconnues, des équations d'ordre supérieur comme celles de Fermat 
ainsi que les équations du second degré générales. Il a également été un pionner dans le principe du calcul 
différentiel de près de 500 ans relativement à Newton et Leibniz. 


+1100 

Le philosophe et physicien Hibat Allah Abu'l-Barakat al-Baghdaadi est le premier à nier l'idée 
d'Aristote selon laquelle une force constante produit un mouvement uniforme ce qui préfigure la seconde 
loi de Newton sur le mouvement. Comme Newton, il a décrit l'accélération comme étant la variation de 
vitesse. 


+1037 

Le mathématicien, physicien et philosophe Ibn al-Haytham est conscient de la magnitude de 
l'accélération due a la gravité. Il découvre la loi de l'inertie, connue aujourd'hui comme la première loi du 
mouvement de Newton. 
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+1030 

Le philosophe, écrivain, médecin et scientifique Abu ‘Ali al-Husayn Ibn Abd Allah Ibn Sina (connu en 
Occident sous le nom de Avicenne) note que si la perception de la lumière est due à l'émission d'une sorte 
de particules par une source lumineuse, la vitesse de la lumière doit être finie. Il a également fourni une 
explication sophistiquée pour le phénomène de l'arc en ciel. Le mathématicien, astronome, physicien, 
érudit, encyclopédiste, philosophe, astrologue, voyageur, historien, pharmacologue Abü al-Rayhän 
Muhammad ibn Ahmad Al-Biruni, et plus tard l'astronome Abu al'Fath Khäzini, ont été les premiers à 
appliquer des méthodes scientifiques expérimentales dans la mécanique, en particulier les domaines de la 
statique et la dynamique, pour déterminer le poids spécifique, tels que ceux basés sur la théorie des 
équilibres et de pesage. 


+1021 

Le philosophe, mathématicien et physicien Ibn al-Haytham considéré comme le père de l'optique et un 
pionnier de la méthode scientifique explique correctement la lumière et la vision, et introduit la méthode 
scientifique expérimentale, jetant les bases de la physique expérimentale. Il discute aussi de la 
psychologie expérimentale et décrit les divers instruments d'optique comme la chambre noire. 


+1019 

Le mathématicien, astronome et physicien Abü Rayhän Al-Birunïi a observé et décrit l'éclipse solaire du 
8 avril 1019, ainsi que l'éclipse lunaire du 17 Septembre 1019, en détail ; il a donné la localisation exacte 
des étoiles lors de l'éclipse lunaire. Il invente l'astrolabe orthographique et le planisphère. 


+1010 
Le mathématicien Al-Sijistani invente le Zuraqi, un astrolabe unique conçu pour un modèle planétaire 
héliocentrique dans lequel la Terre est en mouvement plutôt que le ciel. 


+1000 

Le mathématicien, physicien et astronome Abu Sahl al-Qouhi découvre que la lourdeur des corps varie 
en fonction de leur distance du centre de la Terre, et résout des équations plus élevées que le deuxième 
degré. Durant le même décennie, le mathématicien et ingénieur Al'Karkhi écrit un livre contenant les 
premières preuves connues par induction mathématique. Il l'utilise pour démontrer le théorème du 
binôme, le triangle de Pascal, et la somme des cubes intégrales. 


+996 

L'astrolabe mécanique orienté, comportant 8 roues dentées est inventé par le mathématicien, astronome et 
physicien Abü Rayhän Al-Biruni qui est aussi l'auteur de travaux sur la sommation de séries et la 
combinatoire. 


+964 

Le mathématicien, philosophe et physicien Abd al-Rahman al-Soufi explique le pouvoir grossissant des 
lentilles et fut un des premiers à se servir d'une méthode d'analyse scientifique qui influencera grandement 
de futurs scientifiques. 


+953 

Le mathématicien et ingénieur Al-Karkhi définit différents monômes et donne des règles pour les 
produits de n'importe quels deux d'entre eux. Il a aussi découvert le théorème du binôme pour des 
exposants entiers. 
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+952 

Le mathématicien Abu'l-Hasan al-Uglidisi modifie les méthodes de calcul pour le système numérique 
indien pour le rendre possible aux plumes et à l'utilisation du papier. Jusque-là, faire des calculs avec les 
chiffres indiens nécessitait l'emploi d'une planche. 


+900 

La première référence à un tube d'observation se trouve dans l'oeuvre de l'astronome et mathématicien Al- 
Battani, et la première description exacte du tube d'observation a été donnée par le mathématicien, 
astronome, physicien, érudit, encyclopédiste, philosophe, astrologue, voyageur, historien, pharmacologue 
Al-Biruni, dans une section de son travail dédiée à vérifier la présence du nouveau croissant de Lune à 
l'horizon. Bien que ces tubes d'observations préliminaires n'aient pas de lentilles, ils ont permis à un 
observateur de se concentrer sur une partie du ciel en éliminant les interférences lumineuses. Ces tubes 
d'observation ont été adoptés ultérieurement en Europe latine, où ils ont influencé le développement du 
télescope. 


+880 

L'astronome et mathématicien Al-Battani découvre le mouvement de l'apogée du Soleil, calcule les 
valeurs de la précession des équinoxes et l'inclinaison de l'axe terrestre. Il est à l'origine de la définition de 
la fonction trigonométrique tangente et cotangente. 


+820 

Le mot "algèbre" naît. Le mathématicien, géographe, astrologue et astronome 

Muhammad ibn Musa Al'Khwarizmi est souvent considéré comme le père de l'algèbre médiévale, car il 
dégage celle-ci de l'emprise géométrique. On lui doit aussi le quadrant, l'instrument mural, le quadrant des 
sinus qui a été utilisé pour résoudre les problèmes trigonométriques et faire des observations 
astronomiques. 


+800 
Des astronomes inventent le cadran solaire universel et le cadran horaire universel à Bagdad. 


+780 

L'alchimiste Jabir Ibn Hayyan introduit la méthode scientifique expérimentale pour la chimie, ainsi que 
les appareils de laboratoire tels que l'alambic et des processus tels que la distillation pure, la liquéfaction, 
la cristallisation, et la filtration. Il à également inventé plus de vingt types d'appareils de laboratoire, ce 
qui a entraîné la découverte de plusieurs substances chimiques. Il a également développé des recettes pour 
le verre coloré. 


+773 
Les chiffres arabes (adaptés de l'Inde) font leur première apparition en Europe. 


+628 
Le mathématicien Brahmagupta, donne des règles pour résoudre les équations linéaires et quadratiques. 
Il découvre que les équations du second degré ont deux racines, dont les négatives et les irrationnelles. 


+550 
Les mathématiciens hindous donnent une représentation du chiffres zéro dans un système de notation de 
position. 
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+499 

Le mathématicien Âryabhat obtient le nombre complet de solutions d'un système d'équations linéaires 
par des méthodes équivalentes aux méthodes modernes, et décrit la solution générale de telles équations. Il 
donne également des solutions d'équations différentielles. 


+275 
Le mathématicien Diophante d'Alexandrie considéré comme le père de l'algèbre étudie les équations à 
variables rationnelles (incluant donc les équations du second degré) et les équations diophantiennes. 


+121 
Année correspondant au plus ancien document faisant mention de la pierre magnétique. 


+100 

L'ingénieur, mécanicien et mathématicien Héron d'Alexandrie redécouvre (après les chinois) le concept 
de force. Il invente aussi un système d'engrenages pour soulever des poids utilisant la puissance de la 
vapeur. Il fait la première description du sextant (mais ne l'a toutefois pas inventé). Son contemporain 
astronome Claude Ptolémée invente le sextant et décrit l'astrolabe (peut-être inventé par l'astronome, 
géographe et mathématicien Hipparque) et étudie la réfraction et la réflexion. Pendant le même siècle le 
mathématicien et philosophe Nicomaque de Gérase définit ainsi les nombres pairs et impairs, les 
nombres premiers et composés, les nombres parfaits. 


+80 
L'érudit Wang Ch'ung réalise la première boussole aimantée sur un plateau de laiton. 


-87 

Année correspondant à la datation de la machine d'Anticythère, considérée comme le premier calculateur 
analogique et la première machine à engrenages (une trentaine!) antique permettant de calculer des 
positions astronomiques complexes. Le soin et l'adresse avec lesquels cette machine fut réalisée, ainsi que 
les capacités nécessaires en mécanique et en astronomie remettent en question les connaissances 
historiques sur les sciences grecques avant sa découverte. En effet, aucun objet de même âge et de même 
complexité n'était connu dans le monde et il faut attendre près d'un millénaire pour voir apparaître des 
mécanismes comparables! Le physicien, mathématicien et ingénieur Archimède de Syracuse en est 
l'hypothétique créateur. 


-134 
L'astronome, géographe et mathématicien Hipparque de Nicéedécouvre la précession des équinoes. 


-150 

L'astronome, géographe et mathématicien Hipparque est souvent désigné comme le créateur de la 
trigonométrie et des tables numériques correspondantes. Il calcule le premier la période de révolution du 
Soleil autour de la Terre (mais les résultats numériques sont en réalité ceux de la rotation de la Terre 
autour du Soleil) et élabore la théorie des excentriques et des épicycles. 


-200 

Dans le siècle, les chinois auraient inventé l'écluse, le gouvernail, le principe de la machine à vapeur 
plusieurs centaines d'années avant les occidentaux! Pendant ce siècle, le scientifique et ingénieur 
Philon de Byzance rédige des traités sur les leviers, la pneumatique, les automates, la traction et les 
clepsydres. 
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-225 

Le géomètre et astronome Apollonius de Perge publie la première étude sur les coniques donnant à 
l'ellipse, à la parabole et à l'hyperbole les noms que nous leur connaissons. On lui attribue en outre 
l'hypothèse des orbites excentriques pour expliquer le mouvement apparent des planètes et la variation de 
vitesse de la Lune. 


-250 

Le mathématicien, physicien et ingénieur Archimède de Syracuse étudie des machines simples tel que le 
levier, la fameuse vis permettant entre autre de pomper l'eau ("vis d'Archimède") et découvre le principe 
d'Archimède qui explique la flottaison. Dans la même décennie, l'astronome, géographe, philosophe et 
mathématicien Ératosthène de Cyrène calcule le diamètre de la Terre à l'aide d'un gnomon et de son 
ombre et démontra l'inclinaison de l'écliptique. 


-260 
Le mathématicien, physicien et ingénieur Archimedes of Syracuse calcule z7 avec une précision de deux 


décimales utilisant des polygones inscrits et circonscrits et calcule la surface sous un segement de 
parabole. 


-281 

L'astronome et mathématicien Aristarque de Samos fait l'hypothèse que le Soleil occupe le centre du 
système solaire et utilise la trigonométrie pour estimer le rayon de la Lune et sa distance à la Terre en 
utilisant l'ombre de la Terre pendant une éclipse Lunaire. 


-300 

Le mathématicien et géomètre Euclide publie ses Éléments, où il réorganise toute la connaissance de la 
géométrie incluant des démonstrations logiques, la construction des 5 solides platoniciens. Dans son 
Optica, il nota que la lumière va en ligne droite et décrit la loi de réflexion. 


-310 
Le savant Autolycus de Pitane définit le mouvement uniforme tel qu'un objet parcoure une quantité égale 
de distance en un temps égal. 


-370 
Le philosophe Aristote développe la logique avec une théorie naïve des propositions, des quantités et du 
raisonnement par inférence. 


-388 

Le philosophe et astronome Héraclide du Pont fait l'hypothèse de la rotation de la Terre sur elle-même 
afin d'expliquer le mouvement apparent des étoiles au cours de la nuit (mais toujours dans un cadre 
géocentrique) et suggère que chaque planète est un corps comme la Terre. 


-400 
L'École Stoïcienne développe les propositions composées et les connecteurs logiques: "implication", "et", 
"ou" et les inférences "Modus ponens" et "Modus tollens". 


430 

Le philosophe Démocrite d'Abdère avance l'idée selon laquelle la matière se compose de particules 
identiques et minuscules qu'il appelle des "atomes". En réalité il s'agit plutôt d'une vulgarisation des idées 
de son maître, le philosophe Leucippe de Milet élaborées 10 ans avant. 
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-500 
Les philosophes Leucippe et Démocrite sont les fondateurs de l'atomisme. 


-540 
Le philosope et mathématicien Pythagore étudie la géométrie propositionnelle et la vibration de la corde 
de la lyre. 


-600 

Le philosophe Empédocle plaide pour une décomposition du monde en quatre éléments fondamentaux: 
l'eau, la terre, l'air et le feu. Le même siècle, le mathématicien Thalès de Milet met en évidence 
l'électrostatique en frottant un morceau d'ambre, prédit une éclipse et développe la géométrie du triangle. 


-800 
Les Assyriens utilisent des clepsydres et les Chinois tracent les mouvements planétaires pour leur 
calendrier. 


-1500 
Les indiens développent la théorie des 4 éléments (eau, air, terre feu). 


-1700 

Le mathématicien Apastamba résout les équations linéaires générales et utilise les systèmes d'équations 
diophantiennes comportant jusqu'à 5 inconnues. Le même siècle, les mathématiciens égyptian utilisent des 
fractions simples. 


-1800 
Les scribes Babyloniens recherchent la solution d'une équation quadratique. 


-2000 
Les prêtres babyloniens font les premiers relevés des observations célestes. 


-2300 
Les astronomes chinois font les premières observations du ciel. 


-2500 
Les Mésopotamiens imaginent un système de numérotation de position composé de symboles dont la 
valeur est fonction de leur rang à l'intérieur d'un nombre. 


-3000 
Les Chinois et les Babyloniens inventent l'abaque (boulier) première forme de machine à additionner. Des 
notions de géométrie pour l'arpentage sont développées (calcul de l'hypoténuse). 


-3200 
Datation des premières roues trouvées. 
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Notes personnelles: 
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Pour se détendre après avoir lu quelques centaines de pages de développements mathématiques, rien ne 
vaut parfois un peu d'humour scientifique. 


> Cette page est transmise avec des électrons 100% recyclés 


HUMOUR 


1. SITUATIONS 


Lors d'un grand jeu télévisé, les trois concurrents se trouvent être un ingénieur, un physicien et un 
mathématicien. Ils ont une épreuve à réaliser. Cette épreuve consiste à construire une clôture tout 
autour d'un troupeau de moutons en utilisant aussi peu de matériel que possible. 


- L'ingénieur: Regroupe le troupeau dans un cercle, puis décide de construire une barrière tout autour. 


- Le physicien: Construit une clôture d'un diamètre infini et tente de relier les bouts de la clôture entre 
eux jusqu'au moment où tout le troupeau peut tenir dans le cercle. 


- Le mathématicien: Voyant ceci, construit une clôture autour de lui-même et se définit comme y étant 
à l'extérieur. 


Deux hommes se déplaçant en ballon sont perdus dans le désert. Ils aperçoivent un individu en train de 
méditer à l'ombre d'un arbre. 


- "Où sommes-nous, s'il vous plaît ?" lui demandent-ils. 
Après un long moment de réflexion, l'homme leur répond: 

- "Dans un ballon." 

- "Merci, monsieur le mathématicien." 
L'homme demande étonné: 

- "Comment avez-vous su que j'étais mathématicien?" 


- "Pour trois raisons (répond l'aéronaute). Premièrement, vous avez beaucoup réfléchi 
avant de nous répondre. Deuxièmement, votre réponse est très exacte. Troisièmement, elle 
ne sert absolument à rien." 


Réactions devant un feu 
- L'ingénieur: Il prend un seau d'eau et éteint le feu 


- Le physicien: Après avoir mesuré la hauteur de la flamme, la pression, la température etc.., il calcule 
la quantité minimale d'eau pour éteindre la flamme 


- Réaction du mathématicien: "D'après le corollaire I. IV. IL. du théorème I. IV. I, il existe une solution 
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pour éteindre ce feu" 


Un médecin, un légiste et un mathématicien discutent des mérites comparés d'une épouse et d'une 
maîtresse. 


- Le légiste: "Il vaut mieux avoir une maîtresse. En cas de divorce, une épouse pose de nombreux 
problèmes légaux." 


- Le médecin: "Il vaut mieux avoir une épouse, car le sentiment de sécurité réduit le stress, et c'est bon 
pour la santé." 


- Le mathématicien: "Vous avez tous les deux torts. Le mieux est d'avoir les deux. Quand votre femme 
vous croît chez votre maîtresse, et votre maîtresse chez votre femme, vous pouvez faire des maths." 


Un grand homme d'affaires engage un mathématicien, un informaticien et un physicien afin de pouvoir 
gagner à tous les Tiercés. 


Le mathématicien le premier s'attaque à la tâche, il calcule des matrices à n'en plus finir, pose des 
axiomes à tout bout de champs et après de longues semaines de Lemmes, théorèmes et conjectures, il 
conclut que le problème est formellement irrésolvable. 


Ensuite, l'informaticien heureux d'avoir vu le mathématicien en échec, s'approche de son Cray II et 
après avoir écrit quantités d'algorithmes en C++ et introduit tous les paramètres et conditions initiales 
annonce joyeusement qu'il faudra juste quelques centaines d'années pour calculer le résultat de chaque 
Tiercé... 


Le physicien, le sourire aux lèvres, informe ses éminents collègues qu'il a la solution. Il s'approche d'un 
tableau noir et tout en dessinant une sphère commence par dire: "Approximons le cheval par une 
sphère parfaite." 


Lors d'un entretien d'embauche, un chef d'entreprise reçoit quatre ingénieurs: un ayant fait l'École 
polytechnique, le second HEC, le troisième informaticien, et le dernier sortant de l'université. Celui-ci 
explique aux quatre candidats qu'en définitive, pour faire marcher une entreprise, il suffit de savoir 
compter. 


Il s'adresse donc au premier d'entre eux, le polytechnicien, et lui dit: "allez-y, comptez..." 
- Le polytechnicien: "un. deux... un... deux..." 

L'homme étonné s'adresse ensuite à l'ingénieur sortant d'HEC: "À vous! Comptez..." 
- L'ingénieur sortant d'HEC: "un KiloFranc.. deux KiloFrancs, trois KE..." 

Il se retourne ensuite, inquiet, vers l'informaticien: "À vous! Comptez..." 


- L'informaticien: "O0... 1... 0... 1..." 
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Désespéré, le chef d'entreprise s'adresse au dernier candidat sortant de faculté: "Allez-y, comptez..." 


- Le jeune homme commence: "1... 2... 3... 4... 5... 6... 7..." 
Le chef d'entreprise rassuré: "continuez, continuez..." 


"8... 9... 10... valet. dame. roi... "!! 


Un concours met au défi un mathématicien, un physicien et un informaticien de démontrer que tous les 
impairs ne sont pas premiers. 


Le mathématicien en premier s'attaque à la tâche et énonce: 


"3 impair et premier 

o impair et premier 

7 impair et premier 

9=3x3 impair et non premier 


Donc, la proposition initiale est fausse. Fin de la démonstration" 
Ensuite, le physicien s'énonce à son tour: 


"3 impair et premier 

impair et premier 

7 impair et premier 

9 est impair mais non premier 
11 impair et premier 

13 impair et premier 


Donc 9 doit être une erreur expérimentale. La proposition est donc fausse" 
L'informaticien…: 


"3 impair et premier 

o impair et premier 

7 impair et premier 

9 impair et non premier 
9 impair et non premier 
9 impair et non premier 
9 impair et non premier 


- Finalement, le chimiste: 


"3 impair et premier 
o impair et premier 
7 impair et premier 
9 impair et premier 
11 impair et premier 
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13 impair et premier 
15 impair et premier..." 


Un mathématicien, un ingénieur et un physicien se voient remettre une balle en gomme rouge afin d'en 
déterminer le volume. 


- Le mathématicien: Mesure le diamètre et évalue le résultat de la triple intégrale. 


- Le physicien: Remplis un tonneau d'eau, dépose la balle dans l'eau et mesure le déplacement total de 
volume. 


- L'ingénieur: Observe le modèle et le numéro de série dans sa table des "balles en gomme rouge" 


Cette histoire est une légende urbaïne fort sympathique: 


J'ai reçu un coup de fil d'un collègue à propos d'un étudiant. Il estimait qu'il devait lui donner un zéro à 
une question de physique, alors que l'étudiant réclamait un 20. Le professeur et l'étudiant se mirent 
d'accord pour choisir un arbitre impartial et je fus choisi. Je lus la question de l'examen: "Montrez 
comment il est possible de déterminer la hauteur d'un building a l'aide d'un baromètre". L'étudiant avait 
répondu: "On prend le baromètre en haut du building, on lui attache une corde, on le fait glisser 
jusqu'au sol, ensuite on le remonte et on calcule la longueur de la corde. La longueur de la corde donne 
la hauteur du building." 


L'étudiant avait raison vu qu'il avait répondu juste et complètement à la question. D'un autre côté, je ne 
pouvais pas lui mettre ses points: dans ce cas, il aurait reçu son grade de physique alors qu'il ne m'avait 
pas montré de connaissances en physique. J'ai proposé de donner une autre chance à l'étudiant en lui 
donnant six minutes pour répondre à la question avec l'avertissement que pour la réponse, il devait 
utiliser ses connaissances en physique. Après cinq minutes, il n'avait encore rien écrit. Je lui ai demandé 
s'il voulait abandonner, mais il répondit qu'il avait beaucoup de réponses pour ce problème et qu'il 
cherchait la meilleure d'entre elles. Je me suis excusé de l'avoir interrompu et lui ai demandé de 
continuer. Dans la minute qui suivit, il se hâta pour me répondre: "On place le baromètre à la hauteur 
du toit. On le laisse tomber en calculant son temps de chute avec un chronomètre. Ensuite en utilisant 
la bonne formule connue par tous, on trouve la hauteur du building". À ce moment, j'ai demandé à mon 
collègue s'il voulait abandonner. Il me répondit par l'affirmative et donna presque 20 à l'étudiant. En 
quittant son bureau, j'ai rappelé l'étudiant, car il avait dit qu'il avait plusieurs solutions à ce problème. 
"Hé bien, dit-il, il y a plusieurs façons de calculer la hauteur d'un building avec un baromètre. Par 
exemple, on le place dehors lorsqu'il y a du soleil. On calcule la hauteur du baromètre, la longueur de 
son ombre et la longueur de l'ombre du building. Ensuite, avec un simple calcul de proportion, on 
trouve la hauteur du building." 


Bien, lui répondis-je, et les autres? À quoi l'élève répondit: "Il y a une méthode assez basique que vous 
allez apprécier. On monte les étages avec un baromètre et en même temps on marque la longueur du 
baromètre sur le mur. En comptant le nombre de traits, on a la hauteur du building en longueur de 
baromètre. C'est une méthode très directe. Bien sûr, si vous voulez une méthode plus sophistiquée, vous 
pouvez pendre le baromètre à une corde, le faire balancer comme un pendule et déterminer la valeur de 
g au niveau de la rue et au niveau du toit. À partir de la différence de g la hauteur de building peut être 
calculée. De la même façon, on l'attache à une grande corde et en étant sur le toit, on le laisse 
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descendre jusqu'à peu près le niveau de la rue. On le fait balancer comme un pendule et on calcule la 
hauteur du building à partir de sa période de balancement." 


Finalement, l'élève conclut: "Il y a encore d'autres façons de résoudre ce problème. Probablement la 
meilleure est d'aller au sous-sol, frapper à la porte du concierge et lui dire: "J'ai pour vous un superbe 
baromètre si vous me dites quelle est la hauteur du building." 


J'ai ensuite demandé à l'étudiant s'il connaissait la réponse que j'attendais. Il a admis que oui, mais qu'il 
en avait marre du collège et des professeurs qui essayaient de lui apprendre comment il devait penser. 


Pour l'anecdote, l'étudiant était Niels Bohr (prix Nobel de Physique en 1923) et l'arbitre Rutherford 
(prix Nobel de Chimie en 1908). 


Dans un cours de Russell portant sur le fait que d'une proposition fausse, toute proposition peut être 
déduite, un étudiant lui posa la question suivante: 


- "Prétendez-vous que de 2 + 2 =5, il s'ensuit que vous êtes le pape ? " 
- "Oui", fit Russell 
- "Et pourriez-vous le prouver !", demanda l'étudiant sceptique 
- "Certainement", réplique Russell, qui proposa sur le champ la démonstration suivante. 
(1) Supposons que 2+2=5 
(2) Soustrayons 2 de chaque membre de l'égalité, nous obtenons 2 = 3 
(3) Par symétrie, 3 = 2 
(4) Soustrayant 1 de chaque côté, il vient 2 =1 


Maintenant le pape et moi sommes deux. Puisque 2 = 1, le pape et moi sommes un. Par suite, je suis le 
pape. 


Sur ce … 


What is "pi"? 

- Mathematician: "Pi is the ratio of the circumference of a circle to its diameter." 
- Engineer: "Pi is about 22/7." 

- Physicist: "Pi is 3.14159 plus or minus 0.000005" 

- Computer Programmer: "Pi is 3.141592653589 in double precision." 


- Nuütritionist: "You're one track math-minded fellows, Pie is a healthy and delicious dessert!" 
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An astronomer, a physicist, a mathematician and a computer scientist (it is said) were holidaying in 
Scotland. Glancing from a train window, they observed a black sheep in the middle of a field. 


- "How interesting", observed the astronomer, "all scottish sheep are black!" 
- To which the physicist responded:"No, no! Some Scottish sheep are black!" 


- The mathematician gazed heavenward in supplication, and then intoned: "In Scotland there exists at 
least one field, containing at least one sheep, at least one side of which is black." 


- The computer scientist: "Oh, no! A special case!" 


A mathematician, a biologist and a physicist are sitting in a street cafe watching people going in and 
coming out of the house on the other side of the street. 


First they see two people going into the house. Time passes. After a while they notice three persons 
coming out of the house. 


- The physicist: "The measurement wasn't accurate." 
- The biologists: "They have reproduced". 


- The mathematician: "If now exactly one person enters the house then it will be empty again." 


A mathematician and an engineer attend a lecture by a physicist. The topic concerns Kaluza-Klein 
theories involving physical processes that occur in spaces with dimensions of 9, 12 and even higher. 
The mathematician is sitting, clearly enjoying the lecture, while the engineer is frowning and looking 
generally confused and puzzled. By the end the engineer has a terrible headache. At the end, the 
mathematician comments about the wonderful lecture. 


- The engineer says: "How do you understand this stuff?" 
- Mathematician: "I just visualize the process." 
- Engineer: "How can you visualize something that occurs in 9-dimensional space?" 


- Mathematician: "Easy, first visualize it in N-dimensional space, then let N go to 9." 


Two mathematicians are in a bar. The first one says to the second that the average person knows very 
little about basic mathematics. The second one disagrees, and claims that most people can cope with a 
reasonable amount of math. 


The first mathematician goes off to the washroom, and in his absence the second calls over the 
waitress. He tells her that in a few minutes, after his friend has returned, he will call her over and ask 
her a question. All she has to do is answer "one third x cubed." 


She repeats "one thir -- dex cue"? 
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He repeats "one third x cubed". 


She asks, "one thir dex cuebd?" 
"Yes, that's right," he says. 
So she agrees, and goes off mumbling to herself, "one thir dex cuebd...". 


The first guy returns and the second proposes a bet to prove his point, that most people do know 
something about basic math. He says he will ask the blonde waïitress an integral, and the first laughingly 
agrees. The second man calls over the waïitress and asks "what is the integral of x squared?". 


The waitress says "one third x cubed" and while walking away, turns back and says over her shoulder 
"plus a constant!" 


Paroles de profs: 


- Il reste des lambeaux de l'argument 

- Le signe ‘- devant le potentiel vous interpelle ? Et si je mets un ‘+' est-ce que cela vous convient 
mieux? Oui ! Alors mettons un ‘+... 

- C'est une courbe de phase ça ? Non, c'est une jambe de chien ! 

- On va le tuer et on fera croire à un suicide 

- Vous pouvez dire que c'est prévisible puisque c'est imprévisible ! 

- Je compte sur vous pour comprendre un petit peu à fond la suite 

- Nous allons étudier cela maintenant un peu plus tard 

- Je vais vous présenter des résultats dépendant des équations de Maxwell que vous n'avez pas encore 
vues. de toute façon, au point où on en est... 

- Si vous ne comprenez pas, c'est normal... le contraire serait d'ailleurs étonnant 

- La relativité générale ne sert à rien ! C'est pas avec ça qu'on met des satellites en orbite! 

- Question à cinquante centimes 

- De temps en temps, il faut être absurde 

- Quand on n'a rien à se mettre sous la dent, on prend le théorème de Gauss 

- On ne voit pas par quelle vertu du Saint-Esprit il deviendrait neutre ?! 

- Vous comprendrez quand vous serez grand... 

- Prenons l'exemple d'une banque: monsieur y fait un dépôt et madame y fait un retrait. enfin comme 
d'habitude quoi ! 

- … plus le parallélisme sera parallèle. 

- Effacez-moi ces gris-gris résidus de calculs antérieurs 

- Effacez le membre de gauche. J'ai dit DE GAUCHE ! Où est votre droite ? C'est bien. eh bien la 
gauche, c'est de l'autre côté ! 

- Voyons, qui sera la prochaine victime ? 

- Le ‘+ se reconnaît, et les électrons ne s'y trompent pas, à sa belle couleur rouge ! 

- Le but du jeu est de vérifier que le critère ne dit pas de conneries 

- Si vous n'arrivez pas à faire cela, je vous rassure: c'est foutu pour l'examen 

- Si vous n'arrivez pas à faire cela, faites-le ! 

- Vous être très forts pour trouver des choses fausses 

- Ce genre de démonstration, ça me plaît. Vous, ça vous fait faire des cauchemars 

- Je ne résoudrai pas ceci, car cela risquerait de heurter votre sensibilité ! 
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- Tout ce que les profs adorent mérite votre méfiance ! 

- Vous ajoutez des patates et des cochons, c'est sans dimension... 

- On peut chercher la dérivée de l'impulsion de Dirac, c'est pas ça qui va nous sauter à la tête 

- C'est bête mais Riemann, c'est comme ça 

- Regardez l'équation que je viens d'effacer 

- Juridiquement parlant, le courant est dans ce sens 

- Ilest hors de question que je perde mon temps à vous résoudre cette plaisanterie de basse volée ! 

- Si la fille a compris alors vous devez avoir tous compris 

- Ah oui, vous vous moquez de moi. En fait, vous avez raison de vous moquer des profs car nous, on 
n'hésite pas à se moquer de vous 

- Attention, très très important: je vous propose d'en rêver la nuit 

- J'ai l'impression du jouer du stradivarius devant des vaches 

- La main de dieu répartit le champ perpendiculairement à la surface 

- Le miracle de la disparition de l'harmonique n'aura pas lieu aujourd'hui 

- Si vous vous réveillez la nuit, dites-vous que échantilloner dans le domaine des temps, c'est périodiser 
dans le domaine des fréquences... puis rendormez-vous 

- Les courbes gauches ne sont pas droites 

- Vous voyez, quelques fois mes résultats sont corrects 

- On note "Q"' la sortie, c'est évident. 

- Il va falloir une entourloupette pour réussir à récupérer cette variable 

- Je suis un 68000; M. le directeur passe dans le couloir, frappe à la porte: on ne fait pas mieux comme 
interruption ! 

- Attention: un, deux, trois, à vos cerveaux ! 

- Dans la steppe de l'automatique, nous arrivons à la partie aride des mathématiques 

- Quel intérêt ? Eh bien aucun. C'est une figure de rhétorique pédagogique 

- Si vous avez quelques souvenirs sur les graphes de fluence que jadis nous traçâmes... 

- Les électrons dans du métal très chaud, c'est la place de la Concorde à 5h du soir, donc ça ne conduit 
pas non plus 

- Les cercles, c'est ce qui a le moins de coins ! 

- Si vous mettez vos doigts dans une prise, ce n'est pas un nombre complexe qui sort 

- Voir la démonstration dans vos lectures journalières. donc je m'en dispense 

- Et puis vient ensuite le père Carnot: il ramène sa fraise pour ne pas dire grand chose 

- Quelquefois, les gens qui ont un peu de culture connaissent Ça. c'est raté pour aujourd'hui ! 

- On n'appellera pas cela "rendement", car on peut obtenir des résultats supérieurs à 1, ce qui pourrait 
troubler quelques esprits faibles 

- … Si vous avez par exemple de la glace à 20°C... 

- Moi, si on m'avait envoyé au tableau, j'aurais pas écrit cela 

- Vous trouverez la réponse sur 36 15 Archimède 

- J'utilise une méthode qui date de quelques siècles. comme moi d'ailleurs ! 

- Posez-moi des questions. j'aimerais qu'on me pose des questions! … d'autres questions ? Je vais être 
obligé de prendre la liste et de dire: "toi, tu as une question à poser" 

- L'ordonnancement implémenté dépend de l'instanciation du garbage collector s'il est synchronisé sur 
le multithreading préemptif de l'OS. 

- vous n'êtes que des boîtes qui reçoivent des entrées et crachent des sorties 


Sherlock Holmes et le Dr Watson sont au camping. Après un bon repas et une bonne bouteille de vin, 


ils gagnent leur sac de couchage dans la tente et s'endorment. 
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Quelques heures plus tard, Holmes se réveille et aussitôt secoue son compagnon: 


- "Watson, regardez le ciel et dites-moi ce que vous voyez." 
- "Je vois des millions et des millions d'étoiles." 
- "Et qu'est-ce que vous en concluez ?" 


- "Du point de vue astronomique, répond Watson, cela me dit qu'il y a des millions de galaxies et 
potentiellement des milliards de planètes. Du point de vue astrologique, j'observe que Saturne est en 
Lion. Du point de vue chronologique, j'en déduis qu'il est environ 3 heures 15. Du point de vue 
théologique, je vois que Dieu est tout-puissant et que nous sommes petits et insignifiants. Du point de 
vue météorologique, je pense que nous aurons une belle journée demain. Et vous, Holmes ?" 


Sherlock Holmes reste pensif une minute puis déclare: 


- "Watson, vous êtes un âne. On nous a fauché la tente." 


An engineer, a mathematician, and a physicist are staying for the night in a hotel. Fortunately for this 
joke, a small fire breaks out in each room. 


The physicist awakes, sees the fire, makes some careful observations, and on the back of the hotel's 
wine list does some quick calculations. Grabbing the fire extinguisher, he puts out the fire with one, 
short, well placed burst, and then crawls back into bed and goes back to sleep. 


The engineer awakes, sees the fire, makes some careful observations, and on the back of the hotel's 
room service list (pizza menu) does some quick calculations. Grabbing the fire extinguisher (and adding 
a factor of safety of 5), he puts out the fire by hosing down the entire room several times over, and then 
crawls into his soggy bed and goes back to sleep. 


The mathematician awakes, sees the fire, makes some careful observations, and on a blackboard 
installed in the room, does some quick calculations. Jubliant, he exclaims "A solution exists!", and 
crawls into his dry bed and goes back to sleep. 


How do you know that the driver driving toward you is a physicist? 


He has a red sticker on his bumper, saying: "If this sticker is blue, you are driving too fast." 


A Princeton plasma physicist is at the beach when he discovers a ancient looking oil lantern sticking out 
of the sand. He rubs the sand off with a towel and a genie pops out. The genie offers to grant him one 
wish. The physicist retrieves a map of the world from his car an circles the Middle East and tells the 
genie, "I wish you to bring peace in this region". 


After 10 long minutes of deliberation, the genie replies, "Gee, there are lots of problems there with 
Lebanon, Iraq, Israel, and all those other places. This is awfully embarrassing. l've never had to do this 
before, but l'm just going to have to ask you for another wish. This one is just too much for me". 
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Taken aback, the physicist thinks a bit and asks, "I wish that the Princeton tokamak would achieve 
scientific fusion energy break-even." 


After another deliberation the genie asks, "Could I see that map again?" 


2. MATHÉMATIQUES 


Un professeur de maths explique à une blonde les limites. Il fait avec elle l'exercice suivant: 


. 1 
litn = © 
x—8 x—8 


À la fin de l'exercice, il demande à la blonde si elle a compris. "Oh oui monsieur j'ai tout compris!". N'y 
croyant qu'à moitié, il lui pose l'exercice suivant: 


Soit à calculer: 


1 
lim 
x—5 Xx— 5 
Et la blonde de résoudre: 
| . l 
lin = « alors lim = 
+x—8 x— 8 x—5 Xx— # 


Évolution de l'enseignement des Mathématiques (...) 


- Enseignement 1960: Un paysan vend un sac de pommes de terre pour 100 Frs. Ses frais de production 
s'élèvent au 4/5 du prix de vente. Quel est son bénéfice ? 


- Enseignement traditionnel 1970: Un paysan vend un sac de pommes de terre pour 100 Frs. Ses frais de 
production s'élèvent au 4/5 du prix de vente, c'est-à-dire à 80 Frs. Quel est son bénéfice ? 


- Enseignement moderne 1970: Un paysan échange un ensemble P de pommes de terre contre un 
ensemble M de monnaie. Le cardinal de l'ensemble M est égal à 100, et chaque élément PFM vaut 1 Fr. 
Dessinez 100 gros points représentant les éléments de l'ensemble M. L'ensemble F des frais de 
production comprend 20 gros points de moins que l'ensemble M. Représentez l'ensemble F comme 
sous-ensemble de l'ensemble M et donnez la réponse à la question suivante: Quel est le cardinal de 
l'ensemble B des bénéfices ? (à dessiner en rouge) 


- Enseignement rénové 1980: Un agriculteur vend un sac de pommes de terre pour 100 Frs. Les frais de 
production s'élèvent à 80 Frs et le bénéfice est de 20 Frs. Devoir: souligne les mots "Pommes de terre" 
et discutes-en avec ton voisin. 


- Enseignement réformé 1980: Un peizan kapitalist privilégié sanrichi injustement de 20 Frs sur un 
sac de patat, analiz le tekst et recherche les fotes de contenu, de gramère, >d'orthografe, de 
ponctuassion et ensuite dit ce que tu panse de set manière de s'enrichir. 


- Enseignement start-up 1999: Un producteur de l'espace agricole câblé consulte une data bank qui 
display le day-rate de la patate. Il load son progiciel de computation fiable et détermine le cash-flow sur 
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écran bit-map (sous WMil avec config floppy et DD 40Go). Dessine avec ta souris le contour intégré 
3D du sac de pommes de terre. Puis logues-toi au network par le www.blue-potatoe.com et suis les 
indications du menu. 


- Enseignement 2010: Qu'est-ce qu'un paysan ? 


Volume = pi-2:2-à 


Un mathématicien à son ami: 
- "Es-tu fidèle?" 


- "Oui, à isomorphisme près" 


Comment les mathématiciens le font: 
- Les théoriciens des nombres l'ont fait en premier 


- Nous savons que les analystes réels le font continâment, mais pour les spécialistes de théorie des 
ensembles, ce n'est qu'une hypothèse 


- Les analystes complexes le font entièrement mais avec conformisme 
- Les algébristes le font avec détermination et sans discrimination 
- Les topologistes le font ouvertement, mais compactement 


- Les topologistes différentiels et algébriques le font avec variété 
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- Les spécialistes de combinatoire le font discrètement 


- Les statisticiens le font soit presque toujours, soit presque jamais 

- Les théoriciens de la mesure le font presque partout 

- Les logiciens le font avec consistance 

- Les géomèêtres le font au foyer mais avec courbures et torsions 

- Les théoriciens des groupes le font simplement et fidèlement 

- Les théoriciens des anneaux le font avec intégrité 

- Les théoriciens des corps le font en inversé 

- Les spécialistes de programmation linéaire maximisent la performance et minimisent les efforts 
- Markov avait besoin de chaînes pour le faire, et Noether d'anneaux 

- Euler le faisait en cercle, tandis que Bernoulli le faisait en spirale ou en huit 
- Môbius le faisait toujours du même côté 


- Gauss le faisait normalement, Lebesgue, avec mesure, et Cauchy le faisait complètement, au contraire 
de Güdel 


- Fermat a essayé de le faire dans la marge, mais il n'y avait pas assez de place 


- On pense que Riemann et Goldbach l'on fait, mais on n'est encore jamais arrivé à le prouver 


Qu'est-ce qu'un homme complexe dit à une femme réelle ? 


Réponse: "viens danser !" (il faut lire "dans C", c'est-à-dire l'ensemble des complexes) 


Les fonctions logarithme et exponentielle sont au restaurant. Quand viendra l'addition, qui payera ? 
Réponse: Exponentielle, car logarithme né paie rien. 


Plus tard dans la nuit, Logarithme et Exponentielle rentrent chez eux un peu bourrés. Logarithme 
demande: Est-ce que je prends le volant ? 


Exponentielle répond: Je préfère que ce soit moi qui conduise. Au cas où on dérive... 


Deux suites de Cauchy veulent sortir en boite. Elles arrivent devant une boite où se déroule la soirée 
"No Limit". Elles décident de rentrer, mais le vigile les arrête en leur disant:"Désolé, c'est complet!". 
(dans un espace complet, une suite de Cauchy est convergente par définition, donc elle a une limite.) 
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A mathematician went insane and believed that he was the differentiation operator. His friends had him 
placed in a mental hospital until he got better. AIl day he would go around frightening the other patients 
by staring at them and saying: "I differentiate you!" 


One day he met a new patient; and true to form he stared at him and said "I differentiate you!", but for 
once, his victim's expression didn't change. Surprised, the mathematician marshaled his energies, stared 
fiercely at the new patient and said loudly "I differentiate you!", but still the other man had no reaction. 
Finally, in frustration, the mathematician screamed out "I DIFFÉRENTIATE YOU!" 


The new patient calmly looked up and said: "You can differentiate me all you like: l'm e to the x." 


Ce que les mathématiciens disent et ce qu'il faut comprendre: 
- Trivial: Si je dois vous montrer ceci, vous êtes dans la mauvaise classe 
- On peut trivialement montrer: On a pas besoin de plus de 4 heures pour le démontrer 


- Contrôlez vous-même: C'est la partie difficile de la démonstration donc vous pouvez le faire sur votre 
temps libre 


- Similairement: Au moins une ligne de la démonstration est identique à la précédente 


- Procédons formellement: Nous allons manipuler des symboles avec des règles bien prédéfinies sans 
rien comprendre au sens réel du résultat. 


- Nous nous dispenserons de la démonstration: Faites-moi confiance, c'est vrai! 
- Le lecteur montrera facilement: Ça m'ennuie de montrer que... 


- Nous conseillons vivement au lecteur de faire les exercices indiqués: Comme je les ai pas faits, vous 
pourriez me les corriger 


- J'ai montré ce résultat dans un papier antérieur: Je ne sais plus diable comment on fait pour prouver ce 
truc-là 


- On généralise facilement: La généralisation dépasse mon niveau 


- D'après une propriété bien connue: Par 10 personnes au monde... 


Tout le monde connaît le "Théorème du Salaire" qui établit que les ingénieurs et les scientifiques ne 
peuvent JAMAIS gagner autant que les hommes d'affaires et les commerciaux. Ce théorème peut enfin 
se démontrer par la résolution d'une équation mathématique simple. 


Notre équation s'appuie sur deux postulats très connus: 


P1. La Connaissance c'est la Puissance 
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P2. Le Temps c'est de l'Argent 


Tout ingénieur sait ensuite que: 


. Travail 
Puissance = —— 
Temps 
Puisque: 
Connaissance = Puissance 
et que: 


Temps = Argent 


Nous avons donc: 


. Travail 
Connaissance = —— 
Argent 
Nous obtenons alors facilement: 
Travail 
AP gert = ———— 
Connaissance 


Ainsi quand la Connaissance tend vers zéro, l'Argent tend vers l'infini quelle que soit la valeur attribuée 
à Travail, cette valeur peut être très faible. À l'inverse quand la Connaissance tend vers l'infini, l'Argent 
tend alors vers zéro, même si la valeur Travail est élevée. 


D'où la conclusion évidente suivante: Moins vous en connaissez, plus vous gagnez d'argent. 


PS: Ceux d'entre vous qui ont eu quelques difficultés de compréhension doivent être les mieux 
rémunérés. 


C.Q.FD. 


Dans le même genre voici le "Théorème du misogyne"”: 


D'abord, nous déclarons que les filles sont des variables factorisables en quantités de temps et d'argent 
telle que: 


Filles = Temps: Argent 
Comme nous le savons tous "le temps c'est de l'argent!". Donc: 
Temps = Argent 
et parce que "l'argent est la racine du mal..." et que le mal est un synonyme du ce qui est mauvais: 


Argent = Mauvais 
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Donc: 


Filles = (Mauvais)? 
Nous sommes donc forcés de conclure: 


Filles = Mauvais 


The Top Ten Excuses For Not Doing Your Math Homework 


#10. Galileo didn't know calculus; what do I need it for? 


#9. "A math addict stole my homework. When they arrested him, they discovered Mr. Pleacher had 


been his teacher." 


#8. l'm taking physics and the homework in there seemed to involve math, so I thought I could just do 


that instead. 
#7. I have the proof, but there isn't room to write it in the margin. 
#6. I have a solar powered calculator and it was cloudy. 


#5. I was watching the World Series and got tied up trying to prove 
that it converged. 


#4. I could only get arbitrarily close to my textbook. 
I couldn't actually reach it. 
(I reached half way, and then half of that, and then ...) 


#3. I couldn't figure out whether 
i am the square root of negative one or 
i is the square root of negative one. 


#2. It was Einstein's birthday and pi day 
and we had this big celebration! 
(This only works for March 14) 


#1. I accidentally divided by zero and my paper burst into flames. 


Que fait: 
2ab 
2Fr.16 
(lire "2 abbés sur 2 françaises) 
Solution: 
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2bb* 
eg 
(lire "2 bébés assurés") 


Que fait: 


cheval 


oiseau 
Comme: 


cheval _ vache ‘1 
oiseau £'i 
(lire "vache + l" (contient toutes les lettres de "cheval") divisé par "bête à ailes" 


Mais: 


vache} _ Êx'i 
£"i #8" 
(lire "bête à pie + l" divisé par "bête à ailes") 


On simplifie: 


XX 
Ceci démontre que Pi est incommensurable (soit irrationnel) car il n'y a aucune commune mesure entre 
un cheval et un oiseau... 


= 7 


À démontrer: 


ROSSINT 1 
SOLSIDO 


ROS SI M _ ROS MN 
SOL SI DO SOL DO 


mais À} = DO (NI vaut Do c'est-à-dire "niveau d'eau") donc: 


ROS 
SOL 


Mais SOL fait RINO (Solferino: c'est lors de cette bataille qu'Henri Dunant en voyant l'horreur a décidé 
de créer la Croix-Rouge) donc: 


ROS 
RI NO 


=] 
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et comme RINO c'est ROS (rhinocéros) donc RINO = ROS alors: 


Chaque futur ingénieur apprend à inscrire la somme de deux chiffres rationnels, par exemple: 
1+1=2 
Cette forme est cependant assez banale et indique des lacunes dans votre éducation. 
En premier semestre, on apprend que: 
1=in(e) 
et ensuite que: 
1= sin?(p) + cos (p) 


Tout le monde sait aussi que: 


et que donc l'équation: 
1+1=2 
peut être écrite plus simplement: 
. 2 2 = (1Ÿ 
Infe) +sin° (p) + cos” (p) = if) 
(il faut admettre que l'aspect est bien plus clair et plus scientifique) 


D'autre part, il est évident que: 


1= cosh(g)4f1 - tanh?(g) 


et aussi: 


il en résulte que: 
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In(e) +sin?(p) + cos? (p) = Ë | 


#= 0 
peut être réécrite comme suit: 


* 
1 s D h fi + h? 
In r ‘ + :| | +sin* (p) + cos" (p) = >» ef te) 
3-0 Z = : 
Il faut également se rappeler que: 
Ql=1 


et que l'exposant inverse de l'exposant opposé est égal à l'exposant opposé de l'exposant inverse. En 
supposant un espace à n dimension, on sait que: 


64 Ro © A 
Si l'on prend encore la matrice comme la métrique d'un espace canonique orthogonal et orienté: 
(gg) —(gy )7 =0 
nous obtenons logiquement: 
(Ce) -(e, "7" )=1 


nous obtenons ainsi une expression simple et claire pour tout le monde de 1 +1 = 2: 


H=Û 


2 : - 3 x 
un CHENE + sin/(p) + cos (p}= Ù ee tanh ®) 


Il est donc évident que cette équation est bien plus compréhensible que: 
1+1=2 


Il serait possible de montrer plusieurs autres développements de cette simple expression et nous le 
ferons à partir du moment où vous commencerez à comprendre les principes simples de la méthode 
précédente. 


Un catcheur, un physicien et un mathématicien sont sujet à une expérience: on les enferme dans une 
pièce avec chacun une boite d'épinards, fermée, et sans ouvre-boîte. Au bout de 24 heures, on va voir 
ce qu'ils sont devenus. 


- Le catcheur a réussi à ouvrir sa boîte: « Et bien, j'ai simplement violemment projeté la boîte contre le 
mur. L'impact a été tel qu'elle s'est ouverte », explique t-il. 


- Le physicien a également réussi à ouvrir sa boîte: « J'ai observé le solide, et distingué ses points de 
rupture. J'ai alors effectué une pression de manière à exercer une force maximale sur ceux-ci, et la 
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boîte s'est tout naturellement ouverte. » 


- Le mathématicien, enfin, est retrouvé prostré dans un coin de la pièce, la sueur ruisselant sur son 
visage, et sa boîte de conserve, fermée, entre les pieds: « Admettons que la boîte est ouverte... 
Admettons que...» 


3. PHYSIQUE 


-En théorie, il n'y a pas de différences entre la théorie et la pratique. En pratique, si! 


-La théorie, c'est quand on sait tout, mais que rien ne marche. La pratique, c'est quand tout marche, 
mais qu'on ne sait pas pourquoi. En informatique, la théorie et la pratique sont réunies: rien ne marche 
et on ne sait pas pourquoi! 


Matter is fundamentally lazy:- It always takes the path of least effort 
Matter is fundamentally stupid:- It tries every other path first. 


That is the heart of physics - The rest is details. 


Ce sont deux atomes qui se rencontrent. 
L'un dit à l'autre: "Merde, j'ai perdu un électron!" 
L'autre: "T'es sûr?" 


Et le premier répond: "POSITIVEMENT !!" 
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Biogies Drisien / Jack Miggins 


TEA MGUE 
Ë ane) 4 IStilL 
E-M > + 37151772 Di een o 
\ 22247 Ton 1% w 

Q = { 32 2 


You enter the laboratory and see an experiment. How will you know which class is it? 
- Ifit's green and wiggles, it's biology. 
- [fit stinks, it's chemistry. 


- If it doesn't work, it's physics. 


Theorem: a cat has nine tails. 


Proof: No cat has eight tails. A cat has one tail more than no cat. Therefore, a cat has nine tails. 


Un physicien étudiant la physique quantique, c'est quelqu'un qui ne voyant pas très bien, cherche dans 
une chambre obscure, un chat noir, qui probablement n'existe pas. 


An engineer, a physicist, a mathematician, and a mystic were asked to name the greatest invention of 
all times. 


- The engineer chose fire, which gave humanity power over matter. 
- The physicist chose the wheel, which gave humanity the power over space. 


- The mathematician chose the alphabet, which gave humanity power over symbols. 
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- The mystic chose the thermos bottle. 


"Why a thermos bottle?" the others asked. 


- The mystic: "Yes, because the thermos keeps hot liquids hot in winter and cold liquids cold in 
summer." 


- "Yes... so what?" the others asked. 


- The mystic: "Think about it." said the mystic reverently. "That little bottle.. how does it know?" 


Physics professor has been doing an experiment, and has worked out an empirical equation that seems 
to explain his data. He asks the math professor to look at it. 


A week later, the math professor says the equation is invalid. By then, the physics professor has used 
his equation to predict the results of further experiments, and he is getting excellent results, so he asks 
the math professor to look again. 


Another week goes by, and they meet once more. The math professor tells the physics professor the 
equation does work, "But only in the trivial case where the numbers are real and positive." 


Page: 4783/4839 


[v3.0 - 2013] 


PR 


È 


[3Ë g'+v]Y= AÈY 


7 ee 


Ce Hy Oe + 60, + 6Ca + 6H, © xx 
à C4 Li 


PONT EN 


È 


Heisenberg was driving down the highway whereupon he was pulled over by a policeman. 
The policeman asked: 

"Do you know how fast you were going back there?" 

Heisenberg replied: 


"No, but I know where I am." 


What's the difference between an auto mechanic and a quantum mechanic? 


The quantum mechanic can sometimes get the car inside the garage without opening the door. 
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“At this point we notice Lheë hs eruerdion ts 
bouutifuliy sémplifient if ue assume that 
space-time has 92 dimensions.” 


Why God Never Received Tenure at any University 

1. He had only one major publication. 

2. It was in Hebrew. 

3. It had no references. 

4. It wasn't published in a refereed journal. 

5. Some even doubt he wrote it himself. 

6. It may be true that he created the world, but what has he done since then? 
7. His cooperative efforts have been quite limited. 

8. The scientific community has had a hard time replicating his results. 

9. He never applied to the Ethics Board for permission to use human subjects. 
10. When one experiment went awry he tried to cover it up by drowning the subjects. 


11. When subjects didn't behave as predicted, he deleted them from the sample . 
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12. He rarely came to class, just told students to read the Book. 
13. Some say he had his son teach the class. 


14. He expelled his first two students for learning. 


15. Although there were only ten requirements, most students failed his tests. 


16. His office hours were infrequent and usually held on a mountaintop. 


In the beginning there was Aristotle 

And objects at rest tended to remain at rest 

And objects in motion tended to come to rest 

And God saw that it was boring, although very restful. 


Then God created Newton 

And objects at rest tended to remain at rest 

And objects in motion tended to remain in motion 

And energy was conserved, and momentum was conserved, 
And matter was conserved 

And God saw that it was conservative. 


Then God created Einstein 

And everything was relative 

And fast things became short 

And straight things became curved 

And the universe was filled with inertial frames 
And God saw that it was relatively general 

but some of it was especially relative. 


Then God created Bohr 

And there was the principle 

And the principle was quantum 
And all things were quantified 

But some things were still relative 
And God saw that it was confusing. 


Then God was going to create Furgeson 
And Furgeson would have unified 

And he would have fielded a theory 

And all would have been one. 

But it was the seventh day 

And God rested 

And objects at rest tend to remain at rest. 
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TUES TU SAURAS QUEÏ f PARESSEUX, 

PARESSEUX, JE SUIS EN TRAIN] KPARESSEUX JE PREMIÈRE LOI DE 
EME LA FHYSIQUE 

SCIENTIFIQUE 


The Physicist's Bill of Rights 


We hold these postulates to be intuitively obvious, that all physicists are born equal, to a first 
approximation, and are endowed by their creator with certain discrete privileges, among them a mean 
rest life, n degrees of freedom, and the following rights which are invariant under all linear 
transformations: 


1. To approximate all problems to ideal cases. 


2. To use order of magnitude calculations whenever deemed necessary (i.e. whenever one can get away 
With it). 


3. To use the rigorous method of "squinting" for solving problems more complex than the addition of 
positive real integers. 


4. To dismiss all functions which diverge as "nasty" and "unphysical". 


5. To invoke the uncertainty principle when confronted by confused mathematicians, chemists, 
engineers, psychologists, dramatists, and other lower scientists. 


6. When pressed by non-physicists for an explanation of (4) to mumble in a sneering tone of voice 
something about physically naïve mathematicians. 


7. To equate two sides of an equation which are dimensionally inconsistent, with a suitable comment to 
the effect of, "Well, we are interested in the order of magnitude anyway". 


8. To the extensive use of "bastard notations" where conventional mathematics will not work. 

9. To invent fictitious forces to delude the general public. 

10. To justify shaky reasoning on the basis that it gives the right answer. 

11. To cleverly choose convenient initial conditions, using the principle of general triviality. 

12. To use plausible arguments in place of proofs, and thenceforth refer to these arguments as proofs. 


13. To take on faith any principle which seems right but cannot be proved. 


You can at least take this simple Real Scientist Quiz to find out if you're cut out for the life of a true 
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scientist. 


The Real Scientist Quiz 
1. At Christmas time, you: 
a. Take a couple of days off to spend time with your family. 
b. Leave early on Christmas eve so you can pick up a few presents for the family. 


c. Only work half a day, spending the rest of the day at home working on your grant 
application. 


2. Your spouse wants to discuss plans for the family vacation with your kids. You: 
a. Propose to go camping so you can explain the wonders of nature to your kids 


b. Propose to go to another city so you can spend the day in your friend's lab while your 
spouse takes the kids sightseeing. 


c. Ask your spouse, "We have kids?" 


3. At a scientific meeting on an island in the South Pacific, no talks are scheduled in the afternoon. 
During this free time, you: 


a. Follow the local custom and sunbathe on the beach in the nude. 


b. Sit on the beach fully clothed, unaware of the nude sunbathers, and discuss science with 
your colleagues. 


c. Sit in your hotel room with the drapes closed, and work on your manuscript. 
4. The nurse at school calls to tell you that your second-grade child has chicken pox. You: 
a. Immediately drop what you're doing and rush to school to pick up your sick kid. 
b. Immediately drop what you're doing and begin trying to find a cure for chicken pox. 
c. Ask the nurse for directions to the school, and the names of your kids. 


5. Beings from outer space visit Earth, and you are the first human they meet. To show their friendship, 
they present you with a highly advanced device that is capable of prolonging life, ending human 
suffering, and curing disease. You: 


a. Present it to the United Nations. 
b. Apply for a patent. 
c. Break it open to see how it works. 


6. What is the longest amount of time that you have worked without a vacation (excluding scientific 
meetings)? 
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a. Six months. 


b. Two years. 
c. I took a weekend off about 10 years ago. 
7. What are your hobbies? 
a. Sports, music, and dance, because they allow the analytical parts of my brain to relax. 
b. Cooking, because it's quite a lot like science. 
c. Reading back issues of scientific journals cover to cover. 
8. Your best friend is: 
a. À member of your college fraternity. 
b. À member of your immediate family. 
c. À member of a gene family. 
Score: 


Give yourself one point for every question you answered with an "a," 5 points for every "b," and 50 
points for every "c." If you took the test three times and averaged your score, give yourself 100 extra 
points. If you calculated the standard error of the mean, give yourself 500 points. 


If you scored less than 10, you are normal. Scores of 11-50 indicate an obsessed scientist. If you scored 
more than 50, you are in need of help and should consider joining Scientists Anonymous; if you scored 
greater than 500, you should forget Scientists Anonymous and get back to work since you are beyond 
help, and may actually succeed as a scientist. 


Pourquoi 
ne bouges-tu pas? 


la gravité 
n'était pas 


Comment il faut comprendre certaines phrases dans les publications des physiciens: 
- Il est bien établi que...: Je ne me suis pas donné la peine de lire les références, mais... 


- Ceci est de grande importance théorique: Ceci est important pour moi. 
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- Quoiqu'il n'ait pas été possible de donner une réponse définitive: L'expérience échoua, mais il me 
semble tout de même pouvoir en tirer une publication. 


- La technique utilisée fut particulièrement adéquate...: Le copain du labo d'à côté avait déjà mis la 
technique au point. 


- 3 échantillons furent choisis pur une étude exhaustive: Les résultats obtenus à partir des autres 
échantillons n'ont rien donné de cohérent . 


- Manipulé avec la plus grande précaution durant toute l'expérimentation: Ne fut pas jeté à l'égout. 
- La concordance avec la théorie est excellente: elle est passable. 

- La concordance avec la théorie est bonne: elle est faible. 

- La concordance avec la théorie est satisfaisante: elle est douteuse. 

- La concordance avec la théorie est passable: elle est totalement imaginaire. 

- Il est généralement admis que...: 2 collègues pensent comme moi 

- Il est admis que: Je crois que. 

- Il est évident que des travaux complémentaires seront utiles: Je n'ai rien compris. 

- Voici quelques résultats typiques: Voici les meilleurs résultats. 

- Significatif dans un intervalle de confiance de...: non significatif. 


- Les réactifs utilisés furent synthétisés au laboratoire selon des techniques standardisées: Les réactifs 
furent achetés chez... 


- Malheureusement, les bases quantitatives permettant de tirer profit des résultats n'ont pas encore été 
formulées: Personne n'est arrivé à comprendre quoi que ce soit à ce qui a été observé. 


- Nous remercions X pour sa précieuse collaboration et Y pour les discussions fructueuses: X a fait le 
travail et Y m'a expliqué ce que signifiaient les résultats. 
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4. STATISTIQUES 


3 statisticiens sortent faire du tir sur cible statique. Le premier statisticien fait feu et tire trop à gauche, 
le deuxième fait feu, mais tire symétriquement trop à droite. Enfin, le dernier ne tire pas, mais s'exprime 
triomphalement: "En moyenne nous l'avons eu!" 


Patient: "Vais-je survivre à cette opération délicate?" 
Chirurgien: "Oui, je suis absolument sûr que vous y survivrez." 
Patient: "Comment pouvez-vous être si sûr?" 


Chirurgien: "9 patients sur 10 meurent lors de cette opération et hier mon neuvième patient est mort. 
aujourd'hui" 


10 bonnes raisons pour s'orienter dans le domaine de la statistique: 

1. Estimer des paramètres est plus simple que de se battre dans la vraie vie 
2. Les statisticiens sont des gens reconnus 

3. Vous apprendrez l'alphabet grec en entier 

4. La probabilité que vous obteniez un job dans ce domaine est > 0.9999 
5. Si vous êtes virés, vous pourrez toujours vous reconvertir à l'ingénierie 
6. Vous faites ce travail dans la confidence, la régularité et la variabilité 

7. Vous êtes normal et le reste du monde est faux 

8. La ligne de régression paraît meilleure que la ligne du chômage 


9. Vous n'avez jamais besoin d'être exact - seulement approximatif 
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10. Personne ne comprend ce que vous faites, alors vous avez toujours raison 


5, ÉCONOMIE 


Pour aider à comprendre le jargon spécifique du marketing... et éviter de paraître ridicule dans une 
soirée (pot de départ par exemple...): 


1. Michel est à une soirée et voit une nana très attirante. Il s'approche d'elle et lui dit: "Je suis un très 
bon coup". C'est ce qu'on appelle du "marketing direct" 


2. Michel est à une soirée avec un groupe de copains et il voit une nana très attirante. Un de ses amis 
s'approche d'elle et lui dit: "Tu vois ce garçon là-bas, c'est un très bon coup". C'est ce qu'on appelle de 
la "publicité." 


3. Michel est à une soirée et il voit une nana très attirante. Il lui demande son numéro de téléphone. Le 
lendemain, il l'appelle et lui dit: "Je suis un très bon coup". C'est ce qu'on appelle du "télémarketing." 


4. Michel est à une soirée et il voit une nana très attirante. Il la reconnaît, s'approche d'elle, lui rafraîchit 
la mémoire et lui dit: "Tu te souviens que je suis un très bon coup ?". C'est ce qu'on appelle du 
"Customer Relationship Management (CRM)" 


5. Michel est à une soirée et il voit une nana très attirante. Il se lève, s'arrange un peu, s'approche d'elle 
et lui sert un verre. Il lui ouvre la porte lorsqu'elle part, ramasse son sac lorsqu'il tombe, lui offre une 
cigarette et lui dit: "Je suis un très bon coup". C'est ce qu'on appelle des "relations publiques" ou 
"public relations" (PR) 


6. Michel est à une soirée et il voit une nana très attirante. Il invite à danser toutes ses copines, leur 
offre à boire et les fait rire ostensiblement par ses plaisanteries très spirituelles. La belle nana l'aborde et 
lui dit: "J'ai l'impression que tu es un très bon coup". C'est ce qu'on appelle du "lobbying". 


7. Michel est à une soirée et il voit une nana très attirante. Elle s'approche de lui et lui dit: "J'ai entendu 
dire que tu es un très bon coup". C'est ce qu'on appelle le "pouvoir de la marque”. 


8. Michel est à une soirée et voit une super belle nana. Il la mate avec ses potes, fait des réflexions très 
fines, se bourre la gueule, ne fait rien du tout et rentre bredouille. C'est ce qu'on appelle la "réalité du 
marché". 


6. CHIMIE 

On vient de découvrir un nouvel élément chimique: 

ÉLÉMENT NUMÉRO: 115 

NOM: Femme 

SYMBOLE: Fm 

MASSE ATOMIQUE: Acceptable 60 kg mais des isotopes connus de 40 à 250 kg 
OCCURRENCE: Très abondant de par le monde 


PROPRIÉTÉS PHYSIQUES: 
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- Entre en ébullition pour un rien et gêle sans raison 


- Conductivité thermique: faible surtout aux extrémités inférieures 
- Coefficient de dilatation: augmente avec les années 
- Cède aux pressions appliquées aux points sensibles 


- Structure moléculaire: parfaite ?90/60/90, existe aux USA sous forme croissante 60/90/120 et dans les 
pays nordiques sous forme dite plate 50/50/50 


PROPRIÉTÉS CHIMIQUES: 


- Très grande affinité pour l'or, l'argent, le platine et tous les métaux nobles. Absorbe de grandes 
quantités de substances onéreuses 


- Peut exploser spontanément sans avertissement 


- Insoluble dans les liquides mais présente une activité grandement augmentée par saturation dans 
l'alcool 


- Réactivité très variable selon les périodes de la journée 

- Grande aptitude aux changements d'humeur et à la jalousie. 

- Sensible aux élections qui lui transmettent parfois la migraine 
UTILISATIONS COURANTES: 

- Hautement décorative surtout dans les voitures de sport 

- Puissant agent nettoyant 

- Aide efficace pour la relaxation et la détente 

TEST: 

Tourne au vert si placée à côté d'un spécimen de meilleure qualité 
PRÉCAUTIONS D'EMPLOI: 

- Hautement dangereuse si placée entre des mains non expertes 


- Il est illégal d'en posséder plus d'un spécimen, mais il est possible d'en entretenir plusieurs à des 
endroits différents tant que les différents spécimens n'entrent pas en contact (risque d'explosion) 


ATTENTION: 


Certains chercheurs d'Amérique du Sud ont découvert le moyen d'en fabriquer artificiellement, 
présentées généralement sous les marques "Travelo" ou "Dragqueen". Ne consommer que le produit 
générique 
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On vient de découvrir un nouvel élément chimique: 


ÉLÉMENT NUMÉRO: 116 
NOM: Homme 
SYMBOLE: Hm 


ANALYSE QUANTITATIVE: Mesuré à 17 cm, bien que quelques isotopes existent en 25, 20, 13 et 
même 10 cm. 


DÉCOUVREUR: Éve (découvert par accident un jour où elle avait envie de côtelettes) 

LIEU D'EXTRACTION: Se trouve en grandes quantités en présence d'un gisement de Fm très pur 
PROPRIÉTÉS PHYSIQUES 

- Surface recouverte de poils, raides par endroits, doux dans d'autres 


- Bout quand on l'agite, se glace quand on le met en présence de la logique et du bon sens, se liquéfie 
quand on le traite comme un dieu 


- Devient exécrable lorsqu'on le mélange à n'importe quel alcool 


- Peut être la cause de maux de tête (ou des maux d'autres parties du corps); à manipuler avec 
précaution 


- Diminue son entropie directement après sa réaction avec l'élément Fm (état se manifestant par des 
ronflements.. ZZZZZ) 


- Augmente sa masse considérablement en vieillissant, perd de ses capacités réactionnelles. 
- Se déshydrate rapidement par temps sec. 

- Rarement trouvé à l'état pur après 14 ans 

- possède souvent un attachement inexplicable à sa roche mère, rendant l'extraction difficile 


- Si on le met sous pression, devient trop dur et improductif; n'est productif que si l'on utilise la subtilité, 
les subterfuges, et la flatterie 


PROPRIÉTÉS CHIMIQUES 

- Tendance très forte à réagir avec l'élément Fm, même si la réaction est parfois endothermique 
- Réputé être le meilleur catalyseur pour les réactions de transformation de l'élément Fm 

- Possède la faculté d'entrer en réaction avec à peu près n'importe quoi 

- En cas de réaction importante, l'aspect de l'élément change pour virer au rouge cramoisi. 


- S'il est saturé en alcool, il devient inerte et repoussant pour la plupart des éléments 
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- Ne convient pas pour les tâches ménagères et les opérations de nettoyage 


- Ne convient pas non plus pour les tâches familiales 

- Est neutre en ce qui concerne la courtoisie et l'impartialité 

USAGES COURANTS 

- Transport de choses lourdes, chauffeur, dîners gratuits au restaurant. 

- Usage possible pour les activités sexuelles 

TESTS 

- Les spécimens les plus purs ne sont pas synonymes de pureté, et ceux qui ont déjà servi, encore moins 
DANGERS 


- La réaction avec un autre élément Hm est extrêmement violente si l'élément Fm est le catalyseur 


La question suivante a réellement été posée en ces termes à l'université de chimie de Washington: 


L'Enfer est-il exothermique (dégage-t-il de la chaleur) ou endothermique (absorbe-t-il de la chaleur) ? 
Appuyez votre réponse avec une preuve. 


La plupart des étudiants écrivirent comme preuve de leurs théories la loi de Boyle (Les gaz se 
réchauffent quand ils sont comprimés et se refroidissent quand ils se décompriment) ou une variante. 


Un étudiant, toutefois, a écrit ce qui suit: 


Premièrement, nous avons besoin de savoir comment la masse de l'Enfer évolue dans le temps. Ce qui 
signifie aussi que nous avons besoin de connaître le rythme auquel les âmes vont en Enfer et le rythme 
auquel elles en sortent. Je pense que nous pouvons sans crainte affirmer qu'une fois qu'une âme est en 
Enfer, elle n'en sortira plus. Par conséquent, aucune âme ne sort des enfers. 


Pour ce qui est des nombreuses âmes qui vont en Enfer, examinons les différentes religions qui existent 
de par le monde aujourd'hui. Certaines d'entre elles décrètent que si vous n'êtes pas membre de leur 
religion, vous irez en Enfer. Depuis qu'il y a plus d'une religion de cette sorte et depuis que les gens ne 
pratiquent qu'une seule religion, nous pouvons en déduire que presque tout le monde et toutes les âmes 
vont en Enfer. 


Avec le rythme des naissances et des morts qui sont ce qu'ils sont, nous pouvons nous attendre à ce que 
le nombre des âmes en Enfer augmente de façon exponentielle. 


Maintenant occupons-nous du rythme d'évolution du volume de l'Enfer, parce que la loi de Boyle prédit 
que pour que la température et la pression restent les mêmes, le volume de l'Enfer doit s'agrandir 
proportionnellement aux âmes qui s'ajoutent. 


Ceci nous donne deux possibilités: 
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1. Si l'Enfer croît a un rythme plus lent que celui des âmes qui arrivent en Enfer, alors la température et 
la pression s'accroissent jusqu'à ce que l'Enfer craque de partout. 


2. Bien sûr, si l'Enfer s'agrandit à un rythme plus rapide que le nombre d'âmes en Enfer s'accroît, alors 
la pression et la température baissent jusqu'a ce que l'Enfer gêle tout entier. 


A chemist walks into a pharmacy and asks the pharmacist: "Do you have any acetylsalicylic acid?" 
- "You mean aspirin?" asked the pharmacist. 


- "That's it, I can never remember that word." 


A physicist, biologist and a chemist were going to the ocean for the first time. 


The physicist saw the ocean and was fascinated by the waves. He said he wanted to do some research 
on the fluid dynamics of the waves and walked into the ocean. Obviously he was drowned and never 
returned. 


The biologist said he wanted to do research on the flora and fauna inside the ocean and walked inside 
the ocean. He too, never returned. 


The chemist waïited for a long time and afterwards, wrote the observation: "The physicist and the 
biologist are soluble in ocean water". 


CLASSIFICATION OF CHEMISTRY 
Physical Chemistry: The pitiful attempt to apply y=mx+b to everything in the universe. 
Organic Chemistry: The practice of transmuting vile substances into publications. 


Inorganic Chemistry: That which is left over after the organic, analytical, and physical chemists get 
through picking over the periodic table. 


Chemical Engineering: The practice of doing for a profit what an organic chemist only does for fun. 


Free radicals have revolutionized chemistry. 


Chemist's last words: 
- And now the tasting test. 
- And now shake it a bit... 


- In which glass was my mineral water? 
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- Why does that stuff burn with a green flame?!? 


- And now the detonating gas problem. 

- This is a completely safe experimental setup. 

- Now you can take the protection window away... 
- Where do all those holes in my kettle come from? 
- And now a cigarette. 

7. INGÉNIERIE 


Des scientifiques de la NASA ont développé un fusil spécialement conçu pour projeter des poulets 
morts dans les pare-brises des avions de ligne, des jets militaires et des navettes spatiales. Le but étant 
de vérifier les conséquences de possibles collisions avec des volatiles et d'adapter les matériaux des 
pare-brises en conséquence. 


Les ingénieurs britanniques ayant entendus parler de ce genre de fusil ont de suite développés un 
identique pour effectuer le même type de tests sur leurs trains à très grande vitesse. Lorsque le premier 
test fut effectué, le poulet traversa le pare-brise, la console de commande, la motorisation pour finir sa 
course dans le mur opposé. 


Horrifiés et étonnés par ces résultats, les ingénieurs britanniques les communiquèrent à leurs confrères 
américains afin d'obtenir des suggestions de leur part. La NASA leur répondit en une seule 
phrase: "Décongelez le poulet avant!" 


Comprendre les ingénieurs 
- Tentative N° 1 


Deux élèves ingénieurs marchent le long de leur campus lorsque l'un des deux dit à l'autre, admiratif: 
"Où est-ce que tu as trouvé ce vélo ?" Le second lui répond: "Ben en fait, alors que je marchais, hier, et 
que j'étais dans mes pensées, je croise une super nana en vélo qui s'arrête devant moi, pose son vélo par 
terre, se déshabille entièrement et me dit: "Prends ce que tu veux... ". J'ai donc choisi son vélo. 


Le premier opine et lui dit: "Tu as raison, les vêtements auraient certainement été trop serrés. 
- Tentative N° 2 


Pour une personne optimiste, le verre est à moitié plein. 
Pour une personne pessimiste, il est à moitié vide. 
Pour l'ingénieur, il est deux fois plus grand que nécessaire. 


- Tentative N° 3 


Un pasteur, un médecin et un ingénieur jouent au golf. Ils attendent après un groupe de golfeurs 
particulièrement lents. Au bout d'un moment, l'ingénieur explose et dit: "Mais qu'est-ce qu'ils fichent? 
ça fait bien un quart d'heure qu'on attend là !" Le docteur intervient, exaspéré lui aussi: "Je ne sais pas, 
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mais je n'ai jamais vu des gens s'y prendre aussi mal !" Le pasteur dit alors: "Attendez, voilà quelqu'un 
du golf. On n'a qu'à le lui demander. Dites-moi, il y a un problème avec le groupe de devant. Ils sont 
plutôt lents, non ?" L'autre répond: "Ah oui, c'est un groupe de pompiers aveugles. Ils ont perdu la vue 
en tentant de sauver le golf des flammes l'année dernière, alors depuis, on les laisse jouer gratuitement". 
Le groupe reste silencieux un moment, et le pasteur dit: "C'est si triste. Je vais faire une prière 
spécialement pour eux ce soir". Le médecin ajoute: "Bonne idée. Et moi, je vais contacter un copain 
chercheur ophtalmologiste pour voir ce qu'il peut faire". Et l'ingénieur: "Mais putain ! Pourquoi ils 


jouent pas la nuit ?" 


- Tentative N° 4 


Un ingénieur traversait la rue lorsqu'une grenouille l'appela et lui dit: "Si tu m'embrasses, je me 
transformerai en une magnifique princesse". Il se baissa, ramassa la grenouille et la mit dans sa poche. 
La grenouille lui dit alors: "Si tu m'embrasses, je me transformerai en une magnifique princesse et je 
resterai à tes côtés pendant une semaine". L'ingénieur sortit la grenouille de sa poche, lui fit un sourire 
et la replaça dans sa poche. La grenouille se mit alors à crier: "Si tu m'embrasses, je me transformerai 
en une magnifique princesse, je resterai à tes côtés pendant une semaine et je ferai TOUT ce que tu 
veux". Encore une fois, l'ingénieur sortit la grenouille de sa poche, lui sourit et la remit dans sa poche. 
La grenouille lui demanda alors: " Quoi, qu'est-ce qu'il y a ? Je te dis que je suis une magnifique 
princesse, que je resterai à tes côtés pendant une semaine et que je ferai tout ce que tu veux. Alors 
pourquoi tu ne m'embrasses pas ?" L'ingénieur répondit: "Regarde-moi, je suis un ingénieur. J'ai pas le 
temps d'avoir une petite amie. Par contre, une grenouille qui parle, ça, c'est cool ! " 


- Tentative N°5 
Un journaliste interviewe un paysan corse: 
- "Dites-moi, comment faites-vous pour tracer les routes ici? " 


- "beh, on lâche un âne et on regarde par où il passe dans la montagne.…..et c'est là qu'on fait passer la 
route". 


- "et si vous n'avez pas d'âne? " 


- "ah....beh on prend un ingénieur... " 


Lors de la course à la conquête spatiale dans les années 1960, la NASA décida pour le besoin de ses 
astronautes de développer un stylo à bille fonctionnant dans un système sans gravité. 


Après un temps considérable de recherche et de développements, le stylo "Astronaute" fut développé 
pour un coût de 1 million de dollars. Le stylo fonctionna très bien mais trouva un faible intérêt de la 
part du public sur Terre. 


L'Union Sovétique, se trouvant confronté au même problème, utilisa elle un crayon... 


The great mathematician John Von Neumann was consulted by a group who was building a rocket ship 
to send into outer space. When he saw the incomplete structure, he asked, "Where did you get the 


plans for this ship?" 
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He was told, "We have our own staff of engineers." 


He disdainfully replied: "Engineers! Why, I have complete sewn up the whole mathematical theory of 
rocketry. See my paper of 1952." 


Well, the group consulted the 1952 paper, completely scrapped their 10 million dollar structure, and 
rebuilt the rocket exactly according to Von Neumann's plans. The minute they launched it, the entire 
structure blew up. They angrily called Von Neumann back and said: "We followed your instructions to 
the letter. Yet when we started it, it blew up! Why?" 


Von Neumann replied, "Ah, yes! That is technically known as the blow-up problem - I treated that in 
my paper of 1954." 


Dans un laboratoire d'électronique: 

-Dis-donc, c'est quoi le semi-remorque sur le parking devant? 
- Le semi-remorque? 

- Ben oui, le chauffeur dit que tu es au courant... 


-Ah oui!! J'ai commandé un condensateur de 1 Farad. 


The Dictionary: what engineers say and what they mean by it 

- Major Technological Breakthrough: Back to the drawing board. 

- Developed after years of intensive research: It was discovered by accident. 

- The designs are well within allowable limits: We just made it, stretching a point or two. 
- Test results were extremely gratifying: It works, and are we surprised! 


- Customer satisfaction is believed assured: We are so far behind schedule that the customer was happy 
to get anything at all. 


- Close project coordination: We should have asked someone else. 


- Project slightly behind original schedule due to unforeseen difficulties: We are working on something 
else. 


- The design will be finalized in the next reporting period: We haven't started this job yet, but we've got 
to say something. 


- À number of different approaches are being tried: We don't know where we're going, but we're 
moving. 


- Extensive effort is being applied on a fresh approach to the problem: We just hired three new guys; 


well let them kick it around for a while. 
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- Preliminary operational tests are inconclusive: The darn thing blew up when we threw the switch. 


- The entire concept will have to be abandoned: The only guy who understood the thing quit. 


- Modifications are underway to correct certain minor difficulties: We threw the whole thing out and 
are starting from scratch. 


- Essentially complete: Half done. 
- We predict..: We hope to God! 
- Drawing release is lagging: Not a single drawing exists. 


- Risk is high, but acceptable: 100 to 1 odds, or with 10 times the budget and 10 times the manpower, 
we may have a 50/50 chance. 


- Serious, but not insurmountable, problems: It will take a miracle. God should be the program manager. 
- Not well defined: Nobody has thought about it. 

- Requires further analysis and management attention: Totally out of control. 

- The project is designed for high availability: Malfunctions will be blamed on the operators mistakes. 


- This project has low maintenance requirements: We wouldn't let the technicians change a light bulb, 
much less fool around with our baby. 


- The software is being developed without excessive process overhead: The documentation will be 
written in clear and lucid Chinese. 


- The delivery is scheduled for the last quarter of next year: This leaves us plenty of time to decide who 
to blame for it being late. 


- How many first year engineering students does it take to change a light bulb?: None. That's a second 
year subject. 


- How many second year engineering students does it take to change a light bulb?: One, but the rest of 
the class copies the report 


- How many third year engineering students does it take to change a light bulb?: Will this question be in 
the final examination”? 


- How many civil engineers does it take to change a light bulb?: Two. One to do it and one to steady the 
chandelier 


- How many electrical engineers does it take to change a light bulb?: None. They simply redefine 
darkness as the industry standard 


- How many computer engineers does it take to change a light bulb?: Why bother? The socket will be 
obsolete in six months anyway 
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- How many mechanical engineers does it take to change a light bulb?: Five. One to decide which way 
the bulb ought to turn, one to calculate the force required, one to design a tool with which to turn the 
bulb, one to design a comfortable - but functional - hand grip, and one to use all this equipment. 


- How many nuclear engineers does it take to change a light bulb?: Seven. One to install the new bulb 
and six to figure out what to do with the old one for the next 10,000 years. 


Cela se passe à Moscou, : un couple de touristes demande son chemin, sur un pont, à un quidam, russe, 
qui se trouve être ingénieur (trouver un pont moscovite connu, et la première rue qui le croise sur la 
berge…). 


Le gars leur dit: "vous traversez, et, d'ici 50 m, vous tournez à droite..." 
Remerciements de la part des touristes. , puis ils partent. Alors le gars leur court derrière: 


"Attendez, attendez ! Je viens de me souvenir que le pont fait 70 m. Si vous tournez à droite au bout de 
50 m, comme je vous l'ai dit, vous tomberez à l'eau." 


8. INFORMATIQUE 


7 A 7 __ 


je ne sais pas les | 
\ ordinateurs sont 
dns maintenance 


PRE 


NICE TRY. 


quel est le sens 
de la vie? 


| 


Himclude <SfFdi0,n/7 
int main(void) 


int count ; 


for (count = 1; count = 500 ; count ++) 


prinit£ (I will not Throw paper dirplanes in class“); 
return O; 


Comment devenir un bon Hacker ? 
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Bon, si tu veux être un vrai hacker, il va te falloir Linux. 


Là, tu as 2 solutions: 


1. Tu es un sale bourgeois capitaliste et tu l'achètes 150 balles à la FNAC 
2. Tu es un vrai trou du cul, et là tu le downloades par le Net 


Évidemment, tu es un vrai trou du cul donc tu ouvres ton tit client FTP et tu te tapes tranquillement les 
20 ou 25 heures de download pour une Slack ou une Debian. Evite la Red Hat, ça fait trop grand 
public, toi t'es un mec uNdERgrOuNd maintenant, c'est normal, t'es Hacker. 


Bon, tu as ton Linux, maintenant c'est bon oublie-le. Pas la peine de se casser le cul à apprendre un 
nouvel OS dont tu ne te serviras jamais parce que "XWing vs Tie Fighter" tourne pas dessus. La 
meilleure solution consiste carrément à niquer lilo, comme ça tu es sûr que tu ne booteras que sous 
Windows95. C'est une solution élégante que de nombreux trous du cul semblent avoir choisie. Pour ça, 
ouvre une session DOS par Windows et tape fdisk /mbr. Ca va effacer lilo qui était installé sur le MBR 
de ton disque dur, comme ça tu n'auras plus à te soucier de Linux. 


L'essentiel est de l'avoir, pas de savoir s'en servir. 
"Ouais mais comment je peux prouver aux gens que j'ai Linux et passer pour un gros rebelle ?" 


C'est une question bien naturelle. J'ai pensé à toi petit looser et voici une série de phrases qu'il faut 
balancer à propos de Linux: 


- "Linux c'est trop puissant, t'es complètement libre par rapport à ces OS de fachos genre Windaube. De 
toute façon, MS c'est trop ripoux." 


- "Bah si t'es un débutant, va pas sous Linux, c'est fait pour les eLiTes ce truc, toi reste sous winfuck." 


- "Dis, tu sais pas ou je pourrais trouver la libc5.4.36 ? Parce que chez moi la 5.4.35 est incompatible 
avec les modifs que j'ai faites au kernel." 


- "Ça pue netscape, moi ça me dumpe des cores de 10 mégas dès que le lance, je préfère Lynx au moins 
c'est pas prise de gueule c'est mieux le mode texte." 


- "Ralala le bouffon que c'est lui ! Il s'est installé une Red Hat !! Tain c'est de la daube les Red Hat c'est 
nul y'a que la Debian qui est bien, au moins tu sais ce que tu fais t'es le master de ton system nan 
vraiment c'est ripoux Red Hat." 


Avec ce genre de petites phrases, tu te retrouveras très vite classé dans la catégorie "OK c'est un trou 
du cul, mais un trou du cul sous Linux", ce qui est la première étape pour être un vrai hacker. 
Maintenant que tout le monde sait que tu as ton Linux, il faut passer au stade suivant, celui du pro des 
réseaux, genre le mec qui maîtrise ICMP à mort. C'est la deuxième étape de ton long périple. 


Ici, il faut mettre la main au porte-monnaie. Direction la FNAC, tu achètes n'importe quel bouquin sur 
Unix et sur les réseaux. L'essentiel est que le titre soit compliqué. Un petit "Protocole rlogin sur réseau 
Ethernet en sous-adressage" sera du meilleur effet. N'hésite pas, dès que tu ne comprends même pas le 
titre, il faut acheter le bouquin: c'est pas pour lire, c'est pour impressionner tes autres potes trous du cul. 


Une bonne méthode consiste à acheter un bouquin genre "TCP/IP volume 43" et de prendre des mots 
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au hasard à apprendre par coeur: rai socket, sur-adressage, FDDI, telnet par exemple. Ensuite, tu les 
ressors dans une phrase, même hors contexte c'est pas grave personne n'ira vérifier ce que ça veut dire. 
Par exemple, il ne faut pas hésiter à balancer un "Le Telnet, ça prends combien de rai sockets en 
sur-adressage sur un FDDI" sur un bon gros channel de cowboyz, ça impressionne toujours, et personne 
n'ira te dire que ça n'a aucun sens, ne t'inquiète pas. 


Dispose ensuite ces bouquins dans ta chambre, avec les titres les plus compliqués aux endroits les plus 
visibles. Corne quelques pages pour faire plus vrai. Prends aussi quelques feuilles et dessine des 
schémas bidons de réseau, ou met des trucs genre 123.44.5.34 root/lydia pour faire croire que tu te 
chopes de password comme un ouf. Faut se la jouer à mort, ne jamais hésiter à en rajouter, scanne-toi 
une photo de Mitnick et accroche la au-dessus de ton lit, ou met des autocollants à tête de mort sur ton 
UC pour bien dire que maintenant, t'es un voyou, un mec dangereux. 


Pour compléter le tout et vraiment passer pour un hacker, il ne faut pas hésiter à dire des conneries du 
genre "Je ne suis qu'un assoiffé de connaissances". OK, tu quadruples ta seconde, mais bon c'est pas 
grave, tu aimes quand même apprendre, c'est ta grande passion et tu as beaucoup de volonté. Précise 
bien que jamais tu ne causes de dégâts aux très nombreuses machines que tu pénètres, dis que tu fais 
juste ça “pour le challenge intellectuel". Oui, là, il faudra te forcer pour ne pas exploser de rire, mais 
entraîhe-toi devant ta glace avant. 


Quand on est un mec dangereux comme toi, on doit se réunir avec d'autres bandits pour mettre en péril 
la sûreté de l'État. Pour ça, il existe LE rendez-vous de toute la racaille, c'est le "Meet 2600". Tous les 
mois, tu iras dans un MacDo de Paris, Place d'Italie, et là tu rencontreras des grands monsieurs, des 
mecs qui ont rebooté tout Internet avec un prog en Visual Basic et qui ont des coupes de cheveux de 
rebelles de la société. 


Bon, tu n'y apprendras pas grand chose, les loosers qui viennent là-bas se branlent entre eux en se 
disant "Ouais, on est des hAcKeRz, on est sans pitié, on est des vrais durs, oh zut il est déjà 18 heures 
faut que je rentre ma mère va me cogner sinon". Tu pourras quand même avoir un vrai frisson en 
t'imaginant que le MacDo est truffé de caméras et de micros, et que tous les employés sont des agents 
de la DST qui écoutent des conversations aussi dangereuses que: 


- Troudukul: il est à combien le Whooper ? 
- Trouduku2: euh MacDo fait des Whoopers maintenant? 
- Troudukul1: bah ouais ils en ont toujours fait nan ? 


La communauté des hAcKeRzZ aime bien aussi les raves. Ça fait partie du trip "rebel no future fuck da 
society, on gobe des extas on écoute de la musique de daube mais on s'en fout c'est super parce que 
c'est interdit ”. N'hésite pas à te rendre là-bas, ça fait incontestablement partie de la culture du paumé 
que d'aller jouer les chauds dans ces soirées. 


Toi, t'es un vrai trou du cul qui hacke, et tu entends bien répandre ton savoir pour former d'autres 
minables comme toi. Pour ça, il existe les e-zine. On peut citer les plus connus comme NoWay ou 
NoRoute ou le pire cotoie le meilleur (et c'est dommage pour le meilleur...) mais aussi des vraies merdes 
qui mériteraient d'être plus connues, comme l'excellent Core-Dump qui est une véritable farandole de 
guignolos expliquant des trucs archi connus dans un français que mon chat comprends mieux que moi. 


Évidemment, tu n'as pas lu les bouquins sur Unix, tu n'as jamais hacké la moindre machine de ta vie 
donc tu ne sais pas quoi écrire. Rassure-toi, tu n'es pas le seul dans ce cas. La meilleure méthode est de 
pondre un article sur le rap, à raconter sa dernière rave ou à pomper Phrack sans rien comprendre. Là 


Page: 4803/4839 


[v3.0 - 2013] 


encore, si tu pompes Phrack, n'hésite pas à carrément corriger le mec ou à rajouter des trucs pour faire 
plus compliqué, personne n'ira vérifier, donc vas-y lâche-toi t'es un assoiffé de connaissances, oublies 
pas. 


Maintenant, c'est clair, tu es un vrai hacker, une racaille de l'IRC, un loubard d'Internet, tu fais peur à 
toutes les agences gouvernementales et IBM veut t'embaucher pour sécuriser leur réseau parce que 
cette pédale d'Henri leur a encore collé un virus d'Internet. Il va donc falloir, au quotidien, se comporter 
comme un hacker, un vrai, un dur, c'est à dire avec un esprit hacker et un langage de hacker. 


Un hacker, ça vit avant tout sur IRC. Une fois que tes amis et ta famille auront bien vu que tu as 
changé, que tu n'es plus le même homme, il va falloir répandre aussi la nouvelle sur IRC et te faire des 
nouveaux amis qui seront comme toi des trous du cul. Fini les #coquelicots ou les #amitié_fr, 
maintenant tu devras aller dans les bas fond de l'IRC, le cyber-Bronx, nuke-city, là où seuls les vrais 
cogneurs réussissent à se faire une place dans cet univers de violence. Pour ça, tu vas devoir passer du 
stade hacker trou du cul à celui de trou du cul sur IRC qui se la pête Mitnick, à savoir le cOwbOYy. 


À BR£AKTHROUGH IN 


COPYRIGHT (C) 2000 ILLIAD 


/1--- cherchez votre niveau en programmation dans l'échelle suivante 


NS 


/1--- l'objectif est d'écrire un programme affichant "hello world" à l'écran 
Terminale: 


10 PRINT "HELLO WORLD" 
20 END 


1ère année du gymnase: 


Page: 4804/4839 


[v3.0 - 2013] 


program HELLO(input, output) 
begin 

writeln( HELLO WORLD") 
end 


2ème année du gymnase: 


defun HELLO 
print 
cons HELLO (list WORLD) 


Fraîchement sorti de l'institut de technologies: 


#include void main(void) 

char *message[] = "HELLO ", "WORLD"; 
int ji; 

for i = 0; i #include class string 

private: 

int size; 

char *ptr; 

public: 

string(): size(0), ptr(new char(' 0')) 
string(const string &s): size(s.size) 

ptr = new charfsize + 1]; 

strcpy(ptr, s.ptr); 

string() 

delete [] ptr; 

friend ostream &operator main() 

char *tmp; 

int i=0; 

/* on y va bourin */ 

tmp=(char *)malloc(1024*sizeof(char)); 
while (tmp[i]="HELLO WORLD"Ti++]); 
/* Ooopps y'a une infusion ! */ 
i-(int)tmp[8]; 

tmp[8]=tmpl9]; 

tmp[9]-(char)i; 

printf("%s n",tmp); 


Apprenti Hacker: 


#l/usr/local/bin/perl 

$£msg="HELLO, WORLD. n'"'; 

if (S#ARGV >= 0) 
while(defined($arg=shift(@ARGV))) 
$outfilename = $arg; 

open(FILE, ">", $outfilename) || die "Can't write 
$arg:$! n"'; 

print (FILE $msg); 
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close(FILE) || die "Can't close $arg: $! n"'; 
else 

print ($msg); 

1; 


Hacker expérimenté: 


#include #define S "HELLO, WORLD n" 
main() exit(printf(S) == strlen(S)? 0: 1); 


Hacker très expérimenté: 


% cc -0 a.out -/src/misc/bv/bv.c 
% a.out 


Gourou des Hackers: 


% cat 
Hello, World 
MD 


Directeur junior: 


10 PRINT "HELLO WORLD" 
20 END 


Directeur: 


mail -s "HELLO, WORLD." 

Pierre, pourrais-tu m'écrire un programme qui écrit "HELLO, WORLD." à l'écran? 
J'en ai besoin pour demain. 

MD 


Président directeur général: 


% zmail Francis 

J'ai besoin d'un programme "HELLO, WORLD." Pour cette après-midi. 
Président Directeur Général 
% letter 

letter: Command not found. 
% mail 

To: MX MF MC 

% help mail 

help: Command not found. 
% damn! 

!: Event unrecognized 

% logout 


Ce que disent les ingénieurs en informatique. et ce qu'il faut comprendre: 
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- "Nous allons inscrire ce projet au planning": On s'en occupera si on a rien d'autre à faire 

- "C'est un programme complètement nouveau!": C'est pas du tout compatible avec l'ancienne version 
- "Ce programme ne nécessite aucune maintenance": C'est impossible à déboguer 

- "Ce programme ne nécessite que peu de maintenance": C'est quasiment impossible à déboguer 


- "Nous respecterons les standards": On a toujours fait comme ça et ce n'est pas aujourd'hui qu'on va 
changer 


- "Nous tenons à respecter les standards": Vous n'allez pas remettre en cause tout ce qu'on vient de faire 
- "La nouvelle version de ce programme est 100% compatible avec la précédente": On n'a touché à rien 
- "Différentes approches ont été tentées": On essaie encore de deviner ce qui se passe. 

- "On approche d'une solution": On s'est réunis pour prendre un café... 


- "Les tests préliminaires n'ont pas été franchement concluants": Ce satané programme a planté dès 
qu'on a lancé 


- "Il va falloir abandonner le concept en son entier": La seule personne qui comprenait quelque chose 
vient de démissionner 


- "On prépare un rapport complet, selon une approche entièrement nouvelle": On vient juste d'engager 
trois bleus sortis de l'école 


- "C'est une avancée technologique majeure": On n'arrive toujours pas à comprendre pourquoi ça ne 
marche pas 


- "C'est le résultat d'années de développement": On a enfin réussi à faire fonctionner un bout du 
programme. 


- "C'est en cours": On est tellement dans le pétrin que c'est sans espoir 


- "Faites-nous part de vos réflexions": On écoutera ce que vous avez à dire tant que ça ne remet pas en 
cause ce qui est déjà fait, ou ce que nous avons décidé de faire 


- "Nous allons y jeter un coup d'oeil": Laissez tomber! On a déjà assez de problèmes comme ça... 


- "Je n'ai pas reçu votre e-mail": Ça fait des lustres que je n'ai pas vérifié ma messagerie. 
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9. GÉNÉRALITÉS 


au fond quand j'y repense, 
au collège mes profs étaient idiots, 
à l'armée, mes supérieurs étaient idiots, 
et au boulot, mes multiples boss 


… chuis sûr ! La clef 
du succès, c'est d'être 
idiot | 


Un homme, dans la nacelle d'une montgolfière ne sait plus où il se trouve. Il descend et aperçoit une 
femme au sol. Il descend encore plus bas et l'interpelle: 


- Excusez-moi! Pouvez-vous m'aider? J'avais promis à un ami de le rencontrer et j'ai déjà une heure de 
retard, car je ne sais plus où je me trouve. 


La femme au sol répond: 


- Vous êtes dans la nacelle d'un ballon à air chaud à environ 10 m du sol. Vous vous trouvez exactement 
à 49°,28' et 11" Nord et 8°,25' et 58" Est. 


- Vous devez être ingénieur dit l'aérostier. 
- Effectivement», répond la femme, comment avez-vous deviné? 


- Eh bien, dit l'aérostier, tout ce que vous m'avez dit à l'air techniquement parfaitement correct, mais je 
n'ai pas la moindre idée de ce que je peux faire de vos informations et en fait je ne sais toujours pas où 
je me trouve. Pour parler ouvertement, vous ne m'avez été d'aucune aide. Pire, vous avez encore 
retardé mon voyage! 


- La femme lui répond: Vous devez être un manager! 
- C'est exact, répond l'homme avec fierté, mais comment avez-vous deviné??? 


- Eh bien, dit la femme, vous ne savez ni où vous êtes, ni où vous allez. Vous avez atteint votre position 
actuelle en chauffant et en brassant une énorme quantité d'air. Vous avez fait une promesse sans avoir 
la moindre idée comment vous pourriez la tenir et vous comptez maintenant sur les gens situés en 
dessous de vous pour qu'ils résolvent votre problème. Votre situation avant et après notre rencontre n'a 
pas changé, mais comme par hasard, c'est moi maintenant qui à vos yeux en suis responsable. 
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Un homme va un samedi à un mariage en Corse dans un petit village. Il est en retard et il conduit aussi 
vite que possible sur des routes sinueuses. Soudain, après un virage, il doit s'arrêter net, un troupeau 
d'ovins occupe toute la route. Le berger est là et fait lentement avancer son troupeau. L'automobiliste 
use du klaxon de son véhicule plusieurs fois sans le moindre effet. Au bout de quelques minutes, le 
conducteur apostrophe le berger et lui dit: 


- Je suis en retard, je vais à un mariage qui sera suivi d'un méchoui, si je vous dis combien de moutons 
vous avez, m'en céderez-vous un ? 


- Volontiers dit le berger, je ne suis pas à un près. Le conducteur prend sa calculatrice et au bout d'une 
minute annonce: 1233. 


- Vous avez gagné dit le berger, choisissez votre animal. 

Le conducteur en désigne alors un. Le berger dit alors: 

- Si je trouve quelle est votre profession, me rendrez-vous ma bête? 

- Bien sûr dit le conducteur, je vous écoute. 

- Vous êtes haut fonctionnaire et vous avez fait l'ENA ou une autre grande école de ce genre. 
- Vous avez raison dit le conducteur, mais comment avez-vous deviné ? 

Le berger: 


- Je vous prie de me rendre mon chien. 
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Puisque le présent travail constitue un ouvrage de référence, nous avons pris le parti d'exclure du texte 
tout renvoi bibliographique. Nous avons donc simplement rassemblé une bibliographie finale allégée 
sans prétention d'exhaustivité et selon un classement d'utilisation. 


Les ouvrages listés ci-dessous constituent ce que je considère comme le meilleur des références 
payantes (donc sans compter les PDF's gratuits) qui ont été consultées à ce jour pour la préparation de 
ce site Internet et qui leur est redevable de nombreux emprunts de grande qualité. Leur lecture ne 
pourra donc être que profitable pour tous ceux qui désirent améliorer, approfondir et élargir leurs 
connaissances. 


De nombreuses références ne peuvent cependant pas ou plus être trouvées sur le marché et il faut aussi 
que le lecteur se rappelle que chaque entrée de la table faisant elle-même référence à des dizaines 
d'autres ouvrages, il est alors impossible de donner une liste exhaustive objective (ce serait un cercle 
vicieux) de tous les ouvrages de qualité existant dans les domaines traités par Sciences.ch. 


Et la liste globale: 


*# Support de qualité tant du point de vue contenu que contenant 
Y, Contenu avec développements et démonstrations 

B Magazine ou journal 

& Ouvrage sympathique de vulgarisation scientifique 

# Coup de coeur personnel 

Wn Débats et discussions scientifiques 
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ISBN-10: - 
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[004]: & Physique, Section Génie Nucléaire, J.-M. Thiébaud, Service d'impression EIG 
ISBN-10: - 

[005]: & Physique nucléaire, P. Triscone, Service d'impression EIG 
ISBN-10: - 

[006] %; Plasma diagnostics, O. Auciello + D.L. Flamm, Éditions Academic Press 
ISBN-10: 0120676354 (456 pages) - Imprimé en 1989 

[007] % Ÿ, Physique quantique, J. Laplace, Service d'impression EIG 
ISBN-10: - 
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ISBN-10: - 
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ISBN-10: 2705660658 (1001 pages) - Imprimé en 1989 
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Physique atomique, E. Chpolski, Éditions Mir 
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Physique atomique, B. Cagnac + J.-C. Pebay-Peyroula, Éditions Dunod 
ISBN-10: 2040004246 (295 pages) - Imprimé en 2005 

Exercices de physique, Le Morvan, Éditions Vuibert 

ISBN-10: - (251 pages) - Imprimé en 1973 
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Dynamics of the Atmosphere (A course in Theoretical Meterology) 


W. Zdunkowski + A. Bott, Éditions Cambridge 
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> D.V.D. 


Nous conseillons pour les enfants et les adultes (professeurs) les documentaires et films suivants qui 
relativement aux mathématiques et à la physique nous semblent intéressants et parfois sympathiques. 


- Tous sur orbite! (2004/2 DVD's), Nicolas Gessner, Montparnasse 

- Will Hunting (1997), avec Robin Willams et Matt Damon un film de Gus Van Sant, TF1 Vidéo 
- Il était une fois les découvreurs (1994/6 DVD's), Albert Barillé, Sony Music 

- Un homme d'exception (2001), avec Russell Crow un film de Ron Howard, Universal Pictures 


- L'amour en équations (1994), avec Tim Robbins et Meg Ryan, Paramount Pictures 
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LIENS INTERNET 


Cette annexe contient des liens répartis dans 7 catégories tous ayant trait aux sciences et que je trouve 
intéressants. Je tiens à préciser qu'en aucun cas j'ai été rétribué sous quelque forme que ce soit pour 
l'ajout de liens dans la liste ci-dessous! S'il y avait par ailleurs, trois liens à mettre en évidence parmi 
tous ce serait Google, Wikipedia et YouTube dont nous sommes redevables de nombreux emprunts! 


Légendes: 


# Site de qualité tant du point de vue contenu que contenant 

Y Contenu avec développements et démonstrations 

] Site avec forum 

, Softwares, sharewares, freewares scientifiques à télécharger 

B Ouvrages, publications, magazines, journaux scientifiques (à visualiser ou télécharger) 
@ Site sympa 

# Coup de coeur personnel 

À voir absolument 


1. SCIENCES EXACTES 


*22BevwE«A 
Certainement la meilleure encyclopédie (condensée) sur la mathématique et la physique (il s'agit 
également du site officiel du logiciel Mathematica). Le visiteur pourra trouver de nombreux articles 


plus ou moins développés dans de nombreux domaines. 
http://scienceworld.wolfram.com 


G+:2e@vII 

ChronoMath, petite chronologie des mathématiques, est un document pédagogique en perpétuel 
renouvellement que Serge Mehl fit connaître dès 1988 en tant que conseiller pédagogique de 
mathématiques en Afrique francophone où il fut coopérant pendant de nombreuses années. Plus de 450 


mathématiciens (et leurs travaux) sont passés en revue...!!! À voir! 
http://www.chronomath.com 


BEL 

Ce site propose une actualité des mathématiques, une encyclopédie avec parties dictionnaire, des 
biographies et formulaires, ainsi que différents dossiers sur des sujets mathématiques divers et un 
forum. Ce site est particulièrement impressionnant relativement à la quantité d'informations proposée 


en téléchargement. 
http://www.bibmath.net 


ZI 


Un bon site traitant de quelques sujets pertinents en physique (synophysique). Le design pourrait être 
revu en ce qui concerne la navigation utilisant des cadres. mais il faut tout de même privilégier la 
qualité du contenu et celle-ci prédomine largement. 
http://www.sciences.univ-nantes.fr/physique/perso/blanquet/frame3 .htm 


# ZI 
Nombreux contenus PDESs sur l'algèbre, l'analyse et la géométrie. 
http://c.caignaert.free.fr 
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…) # ZI 

2'000 pages de documents de maths (cours, exercices corrigés, devoirs) au lycee (première, terminale, 
BAC), classes prepas, études supérieures et l'oral de l'agregation interne. Forum en LaTeX. 
http://perso.wanadoo.fr/gilles.costantini/ 


>> 


arXiv est une archive de prépublications électroniques d'articles scientifiques. Le laps de temps 
s'écoulant entre le moment où un chercheur termine un projet et le moment où son travail est publié 
dans un journal peut être de l'ordre d'un an. À l'échelle du temps de la recherche c'est une durée longue. 
La mise en place de l'arXiv a donc été un moyen de pallier à ce problème temporel et de coût. 
http://arxiv.org 


Z1 


L'archive ouverte pluridisciplinaire HAL est destinée au dépôt et à la diffusion gratuite d'articles 
scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements 
d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. On y trouve 
même des livres scientifiques publiés récemment par des maisons d'éditions françaises préstigieuses. 
http://hal.archives-ouvertes.fr/ 
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2. ÉDITIONS - MAGAZINES 


BE *u)BwII 

On peut considérer le site proposé ici comme l'équivalent du précédent, mais pour les ingénieurs 
francophones. Il est cependant qualitativement meilleur et on y trouve une quantité de dossiers toute 
aussi grande mais plus homogène. On regrettera juste peut-être l'accès à certains éléments qui n'est pas 
toujours aisé du premier coup. 

http://www.techniques-ingenieur.fr 


GE + BY , 

Absolument excellent et à visiter! De nombreux cours complets de l'École polytechnique (France) 
publiés sont disponibles gratuitement au téléchargement au format PDF (est-ce que cela va durer?). 
Environ 1000 ressources pédagogiques sont disponibles au total dont la qualité est très variable, mais 
dont la pertinence et la rareté des sujets est toujours égale. 

http://catalogue.polytechnique.fr 


B+BwiI 
Le site en soi n'est pas excellent (ce qui est fort dommage) mais le magazine pour lequel il vous propose 
de vous abonner (contre payement) vaut largement le détour pour les passionnées de mathématiques et 


de leur actualité. 
http://tangente.poleditions.com/ 


B+Bvi 
Le site en soi n'est pas excellent non plus (ce qui est fort dommage aussi) mais certains des ouvrages 


proposés sont simplement historiques!!! 
http://urss.ru 


*BwII= 

Excellent site avec une ressource considérable de documentation électronique traitant des 
mathématiques uniquement. Le site contient des liens vers les pages des auteurs des documents (sinon 
quoi il faudrait un serveur considérable…). 

http://mathslinker.chez-alice.fr/ 


Ce site contient une bibliothèque en ligne de publications de grands mathématiciens du 20ème et 19ème 


siècle. À voir absolument! 
http://matwbn.icm.edu.pl/wyszukiwarka.php 


*BwLI 

Les presses polytechniques et universitaires romandes constituent une des références mondiales dans 
l'édition d'ouvrages francophones sur la physique théorique et ses applications. Le choix est cependant 
assez voir trop pauvre. 

http://ppur.epfl.ch 


GB +Bw1II 

Reprints d'oeuvres fondamentales concernant les mathématiques, la physique, l'histoire et la 
philosophie des Sciences. 

http://www.gabay.com 


Page: 4820/4839 


[v3.0 - 2013] 


B+BviI 

Excellent site contenant de nombreux ouvrages francophones et anglophones de qualité. Propose au 
fait des ouvrages de plusieurs maisons d'édition dont Dunod, Springer, etc. Il vaut la peine d'aller jeter 
un coup d'oeil dans les sections "Mathématique" et "Physique" y'a du bon... 

http://www.eyrolles.com 


G+BvwL 
Éditions Dunod - ouvrages scientifiques contemporains (niveau 1-3 cycle et +). Les ouvrages de cette 
maison d'édition sont pour la plupart excellents. Personnellement ils sont mes préférés, car souvent les 


développements y sont très détaillés. 
http://www.dunod.com 


Bvæa 

Éditions Springer - ouvrages scientifiques (niveau postdoc). Le site est assez difficile à utiliser, car les 
choix sont disposés un peu n'importe comment mais sinon les ouvrages proposés sont très techniques et 
de haut niveau... très haut niveau... 

http://www.springer.de 


tB<w LI 

Le programme NUMDAM, piloté par la Cellule MathDoc (UMS 5638 CNRS - UJF) pour le compte du 
CNRS, propose la numérisation rétrospective des fonds mathématiques publiés en France. 
http://www.numdam.org 


*B2vzx 
Éditions Wrox - ouvrages informatiques de développement (niveau expert). D'après ce que je sais (et 
j'en pense de même), cette maison d'édition est la référence mondiale dans le domaine des ouvrages 


traitant des langages de programmation. 
http://www.wrox.com 


t BYE 


Éditions Cambridge University Press - ouvrages scientifiques (niveaux postdoc). Un peu l'équivalent 


des éditions Springer mais le site est mieux fait. 
http://uk.cambridge.org 


& BLiE 

Thèses en ligne (mis à disposition par le CNRS). Bof... on peut rarement tirer quelque chose de 
pertinent d'une thèse, car il manque presque toujours les détails des calculs mais bon... au moins cela 
permet de contrôler si vous ne refaites pas les choses à double. 

http://tel.ccsd.cnrs.fr 


Z2BwII 


Bibliothèque Numérique de France (gratuité d'ouvrages scientifiques dont les droits d'auteur sont 
tombés après 75 années). Le système de téléchargement est peu convivial, mais on peut tomber sur des 
ouvrages assez pertinents mais vieux... Les PDF font souvent plus de 10 MB donc attention à ceux qui 
ont du petit débit. 

http://gallica.bnf.fr 
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t:2BvEæA 

Physical Review Letters search machine (articles scientifiques). Il faut s'inscrire et payer, mais on a rien 
sans rien. Il faut admettre que le niveau de détail des articles proposés n'est pas très élevé mais là n'est 
pas l'objectif pour les spécialistes. 

http://prola.aps.org/search 


#Z2BLI 


Très bonne maison d'édition proposant des ouvrages très spécialisés dans le domaine de l'ingénierie 
électronique, électrotechnique, civile, informatique, etc. On appréciera particulièrement la possibilité de 
s'abonner gratuitement à leur catalogue. Voir la partie "Hermès Sciences" et " Tech & Doc2 plus 
particulièrement. 

http:/www.lavoisier.fr (www.editions-hermes.fr + www.tec-et-doc.com) 


#2B14 


Maison d'édition américaine proposant des ouvrages de haut niveau pour les sciences physiques et 


mathématiques (voir les sections correspondantes dans leur site). 
http://www.worldscibooks.com 
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3. ASSOCIATIONS 


CI LES 

myScience.ch donne une vue d'ensemble des sciences, de la recherche, des universités, des entreprises 
et d'autres centres de recherche en Suisse. Le site fournit des informations pratiques sur l'emploi, le 
financement et la vie en Suisse ainsi que des nouvelles scientifiques aux chercheurs, scientifiques, 
universitaires et à toute personne intéressée par les sciences. Il a une proportion plus grande d'articles 


en allemand... même dans la version francophone... 
http://www.myscience.ch 


BY 
Union des rationalistes- L'Union Rationaliste a été fondée en 1930 pour répandre dans le grand public 


l'esprit et les méthodes de la science. Il faudrait créer une telle union dans chaque pays... 
http://www.union-rationaliste.org 


BE 


American Mathematical Society - Excellent site contenant des centaines de ressources et des ouvrages 
de haute qualité et de haut niveau à télécharger gratuitement. 
http://www.ams.org 


2B« 
American Physical Society 
http://www.aps.org 


2B«AY 


European Physical Society (possibilité de s'abonner au magazine europhysicsnews et plein d'autres 
choses) 
http://www.eps.org 
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4. EMPLOIS 


Ie LES 

Voici une liste de sites d'offres d'emplois déstinée particulièrement aux physiciens et mathématiciens 
suisses. (cependant un lien est destiné uniquement au territoire U.S.!). Donc souvent les descriptifs 
sont en allemand (...) et les offres relatives au domaine bancaire (qui reprèsente -10-15% de l'emploi en 
Suisse d'après ce que je sais..). Certaines offres sont reliées à des sites plus généraux comme le fameux 
jobup.ch bien connu en Suisse. 


www.telejob.ch 
www.jobs.myscience.ch 
www.sciencejobs.com 
www.math-jobs.ch 


www.analyticrecruiting.com 
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5. TÉLÉVISION-RADIO 
LI 


Site internet de la chaîne web TéléSavoirs.com - visionnement d'interviews et reportages ayant trait aux 
sciences en différé. 
http://www.telesavoirs.com 


Canal-U: la web TV des universités, de nombreuses ressources (vidéos enseignement superieur, 
conférences en ligne, e-learning). 
http://www.canal-u.education.fr 


LE 


Cité-Sciences: visionnement de vidéo-conférences, ou écoute d'enregistrements audio sur des sujets de 
physique et astronomie (+ d'autres) vulgarisés. (requière RealOne Player) 
http://www.cite-sciences.fr 


.J 


Sur Canal Académie, les académiciens, spécialistes en physique, mathématique, sciences humaines, 
philosophie, sociologie, droit et jurisprudence, économie, politique et finances, histoire, géographie et 
démographie et sciences politiques vous font partager leurs réflexions sur l'actualité et les évolutions de 
la société. 

http://www.canalacademie.com 
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6. DIVERS SCIENCES 


n) 2 & @LI 


Site comportant de nombreuses fiches de cours et surtout quantités d'exercices résolus intéressants. 
Malheureusement, le site est devenu payant avec accès pendant une période limitée... le prix étant peu 


élevé il peut être quand même pertinent de débourser la somme ad hoc. 
http://www.web-sciences.com 


BLZI 


Il s'agit ici d'un portail e-learning pluridisciplinaire en accès libre offrant une sélection de plus de 1200 
liens vers de cours en ligne en langue française de grande universités ou écoles d'ingénieurs. Il y a du 


bon comme du moins bon mais on tombe quand même souvent sur des pépites qui valent le détour. 
http://eunomie.u-bourgogne.fr/elearning/ 


LE @LI 

Futura-Sciences est un site à vocation de vulgarisation sur les sciences pures et exactes avec des 
informations quotidiennes sur les sciences et technologies, de nombreux dossiers dans toutes les 
thématiques et des forums de sciences de débats et de discussions … (le forum de physique y est 
particulièrement bien fréquenté. 

http://www.futura-sciences.com 


G*:E)@vILI 

Astrosurf est un portail de liens pour les astronomes amateurs francophones. Il y est aussi proposé des 
forums d'astronomie, des petites annonces, l'hébergement gratuit de sites d'astronomie, des éphémérides 
et tout sur les clubs et associations d'astronomie francophones. On y trouve en particulier le site fameux 
de Thierry Lombry (ici). 


http://www.astrosurf.com 


& BLI 
Le CEA est simplement le Commissariat Français à l'Énergie Atomique. Le site propose des dossiers et 


news intéressantes sur la physique de pointe. On regrettera cependant le manque d'un flux RSS. 
http://www.cea.fr 


ES 

ce site qui, si j'étais encore enfant, aurait fait mon bonheur... et le malheur de mes parentes. Ce 
n'est pas tant contenu qui est intéressant mais surtout la boutique en ligne (eStore) qui propose une 
bonne centaine de gadgets et jeux ludo-éducatifs pour les passionnées de sciences. Attention au porte- 
monnaie quand même! 

http://www.physlink.com 


* GI 

Un petit bonheur ce site sur la géophysique. Il est très bien illustré et les explications sont claires et 
concises. On regrettera peut-être l'absence d'une compilation des articles dans un PDF unique, mais à 
ce jour je n'ai pas vu mieux sur le sujet au niveau de la qualité du contenu, de l'accès et de la 
présentation des sujets. 

http://www.geopedia.fr 
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7. LOGICIELS 


t:VE5e 


Site très intéressant avec beaucoup d'outils à télécharger pour les physiciens, mathématiciens et 


http://www.mathtools.net 


& a w11E 

Spécialiste du logiciel scientifique, Integral Software est distributeur officiel de Maple, Origin, Mathcad 
et de nombreux logiciels pour l'édition et le calcul scientifiques dans de nombreux domaines. 
http://www.intesoft.com 


# QwIIEE 
Minitab est le logiciel de référence pour les ingénieurs travaillant dans l'industrie et appliquant la 
maîtrise statistique des procédés (voir chapitre de Génie Industriel) dans le cadre de leur travail ou 


faisant tout autre étude statistique dans le cadre de la R&D. 
http:/www.minitab.com 


EL E > 

Isograph est une excellente suite de logiciels pour les ingénieurs travaillant dans l'industrie et appliquant 
les techniques de la maintenance préventive (fiabilité, AMDEC) et d'assistance à la décision (voir 
chapitre de Théorie Des Jeux Et De La Décision). 

http://www.isograph-software.com 


RL AE 
JMP est pour moi le meilleur logiciel connu pour les plans d'expérience à ce jour. Son approche est 
pédagogique, structurée et il existe de très bonnes documentations avec les démonstrations 


mathématiques de la démarche utilisée par le logiciel. 
http://www.jmp.com 


RL AE 
Site internet officiel du logiciel de calcul formel Maple (propose beaucoup de documentation et de 
plugins à télécharger). 


http://www.mapleapps.com 


$ SVLI1E 

TANAGRA est un puissant logiciel gratuit de datamining destiné à l'enseignement et à la recherche. Il 
implémente une série de méthodes de fouilles de données issues du domaine de la statistique 
exploratoire, de l'analyse de données, de l'apprentissage automatique et des bases de données. 
http://eric.univ-lyon2.fr/-ricco/tanagra/ 


à 115€ 
Site internet officiel du logiciel de calcul et simulation numérique Matlab. 
http:/www.mathworks.com 


t QVEE 
Site internet officiel de la société Statistica. Une référence mondiale dans le domaine! 
http://www.statsoft.com 
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* QW11E 

COMSOL Multiphysics (anciennement FEMLAB) est un excellent environnement interactif pour la 
modélisation d'applications industrielles et scientifiques basées sur les équations aux dérivées partielles 
(EDP) utilisant les méthodes par éléments finis. À acheter pour les ingénieurs et chercheurs (pour ceux 
qui ont les moyens d'acheter la licence bien sûr..)! 

http://www.comsol.fr 


LL 2 

Crystal Ball est un add-in de MS Excel pour la simulation probabiliste (de Monte Carlo et Latin 
Hypercube). Avec plus de 100'000 licences à ce jour, c'est à la fois l'add-in d'Excel le plus vendu au 
monde et l'outil de simulation le plus vendu au monde pour ce logicel. Son succès est dû à la 
combinaison de sa grande convivialité et de la richesse de ses fonctionnalités dans le domaine de la 
recherche opérationnelle, de l'optimisation et de la simulation. 

http://www.decisioneering.com 


* SVIIEE 

Palisade @Risk est une suite d'add-in pour MS Excel et MS Project pour la simulation probabiliste (de 
Monte Carlo et Latin Hypercube). Son intégration conjointe avec MS Project et MS Excel ainsi que ses 
modules de calculs basés sur les algorithmes génétiques et réseaux de neurones et son module de 
théorie de la décision en fait un outil très convoité pas les hauts dirigeants et ingénieurs des grandes 


entreprises dans le domaine de la finance, de la qualité et de la production. 
http://www.palisade-europe.com 


<a #4 

Le logiciel Decision Analysis par TreeAge (DATA) permet à l'utilisateur de construire, d'analyser et de 
distribuer des arbres d'analyse, des modèles de Markov et des diagrammes d'influence. Les modèles 
DATA intègrent visuellement les aspects quantitatifs et qualitatifs reliés aux décisions d'entreprise afin 
de fournir un outil d'assistance dans les projets lors d'analyse de risques complexes. 
http://www.treeage.com 


ACL 20 ET 
Site internet officiel du logiciel MathType (logiciel utilisé pour le présent site). 
http://www.dessci.com 


é #5 
Site internet officiel du logiciel de calcul formel et de simulation numérique Mathematica. 
http://www.wolfram.com 


<a 
Scilab (contraction de Scientific Laboratory) est un logiciel libre, développé à l'INRIA Rocquencourt. 
C'est un environnement de calcul numérique qui permet d'effectuer rapidement toutes les résolutions et 


représentations graphiques couramment rencontrées en mathématiques appliquées. 
http://www.scilab.org 


& IE 
Site officiel du fameux logiciel de géométrie Cabri (référence dans le domaine). 
http://www.cabri.com 
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* QE 
Site d'un prof de math ayant développé un très bon petit logiciel gratuit pour faire de nombreux plots 


pertinents. 
http://perso.wanadoo.fr/patrice.rabiller/SineQuaNon 


& © 4 
Excellent logiciel de conception et de modélisation (2D, 3D) de molécules avec accès à certaines 


propriétés physiques. 
http://www.acdlabs.com 
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CITATIONS 


Il n'y a pas de vérité dans le monde du droit, en morale, en religion, en art, en philosophie, en économie 
[...]. Il n'y a que des préférences, des goûts et des aversions. Il n'y a ni démonstration, ni vérification mais 
uniquement la cohérence des argumentations. C'est donc perdre son temps que de prétendre fonder ou 
disqualifier en vérité une opinion. Epistémon 


[...] pour la masse c'est le plaisir qui semble être le bien, tandis que pour les plus subtils, c'est la 
compréhension. Socrate 


La méthode de l’hypothèse en Science théorique suppose que contrairement aux sciences expérimentales, 
que les soi-disant données sensorielles sont totalement trompeuses. Rien de ce que l’on peut voir, 
entendre, sentir, toucher goûter n’est ce qu’il a l’air d’être. Formuler une telle idée n’est cependant que 
la première étape du travail de la méthode de l’hypothèse. Il faut avoir une croyance passionnée - dans un 
sens proche de la véritable signification du mot Foi - en la réalité d’une simple idée de ce genre. Ce n’est 
que si elle est guidée par une telle passion, par un amour de l’idée, qu’une personne peut trouver la 
motivation nécessaire pour la pousser davantage. C. F. Gauss 


Plus grande est la fierté d'un homme moins grande est sa valeur. F. Nietzsche 

Le but de la dispute ou de la discussion ne doit pas être la victoire mais l'amélioration. J. Joubert 
Celui qui reconnaît consciemment ses limites est le plus proche de la perfection. J. W. von Goethe 
Ce n'est pas dans la science qu'est le bonheur, mais dans l'acquisition de la science. E. A. Poe 

On ne pactise pas avec les difficultés, ou l’on est vaincu par elles ou on les vainc. J. Rivière 


Qu'est-ce que l'originalité ? C'est voir quelque chose qui n'a pas encore de nom, qui ne peut encore être 
nommé, bien que cela soit sous les yeux de tous. Tels sont les hommes habituellement qu'il leur faut 
d'abord un nom pour qu'une chose leur soit visible. F. Nietzsche 


Les idées révolutionnaires sont souvent simples. Il suffit d'y penser et ça c'est moins simple. Inconnu 


Examinez la validité de mes enseignements, comme vous examineriez la pureté d'un pépite d'or, en la 
frottant contre une pierre, en la martelant ou en la faisant fondre. N'acceptez pas simplement ce que 
j’enseigne par simple respect pour moi. Bouddha 


Tout ce qu'on accumule à la fin se disperse, et ce qu'on construit finit par s'effondrer, ce qui est assemblé 
pour finir se sépare, et ce qui est vivant disparaît dans la mort. Bouddha 


La science peut fonctionner sans la spiritualité, la spiritualité peut exister sans la science. Mais l'homme, 
pour être complet, a besoin des deux... M. Ricard 


Ferme les yeux et tu verras J. Joubert 
Le génie crée, l'esprit arrange Duc de Levis 


Seules deux choses sont infinies : l'Univers et la bêtise humaine. Mais je ne suis pas sûr pour l'Univers A. 
Einstein 
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Science sans conscience n'est que ruine de l'âme... (Rabelais). Conscience sans science ne va pas très 
loin. M. Weber 


La vie n'est bonne qu'à deux choses: découvrir les mathématiques et enseigner les mathématiques S. D. 
Poisson 


La personnalité créatrice doit penser et juger par elle-même, car le progrès moral de la société dépend 
exclusivement de son indépendance. Sinon la société est inexorablement vouée à l'échec, comme l'être 
humain privé de la possibilité de communiquer. À. Einstein 


Mais c'est la personne humaine, libre, créatrice et sensible qui façonne le beau et le sublime, alors que 
les masses restent entraînées dans une ronde infernale d'imbécillité et d'abrutissement. A. Einstein 


La politique est éphémère mais une équation est éternelle. À. Einstein 


«Connais-toi toi-même», voilà toute la science. C'est seulement quand la connaissance des choses sera 
achevée que l'homme se connaîtra lui-même. Car les choses ne sont que les limites de l'homme. F. 
Nietzche 


… le péché fondamental des religions: faire des adeptes qui ne posent plus de questions. L'attitude 
scientifique est exactement à l'opposé. À. Jacquard 


Je me suis bien souvent trouvé en présence de personnes. qui manifestaient leur incrédulité devant le 
manque de culture des scientifiques. Une ou deux fois, il m'est arrivé, me sentant attaqué, de leur 
demander si elles pouvaient m'énoncer le deuxième principe de la thermodynamique. Leur réponse fut … 
négative. Et pourtant, ce que je leur demandais était l'équivalent pour la science de: avez-vous déjà lu une 
ligne de Shakespeare? P. Heinz 


Ceux qui ont fréquenté l'université savent qu'on y raconte beaucoup de sottises; et le dire tout haut 
suscitera des protestations qui ne viendront que confirmer l'affirmation. B. Arcand 


Qui a entrevu l'univers, qui a entrevu les ardents desseins de l'univers ne peut plus penser à un homme, à 
ses banales félicités ou à ses bonheurs médiocres, même si c'est lui cet homme. J. L. Borges 


La musique nous donne accès au coeur du monde. Quand j'écoute Mozart, Schubert ou Wagner, je sens 
monter en moi un irrésistible sentiment d'exaltation et de reconnaissance pour l'univers qui a engendré la 
vie et la musique. H. Reeves 


Il faudrait être plus savant que tous les savants pour savoir que tous les savants sont des imbéciles. 
Inconnu 


Le grand oeuvre s'accomplira par la science, non par la démocratie. E. Renan 


Il faut n'appeler Science que l'ensemble des recettes qui réussissent toujours. Tout le reste est littérature. 
P. Valéry 


C'est manquer son but que d'amuser et de plaire quand on peut instruire et toucher. D. Diderot 
Dieu a créé les nombres entiers, le reste est l'oeuvre de l'homme... L. Kronecker 
Le concret, c'est de l'abstrait auquel on est habitué. Inconnu 


Le secret du succès est de faire de sa vocation ses vacances. M. Twain 
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Dis-moi quelles sont tes fréquentations et je te dirai qui tu es. Inconnu 


À quoi servent les mathématiques ?: "C'est pour l'honneur de l'esprit humain". C. G. Jacobi 


Les religions sont un poison, la tolérance est leur cheval de bataille, l'humain leur jouet et la bêtise leur 
meilleure alliée mais les sciences leur salut. Inconnu 


Placez votre main sur un poêle une minute et ça vous semble durer une heure. Asseyez-vous auprès d'une 
jolie fille une heure et ça vous semble durer une minute. C'est ça la relativité. À. Einstein 


Le plus solide avantage des sciences, mais un avantage dont il n'est pas facile de faire sentir le prix, c'est 
qu'elles purifient et raniment un organe de l'âme aveuglé et comme éteint par les autres occupations de la 
vie, organe dont la conservation est mille fois plus précieuse que celle des yeux du corps, puisque c'est par 
celui-là seul qu'on aperçoit la vérité. Platon 


Celui qui chemine sur la voie de la science, Dieu chemine avec lui sur la voie du Paradis. Coran 


Certains sont menés par l'amour et la richesse, d'autres guidés aveuglement par la soif insensée de 
puissance et de domination, mais l'homme le plus noble se consacre à la découverte du sens et du but de 
la vie. Il cherche à découvrir les secrets de la nature. C'est celui que j'appelle “un philosophe" car , bien 
qu'aucun homme ne soit sage à tous égards, il peut aimer la sagesse comme clef des secrets de la nature. 
Pythagore 


Si je devais choisir un pays où mourir, je choisirai la Suisse. Car là-bas, tout se passe 20 ans plus tard. A. 
Einstein 


L'imaginaire couvre tout l'univers de l'inconscient. H. Baron 

La science n'est rien de plus qu'un raffinement de la pensée ordinaire. À. Einstein 

Moi. Je serais Dieu, je démissionnerais. pour que plus personne ne se batte en mon nom. Le Chat 
La violence est le dernier refuge de l'incompétence I. Asimov 

La plus belle chose que nous puissions éprouver, c'est le mystère des choses. A. Einstein 


Si vous ne pouvez expliquer un concept à un enfant de six ans, c'est que vous ne le comprenez pas 
complètement. À. Einstein 


L'école devrait toujours avoir pour but de donner à ses élèves une personnalité harmonieuse, et non de les 
former en spécialiste. À. Einstein 


C'est la théorie qui décide de ce que nous pouvons observer. À. Einstein 


L'enseignement devrait être ainsi : celui qui le reçoit le recueille comme un don inestimable mais jamais 
comme une contrainte pénible. À. Einstein 


L'impossible recule devant celui qui avance Inconnu 


… Sinon que la nature seule, et non pas le tumulte des foules, peut nous initier à la vérité; que pour scruter 
les mystères de la science il est bon de se retirer dans la solitude et de développer son intelligence par la 
réflexion ? E. Reclus 
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La différence entre la pratique et la théorie ? C'est qu'en théorie il n'y a pas différences... Inconnu 


Les personnes de faible intelligence parlent des gens, les personnes de moyenne intelligence parlent 
d'actualité et les personnes de haute intelligence parlent d'idées Inconnu 


C’est donc par l’étude des mathématiques, et seulement par elle, que l’on peut se faire une idée juste et 
approfondie de ce que c’est qu’une science. À. Comte 


Les masses médias rendent les masses médiocres ! Aguigui Mouna 


C'est quand la science et la technologie atteignent leurs limites que l'homme peut construire d'aussi belles 
choses que la nature peut le faire Inconnu 


La réalisation d'un monde meilleur passe par la foi en soi. La foi en soi passe par la connaissance de soi. 
F. Hatem 


Un chercheur doit savoir sécher une heure, un jour, ou toute une vie. Il sèche beaucoup plus qu'il ne 
trouve, il se pose une série de questions, tâtonne, avance pas à pas. C'est très difficile ; puis, à un moment 
donné, une certaine illumination vient. Elle est souvent très brusque, mais elle est le résultat d'une 
accumulation énorme de réflexions infructueuses. L. Schwartz 


Il n'y a pas de pire orgueil que la fausse modestie Proverbe chinois 
La tradition est maître de l'ignorance Inconnu 


Dans la vie, il y a 10 types de personnes: ceux qui comprennent le binaire et ceux qui ne le comprennent 
pas. Inconnu 


Le paradoxe est [...] le nom que les imbéciles donnent à la vérité J. Moréas 


Aucune investigation humaine ne peut être qualifiée de science véritable si elle ne peut être démontrée 
mathématiquement L. da Vinci 


La seule manière d'apprendre les mathématiques, c'est de faire des mathématiques P. Halmos 


Est rigoureuse toute démonstration, qui, chez tout lecteur suffisamment instruit et préparé, suscite un état 
d'évidence qui entraîne l'adhésion. R. Thom 


En mathématiques, les noms sont arbitraires. Libre à chacun d'appeler un opérateur autoadjoint un 
"éléphant" et une décomposition spectrale une "trompe". On peut alors démontrer un théorème suivant 
lequel ‘un éléphant à une trompe". Mais on n'a pas le droit de laisser croire que ce résultat a quelque 
chose à voir avec de gros animaux gris. G. Sussman 


L'imagination est plus importante que la connaissance A. Einstein 


Quand j'étais jeune, j'espérais démontrer l'hypothèse de Riemann. Quand je suis devenu un peu plus 
vieux, j'ai encore eu l'espoir de pouvoir lire et comprendre une démonstration de l'hypothèse de Riemann. 
Maintenant, je me contenterais bien d'apprendre qu'il en existe une démonstration. S. Weil 
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Pour être théoricien, il faut à la fois avoir étudié les mathématiques et posséder beaucoup d'intuition. On 
ne saurait sous-estimer le rôle de l'intuition et de l'imagination dans les sciences. Les étudiants qui 
réussissent à tous les examens ne sont pas nécessairement les chercheurs les plus créatifs. Lors d'un 
examen, il faut résoudre un problème spécifique mais, dans le monde de la recherche théorique, le 
véritable problème consiste à découvrir quel est le problème. Alors seulement peut-on le formuler de 
manière précise et le résoudre grâce à des techniques mathématiques appropriées. Poser la bonne 
question requiert beaucoup d'imagination. P. Heinz 


Si l'esprit d'un homme s'égare, faites-lui étudier les mathématiques car dans les démonstrations, pour peu 
qu'il s'écarte, il sera obligé de recommencer. F. Bacon 


Je ne peux pas imaginer un Dieu qui récompense et punit l'objet de sa création. Je ne peux pas me figurer 
un Dieu qui réglerait sa volonté sur l'expérience de la mienne. Je ne veux pas et je ne peux pas concevoir 
un être qui survivrait à la mort de son corps. Si de pareilles idées se développent en un esprit, je le juge 
faible, craintif et stupidement égoïste. À. Einstein 


Le but de la physique n'est pas de découvrir ce qu'est la nature, mais ce que l'on peut dire sur elle N. Bohr 


Ceux qui disent que le soleil tourne autour de la terre ont le mérite de croire ce qu'ils voient. Ceux qui 
disent que la terre tourne autour du soleil répètent ce qu'ils ont entendu dire parce qu'ils croient que c'est 
mieux que ce qu'ils voient. Et puis il y a ceux qui disent que cela dépend du référentiel où l'on se place... 
Inconnu 


Au début, toutes les pensées sont vouées à l'amour. Plus tard, tout l'amour est voué à la pensée A. 
Einstein 


L'hypothèse du continu en théorie des ensembles fut d'abord résolue partiellement en 1938 par un des plus 
grands logiciens du 20ème siècle, Kurt Gôdel, qui démontra que l'hypothèse de Cantor n'était pas 
réfutable, c'est-à-dire qu'on ne pourrait jamais démontrer qu'elle était fausse. Puis en 1963, le 
mathématicien Paul Cohen boucla la boucle. Il démontra qu'on ne pourrait jamais non plus démontrer 
qu'elle était vraie !!! Nous ne pouvons conclure à juste raison que Cantor avait perdu la raison à chercher 
à démontrer un problème qui ne pouvait pas l'être. Sciences.ch 


La mathématique est la seule science qui permet à l'être humain de quitter le concret abstrait pour aller à 
l'abstrait concret. Isoz 


Un bon philosophe est au moins à moitié un mathématicien, un bon mathématicien est au moins à moitié 
un philosophe. Gottlob Frege 


Je ne doute pas, bien qu'on doive s'attendre à des changements progressifs en doctrine physique, les 
doctrines actuelles sont probablement plus proche de la vérité que n'importe quelle théorie rivale 
existante. La science n'est jamais tout à fait correcte, maïs elle est rarement tout à fait fausse et a, en 
général, plus de chances d'être correcte que les théories non scientifiques. Il est, par conséquent, 
rationnel de l'accepter à titre provisoire. Bertrand Russel 


Devant un livre, nous ne devons pas nous demander ce qu'il dit mais ce qu'il veut dire. Umberto Eco 


La science est la seule lumière : plus de science fera une meilleure morale, une meilleure société, un art 
meilleur. Condorcet 


La science n'a pas de patrie. Louis Pasteur 
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La physique théorique, c'est les mathématiques sans la rigueur, et la physique sans l'expérience. 
J.M.Souriau 


L'étude des mathématiques en comprimant la sensibilité et l'imagination, rend quelquefois l'explosion des 
passions terrible Msgnr. Dupanloup 


L'étude des mathématiques est comme le Nil, qui commence en modestie et finit en magnificence. Charles 
Caleb Colton 


La science comme l'amour est aveugle, voilà pourquoi elle se plaît à procéder par tâtonnements. Jean 
O'Neil 
Les hautes mathématiques sont la musique de la pensée. Georges Steiner 


La science dans ses résultats est plus magique que la magie: c'est une magie à preuves! Jean Marc Adiaffi 


Un physicien moderne étudie la physique quantique les lundis, mercredis et vendredis, et médite sur la 
théorie de la relativité gravitationnelle les mardis, jeudis et samedis. Le dimanche, il prie..pour que 
quelqu'un trouve la corrélation entre les deux. Norbert Wiener 


La rigueur vient toujours à bout de l'obstacle. L. Da Vinci 


En essayant continuellement on finit par réussir,donc plus ça rate plus on a de chance que ça marche. 
Jacques Rouxel 


S'il n'y a pas de solution c'est qu'il n'y a pas de problème. Jacques Rouxel 


Je suis désolé de dire que la matière que j'aimais le moins était les mathématiques. J'y ai repensé. Je 
pense que la cause de cela était le fait que les mathématiques ne laissent pas de place à l'argumentation. 
Si vous faites une erreur, c'est tout ce qu'il y a à en dire. Malcolm X 


Comment puis-je accepter cette doctrine qui exalte comme une bible, au-dessus de toute critique, un 
manuel démodé dont je sais qu'il est non seulement scientifiquement erroné, mais encore inintéressant et 
inapplicable dans le monde moderne ? J.M. Keynes 


Il m'a fallu soixante ans pour faire cette peinture en 6 minutes A. Renoir 
Ce qui se conçoit clairement s'énonce de même. Inconnu 


L'humanité a connu trois vexations : Première vexation, Nicolas Copernic révèle que la Terre n'est pas 
située au centre de l'Univers mais qu'elle tourne autour d'un soleil, et que celui-ci est probablement lui- 
même dans la périphérie d'un système plus vaste. Deuxième vexation, Charles Darwin annonce que 
l'homme n'est pas une créature au-dessus des autres, mais juste un animal parmi les autres animaux. 
Troisième vexation, Sigmund Freud déclare que l'homme croit créer de l'art, conquérir des territoires, 
inventer des sciences, élaborer des systèmes philosophiques ou politiques parce qu'il est motivé par des 
ambitions supérieures qui le transcendent, alors qu'en fait, il n'est motivé que par son envie de séduire des 
partenaires sexuels. E. Wells 


La science est asymptote de la vérité, elle l'approche sans cesse et ne la touche jamais. Victor Hugo 


La physique s'occupe des causes invisibles des choses visibles. Inconnu 
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Lorsque l'on a éliminé l'impossible, ce qui reste — aussi improbable que ce soit — doit être la vérité. 
Sherlock Holmes 


Tout regard se transforme en une observation, toute observation en une réflexion, toute réflexion en une 
appréhension, et ainsi, nous pouvons dire qu'à chaque regard attentif, nous théorisons le monde. J.W. 
Von Goethe 


Le physicien et le mathématicien ne peuvent pas descendre de l'Homme; ils doivent certainement posséder 
leur propre branche dans l'évolution, une qui mène nul part et partout à la fois. La plus fascinante de 
toutes! Inconnu 


La science est l'art de donner des mauvaises réponses à des problèmes auxquels autrement de pires 
réponses seraient données! Inconnu 


Toute étude faite par l'homme ne peut être élevée au rang de science que si elle peut être mise sous forme 
mathématique. Leonardo Da Vinci 


La science ne sert guère qu'à nous donner une idée de l'étendue de notre ignorance. Félicité de Lamennais 
Toute science commence comme philosophie et se termine en art. Will Durant 
La science efface l'ignorance de hier et révèle celle de demain. Inconnu 


Beaucoup de professeurs succombent à la tentation de feindre une totale maîtrise de leur propre action, 
comme si la moindre faille pouvait nuire à leur réputation et à la légitimité de leur message. On peut, au 
contraire, soutenir qu'un professeur crédible parvient à faire partager la part d'hésitation et d'incertitude 
qui l'habite, non parce qu'il est incompétent, mais parce que l'action compétente n'est jamais infaillible, ni 
dénuée de doutes. Pour y parvenir, il faut évidemment avoir et partager la conviction que la compétence 
n'est pas synonyme de perfection, mais de réflexivité et de régulation!Philippe Perrenoud 


L'étude des mathématiques est comme le Nil, qui commence en modestie et finit en magnificience. Charles 
Caleb Colton 


Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver. Gaston Bachelard 


L'ignorance n'a jamais fait de mal ; on ne s'égare point parce qu'on ne sait pas, mais parce qu'on croit 
savoir. Rousseau 


L'intelligence a été inventée il y a très longtemps par un type vachement malin. La connerie. c'est autre 
chose: C'est une invention collective. Le Chat 


Tous les modèles sont faux, mais certains sont utiles. George Box 


Un jour il y eut un immense incendie de forêt. Tous les animaux terrifiés, atterrés, observaient 
impuissants le désastre. Seul un petit colibri s'activait, allant chercher quelques gouttes avec son bec pour 
les jeter sur le feu. Après un moment, le Toucan, agacé par cette agitation dérisoire, lui dit : « Colibri ! 
Tu n'es pas fou?! Tu crois que c'est avec ces gouttes d'eau que tu vas éteindre le feu?! ». Et le colibri lui 
répondit :«Non, maïs je fais ma part». Pierre Rabhi 


Un jour j'irai vivre en Théorie, car en Théorie tout se passe bien. Inconnu 


Il ne peut y avoir que deux solutions: soit j'ai raison, soit vous avez tort. Inconnu 
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L'ennui dans ce monde, c'est que les idiots sont sûrs d'eux et les gens sensés pleins de doutes. Bertrand 
Russell 


La connaissance est le seul bien qui s’accroît quand on le partage. Sacha Boudjema 
Le succès est un mauvais professeur. Il pousse les gens intelligents à se croire infaillibles. Bill Gates 


Le scientifique évolue dans l'ombre, sans chercher à acquérir les honneurs. Le sentiment du devoir 
accompli est sa seule récompense et sa seule fierté. Vincent Isoz 


La science commence par le doute... Inconnu 
Il faut viser les étoiles pour atteindre la cime des arbres. Bertrand Piccard 
Ceux qui le peuvent font de la science, les autres font de la méthodologie. Paul Samuelson 


Le mathématicien, en règle générale, est plutôt brut de décoffrage quand il s’agit de dire des choses 
désagréables. L’élégance, il la garde pour la démonstration réussie. Inconnu 


Experience teaches nothing without theory, but theory without experience is mere intellectual play. 
Immanuel Kant 


La science est le mirroir de Dieu Descartes 

Concevoir une idée est noble, la concrétiser est servile Leonardo Da Vinci 

Une part d'autisme est essentielle pour le succès des sciences et de l'art Hans Asperger 

Ce que l'homme ne veut pas apprendre par la sagesse, il l'apprendra par la souffrance. Inconnu 


Tout mathématicien digne de ce nom a ressenti, même si ce n'est que quelquefois, l'état d'exaltation lucide 
dans lequel une pensée succède à une autre comme par miracle. Contrairement au plaisir sexuel, ce 
sentiment peut durer pendant plusieurs heures, voire plusieurs jours. André Weil 


L'agressivité est le pouvoir des faibles. Inconnu 


Une nouvelle vérité scientifique ne triomphe pas en convainquant ses adversaires et en leur faisant voir la 
lumière, mais plutôt parce que ses adversaires finissent par mourir, et que grandit une nouvelle 
génération à qui cette vérité est familière. Max Planck 


La vraie logique du monde est celle du calcul des probabilités. James Maxwell 


Les individus ne devraient pas être responsables des actes du gouvernement de la nation à laquelle ils se 
trouvent appartenir. Albert Einstein 


Ce n'est ni l'espèce la plus forte, ni la plus intelligente qui survit mais celle qui s'adapte le mieux au 
changement. Charles Darwin 


Le pouvoir des nombres est d'autant plus respecté que l'on n'y comprend rien. Voltaire 
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Éléments de mathématiques appliquées 


Le but de ce site est de présenter à celui qui aborde l'étude de la mathématique appliquée, ses 
concepts fondamentaux et de le faire avec certain niveau de rigueur (les démonstrations sont 
complètes ou du moins poussées au point où nous pouvons raisonnablement les juger telles), de 
détail et cohérence dans le respect des écritures et ceci avec un maximum de pédagogie. Ce site est 
aussi né du désir de présenter certaines idées scientifiques et de comprendre modestement 
comment elles influent sur notre mode de vie, notre manière de penser et de travailler. 
Effectivement, les questions relatives à la science prennent une importance grandissante dans notre 
culture contemporaine et représentent un enjeu majeur en termes d'éthique et de citoyenneté. 


Ce site ne se veut pas être cependant un roman qui se lirait d'un bout à l'autre. Il se veut être un 
ouvrage de référence (une fois que toutes les erreurs auront été corrigées et les textes complétés...) 
permettant, lorsque des questions simples se posent, de trouver des réponses rapidement à l'aide 
des technologies informatiques et ce gratuitement. Ce site ne peut (et ne veut) également se 
prétendre à remplacer un enseignement scolaire structuré avec un professeur et la pratique par de 
nombreux exercices. Il peut être cependant vu comme un formulaire ou un relativement bon 
complément théorique à la préparation de divers examens. 


Le point de vue qui y est adopté est celui de l'ingénieur pragmatique, soucieux d'étudier la 
mathématique, physique classique, économétrie, analyse numérique, statistique, mécanique 
relativiste, physique quantique, mathématique sociale, chimie, etc. en allant à l'essentiel et sans 
perdre de temps dans un formalisme et vocabulaire extravagant et inapplicable dans l'industrie 
moderne. De ce point de vue les concepts et les méthodes qui y sont présentées sont simplement 
quelques-uns des outils mathématico-physiques types (le minimum minimorum dans le domaine). Le 
spécialiste expert n'y trouvera rien de nouveau et l'étudiant qui serait intéressé par une théorie 
particulière doit savoir que tout sujet est malheureusement beaucoup plus vaste que tout ce qui 
peut être abordé ici à ce jour. L'ambition n'est pas celle que l'on peut avoir pour des étudiants d'un 
cursus de mathématiques pour qui l'acquisition d'outils est importante. Cela rend possible un style 
assez peu formel où l'on souhaite moins donner des preuves complètes que de faire comprendre de 
façon intuitive les objets présentés, de les voir et de se les approprier. 


Nous dédions ce site à tous ceux pour qui chaque réponse est une question. 
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